Dia

nari-labs • Updated 2025 Jun 15 22:19

, No training script, just TTS model

(laughs), (clears throat), (sighs), (gasps), (coughs), (singing), (sings), (mumbles), (beep), (groans), (sniffs), (claps), (screams), (inhales), (exhales), (applause), (burps), (humming), (sneezes), (chuckle), (whistles)

RoPE

RMS Normalization

Grouped-query Attention

Byte Level Tokenizer

CFG Scale

Delay Pattern

Nari Labs: Dia Examples | Notion

Comparison between Dia-1.6B (ours), ElevenLabs Studio, and Sesame CSM-1B. Plus fun examples (including audio prompt use).

https://yummy-fir-7a4.notion.site/dia

nari-labs/Dia-1.6B · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

https://huggingface.co/nari-labs/Dia-1.6B

Documentation

documentation.md

devnen

Nari Labs

Nari Labs ： Free And Open-Source TTS AI Voice Dialogue

Discover Nari Labs, a open-source TTS AI for ultra-realistic dialogue and voice cloning. Build immersive audio experiences with real-time streaming.

https://narilabs.org/

Dia

Nari Labs

Recommendations