ChatTTS est un modèle génératif de parole spécialement optimisé pour les applications basées sur le dialogue. En utilisant des architectures neuronales avancées, il produit une parole naturelle et expressive avec une prosodie contrôlable et une similarité entre locuteurs. Les utilisateurs peuvent spécifier des identités de locuteurs, ajuster la vitesse et la tonalité de la voix, et affiner la tonalité émotionnelle pour s’adapter à divers contextes conversationnels. Le modèle est open-source, hébergé sur Hugging Face, permettant une intégration fluide via des API Python ou une inférence directe du modèle dans des environnements locaux. ChatTTS supporte la synthèse en temps réel, le traitement par lots et les capacités multilingues, le rendant adapté pour les chatbots, assistants virtuels, narration interactive et outils d’accessibilité nécessitant des interactions vocales humaines et dynamiques.