ChatTTS — это сложная модель текст-в-речь (TTS), оптимизированная для генерации голоса в контексте диалога. Она была обучена на приблизительно 100 000 часов разнообразных речевых данных на английском и китайском языках, что обеспечивает высокую точность и естественные интонации. Его универсальность делает его подходящим для помощников LLM и различных разговорных сценариев, от решений для обслуживания клиентов до интерактивного повествования. ChatTTS использует современные методы машинного обучения для предоставления голосовых выходов, которые отражают человеческую выразительность, что делает разговоры более привлекательными и интуитивными.