Агент голосового AI Samantha Voice обеспечивает разговоры в реальном времени на базе AI с распознаванием речи и естественным синтезом текста в речь через GPT-4.
Агент голосового AI Samantha — полностью модульная, открытая платформа голосового помощника, разработанная на Python. Использует модель GPT-4 от OpenAI для управления диалогом с учетом контекста, Whisper для точной транскрипции голосов в текст и ElevenLabs или Microsoft TTS для реалистичного вывода текста в речь. Встроенная поддержка постоянного слушания, настраиваемых хуков навыков, API-интеграций и триггеров по событию позволяют создавать индивидуальные голосовые сценарии, автоматизировать задачи и разворачивать на настольных или серверных системах без значительных лицензионных ограничений.