
생성형 AI 환경은 음성 AI 선구자인 ElevenLabs가 기념비적인 5억 달러 규모의 시리즈 D 펀딩 라운드를 발표함에 따라 또 다른 지각 변동을 목격했습니다. 이번 자본 투입으로 이 회사의 가치는 1년 전보다 3배 이상 증가한 놀라운 110억 달러에 도달했습니다. 이번 라운드는 Sequoia Capital이 주도했으며, 이는 ElevenLabs가 텍스트 음성 변환 툴 제공업체에서 종합적인 기업용 AI 플랫폼으로 전환하는 것에 대한 기관들의 강력한 신뢰를 시사합니다.
이 이정표는 오디오 AI 분야의 빠른 성숙도를 강조합니다. 2025년을 3억 3천만 달러 이상의 연간 반복 매출(ARR)로 마무리한 ElevenLabs는 대화형 에이전트 및 자동화된 음성 인프라에 대한 급증하는 수요를 효과적으로 활용하고 있습니다. Sequoia의 Andrew Reed가 이사회에 합류함에 따라, 회사는 단순한 크리에이터용 도구를 넘어 비즈니스와 인간이 기술과 상호작용하는 방식에 대한 근본적인 인프라 계층으로 자리매김하고 있습니다.
시리즈 D 라운드는 2026년 AI 분야에서 가장 중요한 자본 조달 중 하나입니다. 최고 수준의 벤처 캐피털 회사들의 참여는 차세대 컴퓨팅에서 음성 인터페이스의 전략적 중요성을 강조합니다. Sequoia Capital과 함께 Andreessen Horowitz(a16z) 및 ICONIQ Growth를 포함한 주요 기존 투자자들이 지분을 크게 늘려 회사의 로드맵에 대한 깊은 확신을 보여주었습니다.
이번 라운드에 참여한 신규 투자자로는 Lightspeed Venture Partners, Evantic Capital, BOND가 있으며, 이로써 2022년 설립 이후 회사가 조달한 총 자금은 7억 8,100만 달러에 달합니다. 이 막대한 자금은 ElevenLabs가 향후 IPO를 염두에 두고 연구 역량과 글로벌 입지를 공격적으로 확장할 수 있는 자원을 제공합니다.
투자 라운드 주요 하이라이트
| 지표 | 상세 내용 |
|---|---|
| 라운드 시리즈 | 시리즈 D |
| 조달 자본 | 5억 달러 |
| 기업 가치 (Post-Money) | 110억 달러 |
| 주도 투자자 | Sequoia Capital |
| 기존 투자자 | Andreessen Horowitz (a16z), ICONIQ Growth |
| 신규 투자자 | Lightspeed Venture Partners, Evantic Capital, BOND |
| 현재까지 총 펀딩 금액 | 7억 8,100만 달러 |
ElevenLabs는 처음에 초실사적인 텍스트 음성 변환(TTS) 모델로 시장의 주목을 받았으나, 이번 펀딩 라운드는 기업 시장을 향한 결정적인 전환점이 되었습니다. 이러한 가치 급등의 핵심 동력은 대규모 대화형 AI 배포를 위해 설계된 회사의 플랫폼인 ElevenAgents입니다.
ElevenLabs는 정적인 오디오 생성을 넘어 동적이고 대화형인 경험으로 나아가고 있습니다. 회사 보고에 따르면 급격한 매출 성장은 Deutsche Telekom, Square, Revolut, 심지어 우크라이나 정부와 같은 글로벌 거대 기업들의 기업 채택에 의해 촉진되었습니다. 이러한 조직들은 고객 지원 및 인바운드 영업에서부터 시민 참여 및 내부 교육에 이르기까지 다양한 중요 워크플로우에 이 플랫폼을 활용합니다.
이러한 변화를 지원하기 위해 ElevenLabs는 대화형 인프라에 대한 대대적인 업그레이드를 발표했습니다. 새로운 Eleven v3 Conversational 모델을 기반으로 하는 이 플랫폼은 이제 훨씬 빠른 응답 시간과 향상된 표현력을 자랑합니다. 결정적으로, 이번 업데이트에는 향상된 턴테이킹(turn-taking) 개선 사항이 포함되어 AI 에이전트가 방해나 일시 정지를 더 자연스럽게 처리할 수 있게 되었습니다. 이는 voice AI 개발에서 악명 높게 어려운 과제입니다.
공동 창립자인 Mati Staniszewski와 Piotr Dabkowski가 밝힌 회사의 비전은 "전체 오디오 스택(full audio stack)"을 구축하는 것입니다. 여기에는 음성 합성, 전사, 음향 효과 및 음악 생성과 같은 별개의 기술을 멀티모달 상호작용이 가능한 일관된 생태계로 통합하는 것이 포함됩니다.
핵심 플랫폼 제공 서비스
| 제품 | 기능 | 대상 고객 |
|---|---|---|
| ElevenAgents | 대화형 대화 AI 인프라 | 기업, 고객 지원, 영업 팀 |
| ElevenCreative | 오디오 생성, 편집 및 현지화 | 콘텐츠 크리에이터, 미디어 브랜드, 출판사 |
| ElevenAPI | 앱을 위한 저지연 음성 인프라 | 개발자, 게임 스튜디오, 앱 빌더 |
ElevenCreative는 미디어 제작의 허브 역할을 하며 Duolingo, NVIDIA, TIME과 같은 브랜드가 70개 이상의 언어로 고충실도 오디오를 생성, 편집 및 현지화할 수 있도록 지원합니다. 이 플랫폼은 콘텐츠 글로벌화에 대한 증가하는 요구를 해결하여, 미디어 회사가 더빙 스튜디오의 전통적인 비용과 물류적 장애물 없이 국제적인 청중에게 도달할 수 있게 해줍니다.
개발자 측면에서 ElevenAPI는 계속해서 중요한 구성 요소로 작용하여 Meta, Epic Games, Salesforce와 같은 기업에 대화형 경험을 제공하고 있습니다. 이 API는 실시간 애플리케이션, 게임 및 대화형 교육 도구에 필요한 저지연 인프라를 제공하며, 현재 전 세계적으로 10억 명 이상의 사용자에게 도달하고 있습니다.
5억 달러 투자의 상당 부분은 연구 및 개발에 할당되었습니다. ElevenLabs는 "오디오 범용 지능(Audio General Intelligence, 오디오 분야의 AGI)" 개발을 명시적으로 목표로 하고 있습니다. 여기에는 인간의 인지 능력을 모방하는 방식으로 문맥, 감정 및 뉘앙스를 이해하는 모델을 만드는 것이 포함됩니다.
공동 창립자 Piotr Dabkowski는 회사가 감정적인 대화 모델과 고급 더빙 기술로 연구를 확장하고 있다고 강조했습니다. 목표는 단순한 음성 복제를 넘어 진정한 "존재감"을 가진 에이전트를 만드는 것입니다. 이 연구 로드맵에는 지연 시간과 사실성에 대한 업계 벤치마크를 재정의하는 제품 경험을 위해 모델을 최적화하는 것이 포함됩니다.
초점은 또한 멀티모달 기능으로 옮겨가고 있습니다. Mati Staniszewski는 이번 펀딩이 회사가 "음성 그 이상"으로 나아가는 데 도움이 될 것이며, 기업들이 "말하고, 입력하고, 행동을 취할 수 있는" 에이전트를 구축할 수 있게 할 것이라고 언급했습니다. 이는 ElevenLabs'의 에이전트가 단순한 음성 봇이 아니라 다양한 모달리티에서 복잡한 작업을 수행할 수 있는 완전히 통합된 어시스턴트가 되는 미래를 시사합니다.
성장 전략의 일환으로 ElevenLabs는 물리적 입지를 공격적으로 확장하고 있습니다. 회사는 런던, 뉴욕, 샌프란시스코, 도쿄, 서울, 싱가포르, 베를린 등 주요 글로벌 허브에 현지 밀착형 시장 진출(go-to-market) 팀을 구축하고 있습니다. 이러한 국제적 발자취는 현지화된 지원과 지역 데이터 규정 준수가 필요한 기업 고객을 지원하는 데 필수적입니다.
이러한 확장은 AI 시장의 경쟁이 점점 더 치열해지는 시점에 이루어집니다. 경쟁업체들이 텍스트용 대규모 언어 모델(LLM)에 집중하는 동안, ElevenLabs는 오디오 모달리티에서 지배적인 틈새시장을 개척해 왔습니다. 높은 기업 가치와 풍부한 자본 준비금을 확보함으로써 회사는 OpenAI나 Google과 같은 더 광범위한 AI 연구소의 잠재적인 침해에 대비해 리더십 지위를 효과적으로 공고히 하고 있습니다.
Sequoia Capital의 Andrew Reed는 창립자들이 "글로벌 AI 생태계에서 가장 영향력 있는 회사 중 하나"를 구축했다고 찬양하며, ElevenLabs가 사람들이 기술과 인터페이스하는 방식을 근본적으로 바꾸고 있다고 언급했습니다. 이번 투자 논리는 컴퓨팅의 다음 단계가 전통적인 역학을 뒤집을 것이라는 믿음에 근거합니다. 즉, 인간이 키보드와 마우스를 통해 기계에 적응하는 대신, 기술이 자연스러운 대화를 통해 인간에게 적응할 것이라는 점입니다.
110억 달러의 기업 가치와 3억 3천만 달러 이상의 ARR을 창출하는 강력한 매출 엔진을 갖춘 ElevenLabs는 공개 상장을 향한 가도에 확고히 서 있습니다. 경영진은 "IPO와 그 이후를 향해" 구축하고 있다고 명시적으로 언급했으며, 이는 이번 시리즈 D가 공개 데뷔 전 마지막 주요 비공개 자금 조달 행사가 될 가능성이 높음을 나타냅니다.
크리에이티브 및 기업 부문의 경우, 이번 펀딩은 ElevenLabs가 안정적이고 혁신적인 힘으로 남을 것임을 보장합니다. 안전, 연구 및 엔터프라이즈급 신뢰성에 대한 집중은 generative AI를 채택하려는 대규모 조직의 주요 우려 사항을 해결합니다. 회사가 에이전트 워크플로우를 더욱 강화함에 따라, 우리는 더 빠르고 똑똑하며 인간의 상호작용과 구별할 수 없는 새로운 음성 우선 애플리케이션의 물결을 보게 될 것으로 기대할 수 있습니다.