Sequoia 領投：ElevenLabs 以 $11B 估值募得 $500M

ElevenLabs 在里程碑式的 D 輪融資中估值翻三倍至 110 億美元

這是一個明確的信號，表明生成式 AI 熱潮正成熟並進入大規模企業採用的階段，語音 AI 先驅 ElevenLabs 已獲得 5 億美元的 D 輪融資。此輪融資由紅杉資本（Sequoia Capital）領投，將公司的估值推高至驚人的 110 億美元——與僅僅 12 個月前相比，其價值翻了三倍以上。

這次注資不僅對這家總部位於倫敦的初創公司而言是個關鍵時刻，對更廣泛的 AI 領域也是如此，因為投資者正在加倍投入承諾重新定義人機交互的基礎設施層。隨著 Andreessen Horowitz (a16z) 的投資增加四倍，以及 ICONIQ Capital 的持股增加三倍，市場正對 ElevenLabs 的願景投下響亮的信任票：語音，而非文本，將成為未來的首要交互界面。

估值與營收的飛速增長

圍繞這次融資的數據表明，這家公司正脫穎而出。僅在一年之前的 2025 年 1 月，ElevenLabs 以 33 億美元的估值完成了 C 輪融資。到 2026 年 2 月躍升至 110 億美元，凸顯了由實質性營收（而非僅僅是炒作）推動的強勁增長軌跡。

公司在 2025 財政年度結束時，年度經常性收入 (ARR) 超過 3.3 億美元，這一數字主要由企業領域的快速採用所驅動。這種財務持久性使 ElevenLabs 與其許多 generative AI 同行區分開來，後者仍在努力彌合爆火的消費者工具與可持續的 B2B 商業模式之間的差距。

作為交易的一部分，紅杉資本的合夥人 Andrew Reed 將加入 ElevenLabs 董事會。他的參與表明，在公司邁向公開上市的複雜路徑中，他將擔任戰略導師的角色。

近期融資里程碑

輪次名稱	日期	融資金額	估值	領投方
Series D	2026 年 2 月	5 億美元	110 億美元	Sequoia Capital
Series C	2025 年 1 月	1.8 億美元	33 億美元	a16z / Nat Friedman / Daniel Gross
Series B	2024 年 1 月	8000 萬美元	11 億美元	a16z / Nat Friedman / Daniel Gross

超越文字轉語音：對話式智能體時代

雖然 ElevenLabs 最初以其超逼真的 text-to-speech (TTS) 模型吸引了公眾的想像力，但 D 輪融資明確撥款用於一個更宏大的野心：主導 對話式 AI (Conversational AI) 技術棧。該公司正從作為靜態內容生成的工具，轉型為驅動動態、實時交互的引擎。

執行長 Mati Staniszewski 一直對這一轉變直言不諱，他表示「語音是 AI 的下一個界面」。為了支持這一點，新資金的很大一部分將用於開發公司的企業平台 ElevenAgents。ElevenAgents 旨在讓企業部署自主語音智能體，能夠以低於 100 毫秒的延遲處理複雜的客戶服務諮詢、入境銷售和內部工作流。

版本 3 的技術飛躍

配合融資公告，ElevenLabs 正在對其核心模型進行重大更新。新的「Eleven v3 對話模型」引入了：

增強的情緒智力： 智能體現在能比以往更有效地檢測和複製細微差別、語調和節奏，減少自動通話中的「恐怖谷」效應。
編排層： 改進的輪換機制確保 AI 智能體不會尷尬地打斷用戶，模擬人類對話的自然流動。
音頻通用智能： 一項長期研究目標，旨在創建能深度理解語境、音效和語調，而非僅僅處理文本字符串的模型。

企業採用與戰略合作夥伴關係

ElevenLabs 營收的快速增長是由一系列知名的企業客戶推動的。該公司已超越了服務個人創作者和 YouTubers 的階段，轉而為全球巨頭提供關鍵任務基礎設施。

目前的合作夥伴包括：

電信業： Deutsche Telekom 正在利用該技術使其客戶支持界面現代化。
金融科技： Square 和 Revolut 等公司正在集成語音智能體，以簡化用戶交互和欺詐檢測流程。
公共部門： Ukrainian Government 已採用該技術提供公民參與服務，展示了 AI 語音在無障礙和公共信息方面的實用性。
媒體與教育： Duolingo、Nvidia 和 TIME Magazine 使用 ElevenCreative 平台將內容本地化為 70 多種語言，有效打破了全球媒體的語言障礙。

此外，該公司通過其 經典語音市場 (Iconic Voice Marketplace) 使名人語音的使用合法化。通過與包括 Judy Garland、James Dean、Michael Caine 和 Matthew McConaughey 在內的遺產委員會和演員達成法律協議，ElevenLabs 建立了一個受監管且合乎道德的語音授權框架。此舉不僅產生了新的收入流，還將公司定位為「好萊塢友好型」AI 實體，這與困擾圖像和視頻生成初創公司的版權爭議形成了鮮明對比。

走向 IPO 之路

也許這次融資中最顯著的敘述是對 IPO 準備工作的明確確認。Staniszewski 指出，公司正在「朝著 IPO 及更遠的目標前進」，D 輪融資的結構性成熟也呼應了這一觀點。

憑藉紅杉資本的一個董事會席位、通往 10 億美元 ARR 的清晰路徑，以及在特定垂直領域（音頻）的主導地位（該領域與 OpenAI 和 Google 等通用 LLM 提供商是互補而非直接競爭關係），ElevenLabs 正將自己定位為 2027 年或 2028 年上市的主要候選者。

然而，前方的道路並非沒有挑戰。「大科技」巨頭正在蠶食音頻領域。OpenAI 的高級語音模式和 Google 的 Gemini 集成帶來了激烈競爭。ElevenLabs 的策略似乎是「深度勝於廣度」——提供卓越的延遲、情感表現以及針對開發者的特定工具，這是通用模型難以企及的。

全球擴張計劃

為了支持其不斷增長的客戶群，ElevenLabs 正在進行大規模的地域擴張。新資金將支持在關鍵金融中心建立和發展本地化的市場開拓團隊。

目標擴張城市

地區	關鍵城市	重點領域
北美洲	New York, San Francisco, Mexico City	銷售、產品、開發者關係
歐洲	London, Warsaw, Dublin, Berlin, Paris	研發、監規遵循、企業銷售
亞太地區	Tokyo, Seoul, Singapore, Bengaluru, Sydney	本地化、亞洲市場採用
南美洲	São Paulo	拉丁美洲市場增長

結論：語音優先的未來

這筆 5 億美元的 D 輪融資不僅僅是一個財務里程碑；它驗證了一個論點：音頻對於 AI 革命的重要性將與文本和代碼不相上下。通過獲得 110 億美元的估值並得到世界頂級風險投資公司的支持，ElevenLabs 已被正式加冕為 voice AI 垂直領域的王者。

對於創作者、開發者和企業來說，這預示著數字交互將越來越多地離開屏幕和鍵盤，回歸到最自然界面：人類的聲音。隨著 ElevenLabs 加速對「音頻通用智能」的研究，合成語音與人類情感聯繫之間的界限將比任何人預想的更快模糊。