Google、Gemini 3.1 Flash Liveを発表:SynthID透かし付きのリアルタイム音声AIモデルが世界展開
GoogleはGemini 3.1 Flash Liveを公開しました。これはこれまでで最も高品質なリアルタイム音声・音響モデルであり、レイテンシーの低減、感情トーン認識の向上、そして生成されたすべてのAI音声に対するSynthID透かしの必須化を特徴とします。Search Liveは同時に200か国以上に拡大します。
GoogleはGemini 3.1 Flash Liveを公開しました。これはこれまでで最も高品質なリアルタイム音声・音響モデルであり、レイテンシーの低減、感情トーン認識の向上、そして生成されたすべてのAI音声に対するSynthID透かしの必須化を特徴とします。Search Liveは同時に200か国以上に拡大します。
ElevenLabsとIBMは、ElevenLabsのテキスト読み上げ(Text-to-Speech)および音声認識(Speech-to-Text)技術をIBM watsonx Orchestrateに統合する協業を発表しました。これにより、企業は70言語で自然な多言語対応の音声AIエージェントを展開できるようになります。
音声AIスタートアップのElevenLabsは、Sequoia主導のシリーズDで評価額を3倍の110億ドルに引き上げ、IPO準備の中で年間ARRが3.3億ドルに達した。
音声AIのリーダーであるElevenLabsは、Sequoia Capitalが主導する$500MのシリーズD資金を確保し、企業導入により$330MのARRを達成して$11Bの評価に到達しました。
音声AIスタートアップのElevenLabsは、企業導入が急増する中、110億ドルの評価額でシリーズDとして5億ドルの資金を確保し、1年で評価額を3倍にしました。
音声AIインフラプロバイダーのLiveKitは1億ドルの新規資金調達を確保し、評価額が10億ドルに達しました。 同社はOpenAIのChatGPTの音声機能を支え、リアルタイムの音声およびビデオソリューションを拡大しています。
Google DeepMindは、感情に配慮した音声AIを専門とするスタートアップHume AIのCEOと主要エンジニアを採用し、Geminiモデルの機能を強化して音声ベースのインタラクションを進化させようとしています。