小米推出三款 MiMo V2 人工智慧模型,鎖定代理、機器人與語音合成
小米發表了 MiMo-V2-Pro、MiMo-V2-Omni 與 MiMo-V2-TTS — 這三款 AI 模型擁有超過一兆個參數、具備多模態感知與情感語音合成,在代理基準測試中可與 Claude Opus 4.6 一較高下。
小米發表了 MiMo-V2-Pro、MiMo-V2-Omni 與 MiMo-V2-TTS — 這三款 AI 模型擁有超過一兆個參數、具備多模態感知與情感語音合成,在代理基準測試中可與 Claude Opus 4.6 一較高下。
Google 推出 Gemini Embedding 2,這是首款原生多模態的嵌入模型,能夠將文字、圖像與影片共同映射到統一的向量空間,用於檢索與搜尋任務。
中國的 DeepSeek 即將發布 V4 多模態模型 — 能夠生成文字、圖像與影片 — 據報導,其拒絕讓 Nvidia 和 AMD 提前進行優化存取,反而在中國一年一度的議會會期前僅獨家提供給國內晶片廠商華為與寒武紀。
DeepSeek 的職缺公告透露了建立一個支援文字、圖像與音訊的多模態 AI 搜尋引擎的計畫,直接瞄準 Google 在搜尋市場的市占率。
總部位於北京的 Moonshot AI 推出 Kimi K2.5,一款開源多模態 AI 模型,可與 OpenAI 和 Anthropic 媲美,且運行成本低四倍,這對美國的半導體出口管制在限制中國 AI 發展方面的有效性提出了質疑。