Google Gemini 3 Deep Think 升級版在基準測試中超越 GPT-5.2 與 Claude Opus 4.6
Google 的強化版 Gemini 3 Deep Think 模型在最新的基準測試中展現出優於 OpenAI 的 GPT-5.2 與 Anthropic 的 Claude Opus 4.6 的表現。
Google 的強化版 Gemini 3 Deep Think 模型在最新的基準測試中展現出優於 OpenAI 的 GPT-5.2 與 Anthropic 的 Claude Opus 4.6 的表現。
Google 強化 Gemini 3 Deep Think 以處理複雜的科學任務,並推出 Aletheia——一個解出 91.9% 進階數學題目的 AI 代理。
Google 為科學與工程升級 Gemini 3 Deep Think。在 ARC-AGI-2 上達到 84.6%,在競賽程式設計中 Elo 為 3455。
Google 報告稱,出於商業動機的主體對 Gemini 進行了蒸餾攻擊,使用超過 100,000 次提示以提取 AI 模型的能力與智慧財產權。
Google 推出對 Gemini 3 Deep Think 的重大升級,在「人類最後考試」中取得 48.4% 的成績,並在國際奧林匹亞挑戰中達到金牌級表現。
Gemini Deep Think 在解決博士級數學問題方面取得突破性表現,並使多個領域的自主研究成為可能。
Google 推出 AI 模式購物廣告與直接優惠,讓使用者可在 Gemini 聊天機器人和搜尋中直接購買 Etsy 與 Wayfair 的商品。
Claude Opus 4.6 在具備 100 萬個 token 的上下文中,在代理式編碼與專業任務上領先,並在關鍵基準測試中超越 Gemini 3 Flash。
Google Cloud 推出 Gemini Enterprise Agent Ready (GEAR) 計畫,提供開發者每月 35 個學習點數、實作訓練與認證途徑,使用 Agent Development Kit 與 Gemini Enterprise 平台打造可投入生產的 AI 代理人。
Google 的 Gemini 應用達到7.5億月活躍用戶(MAUs),自第三季以來增加1億,Gemini 3 模型推動了公司歷史上最快的採用速度。
Google 宣布在 Gemini 中推出 Personal Intelligence、Search 的 AI 模式、搭載 Gemini 3 自動瀏覽的 Chrome,以及由 AI 驅動的免費 SAT 準備課程。
蘋果宣布與 Google 建立突破性合作,將 Gemini AI 整合進 Siri,為數十億裝置帶來先進的人工智慧功能。
在 AI 競爭加劇之際,分析師在財報討論中敦促 Google 就與蘋果的策略性 Siri-Gemini 整合協議提供回應。
Google 員工開始測試搜尋用 AI 模式,這是一項強化的 AI 功能,專為探索性問題與複雜推理任務設計。
Google 推出測試版功能,提示用戶授權 Gemini AI 存取電子郵件、相片、行事曆和搜尋紀錄,引發用戶對隱私的擔憂。
Google 推出結合視覺推理與程式碼執行的突破性功能,讓 AI 能透過 Think-Act-Observe 循環檢查、縮放並操作影像。
產業分析顯示,四款前沿 AI 模型——ChatGPT 5.2、Gemini 3、Claude 4.5 與 DeepSeek R1——並非僅依靠基準測試表現,而是根據特定工作流程需求,被策略性地部署在行銷內容堆疊中。
Google 推出 Private AI Compute,這是一個新系統,讓 Gemini 模型能夠在利用雲端運算能力的同時,保持使用者資料加密並保密,類似 Apple 的做法。
Demis Hassabis 揭露他與 Google 執行長 Sundar Pichai 每日進行戰略對話,正值 DeepMind 加強與 OpenAI 的競爭之際。
ChatGPT 廣告、Anthropic 的 Cowork 工具以及 Gemini 的 Personal Intelligence 表明 AI 競爭與使用者體驗出現重大變化。