業餘數學家使用人工智慧解決長期未解的數學問題
在一個令人驚訝的進展中,業餘數學家正在利用 AI 聊天機器人來解決由傳奇數學家保羅·埃爾德什提出的複雜且長期未解的數學問題,這表明 AI 的推理能力已取得重大飛躍。
在一個令人驚訝的進展中,業餘數學家正在利用 AI 聊天機器人來解決由傳奇數學家保羅·埃爾德什提出的複雜且長期未解的數學問題,這表明 AI 的推理能力已取得重大飛躍。
麻省理工學院的研究人員示範了在新的資料環境中,表現最佳的機器學習模型可能會變成表現最差,揭示了醫療人工智慧及其他關鍵應用中來自虛假相關性的潛在風險。
名為 APEX-Agents 的新基準測試顯示,即使是像 GPT-5.2 和 Gemini 3 Flash 這樣的領先 AI 模型,也在來自法律和金融等專業領域的多領域複雜任務中大多表現失敗,令其是否能立即投入職場產生疑問。
反制數位仇恨中心(CCDH)的研究估計,伊隆·馬斯克的Grok AI在約11天內被用來創建約300萬張性化影像,造成嚴重的安全疑慮。
來自OpenAI、Anthropic和Google DeepMind的研究人員以超過90%的成功率繞過了12項已發表的AI防禦措施,暴露出生產系統中的關鍵安全漏洞。