Google、画期的な科学的推論を備えた Gemini 3 Deep Think をリリース
Google は科学・工学向けに Gemini 3 Deep Think をアップグレードしました。ARC-AGI-2 で84.6%、競技プログラミングで Elo 3455 を達成。
Google は科学・工学向けに Gemini 3 Deep Think をアップグレードしました。ARC-AGI-2 で84.6%、競技プログラミングで Elo 3455 を達成。
Gemini Deep Thinkは博士課程レベルの数学問題を解く上で画期的な性能を達成し、複数の分野で自律的な研究を可能にする。
GoogleはDialogLabを公開しました。これは、一対一のやり取りを超えた複数参加者による人間とAIの会話を作成・シミュレーション・テストするためのオープンソースフレームワークです。
DeepMindのAletheiaというAIは、悪名高く難解な13件のエルデシュ問題を解決することでブレイクスルーを達成し、高度な数学研究における前例のないAIと人間の協働を実証した。
MIT Technology Reviewは、METRの論争を呼ぶタイムホライズンプロットに関する詳細な分析を掲載しました。このプロットは、時間の経過に伴うAIモデルのタスク遂行能力の向上を示すもので、AI楽観論者と悲観論者の双方により広く誤解されてきました。このグラフによって、一部の人々はAIのユートピアや黙示録が差し迫っていると信じるようになりました。この記事はデータの本当の意味を明らかにし、AI能力の測定や進展の軌跡に関する一般的な誤解に対処しています。
OpenAIは、SoraやDALL‑Eのような長期的なAI研究プロジェクトよりもChatGPTの迅速な改善を優先したため、上級スタッフの離職に直面している。
CSETの報告書は、AI企業が研究開発を加速するためにシステムを利用していることを明らかにし、イノベーション、安全性、ガバナンスへの影響を検討している。
新たに登場した世界モデル技術は、機械に空間と時間の理解を与えることで、AIの一貫性の問題を解決することを目的としています。
Humans& は Anthropic、xAI、Google の元研究者らが設立した新しい AI スタートアップで、シードラウンドで $480M を調達し、Nvidia とジェフ・ベゾスの支援を受けて評価額 $4.8B を達成しました。
研究者たちはRiff-Diffと呼ばれる新しいAI手法を開発し、酵素設計を変革して、産業および医療用途向けの高効率で安定したバイオ触媒を創出しました。研究結果は学術誌Natureに掲載されました。
DeepMindのデミス・ハサビス、Anthropicのダリオ・アモデイ、AIの先駆者ヤン・ルカンがAGIの実現可能性について対立する見解を示し、ルカンはLLMだけでは人間レベルの知能に到達できないと主張しています。
大規模な研究により、GPT-4のようなAIが創造性テストで平均的な人を上回ることができる一方で、最も創造的な人間は依然として大きな優位性を持っており、現行のAI能力には明確な上限があることが明らかになった。