アマチュア数学者がAIを使って長年未解決の数学問題を解く
驚くべき展開として、アマチュアの数学者たちがAIチャットボットを活用して、伝説的なポール・エルデシュが提起した複雑で長年未解決だった数学の問題を解決しており、これはAIの推論能力が大きく進歩したことを示しています。
驚くべき展開として、アマチュアの数学者たちがAIチャットボットを活用して、伝説的なポール・エルデシュが提起した複雑で長年未解決だった数学の問題を解決しており、これはAIの推論能力が大きく進歩したことを示しています。
MITの研究者は、最も高性能な機械学習モデルが新しいデータ環境に適用されると最悪の性能を示すことがあり、医療分野のAIやその他の重要な用途で発生する偽の相関から生じる隠れたリスクを明らかにしていると示しています。
APEX-Agentsという新しいベンチマークは、GPT-5.2やGemini 3 Flashのような最先端のAIモデルでさえ、法律や金融などの専門分野から抽出された、複雑で複数のドメインにまたがるほとんどのタスクで失敗することを示しており、職場での即時の実用性に疑問を投げかけています。
対デジタルヘイトセンター(CCDH)の調査によると、イーロン・マスクのGrok AIは約11日間で約300万件の性的な画像を生成したと推定されており、深刻な安全上の懸念を引き起こしています。
OpenAI、Anthropic、Google DeepMindの研究者たちは、公開されている12のAI防御策を90%以上の成功率で回避し、本番システムにおける重大なセキュリティの穴を暴露しました。