Google publie Gemini 3 Deep Think avec un raisonnement scientifique révolutionnaire
Google améliore Gemini 3 Deep Think pour la science et l'ingénierie. Atteint 84,6 % sur ARC-AGI-2 et un score Elo de 3455 en programmation compétitive.
Google améliore Gemini 3 Deep Think pour la science et l'ingénierie. Atteint 84,6 % sur ARC-AGI-2 et un score Elo de 3455 en programmation compétitive.
Gemini Deep Think atteint des performances révolutionnaires dans la résolution de problèmes mathématiques de niveau doctorat et permet la recherche autonome dans plusieurs domaines.
Google dévoile DialogLab, un cadre open source pour concevoir, simuler et tester des conversations multipartites entre humains et IA, au‑delà des interactions individuelles.
L'IA Aletheia de DeepMind réalise une percée en résolvant 13 problèmes d'Erdős notoirement difficiles, démontrant une collaboration humain-IA sans précédent dans la recherche mathématique avancée.
MIT Technology Review publie une analyse approfondie du controversé diagramme d'horizon temporel de METR, qui a été largement mal interprété tant par les optimistes que par les pessimistes de l'IA. Le graphique, qui montre l'amélioration des capacités des modèles d'IA à accomplir des tâches au fil du temps, a conduit certains à penser qu'une utopie ou une apocalypse liée à l'IA était imminente. L'article clarifie la signification réelle des données et aborde les idées reçues courantes sur les mesures des capacités de l'IA et les trajectoires de progrès.
OpenAI fait face à des départs de cadres supérieurs alors que l'entreprise privilégie des améliorations rapides de ChatGPT au détriment de projets de recherche en IA à long terme comme Sora et DALL‑E.
Un rapport du CSET révèle que des entreprises d'IA utilisent des systèmes pour accélérer la R&D, en examinant les conséquences pour l'innovation, la sécurité et la gouvernance.
La technologie émergente des modèles du monde vise à résoudre les problèmes de cohérence de l'IA en offrant aux machines une meilleure compréhension de l'espace et du temps.
Humans&, une nouvelle startup d'IA fondée par d'anciens chercheurs d'Anthropic, xAI et Google, a levé 480 M$ lors d'un tour d'amorçage, atteignant une valorisation de 4,8 Md$ avec le soutien de Nvidia et Jeff Bezos.
Des chercheurs ont développé une nouvelle méthode d'IA appelée Riff‑Diff qui transforme la conception d'enzymes, créant des biocatalyseurs très efficaces et stables pour des applications industrielles et médicales. Les résultats ont été publiés dans la revue Nature.
Demis Hassabis de DeepMind, Dario Amodei d'Anthropic et le pionnier de l'IA Yann LeCun présentent des points de vue contradictoires sur la faisabilité de l'AGI, LeCun affirmant que les LLM seuls ne peuvent atteindre une intelligence de niveau humain.
Une importante étude révèle que, si des IA comme GPT-4 peuvent désormais surpasser la personne moyenne aux tests de créativité, les humains les plus imaginatifs conservent encore un avantage significatif, mettant en évidence un plafond clair pour les capacités actuelles de l'IA.