구글, 획기적인 과학적 추론을 갖춘 Gemini 3 Deep Think 공개
구글이 과학 및 공학을 위해 Gemini 3 Deep Think를 업그레이드했습니다. ARC-AGI-2에서 84.6%를 달성하고, 경쟁 코딩에서 Elo 3455를 기록했습니다.
구글이 과학 및 공학을 위해 Gemini 3 Deep Think를 업그레이드했습니다. ARC-AGI-2에서 84.6%를 달성하고, 경쟁 코딩에서 Elo 3455를 기록했습니다.
Gemini Deep Think는 박사 수준의 수학 문제 해결에서 획기적인 성능을 달성하고 여러 분야에서 자율 연구를 가능하게 합니다.
Google이 DialogLab을 공개했습니다. DialogLab은 1:1 상호작용을 넘어서는 다자간 인간-AI 대화를 작성, 시뮬레이션 및 테스트하기 위한 오픈소스 프레임워크입니다.
DeepMind의 Aletheia AI는 악명 높게 어렵던 13개의 Erdős 문제를 해결하며 돌파구를 마련했고, 고급 수학 연구에서 전례 없는 AI-인간 협업을 보여주었다.
MIT Technology Review는 METR의 논란이 된 시간 지평선 도표에 대한 심층 분석을 게재했습니다. 이 도표는 AI 모델들이 시간이 지남에 따라 과제를 수행하는 능력이 향상되는 모습을 보여주며, AI 낙관론자와 비관론자 모두에 의해 널리 오해되었습니다. 이 그래프 때문에 일부는 AI의 유토피아나 종말이 임박했다고 믿게 되었습니다. 이 기사는 데이터의 진정한 의미를 명확히 하고, AI 능력 측정과 발전 궤적에 대한 일반적인 오해들을 바로잡습니다.
OpenAI는 Sora와 DALL-E 같은 장기 AI 연구 프로젝트보다 빠른 ChatGPT 개선을 우선시하면서 고위 직원들의 이탈에 직면해 있다.
CSET 보고서는 AI 기업들이 연구개발을 가속화하기 위해 시스템을 사용하고 있음을 밝히며, 이는 혁신, 안전성 및 거버넌스에 미치는 영향을 검토한다.
새롭게 등장하는 세계 모델 기술은 기계가 공간과 시간을 더 잘 이해하도록 하여 AI의 일관성 문제를 해결하는 것을 목표로 한다.
Humans&는 Anthropic, xAI, Google의 전 연구원들이 설립한 새로운 AI 스타트업으로, 시드 라운드에서 $480M을 조달하며 Nvidia와 Jeff Bezos의 지원으로 $4.8B의 기업가치를 달성했습니다.
연구진은 Riff-Diff라고 불리는 새로운 AI 방법을 개발하여 효소 설계를 혁신하고 산업 및 의료 응용을 위한 매우 효율적이고 안정적인 생촉매를 만들어냈습니다. 이 연구 결과는 학술지 Nature에 게재되었습니다.
DeepMind의 Demis Hassabis, Anthropic의 Dario Amodei, AI 선구자 Yann LeCun이 AGI 실현 가능성에 대해 상충되는 견해를 제시했으며, LeCun은 LLM만으로는 인간 수준의 지능에 도달할 수 없다고 주장합니다.
대규모 연구에 따르면 GPT-4와 같은 AI가 창의성 테스트에서 평균적인 사람을 능가할 수 있지만, 가장 상상력이 풍부한 인간은 여전히 상당한 우위를 유지하고 있어 현재 AI 능력에는 명확한 한계가 있음을 보여준다.