Google выпускает Gemini 3 Deep Think с прорывными возможностями научного рассуждения
Google обновляет Gemini 3 Deep Think для науки и инженерии. Добивается 84,6% в ARC-AGI-2 и рейтинга Elo 3455 в соревновательном программировании.
Google обновляет Gemini 3 Deep Think для науки и инженерии. Добивается 84,6% в ARC-AGI-2 и рейтинга Elo 3455 в соревновательном программировании.
Gemini Deep Think демонстрирует прорывные результаты в решении математических задач уровня PhD и обеспечивает возможность автономных исследований в нескольких областях.
Google представляет DialogLab — фреймворк с открытым исходным кодом для создания, моделирования и тестирования многосторонних разговоров между людьми и ИИ, выходящих за рамки один‑на‑один взаимодействий.
ИИ Aletheia от DeepMind совершил прорыв, решив 13 печально сложных задач Эрдёша, продемонстрировав беспрецедентное сотрудничество человека и ИИ в области продвинутых математических исследований.
MIT Technology Review публикует подробный анализ спорного графика временного горизонта METR, который был широко неверно истолкован как оптимистами, так и пессимистами в отношении ИИ. График, показывающий, как с течением времени улучшается способность моделей ИИ выполнять задачи, заставил некоторых поверить, что утопия или апокалипсис ИИ неизбежны. В статье разъясняется истинное значение данных и рассматриваются распространённые заблуждения относительно измерений возможностей ИИ и траекторий прогресса.
OpenAI сталкивается с уходом старших сотрудников, поскольку компания отдает приоритет быстрым улучшениям ChatGPT в ущерб долгосрочным исследовательским проектам в области ИИ, таким как Sora и DALL‑E.
Отчет CSET показывает, что компании, работающие с ИИ, используют системы для ускорения НИОКР, рассматривая последствия для инноваций, безопасности и управления.
Появляющаяся технология моделей мира стремится решить проблемы согласованности ИИ, давая машинам лучшее понимание пространства и времени.
Humans&, новый AI-стартап, основанный бывшими исследователями из Anthropic, xAI и Google, привлек $480 млн в посевном раунде, достигнув оценки в $4,8 млрд при поддержке Nvidia и Джеффа Безоса.
Исследователи разработали новый метод ИИ под названием Riff-Diff, который преобразует проектирование ферментов, создавая высокоэффективные и стабильные биокатализаторы для промышленных и медицинских применений. Результаты опубликованы в журнале Nature.
Демис Хассабиc из DeepMind, Дарио Амодеи из Anthropic и пионер ИИ Янн Лекун высказывают противоречивые мнения о достижимости АГИ, при этом Лекун утверждает, что одни лишь большие языковые модели не способны достичь человеческого уровня интеллекта.
Крупное исследование показывает, что такие ИИ, как GPT-4, теперь могут превосходить среднестатистического человека в тестах на креативность, но самые изобретательные люди по-прежнему сохраняют значительное преимущество, что указывает на очевидный предел возможностей современных ИИ.