AI News

Рассвет эры агентов: стратегический скачок Alibaba

Решительным шагом, усиливающим глобальную гонку вооружений в области искусственного интеллекта, компания Alibaba Cloud официально представила Qwen 3.5 — масштабную модель с 397 миллиардами параметров, призванную перевести индустрию от пассивных чат-ботов к автономным цифровым агентам. Выпущенная 16 февраля 2026 года, эта модель знаменует собой фундаментальный архитектурный сдвиг, отдавая приоритет «агентным» (agentic) возможностям — способности ИИ самостоятельно планировать, использовать инструменты и выполнять сложные рабочие процессы в мобильных и десктопных интерфейсах без постоянного контроля со стороны человека.

Запуск происходит в критический для сектора ИИ момент. Если 2025 год прошел под знаком совершенствования моделей рассуждения (reasoning models), то 2026 год стремительно становится годом «ИИ-агента». Новая разработка Alibaba нацелена именно на этот рубеж, обладая гибридной архитектурой смеси экспертов (Mixture-of-Experts, MoE), которая, по заявлению компании, обеспечивает современную производительность при одновременном снижении затрат на инференс на 60% по сравнению с предшественником. Открывая веса модели Qwen 3.5-397B-A17B, Alibaba не просто выпускает продукт, но и пытается установить стандарт для следующего поколения разработки ИИ с открытыми весами.

Архитектурный прорыв: дизайн 397B/17B

В основе Qwen 3.5 лежит сложный инженерный компромисс между огромным масштабом и операционной эффективностью. Хотя модель обладает ошеломляющим общим количеством параметров в 397 миллиардов, она использует высокоразреженную архитектуру MoE, которая активирует только 17 миллиардов параметров при каждом прямом проходе.

Это количество «активных параметров» является ключевым показателем для разработчиков и корпоративных клиентов. Оно позволяет модели сохранять энциклопедические знания и глубину рассуждений системы с триллионом параметров, сохраняя при этом скорость инференса и стоимость на уровне гораздо меньшей модели. Архитектура объединяет технологию Gated DeltaNet — механизм линейного внимания — с традиционными слоями Transformer. Этот гибридный подход значительно снижает требования к пропускной способности памяти, что является постоянным узким местом при развертывании больших языковых моделей (LLM) в промышленных масштабах.

Ключевые архитектурные характеристики:

Категория спецификации Техническая деталь Влияние на производительность
Общее количество параметров 397 миллиардов Обеспечивает сохранение обширных знаний и нюансов
Активные параметры 17 миллиардов Обеспечивает высокоскоростной инференс с низкой задержкой
Тип архитектуры Гибрид MoE + Gated DeltaNet Балансирует глубину рассуждений и вычислительную эффективность
Окно контекста 256k (Standard) / 1M (Plus) Позволяет обрабатывать массивные документы и кодовые базы
Метод обучения Мультимодальность раннего слияния Нативное понимание текста, аудио и видео

Эта эффективность не является чисто теоретической. Alibaba Cloud сообщает, что Qwen 3.5 в восемь раз эффективнее справляется с крупномасштабными рабочими нагрузками, чем предыдущая модель Qwen 3-Max-Thinking, что делает её жизнеспособным движком для реальных коммерческих приложений, а не просто исследовательским артефактом.

Больше чем чат: настоящая мультимодальная агентность

Наиболее значимым отличием Qwen 3.5 является её ориентация на визуальные агентные возможности (visual agentic capabilities). В отличие от предыдущих поколений моделей, которые в основном были системами «текст на входе — текст на выходе», Qwen 3.5 обучалась с использованием мультимодальности «раннего слияния» (early fusion). Это означает, что модель обрабатывает изображения, видео и аудио нативно вместе с текстом, а не полагается на отдельные слои адаптеров, которые могут терять нюансы.

Для «эры агентов» такое нативное зрение имеет первостепенное значение. Alibaba продемонстрировала способность модели интерпретировать графические интерфейсы пользователя (GUI) как на смартфонах, так и на компьютерах. В ходе контролируемых демонстраций Qwen 3.5 ориентировалась в сложных программных средах, идентифицировала кнопки, читала динамическое содержимое экрана и выполняла многоэтапные рабочие процессы — такие как бронирование поездки через три разных приложения или управление логистикой цепочки поставок — полностью автономно.

Эта возможность ставит Qwen 3.5 в прямую оппозицию проприетарным агентам, «использующим компьютер», от западных конкурентов. Однако, предлагая эти возможности в пакете ИИ с открытым исходным кодом (Open-source AI) под лицензией Apache 2.0, Alibaba снижает порог входа для разработчиков, стремящихся создавать инструменты автономной роботизированной автоматизации процессов (RPA) и персональных помощников.

Тестирование будущего: новый глобальный стандарт?

Релиз вызвал немедленные сравнения с топовыми моделями из США. Alibaba заявляет, что во внутренних бенчмарках Qwen 3.5 превосходит GPT-5.2 и Claude Opus 4.5 в специфических задачах, связанных со зрением и следованием инструкциям, хотя, по сообщениям, немного уступает в чисто кодинговых задачах специализированным моделям для программирования.

Конкурентная среда в 2026 году крайне напряженная. Всего за несколько дней до анонса Alibaba компания ByteDance обновила свою модель Doubao, и ходят слухи, что DeepSeek готовит ответный релиз. Однако показатели Qwen 3.5 в бенчмарке «Последний экзамен человечества» (Humanity's Last Exam, HLE-Verified) свидетельствуют о том, что она достигла уровня зрелости рассуждений, сопоставимого с лучшими закрытыми моделями, доступными на данный момент.

Сравнительная характеристика (прогноз):

Характеристика Qwen 3.5 (Alibaba) GPT-5.2 (OpenAI) Claude Opus 4.5 (Anthropic)
Основной фокус Агентность/Действие Рассуждение/Генерация Безопасность/Длинный контекст
Открытые веса Да (Apache 2.0) Нет Нет
Мультимодальность Нативная (Early Fusion) Нативная Нативная
Стоимость развертывания Низкая (17B активных) Высокая Высокая
Экосистема Alibaba Cloud/Hugging Face Azure/OpenAI API AWS/Google Cloud

Глобальная гонка вооружений в сфере ИИ

Агрессивная стратегия Alibaba в области открытого исходного кода — это обоюдоострый меч, призванный потеснить конкурентов. Выпуская мультимодальную базовую модель (multimodal foundation model) такого калибра бесплатно, Alibaba поощряет мировое сообщество разработчиков оптимизировать и развивать их архитектуру, фактически превращая в общедоступный товар (commoditizing) уровень «интеллекта», на котором такие компании, как OpenAI и Google, стремятся монетизироваться.

Этот шаг усиливает растущее влияние Китая в экосистеме открытых моделей. Учитывая более 20 миллионов загрузок серии Qwen до этого релиза, ожидается, что обновление 3.5 ускорит внедрение на рынках, где суверенитет данных и стоимость развертывания являются основными приоритетами. Поддержка моделью более 200 языков, включая нишевые диалекты, еще больше расширяет её привлекательность за пределами англоязычного мира.

Экосистема разработчиков и безопасность

Для поддержки развертывания этих агентов Alibaba одновременно обновила свою студию моделей Alibaba Cloud Model Studio и выпустила фреймворк «Qwen Agent». Этот программный стек обеспечивает необходимые защитные барьеры для развертывания автономных агентов, включая теги «режима мышления» (thinking mode), которые позволяют разработчикам видеть внутренний процесс рассуждений модели перед тем, как она предпримет действие, что является критически важной функцией для соблюдения нормативных требований в таких корпоративных секторах, как финансы и здравоохранение.

Однако переход к агентному ИИ (agentic AI) поднимает серьезные вопросы безопасности. Модель, которая может «кликать» и «печатать» на экране, несет в себе риски, которых нет у текстовых чат-ботов. Alibaba подчеркнула, что Qwen 3.5 включает надежное обучение безопасности для предотвращения непреднамеренных действий, но ответственность во многом ляжет на разработчиков, которым придется внедрять строгие структуры разрешений для этих автономных систем.

По мере того как индустрия осваивает возможности Qwen 3.5, становится ясно одно: определение «большой языковой модели» эволюционирует. Мы больше не просто создаем модели, которые говорят; мы создаем модели, которые действуют. С Qwen 3.5 Alibaba заявила о себе как об одном из главных архитекторов этой новой агентной реальности.

Рекомендуемые