
Google официально представила Veo 3.1, последнюю версию своей генеративной модели ИИ (Generative AI) для видео, теперь интегрированную напрямую в Gemini. Это обновление знаменует собой значительный поворот к созданию контента с приоритетом мобильных устройств, позволяя генерировать готовые для социальных сетей вертикальные видео формата 9:16 без необходимости последующей обрезки.
Для цифровых маркетологов, менеджеров по социальным сетям и создателей контента это означает упрощённый рабочий процесс для платформ вроде TikTok, Instagram Reels и YouTube Shorts. Позволяя пользователям запрашивать вертикальные форматы напрямую, Google позиционирует Gemini как всесторонний инструмент для экономики создателей, бросая вызов конкурентам, которые по-прежнему в основном ориентируются на ландшафтную генерацию.
Ключевой особенностью Veo 3.1 является её способность нативно понимать и генерировать контент в вертикальном соотношении сторон. Предыдущие версии моделей преобразования текста в видео, а также многие конкурирующие модели на рынке, часто генерировали видео в квадратном (1:1) или ландшафтном (16:9) форматах. Чтобы использовать такие клипы на мобильных платформах, авторам традиционно приходилось обрезать ролики.
Этот подход «сначала обрезка» имел несколько технических ограничений:
В заявлении Google по поводу обновления подчёркивается, что Veo 3.1 обеспечивает «оптимизированную композицию за счёт генерации вертикального видео в полном кадре». Это указывает на то, что тренировочные данные или процесс вывода модели были настроены на распознавание вертикальных приёмов кадрирования, таких как корректная верхняя и нижняя зона кадра и вертикальные ведущие линии, которые критичны для вовлечённости на мобильных устройствах.
Отрасль стремительно переходит от адаптации форматов эпохи настольных компьютеров к генерации контента, родного для мобильных устройств. Ниже таблица, которая описывает операционные различия между традиционным рабочим процессом и нативной генерацией Veo 3.1.
Таблица 1: Сравнение методологий генерации видео с помощью ИИ
| Характеристика | Нативная вертикальная генерация (Veo 3.1) | Традиционная обрезка из ландшафтного формата |
|---|---|---|
| Соотношение сторон | Нативно 9:16 (вертикальное) | Нативно 16:9 (ландшафт), конвертируется в 9:16 |
| Целостность пикселей | Сохраняет полное разрешение сгенерированного вывода | Потеря примерно 60–70% пикселей из‑за обрезки |
| Кадрирование объекта | ИИ оптимизирует композицию под вертикальные экраны (например, центрирование объекта) | Объект часто выходит за «зону безопасности» при движении |
| Скорость производства | Генерация «в один заход», готова к загрузке | Требуется вторичное редактирование/перефрейминг |
| Соответствие промпту | Визуальные элементы генерируются специально для вертикального пространства | Периферийные элементы в промпте могут быть утеряны при обрезке |
Выпуск Veo 3.1 произошёл в момент, когда Google активно укрепляет своё доминирование в области генеративного видео. Согласно отчётам с упоминанием LMArena, широко цитируемого эталона для крупных мультимодальных моделей (Large Multimodal Models), разные версии Google Veo в настоящее время занимают верхние строчки в таблице лидеров по преобразованию текста в видео.
Этот рейтинг имеет значение для корпоративных и профессиональных пользователей. Хотя существует множество экспериментальных моделей, высокие позиции в рейтингах свидетельствуют о стабильности соблюдения промпта, временной согласованности (плавности движения) и визуальном качестве — качествах, необходимых творческим профессионалам. Интегрируя эту высокопроизводительную модель в Gemini, Google фактически демократизирует доступ к передовой синтезу видео, переводя его из разработческих API или закрытых бет в продукт, ориентированный на конечного пользователя.
Несмотря на впечатляющие технологические возможности Veo 3.1, отраслевые наблюдатели высказывают обоснованные опасения по поводу насыщения алгоритмическим контентом — часто пренебрежительно называемым «AI slop». Простота, с которой пользователи Gemini теперь могут генерировать бесконечные потоки вертикального видео, усиливает опасения по поводу унификации интернета, где созданный человеком контент конкурирует за видимость с машинно-сгенерированным кликбейтом.
Платформы вроде Meta уже экспериментировали с этой концепцией; запуск Vibes, социальной поверхности, полностью посвящённой прокрутке AI-видео, подчёркивает направление отрасли. Критики утверждают, что инструменты вроде Veo 3.1, хотя и мощные, фактически служат двигателем для этой «бесконечной» массы контента, что может ухудшить пользовательский опыт на социальных платформах, засыпая их низкозатратными синтетическими материалами.
Однако с точки зрения Creati.ai инструмент нейтрален; его влияние зависит от намерений создателя. Для профессиональных дизайнеров и рассказчиков Veo 3.1 предлагает способ быстро генерировать качественный B-roll, динамические фоны и концепты раскадровки. Задача для индустрии творчества — использовать эти инструменты для усиления нарративной ценности, а не просто заполнения ленты.
Интеграция Veo 3.1 в Gemini свидетельствует о глубокой конвергенции модальностей ИИ у Google. Пользователи, скорее всего, смогут использовать сильные языковые возможности Gemini для генерации идей видео, написания сценариев и затем немедленно создавать сопутствующие визуальные материалы в том же интерфейсе.
Ключевые преимущества такой интеграции экосистемы включают:
Оглядываясь на остаток 2026 года, стандартизация генерации вертикального видео служит предвестником более продвинутых функций. Ожидается, что будущие обновления могут сосредоточиться на:
Google Veo 3.1 демонстрирует зрелость технологий генеративного видео. Пройдя стадию «новизны» в создании видео и сосредоточившись на конкретных форматах, требуемых современным интернетом (в частности 9:16 вертикальное видео), Google превращает генеративный ИИ в практическую утилиту. Хотя дебаты о насыщении контентом остаются актуальными, польза для профессиональных создателей очевидна: Veo 3.1 снижает трение между творческой идеей и её реализацией на крупнейших видеоплатформах мира.