AI News

Google Veo 3.1 приносит нативную генерацию вертикального видео в Gemini

Google официально представила Veo 3.1, последнюю версию своей генеративной модели ИИ (Generative AI) для видео, теперь интегрированную напрямую в Gemini. Это обновление знаменует собой значительный поворот к созданию контента с приоритетом мобильных устройств, позволяя генерировать готовые для социальных сетей вертикальные видео формата 9:16 без необходимости последующей обрезки.

Для цифровых маркетологов, менеджеров по социальным сетям и создателей контента это означает упрощённый рабочий процесс для платформ вроде TikTok, Instagram Reels и YouTube Shorts. Позволяя пользователям запрашивать вертикальные форматы напрямую, Google позиционирует Gemini как всесторонний инструмент для экономики создателей, бросая вызов конкурентам, которые по-прежнему в основном ориентируются на ландшафтную генерацию.

Переход к генерации с приоритетом мобильных устройств

Ключевой особенностью Veo 3.1 является её способность нативно понимать и генерировать контент в вертикальном соотношении сторон. Предыдущие версии моделей преобразования текста в видео, а также многие конкурирующие модели на рынке, часто генерировали видео в квадратном (1:1) или ландшафтном (16:9) форматах. Чтобы использовать такие клипы на мобильных платформах, авторам традиционно приходилось обрезать ролики.

Этот подход «сначала обрезка» имел несколько технических ограничений:

  • Потеря разрешения: увеличение и обрезка вертикального фрагмента из ландшафтного видео значительно уменьшают количество пикселей в финальном результате.
  • Ошибки композиции: модели ИИ, обученные на ландшафтных кинематографических данных, часто центрируют объекты таким образом, что при вертикальной обрезке получается неудачная кадрировка (например, отрезанные объекты или потеря контекста).
  • Трение в рабочем процессе: дополнительный шаг редактирования и перестановки кадра замедляет конвейер «идея → публикация».

В заявлении Google по поводу обновления подчёркивается, что Veo 3.1 обеспечивает «оптимизированную композицию за счёт генерации вертикального видео в полном кадре». Это указывает на то, что тренировочные данные или процесс вывода модели были настроены на распознавание вертикальных приёмов кадрирования, таких как корректная верхняя и нижняя зона кадра и вертикальные ведущие линии, которые критичны для вовлечённости на мобильных устройствах.

Сравнительный анализ: нативная вертикальная генерация против обрезки ландшафта

Отрасль стремительно переходит от адаптации форматов эпохи настольных компьютеров к генерации контента, родного для мобильных устройств. Ниже таблица, которая описывает операционные различия между традиционным рабочим процессом и нативной генерацией Veo 3.1.

Таблица 1: Сравнение методологий генерации видео с помощью ИИ

Характеристика Нативная вертикальная генерация (Veo 3.1) Традиционная обрезка из ландшафтного формата
Соотношение сторон Нативно 9:16 (вертикальное) Нативно 16:9 (ландшафт), конвертируется в 9:16
Целостность пикселей Сохраняет полное разрешение сгенерированного вывода Потеря примерно 60–70% пикселей из‑за обрезки
Кадрирование объекта ИИ оптимизирует композицию под вертикальные экраны (например, центрирование объекта) Объект часто выходит за «зону безопасности» при движении
Скорость производства Генерация «в один заход», готова к загрузке Требуется вторичное редактирование/перефрейминг
Соответствие промпту Визуальные элементы генерируются специально для вертикального пространства Периферийные элементы в промпте могут быть утеряны при обрезке

Доминирование на рынке и рейтинги LMArena

Выпуск Veo 3.1 произошёл в момент, когда Google активно укрепляет своё доминирование в области генеративного видео. Согласно отчётам с упоминанием LMArena, широко цитируемого эталона для крупных мультимодальных моделей (Large Multimodal Models), разные версии Google Veo в настоящее время занимают верхние строчки в таблице лидеров по преобразованию текста в видео.

Этот рейтинг имеет значение для корпоративных и профессиональных пользователей. Хотя существует множество экспериментальных моделей, высокие позиции в рейтингах свидетельствуют о стабильности соблюдения промпта, временной согласованности (плавности движения) и визуальном качестве — качествах, необходимых творческим профессионалам. Интегрируя эту высокопроизводительную модель в Gemini, Google фактически демократизирует доступ к передовой синтезу видео, переводя его из разработческих API или закрытых бет в продукт, ориентированный на конечного пользователя.

Дебаты вокруг «Slop» и насыщенности контента

Несмотря на впечатляющие технологические возможности Veo 3.1, отраслевые наблюдатели высказывают обоснованные опасения по поводу насыщения алгоритмическим контентом — часто пренебрежительно называемым «AI slop». Простота, с которой пользователи Gemini теперь могут генерировать бесконечные потоки вертикального видео, усиливает опасения по поводу унификации интернета, где созданный человеком контент конкурирует за видимость с машинно-сгенерированным кликбейтом.

Платформы вроде Meta уже экспериментировали с этой концепцией; запуск Vibes, социальной поверхности, полностью посвящённой прокрутке AI-видео, подчёркивает направление отрасли. Критики утверждают, что инструменты вроде Veo 3.1, хотя и мощные, фактически служат двигателем для этой «бесконечной» массы контента, что может ухудшить пользовательский опыт на социальных платформах, засыпая их низкозатратными синтетическими материалами.

Однако с точки зрения Creati.ai инструмент нейтрален; его влияние зависит от намерений создателя. Для профессиональных дизайнеров и рассказчиков Veo 3.1 предлагает способ быстро генерировать качественный B-roll, динамические фоны и концепты раскадровки. Задача для индустрии творчества — использовать эти инструменты для усиления нарративной ценности, а не просто заполнения ленты.

Интеграция в экосистему Gemini

Интеграция Veo 3.1 в Gemini свидетельствует о глубокой конвергенции модальностей ИИ у Google. Пользователи, скорее всего, смогут использовать сильные языковые возможности Gemini для генерации идей видео, написания сценариев и затем немедленно создавать сопутствующие визуальные материалы в том же интерфейсе.

Ключевые преимущества такой интеграции экосистемы включают:

  1. Контекстуальная осведомлённость: пользователи могут уточнять промпты для видео с помощью естественного языкового диалога с Gemini, итеративно подбирая визуальный стиль перед генерацией.
  2. Мультимодальные рабочие процессы: теоретически рабочий процесс может включать загрузку изображения продукта и просьбу к Gemini «анимировать это в вертикальном видео для Instagram», используя понимание Veo 3.1 движения и контекста загруженного изображения.
  3. Доступность: разместив Veo 3.1 в Gemini, Google устраняет необходимость в специализированном видеопрограммном обеспечении, делая высококлассное генеративное видео доступным для владельцев малого бизнеса и независимых маркетологов.

Технические последствия для будущего

Оглядываясь на остаток 2026 года, стандартизация генерации вертикального видео служит предвестником более продвинутых функций. Ожидается, что будущие обновления могут сосредоточиться на:

  • Переменных частотах кадров: оптимизация специально для стандартов 30fps или 60fps, предпочитаемых разными социальными платформами.
  • Синхронизации аудио: более тесная интеграция между генерацией видео и ИИ‑генерируемыми звуковыми эффектами или озвучкой, которые уже присутствуют в исследовательской ветке Google.
  • Интеграции брендового набора: предоставление бизнесам возможности загружать гайды по стилю, чтобы сгенерированные вертикальные видео соответствовали определённым палитрам и типографическим правилам.

Заключение

Google Veo 3.1 демонстрирует зрелость технологий генеративного видео. Пройдя стадию «новизны» в создании видео и сосредоточившись на конкретных форматах, требуемых современным интернетом (в частности 9:16 вертикальное видео), Google превращает генеративный ИИ в практическую утилиту. Хотя дебаты о насыщении контентом остаются актуальными, польза для профессиональных создателей очевидна: Veo 3.1 снижает трение между творческой идеей и её реализацией на крупнейших видеоплатформах мира.

Рекомендуемые