AI News

Google Veo 3.1이 Gemini에 네이티브 세로 비디오 생성을 도입

Google은 생성형 AI (Generative AI) 비디오 모델의 최신 버전인 Veo 3.1을 공식 발표했으며, 이제 이를 직접 Gemini에 통합했습니다. 이번 업데이트는 "모바일 우선" 콘텐츠 제작으로의 중요한 전환을 의미하며, 후반 편집에서 자르기 없이 소셜에 바로 올릴 수 있는 9:16 세로 비디오 생성을 가능하게 합니다.

디지털 마케터, 소셜 미디어 매니저, 콘텐츠 제작자들에게 이번 개발은 TikTok, Instagram Reels, YouTube Shorts 같은 플랫폼을 위한 워크플로를 간소화한다는 신호입니다. 사용자가 직접 세로 형식을 요청할 수 있게 함으로써 Google은 Gemini를 크리에이터 경제를 위한 포괄적 도구로 자리매김시키고 있으며, 여전히 주로 가로 우선 생성에 의존하는 경쟁자들에 도전하고 있습니다.

모바일 우선 생성으로의 전환

Veo 3.1의 핵심 기능은 세로 종횡비를 네이티브로 이해하고 생성할 수 있다는 점입니다. 이전 세대의 텍스트-투-비디오 모델들—그리고 현재 시장에 있는 많은 경쟁 모델들—은 종종 정사각형(1:1) 또는 가로(16:9) 형식으로 비디오를 생성했습니다. 모바일 플랫폼에서 이러한 클립을 사용하려면 제작자들은 전통적으로 영상을 잘라야 했습니다.

이러한 "먼저 자르기(crop-first)" 방식은 몇 가지 기술적 제약을 낳았습니다.

  • 해상도 손실: 가로 영상에서 세로 부분을 확대해 잘라내면 최종 출력의 픽셀 수가 크게 줄어듭니다.
  • 구도 오류: 가로 영화 데이터로 학습된 AI 모델은 피사체를 중앙에 배치하는 경향이 있어 세로로 잘랐을 때 피사체의 일부분이 잘리거나 맥락을 잃는 등의 어색한 구도가 발생합니다.
  • 워크플로 마찰: 추가적인 편집 및 재구성 단계는 아이디어에서 업로드까지의 과정을 느리게 만듭니다.

Google의 업데이트 관련 성명은 Veo 3.1이 "전체 프레임 세로 비디오를 생성하여 최적화된 구도(optimized composition)를 제공한다"고 강조합니다. 이는 모델의 학습 데이터 또는 추론 과정이 세로 구도 관습(예: 적절한 머리 여유(headroom)와 세로 유도선)을 인식하도록 조정되었음을 시사하며, 이는 모바일 참여도에 매우 중요합니다.

비교 분석: 네이티브 세로 vs. 가로 크롭

업계는 데스크톱 시대의 비디오 형식을 적응시키는 단계에서 모바일 네이티브 콘텐츠를 생성하는 방향으로 빠르게 이동하고 있습니다. 아래 표는 전통적인 워크플로와 Veo 3.1의 네이티브 생성 간 운영상 차이를 정리한 것입니다.

Table 1: Comparison of AI Video Generation Methodologies

Feature Native Vertical Generation (Veo 3.1) Traditional Landscape Cropping
Aspect Ratio Native 9:16 (Vertical) Native 16:9 (Landscape) converted to 9:16
Pixel Integrity Retains full resolution of the generated output Loss of approx. 60-70% of pixels due to cropping
Subject Framing AI optimizes composition for vertical screens (e.g., subject centering) Subject often moves out of the "safe zone" during motion
Production Speed One-shot generation ready for upload Requires secondary editing/reframing phase
Prompt Adherence Visual elements generated specifically for vertical space Peripheral elements in prompt may be lost in crop

시장 우위와 LMArena 순위

Veo 3.1의 출시 시점은 Google이 생성형 비디오 분야에서 공격적으로 우위를 주장하고 있는 때와 맞물립니다. 널리 인용되는 대형 멀티모달 모델 벤치마크인 LMArena를 인용한 보고서에 따르면, Google Veo의 다양한 버전들이 현재 텍스트-투-비디오 리더보드 상위권을 차지하고 있습니다.

이러한 순위는 기업 및 전문 사용자에게 중요합니다. 많은 실험적 모델들이 존재하지만, 높은 리더보드 순위는 프롬프트 준수성, 시간적 일관성(동작의 부드러움), 시각적 충실도 등 창작 전문가들이 요구하는 일관성을 의미합니다. 이 고성능 모델을 Gemini에 통합함으로써 Google은 이를 개발자 API나 폐쇄 베타에서 소비자용 제품으로 민주화하고 있습니다.

"Slop" 논쟁과 콘텐츠 포화

Veo 3.1의 기술적 능력은 인상적이지만, 업계 관찰자들은 알고리즘 기반 콘텐츠의 포화—일반적으로 경멸적으로 'AI slop'이라고 불리는—에 대한 우려를 제기해 왔습니다. Gemini 사용자가 이제 무한한 세로 비디오 스트림을 쉽게 생성할 수 있게 되면서, 인간이 만든 콘텐츠가 기계 생성의 참여 유인물과 가시성을 두고 경쟁하는 균질화된 인터넷에 대한 두려움이 커지고 있습니다.

Meta 같은 플랫폼은 이미 이 개념을 실험했습니다; 전적으로 스크롤 가능한 AI 비디오에 전념하는 소셜 표면인 Vibes의 출시는 업계의 방향을 부각합니다. 비평가들은 Veo 3.1과 같은 도구가 강력하긴 하지만 본질적으로 이러한 "무한한 slop"의 엔진으로 작동하여 저노력 합성 미디어로 소셜 플랫폼의 사용자 경험을 저하시킬 수 있다고 주장합니다.

그러나 Creati.ai 관점에서 보면, 도구 자체는 중립적이며 그 영향은 제작자의 의도에 달려 있습니다. 전문 디자이너와 스토리텔러에게 Veo 3.1은 고품질 B-roll, 역동적인 배경, 스토리보드 컨셉을 전례 없는 속도로 생성할 수 있는 수단을 제공합니다. 창작 업계가 직면한 도전은 이러한 도구를 피드 공간을 채우는 용도로만 사용하지 않고 서사적 가치를 향상시키는 방식으로 활용하는 것입니다.

Gemini 생태계와의 통합

Veo 3.1을 Gemini에 통합한 것은 Google의 AI 모달리티 간 더 깊은 수렴을 시사합니다. 사용자는 Gemini의 강력한 언어 능력을 활용해 비디오 컨셉을 브레인스토밍하고, 대본을 작성한 다음 동일한 인터페이스 내에서 바로 시각 자산을 생성할 수 있을 것으로 보입니다.

이 생태계 통합의 주요 이점은 다음과 같습니다:

  1. 맥락 인식: 사용자는 Gemini와의 자연어 대화를 통해 비디오 프롬프트를 정교하게 다듬고 생성 전에 시각적 스타일을 반복적으로 수정할 수 있습니다.
  2. 멀티모달 워크플로: 이론적으로는 제품 이미지를 업로드한 뒤 Gemini에 "Instagram용 세로 비디오로 이걸 애니메이션화해 달라"고 요청하여 Veo 3.1의 동작 이해와 업로드한 이미지의 문맥을 활용하는 워크플로가 가능할 것입니다.
  3. 접근성: Veo 3.1을 Gemini에 배치함으로써 Google은 전문 비디오 소프트웨어의 필요성을 우회하여 소규모 사업자와 독립 마케터도 고급 생성형 비디오에 접근할 수 있게 합니다.

향후 기술적 시사점

2026년 나머지 기간을 전망하면, 세로 비디오 생성의 표준화는 더 발전된 기능의 전조가 됩니다. 향후 업데이트는 다음에 초점을 맞출 가능성이 있습니다:

  • 가변 프레임레이트: 다양한 소셜 플랫폼이 선호하는 30fps 또는 60fps 표준에 맞춰 최적화
  • 오디오 동기화: 이미 Google 연구 파이프라인에 존재하는 AI 생성 효과음 또는 보이스오버와의 보다 긴밀한 통합
  • 브랜드 키트 통합: 기업이 스타일 가이드를 업로드해 생성된 세로 비디오가 특정 색상 팔레트와 타이포그래피 규칙을 준수하도록 허용

결론

Google Veo 3.1은 생성형 비디오 기술의 성숙을 상징합니다. "비디오 만들기"의 참신함 단계를 넘어 현대 인터넷이 요구하는 특정 전달 형식(특히 9:16 세로 비디오)에 초점을 맞춤으로써 Google은 생성형 AI를 실용적인 유틸리티로 전환하고 있습니다. 콘텐츠 포화에 대한 논쟁은 여전히 중요하지만, 전문 창작자에게 주는 유용성은 분명합니다: Veo 3.1은 창작 아이디어와 세계 최대의 비디오 플랫폼에서의 실행 사이의 마찰을 줄여줍니다.

추천