LTX-2는 190억 파라미터의 오픈소스 비디오 기반 모델(14B 비디오 + 5B 오디오)로, 단일 패스에서 동기화된 고해상도 비디오와 오디오를 생성합니다. 네이티브 4K(3840×2160)에서 최대 50 FPS를 지원하며 동영상 클립은 최대 20초까지 가능합니다. 텍스트 프롬프트, 이미지, 깊이 맵, 키프레임, 짧은 참조 비디오 등 멀티모달 입력을 지원합니다. 모델은 대화, 환경음, 음악 및 Foley를 포함한 네이티브 오디오 합성을 제공하며 시각 이벤트에 정렬됩니다. LTX-2는 효율적인 추론(NVFP4/NVFP8)을 위해 최적화되어 있으며, 팀이 가중치를 다운로드하여 미세조정하고 로컬에 배포하거나 호스팅된 웹 생성기(크레딧 필요)를 사용할 수 있도록 Apache 2.0으로 제공됩니다.
Soro 2는 OpenAI Sora 2 아키텍처를 기반으로 구축된 혁신적인 AI 영상 제작 플랫폼입니다. 사용자가 상세한 텍스트 프롬프트 및 시각적 참조를 전문 등급의 10~20초 영화 영상으로 변환할 수 있습니다. 주요 기능으로는 얼굴 인식 및 음성 매칭이 가능한 맞춤 캐릭터 임베딩, 현실적인 움직임을 위한 고급 물리 기반 모델링, 음성과 음향 효과를 포함한 동기화 오디오 합성이 있습니다. 이 플랫폼은 마케팅, 교육 및 엔터테인먼트용 내러티브 일관성 멀티미디어 콘텐츠의 빠른 생성을 지원합니다.
Sora 2는 물리 법칙을 따르는 현실적인 비디오를 생성하는 OpenAI의 플래그십 AI 비디오 및 오디오 생성 시스템입니다. 대화 및 음향 효과를 영상과 완벽하게 동기화하며, 물체 역학을 정확하게 시뮬레이션하는 다중 샷 복잡한 장면을 지원합니다. 또한 사용자가 자신의 모습을 업로드하여 비디오를 개인화할 수 있는 혁신적인 카메오 기능을 제공합니다. 이 시스템은 안전, 동의 및 사용자 복지를 강조하면서 영화 및 애니메이션 스타일 비디오 제작의 창의적 자유를 제공합니다.