LTX-2 es un modelo base de vídeo de código abierto de 19 mil millones de parámetros (14B video + 5B audio) que genera vídeo y audio sincrónicos de alta resolución en una sola pasada. Soporta 4K nativo (3840×2160) hasta 50 FPS y clips de vídeo de hasta 20 segundos, con entradas multimodales que incluyen prompts de texto, imágenes, mapas de profundidad, keyframes y vídeos de referencia cortos. El modelo provee síntesis de audio nativa—diálogos, sonidos ambientales, música y Foley—alineados con eventos visuales. LTX-2 está optimizado para inferencia eficiente (NVFP4/NVFP8) y se distribuye bajo Apache 2.0 para que los equipos puedan descargar pesos, ajustar, desplegar localmente o usar el generador web alojado (requiere créditos).