LTX-2 é um modelo base de vídeo open-source de 19 bilhões de parâmetros (14B vídeo + 5B áudio) que gera vídeo e áudio sincronizados de alta resolução em uma única passagem. Suporta 4K nativo (3840×2160) a até 50 FPS e clipes de vídeo de até 20 segundos, com entradas multimodais incluindo prompts de texto, imagens, mapas de profundidade, keyframes e vídeos de referência curtos. O modelo fornece síntese de áudio nativa — diálogo, sons ambiente, música e Foley — alinhada aos eventos visuais. LTX-2 é otimizado para inferência eficiente (NVFP4/NVFP8) e é distribuído sob Apache 2.0 para que equipes possam baixar pesos, ajustar, implantar localmente ou usar o gerador web hospedado (créditos necessários).