Happy Horse 1.0은 텍스트 또는 이미지 프롬프트로부터 영화 품질의 비디오와 동기화된 오디오를 생성하도록 설계된 오픈소스 AI 비디오 생성 모델입니다. 통합 Transformer 아키텍처를 사용하며, 다국어 립싱크를 지원하고, 고성능 GPU에서의 자가 호스팅, 파인튜닝 및 상업적 배포를 위해 설계되었습니다.
Happy Horse 1.0은 텍스트 또는 이미지 프롬프트로부터 동기화된 오디오가 포함된 짧고 고품질의 비디오를 생성하는 150억 파라미터의 오픈소스 AI 비디오 생성 모델입니다. 통합 Transformer 아키텍처, 다국어 립싱크, 그리고 5~8초 길이의 클립에서 1080p 출력을 결합합니다. 이 모델에는 distilled inference, 초해상도, 오픈소스 배포 코드도 포함되어 있어 자가 호스팅 워크플로우에 적합합니다. 상업적 사용을 지원하며 최신 GPU에서 효율적인 생성을 위해 최적화되었습니다. 이 제품은 비디오와 오디오의 공동 합성, 안정적인 출력 품질, 그리고 제작자, 개발자, 연구자를 위한 실용적인 배포에 중점을 둡니다.