AI-Short-Video-Engine在端到端流程中協調多個AI模組,將用戶定義的文字提示轉換成精美的短影片。首先,系統利用大型語言模型產生分鏡和腳本。接著,Stable Diffusion創建場景圖像,bark提供逼真的語音配音。引擎會將圖像、字幕和音訊合成成一個完整影片,自動添加轉場和背景音樂。其插件架構允許按需客製化每階段:從替換不同的文字轉圖像或TTS模型到調整影片解析度和樣式模板。透過Docker或原生Python部署,提供CLI命令和RESTful API端點,讓開發者可以輕鬆整合AI影片製作流程到既有工作流程。