- 自然な動きと物理認識レンダリングを備えたテキスト→ビデオ生成
- 画像→ビデオのアニメーションと動作合成
- マルチモーダル入力:画像、短い動画、音声、テキストを組み合わせ可能
- 参照任意:アップロードしたコンテンツを動き/スタイル参照として使用
- ビデオ延長とマルチショットによるストーリーテリング
- 組み込みオーディオ生成:効果音やバックグラウンドミュージック
- 顔、衣装、テキスト、シーン要素の高い一貫性
- APIアクセスと階層型のクレジットベース料金
- 複数のアスペクト比でエクスポート、プランにより最大2K/4K