ローカル 8GB VRAM 動画モデル比較データセット — Wan2.1 × LTX-Video × AnimateDiff
- Digital2,000 JPY







ローカル 8GB VRAM 動画モデル比較データセット 2026 「Wan2.1 / LTX-Video / AnimateDiff、結局どれをいつ使えばいいの?」を、**同じ 30 プロンプト・同じ seed**で生成して 90 動画 + 評価 CSV で答えるデータセットです。 ローカル 8GB VRAM(RTX 4060 / 5060)で動かせる現実的な選択肢を、**実画像**で示します。 ## こんな人にオススメ - 動画モデルの「最初の 1 本」を選ぶ判断材料が欲しい - Wan2.1 / LTX-Video / AnimateDiff の 得意・不得意の境界を実画像で把握したい - 動画モデルごとの 時間的安定性 / モーション量 / 静止画品質 を数値で比較したい - 自分で 30 動画 × 3 モデル = 90 動画を生成する 数日分の検証を圧縮したい ## 内容物(全 158 MB、ZIP) - 全動画 90 本(videos/animatediff/ / videos/ltx_video/ / videos/wan21/、各 30 mp4) - 厳選 20 動画(highlights/、k-means 多様性選定 k=20、selection.csv 付き) - 3 モデル横並び Grid 動画 5 本(grids/、キャラ動作 / 風景 / 物体粒子 / 抽象 / エッジケース、ffmpeg hstack) - サムネイル 90 枚(thumbnails/、各動画の 1st frame PNG) - metadata.csv(全 90 動画の生成パラメータ — model / num_frames / fps / resolution / steps / cfg / seed / dreamshaper_8 base 等) - video_metrics.csv(評価スコア — frame_aesthetic_mean / temporal_consistency / motion_intensity) - prompts.json(30 プロンプト、ジャンル別) - README.md(検証セットアップ + モデル別傾向 + ライセンス) - reproduce.md(再現スクリプト + CLI 使用例 + 既知のハマりどころ) ## 主要発見 / 観察できる挙動(抄賭) | モデル | aesthetic 平均 | temporal_consistency | motion_intensity | 特徴 | |---|---|---|---|---| | AnimateDiff (dreamshaper_8 base) | 5.82 🥇 | 0.995 🥇 | 0.020 | 静止画品質トップ、最も時間的に安定、モーション控えめ | | Wan2.1 1.3B | 5.59 | 0.987 | 0.078 🥇 | バランス良好、最もモーション量が多い | | LTX-Video 0.9 | 4.71 | 0.990 | 0.024 | 解像度高いが品質ばらつき大、静止画寄り | 結論 (棲み分け) - 🥇 動き重視 → Wan2.1(キャラ動作・粒子・風景に強い) - 🥇 静止画品質重視 → AnimateDiff(dreamshaper_8 ベースで顔・手の崩れが大幅改善) - 🥇 高解像度 → LTX-Video(1024×576、ただし aesthetic ばらつき大) 詳細は README.md と Grid 動画 5 本、video_metrics.csv を参照。 ## 30 プロンプトの構成(ジャンル多様) | ジャンル | 数 | 例 | |---|---|---| | キャラ動作 | 8 | samurai drawing katana / cyberpunk hacker / detective in rainy noir street | | 風景 | 8 | jungle waterfall / aurora over snow village / underwater coral reef | | 物体・粒子 | 6 | sparks from campfire / water droplets slow motion / ink in clear water | | 抽象 | 4 | swirling galaxy / liquid metal flow / flowing colorful smoke | | エッジケース | 4 | multi-character sparring / fast camera pan / ballet leap | エッジケース 4 種は 全モデルが破綿しやすい題材を意図的に入れています(限界の可視化)。 ## 検証セットアップ | 項目 | 値 | |---|---| | Wan2.1 1.3B | 832×480 / 81 frames / 16fps native / steps=30 / cfg=5.0 / 公式推奨ネガ自動適用 | | LTX-Video 0.9 | 1024×576 / 97 frames / 24fps native / steps=30 / cfg=3.5 | | AnimateDiff | 512×768 / 32 frames / 8fps native → RIFE 24fps / steps=50 / cfg=8.0 / dreamshaper_8 base / FreeNoise(context_length=16, stride=4) | | 共通 seed | 5307 | | 共通 prompt | 30 個(全件 prompts.json に記録) | | 動画長 | 約 4 秒(各モデル native fps で生成、grid は 24fps に統一) | 「prompt と seed と長さ以外はモデル native のまま」を厳守。これで「モデルごとの個性」を isolate しています。 ## 使い方 1. ZIP を展開 → README.md を最初に読む 2. grids/grid_p*_3model.mp4 の 5 本で 3 モデルの差を視覚的に把握(キャラ / 風景 / 物体粒子 / 抽象 / エッジケース) 3. highlights/ の厳選 20 動画で 各モデルが得意とするケースを確認 4. video_metrics.csv で aesthetic / temporal / motion の 3 軸スコアを並べて比較 5. metadata.csv で 再現用パラメータ(steps / cfg / negative / dreamshaper_8 base 等)を参照 6. reproduce.md の手順で自分でも回せます(MetAIra スクリプト群を使う場合) ## 使用モデルとライセンス | モデル | 配布元 | 出力物の権利 | |---|---|---| | Wan2.1 1.3B | https://huggingface.co/Wan-AI/Wan2.1-T2V-1.3B-Diffusers | Apache-2.0 系 | | LTX-Video 0.9 | https://huggingface.co/Lightricks/LTX-Video | OpenRAIL-M | | AnimateDiff (Motion Adapter) | https://huggingface.co/guoyww/animatediff-motion-adapter-v1-5-3 | CreativeML OpenRAIL-M | | dreamshaper_8 (AnimateDiff ベース) | https://civitai.com/models/4384 (Lykon) | 商用 OK、明示禁止条項なし | | SD1.5 (AnimateDiff の素ベース、未使用) | https://huggingface.co/stable-diffusion-v1-5/stable-diffusion-v1-5 | CreativeML OpenRAIL-M | 本商品にはモデル本体(.safetensors)は同棱していません。**生成動画 + 評価 CSV のみの提供**です。 ## スコープと注意事項 - 検証環境: RTX 5060(8GB VRAM)。1 動画あたり Wan2.1 ~14分、LTX ~2.3分、AnimateDiff ~58分(50 steps × 512×768 + FreeNoise) - CogVideoX-2B / SVD-XT は対象外: 前者は CPU offload で 30分超え、後者は i2v 専用のため別商品(V3)で扱う予定 - aesthetic 評価は LAION の自動予測値で、人の好みと完全一致しません - AnimateDiff の素 SD1.5 ベースは顔・手の崩壊が酷かったため、**dreamshaper_8 ベース**に切り替えて再生成しました(metadata.csv の animatediff_base 列参照) ## 関連商品 - 画像系: realcartoon3d_v18 単独 「Sampler×CFG 55 通り検証」 → P2: https://metaira.booth.pm/items/8354494 - 画像系: realcartoon3d_v18 単独 「Negative Prompt 30 種 ON/OFF 検証」 → P5: https://metaira.booth.pm/items/8354537 - 画像系: 「SD1.5 2 モデル比較(dreamshaper × realcartoon3d)」 → P1: https://metaira.booth.pm/items/8354430 V1 + P1/P2/P5 で「Sampler / CFG / Negative / SD1.5 Model / 動画モデル」の 5 軸の検証データが揃います。






