YoutubeMCP、Claude任せで全自動動画編集
- Digital20,000 JPY

**参考動画のURLを入力するだけで、YouTube動画制作が完全自動化** このツールは、参考にしたいYouTube動画のURLを入力するだけで、以下のすべてを自動実行します: ### 🎬 コア機能 1. **YouTube字幕取得** → 既存動画の字幕を自動取得 2. **Whisper音声文字起こし** → 動画・音声ファイルを高精度でテキスト化 3. **AI自動シナリオ生成** → 取得した内容を分析して台本を自動作成 4. **多様な音声合成** → VOICEVOX、VOICEPEAK、Style-Bert-VITS2に対応 5. **YMM4プロジェクト自動生成** → ゆっくりムービーメーカー4で即編集可能 6. **字幕ファイル出力** → SRT形式でそのまま使える ### ⚡ 注目機能:Whisper自動カット **「無音部分を手作業でカット」は過去のもの** Whisper機能を使った自動カット機能で、動画を発話単位で完全自動分割。 - 動画から音声を抽出 - Whisperで発話区間を検出 - 発話ごとに動画ファイルを自動分割 - 各セグメントに字幕テキストを自動付与 編集の8割を占める「無音カット作業」が完全自動化されます。 --- ## 機能詳細解説 ### 1. YouTube字幕取得機能 - YouTube APIを使用せず、直接字幕を取得 - 自動生成字幕、手動字幕の両方に対応 - 複数言語の字幕を取得可能 ### 2. Whisper音声文字起こし **対応入力** - 動画ファイル(MP4、AVI、MOV等) - 音声ファイル(MP3、WAV、M4A等) - YouTube動画(URLから直接処理) **出力形式** - テキスト全文 - タイムスタンプ付きセグメント - JSON形式でエクスポート ### 3. Whisper自動カット機能 **ワークフロー** ``` 動画ファイル入力 ↓ 音声抽出(ffmpeg) ↓ Whisper書き起こし(発話区間検出) ↓ 発話ごとに動画を自動分割 ↓ 各セグメントに字幕テキスト付与 ``` **従来の編集作業** 1. 動画を再生しながら無音部分を探す 2. 手動でカット位置をマーク 3. 一つずつカットを実行 4. 字幕を手動で入力 **このツールの場合** 1. 動画ファイルを指定 2. ワンクリック実行 3. 完了(発話区間で分割済み・字幕付き) ### 4. 音声合成エンジン対応 **VOICEVOX** - 50種類以上のキャラクターボイス - 感情表現、スタイル変更が可能 - ローカルAPI経由で高速生成 **VOICEPEAK** - 高品質な商用音声合成 - 小春立花、ずんだもん等に対応 - 感情パラメータ詳細調整可能 **Style-Bert-VITS2** - 最新の音声合成技術 - カスタムボイスモデル対応 - リアルタイム生成 ### 5. YMM4プロジェクト自動生成 **自動構築される要素** - タイムライン配置 - 音声ファイルの自動配置 - 字幕レイヤーの自動生成 - キャラクター立ち絵の配置 - 画像素材の自動挿入(開発中) **出力ファイル** - `.ymmp` プロジェクトファイル - 音声WAVファイル一式 - 字幕SRTファイル - 素材ファイル一式 ### 6. 辞書登録機能 - 固有名詞の読み方を事前登録 - プロジェクト全体で統一された発音 - CSV形式でインポート・エクスポート可能 ### 7. 字幕ファイル生成 - SRT形式(標準字幕フォーマット) - タイムスタンプ自動計算 - YMM4、Premiere Pro、DaVinci Resolveで使用可能 --- ## 技術仕様 ### システム構成 - **MCPサーバー** (Model Context Protocol) - **Python 3.8+** - **FastMCP フレームワーク** ### 必要な外部ツール - **ffmpeg** - 動画・音声処理 - **OpenAI Whisper** - 音声認識 - **VOICEVOX** / **VOICEPEAK** / **Style-Bert-VITS2** - 音声合成 ### 出力ディレクトリ構造 ``` configs/ # 設定ファイル transcripts/ # 字幕テキスト whisper_transcripts/ # Whisper書き起こし結果 ymmp_projects/ # YMM4プロジェクト voice_files/ # 生成音声ファイル audio_segments/ # 音声セグメント video_segments/ # 動画セグメント(自動カット結果) reference_images/ # 参考画像 ``` --- ## 利用シーン ### ケース1:解説動画制作 1. 参考動画のURLを入力 2. 字幕を自動取得 3. AIが台本を再構成 4. 音声合成で解説ナレーション生成 5. YMM4で編集→完成 ### ケース2:講座動画のリメイク 1. 既存の講座動画を入力 2. Whisperで完全文字起こし 3. 発話単位で動画を自動分割 4. 不要なセグメントを削除 5. 音声を差し替えて新バージョン完成 ### ケース3:ポッドキャストの動画化 1. 音声ファイルをWhisperで文字起こし 2. テキストをAIが整形・台本化 3. キャラクターボイスで再生成 4. 字幕付き動画として出力 --- ## Whisper自動カット:具体例 **入力動画** - 10分間の講義動画 - 間に無音部分が多数存在 **従来の作業時間** - 無音検出+カット:1~2時間 - 字幕入力:1~2時間 - **合計:2~4時間** **このツールの作業時間** - 実行コマンド:1回 - 処理時間:5~10分 - **合計:10分** **出力結果** - 発話セグメント50個に自動分割 - 各セグメントに字幕テキスト付与 - JSONファイルで結果をエクスポート - 必要なセグメントだけ選んで編集可能 --- ## 導入メリット ### 時間削減 - 字幕入力作業:90%削減 - 無音カット作業:95%削減 - 音声収録作業:100%削減(合成音声使用時) ### 品質向上 - 誤字脱字の大幅削減 - 発話タイミングの自動最適化 - 複数言語への展開が容易 ### コスト削減 - 声優・ナレーター費用:不要 - 編集時間の大幅短縮 - 反復作業の完全自動化 --- ## 動作環境 - Windows 10/11(推奨) - Python 3.8以上 - ffmpeg(動画処理) - CUDA対応GPU(Whisper高速化に推奨) - 8GB RAM以上(16GB推奨) --- ## まとめ このツールは、YouTube動画制作における**最も時間のかかる3つの作業**を完全自動化します: 1. **字幕起こし** → Whisperで自動 2. **無音カット** → 発話区間検出で自動 3. **音声収録** → 音声合成で自動 参考動画を入力するだけで、編集可能なYMM4プロジェクトが完成。 動画制作の**80%を自動化**し、クリエイターは企画とブラッシュアップに集中できます。
