SRT形式対応 文字起こしツール
- Digital0 JPY

※python 環境が必要ですが、ローカルに Whisper を落とす事で、Open AI の API Key 無しで完全無料で使用できるらしいです。SRT 対応の方の html ファイルを Whisper をローカルに落として動作できるよう修正する作業を ChatGPT に依頼する方法も良いかもしれません。 ⚠️ Whisper をローカルに落とさない限り OpenAI API Key が必要です ローカルで動作させない場合、このツールを使用するには OpenAI の API Key が必要です。 まだお持ちでない方は、OpenAI に課金して API Key を取得してください。 ⚠ OpenAI APIは従量課金制で、チャージ残高の有効期限は1年です。 使いすぎに注意し、まずは最低チャージ額の5ドルで試すことをおすすめします。デビットカードでのチャージなら比較的安心です。 ⚠ 残高が不足した場合に自動でチャージする設定は推奨しません。API Key が流出した際に膨大に請求される恐れがあるからです。 💰 利用料金の目安 ・ver1.0.0 / ver2.0.0:2時間の文字起こしで約 100円 ・ver3.0.0(安価版):同じ作業で約 50円 ver2.0.0 は高性能ですが、開発者の体感では ver1.0.0 の方が誤りが少ない印象です。 ver3.0.0 は他の半額で利用でき、精度は若干劣りますが十分実用的です。 🔑 API Key の入力について ツール起動時に API Key の入力を求められます。 毎回入力するのが面倒な場合は、以下のQiita記事の手順に従い API Key をHTMLに埋め込んでください。 https://qiita.com/uni928/items/01b8c2e21c5f8e00d0cd 📝 ツールの概要 このツールは以下の2ステップで動作します。 1. 動画を mp3 に変換(exeファイルで実行) ・動画を音声データ(mp3)に変換し、15MBごとに分割して出力します。 2. mp3を文字起こし(HTMLファイルで実行) ・文字起こしは 25MB 以下 の音声ファイルに対応。 🚀 使用手順 1. MovieToText.exe を開く 2. 動画ファイルを「ここに文字起こしする動画ファイルをドラッグ&ドロップして下さい」にドラッグ&ドロップ 3. 処理中はPCが一時的に重くなる場合があります。作業完了まで待機 4. MovieToText.exe と同じフォルダに Created.mp3 が生成されます 5. 文字起こし(音声データのみ).html を開く 6. mp3ファイルを指定し「文字起こし開始」ボタンをクリック 7. 作業完了まで待機 8. 文字起こし結果が表示されます 9. 必要に応じて字幕内容を手動修正してください 📌 注意事項 ・モデルの違い ・ver1.0.0 / ver2.0.0 / ver3.0.0 は使用するモデルが異なります。 ・ver2.0.0 の方が高性能とされていますが、個人的には ver1.0.0 の方が誤りが少ない印象です。 ・ver3.0.0(安価版)は精度がやや低いですが、コスト半分で十分実用可能。 ・推奨 ・精度重視の場合 → ver1.0.0 ・コスト重視の場合 → ver3.0.0 📣 まとめ 基本的には ver1.0.0(SRT形式対応) を使えば 字幕付けの作業をかなり効率化できます。 コストを抑えたい場合は ver3.0.0 がおすすめです。