Whisper文字起こしGUI
- WindowsDigital500 JPY
- macOSDigital500 JPY
- LinuxDigital500 JPY

OpenAI Whisper をローカルで実行するデスクトップアプリ。音声・動画ファイルをドラッグ&ドロップするだけで、高精度な文字起こしができます。 API キー不要・完全オフライン動作(初回のみモデルダウンロードが必要)。
特徴
- **完全ローカル処理** — 音声データがインターネットに送信されることはありません - **かんたん操作** — ファイルを選んでボタンを押すだけ - **5段階のモデル選択** — 速度重視の Tiny から最高精度の Large まで用途に合わせて選択 - **多言語対応** — 日本語・英語・中国語・韓国語など 10 言語に対応 - **英語翻訳機能** — 外国語の音声を英語に翻訳して文字起こし - **複数の出力形式** — TXT / SRT / VTT / TSV / JSON - **タイムスタンプ付き出力** — 字幕制作や議事録作成に便利 - **ダーク/ライトモード** — お好みのテーマで作業 - **設定の自動保存** — モデル・言語・出力形式などの設定はアプリを閉じても保持
対応ファイル形式
MP3, WAV, M4A, MP4, MKV, WebM, FLAC, OGG, MOV, AAC, WMA, Opus
動作環境
【Windows】 - Windows 10 (21H2 以降) / Windows 11 【macOS】 - macOS 11 (Big Sur) 以降 - Apple Silicon (M1/M2/M3/M4) または Intel Mac 【Linux】 - Ubuntu 22.04 以降 / Debian 12 以降(または同等のディストリビューション) - WebKitGTK 4.1 が必要(Ubuntu/Debian: `libwebkit2gtk-4.1-0`) - x86_64 (amd64) アーキテクチャ 【共通】 - メモリ: 4GB 以上(Large モデル使用時は 8GB 以上推奨) - ストレージ: モデルサイズ分の空き容量が必要(下記参照) - インターネット接続: 初回のモデルダウンロード時のみ必要
モデル一覧
| モデル | パラメータ数 | ダウンロードサイズ | 特徴 | |--------|-------------|-------------------|------| | Tiny | 39M | 75 MB | 最速・低精度 | | Base | 74M | 142 MB | バランス型 | | Small | 244M | 466 MB | 高精度 | | Medium | 769M | 1.5 GB | 高精度・日本語向き | | Large | 1.5B | 2.9 GB | 最高精度 | 日本語の文字起こしには **Medium** 以上を推奨します。
インストール
1. `Whisper文字起こし_1.0.0_x64-setup.exe` を実行 2. 画面の指示に従ってインストール 3. デスクトップまたはスタートメニューからアプリを起動
使い方
1. アプリを起動 2. 音声・動画ファイルをウィンドウにドラッグ&ドロップ、または「ファイルを選択」ボタンをクリック 3. 必要に応じてモデル・言語・出力形式を設定 4. 「文字起こし開始」をクリック 5. 初回はモデルの自動ダウンロードが行われます(次回以降は不要) 6. 完了後、結果をコピーまたはファイルに保存
ライセンス
MIT License 本ソフトウェアは以下のオープンソースプロジェクトを利用しています: - [OpenAI Whisper](https://github.com/openai/whisper) (MIT License) - [whisper.cpp](https://github.com/ggerganov/whisper.cpp) (MIT License) - [whisper-rs](https://github.com/tazz4843/whisper-rs) (MIT / Apache 2.0) - [Tauri](https://tauri.app/) (MIT / Apache 2.0)
