
TALQu 深層学習系読み上げソフト フリー/ドネーションウェア
- フリーダウンロード_CPU版ダウンロード商品¥ 0
- ブースト用(ファイルはフリーダウンロード_CPU版と同一です)ダウンロード商品¥ 100
- フリーダウンロード_GPU版(CUDA10.2)ダウンロード商品¥ 0
- フリーダウンロード_GPU版(CUDA11.0)_分割圧縮しているのでまとめて解凍してくださいダウンロード商品¥ 0
- セットアップ済みCPU版2.5.0.1_マネージャーからセットアップができないときはこちらをご利用くださいダウンロード商品¥ 0

深層学習系読み上げソフトです いわゆるAI系TTSというものです Q. 野良ボイスロイド? A. 読み上げソフトであるかという意味であればそうですね Q. 声は増えるの? A. 中の人志望の有志の方が現れて、参戦してもらえたら嬉しいですね Q. 声のバリエーション一覧はある? A. 公式にモデル生成を支援させていただいたモデル一覧はこちらです。 https://haruqa.github.io/TALQu/Model-List.html Q. 中の人やりたい! A. 開発者がセットアップをお手伝いする、「TALQu参戦チケット」の入手方法はHaruqaポイント取引を用意しています https://docs.google.com/spreadsheets/d/12bNyV3DBfgwP6qSopWHrduxU2KFnX7LDvI91MHP7mzE/edit?usp=sharing Q. 自力で作成したい場合は? A1. ベリーイージーな方法 >>お勧め<< モデルを作成するための専用収録セットと公式ドキュメント兼モデル生成のためのツール(Google Colab ノート)を公開しました。 疑問符、感嘆符、3つの表情拡張表現に対応しています。 https://colab.research.google.com/drive/1gZe8-ls6ouV9aMwdFxh0DufsJon6iWNH A2. ITAコーパスを使用する方法 入力したテキストに対応する声が出るなあ程度のものが作成できる方法を一般に公開しています https://youtu.be/x8GvJqxDZAA [PR] ここからダウンロードできる通常TALQuの上位版、「TALQuPRO」をFANBOXの支援者限定で配布しています。ひと月定額のサブスク方式 https://haruqa.fanbox.cc/ 限定機能としては ・導入したTALQuモデルすべてに、汎用ボコーダーモデルや、48kHz対応汎用ボコーダーモデルに強制切り替えをすることが可能で、高品質化や声色のニュアンスの変化が期待できます ・「発音アルファベット」の直接入力が可能で、無声化などの発音の微調整ができます ・実行環境のリソースに依存しますが、一つの場所にインストールしたTALQuPROを同時に複数起動、並行して合成を実行できます ・「調声」ウィンドウに音素位置表示機能(調整中…)があり、調声する際の目安とすることができます ・他、限定機能が追加されたり、先行機能が使えたり、実験中の機能に触れたりするかも… という感じです。よろしければ~ [PR2] TALQuの公式(?)Discordサーバーを公開してます。 現状の様子は ・ネタが無いという声にお応えする動画素材共有 ・作品作ったから見てーという共有の場 という感じです。よろしければ~ https://discord.gg/EKANVTPG83
■はじめに
深層学習系読み上げソフト(TTS:テキストトゥースピーチ)です。 TALQu→とーく と読みます。 ほか、オープンソースを使用しています。 詳しくはそれぞれのライセンスファイル、コピーライトファイル等をご確認ください。
■利用規約
◇禁止事項 ・犯罪への使用、いたずら、悪意ある使用 ・再配布 ・逆コンパイル、リバースエンジニアリング、解析 ・故意に内部ロジック、仕様、設計の抜き出し、再度ソフトウェア化するなどの再利用 ・意図せず得られた仕様などの情報の公開 ・作者が許可する部分の書き換え、差し替え、追加などの変更を除き 作者の事前の許可なしに内部のコードを書き換えることによる改造、改造結果の公開、改造方法の公開、 外部からの自動操作ツールの公開、配布 ◇変更許可行為 ・Modelsフォルダ以下へモデルの追加 ◇免責事項 ・本ソフトウェア、プラグインを使用したことで被ったいかなる損害も作者は一切責任を負いません ・自己責任で使用をお願いいたします ◇ほか注意点 ・使用するモデルやキャラなどの利用規約を遵守してください ・このソフト向けのモデルを作成、配布、販売等自由ですが、予告なく仕様が変更されることをご了承ください ・デフォルトモデルHaruqaの利用規約は下記をご確認ください https://haruqa.github.io/
■Terms Of Use(Automatic translation, Japanese is official)
◇Prohibited acts ・Use for crime, mischief, or malicious use ・Redistribution ・Decompiling, reverse engineering, or analysis ・Intentionally extracting internal logic, specifications, or designs, and reusing them for develop software ・Unintentional disclosure of specifications or other information obtained by the user ・Except for changes such as rewriting, replacement, or addition of parts permitted by the author The prior permission of the author, disclosure of modification results, disclosure of modification methods. Release and distribution of automatic operation tools from the outside. ◇Permitted modify actions ・Adding models to the Models folder ◇Disclaimer ・The author assumes no responsibility whatsoever for any damages incurred by using this software or plug-in. ・Please use at your own risk. ◇Other points to note ・Please comply with the terms of use for the models and characters you use. ・You are free to create, distribute, and sell models for this software, but please note that specifications are subject to change without notice. ・Please see below for the terms of use of the default model Haruqa. https://haruqa.github.io/
■動作環境
以下の環境で動作を確認しました OS Windows10 Pro 64bit 21H2 CPU Intel(R) Core(TM) i7-4770K CPU @ 3.50GHz メモリ 16.0 GB .NET Framework 4.8がインストールされている環境ならGUIは動作するかと思います。 またさらに、pytorchの実行のためにMicrosoft Visual C++ 再頒布可能パッケージが必要とのこと。 https://support.microsoft.com/ja-jp/topic/%E6%9C%80%E6%96%B0%E3%81%AE%E3%82%B5%E3%83%9D%E3%83%BC%E3%83%88%E3%81%95%E3%82%8C%E3%82%8B-visual-c-%E3%81%AE%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89-2647da03-1eea-4433-9aff-95f26a218cc0 の x64: vc_redist.x64.exe を導入するとおそらく大丈夫なはず…。 【開発環境のMicrosoft Visual C++インストール状況】 (とりあえずどれが必要なのかわかってないので一通り記しますね…) Microsoft Visual C++ 2005 Redistributable 8.0.61001 Microsoft Visual C++ 2005 Redistributable 8.0.56336 Microsoft Visual C++ 2005 Redistributable (x64) 8.0.50727.42 Microsoft Visual C++ 2008 Redistributable - x64 9.0.21022 Microsoft Visual C++ 2008 Redistributable - x64 9.0.30729.17 Microsoft Visual C++ 2008 Redistributable - x86 9.0.30729.17 Microsoft Visual C++ 2008 Redistributable - x86 9.0.30729.6161 Microsoft Visual C++ 2010 x64 Redistributable - 10.0.40219 Microsoft Visual C++ 2010 x86 Redistributable - 10.0.40219 Microsoft Visual C++ 2012 Redistributable (x64) - 11.0.61030 Microsoft Visual C++ 2012 Redistributable (x86) - 11.0.61030 Microsoft Visual C++ 2013 Redistributable (x64) - 12.0.30501 Microsoft Visual C++ 2013 Redistributable (x86) - 12.0.30501 Microsoft Visual C++ 2015-2019 Redistributable (x64) - 14.24.28127 Microsoft Visual C++ 2015-2019 Redistributable (x86) - 14.24.28127 【GPU版の動作環境】 GTX1070ti 8GB CUDA10.2 cuDNN8.0.2 ※注意 TALQuを置くフォルダまでのパスに半角スペースなど コマンドプロンプトで不都合な文字が含まれると 正常に動作ない可能性があります
■使い方(TALQuManager)
1. 起動 zipを解凍し、TALQuフォルダーの中のTALQuManagerフォルダーの中の「TALQuManager.exe」を起動してください。 TALQuManagerフォルダーの一つ上のフォルダーへファイルを展開するため、フォルダー構造を変更しないでください。 2. ダウンロードとセットアップ 黒い画面がいくつか現れ、数分から数十分待つと、完了のダイアログが表示されます。 ※エラー終了時は時間を空けて再試行するか、セットアップ済みのものをご利用ください 3. TALQuの起動 一つ上のフォルダーへ戻って「ReadMe.txt」を確認してください。
■使い方(TALQu)
1. 起動 「TALQu.exe」を起動してください。 2. 再生 「読み上げる文」に読み上げさせたい文を入力し 「再生」ボタンをクリックすると、再生されます。 ※長文をまとめて合成し再生するのは時間がかかります。 長文は「wav保存」で合成をかけてwavを保存してから 外部プレイヤーで再生することをお勧めします。 3. 停止 再生を途中で停止させたい場合は 「停止」ボタンをクリックすることで停止できます。 4. wav保存 「wav保存」から合成結果をwavに保存することができます。 ※合成毎に出力される音声は異なるため、ご注意ください。 「再生」で確認したファイルをそのまま保存したい場合は、「今聞いたのを保存」ボタンをご活用ください。 「テキストファイルを出力する」にチェックが入っていると、 保存したwavと同じ場所に名前のテキストファイルが出力されます。
■使い方Tips
〇読み仮名の修正 一度「再生」もしくは「wav保存」、それか「発音を展開」を行うと「読み上げる文」から推測された「発音ひらがな」「発音アルファベット」(TALQuPRO版のみ)が出力されます 「発音ひらがな」は任意に変更できます。 助詞の「は」は「わ」、「へ」は「え」と発音通りに入力してください。 長音「-」は使用できません。対応する母音を入力してください。 〇ショートカットキー Ctrl+E:再生 Ctrl+R:もう一度再生 Ctrl+S:今聞いたのを保存 Ctrl+W:wav保存 に対応します。 〇設定項目をデフォルト値にする 話速、シグマ、デノイザー強度、小ポーズの長さ、大ポーズの長さ、声の高さ、声色の高さ の数値部分をダブルクリックするとデフォルト値に戻すことができます。 〇特殊符号 【全モデル対応】 句読点「、」「。」:「、」が小ポーズ、「。」が大ポーズ 【モデルによっては非対応】デフォルトモデルは現在疑問符のみ対応 疑問符「?」:疑問文、語尾上がり想定です。ポーズ長は大ポーズ。※発音アルファベットの場合は半角表記「?」 感嘆符「!」:感嘆、元気(?)、勢いがいい(?)想定です。出力感はモデルで異なると思われます。ポーズ長は大ポーズ。※発音アルファベットの場合は半角表記「!」 句頭表現スイッチフラグ「X」「Y」「Z」:句頭に半角アルファベットで「X」「Y」「Z」を入力すると、表現を切り替えます。対応する表現はそれぞれのモデルの説明をご確認ください 〇合成結果を調声する 「再生」を行った後 「調声する」ボタンをクリックすると、調声を行えるウィンドウが表示されます 元々のピッチが緑で表示され、その上からマウス左クリックドラッグで新しいピッチを赤線を引くことができます。 上の灰色の領域をクリックすると、再生開始位置を設定できます。再生開始位置は青い縦の線であらわされています。 「Play」ボタンでピッチを変更したwavを再生、「Reset」ボタンで赤線を削除、 「Save」でピッチを変更したwavを保存することができます。
■設定項目
話速:100がデフォルト、50で1/2倍速、200で2倍速 シグマ:使用しません デノイザー:使用しません 大ポーズの長さ:「。」「?」「!」の長さに対応 声の高さ:1がデフォルト、0.5で1オクターブ下、2で1オクターブ上、変更すると音質が下がります 声色の高さ:1がデフォルト、下げると男声的(年齢が上がる)、上げると女声的(年齢が下がる)に変化するイメージ、変更すると音質が下がります
■モデルの追加の仕方
TALQuフォルダ内のModelsフォルダ中にモデルをフォルダごと追加することで追加可能です。 TALQuを再起動すると、モデル名から選択できます。 一覧に表示されない場合は、モデルフォルダの配置が正しいか、モデルフォルダ内のConfig.csvなどを確認してください
■ヘルプ
【使用に関してヘルプが必要な場合】 YouTubeの正式リリース動画 https://youtu.be/KK4vdyx7e0k のコメント欄をご確認ください。 コメント欄に同様の質問が無かった場合、新たにコメントを記入して質問をしてください。 ここを基本的な窓口と設定したいと思っていますが、 作者Twitterへリプライ、DMでも問題ありません。
■アンインストール方法
レジストリ操作などはしていません。 配備したファイルをそれぞれ削除してください。
■謝辞
動作確認・追加機能提案など協力: CrazYさま(Twitter: https://twitter.com/crazy_toho) なっちゃそさま(Twitter: https://twitter.com/naTeaso) おふとんPさま(Twitter: https://twitter.com/joumonsugi) 動作確認協力: MIZKIさま(Twitter: https://twitter.com/MIZKI_AtR) GPU CUDA11系動作確認協力: CUDA11.6 草薙快速雷虎さま(Twitter: https://twitter.com/stcr_5001f) CUDA11.1 六銃士さま(Twitter: https://twitter.com/roku10shi) CUDA11.0 なっちゃそさま(Twitter: https://twitter.com/naTeaso) ご協力ありがとうございました
■更新履歴
2023/02/23 2.11.0.0 デフォルトモデル、プラグインGetYomiFromMeCabを更新 2022/12/01 2.10.0.0(PRO版のみ) CPU版UNIVERSAL48kHzボコーダー合成高速化 2022/11/01 2.9.0.0(PRO版のみ) コマンドライン実行のクライアント(TALQuPRO_CMDClient.exe)を追加対応 2022/10/01 2.8.3.0 テキストファイルの出力パスが場合によりズレる問題を修正 フォームが画面外の場合画面内に戻すよう修正 辞書更新 2022/09/05 2.8.2.1 2.8.2.0の修正で配置先のフルパスにスペースが入っていると不具合が発生していた件について修正 2022/09/04 2.8.2.0 MeCabがインストールされた環境で不具合が発生していた件について修正 辞書更新 2022/08/01 2.8.1.1 モデルファイルの容量軽減機能を追加 2022/06/01 2.7.0.0 音質Refine機能を追加(PRO版のみ) 声色の高さの数値を10倍細かく変更 2022/03/05 2.6.0.0 PRO版のみ 調声をする画面に音素ラベル描画機能を追加 2022/02/13 2.5.0.0 専用ボコーダーモデルをもたないモデルが使用するボコーダーモデルを 「HaruqaOnly_軽量汎用_TALQu_HiFiGANModel.pt」へ変更 モデルを切り替える時のロードを短縮 wavファイルのデフォルト名を「年月日時分秒_SpkName_漢字かな文(50文字上限).wav」へ変更 2022/01/09 2.4.0.0 まとめて合成機能を簡易的に実装 「SpkName,漢字かな文,(オプション)発音ひらがな」UTF8のファイルをD&Dで、そのファイルが存在するフォルダにwavを出力します 2021/12/25 2.3.0.0 感嘆符「!」に対応(デフォルトモデルはこの時点で出力未対応です…) 表現スイッチフラグ「XYZ」を発音ひらがなに書くと、裏の発音アルファベットに貫通するように変更 2021/11/01 2.2.0.0 PRO版のみ 「TALQuPROをもう一つ起動」ボタンを追加 2021/10/22 2.1.0.0 同梱読み取得プラグイン更新、笑い音素「W」を「発音ひらがな」で入力対応 2021/08/15 2.0.3.0 発音アルファベットの表示をPRO版のみに限定 2021/08/03 2.0.2.0 調声フォームで再生開始位置の変更が出来なくなっていたのを修正 2021/08/02 2.0.1.0 調声フォームで最後まで再生できていなかったのを修正 読み込めないモデルを踏むとモデルロードが終了できなくなるため、初期ロードをHaruqaに固定 新規ボコーダー対応モデルは新規ボコーダーを優先選択するよう変更 モデルロード待ちが長いよの警告が出るのを60秒後に変更 2021/08/02 2.0.0.0 wavファイルの接続時プチノイズが発生することがあるため頭10msをフェードイン、 最後に一律大ポーズを付加していたところを100ms付加へ変更 小ポーズと大ポーズの下限を拡張、小ポーズ:10ms、大ポーズ:100ms 動作しない場合のエラーメッセージ表示機能を追加 調声フォームでの再生に無駄な処理を削減、合成速度向上 ピッチフォルマント変更について調声フォームと同じdllを使用し高速化、同梱プラグイン方式を廃止 本体利用規約の表現変更 2021/06/21 1.9.1.0 クローズド配布 ピッチ手書きできるだけの奴を追加、新しいボコーダーをHaruqa以外の対応モデルへ開放 2021/05/29 1.9.0.0 クローズド配布 合成高速化、新しいボコーダーを導入(Haruqaのみ使用可能) 2021/05/26 1.3.0.0 利用規約更新、自動翻訳英文追加、利用規約表示機能追加 2021/05/06 1.2.1.0 声の高さと声色の高さ変更機能調整、発音展開調整 2021/05/02 1.2.0.0 GUI項目追加(声の高さ、声色の高さ)、ショートカットキーをテキストボックス以外にフォーカスがあっても使用可能に変更、声の高さと声色の高さのみ変更可能ボタン「再生したものに←を再適用して再生」を追加、停止ボタンが動作しなかったのを修正、TALQuを再び起動したとき使用モデルを復帰するように修正 2021/04/04 1.1.0.0 GUI項目追加(シグマ、デノイザー強度)、合成プログレスバー追加、ショートカットキー追加、再生対象が10句以上の場合確認ダイアログ出力 2021/03/07 1.0.0.1 メンテナンスアップデート、ReadMeの更新と実行メッセージ取得batの追加 2021/02/23 1.0.0 正式リリース、モデル切り替え時にURLを開くボタンのテキストが更新されない不具合を修正、URLを開くボタンの幅変更がうまく行えていなかった不具合を修正 2021/02/07 0.5.0 話速実装、もう一度再生ボタン追加文末「す」の無声化調整、同じ言葉を繰り返す時のバグ修正 2021/01/23 0.4.0 モデルの仕様変更、アップデートチェック機能追加 2021/01/02 0.3.0 小ポーズ、大ポーズ対応、発音展開ボタンを追加 2020/12/23 0.2.0 モデル選択対応、設定項目保存対応、付属モデルの更新(学習データセット追加、疑問文対応) 2020/12/13 0.1.1 スペルミス修正 GPU対応版 2020/12/07 0.1.0 ほとんどのコードをSSYQuからコピー、初期クローズドベータリリース