【TTS】現実の女子大生4人音声モデル【STYLE-BERT-VITS2】LINE通話で雑談する女子大生のような音声合成!Style-Bert-VITS2-JPextra 5話者26感情モデル ライセンスフリー AivisSpeech対応予定 生成AI (例えるなら、音質が超向上した人間voiceroid!)
- ダウンロード商品¥ 0

1 | 実際に生成した視聴用音声 |
初音ミクなどに代表される「音声合成」.. PCを使って、入力した文をなんでも喋らせる事ができる.. しかし...機械アニメ系の声や、聞いたら自動音声だとわかるような声ばかりで、実際に駅前のマックで雑談をしている女子大生の様な "リアル"な一般女子の喋り方の音声合成はいままでになかった... しかし!!今ここに!最新技術により登場しました! 「LINEで雑談する素人女子大生のような音声合成!Style-Bert-VITS2-JPextra 5話者26感情モデル ライセンスフリー」 (おまけでイケボ男子1人付き) 更新履歴 ・2024年3月16日 旧商品画像が荒かったので、新しいポップな商品画像を追加しました、更新に伴ってなにか戸惑らせてしまったらすみません、仕事の休憩時間にオープンソース精神で作っております('ω')ノ(Licence MIT) サンプル音声はこのページの商品画像の下の再生ボタン▶を押してください または以下のリンクから聞く https://s2.booth.pm/36a20e54-274e-4dab-9203-29301ed59261/s/5566669/full/dbd8ff8c-2fa9-41b9-9c4b-c958e3ad8355.mp3 外部のおすすめの使い方解説動画 Style-Bert-VITS2が実用レベルのTTSに!日本語特化版アップデート https://www.youtube.com/watch?v=uY2VKryqd4I 外部のおすすめの使い方解説ドキュメント https://github.com/litagin02/Style-Bert-VITS2?tab=readme-ov-file#%E4%BD%BF%E3%81%84%E6%96%B9 単一のモデルに5話者 26感情スタイルが詰め込まれています 各種音声合成ソフトの話者選択機能タブで切り替えできます この説明書などが入ってるフォルダー(NotAnimeJPManySpeaker)を C:\Users\YOUR USERNAME\....\Style-Bert-VITS2\model_assets\ に入れてください、入れると C:\Users\YOUR USERNAME\....\Style-Bert-VITS2\model_assets\NotAnimeJPManySpeaker\ というディレクトリパスになります ・店舗での呼び込み音声、個人的な目覚まし音声などの鑑賞用、会話AIの声に適用する、ゆかりねっとなどで自分の出すネット通話声として使う、動画制作に使うなど、使い方は自由自在です ・お客様の中にはそのような方はいないとは思われますが、他人を中傷したり損害を与える目的の悪質な音声を生成して外部に発信しないでください ・顔写真はAIによる無関係のイメージ画像です ・安心設計 現行法においてAIモデル等(情報解析)は著作権法の例外規定となっておりますので、万が一何かが起きても安心してお使いいただけます。本商品に登場するすべての女性は20歳を超えております ・Licence MIT (制限なしで自由にお使いいただけます) ・タグ TTS 音声作品 音声 AI TTS VRChat ボイスチェンジャー ゆかりねっと AI 素人 話者と話者番号のリスト speaker_name(話者名)と: speaker_id(話者番号) -- "NotAnime-JP-age20female-amazinGood": 0, "NotAnime-JP-age20female-calmCloud": 1, "NotAnime-JP-age20female-coolcute": 2, "NotAnime-JP-age20female-fineCrystal": 3, "NotAnime-JP-age20male-lightFire": 4 -- 話者及び感情スタイルの名前リスト (lolは大笑い、downは落ち込みという意味になります) 例:下の表の「"amazinGood(lol)": 2,」の場合は スタイル名はamazinGood(lol)で スタイル番号は2になります 話者番号は0です *以下は開発者さん向けメモになります* https://github.com/litagin02/Style-Bert-VITS2のserver_fastapi.pyを使ってブラウザURLリクエスト経由で音声の生成リクエストを送る場合は、URLにどのような感じに音声を生成するかを記入します、URLのサンプルは以下です http://127.0.0.1:5000/voice?text=ここに読み上げ文章を入力&model_id=0&speaker_id=2&style=coolcute(sad)&style_weight=1.8 備考 (話者番号はspeaker_id=0に入り、スタイル名は style=パラメータに文字列で入り、スタイル感情をどれだけ強く設定するかはstyle_weight=パラメータに入ります (0.1から3ぐらいの間で、2.0がたいていの場合ちょうどいいです)) 全く同じURL内容でリクエストを複数回送ると、音声が返ってこない場合があるので、URLの末尾に&randomnum=8757(毎回違う番号)などを入れるとよいです -- "Neutral": 0, "amazinGood(down)": 1, "amazinGood(lol)": 2, "amazinGood(onmygod)": 3, "amazinGood(normal)": 4, "calmCloud(lol)": 5, "calmCloud(question)": 6, "calmCloud(down)": 7, "calmCloud(hate)": 8, "calmCloud(ohmygod)": 9, "calmCloud(normal)": 10, "coolcute(onmygod)": 11, "coolcute(normal)": 12, "coolcute(fine)": 13, "coolcute(sad)": 14, "fineCrystal(fine)": 15, "fineCrystal(ohmygod)": 16, "fineCrystal(veryfine)": 17, "fineCrystal(normal)": 18, "fineCrystal(sad)": 19, "lightFire(question)": 20, "lightFire(hello)": 21, "lightFire(normal)": 22, "lightFire(strong)": 23, "lightFire(lol)": 24 --