[RVC] KLM 4.2 Pretrained Model (Test Version) [RMVPE / FP32]
- ダウンロード商品¥ 0
![[RVC] KLM 4.2 Pretrained Model (Test Version) [RMVPE / FP32]](https://booth.pximg.net/5b273a06-a1f0-40f5-b4d2-6b693e50857e/i/5940896/55049e41-2404-47a8-b354-d6710eb9dab7_base_resized.jpg)
[주의] 본 모델은 RVC Voice Model 제작자를 위한 사전학습 모델이며, 일반적인 모델이 아닙니다. 또한 본 사전학습 모델은 아직 학습중인 모델로써 정식 모델에 비해 매우 성능이 떨어질 수 있다는 점 유의하시기 바랍니다. KLM 4.2의 특징 - KLM 4.2는 새로운 알고리즘에 대응하기 위해 완벽히 새롭게 구성된 데이터셋으로 학습되었으며, 기존 FP16이 아닌 FP32로 학습된 사전학습 모델입니다. KLM 4.2는 [속삭임]과 공기가 많이 섞여 있는 발성을 지닌 목소리 뿐만이 아니라 기존에 한계로 여겨졌던 C6 이상의 소리를 구현시키기 위해 재구성 되었습니다. 여러분의 모델의 데이터셋에 C6 이상의 pitch를 가진 데이터가 이미 존재한다면 데이터셋의 볼륨에 유의 하시기 바랍니다. (고음대에서 dB이 특정 범위를 넘어서면 저음으로 인식 될 수 있음) 여러분의 모델이 속삭임+일반 목소리를 구현하길 원한다면 최소 7:3 비율로 데이터셋을 준비하는게 좋습니다. [일반 목소리 7] : [속삭임 3]. 만약 ASMR 데이터셋 만으로 모델을 구성해야 하는 경우 특정 발음 또는 피치의 영역이 제한적일 수 있습니다. 여러분의 모델인 속삭임+일반 목소리+중고음+고음을 모두 포함한다면 데이터셋을 모두 라벨링하여 분해한 Dataset의 Loudness를 평준화 시켜야 합니다. 일반적인 소리보다 다소 작게 들리도록 설정해 주시는 것을 권장드립니다. 본 테스트 모델은 40k의 샘플레이트 만을 지원합니다. 감사합니다. [注意] 本モデルはRVC Voice Model制作者向けの事前学習モデルであり、一般的なモデルではありません。また、この事前学習モデルはまだ学習中のモデルであるため、正式モデルに比べて性能が大幅に劣る可能性があることに注意してください。 KLM 4.2の特徴 - KLM 4.2は新しいアルゴリズムに対応するために、完全に新しいデータセットで学習されており、従来のFP16ではなくFP32で学習された事前学習モデルです。 KLM 4.2は、[囁き声]や息が多く混ざった発声の声だけでなく、従来の限界とされていたC6以上の音を実現するために再構成されました。 あなたのモデルのデータセットにC6以上のピッチを持つデータが既に存在する場合、データセットのボリュームに注意してください。(高音域でのdBが特定範囲を超えると低音として認識される可能性があります) あなたのモデルが囁き声+通常の声を実現したい場合、最低でも7:3の比率でデータセットを準備することをお勧めします。[通常の声7] : [囁き声3]。もしASMRデータセットのみでモデルを構成する場合、特定の発音やピッチの範囲が制限される可能性があります。 あなたのモデルが囁き声+通常の声+中高音+高音をすべて含む場合、データセットをすべてラベリングして分解したデータセットのラウドネスを平準化する必要があります。一般的な音よりやや小さく聞こえるように設定することをお勧めします。 本テストモデルは40kのサンプルレートのみをサポートします。 ありがとうございます。 Dataset - 146 Hours Foundation Model - KLM 4.2 (no finetune) [Korean & Japanese based] Batch Size - 8 Pitch Range - G1 to C6 [Safe Range] C6 to G6 [Extentional] 90 Epochs (Test Version) F0 Method - Rmvpe FP32 Sample Rate - 40Khz (Test Version) Or you can download Newest Test Version in my HuggingFace https://huggingface.co/SeoulStreamingStation/KLM4.2_TestVersion/tree/main