勉強熱心なAIと会議する「ガリ勉くん」
- Digital100 JPY






《セットアップ手順》 (1) お使いのPCに 「Python(バージョン3.10 または 3.11)」が インストールされているか確認してください。 インストールする際は、最初の画面で必ず 「Add Python to PATH」にチェックを入れてください。 (2) ダウンロードしたGaribenKunのフォルダの中にある 「setup_env.bat」をダブルクリックして実行します。 (3) 黒い画面(コマンドプロンプト)が開き、 自動的にAI学習に必要なデータ(約4GB)の ダウンロードと構築が始まります。 環境や回線によって数分〜十数分かかりますので、 完了の文字が出るまで画面を閉じずにお待ちください。 (4) セットアップが完了したら、GaribenKun.exe を起動します。 「設定・ツール」タブの「Python環境パス」に venv\Scripts\python.exe と入力されていることを確認してください。 ・ローカルLLMのセットアップについては、こちらを参照。↓ ※ビルド済みのLoRA用ツールをダウンロードして解凍し、 フォルダ内の2つの実行ファイルを このツールの実行ファイルのあるフォルダ内に配置してください。 ※音声で入力する場合は、このツールの実行ファイルのあるフォルダ内に whisper.netのモデルファイルを置いておく必要があります。↓ ggerganov/whisper.cpp at main We’re on a journey to advance and democratize artificial inte huggingface.co ※ggml-base.binをダウンロードして、 実行ファイルと同じフォルダ内に配置してください。 ※音声を出力する場合は、voiceboxを起動しておいてください。↓ VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア 無料で使える中品質なテキスト読み上げ・歌声合成ソフトウェア。商用・非商用問わず無料で、誰でも簡単にお使いいただけます。イン voicevox.hiroshiba.jp ・AIがおしゃべりするのに必要です。 🌟「話す、記憶する、そして成長する。 あなただけのAIキャラクターを錬成する 究極のワークベンチ『GaribenKun』登場!」 ・ローカルLLMの真価を引き出す、 Windows向け高機能AIチャット &育成アプリケーション『GaribenKun』。 ・単なるチャットアプリではありません。 ・AIキャラクターの「記憶」を管理し、 あなたとの会話から「学習データ」を自動生成し、 さらにはローカルで「追加学習(LoRA)」や 「モデルの合体(マージ)」まで完結できる、 まさにAI錬金術師のためのワークベンチです。 【GaribenKunのここがすごい!】 🧠 成長する長期記憶(RAG搭載): あなたとの会話は自動でベクトル化されて記憶されます。過去の出来事やあなたの好みを踏まえた、文脈豊かな会話を実現。 🎭 感情豊かなリアクション: 会話の内容からAIの感情をリアルタイムに分析。喜怒哀楽のパラメーターを画面上に可視化します。 🗣️ 音声と耳を持つAI: VOICEVOXによるフルボイス読み上げと、Whisperによる高精度な音声入力に対応。 🎓 クリック一つで追加学習(QLoRA): AIの返答を「訂正」するだけでデータが蓄積。溜まったデータを使って、あなたのPC上で直接AIの性格や知識をファインチューニング可能! 🧪 禁断の「LoRA合体部屋」: 複数のLoRAモデルを好きな比率でブレンドし、ベースモデルに焼き付け(Bake)。全く新しい人格を創り出せます。 📦 パッケージで共有: 育てたキャラクター(プロンプト+LoRAモデル)は .gkpkg 形式で1つのファイルにエクスポート可能。他のユーザーと簡単に自作キャラクターを共有できます。 Ollama、llama.cpp、そして各種クラウドAPI(OpenAI, Gemini, Claude)にも対応。 ゲーム開発のNPCロジック作成から、理想のパートナーAIの育成まで、GaribenKunがあなたのAIライフを加速させます! 📖 取扱説明書 【概要】 ・「GaribenKun」は、ローカルLLM(Ollamaやllama.cpp) および各種クラウドAPI(OpenAI、Gemini、Claude)を活用し、 AIキャラクターとの会話、長期記憶の蓄積、 そしてあなただけのAIを育成(追加学習)するための 統合アプリケーションです。 【基本のチャット機能と記憶】 (1) サーバーの起動は「設定・ツール」タブから行います。 使用するLLMやクラウドAPIを選択し、 起動または接続ボタンを押してください。 (2) メイン画面の「チャット」タブ下部にある入力欄から テキストを入力して送信します。 ( マルチモーダルに対応しているモデルを読み込んでいる場合は、 画像をドラッグ&ドロップして、画像認識をさせることも可能です。) (3) あなたとAIの会話は、自動的に分析され、 「長期記憶」として保存されます。 AIは過去の会話や、 あなたの好みを踏まえた返答をするようになります。 (4) AIの返答に含まれる感情は自動で分析され、 画面上のアイコンと感情パラメーターとして リアルタイムに可視化されます。 【AIの育成と追加学習(LoRA)】 (1) AIの返答が理想と異なる場合 「返答を訂正して学習」ボタンを押し、 あなたが考える「正しい返答」を入力して データを蓄積させることができます。 (2) データが5件以上溜まると 「追加学習」ボタンが押せるようになります。 (3) バッチサイズやエポック数などの 詳細設定を行い学習を開始すると、 AIの性格を固定化するLoRAモデルが生成されます。 (4) 学習データを入力するのが面倒なのでやりたくない場合は、 「学習データの自動生成」ツールを使ってください。 AIが質問と回答のペアを大量に自動作成してくれます。 【LoRA合体部屋とAI会議室】 (1) 「LoRA合体部屋」を使用すると、 学習した複数のLoRAモデルを好きな比率でブレンドし、 ベースモデルに完全に焼き付けた新しいモデル(GGUF)を 作成できます。 (2) 作成したモデルは、Ollamaなどに読み込ませることで、 他のゲームやアプリケーションのNPCとして 活躍させることができます。 (3) 「AI会議室」では、作成した複数のキャラクターを呼び出し、 特定のテーマについて自動で議論させることができます。 (4) 会議室で「口論バトルモード」を有効にすると、 規定ターン終了時に、司会者AIが 勝敗の判定と熱い総評を行ってくれます。 【キャラクターの共有】 (1) 画面上のメニューから 「パッケージとして書き出す」を選ぶと、 キャラクターの設定と学習済みLoRAが 1つのファイル(.gkpkg)に圧縮されます。 (2) このファイルを他のユーザーに渡して 「パッケージから読み込む」を実行してもらえば、 あなたが育てたAIキャラクターを そのまま共有することができます。 《学習のコツ》 ・ただ闇雲に自動生成したデータを食べさせるのは、 非常に非効率であり、 最悪の場合、AIが「バカになる」原因になります。 (AI特有の不自然な言葉遣いに引っ張られる) 1. 効果が見えてくるデータ量の目安 ・ベースモデル(Llama 3 8Bクラスなどを想定)に このツールの方式「QLoRA」で追加学習させる場合、 目的によって必要なデータ量が全く異なります。 レベル1:口調や語尾を覚えさせる(100 〜 300件) ・「~だにゃ」「吾輩は~である」といった独特の口調や、 出力のフォーマット(必ずJSONで返すなど)を覚えさせるだけなら、 高品質なデータが100件もあれば十分に効果を実感できます。 レベル2:キャラクターの性格や価値観を反映させる(500 〜 1,000件) ・特定の話題に対して 「怒る」「喜ぶ」「独特の持論を展開する」といった反応のパターンを 定着させるには、この程度のバリエーションが必要です。 レベル3:新しい専門知識を暗記させる(数千 〜 1万件以上) ・設定集や特定の業界の知識を 「モデルそのものの脳内に暗記」させるのは、 LoRAの最も苦手とする分野であり、 膨大なデータと計算時間が必要です。 (後述するRAGで解決するのが現在の主流です) 2. より効率よく学習させる「3つの極意」 ・ただデータを増やすのではなく、 以下のポイントを意識すると学習効率が劇的に上がります。 ① 「自動生成データ」は必ず人間がチェック(クリーニング)する ・LLMに自動生成させたデータ(Synthetic Data)は、 どうしても「AIっぽい、無難でつまらない返答」になりがちです。 ・これをそのまま学習させると、キャラクターの個性が死んでしまいます。 効率化のコツ: ・自動生成ツールで100件のQ&Aの「ベース」を作り、 それを人間が「このキャラならもっと皮肉っぽく言うはずだ」 「ここでこの口癖を使うはずだ」と 手作業で尖らせる(微調整する)のが、 最もタイムパフォマンスが良いデータの作り方です。 ② データの「多様性」を意識する ・同じような挨拶や日常会話ばかり500件学習させても、 あまり賢くなりません。 ・以下のシチュエーションを意識してデータを作ると、 どんなフリにも対応できるAIになります。 未知の質問: ・「知らないこと」を聞かれたときに、キャラらしくどう誤魔化すか。 感情の起伏: ・激怒している時、照れている時、悲しい時のセリフ。 専門領域: ・そのキャラが一番語りたいテーマについての熱い語り。 ③ LoRAに「知識」を詰め込もうとしない ・LoRAは『話し方(スタイル)』を学ぶものであり、 『知識(ファクト)』を学ぶものではない、というのが、 現在のAIエンジニアの共通認識です。 ・キャラクターの生い立ちや世界観の設定を LoRAで暗記させようとすると、 膨大なデータが必要になります。 ・しかし、GaribenKunにはすでに 「RAG(長期記憶のベクトル検索)」が搭載されています。 ・これは非常に理にかなった設計です。 事実や過去の記憶: ・RAG(データベース)から引き出してプロンプトに注入する。 口調や性格、返答のテンポ: ・LoRAでベースモデルに定着させる。 ・この役割分担を意識するだけで、 少ない学習データでも驚くほどキャラクターが 生き生きと動くようになります。 3. おすすめの学習フロー(実践編) ・最も効率的なAI育成フローは、以下のようになります。 最初は手動で訂正(数十件): ・まずは普通にチャットをし、 AIが「キャラブレ」を起こしたら すかさず「返答を訂正して学習」ボタンで 正しいセリフを教え込みます。 ・これで高品質な基礎データを作ります。 自動生成でシチュエーションを補強(数百件): ・データ生成ツールを使って、 「このキャラが言いそうなこと」のリストを作ります。 ・生成されたリストにサッと目を通し、 AIくさい部分を人間が修正します。 100〜300件溜まったら「追加学習」: ・エポック数「3〜5」、 学習率「0.0002(2e-4)」あたりで学習を回し、 合体部屋でベースモデルに焼き付けます。





