プロンプトインジェクションを監視する「PromptGuard」
- Digital100 JPY





■概要 ・「Prompt Guard」は、 あなたのPCからAIへの通信を ローカル環境で監視し、 機密情報の漏洩や 悪意のあるプロンプト実行を未然に防ぐ、 次世代のAIセキュリティツールです。 ・昨今、ChatGPTなどの生成AIサービスを利用する際、 気付かぬうちに社外秘のAPIキーや パスワードを送信してしまったり、 Webサイトに巧妙に仕掛けられた プロンプトインジェクションによって データを盗み出されたりするリスクが急増しています。 ・「Prompt Guard」は、こうした脅威に対して 「PCの出口」で強固な防波堤として機能します。 ・AI関連の通信のみを ピンポイントで検査するスマートな設計により、 Google検索や動画視聴など、 通常のWebブラウジングの速度やセキュリティには 一切影響を与えません。 ・さらに、従来のルールベース検知をすり抜ける 高度なサイバー攻撃に対し、 ローカルAI(llama.cppやOllama)を用いて 通信の「意図」を文脈から読み解きブロックする ハイブリッド防衛システムを搭載しました。 ・また、機密情報がプロンプトに含まれていた場合でも、 通信を完全に遮断するのではなく、 危険な箇所だけを自動で伏せ字(マスキング)にして送信する 画期的な新機能を備えています。 ・これにより、ユーザーはエラーで作業を中断されることなく、 安全にAIの利用を継続できます。 ・監査ログの自動保存やWindows起動時の自動実行、 独自のカスタムブロックワード設定など、 ビジネスの実運用に耐えうる エンタープライズ級の機能を網羅しつつ、 クラウドサーバーに一切データを送らない 究極のプライバシー保護を実現しました。 ・見えない脅威からあなたと企業の大切なデータを守る、 必須のセキュリティパートナーです。 《 取扱説明書 》 ■概要と起動方法 ・「Prompt Guard」は、 起動するとWindowsのタスクトレイに盾のアイコンとして常駐し、 自動的にシステムのプロキシ設定を構成して 通信の監視を開始します。 ・複雑な初期設定は一切必要なく、 起動した瞬間から あなたのPCは保護された状態となります。 ・設定メニューから Windows起動時の自動実行を有効にすることで、 保護の空白期間をなくすことが可能です。 ■基本操作 ・すべての操作は、 画面右下のタスクトレイにある 盾のアイコンを右クリックして行います。 ・メニューから選択できる各機能は、以下の通りです。 (1)ログ表示を選択すると、 現在アプリが監視、または、ブロックした通信の リアルタイムな動作記録を確認できます。 また、すべての監視記録は、 アプリと同じフォルダにあるAuditLog.csvファイルに 監査ログとして、自動で永続的に保存されます。 (2)ブロック履歴を選択すると、 過去に危険と判定されて遮断、 または、マスキングされたプロンプトや 機密情報の一覧を振り返ることができます。 (3)一時許可は、 直近でブロックされた通信が安全であると お客様ご自身で判断した場合に、 その接続先を一時的に許可リストへ追加する機能です。 同じサイトを3回許可すると、 アプリが安全なサイトとして学習し、 以降は自動的に通信を通すようになります。 (4)保護 ON/OFFを選択すると、 アプリを終了させずに通信の監視機能だけを一時的に停止、 または再開させることができます。 (5)プロキシ設定を強制修復は、 万が一通信が途切れたり、 インターネットに繋がらなくなったりした場合に使用する 強力な復旧機能です。 クリックすると、 Windowsのインターネット設定を 正常な状態に瞬時にリセットします。 (6)設定を選択すると、 これまでにアプリが学習した許可リストの確認やクリアのほか、 社外秘プロジェクト名などの独自ルールを追加できる カスタムブロックワードの登録が行えます。 また、機密情報の自動マスキング機能のオンオフ切り替えや、 ローカルAI(llama.cppやOllama)を利用した 高度な意図判定エンジンの接続設定もこの画面から行います。 (7)終了をクリックすると、 システムのプロキシ設定を安全に解除し、 ローカルAIサーバーを停止させた上で、 アプリを完全に終了します。 脅威の検知と自動マスキングについて AIとの通信中に機密情報 (AWSキー、パスワード、認証トークンなど)や カスタムブロックワードが検知されると、 「Prompt Guard」は、即座にその部分を 安全な文字(REDACTED)に置き換えてマスキングし、 AIへの情報漏洩を防ぎつつ、通信自体は継続させます。 一方で、プロンプトインジェクションや Markdownを用いたデータ持ち出しなどの 「悪意のある命令そのもの」が検知された場合、 または、ローカルAIが文脈から 危険な攻撃意図を読み取った場合は、 即座にその通信全体を強力に遮断します。 処理が行われると、画面右下に通知が表示され、 専用のウィンドウから どのような内容が送信されようとしたのかを 詳細に確認することができます。




