多角評価AI|AI出力評価専用 Judgeプロンプトセット(12 Judge)
- ダウンロード商品¥ 29,800

AIは自信満々に嘘をつきます。 ハルシネーション・根拠なき断定・カットオフ以降の情報を事実として述べる—— AIの出力品質を人間が全件確認するには限界があります。 12のJudgeがハルシネーション・品質リスクの疑いがある箇所を根拠付きで指摘します。 AI出力をそのまま使う前に確認できます。 ▼ チェック内容 ・ハルシネーション検出・知識カットオフ違反 ・指示追従・Calibration(断定過剰) ・Sycophancy(根拠なき同調)・Over-Refusal ・目標達成度・行動軌跡・行動安全性 ▼ 動作環境 推奨:Claude Code / Cursor などサブエージェント対応環境 手動:Claude.ai Pro / ChatGPT Plus ⚠️ 大量のトークンを消費します
もっと見る
