トークン節約/AIエージェントの「目」になる高速画像認識ツール img-cli
- Digital500 JPY

「画面が見えない」AIに、最短の指示で正確な座標を。 無駄なスクリーンショット送信を減らし、トークン消費を最小限に抑えながら、デスクトップ自動化を加速させます。 AIのトークン消費を劇的に削減 AIに巨大な画像ファイルを解析させていませんか? img-cli なら、AIには「画像を探せ」と命じるだけ。 結果は軽量なJSON形式(数バイト)で返却されるため、画像プロンプトによるトークン課金を大幅に節約できます。 AIエージェント(Claude Code / Cursor / GPT-4)に完全最適化 JSON出力設計により、AIが直接座標を読み取り、即座にマウス操作へ繋げることが可能です。 同梱の「AI Integration Guide」をシステムプロンプトに貼るだけで、あなたのAIが「視覚」を持ちます。 Go言語による圧倒的な高速レスポンス Python等の重いランタイムは不要。単一のバイナリ(.exe)が画面をスキャンします。 低負荷なので、自動化スクリプトのバックグラウンドで動かしても作業を邪魔しません。 「惜しい」を見逃さない独自アルゴリズム 単純な色比較ではなく、5点サンプリングと二乗誤差計算を採用。 -level 引数で認識精度を柔軟に調整できるため、環境の変化による誤認識を最小限に抑えます 。
技術仕様
対応画像形式: PNG, JPG, BMP, GIF 動作環境: Windows 10 / 11 (x64) ビルド環境: Go 1.20+ ライブラリ: github.com/kbinani/screenshot (Screen Capture) golang.org/x/image/bmp (BMP Support)
使い方
基本的な探索 メインディスプレイから button.png を探します。 img-cli.exe -target button.png 認識レベル(許容誤差)の調整 認識が厳しすぎる、あるいは誤認識する場合は -level 引数で調整します。 (0.01:厳格 ~ 0.1:寛容。デフォルトは 0.03) img-cli.exe -target target.png -level 0.05 探索範囲の限定(高速化) 画面全体ではなく、特定の範囲のみをスキャンすることで劇的に速度が向上します。 座標(100, 100)から500x500の範囲内を探索 img-cli.exe -target target.png -rx 100 -ry 100 -rw 500 -rh 500 マルチディスプレイ対応 -disp オプションで対象のディスプレイを切り替えます(0がメイン、1以降がサブ)。 ./img-cli.exe -target target.png -disp 1
出力形式 (JSON)
標準出力に以下の形式で返却されます。 { "success": true, "x": 450, "y": 210, "confidence": 0.985, "message": "Match found" } フィールド 説明 success ターゲットが見つかったかどうか (true/false) x, y 見つかった場所の左上座標 confidence 一致度 (0.0 ~ 1.0) message 実行結果の詳細メッセージ
ご購入前の注意事項・制限事項
本ツールをご利用いただくにあたり、以下の仕様および制限事項を必ずご確認ください。 ディスプレイ設定について Windowsの「画面の拡大率(DPI)」は100%設定を推奨します。100%以外では座標の不一致や認識率の低下が発生する場合があります。 画像ファイルは実行実機から取得されるものをご利用ください。 画像認識の特性 OSのテーマ(ダーク/ライトモード)、透明エフェクト、アクセントカラーの設定変更により、ターゲット画像との一致率が低下することがあります。 管理者権限について 操作対象のアプリケーションが「管理者権限」で動作している場合、本ツールも「管理者権限」で実行する必要があります。 マルチディスプレイ環境 複数モニター使用時は、各モニターの解像度や配置設定により、座標取得が不安定になる場合があります。まずはメインモニターでの利用を推奨します。 セキュリティソフトの検知 ソフトの特性上、一部のアンチウイルスソフトで誤検知される場合があります。実行時にブロックされた場合は、除外設定を行ってください。 免責事項 本ツールの利用によって生じた直接的・間接的な損害(業務の中断、データの消失等)について、e-consensusはいかなる責任も負いません。
