【PDF文字抽出】Scenario Extractor【簡易OCR機能付き】
- Digital300 JPY



TRPGシナリオPDFからテキストを抽出するための補助ツールです。 「PDFしか配布されていない」 「2カラム+柱付きでコピーしにくい」 「縦書きで扱いづらい」 「ココフォリアへ貼り付けたい」 そんな時のために作りました。 本ソフトはPDF内の文字抽出と簡易OCR(画像文字認識)に対応しており、本文・注釈などの領域を指定して必要な部分だけを抽出できます。 ❤️出力したtxtデータは別で販売中の整形ツールに投げると便利です。ココフォリアへの出力も楽々(https://cur1um.booth.pm/items/8434454) --- 主な機能 ✅ PDF埋め込み文字抽出 ✅ 簡易文字認識機能付き ✅ 縦書きPDF対応 ✅ 本文/注釈などの領域指定 ✅ 奇数ページ/偶数ページテンプレート保存 ✅ 完全オフライン動作 --- おすすめの使い方 ① PDFを読み込む ② 本文や注釈の領域を指定する ③ 「自動」で抽出する ④ TXTとして保存する ⑤ 必要に応じて整形ツールやココフォリアへ --- ## ご注意 OCRには Tesseract OCR を使用しています。 OCRの性質上、フォントや画質によっては誤認識が発生します。 特にOCRでは、 ・カタカナ ・長音記号(ー) ・濁点/半濁点 ・特殊記号 などで誤認識が発生する場合があります。 また、ルビ統合機能は試験機能です。 レイアウトによっては誤った文字へルビが付与される場合がありますので、安定性を重視する場合はOFFを推奨します。 抽出結果は必ずご自身でご確認ください。 --- 動作環境 Windows --- プライバシーについて 本ソフトはオフラインで動作します。 PDFや抽出結果を外部へ送信することはありません。 --- ライセンス 本ソフトには Tesseract OCR および関連コンポーネントが含まれています。 ライセンス情報は同梱の LICENSES フォルダをご確認ください。 --- ## 免責事項 本ソフトの利用によって生じた損害について、作者は責任を負いません。 抽出結果は必ず利用者自身で確認してください。 技術的に対応可能な不具合があれば追加で修正、アップデートを行う予定ですので、メッセージまでご連絡ください。 サンプルテキスト:『こころ』 夏目漱石 出典:青空文庫 https://www.aozora.gr.jp/cards/000148/card773.html


