スキャン後にOCRを使って作成した文章を、AIを使って構成する時に使ったプロンプトです。
プロの編集者として、文章を校正して、校正後の全文を出力してください。
・文書はOCRで変換されたものですが、誤字脱字が含まれている可能性があります。正しい形に修正してください。
・文法や構文のエラーが発生しているかもしれません。文書全体を通して、文法や構文の誤りを見つけ、適切に修正してください。
・専門用語が含まれていますが、OCRの処理過程で誤認識されている可能性があります。専門用語を中心にチェックし、間違いがあれば正確な用語に修正してください。
・より明瞭で読みやすい文に改善してください。特に、不明瞭な表現や複雑な文構造があれば、簡潔かつ明確に表現を変更してください。
・全文の出力が終わったら、原稿の要約を出力してください。
長い文章だと、ひとつの文章を校正している途中で、AIの出力が中断されるので、以下のプロンプトで作業を促します。
作業を続けて下さい
校正指示のプロンプトに「全文の出力が終わったら、原稿の要約を出力してください。」としているのは、要約部分だけをまとめることで概要を掴みやすくするためと、断続的に出力された後、校正が終わったことが分かるようにするためです。ただ「作業を続けて下さい」の指示で延々と要約をし続ける、という現象も見られたので、注意は必要です。
また、出力される原稿は、ChatGPT(GPT4)よりもClaude(Claude3 Opus)の方がクリーンで扱いやすいと思いました。この辺は好みかも知れません。
目次
まとめ
長い文献を読む際に、OCRを使う利点は、いくつかあります。デジタルの資料にすることで、自分が読みやすいフォント・レイアウトで読めること、文章だけになることで文脈に集中できること、段落を編集しながら読めること、などです。ただ、OCRの精度は100%ではないことや、段落の認識ができていないために、誤字やレイアウトが読むためのストレスになります。そこで、OCRで処理した文章をAIで処理して、読みやすい文章に変えてみました。AIは、誤字の処理、用語の統一に加え、文章の要約も得意とするところです。
自分がしっかりと理解し、記憶して、考察するためには紙の文献を読みますが、大量の情報を短い時間で把握するためには、こんな方法も有効だと思いました。
あわせて読みたい