【OCR】
- オーシーアール
紙に書かれた文字を読みとって、文字データに変換する装置あるいは仕組み。
たとえば、印刷された原稿をパソコンに再入力しなければならない、といったときに威力を発揮する。スキャナで原稿を読みとって、OCRソフトでテキストデータに変換すれば手間と時間を節約できる。
ただし今のところ、パソコンで扱えるのは印刷された文字だけ。手書き文字には対応できない。業務用では、手書き文字に対応できる装置もあるけど、数字やアルファベットの認識に使われるのが一般的だ。
気になる変換精度だけど、かなり向上したものの、まだ完璧とはいえない。元になる文字の大きさや、スキャナで読み込むときの解像度にもよるけど、だいたい95〜99%とされている。
仮に99%としても、100文字に1文字は間違えるということだ。400字詰めの原稿用紙なら、1枚につき4文字は間違えることになる。また、飾り文字や、背景に柄のある見出し文字などの認識は難しい。正しく変換されなかった文字は、手作業で打ち直すしかない。
変換精度を上げるには、スキャナの解像度を上げるのが基本だ。通常でも400dpiで取り込みたい。元の文字が小さい場合は、拡大コピーなどで大きくするといい。また原稿に、ゴミや汚れがあると精度が落ちる。
用語解説:下島 朗(株式会社エントラータ)監修



















































































