OCRのデメリット

...

OCRソフトウェアは、ドキュメントの画像を電子テキストに変換します。

米国郵政公社は、光学式文字認識(OCR)テクノロジーを使用して、郵便物の住所を読み取ります。 ただし、OCRメールソーターでメールを読み取れるようにするには、アドレスとフォントを特定の方法でフォーマットする必要があります。 OCRソフトウェアは、入力または手書きのドキュメントのスキャン画像を検索可能な電子テキストに変換するのに役立ちますが、アプリケーションを制限するという欠点があります。

限られたドキュメント

OCRは、高品質のタイプされたドキュメントで最適に機能します。 手書きの文書は、OCRソフトウェアでは簡単に読み取ることができません。 同様に、手書きに似た入力フォント(および非ラテンフォント)は、OCRプロセス中に多くのエラーを作成します。 ドキュメントのコントラストが低い、しわが寄っている、汚れている、またはテキストと背景が暗闇で似ている場合、OCRはうまく機能しない可能性があります。 OCRは、画像とテキストの両方を含むドキュメントでは問題があります。 スプレッドシートはまた、より多くのエラーを生成します。

今日のビデオ

正確さ

100%正確なOCRソフトウェアはありません。 エラーの数は、使用するフォントなど、ドキュメントの品質と種類によって異なります。 OCR中に発生するエラーには、文字の誤読、判読できない文字のスキップ、隣接する列のテキストや画像のキャプションの混合などがあります。 電子書籍を電子形式に変換する場合のように、高精度が必要な場合は、電子テキストのクリーンアップが必要になります。

回避策

OCRでは、数字のゼロや大文字の「O」などの文字を区別するのが困難です。 これを回避するために、ゼロを書き出すなどの特別なOCRフォントを使用できます。 ただし、これは、アンケートなど、OCRを念頭に置いて作成されたドキュメントに対してのみ機能します。 手書きのアンケートを作成する場合、研究者は各文字にボックスも使用します。

余分な仕事

元のドキュメントのスキャン画像が高品質であっても、OCRテキストをクリーンアップするために追加の手順を実行する必要があります。 OCRによって作成されたエラーを修正することは非常に手間がかかります。 人は、元のドキュメントと電子テキストを手動で比較する必要があります。 ドキュメントからテキストを入力するときにもエラーが発生しますが、OCRステップをスキップした方が速い場合もあります。