عيوب التعرف الضوئي على الحروف

click fraud protection
...

يقوم برنامج OCR بتحويل صورة المستند إلى نص إلكتروني.

تستخدم خدمة البريد الأمريكية تقنية التعرف الضوئي على الأحرف (OCR) لقراءة العناوين الموجودة على قطع البريد. لكي يكون البريد قابلاً للقراءة بواسطة فارز البريد OCR ، ومع ذلك ، يجب تنسيق العناوين والخطوط بطريقة معينة. يعد برنامج OCR مفيدًا في تحويل الصور الممسوحة ضوئيًا للمستندات المكتوبة أو المكتوبة بخط اليد إلى نص إلكتروني قابل للبحث ، ولكن له عيوبًا تحد من تطبيقاته.

وثائق محدودة

يعمل التعرف الضوئي على الحروف بشكل أفضل مع المستندات المكتوبة عالية الجودة. لا يمكن قراءة المستندات المكتوبة بخط اليد بسهولة بواسطة برنامج التعرف الضوئي على الحروف. وبالمثل ، فإن الخطوط المكتوبة التي تشبه الكتابة اليدوية - وكذلك الخطوط غير اللاتينية - تخلق العديد من الأخطاء أثناء عملية التعرف الضوئي على الحروف. إذا كان المستند به تباين ضعيف ، أو مجعد أو متسخ ، أو كان النص والخلفية متشابهين في الظلام ، فقد لا يعمل التعرف الضوئي على الحروف بشكل جيد. يواجه OCR صعوبة في التعامل مع المستندات التي تحتوي على صور ونصوص. ستنتج جداول البيانات أيضًا المزيد من الأخطاء.

فيديو اليوم

صحة

لا يوجد برنامج OCR دقيق بنسبة 100 بالمائة. يعتمد عدد الأخطاء على جودة المستند ونوعه ، بما في ذلك الخط المستخدم. تتضمن الأخطاء التي تحدث أثناء التعرف الضوئي على الحروف قراءة الأحرف بشكل خاطئ أو تخطي الأحرف غير القابلة للقراءة أو خلط نص من الأعمدة المجاورة أو تسميات توضيحية للصورة. إذا كانت الدقة العالية مطلوبة - كما هو الحال مع تحويل الكتب الرقمية إلى تنسيق إلكتروني - فستكون هناك حاجة لتنظيف النص الإلكتروني.

حول العمل

يواجه OCR صعوبة في التمييز بين الأحرف ، مثل الرقم صفر والحرف الكبير "O". للتغلب على هذا ، يمكن استخدام خط OCR خاص ، مثل كتابة الصفر. ومع ذلك ، يعمل هذا فقط مع المستندات التي تم إنشاؤها مع وضع التعرف الضوئي على الحروف في الاعتبار ، مثل الاستبيانات. عند إنشاء استبيانات مكتوبة بخط اليد ، يستخدم الباحثون أيضًا مربعات لكل حرف.

عمل إضافي

حتى إذا كانت الصورة الممسوحة ضوئيًا للمستند الأصلي عالية الجودة ، يجب إجراء خطوات إضافية لتنظيف نص OCR. إن تصحيح الأخطاء الناتجة عن التعرف الضوئي على الحروف يتطلب عمالة مكثفة. يتعين على الشخص مقارنة المستند الأصلي والنص الإلكتروني يدويًا. يرتكب الأشخاص أيضًا أخطاء عند كتابة نص من مستند ، ولكن في بعض الأحيان يكون تخطي خطوة التعرف الضوئي على الحروف أسرع.