OCR– ის უარყოფითი მხარეები

...

OCR პროგრამული უზრუნველყოფა გარდაქმნის დოკუმენტის სურათს ელექტრონულ ტექსტად.

აშშ საფოსტო სამსახური იყენებს ოპტიკური სიმბოლოების ამოცნობის (OCR) ტექნოლოგიას ფოსტაზე მისამართების წასაკითხად. იმისთვის, რომ ფოსტა იკითხებოდეს OCR ფოსტის დამხარისხებელმა, მისამართები და შრიფტები უნდა იყოს ფორმატირებული გარკვეული გზით. OCR პროგრამული უზრუნველყოფა სასარგებლოა აკრეფილი ან ხელით დაწერილი დოკუმენტების სკანირებული სურათების საძიებლად ელექტრონულ ტექსტად გადასაყვანად, მაგრამ მას აქვს უარყოფითი მხარეები, რაც ზღუდავს მის აპლიკაციებს.

შეზღუდული დოკუმენტები

OCR საუკეთესოდ მუშაობს კარგი ხარისხის აკრეფილ დოკუმენტებთან. ხელნაწერი დოკუმენტების ადვილად წაკითხვა შეუძლებელია OCR პროგრამული უზრუნველყოფის საშუალებით. ანალოგიურად, აკრეფილი შრიფტები, რომლებიც ხელნაწერს წააგავს - ისევე როგორც არალათინური შრიფტები - ქმნის ბევრ შეცდომას OCR პროცესის დროს. თუ დოკუმენტს აქვს ცუდი კონტრასტი, არის ნაკეცები ან ჭუჭყიანი, ან ტექსტი და ფონი მსგავსია სიბნელეში, მაშინ OCR შეიძლება კარგად არ იმუშაოს. OCR-ს უჭირს დოკუმენტები, რომლებსაც აქვთ როგორც სურათები, ასევე ტექსტი. ელცხრილები ასევე წარმოქმნიან მეტ შეცდომებს.

დღის ვიდეო

სიზუსტე

არცერთი OCR პროგრამა არ არის 100 პროცენტით ზუსტი. შეცდომების რაოდენობა დამოკიდებულია დოკუმენტის ხარისხსა და ტიპზე, გამოყენებული შრიფტის ჩათვლით. შეცდომებს, რომლებიც წარმოიქმნება OCR-ის დროს, მოიცავს ასოების არასწორ წაკითხვას, წაუკითხავი ასოების გამოტოვებას ან მიმდებარე სვეტების ან სურათის წარწერების ტექსტის შერევას. თუ საჭიროა მაღალი სიზუსტე - ისევე როგორც ციფრული წიგნების ელექტრონულ ფორმატში გადაყვანა - მაშინ საჭირო იქნება ელექტრონული ტექსტის გასუფთავება.

სამუშაოები

OCR-ს უჭირს სიმბოლოების დიფერენცირება, როგორიცაა რიცხვი ნული და დიდი "O". ამის გადასაჭრელად შეიძლება გამოყენებულ იქნას სპეციალური OCR შრიფტი, როგორიცაა ნულის ჩაწერა. თუმცა, ეს მუშაობს მხოლოდ OCR-ის გათვალისწინებით შექმნილ დოკუმენტებზე, როგორიცაა კითხვარები. კითხვარების შექმნისას, რომლებიც ხელით იქნება დაწერილი, მკვლევარები ასევე იყენებენ ყუთებს თითოეული ასოსთვის.

Დამატებითი სამუშაო

მაშინაც კი, თუ ორიგინალური დოკუმენტის სკანირებული სურათი მაღალი ხარისხისაა, დამატებითი ნაბიჯები უნდა განხორციელდეს OCR ტექსტის გასასუფთავებლად. OCR-ის მიერ შექმნილი შეცდომების გამოსწორება ძალიან შრომატევადია. ადამიანმა ხელით უნდა შეადაროს ორიგინალი დოკუმენტი და ელექტრონული ტექსტი. ადამიანები ასევე უშვებენ შეცდომებს დოკუმენტიდან ტექსტის აკრეფისას, მაგრამ ზოგჯერ უფრო სწრაფია OCR ნაბიჯის გამოტოვება.

კატეგორიები

Ბოლო

როგორ გავხსნათ Wordstar Docs MS Word-ით

როგორ გავხსნათ Wordstar Docs MS Word-ით

WordStar ფაილები შეიძლება გაიხსნას Microsoft W...

როგორ გამოვიყენოთ My Word მაკროები სხვა კომპიუტერზე

როგორ გამოვიყენოთ My Word მაკროები სხვა კომპიუტერზე

დარწმუნდით, რომ ჩანართი „დეველოპერი“ ჩართულია W...

როგორ ჩავსვა გვერდი ან განყოფილება Microsoft Word დოკუმენტში?

როგორ ჩავსვა გვერდი ან განყოფილება Microsoft Word დოკუმენტში?

თქვენ იპოვით პარამეტრებს გვერდის წყვეტებისთვის...