Πώς να σαρώσετε ένα έγγραφο και να επεξεργαστείτε κείμενο

Ας υποθέσουμε ότι έχετε πολλές γραπτές σημειώσεις που θέλετε να μεταφέρετε σε ένα αρχείο υπολογιστή και να τις επεξεργάζεστε από καιρό σε καιρό. Θα μπορούσατε να αφιερώσετε χρόνο για να πληκτρολογήσετε τα δεδομένα με το χέρι, αλλά υπάρχει μια πολύ πιο γρήγορη μέθοδος. Μπορείτε να σαρώσετε το έγγραφο και να μετατρέψετε αυτόματα τις λέξεις σε ηλεκτρονικά γράμματα και λέξεις που μπορούν να επεξεργαστούν. Για να το κάνετε αυτό χρειάζεστε λογισμικό οπτικής αναγνώρισης χαρακτήρων (OCR).

Χρήση λογισμικού OCR με τον σαρωτή σας

Βήμα 1

Ανοίξτε το πρόγραμμα λογισμικού OCR ώστε να είναι έτοιμο να δεχτεί πρόσφατα σαρωμένα αρχεία.

Το βίντεο της ημέρας

Βήμα 2

Σαρώστε το έγγραφό σας στον υπολογιστή σας. Βεβαιωθείτε ότι η σελίδα που θέλετε να σαρώσετε είναι όσο το δυνατόν πιο καθαρή, με σκούρο μελάνι, ώστε ο σαρωτής να μπορεί να αντιλαμβάνεται κάθε λέξη. Εάν το κομμάτι είναι χειρόγραφο αντί για δακτυλογράφηση, οι λέξεις θα πρέπει να εκτυπωθούν (γραμμένες χωριστά, χωρίς σύνδεση γράμματα) αν είναι δυνατόν, καθώς πολλά προγράμματα OCR δυσκολεύονται να αποκρυπτογραφήσουν χειρόγραφο σενάριο.

Βήμα 3

Επιλέξτε την επιθυμητή επιλογή εξόδου (όπως RTF, Word, PowerPoint, Excel, Text ή PDF), αφήστε το πρόγραμμα OCR να πραγματοποιήσει τη μετατροπή και, στη συνέχεια, αποθηκεύστε το αρχείο που μετατράπηκε στον σκληρό σας δίσκο.

Βήμα 4

Ξεκινήστε το πρόγραμμα επεξεργασίας κειμένου για το αρχείο που μόλις μετατρέψατε. Ανοίξτε το αρχείο και επεξεργαστείτε το έγγραφό σας. Ανάλογα με την ποιότητα της σάρωσης και του λογισμικού OCR, μπορεί να χρειαστεί να κάνετε εκτενή επεξεργασία (για παράδειγμα, το "ri" μπορεί να έχει μεταφραστεί λανθασμένα ως "n"). Διατηρήστε ενεργό τον ορθογραφικό έλεγχο καθώς επεξεργάζεστε για να καταλάβετε όλα τα λάθη.

Το Google Way

Βήμα 1

Η Google διαθέτει επίσης ένα ενσωματωμένο σύστημα OCR. Κάθε φορά που βρίσκετε έναν ιστότοπο στη μηχανή αναζήτησης Google που συνδέεται απευθείας με ένα αρχείο PDF, έχετε την επιλογή να τον διαβάσετε είτε ως PDF είτε σε HTML (κείμενο). Έτσι, για να ξεκινήσετε, σαρώστε στο έγγραφό σας.

Βήμα 2

Μετατρέψτε το έγγραφο σε PDF. Μπορείτε να το κάνετε αυτό αποθηκεύοντας απλώς την εικόνα ως αρχείο PDF στο λογισμικό επεξεργασίας εικόνων σας (όπως το Adobe Photoshop). Ή, σε Mac με OSX, κάνοντας κλικ στο "Εκτύπωση" και πατώντας "Αποθήκευση ως PDF".

Βήμα 3

Ανεβάστε το αρχείο PDF στον λογαριασμό φιλοξενίας του ιστότοπού σας (ή μπορείτε να χρησιμοποιήσετε μια δωρεάν υπηρεσία φιλοξενίας ιστότοπου, όπως το Geocities) και κάντε το αρχείο δημόσιο. Σημειώστε την ακριβή διεύθυνση web στο αρχείο PDF.

Βήμα 4

Υποβάλετε τη διεύθυνση του συνδέσμου στο Google Submit (δείτε Πόρους), ώστε να ευρετηριαστεί και να εμφανίζεται στα αποτελέσματα αναζήτησης Google (αυτό μπορεί να διαρκέσει μερικές ημέρες).

Βήμα 5

Βρείτε το αρχείο PDF στη μηχανή αναζήτησης Google πληκτρολογώντας τον ακριβή σύνδεσμο web προς το αρχείο PDF. Κάντε κλικ στην επιλογή για να το κατεβάσετε ως αρχείο HTML.

Βήμα 6

Αντιγράψτε και επικολλήστε το κείμενο από το αρχείο HTML στο Microsoft Word ή σε άλλο πρόγραμμα επεξεργασίας κειμένου για επεξεργασία.

Πράγματα που θα χρειαστείτε

  • Λογισμικό OCR

  • Ερευνητής

  • Λογισμικό επεξεργασίας εικόνας

  • Λογαριασμός φιλοξενίας Ιστού

Υπόδειξη

Ορισμένοι σαρωτές είναι ενσωματωμένοι με λογισμικό OCR για να μετατρέπουν αυτόματα τη σαρωμένη εικόνα σας σε επεξεργάσιμο αρχείο κειμένου.

Εάν θα χρειαστεί να μετατρέψετε πολλές σαρωμένες σελίδες σε κείμενο, επενδύστε σε έναν σαρωτή που διαθέτει αυτόματο τροφοδότη (παρόμοιο με έναν εκτυπωτή). Δείτε Πόρους για ένα παράδειγμα μιας από αυτές τις συσκευές.