Kā konvertēt PDF uz OCR

...

Izvēlnes opcijas, lai izvēlētos OCR teksta atpazīšanu

Kad drukātais dokuments tiek skenēts un saglabāts PDF formātā, dators nezina atšķirību starp skenēto teksta lapu un fotoattēlu. Tādējādi lapā nevar meklēt vai atlasīt tekstu, ko kopēt un ielīmēt. Ja vēlaties meklēt vai atlasīt tekstu, dokumentā ir jāpalaiž optiskā rakstzīmju atpazīšana (OCR). Adobe Acrobat Professional nodrošina šo funkcionalitāti, bet bezmaksas Adobe Acrobat versija nenodrošina. Ja jums nav Acrobat Professional, lūdzu, ņemiet vērā, ka pastāv programmatūra, kas nav Acrobat Professional, lai palaistu OCR PDF dokumentā, un to var atrast, meklējot tīmeklī.

1. darbība

Lejupielādējiet programmu Adobe Acrobat Professional. Programmas Acrobat Professional OCR funkcija nav pieejama, izmantojot tīmekļa pārlūkprogrammas spraudni, tāpēc ir jāielādē faktiskā programma.

Dienas video

2. darbība

Ielādējiet PDF dokumentu ar tekstu, kuru nevar atlasīt kopēšanai un ielīmēšanai. Šādi dokumenti parasti tiek izgatavoti, skenējot dokumentu un saglabājot to Adobe Acrobat PDF formātā. (Ja vēlaties praktizēt ar dokumenta paraugu, skatiet resursus.)

3. darbība

...

Izvēlnes opcijas, lai izvēlētos OCR teksta atpazīšanu

Palaidiet OCR dokumentā. Programmā Adobe Acrobat Professional noklikšķiniet uz izvēlnes "Dokuments", pēc tam atlasiet "OCR teksta atpazīšana" un pēc tam noklikšķiniet uz "Atpazīt tekstu, izmantojot OCR".

4. darbība

...

OCR opcijas

Izvēlieties atbilstošās OCR opcijas. Kad noklikšķināsit uz "Atpazīt tekstu, izmantojot OCR", tiks parādīts jauns logs, kurā jums būs jāizvēlas lappušu diapazons, kurā vēlaties palaist OCR. Varat palaist OCR visā PDF failā vai arī varat ierobežot OCR atpazīšanu tikai uz dažām lapām. Kad esat izvēlējies, cik lapās vēlaties palaist OCR, noklikšķiniet uz Labi. Acrobat Professional tagad sāks atpazīt tekstu jūsu dokumenta lappusēs.

5. darbība

...

OCR: izveido meklējamu un atlasāmu PDF failu

Kad OCR ir pabeigta, meklējiet tekstu un kopējiet un ielīmējiet tekstu tāpat, kā to varētu izdarīt ar PDF failu, kas destilēts no Microsoft Word. Tomēr ņemiet vērā, ka OCR tehnoloģija nav ideāla. OCR var pareizi neatpazīt noteiktus vārdus un var palaist garām kādu tekstu. OCR vislabāk darbojas ar pilnīgi skaidriem teksta attēliem, kas ne vienmēr ir iespējams ar skenētiem dokumentiem.