Dokumenti skannimine ja teksti redigeerimine

Oletame, et teil on palju kirjalikke märkmeid, mida soovite arvutifaili teisaldada ja aeg-ajalt redigeerida. Andmete käsitsi sisestamiseks võite võtta aega, kuid on palju kiirem meetod. Saate dokumendi skannida ja lasta sõnad automaatselt arvutitähtedeks ja redigeeritavateks sõnadeks teisendada. Selleks vajate optilise märgituvastuse (OCR) tarkvara.

OCR-tarkvara kasutamine skanneriga

Samm 1

Avage OCR-tarkvaraprogramm, et see oleks valmis äsja skannitud faile vastu võtma.

Päeva video

2. samm

Skannige oma dokument arvutisse. Veenduge, et skannitav leht oleks võimalikult selge ja tumeda tindiga, et skanner saaks iga sõna üles võtta. Kui tükk on kirjutatud käsitsi, mitte trükitud, tuleks sõnad trükkida (kirjutada eraldi, ühendamata tähed), kui see on vähegi võimalik, on paljudel OCR-programmidel raske skripti (kursiivset) käekirja dešifreerida.

3. samm

Valige soovitud väljundsuvand (nt RTF, Word, PowerPoint, Excel, Text või PDF), laske OCR-programmil teisendada ja seejärel salvestage teisendatud fail kõvakettale.

4. samm

Käivitage äsja teisendatud faili tekstitöötlusprogramm. Avage fail ja redigeerige dokumenti. Olenevalt skannimise ja OCR-tarkvara kvaliteedist peate võib-olla tegema ulatuslikke redigeerimisi (näiteks "ri" võib olla ekslikult tõlgitud kui "n"). Hoidke muutmise ajal õigekirjakontroll sisse lülitatud, et kõik vead tuvastada.

Google'i viis

Samm 1

Google'il on ka sisseehitatud OCR-süsteem. Kui leiate Google'i otsingumootorist veebisaidi, mis on otse lingitud PDF-failiga, on teil võimalus lugeda seda PDF-vormingus või HTML-vormingus (tekst). Alustamiseks skannige oma dokument.

2. samm

Teisendage dokument PDF-iks. Saate seda teha, salvestades pildi lihtsalt PDF-failina oma pilditöötlustarkvarasse (nt Adobe Photoshop). Või OSX-iga Macis klõpsake "Prindi" ja klõpsake nuppu "Salvesta PDF-ina".

3. samm

Laadige PDF-fail üles oma veebisaidi hostimise kontole (või võite kasutada tasuta veebisaidi hostimisteenust, näiteks Geocities) ja muutke fail avalikuks. Pange tähele PDF-faili täpset veebiaadressi.

4. samm

Esitage lingi aadress teenusesse Google Submit (vt jaotist Ressursid), et see indekseeritaks ja kuvatakse Google'i otsingutulemustes (selleks võib kuluda paar päeva).

5. samm

Leidke oma PDF-fail Google'i otsingumootorist, sisestades selle PDF-faili täpse veebilingi. Selle HTML-failina allalaadimiseks klõpsake valikul.

6. samm

Kopeerige ja kleepige HTML-failist tekst redigeerimiseks Microsoft Wordi või mõnda teise tekstitöötlusprogrammi.

Asjad, mida vajate

  • OCR tarkvara

  • Skänner

  • Pilditöötlustarkvara

  • Veebimajutuskonto

Näpunäide

Mõned skannerid on sisseehitatud OCR-tarkvaraga, mis teisendab teie skannitud pildi automaatselt redigeeritavaks tekstifailiks.

Kui teil on vaja palju skannitud lehti tekstiks teisendada, investeerige skannerisse, millel on automaatne söötja (sarnane printerile). Ühe sellise seadme näite leiate ressurssidest.