Vaizdo kreditas: littlehenrabi/iStock/GettyImages
Nešiojamų dokumentų formato (PDF) failus galima rasti visame internete, juos galima platinti nuo įmonės ataskaitų iki mokesčių formų. Juos lengva rodyti ir spausdinti įvairiuose įrenginiuose bei perkelti internetu arba el. paštu. Tačiau kai kalbama apie tam tikras operacijas, ypač skaičiuoklės operacijas, su PDF gali būti sunku dirbti. Laimei, yra įrankių, skirtų duomenims iš PDF konvertuoti į kableliais atskirtų reikšmių formatą, naudojamą daugelyje skaičiuoklių programų, žinomų kaip CSV, arba į „Microsoft Excel“ failus.
Konvertuoti PDF į CSV
Jei gaunate PDF failą su duomenimis lentelės formatu, dažnai norėsite atlikti įvairias šių duomenų analizes. Galbūt norėsite susumuoti kai kuriuos skaičiuoklės stulpelius, palyginti informaciją su kitais turimais duomenimis arba pavaizduoti juos juostinėje arba linijinėje diagramoje.
Dienos vaizdo įrašas
Deja, tai nėra lengva padaryti tiesiai iš PDF failo. Bet jei konvertuojate PDF į CSV failą, galite importuoti jį į skaičiuoklės įrankį, duomenų bazės programą ar daugelį kitų analizės įrankių. Yra daug nemokamų ir mokamų įrankių internete ir neprisijungus, kuriuos galima naudoti konvertuojant PDF į CSV.
Apsvarstykite optinį simbolių atpažinimą
Kai kuriais atvejais, ypač jei PDF yra sukurtas iš nuskaityto dokumento, jame gali būti tik teksto vaizdas, o ne patys neapdoroti simboliai taip, kad jį suprastų kompiuteris. Tokiu atveju gali tekti paleisti programą naudojant optinio simbolių atpažinimo (OCR) programą, kuri gali apdoroti tekstą kaip atskirus žodžius ar skaičius.
OCR programos nėra tobulos, todėl verta dar kartą patikrinti bet kokį tekstą ar skaičius, kuriuos tokiu būdu ištraukėte iš PDF.
Naudokite Adobe Acrobat
Vienas įrankis, galintis konvertuoti PDF failus į skaičiuokles, yra „Adobe Acrobat“. „Adobe“ yra įmonė, kuri sukūrė didžiąją dalį PDF formato. Galite atidaryti PDF failą mokamoje „Acrobat“ versijoje ir eksportuoti į „Microsoft Excel“ skaičiuoklės failą. Jei pageidaujate CSV, „Excel“ ar dauguma kitų skaičiuoklės programų gali atidaryti failą ir išsaugoti jį kaip CSV.
Norėdami konvertuoti failą, atidarykite jį „Acrobat“ ir spustelėkite „Eksportuoti PDF“. Kaip išvesties formatą pasirinkite skaičiuoklę ir „Microsoft Excel Workbook“. Spustelėkite „Eksportuoti“ ir pasirinkite, kur išsaugoti failą. Jei PDF nuskaitomas, Acrobat paleis OCR technologiją, kad ištrauktų tekstą.
Jūs turite mokėti, kad galėtumėte naudoti Acrobat, nors yra nemokama bandomoji versija.
Yra keletas nemokamų internetinių įrankių, kurie gali konvertuoti PDF į CSV arba į skaičiuoklės failus, įskaitant OCR programinės įrangos paleidimą, jei reikia.
Programa, pavadinta Convertio, konvertuos PDF failus į CSV failus. Daugelis konversijų yra nemokamos, tačiau gali tekti mokėti už tokias paslaugas kaip OCR arba didelių failų apdorojimas.
Kitas variantas yra SodaPDF, kuris yra prieinamas nemokamai ir gali konvertuoti PDF failus į Excel failus, Microsoft Word formatą arba Microsoft PowerPoint dokumentus. Jis pasiekiamas nemokamai internete. Galite įkelti PDF ir atsisiųsti failą, kurį jis sugeneruoja paleidus konvertavimo procesą.
Vienas internetinio įrankio naudojimo trūkumas yra tas, kad konvertuojamą failą turite bendrinti su įrankio naudotoju. Galbūt to nenorėsite daryti, jei dokumentas yra konfidencialus.
Taip pat yra įrankių, kuriuos galite naudoti neprisijungę norėdami konvertuoti PDF į CSV failą arba į kitus, galimai patogius formatus.
Vienas vadinamas „Tabula“ ir yra nemokamas „Windows“, „Mac“ ar „Linux“. Jame nėra OCR galimybės, todėl jis negali veikti su nuskaitytais PDF failais, kuriuose nėra įterpto teksto.
Taip pat yra atvirojo kodo įrankis, vadinamas pdf2csv, kuris veikia su Python programavimo kalba. Jį nemokamai galima rasti atvirojo kodo programų saugykloje „GitHub“.
Taip pat galite naudoti nemokamą įrankį PDFMiner, kuris gali konvertuoti PDF failus į tekstą, arba įrankį, vadinamą PDF2HTML, kuris konvertuos PDF į hiperteksto žymėjimo kalbą tinklalapio failus, kuriuos galėsite redaguoti kaip tekstą arba peržiūrėti žiniatinklyje naršyklė.