Kuidas teisendada PDF-i CSV-vormingusse

Turundusmeeskond arutab uut tööplaani

Pildi krediit: littlehenrabi/iStock/GettyImages

Kaasaskantava dokumendivormingu (PDF) faile võib leida kõikjalt Internetist, mida kasutatakse kõige levitamiseks alates ettevõtte aruannetest kuni maksuvormideni. Neid on lihtne igasugustes seadmetes kuvada ja printida ning veebi või meili teel üle kanda. Kui aga rääkida teatud toimingutest, eriti arvutustabelitoimingutest, võib PDF-failidega töötamine olla keeruline. Õnneks on olemas tööriistad andmete teisendamiseks PDF-failidest komadega eraldatud väärtuste vormingusse, mida paljud arvutustabeliprogrammid kasutavad (nimega CSV), või Microsoft Exceli failidesse.

Teisendage PDF-fail CSV-vormingusse

Kui saate PDF-faili tabelivormingus andmetega, soovite sageli nende andmete kohta käitada mitmesuguseid analüüse. Võib-olla soovite mõned arvutustabeli veerud kokku võtta, võrrelda teavet teiste olemasolevate andmetega või joonistada selle tulpdiagrammile või joondiagrammile.

Päeva video

Kahjuks pole seda lihtne PDF-failist otse teha. Kui aga teisendate PDF-i CSV-failiks, saate selle importida arvutustabelitööriista, andmebaasiprogrammi või paljudesse muudesse analüüsitööriistadesse. PDF-vormingus CSV-vormingus teisendamiseks on Internetis ja võrguühenduseta saadaval mitmeid tasuta ja tasulisi tööriistu.

Kaaluge optilist märgituvastust

Mõnel juhul, eriti kui PDF on loodud skannitud dokumendist, võib see sisaldada ainult teksti kujutist, mitte toormärke endid viisil, millest arvuti aru saab. Sel juhul peate võib-olla käivitama programmi optilise märgituvastusprogrammi (OCR) kaudu, mis suudab teksti töödelda üksikute sõnade või numbritena.

OCR-programmid ei ole täiuslikud, seega on hea mõte veel kord kontrollida kõiki sel viisil PDF-failist eraldatud tekste või numbreid.

Kasutage Adobe Acrobati

Üks tööriist, mis saab PDF-faile arvutustabeliteks teisendada, on Adobe Acrobat. Adobe on ettevõte, kes töötas välja suure osa PDF-vormingust. PDF-faili saate avada Acrobati tasulises versioonis ja eksportida Microsoft Exceli tabelifaili. Kui eelistate CSV-vormingut, saate faili avada ja CSV-vormingus salvestada Excel või enamik muid arvutustabeliprogramme.

Faili teisendamiseks avage see Acrobatis ja klõpsake "Ekspordi PDF". Valige väljundvorminguks arvutustabel ja "Microsoft Exceli töövihik". Klõpsake "Ekspordi" ja valige, kuhu fail salvestada. Kui PDF on skannitud, kasutab Acrobat teksti eraldamiseks OCR-tehnoloogiat.

Acrobati kasutamise eest peate maksma, kuigi saadaval on tasuta prooviversioon.

On mitmeid tasuta võrgutööriistu, mis võivad teisendada PDF-i CSV-vormingusse või arvutustabelifailideks, sealhulgas vajadusel käitada neil OCR-tarkvara.

Programm nimega Convertio teisendab PDF-failid CSV-failideks. Paljud konversioonid on tasuta, kuid peate võib-olla maksma selliste teenuste eest nagu OCR või suurte failide töötlemine.

Teine võimalus on SodaPDF, mis on saadaval tasuta ja suudab teisendada PDF-faile Exceli failideks, Microsoft Wordi vorminguks või Microsoft PowerPointi dokumentideks. See on veebis tasuta saadaval ja saate pärast teisendusprotsessi käivitamist PDF-i üles laadida ja selle loodud faili alla laadida.

Veebitööriista kasutamise üks miinus on see, et peate teisendatavat faili jagama sellega, kes seda tööriista kasutab. Kui dokument on konfidentsiaalne, ei pruugi te seda teha.

Samuti on olemas tööriistad, mida saate võrguühenduseta kasutada PDF-i teisendamiseks CSV-failiks või muudesse potentsiaalselt mugavatesse vormingutesse.

Üks kannab nime Tabula ja see on Windowsi, Maci või Linuxi jaoks tasuta saadaval. See ei sisalda OCR-i võimalust, seega ei saa see töötada skannitud PDF-failidega, mis ei sisalda manustatud teksti.

Samuti on olemas avatud lähtekoodiga tööriist nimega pdf2csv, mis töötab Pythoni programmeerimiskeelega. See on tasuta saadaval avatud lähtekoodiga programmihoidlas GitHub.

Võite kasutada ka tasuta tööriista nimega PDFMiner, mis saab PDF-faile tekstiks teisendada, või tööriista nimega PDF2HTML, mis teisendab PDF-i hüperteksti märgistuskeeleks veebilehefailid, mida saate tekstina redigeerida või veebis vaadata brauser.