Attēla kredīts: littlehenrabi/iStock/GettyImages
Portatīvo dokumentu formāta (PDF) failus var atrast visā internetā, ko izmanto, lai izplatītu visu, sākot no uzņēmuma pārskatiem līdz nodokļu veidlapām. Tos ir viegli parādīt un drukāt uz visu veidu ierīcēm, kā arī pārsūtīt pa tīmekli vai e-pastu. Bet, runājot par noteiktām darbībām, īpaši izklājlapu darbībām, PDF var būt grūti strādāt. Par laimi, ir rīki, kas ļauj konvertēt datus no PDF failiem vai nu komatu atdalītu vērtību formātā, ko var izmantot daudzās izklājlapu programmās, kas pazīstamas kā CSV, vai Microsoft Excel failos.
Konvertējiet PDF failu uz CSV
Ja saņemat PDF failu ar datiem tabulas formātā, bieži vien vēlēsities veikt dažāda veida šo datu analīzi. Iespējams, vēlēsities summēt dažas izklājlapas kolonnas, salīdzināt informāciju ar citiem jūsu rīcībā esošajiem datiem vai attēlot to joslu diagrammā vai līniju diagrammā.
Dienas video
Diemžēl to nav viegli izdarīt tieši no PDF faila. Bet, ja PDF failu konvertējat par CSV failu, varat to importēt izklājlapu rīkā, datu bāzes programmā vai daudzos citos analīzes rīkos. Tiešsaistē un bezsaistē ir pieejami vairāki bezmaksas un maksas rīki, ko izmantot PDF konvertēšanai uz CSV.
Apsveriet optisko rakstzīmju atpazīšanu
Dažos gadījumos, īpaši, ja PDF ir izveidots no skenēta dokumenta, tajā var būt ietverts tikai teksta attēls, nevis pašas neapstrādātas rakstzīmes tādā veidā, kā to var saprast dators. Šādā gadījumā programma var būt jāpalaiž, izmantojot optiskās rakstzīmju atpazīšanas (OCR) programmu, kas var apstrādāt tekstu kā atsevišķus vārdus vai ciparus.
OCR programmas nav ideālas, tāpēc ir ieteicams vēlreiz pārbaudīt jebkuru tekstu vai skaitļus, ko šādā veidā izvelkat no PDF.
Izmantojiet programmu Adobe Acrobat
Viens rīks, kas var pārvērst PDF failus izklājlapās, ir Adobe Acrobat. Adobe ir uzņēmums, kas izstrādāja lielu daļu PDF formāta. Varat atvērt PDF failu Acrobat maksas versijā un eksportēt to uz Microsoft Excel izklājlapas failu. Ja vēlaties CSV, Excel vai lielākā daļa citu izklājlapu programmu var atvērt failu un saglabāt to kā CSV.
Lai konvertētu failu, atveriet to programmā Acrobat un noklikšķiniet uz "Eksportēt PDF". Izvēlieties izklājlapu un "Microsoft Excel darbgrāmatu" kā izvades formātu. Noklikšķiniet uz "Eksportēt" un izvēlieties, kur saglabāt failu. Ja PDF fails tiek skenēts, programma Acrobat izmantos OCR tehnoloģiju, lai izvilktu tekstu.
Lai izmantotu Acrobat, jums ir jāmaksā, lai gan ir pieejama bezmaksas izmēģinājuma versija.
Ir vairāki bezmaksas tiešsaistes rīki, kas var pārvērst PDF par CSV vai izklājlapu failiem, tostarp vajadzības gadījumā palaist tajos OCR programmatūru.
Programma ar nosaukumu Convertio pārveidos PDF failus CSV failos. Daudzi reklāmguvumi ir bezmaksas, taču, iespējams, jums būs jāmaksā par tādiem pakalpojumiem kā OCR vai lielu failu apstrādi.
Vēl viena iespēja ir SodaPDF, kas ir pieejama bez maksas un var pārvērst PDF failus Excel failos, Microsoft Word formātā vai Microsoft PowerPoint dokumentos. Tas ir pieejams bez maksas tiešsaistē, un jūs varat augšupielādēt PDF failu un lejupielādēt failu, ko tas ģenerē pēc konvertēšanas procesa.
Viens no tiešsaistes rīka izmantošanas trūkumiem ir tas, ka konvertējamais fails ir jākopīgo ar rīka lietotāju. Jūs, iespējams, nevēlaties to darīt, ja dokuments ir konfidenciāls.
Ir arī rīki, kurus varat izmantot bezsaistē, lai PDF failu pārvērstu CSV failā vai citos, iespējams, ērtos formātos.
Vienu sauc par Tabula, un tas ir pieejams bez maksas operētājsistēmām Windows, Mac vai Linux. Tas neietver OCR iespēju, tāpēc tas nevar darboties ar skenētiem PDF failiem, kuros nav iegulta teksta.
Ir arī atvērtā pirmkoda rīks pdf2csv, kas darbojas ar Python programmēšanas valodu. Tas ir bez maksas pieejams atvērtā pirmkoda programmu repozitorijā GitHub.
Varat arī izmantot bezmaksas rīku PDFMiner, kas var pārvērst PDF failus tekstā, vai rīku PDF2HTML, kas pārveidos PDF par hiperteksta iezīmēšanas valodu Web lapu failus, kurus varat rediģēt kā tekstu vai skatīt tīmeklī pārlūkprogramma.