Kuvan luotto: littlehenrabi/iStock/GettyImages
Portable document format (PDF) -tiedostoja löytyy kaikkialta Internetistä, ja niitä käytetään kaiken jakamiseen yritysraporteista verolomakkeisiin. Ne on helppo näyttää ja tulostaa kaikenlaisilla laitteilla ja siirtää Webin tai sähköpostin kautta. Mutta mitä tulee tiettyihin toimiin, erityisesti laskentataulukkotoimintoihin, PDF-tiedostojen käsittely voi olla vaikeaa. Onneksi on olemassa työkaluja, joilla PDF-tiedostot voidaan muuntaa joko pilkuilla eroteltuun muotoon, jota monet taulukkolaskentaohjelmat voivat käyttää, eli CSV-muodossa, tai Microsoft Excel -tiedostoiksi.
Muunna PDF CSV-muotoon
Jos saat PDF-tiedoston, jossa on tietoja taulukkomuodossa, haluat usein suorittaa erilaisia analyyseja tiedoista. Haluat ehkä summata joitakin laskentataulukon sarakkeita, verrata tietoja muihin tietoihisi tai piirtää ne pylväskaavioon tai viivakaavioon.
Päivän video
Valitettavasti se ei ole helppoa tehdä suoraan PDF-tiedostosta. Mutta jos muunnat PDF-tiedoston CSV-tiedostoksi, voit tuoda sen taulukkolaskentatyökaluun, tietokantaohjelmaan tai moniin muihin analyysityökaluihin. On olemassa useita ilmaisia ja maksullisia työkaluja, jotka ovat saatavilla verkossa ja offline-tilassa PDF-tiedostojen muuntamiseen CSV-muotoon.
Harkitse optista merkin tunnistusta
Joissakin tapauksissa, varsinkin jos PDF on luotu skannatusta asiakirjasta, se voi sisältää vain kuvan tekstistä, ei itse raakamerkkejä tavalla, jonka tietokone ymmärtää. Tässä tapauksessa saatat joutua suorittamaan ohjelman optisen merkintunnistusohjelman (OCR) kautta, joka voi käsitellä tekstin yksittäisinä sanoina tai numeroina.
OCR-ohjelmat eivät ole täydellisiä, joten on hyvä idea tarkistaa kaikki tekstit tai numerot, jotka poimit PDF-tiedostosta tällä tavalla.
Käytä Adobe Acrobatia
Yksi työkalu, joka voi muuntaa PDF-tiedostoja laskentataulukoiksi, on Adobe Acrobat. Adobe on yritys, joka on kehittänyt suuren osan PDF-muodosta. Voit avata PDF-tiedoston Acrobatin maksullisessa versiossa ja viedä sen Microsoft Excel -laskentataulukkotiedostoon. Jos haluat CSV-tiedoston, Excel tai useimmat muut taulukkolaskentaohjelmat voivat avata tiedoston ja tallentaa sen CSV-tiedostona.
Jos haluat muuntaa tiedoston, avaa se Acrobatissa ja napsauta "Vie PDF". Valitse tulostusmuodoksi laskentataulukko ja "Microsoft Excel Workbook". Napsauta "Vie" ja valitse tiedoston tallennuspaikka. Jos PDF skannataan, Acrobat käyttää OCR-tekniikkaa tekstin purkamiseksi.
Sinun on maksettava Acrobatin käyttämisestä, vaikka ilmainen kokeiluversio on saatavilla.
On olemassa useita ilmaisia verkkotyökaluja, jotka voivat muuntaa PDF-tiedoston CSV-muotoon tai laskentataulukkotiedostoiksi, mukaan lukien tarvittaessa OCR-ohjelmiston käyttäminen.
Convertio-niminen ohjelma muuntaa PDF-tiedostot CSV-tiedostoiksi. Monet muunnokset ovat ilmaisia, mutta saatat joutua maksamaan palveluista, kuten tekstintunnistusta tai suurten tiedostojen käsittelyä.
Toinen vaihtoehto on SodaPDF, joka on saatavilla ilmaiseksi ja joka voi muuntaa PDF-tiedostoja Excel-tiedostoiksi, Microsoft Word -muotoon tai Microsoft PowerPoint -asiakirjoiksi. Se on saatavilla ilmaiseksi verkossa, ja voit ladata PDF-tiedoston ja sen luoman tiedoston muunnosprosessin suorittamisen jälkeen.
Yksi verkkotyökalun käytön haittapuoli on, että sinun on jaettava muunnettava tiedosto työkalua käyttävien kanssa. Et ehkä halua tehdä tätä, jos asiakirja on luottamuksellinen.
On myös työkaluja, joita voit käyttää offline-tilassa PDF-tiedoston muuntamiseen CSV-tiedostoksi tai muihin, mahdollisesti käteviin muotoihin.
Yksi on nimeltään Tabula, ja se on saatavilla ilmaiseksi Windowsille, Macille tai Linuxille. Se ei sisällä OCR-ominaisuutta, joten se ei voi toimia skannattujen PDF-tiedostojen kanssa, jotka eivät sisällä upotettua tekstiä.
Siellä on myös avoimen lähdekoodin työkalu nimeltä pdf2csv, joka toimii Python-ohjelmointikielen kanssa. Se on saatavilla ilmaiseksi avoimen lähdekoodin ohjelmavarastosta GitHub.
Voit myös käyttää ilmaista PDFMiner-nimistä työkalua, joka voi muuntaa PDF-tiedostot tekstiksi, tai PDF2HTML-nimistä työkalua muuntaa PDF-tiedoston hypertekstimerkintäkieleksi Web-sivutiedostoiksi, joita voit muokata tekstinä tai katsella verkossa selain.