Hvordan konvertere PDF til CSV

click fraud protection
Markedsteam diskuterer ny arbeidsplan

Bildekreditt: littlehenrabi/iStock/GettyImages

Portable Document Format (PDF)-filer kan finnes over hele internett, brukes til å distribuere alt fra selskapsrapporter til skatteskjemaer. De er enkle å vise og skrive ut på alle slags enheter og overføre via Internett eller e-post. Men når det gjelder visse operasjoner, spesielt regnearkoperasjoner, kan PDF-filer være vanskelige å jobbe med. Heldigvis finnes det verktøy for å konvertere data fra PDF-er til enten det kommadelte verdiformatet som kan brukes av mange regnearkprogrammer, kjent som CSV, eller til Microsoft Excel-filer.

Konverter en PDF til CSV

Hvis du mottar en PDF med data i et tabellformat, vil du ofte kjøre ulike typer analyser på disse dataene. Det kan være lurt å summere noen av kolonnene i et regneark, sammenligne informasjonen med andre data du har eller plotte den på et stolpediagram eller linjediagram.

Dagens video

Dessverre er det ikke lett å gjøre det direkte fra en PDF-fil. Men hvis du konverterer PDF-en til en CSV-fil, kan du importere den til et regnearkverktøy, et databaseprogram eller mange andre analyseverktøy. Det finnes en rekke gratis og betalte verktøy tilgjengelig online og offline for å bruke for PDF til CSV-konvertering.

Vurder optisk tegngjenkjenning

I noen tilfeller, spesielt hvis PDF-en er opprettet fra et skannet dokument, kan den bare inneholde et bilde av teksten, ikke selve råtegnene på en måte som en datamaskin kan forstå. I dette tilfellet må du kanskje kjøre programmet gjennom et optisk tegngjenkjenningsprogram (OCR) som kan behandle teksten som individuelle ord eller tall.

OCR-programmer er ikke perfekte, så det er en god idé å dobbeltsjekke tekst eller tall du trekker ut fra en PDF på denne måten.

Bruk Adobe Acrobat

Et verktøy som kan konvertere PDF-filer til regneark er Adobe Acrobat. Adobe er selskapet som utviklet mye av PDF-formatet. Du kan åpne en PDF-fil i den betalte versjonen av Acrobat og eksportere til en Microsoft Excel-regnearkfil. Hvis du foretrekker en CSV, kan Excel eller de fleste andre regnearkprogrammer åpne filen og lagre den som en CSV.

For å konvertere en fil, åpne den i Acrobat og klikk "Eksporter PDF". Velg regneark og "Microsoft Excel Workbook" som utdataformat. Klikk "Eksporter" og velg hvor du vil lagre filen. Hvis PDF-en skannes, vil Acrobat kjøre OCR-teknologi for å trekke ut teksten.

Du må betale for å bruke Acrobat, selv om det er en gratis prøveversjon tilgjengelig.

Det finnes en rekke gratis verktøy på nettet som kan konvertere PDF til CSV eller til regnearkfiler, inkludert å kjøre OCR-programvare på dem om nødvendig.

Et program kalt Convertio vil konvertere PDF-filer til CSV-filer. Mange konverteringer er gratis, men du må kanskje betale for tjenester som OCR eller behandling av store filer.

Et annet alternativ er SodaPDF, som er tilgjengelig gratis og kan konvertere PDF-filer til Excel-filer, Microsoft Word-format eller Microsoft PowerPoint-dokumenter. Den er tilgjengelig gratis på nettet, og du kan laste opp en PDF og laste ned filen den genererer etter at den har kjørt konverteringsprosessen.

En ulempe med å bruke et nettbasert verktøy er at du må dele filen du konverterer med den som bruker verktøyet. Du ønsker kanskje ikke å gjøre dette hvis dokumentet er konfidensielt.

Det finnes også verktøy som du kan bruke offline for å konvertere en PDF til en CSV-fil eller til andre, potensielt praktiske formater.

Den ene heter Tabula, og den er tilgjengelig gratis for Windows, Mac eller Linux. Den inkluderer ikke OCR-funksjon, så den kan ikke fungere med skannede PDF-filer som ikke inneholder innebygd tekst.

Det er også et åpen kildekodeverktøy kalt pdf2csv som fungerer med programmeringsspråket Python. Det er tilgjengelig gratis på åpen kildekode-programlageret GitHub.

Du kan også bruke et gratis verktøy kalt PDFMiner som kan konvertere PDF-filer til tekst eller et verktøy kalt PDF2HTML that vil konvertere PDF til hypertekst-markeringsspråk Nettsidefiler du kan redigere som tekst eller se på en web nettleser.