Sådan konverteres PDF til CSV

Marketingteam diskuterer ny arbejdsplan

Billedkredit: littlehenrabi/iStock/GettyImages

Filer i bærbart dokumentformat (PDF) kan findes overalt på internettet og bruges til at distribuere alt fra virksomhedsrapporter til skatteformularer. De er nemme at vise og udskrive på alle mulige enheder og overføre via internettet eller e-mail. Men når det kommer til visse operationer, især regnearksoperationer, kan PDF-filer være svære at arbejde med. Heldigvis er der værktøjer til at konvertere data fra PDF-filer til enten det kommaseparerede værdiformat, der kan bruges af mange regnearksprogrammer, kendt som CSV, eller til Microsoft Excel-filer.

Konverter en PDF til CSV

Hvis du modtager en PDF med data i et tabelformat, vil du ofte have lyst til at køre forskellige slags analyser på disse data. Du vil måske opsummere nogle af kolonnerne i et regneark, sammenligne oplysningerne med andre data, du har, eller plotte dem på et søjlediagram eller en linjegraf.

Dagens video

Desværre er det ikke nemt at gøre det direkte fra en PDF-fil. Men hvis du konverterer PDF'en til en CSV-fil, kan du importere den til et regnearksværktøj, et databaseprogram eller mange andre analyseværktøjer. Der er en række gratis og betalte værktøjer tilgængelige online og offline til brug for PDF til CSV-konvertering.

Overvej optisk tegngenkendelse

I nogle tilfælde, især hvis PDF'en er oprettet ud fra et scannet dokument, kan den kun indeholde et billede af teksten, ikke selve de rå tegn på en måde, som en computer kan forstå. I dette tilfælde skal du muligvis køre programmet gennem et optisk tegngenkendelsesprogram (OCR), der kan behandle teksten som individuelle ord eller tal.

OCR-programmer er ikke perfekte, så det er en god idé at dobbelttjekke tekst eller tal, du uddrager fra en PDF på denne måde.

Brug Adobe Acrobat

Et værktøj, der kan konvertere PDF-filer til regneark, er Adobe Acrobat. Adobe er virksomheden, der har udviklet meget af PDF-formatet. Du kan åbne en PDF-fil i den betalte version af Acrobat og eksportere til en Microsoft Excel-regnearksfil. Hvis du foretrækker en CSV, kan Excel eller de fleste andre regnearksprogrammer åbne filen og gemme den som en CSV.

For at konvertere en fil skal du åbne den i Acrobat og klikke på "Eksporter PDF". Vælg regneark og "Microsoft Excel Workbook" som outputformat. Klik på "Eksporter" og vælg, hvor du vil gemme filen. Hvis PDF'en scannes, kører Acrobat OCR-teknologi for at udtrække teksten.

Du skal betale for at bruge Acrobat, selvom der er en gratis prøveversion tilgængelig.

Der er en række gratis onlineværktøjer, der kan konvertere PDF til CSV eller til regnearksfiler, herunder at køre OCR-software på dem, hvis det er nødvendigt.

Et program kaldet Convertio vil konvertere PDF-filer til CSV-filer. Mange konverteringer er gratis, men du skal muligvis betale for tjenester som OCR eller behandling af store filer.

En anden mulighed er SodaPDF, som er tilgængelig gratis og kan konvertere PDF-filer til Excel-filer, Microsoft Word-format eller Microsoft PowerPoint-dokumenter. Den er tilgængelig gratis online, og du kan uploade en PDF og downloade den fil, den genererer, efter den har kørt konverteringsprocessen.

En ulempe ved at bruge et onlineværktøj er, at du skal dele den fil, du konverterer, med den, der betjener værktøjet. Du ønsker måske ikke at gøre dette, hvis dokumentet er fortroligt.

Der er også værktøjer, som du kan bruge offline til at konvertere en PDF til en CSV-fil eller til andre potentielt praktiske formater.

Den ene hedder Tabula, og den er tilgængelig gratis til Windows, Mac eller Linux. Det inkluderer ikke OCR-funktion, så det kan ikke fungere med scannede PDF'er, der ikke indeholder indlejret tekst.

Der er også et open source-værktøj kaldet pdf2csv, der fungerer med programmeringssproget Python. Det er tilgængeligt gratis på open source-programlageret GitHub.

Du kan også bruge et gratis værktøj kaldet PDFMiner, der kan konvertere PDF'er til tekst eller et værktøj kaldet PDF2HTML that vil konvertere PDF til hypertekst-markeringssprog Websidefiler, du kan redigere som tekst eller se på et web browser.