Hur man konverterar PDF till CSV

Marknadsteam diskuterar ny arbetsplan

Bildkredit: littlehenrabi/iStock/GettyImages

Filer i portabla dokumentformat (PDF) finns över hela internet och används för att distribuera allt från företagsrapporter till skatteformulär. De är lätta att visa och skriva ut på alla typer av enheter och att överföra via webben eller e-post. Men när det kommer till vissa operationer, särskilt kalkylbladsoperationer, kan PDF-filer vara svåra att arbeta med. Lyckligtvis finns det verktyg för att konvertera data från PDF-filer till antingen det kommaseparerade värdeformatet som kan användas av många kalkylarksprogram, så kallade CSV, eller till Microsoft Excel-filer.

Konvertera en PDF till CSV

Om du får en PDF med data i ett tabellformat i den vill du ofta köra olika typer av analyser på dessa data. Du kanske vill summera några av kolumnerna i ett kalkylblad, jämföra informationen med annan data du har eller rita upp den på ett stapeldiagram eller ett linjediagram.

Dagens video

Tyvärr är det inte lätt att göra det direkt från en PDF-fil. Men om du konverterar PDF-filen till en CSV-fil kan du importera den till ett kalkylarksverktyg, ett databasprogram eller många andra analysverktyg. Det finns ett antal gratis och betalda verktyg tillgängliga online och offline att använda för PDF till CSV-konvertering.

Överväg optisk teckenigenkänning

I vissa fall, särskilt om PDF-filen skapas från ett skannat dokument, kan den bara innehålla en bild av texten, inte själva de råa tecknen på ett sätt som en dator kan förstå. I det här fallet kan du behöva köra programmet genom ett optisk teckenigenkänningsprogram (OCR) som kan bearbeta texten som enskilda ord eller siffror.

OCR-program är inte perfekta, så det är en bra idé att dubbelkolla all text eller siffror som du extraherar från en PDF på detta sätt.

Använd Adobe Acrobat

Ett verktyg som kan konvertera PDF-filer till kalkylblad är Adobe Acrobat. Adobe är företaget som utvecklat mycket av PDF-formatet. Du kan öppna en PDF-fil i den betalda versionen av Acrobat och exportera till en Microsoft Excel-kalkylarksfil. Om du föredrar en CSV, kan Excel eller de flesta andra kalkylprogram öppna filen och spara den som en CSV.

För att konvertera en fil, öppna den i Acrobat och klicka på "Exportera PDF". Välj kalkylblad och "Microsoft Excel Workbook" som utdataformat. Klicka på "Exportera" och välj var du vill spara filen. Om PDF-filen skannas kommer Acrobat att köra OCR-teknik för att extrahera texten.

Du måste betala för att använda Acrobat, även om det finns en gratis provperiod tillgänglig.

Det finns ett antal gratis onlineverktyg som kan konvertera PDF till CSV eller till kalkylarksfiler, inklusive att köra OCR-programvara på dem om det behövs.

Ett program som heter Convertio kommer att konvertera PDF-filer till CSV-filer. Många konverteringar är gratis, men du kan behöva betala för tjänster som OCR eller bearbetning av stora filer.

Ett annat alternativ är SodaPDF, som är tillgängligt gratis och kan konvertera PDF-filer till Excel-filer, Microsoft Word-format eller Microsoft PowerPoint-dokument. Den är tillgänglig gratis online, och du kan ladda upp en PDF och ladda ner filen den genererar efter att den kört konverteringsprocessen.

En nackdel med att använda ett onlineverktyg är att du måste dela filen du konverterar med den som använder verktyget. Du kanske inte vill göra detta om dokumentet är konfidentiellt.

Det finns också verktyg som du kan använda offline för att konvertera en PDF till en CSV-fil eller till andra, potentiellt bekväma format.

En heter Tabula, och den är tillgänglig gratis för Windows, Mac eller Linux. Det inkluderar inte OCR-kapacitet, så det kan inte fungera med skannade PDF-filer som inte innehåller inbäddad text.

Det finns också ett verktyg med öppen källkod som heter pdf2csv som fungerar med programmeringsspråket Python. Det är tillgängligt gratis på programförrådet GitHub med öppen källkod.

Du kan också använda ett gratis verktyg som heter PDFMiner som kan konvertera PDF-filer till text eller ett verktyg som heter PDF2HTML that kommer att konvertera PDF till hypertextmarkeringsspråk webbsidefiler som du kan redigera som text eller visa på en webb webbläsare.