Come convertire PDF in CSV

click fraud protection
Team di marketing che discute il nuovo piano di lavoro

Credito immagine: littlehenrabi/iStock/GettyImages

I file in formato PDF (Portable Document Format) possono essere trovati ovunque su Internet, utilizzati per distribuire qualsiasi cosa, dai rapporti aziendali ai moduli fiscali. Sono facili da visualizzare e stampare su tutti i tipi di dispositivi e da trasferire via Web o e-mail. Ma quando si tratta di determinate operazioni, in particolare le operazioni sui fogli di calcolo, può essere difficile lavorare con i PDF. Fortunatamente, esistono strumenti per convertire i dati dai PDF nel formato con valori separati da virgole utilizzabile da molti programmi di fogli di calcolo, noti come CSV, o in file Microsoft Excel.

Converti un PDF in CSV

Se ricevi un PDF con dati in formato tabella, spesso vorrai eseguire vari tipi di analisi su quei dati. Potresti voler sommare alcune delle colonne in un foglio di calcolo, confrontare le informazioni con altri dati che hai o tracciarle su un grafico a barre o un grafico a linee.

Video del giorno

Sfortunatamente, non è facile farlo direttamente da un file PDF. Ma se converti il ​​PDF in un file CSV, puoi importarlo in uno strumento per fogli di calcolo, un programma di database o molti altri strumenti di analisi. Esistono numerosi strumenti gratuiti ea pagamento disponibili online e offline da utilizzare per la conversione da PDF a CSV.

Considera il riconoscimento ottico dei caratteri

In alcuni casi, specialmente se il PDF viene creato da un documento scansionato, può includere solo un'immagine del testo, non i caratteri grezzi stessi in un modo che un computer può comprendere. In questo caso, potrebbe essere necessario eseguire il programma tramite un programma di riconoscimento ottico dei caratteri (OCR) in grado di elaborare il testo come singole parole o numeri.

I programmi OCR non sono perfetti, quindi è una buona idea ricontrollare qualsiasi testo o numero estratto da un PDF in questo modo.

Usa Adobe Acrobat

Uno strumento in grado di convertire i file PDF in fogli di calcolo è Adobe Acrobat. Adobe è la società che ha sviluppato gran parte del formato PDF. Puoi aprire un file PDF nella versione a pagamento di Acrobat ed esportarlo in un file di foglio di calcolo Microsoft Excel. Se preferisci un CSV, Excel o la maggior parte degli altri programmi per fogli di calcolo puoi aprire il file e salvarlo come CSV.

Per convertire un file, aprilo in Acrobat e fai clic su "Esporta PDF". Scegli foglio di calcolo e "Cartella di lavoro Microsoft Excel" come formato di output. Fai clic su "Esporta" e scegli dove salvare il file. Se il PDF viene scansionato, Acrobat eseguirà la tecnologia OCR per estrarre il testo.

Devi pagare per usare Acrobat, anche se è disponibile una versione di prova gratuita.

Esistono numerosi strumenti online gratuiti in grado di convertire PDF in CSV o in file di fogli di calcolo, inclusa l'esecuzione di software OCR su di essi, se necessario.

Un programma chiamato Convertio convertirà i PDF in file CSV. Molte conversioni sono gratuite, ma potresti dover pagare per servizi come l'OCR o l'elaborazione di file di grandi dimensioni.

Un'altra opzione è SodaPDF, che è disponibile gratuitamente e può convertire i PDF in file Excel, formato Microsoft Word o documenti Microsoft PowerPoint. È disponibile gratuitamente online e puoi caricare un PDF e scaricare il file che genera dopo aver eseguito il processo di conversione.

Uno svantaggio dell'utilizzo di uno strumento online è che devi condividere il file che stai convertendo con chiunque utilizzi lo strumento. Potresti non volerlo fare se il documento è riservato.

Esistono anche strumenti che puoi utilizzare offline per convertire un PDF in un file CSV o in altri formati potenzialmente convenienti.

Uno si chiama Tabula ed è disponibile gratuitamente per Windows, Mac o Linux. Non include la funzionalità OCR, quindi non può funzionare con PDF scansionati che non contengono testo incorporato.

C'è anche uno strumento open source chiamato pdf2csv che funziona con il linguaggio di programmazione Python. È disponibile gratuitamente nel repository del programma open source GitHub.

Puoi anche utilizzare uno strumento gratuito chiamato PDFMiner che può convertire i PDF in testo o uno strumento chiamato PDF2HTML che convertirà il PDF in linguaggio di markup ipertestuale File di pagine Web che puoi modificare come testo o visualizzare in un Web browser.