Cara Mengonversi PDF ke CSV

Tim pemasaran mendiskusikan rencana kerja baru

Kredit Gambar: littlehenrabi/iStock/GettyImages

File format dokumen portabel (PDF) dapat ditemukan di seluruh internet, digunakan untuk mendistribusikan segala sesuatu mulai dari laporan perusahaan hingga formulir pajak. Mereka mudah untuk ditampilkan dan dicetak di semua jenis perangkat dan untuk ditransfer melalui Web atau email. Tetapi ketika menyangkut operasi tertentu, terutama operasi spreadsheet, PDF bisa jadi sulit untuk dikerjakan. Untungnya, ada alat untuk mengonversi data dari PDF menjadi format nilai yang dipisahkan koma yang dapat digunakan oleh banyak program spreadsheet, yang dikenal sebagai CSV, atau ke dalam File Microsoft Excel.

Konversi PDF ke CSV

Jika Anda menerima PDF dengan data dalam format tabel di dalamnya, Anda akan sering menjalankan berbagai jenis analisis pada data tersebut. Anda mungkin ingin menjumlahkan beberapa kolom dalam spreadsheet, membandingkan informasi dengan data lain yang Anda miliki atau memplotnya pada diagram batang atau grafik garis.

Video Hari Ini

Sayangnya, tidak mudah melakukannya langsung dari file PDF. Tetapi jika Anda mengonversi PDF ke file CSV, Anda dapat mengimpornya ke alat spreadsheet, program database, atau banyak alat analisis lainnya. Ada sejumlah alat gratis dan berbayar yang tersedia online dan offline untuk digunakan untuk konversi PDF ke CSV.

Pertimbangkan Pengenalan Karakter Optik

Dalam beberapa kasus, terutama jika PDF dibuat dari dokumen yang dipindai, mungkin hanya berisi gambar teks, bukan karakter mentah itu sendiri dengan cara yang dapat dipahami oleh komputer. Dalam hal ini, Anda mungkin perlu menjalankan program melalui program pengenalan karakter optik (OCR) yang dapat memproses teks sebagai kata atau angka individual.

Program OCR tidak sempurna, jadi sebaiknya periksa kembali teks atau angka yang Anda ekstrak dari PDF dengan cara ini.

Gunakan Adobe Acrobat

Salah satu alat yang dapat mengonversi file PDF ke spreadsheet adalah Adobe Acrobat. Adobe adalah perusahaan yang mengembangkan banyak format PDF. Anda dapat membuka file PDF dalam versi berbayar Acrobat dan mengekspor ke file spreadsheet Microsoft Excel. Jika Anda lebih suka CSV, Excel atau sebagian besar program spreadsheet lainnya dapat membuka file dan menyimpannya sebagai CSV.

Untuk mengonversi file, buka di Acrobat dan klik "Ekspor PDF." Pilih spreadsheet dan "Microsoft Excel Workbook" sebagai format output. Klik "Ekspor" dan pilih tempat untuk menyimpan file. Jika PDF dipindai, Acrobat akan menjalankan teknologi OCR untuk mengekstrak teks.

Anda harus membayar untuk menggunakan Acrobat, meskipun ada uji coba gratis yang tersedia.

Ada sejumlah alat online gratis yang dapat mengonversi PDF ke CSV atau ke file spreadsheet, termasuk menjalankan perangkat lunak OCR jika perlu.

Sebuah program bernama Convertio akan mengonversi PDF ke file CSV. Banyak konversi gratis, tetapi Anda mungkin harus membayar untuk layanan seperti OCR atau memproses file besar.

Pilihan lainnya adalah SodaPDF, yang tersedia secara gratis dan dapat mengonversi PDF menjadi file Excel, format Microsoft Word, atau dokumen Microsoft PowerPoint. Ini tersedia secara online gratis, dan Anda dapat mengunggah PDF dan mengunduh file yang dihasilkannya setelah menjalankan proses konversi.

Satu kelemahan menggunakan alat online adalah Anda harus membagikan file yang akan Anda konversi dengan siapa pun yang mengoperasikan alat tersebut. Anda mungkin tidak ingin melakukan ini jika dokumen tersebut bersifat rahasia.

Ada juga alat yang dapat Anda gunakan secara offline untuk mengonversi PDF ke file CSV atau ke format lain yang berpotensi nyaman.

Salah satunya disebut Tabula, dan tersedia gratis untuk Windows, Mac atau Linux. Itu tidak termasuk kemampuan OCR, sehingga tidak dapat bekerja dengan PDF yang dipindai yang tidak berisi teks yang disematkan.

Ada juga alat sumber terbuka yang disebut pdf2csv yang bekerja dengan bahasa pemrograman Python. Ini tersedia secara gratis di repositori program sumber terbuka GitHub.

Anda juga dapat menggunakan alat gratis bernama PDFMiner yang dapat mengonversi PDF menjadi teks atau alat bernama PDF2HTML yang akan mengonversi PDF ke bahasa markup hypertext file halaman Web yang dapat Anda edit sebagai teks atau lihat di Web peramban.