Resim Kredisi: Littlehenrabi/iStock/GettyImages
Şirket raporlarından vergi formlarına kadar her şeyi dağıtmak için kullanılan taşınabilir belge formatı (PDF) dosyaları internetin her yerinde bulunabilir. Her türlü cihazda görüntülenmesi ve yazdırılması ve Web veya e-posta yoluyla aktarılması kolaydır. Ancak belirli işlemler, özellikle elektronik tablo işlemleri söz konusu olduğunda, PDF'lerle çalışmak zor olabilir. Neyse ki, PDF'lerden verileri, CSV olarak bilinen birçok elektronik tablo programı tarafından kullanılabilen virgülle ayrılmış değer biçimine veya Microsoft Excel Dosyalarına dönüştürmek için araçlar var.
PDF'yi CSV'ye dönüştürün
Tablo biçiminde veriler içeren bir PDF alırsanız, genellikle bu veriler üzerinde çeşitli türlerde analizler yapmak isteyeceksiniz. Bir elektronik tablodaki bazı sütunları toplamak, bilgileri sahip olduğunuz diğer verilerle karşılaştırmak veya bir çubuk grafik veya çizgi grafiği üzerinde çizmek isteyebilirsiniz.
Günün Videosu
Ne yazık ki, bunu doğrudan bir PDF dosyasından yapmak kolay değil. Ancak PDF'yi bir CSV dosyasına dönüştürürseniz, onu bir elektronik tablo aracına, bir veritabanı programına veya diğer birçok analiz aracına aktarabilirsiniz. PDF'den CSV'ye dönüştürme için kullanılabilecek çevrimiçi ve çevrimdışı bir dizi ücretsiz ve ücretli araç vardır.
Optik Karakter Tanıma özelliğini düşünün
Bazı durumlarda, özellikle PDF taranmış bir belgeden oluşturulmuşsa, bilgisayarın anlayabileceği şekilde ham karakterleri değil, yalnızca metnin bir görüntüsünü içerebilir. Bu durumda, programı, metni tek tek kelime veya sayı olarak işleyebilen bir optik karakter tanıma (OCR) programı aracılığıyla çalıştırmanız gerekebilir.
OCR programları mükemmel değildir, bu nedenle bir PDF'den bu şekilde çıkardığınız metin veya sayıları iki kez kontrol etmek iyi bir fikirdir.
Adobe Acrobat'ı kullanın
PDF dosyalarını elektronik tablolara dönüştürebilen araçlardan biri Adobe Acrobat'tır. Adobe, PDF formatının çoğunu geliştiren şirkettir. Acrobat'ın ücretli sürümünde bir PDF dosyası açabilir ve bir Microsoft Excel elektronik tablo dosyasına aktarabilirsiniz. Bir CSV'yi tercih ederseniz, Excel veya diğer birçok elektronik tablo programı dosyayı açabilir ve CSV olarak kaydedebilir.
Bir dosyayı dönüştürmek için Acrobat'ta açın ve "PDF'yi Dışa Aktar"ı tıklayın. Çıktı formatı olarak hesap tablosunu ve "Microsoft Excel Çalışma Kitabı"nı seçin. "Dışa Aktar" ı tıklayın ve dosyayı nereye kaydedeceğinizi seçin. PDF taranırsa, Acrobat metni çıkarmak için OCR teknolojisini çalıştırır.
Acrobat'ı kullanmak için ödeme yapmanız gerekir, ancak ücretsiz deneme sürümü mevcuttur.
PDF'yi CSV'ye veya elektronik tablo dosyalarına dönüştürebilen, gerekirse üzerlerinde OCR yazılımı çalıştırmak da dahil olmak üzere bir dizi ücretsiz çevrimiçi araç vardır.
Convertio adlı bir program, PDF'leri CSV dosyalarına dönüştürecektir. Birçok dönüştürme ücretsizdir, ancak OCR veya büyük dosyaları işleme gibi hizmetler için ödeme yapmanız gerekebilir.
Başka bir seçenek de ücretsiz olarak sunulan ve PDF'leri Excel dosyalarına, Microsoft Word formatına veya Microsoft PowerPoint belgelerine dönüştürebilen SodaPDF'dir. Çevrimiçi olarak ücretsiz olarak kullanılabilir ve bir PDF yükleyebilir ve dönüştürme işlemini çalıştırdıktan sonra oluşturduğu dosyayı indirebilirsiniz.
Çevrimiçi bir araç kullanmanın bir dezavantajı, dönüştürdüğünüz dosyayı aracı kullanan kişiyle paylaşmanız gerektiğidir. Belge gizliyse bunu yapmak istemeyebilirsiniz.
Ayrıca, bir PDF'yi CSV dosyasına veya diğer olası uygun biçimlere dönüştürmek için çevrimdışı olarak kullanabileceğiniz araçlar da vardır.
Birinin adı Tabula ve Windows, Mac veya Linux için ücretsiz. OCR özelliği içermez, bu nedenle gömülü metin içermeyen taranmış PDF'lerle çalışamaz.
Python programlama diliyle çalışan pdf2csv adlı açık kaynaklı bir araç da var. Açık kaynaklı program deposu GitHub'da ücretsiz olarak mevcuttur.
PDF'leri metne dönüştürebilen PDFMiner adlı ücretsiz bir aracı veya PDF2HTML adlı bir aracı da kullanabilirsiniz. PDF'yi, metin olarak düzenleyebileceğiniz veya bir Web'de görüntüleyebileceğiniz Web sayfası dosyalarına köprü metni biçimlendirme diline dönüştürür tarayıcı.