Kép jóváírása: littlehenrabi/iStock/GettyImages
A hordozható dokumentum formátumú (PDF) fájlok az egész interneten megtalálhatók, és a cégjelentésektől az adózási űrlapokig mindent terjesztenek. Könnyen megjeleníthetők és kinyomtathatók mindenféle eszközön, és átvihetők webes vagy e-mailben. De amikor bizonyos műveletekről van szó, különösen a táblázatkezelési műveletekről, a PDF-fájlok kezelése nehézkes lehet. Szerencsére léteznek olyan eszközök, amelyekkel a PDF-fájlokból adatokat konvertálhat a sok táblázatkezelő program által használható vesszővel elválasztott formátumba, vagy más néven CSV-fájlba, vagy Microsoft Excel-fájlokká.
PDF konvertálása CSV-vé
Ha olyan PDF-fájlt kap, amelyben táblázatos formátumú adatok vannak, akkor gyakran különféle elemzéseket kell futtatnia azokon az adatokon. Érdemes lehet összegezni a táblázat egyes oszlopait, összevetni az információkat más birtokában lévő adatokkal, vagy ábrázolni egy oszlopdiagramon vagy vonaldiagramon.
A nap videója
Sajnos ezt nem könnyű közvetlenül PDF fájlból megtenni. Ha azonban a PDF-fájlt CSV-fájllá alakítja, importálhatja azt egy táblázatkezelő eszközbe, egy adatbázis-programba vagy sok más elemző eszközbe. Számos ingyenes és fizetős eszköz áll rendelkezésre online és offline is a PDF-ből CSV-vé konvertáláshoz.
Fontolja meg az optikai karakterfelismerést
Egyes esetekben, különösen, ha a PDF-t beolvasott dokumentumból hozzák létre, előfordulhat, hogy csak a szöveg képét tartalmazza, magukat a nyers karaktereket nem olyan módon, ahogyan a számítógép megérti. Ebben az esetben előfordulhat, hogy a programot egy optikai karakterfelismerő (OCR) programon keresztül kell futtatnia, amely képes a szöveget egyedi szavakként vagy számokként feldolgozni.
Az OCR programok nem tökéletesek, ezért célszerű még egyszer ellenőrizni minden szöveget vagy számot, amelyet így kinyert a PDF-ből.
Használja az Adobe Acrobat programot
Az Adobe Acrobat az egyik eszköz, amellyel PDF-fájlokat táblázatokká konvertálhat. Az Adobe az a cég, amely a PDF formátum nagy részét fejlesztette ki. Megnyithat egy PDF-fájlt az Acrobat fizetős verziójában, és exportálhat egy Microsoft Excel-táblázatfájlba. Ha inkább CSV-t szeretne, az Excel vagy a legtöbb más táblázatkezelő program megnyithatja a fájlt, és CSV-ként mentheti.
A fájl konvertálásához nyissa meg az Acrobatban, és kattintson a „PDF exportálása” gombra. Válassza ki a táblázatot és a "Microsoft Excel-munkafüzet" kimeneti formátumot. Kattintson az "Exportálás" gombra, és válassza ki a fájl mentési helyét. Ha a PDF beolvasott, az Acrobat az OCR technológiát futtatja a szöveg kibontásához.
Az Acrobat használatáért fizetnie kell, bár ingyenes próbaverzió áll rendelkezésre.
Számos ingyenes online eszköz létezik, amelyekkel a PDF-t CSV-vé vagy táblázatkezelő fájlokká konvertálhatják, beleértve az OCR-szoftverek futtatását is, ha szükséges.
A Convertio nevű program a PDF-fájlokat CSV-fájlokká konvertálja. Sok konverzió ingyenes, de előfordulhat, hogy fizetnie kell az olyan szolgáltatásokért, mint az OCR vagy a nagy fájlok feldolgozása.
Egy másik lehetőség a SodaPDF, amely ingyenesen elérhető, és a PDF-eket Excel-, Microsoft Word- vagy Microsoft PowerPoint-dokumentummá tudja konvertálni. Ingyenesen elérhető online, és feltölthet egy PDF-fájlt, és letöltheti az általa generált fájlt, miután lefutotta a konvertálási folyamatot.
Az online eszköz használatának egyik hátránya, hogy a konvertált fájlt meg kell osztania azzal, aki az eszközt üzemelteti. Előfordulhat, hogy ezt nem kívánja megtenni, ha a dokumentum bizalmas.
Vannak olyan eszközök is, amelyeket offline is használhat a PDF-fájlok CSV-fájllá vagy más, potenciálisan kényelmes formátumba konvertálásához.
Az egyik a Tabula, és ingyenesen elérhető Windows, Mac vagy Linux rendszeren. Nem tartalmaz OCR képességet, így nem tud működni olyan beszkennelt PDF-ekkel, amelyek nem tartalmaznak beágyazott szöveget.
Van egy nyílt forráskódú eszköz is, a pdf2csv, amely a Python programozási nyelvvel működik. Ingyenesen elérhető a nyílt forráskódú GitHub programtárban.
Használhatja a PDFMiner nevű ingyenes eszközt is, amely PDF-eket szöveggé konvertál, vagy egy PDF2HTML nevű eszközt, amely A PDF-et hiperszöveges jelölőnyelvű weboldalakká konvertálja, amelyeket szövegként szerkeszthet vagy megtekinthet a weben böngésző.