קרדיט תמונה: littlehenrabi/iStock/GettyImages
ניתן למצוא קבצי פורמט מסמכים ניידים (PDF) בכל רחבי האינטרנט, המשמשים להפצת כל דבר, החל מדוחות חברה ועד לטפסי מס. קל להציג ולהדפיס אותם בכל מיני מכשירים ולהעברה באמצעות אינטרנט או דואר אלקטרוני. אבל כשמדובר בפעולות מסוימות, במיוחד פעולות בגיליון אלקטרוני, קובצי PDF יכולים להיות קשים לעבודה. למרבה המזל, ישנם כלים להמרת נתונים מקובצי PDF לפורמט הערכים המופרדים בפסיקים שניתן להשתמש בו על ידי תוכניות גיליונות אלקטרוניים רבות, הידועות כ-CSV, או לקבצי Microsoft Excel.
המרת PDF ל-CSV
אם אתה מקבל PDF עם נתונים בפורמט טבלה, לעתים קרובות תרצה להפעיל סוגים שונים של ניתוחים על הנתונים האלה. אולי תרצה לסכם חלק מהעמודות בגיליון אלקטרוני, להשוות את המידע לנתונים אחרים שיש לך או לשרטט אותו על תרשים עמודות או גרף קווים.
סרטון היום
למרבה הצער, לא קל לעשות זאת ישירות מקובץ PDF. אבל אם אתה ממיר את ה-PDF לקובץ CSV, אתה יכול לייבא אותו לכלי גיליון אלקטרוני, תוכנית מסד נתונים או כלי ניתוח רבים אחרים. ישנם מספר כלים חינמיים ותשלום זמינים באופן מקוון ולא מקוון לשימוש להמרת PDF ל-CSV.
שקול זיהוי תווים אופטי
במקרים מסוימים, במיוחד אם ה-PDF נוצר ממסמך סרוק, הוא עשוי לכלול רק תמונה של הטקסט, לא את התווים הגולמיים עצמם באופן שמחשב יכול להבין. במקרה זה, ייתכן שיהיה עליך להפעיל את התוכנית באמצעות תוכנית זיהוי תווים אופטי (OCR) שיכולה לעבד את הטקסט כמילים או מספרים בודדים.
תוכניות OCR אינן מושלמות, לכן מומלץ לבדוק שוב כל טקסט או מספרים שאתה מחלץ מקובץ PDF בדרך זו.
השתמש ב-Adobe Acrobat
כלי אחד שיכול להמיר קבצי PDF לגיליונות אלקטרוניים הוא Adobe Acrobat. אדובי היא החברה שפיתחה חלק גדול מפורמט ה-PDF. ניתן לפתוח קובץ PDF בגרסה בתשלום של Acrobat ולייצא לקובץ גיליון אלקטרוני של Microsoft Excel. אם אתה מעדיף CSV, Excel או רוב תוכניות הגיליון האלקטרוני האחרות יכולות לפתוח את הקובץ ולשמור אותו כ-CSV.
כדי להמיר קובץ, פתח אותו ב-Acrobat ולחץ על "ייצא PDF". בחר גיליון אלקטרוני ו"חוברת עבודה של Microsoft Excel" כפורמט הפלט. לחץ על "ייצוא" ובחר היכן לשמור את הקובץ. אם ה-PDF נסרק, Acrobat תפעיל את טכנולוגיית OCR כדי לחלץ את הטקסט.
אתה צריך לשלם כדי להשתמש ב-Acrobat, אם כי יש גרסת ניסיון בחינם זמינה.
ישנם מספר כלים מקוונים בחינם שיכולים להמיר PDF ל-CSV או לקבצי גיליונות אלקטרוניים, כולל הפעלת תוכנת OCR עליהם במידת הצורך.
תוכנית בשם Convertio תמיר קובצי PDF לקבצי CSV. המרות רבות הן בחינם, אך ייתכן שתצטרך לשלם עבור שירותים כמו OCR או עיבוד קבצים גדולים.
אפשרות נוספת היא SodaPDF, הזמינה בחינם ויכולה להמיר קובצי PDF לקבצי אקסל, פורמט Microsoft Word או מסמכי Microsoft PowerPoint. זה זמין בחינם באינטרנט, ואתה יכול להעלות קובץ PDF ולהוריד את הקובץ שהוא יוצר לאחר הפעלת תהליך ההמרה.
חסרון אחד בשימוש בכלי מקוון הוא שעליך לשתף את הקובץ שאתה ממיר עם מי שמפעיל את הכלי. ייתכן שלא תרצה לעשות זאת אם המסמך חסוי.
ישנם גם כלים שבהם אתה יכול להשתמש במצב לא מקוון כדי להמיר PDF לקובץ CSV או לפורמטים אחרים, שעלולים להיות נוחים.
אחד מהם נקרא Tabula, והוא זמין בחינם עבור Windows, Mac או Linux. הוא אינו כולל יכולת OCR, כך שהוא לא יכול לעבוד עם קובצי PDF סרוקים שאינם מכילים טקסט מוטבע.
יש גם כלי קוד פתוח בשם pdf2csv שעובד עם שפת התכנות Python. זה זמין בחינם במאגר התוכנית הפתוח GitHub.
אתה יכול גם להשתמש בכלי חינמי בשם PDFMiner שיכול להמיר קובצי PDF לטקסט או בכלי שנקרא PDF2HTML that ימיר PDF לשפת סימון היפר-טקסט קבצי דפי אינטרנט שתוכל לערוך כטקסט או להציג ברשת דפדפן.