كيفية تحويل ملفات PDF إلى CSV

فريق التسويق يناقش خطة عمل جديدة

حقوق الصورة: littlehenrabi / iStock / GettyImages

يمكن العثور على ملفات تنسيق المستندات المحمولة (PDF) في جميع أنحاء الإنترنت ، وتستخدم لتوزيع كل شيء من تقارير الشركة إلى النماذج الضريبية. من السهل عرضها وطباعتها على جميع أنواع الأجهزة ونقلها عبر الويب أو البريد الإلكتروني. ولكن عندما يتعلق الأمر بعمليات معينة ، خاصة عمليات جداول البيانات ، فقد يصعب التعامل مع ملفات PDF. لحسن الحظ ، هناك أدوات لتحويل البيانات من ملفات PDF إلى تنسيق قيمة مفصولة بفاصلة يمكن استخدامه بواسطة العديد من برامج جداول البيانات ، المعروفة باسم CSV ، أو إلى ملفات Microsoft Excel.

قم بتحويل ملف PDF إلى CSV

إذا تلقيت ملف PDF يحتوي على بيانات بتنسيق جدول بداخله ، فغالبًا ما ترغب في تشغيل أنواع مختلفة من التحليلات على تلك البيانات. قد ترغب في جمع بعض الأعمدة في جدول بيانات ، أو مقارنة المعلومات ببيانات أخرى لديك أو رسمها على مخطط شريطي أو رسم بياني خطي.

فيديو اليوم

لسوء الحظ ، ليس من السهل القيام بذلك مباشرة من ملف PDF. ولكن إذا قمت بتحويل ملف PDF إلى ملف CSV ، فيمكنك استيراده إلى أداة جدول بيانات أو برنامج قاعدة بيانات أو العديد من أدوات التحليل الأخرى. هناك عدد من الأدوات المجانية والمدفوعة المتاحة عبر الإنترنت وفي وضع عدم الاتصال لاستخدامها في تحويل PDF إلى CSV.

ضع في اعتبارك التعرف الضوئي على الأحرف

في بعض الحالات ، خاصةً إذا تم إنشاء ملف PDF من مستند ممسوح ضوئيًا ، فقد يتضمن فقط صورة للنص ، وليس الأحرف الأولية نفسها بطريقة يمكن للكمبيوتر فهمها. في هذه الحالة ، قد تحتاج إلى تشغيل البرنامج من خلال برنامج التعرف الضوئي على الأحرف (OCR) الذي يمكنه معالجة النص ككلمات أو أرقام فردية.

برامج التعرف الضوئي على الحروف ليست مثالية ، لذلك من الجيد إعادة التحقق من أي نص أو أرقام تستخرجها من ملف PDF بهذه الطريقة.

استخدم Adobe Acrobat

يعد Adobe Acrobat أحد الأدوات التي يمكنها تحويل ملفات PDF إلى جداول بيانات. Adobe هي الشركة التي طورت الكثير من تنسيق PDF. يمكنك فتح ملف PDF في الإصدار المدفوع من Acrobat وتصديره إلى ملف جدول بيانات Microsoft Excel. إذا كنت تفضل ملف CSV أو Excel أو معظم برامج جداول البيانات الأخرى ، فيمكنك فتح الملف وحفظه كملف CSV.

لتحويل ملف ، افتحه في Acrobat وانقر على "تصدير PDF". اختر جدول بيانات و "مصنف Microsoft Excel" كتنسيق الإخراج. انقر على "تصدير" واختر مكان حفظ الملف. إذا تم مسح ملف PDF ضوئيًا ، فسيقوم Acrobat بتشغيل تقنية OCR لاستخراج النص.

عليك أن تدفع مقابل استخدام Acrobat ، على الرغم من توفر نسخة تجريبية مجانية.

هناك عدد من الأدوات المجانية عبر الإنترنت التي يمكنها تحويل ملفات PDF إلى CSV أو إلى ملفات جداول بيانات ، بما في ذلك تشغيل برنامج OCR عليها إذا لزم الأمر.

سيقوم برنامج يسمى Convertio بتحويل ملفات PDF إلى ملفات CSV. العديد من التحويلات مجانية ، ولكن قد تضطر إلى الدفع مقابل خدمات مثل OCR أو معالجة الملفات الكبيرة.

خيار آخر هو SodaPDF ، وهو متاح مجانًا ويمكنه تحويل ملفات PDF إلى ملفات Excel أو تنسيق Microsoft Word أو مستندات Microsoft PowerPoint. إنه متاح مجانًا عبر الإنترنت ، ويمكنك تحميل ملف PDF وتنزيل الملف الذي ينشئه بعد تشغيل عملية التحويل.

أحد الجوانب السلبية لاستخدام أداة عبر الإنترنت هو أنه يجب عليك مشاركة الملف الذي تقوم بتحويله مع أي شخص يقوم بتشغيل الأداة. قد لا ترغب في القيام بذلك إذا كانت الوثيقة سرية.

هناك أيضًا أدوات يمكنك استخدامها في وضع عدم الاتصال لتحويل ملف PDF إلى ملف CSV أو إلى تنسيقات أخرى قد تكون مناسبة.

أحدهما يسمى Tabula ، وهو متاح مجانًا لنظام التشغيل Windows أو Mac أو Linux. لا يتضمن إمكانية التعرف الضوئي على الحروف ، لذلك لا يمكنه العمل مع ملفات PDF الممسوحة ضوئيًا التي لا تحتوي على نص مضمّن.

هناك أيضًا أداة مفتوحة المصدر تسمى pdf2csv تعمل مع لغة برمجة Python. إنه متاح مجانًا في مستودع البرامج مفتوح المصدر GitHub.

يمكنك أيضًا استخدام أداة مجانية تسمى PDFMiner يمكنها تحويل ملفات PDF إلى نص أو أداة تسمى PDF2HTML سيقوم بتحويل PDF إلى ملفات صفحات الويب التي يمكنك تحريرها كنص أو عرضها على الويب المتصفح.