სურათის კრედიტი: littlehenrabi/iStock/GettyImages
პორტატული დოკუმენტის ფორმატის (PDF) ფაილები შეგიძლიათ იხილოთ მთელ ინტერნეტში, რომლებიც გამოიყენება ყველაფრის გასავრცელებლად, კომპანიის ანგარიშებიდან საგადასახადო ფორმებამდე. მათი ჩვენება და დაბეჭდვა მარტივია ყველა სახის მოწყობილობაზე და გადაიცემა ინტერნეტით ან ელექტრონული ფოსტით. მაგრამ როდესაც საქმე ეხება გარკვეულ ოპერაციებს, განსაკუთრებით ცხრილების ოპერაციებს, PDF ფაილებთან მუშაობა შეიძლება რთული იყოს. საბედნიეროდ, არსებობს ინსტრუმენტები PDF ფაილებიდან მონაცემების გადასაყვანად ან მძიმით გამოყოფილი მნიშვნელობის ფორმატში, რომელიც გამოიყენება მრავალი ცხრილების პროგრამის მიერ, რომელიც ცნობილია როგორც CSV, ან Microsoft Excel ფაილებად.
გადაიყვანეთ PDF CSV-ში
თუ თქვენ მიიღებთ PDF-ს მონაცემებით ცხრილის ფორმატში, ხშირად მოგინდებათ ამ მონაცემებზე სხვადასხვა სახის ანალიზის გაშვება. შეიძლება დაგჭირდეთ ცხრილის ზოგიერთი სვეტის შეჯამება, ინფორმაციის შედარება თქვენს ხელთ არსებულ სხვა მონაცემებთან ან დახაზოთ ის სვეტების დიაგრამაზე ან ხაზოვან დიაგრამაზე.
დღის ვიდეო
სამწუხაროდ, ეს არ არის ადვილი ამის გაკეთება პირდაპირ PDF ფაილიდან. მაგრამ თუ PDF-ს გადააქცევთ CSV ფაილად, შეგიძლიათ მისი იმპორტი ელცხრილის ინსტრუმენტში, მონაცემთა ბაზის პროგრამაში ან მრავალი სხვა ანალიზის ინსტრუმენტში. არსებობს მთელი რიგი უფასო და ფასიანი ხელსაწყოები, რომლებიც ხელმისაწვდომია ონლაინ და ოფლაინში PDF-ში CSV კონვერტაციისთვის.
განიხილეთ ოპტიკური სიმბოლოების ამოცნობა
ზოგიერთ შემთხვევაში, განსაკუთრებით თუ PDF იქმნება სკანირებული დოკუმენტიდან, ის შეიძლება შეიცავდეს მხოლოდ ტექსტის სურათს და არა თავად დაუმუშავებელ სიმბოლოებს ისე, როგორც ეს კომპიუტერს შეუძლია. ამ შემთხვევაში, შეიძლება დაგჭირდეთ პროგრამის გაშვება სიმბოლოების ოპტიკური ამოცნობის (OCR) პროგრამის საშუალებით, რომელსაც შეუძლია ტექსტის ცალკეული სიტყვების ან რიცხვების სახით დამუშავება.
OCR პროგრამები არ არის სრულყოფილი, ამიტომ კარგი იდეაა ორჯერ შეამოწმოთ ნებისმიერი ტექსტი ან რიცხვი, რომელსაც ამოიღებთ PDF-დან ამ გზით.
გამოიყენეთ Adobe Acrobat
ერთ-ერთი ინსტრუმენტი, რომელსაც შეუძლია PDF ფაილების ცხრილებად გადაქცევა, არის Adobe Acrobat. Adobe არის კომპანია, რომელმაც შეიმუშავა PDF ფორმატის დიდი ნაწილი. შეგიძლიათ გახსნათ PDF ფაილი Acrobat-ის ფასიან ვერსიაში და გაიტანოთ ექსპორტი Microsoft Excel-ის ცხრილების ფაილში. თუ თქვენ გირჩევნიათ CSV, Excel ან სხვა ცხრილების პროგრამებს შეუძლიათ გახსნან ფაილი და შეინახონ როგორც CSV.
ფაილის კონვერტაციისთვის გახსენით ის Acrobat-ში და დააწკაპუნეთ "Export PDF". აირჩიეთ ელცხრილი და „Microsoft Excel სამუშაო წიგნი“, როგორც გამომავალი ფორმატი. დააჭირეთ "ექსპორტს" და აირჩიეთ სად შეინახოთ ფაილი. თუ PDF დასკანირებულია, Acrobat გაუშვებს OCR ტექნოლოგიას ტექსტის ამოსაღებად.
თქვენ უნდა გადაიხადოთ Acrobat-ის გამოსაყენებლად, თუმცა ხელმისაწვდომია უფასო საცდელი ვერსია.
არსებობს მთელი რიგი უფასო ონლაინ ხელსაწყოები, რომლებსაც შეუძლიათ PDF-ის გადაქცევა CSV-ში ან ცხრილების ფაილებად, მათ შორის, საჭიროების შემთხვევაში მათზე OCR პროგრამული უზრუნველყოფის გაშვება.
პროგრამა სახელად Convertio გადააქცევს PDF ფაილებს CSV ფაილებად. ბევრი კონვერტაცია უფასოა, მაგრამ შესაძლოა მოგიწიოთ გადახდა ისეთი სერვისებისთვის, როგორიცაა OCR ან დიდი ფაილების დამუშავება.
კიდევ ერთი ვარიანტია SodaPDF, რომელიც ხელმისაწვდომია უფასოდ და შეუძლია PDF-ების გარდაქმნა Excel ფაილებად, Microsoft Word ფორმატში ან Microsoft PowerPoint დოკუმენტებად. ის ხელმისაწვდომია უფასოდ ონლაინ, და შეგიძლიათ ატვირთოთ PDF და გადმოწეროთ მისი გენერირებული ფაილი კონვერტაციის პროცესის დასრულების შემდეგ.
ონლაინ ხელსაწყოს გამოყენების ერთი მინუსი არის ის, რომ თქვენ უნდა გაუზიაროთ ფაილი, რომელსაც აკონვერტირებთ, ვისაც ამუშავებს ინსტრუმენტი. თქვენ შეიძლება არ გინდოდეთ ამის გაკეთება, თუ დოკუმენტი კონფიდენციალურია.
ასევე არსებობს ინსტრუმენტები, რომლებიც შეგიძლიათ გამოიყენოთ ოფლაინში PDF ფაილების CSV ფაილად ან სხვა პოტენციურად მოსახერხებელ ფორმატებში გადასაყვანად.
ერთს ჰქვია Tabula და ის უფასოდ არის ხელმისაწვდომი Windows-ისთვის, Mac-ისთვის ან Linux-ისთვის. ის არ შეიცავს OCR შესაძლებლობას, ამიტომ ვერ იმუშავებს სკანირებულ PDF-ებთან, რომლებიც არ შეიცავს ჩაშენებულ ტექსტს.
ასევე არის ღია კოდის ინსტრუმენტი სახელწოდებით pdf2csv, რომელიც მუშაობს პითონის პროგრამირების ენაზე. ის ხელმისაწვდომია უფასოდ ღია კოდის პროგრამის GitHub საცავში.
თქვენ ასევე შეგიძლიათ გამოიყენოთ უფასო ინსტრუმენტი სახელწოდებით PDFMiner, რომელსაც შეუძლია PDF-ების ტექსტად გადაქცევა ან ინსტრუმენტი სახელწოდებით PDF2HTML გადააქცევს PDF-ს ჰიპერტექსტის მარკირების ენაზე ვებ გვერდის ფაილებს, რომელთა რედაქტირება შეგიძლიათ ტექსტის სახით ან ნახვა ინტერნეტში ბრაუზერი.