PDF को CSV में कैसे बदलें

नई कार्य योजना पर चर्चा करने वाली मार्केटिंग टीम

छवि क्रेडिट: Littlehenrabi/iStock/GettyImages

पोर्टेबल दस्तावेज़ प्रारूप (पीडीएफ) फाइलें पूरे इंटरनेट पर पाई जा सकती हैं, जिनका उपयोग कंपनी की रिपोर्ट से लेकर टैक्स फॉर्म तक सब कुछ वितरित करने के लिए किया जाता है। वे सभी प्रकार के उपकरणों पर प्रदर्शित और प्रिंट करना और वेब या ईमेल द्वारा स्थानांतरित करना आसान है। लेकिन जब कुछ कार्यों, विशेष रूप से स्प्रेडशीट संचालन की बात आती है, तो पीडीएफ के साथ काम करना मुश्किल हो सकता है। सौभाग्य से, PDF से डेटा को अल्पविराम से अलग किए गए मान प्रारूप में परिवर्तित करने के लिए उपकरण हैं, जो कई स्प्रेडशीट प्रोग्रामों द्वारा उपयोग किए जा सकते हैं, जिन्हें CSV के रूप में जाना जाता है, या Microsoft Excel फ़ाइलों में।

PDF को CSV में बदलें

यदि आप एक तालिका प्रारूप में डेटा के साथ एक पीडीएफ प्राप्त करते हैं, तो आप अक्सर उस डेटा पर विभिन्न प्रकार के विश्लेषण चलाना चाहेंगे। हो सकता है कि आप स्प्रैडशीट में कुछ स्तंभों का योग करना चाहें, जानकारी की तुलना आपके पास मौजूद अन्य डेटा से करें या इसे बार चार्ट या लाइन ग्राफ़ पर प्लॉट करें।

दिन का वीडियो

दुर्भाग्य से, इसे सीधे पीडीएफ फाइल से करना आसान नहीं है। लेकिन अगर आप PDF को CSV फ़ाइल में कनवर्ट करते हैं, तो आप इसे स्प्रेडशीट टूल, डेटाबेस प्रोग्राम या कई अन्य विश्लेषण टूल में आयात कर सकते हैं। पीडीएफ से सीएसवी रूपांतरण के लिए उपयोग करने के लिए ऑनलाइन और ऑफलाइन कई मुफ्त और सशुल्क टूल उपलब्ध हैं।

ऑप्टिकल कैरेक्टर रिकग्निशन पर विचार करें

कुछ मामलों में, विशेष रूप से यदि पीडीएफ एक स्कैन किए गए दस्तावेज़ से बनाया गया है, तो इसमें केवल पाठ की एक छवि शामिल हो सकती है, न कि कच्चे अक्षर स्वयं एक तरह से कंप्यूटर समझ सकते हैं। इस मामले में, आपको ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) प्रोग्राम के माध्यम से प्रोग्राम चलाने की आवश्यकता हो सकती है जो टेक्स्ट को अलग-अलग शब्दों या संख्याओं के रूप में संसाधित कर सकता है।

OCR प्रोग्राम सही नहीं हैं, इसलिए किसी भी टेक्स्ट या नंबरों को आप PDF से इस तरह से निकालने के लिए दोबारा जांच करना एक अच्छा विचार है।

एडोब एक्रोबेट का प्रयोग करें

एक उपकरण जो पीडीएफ फाइलों को स्प्रेडशीट में बदल सकता है वह है एडोब एक्रोबैट। Adobe वह कंपनी है जिसने अधिकांश PDF प्रारूप विकसित किए हैं। आप एक्रोबैट के सशुल्क संस्करण में एक पीडीएफ फाइल खोल सकते हैं और एक माइक्रोसॉफ्ट एक्सेल स्प्रेडशीट फ़ाइल में निर्यात कर सकते हैं। यदि आप एक सीएसवी पसंद करते हैं, तो एक्सेल या अधिकांश अन्य स्प्रेडशीट प्रोग्राम फ़ाइल को खोल सकते हैं और इसे सीएसवी के रूप में सहेज सकते हैं।

किसी फ़ाइल को कनवर्ट करने के लिए, उसे एक्रोबैट में खोलें और "पीडीएफ निर्यात करें" पर क्लिक करें। आउटपुट स्वरूप के रूप में स्प्रेडशीट और "Microsoft Excel कार्यपुस्तिका" चुनें। "निर्यात" पर क्लिक करें और चुनें कि फ़ाइल को कहाँ सहेजना है। यदि पीडीएफ स्कैन किया जाता है, तो एक्रोबैट टेक्स्ट निकालने के लिए ओसीआर तकनीक चलाएगा।

एक्रोबैट का उपयोग करने के लिए आपको भुगतान करना होगा, हालांकि एक नि: शुल्क परीक्षण उपलब्ध है।

ऐसे कई मुफ्त ऑनलाइन उपकरण हैं जो पीडीएफ को सीएसवी या स्प्रेडशीट फाइलों में परिवर्तित कर सकते हैं, यदि आवश्यक हो तो उन पर ओसीआर सॉफ्टवेयर चलाना भी शामिल है।

कन्वर्टियो नामक एक प्रोग्राम पीडीएफ को सीएसवी फाइलों में बदल देगा। कई रूपांतरण मुफ़्त हैं, लेकिन आपको OCR जैसी सेवाओं या बड़ी फ़ाइलों को संसाधित करने के लिए भुगतान करना पड़ सकता है।

एक अन्य विकल्प सोडापीडीएफ है, जो मुफ्त में उपलब्ध है और पीडीएफ को एक्सेल फाइलों, माइक्रोसॉफ्ट वर्ड फॉर्मेट या माइक्रोसॉफ्ट पावरपॉइंट दस्तावेजों में बदल सकता है। यह मुफ्त ऑनलाइन उपलब्ध है, और आप एक पीडीएफ अपलोड कर सकते हैं और रूपांतरण प्रक्रिया चलाने के बाद इसे उत्पन्न होने वाली फ़ाइल डाउनलोड कर सकते हैं।

ऑनलाइन टूल का उपयोग करने का एक नकारात्मक पहलू यह है कि आपको उस फ़ाइल को साझा करना होगा जिसे आप परिवर्तित कर रहे हैं जो भी टूल संचालित करता है। यदि दस्तावेज़ गोपनीय है, तो हो सकता है कि आप ऐसा नहीं करना चाहें।

ऐसे टूल भी हैं जिनका उपयोग आप PDF को CSV फ़ाइल या अन्य संभावित सुविधाजनक प्रारूपों में कनवर्ट करने के लिए ऑफ़लाइन उपयोग कर सकते हैं।

एक को Tabula कहा जाता है, और यह विंडोज, मैक या लिनक्स के लिए मुफ्त में उपलब्ध है। इसमें ओसीआर क्षमता शामिल नहीं है, इसलिए यह स्कैन किए गए पीडीएफ के साथ काम नहीं कर सकता है जिसमें एम्बेडेड टेक्स्ट नहीं है।

एक ओपन-सोर्स टूल भी है जिसे pdf2csv कहा जाता है जो पायथन प्रोग्रामिंग भाषा के साथ काम करता है। यह ओपन-सोर्स प्रोग्राम रिपोजिटरी गिटहब पर मुफ्त में उपलब्ध है।

आप PDFMiner नामक एक निःशुल्क टूल का भी उपयोग कर सकते हैं जो PDF को टेक्स्ट में बदल सकता है या PDF2HTML नामक टूल का उपयोग कर सकता है पीडीएफ को हाइपरटेक्स्ट मार्कअप भाषा में बदल देगा वेब पेज फाइलें जिन्हें आप टेक्स्ट के रूप में संपादित कर सकते हैं या वेब में देख सकते हैं ब्राउज़र।

श्रेणियाँ

हाल का

फ़ायरफ़ॉक्स को नई विंडोज़ खोलने से कैसे रोकें

फ़ायरफ़ॉक्स को नई विंडोज़ खोलने से कैसे रोकें

कई वेबसाइटों में लिंक होते हैं जो आपके वेब ब्रा...

सर्च बार मेमोरी कैसे साफ़ करें

सर्च बार मेमोरी कैसे साफ़ करें

खोज बार मेमोरी साफ़ करें अधिकांश खोज इंजन और व...

Google क्रोम ट्रैकिंग कैसे बंद करें

Google क्रोम ट्रैकिंग कैसे बंद करें

ट्रैक न करें अनुरोध भेजने के लिए Android के लि...