CSV फ़ाइलों का उपयोग स्प्रेडशीट में डेटा पढ़ने के लिए किया जाता है।
छवि क्रेडिट: स्टॉकबाइट / स्टॉकबाइट / गेट्टी छवियां
फ़ाइल में प्रत्येक पंक्ति डेटा की एक पंक्ति का प्रतिनिधित्व करती है, लेकिन वह डेटा आमतौर पर फ़ील्ड या कॉलम में विभाजित होता है। दो मानक विधियाँ क्षेत्रों को चित्रित करती हैं। एक है निश्चित लंबाई वाले फ़ील्ड, और इसलिए निश्चित लंबाई रिकॉर्ड; दूसरा चर-लंबाई रिकॉर्ड के साथ परिवर्तनीय लंबाई फ़ील्ड रखना है। चर-लंबाई वाले क्षेत्रों को एक प्रतीक द्वारा अलग किया जाना चाहिए, जो कि सीमांकक है। चर-लंबाई के रिकॉर्ड का एक डेटाबेस एक सीमांकित फ़ाइल का उत्पादन करेगा, निश्चित लंबाई के रिकॉर्ड वाले एक का डेटाबेस एक निश्चित चौड़ाई फ़ाइल उत्पन्न करता है।
सीमांकक
सीमांकित फ़ाइल का सबसे सामान्य रूप अल्पविराम का उपयोग फ़ील्ड विभाजक के रूप में करता है। इन फाइलों को कॉमा सेपरेटेड वैल्यूज (सीएसवी) फाइल कहा जाता है। अल्पविराम संख्यात्मक डेटा के लिए उपयुक्त है, लेकिन पाठ के साथ समस्या पैदा कर सकता है। अन्य सीमांककों में स्पेस (" ") बार ("|") या हैट साइन ("^") शामिल हैं। फ़ाइल डिज़ाइनर या प्रोग्रामर को एक ऐसा चरित्र खोजना होता है जो डेटा में शायद ही कभी उपयोग किया जाता है। कभी-कभी वर्णों के संयोजन का उपयोग करना आवश्यक हो सकता है।
दिन का वीडियो
निश्चित क्षेत्र
यह गारंटी देना हमेशा संभव नहीं होता है कि फ़ाइलों में संग्रहीत किए जाने वाले डेटा में कभी भी एक वर्ण का उपयोग नहीं किया जाएगा, इसलिए उपयुक्त सीमांकक खोजने की कठिनाई निश्चित लंबाई वाले फ़ील्ड को बेहतर बना सकती है। यह प्रारूप भंडारण और प्रसंस्करण दोनों में ओवरहेड्स प्रस्तुत करता है, इसलिए सीमांकित फ़ाइलें अधिक सामान्य हैं। एक निश्चित लंबाई के क्षेत्र को गद्देदार करना पड़ता है। पैडिंग के सबसे सामान्य रूप हैं, सांख्यिक डेटा के लिए ज़ीरो के साथ लेफ्ट पैडिंग, और टेक्स्ट के लिए स्पेस के साथ राइट पैडिंग।
प्रक्रियाओं
चाहे कोई फ़ाइल निश्चित चौड़ाई की हो या उसमें सीमांकित क्षेत्र हों, लेखन और पठन कार्यक्रमों को समान परिपाटी का पालन करना होता है। एक निश्चित चौड़ाई फ़ाइल प्राप्त करने वाले प्रोग्राम को पहले प्रत्येक फ़ाइल की लंबाई और डेटा प्रकार जानना होता है। सीमांकित फ़ाइलें प्राप्त करने वाले प्रोग्राम को देखने के लिए सीमांकक को जानना होता है।
अस्वीकृत रिकॉर्ड
प्रत्येक मामले में, आयात कार्यक्रमों में अपवाद-रिपोर्टिंग प्रक्रियाएं होनी चाहिए जो अस्वीकृत रिकॉर्ड को एक अलग फ़ाइल में लिखती हैं। एक सीमांकित रिकॉर्ड के खारिज होने का सबसे आम कारण यह है कि डेटा में सीमांकक दिखाई देता है, जिससे अतिरिक्त कॉलम बनते हैं। निश्चित चौड़ाई के रिकॉर्ड आमतौर पर बहुत लंबे होने के कारण खारिज कर दिए जाते हैं। छोटे रिकॉर्ड आमतौर पर त्रुटियों का कारण नहीं बनते हैं। अंतिम फ़ील्ड अलोकप्रिय हो जाएंगे। यदि अंतिम फ़ील्ड अनिवार्य हैं, तो संक्षिप्त रिकॉर्ड को अस्वीकार कर दिया जाएगा।