CSV ფაილები გამოიყენება ელცხრილებში მონაცემების წასაკითხად.
სურათის კრედიტი: Stockbyte/Stockbyte/Getty Images
ფაილის თითოეული ხაზი წარმოადგენს მონაცემთა რიგს, მაგრამ ეს მონაცემები ჩვეულებრივ იყოფა ველებად ან სვეტებად. ორი სტანდარტული მეთოდი ხაზს უსვამს ველებს. ერთი არის ფიქსირებული სიგრძის ველები და, შესაბამისად, ფიქსირებული სიგრძის ჩანაწერები; მეორე არის ცვლადი სიგრძის ველები ცვლადი სიგრძის ჩანაწერებით. ცვლადი სიგრძის ველები გამოყოფილი უნდა იყოს სიმბოლოთი, რომელიც არის დელიმიტერი. ცვლადი სიგრძის ჩანაწერების მონაცემთა ბაზა წარმოქმნის გამოყოფილ ფაილს, ერთის მონაცემთა ბაზა ფიქსირებული სიგრძის ჩანაწერებით აწარმოებს ფიქსირებული სიგანის ფაილს.
გამსაზღვრები
დელიმიტირებული ფაილის ყველაზე გავრცელებული ფორმა იყენებს მძიმით, როგორც ველის გამყოფს. ამ ფაილებს უწოდებენ მძიმით გამოყოფილი მნიშვნელობების (CSV) ფაილს. მძიმით შეესაბამება ციფრულ მონაცემებს, მაგრამ შეიძლება გამოიწვიოს ტექსტის პრობლემა. სხვა დელიმიტერები მოიცავს ინტერვალის (" ") ზოლს ("|") ან ქუდის ნიშანს ("^"). ფაილის დიზაინერმა ან პროგრამისტმა უნდა მოძებნოს სიმბოლო, რომელიც იშვიათად გამოიყენება მონაცემებში. ზოგჯერ შეიძლება საჭირო გახდეს სიმბოლოების კომბინაციის გამოყენება.
დღის ვიდეო
ფიქსირებული ველები
ყოველთვის არ არის შესაძლებელი იმის გარანტია, რომ ერთი სიმბოლო არასოდეს იქნება გამოყენებული ფაილებში შესანახ მონაცემებში, ამიტომ შესაფერისი დელიმიტერის პოვნის სირთულემ შეიძლება სასურველი გახადოს ფიქსირებული სიგრძის ველები. ეს ფორმატი წარმოადგენს ზედნადებს როგორც შენახვაში, ასევე დამუშავებაში, ამიტომ დელიმიტირებული ფაილები უფრო ხშირია. ფიქსირებული სიგრძის ველი უნდა შეივსოს. შიგთავსის ყველაზე გავრცელებული ფორმებია მარცხნივ ჩასმა ნულებით რიცხვითი მონაცემებისთვის და მარჯვენა შიგთავსით ტექსტის სივრცეებით.
პროცედურები
იქნება ეს ფაილი ფიქსირებული სიგანისა თუ შეიცავს გამოყოფილ ველებს, წერისა და კითხვის პროგრამები უნდა შეესაბამებოდეს იმავე კონვენციებს. პროგრამამ, რომელიც იღებს ფიქსირებული სიგანის ფაილს, ჯერ უნდა იცოდეს თითოეული ფაილის სიგრძე და მონაცემთა ტიპი. დელიმიტირებულ ფაილებს მიმღებმა პროგრამამ უნდა იცოდეს მოსაძებნი დელიმიტერი.
უარყოფილი ჩანაწერები
თითოეულ შემთხვევაში, იმპორტირებულ პროგრამებს უნდა ჰქონდეს გამონაკლისის მოხსენების პროცედურები, რომლებიც აწერენ უარყოფილ ჩანაწერებს ცალკე ფაილში. ყველაზე გავრცელებული მიზეზი, რის გამოც დელიმიტირებული ჩანაწერი უარყოფილია, არის ის, რომ დელიმიტერი გამოჩნდება მონაცემებში და ქმნის დამატებით სვეტებს. ფიქსირებული სიგანის ჩანაწერები ჩვეულებრივ უარყოფილია ძალიან გრძელის გამო. მოკლე ჩანაწერები, როგორც წესი, არ იწვევს შეცდომებს. საბოლოო ველები დაუსახლებელი იქნება. თუ საბოლოო ველები სავალდებულოა, მოკლე ჩანაწერები უარყოფილი იქნება.