CSV-faile kasutatakse andmete lugemiseks arvutustabelitesse.
Pildi krediit: Stockbyte/Stockbyte/Getty Images
Iga rida failis tähistab andmerida, kuid need andmed on tavaliselt jagatud väljadeks või veergudeks. Väljade piiritlemiseks on kaks standardmeetodit. Üks on fikseeritud pikkusega väljade ja seega fikseeritud pikkusega kirjete olemasolu; teine on muutuva pikkusega väljade olemasolu muutuva pikkusega kirjetega. Muutuva pikkusega väljad tuleb eraldada sümboliga, mis on eraldaja. Muutuva pikkusega kirjete andmebaas loob piiritletud faili, fikseeritud pikkusega kirjetega andmebaas aga fikseeritud laiusega faili.
Piiritlejad
Kõige tavalisem piiritletud faili vorm kasutab väljade eraldajana koma. Neid faile nimetatakse komaga eraldatud väärtuste (CSV) failideks. Koma sobib numbriliste andmete jaoks, kuid võib tekstiga probleeme tekitada. Muud eraldajad hõlmavad tühikut (" ") ("|") või mütsimärki ("^"). Faili kujundaja või programmeerija peab leidma märgi, mida andmetes harva kasutatakse. Mõnikord võib osutuda vajalikuks kasutada tähemärkide kombinatsiooni.
Päeva video
Fikseeritud väljad
Alati ei ole võimalik tagada, et failidesse salvestatavates andmetes ei kasutata kunagi ühte tähemärki, seega võib sobiva eraldaja leidmise raskus muuta kindla pikkusega väljad eelistatavamaks. See vorming hõlmab üldkulusid nii salvestamisel kui töötlemisel, seega on piiritletud failid tavalisemad. Fikseeritud pikkusega väli peab olema polsterdatud. Levinumad täidisvormid on vasakpoolne täidis nullidega numbriliste andmete jaoks ja parempoolne täidis tühikutega teksti jaoks.
Protseduurid
Olenemata sellest, kas fail on fikseeritud laiusega või sisaldab piiritletud välju, peavad kirjutamis- ja lugemisprogrammid järgima samu tavasid. Fikseeritud laiusega faili saav programm peab kõigepealt teadma iga faili pikkust ja andmetüüpi. Piiratud faile vastuvõttev programm peab teadma eraldajat, mida otsida.
Tagasilükatud kirjed
Igal juhul peaks importivatel programmidel olema erandite aruandlusprotseduurid, mis kirjutavad tagasilükatud kirjed eraldi faili. Kõige tavalisem põhjus, miks piiritletud kirje tagasi lükatakse, on see, et andmetesse ilmub eraldaja, mis loob täiendavaid veerge. Fikseeritud laiusega kirjed lükatakse tavaliselt tagasi, kuna need on liiga pikad. Lühikesed kirjed tavaliselt vigu ei põhjusta. Viimased väljad jäävad asustamata. Kui lõplikud väljad on kohustuslikud, lükatakse lühikirjed tagasi.