Mis on piiritletud ja fikseeritud laiusega fail?

Sülearvuti, mille ekraanil on arvutustabel

CSV-faile kasutatakse andmete lugemiseks arvutustabelitesse.

Pildi krediit: Stockbyte/Stockbyte/Getty Images

Iga rida failis tähistab andmerida, kuid need andmed on tavaliselt jagatud väljadeks või veergudeks. Väljade piiritlemiseks on kaks standardmeetodit. Üks on fikseeritud pikkusega väljade ja seega fikseeritud pikkusega kirjete olemasolu; teine ​​on muutuva pikkusega väljade olemasolu muutuva pikkusega kirjetega. Muutuva pikkusega väljad tuleb eraldada sümboliga, mis on eraldaja. Muutuva pikkusega kirjete andmebaas loob piiritletud faili, fikseeritud pikkusega kirjetega andmebaas aga fikseeritud laiusega faili.

Piiritlejad

Kõige tavalisem piiritletud faili vorm kasutab väljade eraldajana koma. Neid faile nimetatakse komaga eraldatud väärtuste (CSV) failideks. Koma sobib numbriliste andmete jaoks, kuid võib tekstiga probleeme tekitada. Muud eraldajad hõlmavad tühikut (" ") ("|") või mütsimärki ("^"). Faili kujundaja või programmeerija peab leidma märgi, mida andmetes harva kasutatakse. Mõnikord võib osutuda vajalikuks kasutada tähemärkide kombinatsiooni.

Päeva video

Fikseeritud väljad

Alati ei ole võimalik tagada, et failidesse salvestatavates andmetes ei kasutata kunagi ühte tähemärki, seega võib sobiva eraldaja leidmise raskus muuta kindla pikkusega väljad eelistatavamaks. See vorming hõlmab üldkulusid nii salvestamisel kui töötlemisel, seega on piiritletud failid tavalisemad. Fikseeritud pikkusega väli peab olema polsterdatud. Levinumad täidisvormid on vasakpoolne täidis nullidega numbriliste andmete jaoks ja parempoolne täidis tühikutega teksti jaoks.

Protseduurid

Olenemata sellest, kas fail on fikseeritud laiusega või sisaldab piiritletud välju, peavad kirjutamis- ja lugemisprogrammid järgima samu tavasid. Fikseeritud laiusega faili saav programm peab kõigepealt teadma iga faili pikkust ja andmetüüpi. Piiratud faile vastuvõttev programm peab teadma eraldajat, mida otsida.

Tagasilükatud kirjed

Igal juhul peaks importivatel programmidel olema erandite aruandlusprotseduurid, mis kirjutavad tagasilükatud kirjed eraldi faili. Kõige tavalisem põhjus, miks piiritletud kirje tagasi lükatakse, on see, et andmetesse ilmub eraldaja, mis loob täiendavaid veerge. Fikseeritud laiusega kirjed lükatakse tavaliselt tagasi, kuna need on liiga pikad. Lühikesed kirjed tavaliselt vigu ei põhjusta. Viimased väljad jäävad asustamata. Kui lõplikud väljad on kohustuslikud, lükatakse lühikirjed tagasi.