Hva er en avgrenset fil og en fil med fast bredde?

Bærbar datamaskin med regneark på skjermen

CSV-filer brukes til å lese data inn i regneark.

Bildekreditt: Stockbyte/Stockbyte/Getty Images

Hver linje i en fil representerer en rad med data, men disse dataene er vanligvis delt inn i felt eller kolonner. To standardmetoder avgrenser felt. Det ene er å ha felt med fast lengde, og derfor poster med fast lengde; den andre er å ha felt med variabel lengde med poster med variabel lengde. Felt med variabel lengde må skilles med et symbol, som er skilletegnet. En database med poster med variabel lengde vil produsere en avgrenset fil, en database med en med poster med fast lengde produserer en fil med fast bredde.

Avgrensningstegn

Den vanligste formen for avgrenset fil bruker kommaet som feltskilletegn. Disse filene kalles kommaseparerte verdier (CSV)-filer. Kommaet er egnet for numeriske data, men kan forårsake et problem med tekst. Andre skilletegn inkluderer mellomrom (" ") bar ("|") eller hattetegn ("^"). Fildesigneren eller programmereren må finne et tegn som sjelden brukes i dataene. Noen ganger kan det være nødvendig å bruke en kombinasjon av tegn.

Dagens video

Faste felt

Det er ikke alltid mulig å garantere at ett tegn aldri vil bli brukt i data som skal lagres i filer, så vanskeligheten med å finne et passende skilletegn kan gjøre felt med fast lengde å foretrekke. Dette formatet presenterer overhead både i lagring og behandling, så avgrensede filer er mer vanlig. Et felt med fast lengde må polstres. De vanligste formene for utfylling er venstre utfylling med nuller for numeriske data, og høyre utfylling med mellomrom for tekst.

Prosedyrer

Enten en fil har fast bredde eller inneholder avgrensede felt, må skrive- og leseprogrammene følge de samme konvensjonene. Et program som mottar en fil med fast bredde, må først vite lengden og datatypen til hver fil. Et program som mottar avgrensede filer, må kjenne skilletegnet for å se etter.

Avviste poster

I hvert tilfelle bør import av programmer ha unntaksrapporteringsprosedyrer som skriver ut avviste poster til en egen fil. Den vanligste årsaken til at en avgrenset post blir avvist, er at skilletegnet vises i dataene og skaper ekstra kolonner. Oppføringer med fast bredde blir vanligvis avvist fordi de er for lange. Korte poster forårsaker vanligvis ikke feil. De siste feltene vil være ubefolket. Hvis de siste feltene er obligatoriske, vil korte poster bli avvist.