Vad är en avgränsad och en fil med fast bredd?

click fraud protection
Bärbar dator med kalkylblad på skärmen

CSV-filer används för att läsa in data i kalkylblad.

Bildkredit: Stockbyte/Stockbyte/Getty Images

Varje rad i en fil representerar en rad med data, men denna data är vanligtvis uppdelad i fält eller kolumner. Två standardmetoder avgränsar fält. En är att ha fasta längdfält, och därför fasta längdposter; den andra är att ha fält med variabel längd med poster med variabel längd. Fält med variabel längd måste separeras med en symbol, som är avgränsaren. En databas med poster med variabel längd kommer att producera en avgränsad fil, en databas med en med fast längd poster producerar en fil med fast bredd.

Avgränsare

Den vanligaste formen av avgränsad fil använder kommatecken som fältavgränsare. Dessa filer kallas CSV-filer (comma separated values). Kommat lämpar sig för numeriska data, men kan orsaka problem med text. Andra avgränsare inkluderar mellanslag (" ") stapel ("|") eller hatttecknet ("^"). Fildesignern eller programmeraren måste hitta ett tecken som sällan används i data. Ibland kan det vara nödvändigt att använda en kombination av tecken.

Dagens video

Fasta fält

Det är inte alltid möjligt att garantera att ett tecken aldrig kommer att användas i data som ska lagras i filer, så svårigheten att hitta en lämplig avgränsare kan göra fält med fast längd att föredra. Detta format presenterar omkostnader i både lagring och bearbetning, så avgränsade filer är vanligare. Ett fält med fast längd måste vadderas. De vanligaste formerna av utfyllnad är vänster utfyllnad med nollor för numeriska data och höger utfyllnad med mellanslag för text.

Förfaranden

Oavsett om en fil är av fast bredd eller innehåller avgränsade fält måste skriv- och läsprogrammen följa samma konventioner. Ett program som tar emot en fil med fast bredd måste först veta längden och datatypen för varje fil. Ett program som tar emot avgränsade filer måste känna till avgränsaren för att leta efter.

Avvisade poster

I varje fall bör import av program ha undantagsrapporteringsprocedurer som skriver ut avvisade poster till en separat fil. Den vanligaste orsaken till att en avgränsad post avvisas är att avgränsaren visas i data, vilket skapar extra kolumner. Poster med fast bredd avvisas vanligtvis för att de är för långa. Korta poster orsakar vanligtvis inga fel. De sista fälten kommer att vara obefolkade. Om de sista fälten är obligatoriska kommer korta poster att avvisas.