Što je datoteka s razgraničenjima i datoteka fiksne širine?

Prijenosno računalo s proračunskom tablicom na zaslonu

CSV datoteke se koriste za čitanje podataka u proračunske tablice.

Zasluga slike: Stockbyte/Stockbyte/Getty Images

Svaki redak u datoteci predstavlja redak podataka, ali ti se podaci obično dijele na polja ili stupce. Dvije standardne metode ocrtavaju polja. Jedan je imati polja fiksne duljine, a time i zapise fiksne duljine; drugi je imati polja promjenjive duljine sa zapisima promjenjive duljine. Polja promjenjive duljine moraju biti odvojena simbolom, koji je graničnik. Baza podataka zapisa promjenjive duljine će proizvesti datoteku s razgraničenjima, a baza podataka sa zapisima fiksne duljine proizvodi datoteku fiksne širine.

Ograničenja

Najčešći oblik razgraničene datoteke koristi zarez kao razdjelnik polja. Te se datoteke nazivaju datotekama vrijednosti odvojenih zarezima (CSV). Zarez je prikladan za numeričke podatke, ali može uzrokovati problem s tekstom. Ostali graničnici uključuju razmak (" ") traku ("|") ili znak šešira ("^"). Dizajner datoteke ili programer mora pronaći znak koji se rijetko koristi u podacima. Ponekad će možda biti potrebno koristiti kombinaciju znakova.

Video dana

Fiksna polja

Nije uvijek moguće jamčiti da se jedan znak nikada neće koristiti u podacima koji se pohranjuju u datoteke, tako da poteškoće u pronalaženju prikladnog graničnika mogu učiniti polja fiksne duljine poželjnima. Ovaj format predstavlja troškove i u pohrani i obradi, pa su datoteke s razgraničenjima češće. Polje fiksne duljine mora biti dopunjeno. Najčešći oblici dopuna su lijevi padding s nulama za numeričke podatke i desni padding s razmacima za tekst.

Postupci

Bilo da je datoteka fiksne širine ili sadrži razgraničena polja, programi za pisanje i čitanje moraju slijediti iste konvencije. Program koji prima datoteku fiksne širine najprije mora znati duljinu i vrstu podataka svake datoteke. Program koji prima razgraničene datoteke mora znati graničnik koji treba tražiti.

Odbijeni zapisi

U svakom slučaju, programi za uvoz trebali bi imati procedure izvješćivanja o iznimkama koje zapisuju odbijene zapise u zasebnu datoteku. Najčešći razlog odbijanja razgraničenog zapisa je taj što se graničnik pojavljuje u podacima, stvarajući dodatne stupce. Zapisi fiksne širine obično bivaju odbijeni jer su predugi. Kratki zapisi obično ne uzrokuju pogreške. Posljednja polja neće biti popunjena. Ako su posljednja polja obavezna, kratki zapisi će biti odbijeni.