Kaj je datoteka z razmejeno in fiksno širino?

Prenosni računalnik s preglednico na zaslonu

Datoteke CSV se uporabljajo za branje podatkov v preglednice.

Zasluga slike: Stockbyte/Stockbyte/Getty Images

Vsaka vrstica v datoteki predstavlja vrstico podatkov, vendar so ti podatki običajno razdeljeni na polja ali stolpce. Dve standardni metodi razmejita polja. Eden je imeti polja s fiksno dolžino in s tem zapise s fiksno dolžino; drugi je imeti polja s spremenljivo dolžino z zapisi spremenljive dolžine. Polja s spremenljivo dolžino morajo biti ločena s simbolom, ki je ločilo. Podatkovna baza zapisov spremenljive dolžine bo ustvarila datoteko z razmejitvijo, zbirka podatkov z zapisi s fiksno dolžino pa datoteko s fiksno širino.

Ločila

Najpogostejša oblika razmejene datoteke uporablja vejico kot ločilo polj. Te datoteke se imenujejo datoteka z vrednostmi, ločenimi z vejico (CSV). Vejica je primerna za številske podatke, vendar lahko povzroči težave z besedilom. Druga ločila vključujejo preslednico (" ") vrstico ("|") ali znak za klobuk ("^"). Oblikovalec datotek ali programer mora najti znak, ki se redko uporablja v podatkih. Včasih bo morda treba uporabiti kombinacijo znakov.

Video dneva

Fiksna polja

Ni vedno mogoče zagotoviti, da en znak nikoli ne bo uporabljen v podatkih, ki se shranjujejo v datotekah, zato lahko zaradi težav pri iskanju ustreznega ločila prednostnejša polja s fiksno dolžino. Ta oblika predstavlja stroške pri shranjevanju in obdelavi, zato so ločene datoteke pogostejše. Polje s fiksno dolžino mora biti oblazinjeno. Najpogostejša oblika odmika sta levo odmik z ničlami ​​za številske podatke in desno odmik s presledki za besedilo.

Postopki

Ne glede na to, ali je datoteka fiksne širine ali vsebuje razmejena polja, morajo programi za pisanje in branje upoštevati enaka pravila. Program, ki prejme datoteko s fiksno širino, mora najprej poznati dolžino in vrsto podatkov vsake datoteke. Program, ki prejema ločene datoteke, mora poznati ločilo, ki ga mora iskati.

Zavrnjeni zapisi

V vsakem primeru bi morali uvozni programi imeti postopke za poročanje o izjemah, ki zavrnjene zapise zapišejo v ločeno datoteko. Najpogostejši razlog za zavrnitev razmejenega zapisa je, da se ločilo pojavi v podatkih, kar ustvarja dodatne stolpce. Zapisi s fiksno širino so običajno zavrnjeni, ker so predolgi. Kratki zapisi običajno ne povzročajo napak. Končna polja bodo nepopolnjena. Če so končna polja obvezna, bodo kratki zapisi zavrnjeni.