Mi az a határolt és fix szélességű fájl?

Laptop számítógép-val táblázat a képernyőn

A CSV-fájlokat az adatok táblázatokba olvasására használják.

Kép jóváírása: Stockbyte/Stockbyte/Getty Images

A fájl minden sora egy adatsort jelöl, de ezek az adatok általában mezőkre vagy oszlopokra vannak osztva. Két szabványos módszer határolja be a mezőket. Az egyik az, hogy fix hosszúságú mezők legyenek, és ezért fix hosszúságú rekordok; a másik az, hogy változó hosszúságú mezők legyenek változó hosszúságú rekordokkal. A változó hosszúságú mezőket egy szimbólummal kell elválasztani, amely a határoló. A változó hosszúságú rekordokból álló adatbázis egy elválasztott fájlt, a fix hosszúságú rekordokat tartalmazó adatbázis pedig egy rögzített szélességű fájlt hoz létre.

Határolók

A tagolt fájl leggyakoribb formája a vesszőt használja mezőelválasztóként. Ezeket a fájlokat vesszővel elválasztott értékek (CSV) fájloknak nevezzük. A vessző alkalmas numerikus adatokra, de problémákat okozhat a szöveggel kapcsolatban. További határolójelek közé tartozik a szóköz (" ") sáv ("|") vagy kalapjel ("^"). A fájltervezőnek vagy programozónak olyan karaktert kell találnia, amelyet ritkán használnak az adatokban. Néha szükséges lehet karakterek kombinációjának használata.

A nap videója

Rögzített mezők

Nem mindig garantálható, hogy egy karakter soha ne kerüljön felhasználásra a fájlokban tárolandó adatokban, így a megfelelő határoló megtalálásának nehézsége a fix hosszúságú mezőket előnyösebbé teheti. Ez a formátum többletköltséget jelent mind a tárolás, mind a feldolgozás során, így az elválasztott fájlok gyakoribbak. Egy fix hosszúságú mezőt ki kell tölteni. A kitöltés leggyakoribb formája a bal oldali kitöltés nullákkal a numerikus adatokhoz, és a jobb oldali kitöltés szóközökkel a szöveghez.

Eljárások

Függetlenül attól, hogy egy fájl fix szélességű, vagy elválasztott mezőket tartalmaz, az író- és olvasóprogramoknak ugyanazokat a konvenciókat kell követniük. A rögzített szélességű fájlt fogadó programnak először ismernie kell az egyes fájlok hosszát és adattípusát. A határolt fájlokat fogadó programnak ismernie kell a keresendő határolót.

Elutasított rekordok

Az importáló programoknak minden esetben rendelkezniük kell kivétel-jelentési eljárásokkal, amelyek az elutasított rekordokat külön fájlba írják ki. A lehatárolt rekordok elutasításának leggyakoribb oka az, hogy az elválasztójel megjelenik az adatokban, és extra oszlopokat hoz létre. A rögzített szélességű rekordokat általában elutasítják, mert túl hosszúak. A rövid feljegyzések általában nem okoznak hibát. Az utolsó mezők nem lesznek kitöltve. Ha az utolsó mezők kitöltése kötelező, a rövid bejegyzések elutasításra kerülnek.