Co to jest plik rozdzielany i plik o stałej szerokości?

click fraud protection
Laptop z arkuszem kalkulacyjnym na ekranie

Pliki CSV służą do wczytywania danych do arkuszy kalkulacyjnych.

Źródło obrazu: Stockbyte/Stockbyte/Getty Images

Każdy wiersz w pliku reprezentuje wiersz danych, ale dane te są zwykle podzielone na pola lub kolumny. Pola wyznaczają dwie standardowe metody. Jednym z nich jest posiadanie pól o stałej długości, a zatem rekordów o stałej długości; drugim jest posiadanie pól o zmiennej długości z rekordami o zmiennej długości. Pola o zmiennej długości muszą być oddzielone symbolem, który jest ogranicznikiem. Baza danych rekordów o zmiennej długości utworzy plik rozdzielany, baza danych z rekordami o stałej długości stworzy plik o stałej szerokości.

ograniczniki

Najpopularniejsza forma rozdzielanego pliku używa przecinka jako separatora pól. Te pliki są nazywane plikami z wartościami oddzielonymi przecinkami (CSV). Przecinek jest odpowiedni dla danych liczbowych, ale może powodować problemy z tekstem. Inne ograniczniki to spacja (" ") kreska ("|") lub znak kapelusza ("^"). Projektant plików lub programista musi znaleźć w danych znak, który jest rzadko używany. Czasami może być konieczne użycie kombinacji znaków.

Wideo dnia

Naprawiono pola

Nie zawsze można zagwarantować, że jeden znak nigdy nie zostanie użyty w danych przechowywanych w plikach, więc trudność w znalezieniu odpowiedniego ogranicznika może sprawić, że pola o stałej długości będą preferowane. Ten format przedstawia koszty ogólne zarówno przechowywania, jak i przetwarzania, więc rozdzielane pliki są bardziej powszechne. Pole o stałej długości musi być wypełnione. Najpopularniejszymi formami dopełniania są lewe dopełnienie zerami dla danych liczbowych i prawe dopełnienie spacjami na tekst.

Procedury

Niezależnie od tego, czy plik ma stałą szerokość, czy zawiera pola oddzielone, programy do zapisu i odczytu muszą przestrzegać tych samych konwencji. Program otrzymujący plik o stałej szerokości musi najpierw znać długość i typ danych każdego pliku. Program odbierający rozdzielane pliki musi znać ogranicznik, którego ma szukać.

Odrzucone rekordy

W każdym przypadku programy importujące powinny mieć procedury zgłaszania wyjątków, które zapisują odrzucone rekordy w oddzielnym pliku. Najczęstszym powodem odrzucenia rozdzielanego rekordu jest to, że ogranicznik pojawia się w danych, tworząc dodatkowe kolumny. Rekordy o stałej szerokości są zwykle odrzucane, ponieważ są zbyt długie. Krótkie zapisy zwykle nie powodują błędów. Ostatnie pola będą puste. Jeśli ostatnie pola są obowiązkowe, krótkie rekordy zostaną odrzucone.