Що таке файл із роздільниками та фіксованою шириною?

Портативний комп'ютер з електронною таблицею на екрані

Файли CSV використовуються для зчитування даних у електронні таблиці.

Авторство зображення: Stockbyte/Stockbyte/Getty Images

Кожен рядок у файлі представляє рядок даних, але ці дані зазвичай поділяються на поля або стовпці. Два стандартних методи розмежовують поля. Перше – мати поля фіксованої довжини, а отже, записи фіксованої довжини; інший — мати поля змінної довжини із записами змінної довжини. Поля змінної довжини повинні бути розділені символом, який є роздільником. База даних записів змінної довжини створить файл із роздільниками, база даних із записами фіксованої довжини створює файл фіксованої ширини.

Розмежувачі

Найпоширеніша форма файлу з роздільниками використовує кому як роздільник полів. Ці файли називаються файлами значень, розділених комами (CSV). Кома підходить для числових даних, але може спричинити проблеми з текстом. Інші роздільники включають пробіл (" "), смугу ("|") або знак капелюха ("^"). Конструктор файлів або програміст повинен знайти символ, який рідко використовується в даних. Іноді може знадобитися використовувати комбінацію символів.

Відео дня

Фіксовані поля

Не завжди можливо гарантувати, що один символ ніколи не буде використовуватися в даних, які будуть зберігатися у файлах, тому складність пошуку відповідного роздільника може зробити поля фіксованої довжини перевагою більш бажаними. Цей формат створює накладні витрати як на зберігання, так і на обробку, тому файли з роздільниками є більш поширеними. Поле фіксованої довжини має бути доповнене. Найпоширенішими формами заповнення є лівий відступ нулями для числових даних і правий відступ з пробілами для тексту.

Процедури

Незалежно від того, чи має файл фіксовану ширину чи містить поля з роздільниками, програми запису та читання повинні дотримуватися однакових умов. Програма, яка отримує файл фіксованої ширини, спочатку повинна знати довжину та тип даних кожного файлу. Програма, яка отримує файли з роздільниками, повинна знати роздільник, який потрібно шукати.

Відхилені записи

У кожному випадку програми імпорту повинні мати процедури звітування про винятки, які записують відхилені записи в окремий файл. Найпоширенішою причиною відхилення запису з роздільниками є те, що роздільник з’являється в даних, створюючи додаткові стовпці. Записи з фіксованою шириною зазвичай відхиляються через те, що вони занадто довгі. Короткі записи зазвичай не викликають помилок. Остаточні поля не будуть заповнені. Якщо кінцеві поля є обов’язковими, короткі записи будуть відхилені.