Файли CSV використовуються для зчитування даних у електронні таблиці.
Авторство зображення: Stockbyte/Stockbyte/Getty Images
Кожен рядок у файлі представляє рядок даних, але ці дані зазвичай поділяються на поля або стовпці. Два стандартних методи розмежовують поля. Перше – мати поля фіксованої довжини, а отже, записи фіксованої довжини; інший — мати поля змінної довжини із записами змінної довжини. Поля змінної довжини повинні бути розділені символом, який є роздільником. База даних записів змінної довжини створить файл із роздільниками, база даних із записами фіксованої довжини створює файл фіксованої ширини.
Розмежувачі
Найпоширеніша форма файлу з роздільниками використовує кому як роздільник полів. Ці файли називаються файлами значень, розділених комами (CSV). Кома підходить для числових даних, але може спричинити проблеми з текстом. Інші роздільники включають пробіл (" "), смугу ("|") або знак капелюха ("^"). Конструктор файлів або програміст повинен знайти символ, який рідко використовується в даних. Іноді може знадобитися використовувати комбінацію символів.
Відео дня
Фіксовані поля
Не завжди можливо гарантувати, що один символ ніколи не буде використовуватися в даних, які будуть зберігатися у файлах, тому складність пошуку відповідного роздільника може зробити поля фіксованої довжини перевагою більш бажаними. Цей формат створює накладні витрати як на зберігання, так і на обробку, тому файли з роздільниками є більш поширеними. Поле фіксованої довжини має бути доповнене. Найпоширенішими формами заповнення є лівий відступ нулями для числових даних і правий відступ з пробілами для тексту.
Процедури
Незалежно від того, чи має файл фіксовану ширину чи містить поля з роздільниками, програми запису та читання повинні дотримуватися однакових умов. Програма, яка отримує файл фіксованої ширини, спочатку повинна знати довжину та тип даних кожного файлу. Програма, яка отримує файли з роздільниками, повинна знати роздільник, який потрібно шукати.
Відхилені записи
У кожному випадку програми імпорту повинні мати процедури звітування про винятки, які записують відхилені записи в окремий файл. Найпоширенішою причиною відхилення запису з роздільниками є те, що роздільник з’являється в даних, створюючи додаткові стовпці. Записи з фіксованою шириною зазвичай відхиляються через те, що вони занадто довгі. Короткі записи зазвичай не викликають помилок. Остаточні поля не будуть заповнені. Якщо кінцеві поля є обов’язковими, короткі записи будуть відхилені.