Файлы CSV используются для считывания данных в электронные таблицы.
Кредит изображения: Stockbyte / Stockbyte / Getty Images
Каждая строка в файле представляет собой строку данных, но эти данные обычно делятся на поля или столбцы. Два стандартных метода разграничивают поля. Один из них - иметь поля фиксированной длины и, следовательно, записи фиксированной длины; другой - иметь поля переменной длины с записями переменной длины. Поля переменной длины должны быть разделены символом, который является разделителем. База данных записей переменной длины создаст файл с разделителями, база данных с записями фиксированной длины создаст файл фиксированной ширины.
Разделители
В наиболее распространенной форме файла с разделителями в качестве разделителя полей используется запятая. Эти файлы называются файлами, разделенными запятыми (CSV). Запятая подходит для числовых данных, но может вызвать проблемы с текстом. Другие разделители включают пробел («»), черту («|») или знак шляпы («^»). Разработчик файла или программист должен найти символ, который редко используется в данных. Иногда может потребоваться комбинация символов.
Видео дня
Фиксированные поля
Не всегда можно гарантировать, что один символ никогда не будет использоваться в данных, которые будут храниться в файлах, поэтому сложность поиска подходящего разделителя может сделать поля фиксированной длины предпочтительными. Этот формат представляет собой накладные расходы как на хранение, так и на обработку, поэтому файлы с разделителями встречаются чаще. Поле фиксированной длины должно быть заполнено. Наиболее распространенными формами заполнения являются заполнение слева нулями для числовых данных и правое заполнение пробелами для текста.
Процедуры
Независимо от того, имеет ли файл фиксированную ширину или содержит поля с разделителями, программы записи и чтения должны следовать одним и тем же соглашениям. Программа, получающая файл фиксированной ширины, сначала должна знать длину и тип данных каждого поля. Программа, получающая файлы с разделителями, должна знать разделитель для поиска.
Отклоненные записи
В каждом случае программы импорта должны иметь процедуры отчетов об исключениях, которые записывают отклоненные записи в отдельный файл. Наиболее частая причина отклонения записи с разделителями заключается в том, что разделитель появляется в данных, создавая дополнительные столбцы. Записи с фиксированной шириной обычно отклоняются из-за того, что они слишком длинные. Короткие записи обычно не вызывают ошибок. Последние поля не будут заполнены. Если последние поля являются обязательными, короткие записи будут отклонены.