O que é um arquivo delimitado e de largura fixa?

Computador laptop com planilha na tela

Arquivos CSV são usados ​​para ler dados em planilhas.

Crédito da imagem: Stockbyte / Stockbyte / Getty Images

Cada linha em um arquivo representa uma linha de dados, mas esses dados geralmente são divididos em campos ou colunas. Dois métodos padrão delineiam campos. Uma é ter campos de comprimento fixo e, portanto, registros de comprimento fixo; a outra é ter campos de comprimento variável com registros de comprimento variável. Os campos de comprimento variável devem ser separados por um símbolo, que é o delimitador. Um banco de dados de registros de comprimento variável produzirá um arquivo delimitado, um banco de dados de um com registros de comprimento fixo produz um arquivo de largura fixa.

Delimitadores

A forma mais comum de arquivo delimitado usa a vírgula como separador de campo. Esses arquivos são chamados de arquivo de valores separados por vírgula (CSV). A vírgula é adequada para dados numéricos, mas pode causar problemas com o texto. Outros delimitadores incluem a barra de espaço ("") ("|") ou o sinal de chapéu ("^"). O designer de arquivo ou programador deve encontrar um caractere que raramente é usado nos dados. Às vezes, pode ser necessário usar uma combinação de caracteres.

Vídeo do dia

Campos Fixos

Nem sempre é possível garantir que um caractere nunca será usado em dados a serem armazenados em arquivos, portanto, a dificuldade de encontrar um delimitador adequado pode tornar os campos de comprimento fixo preferíveis. Esse formato apresenta sobrecargas tanto no armazenamento quanto no processamento, portanto, arquivos delimitados são mais comuns. Um campo de comprimento fixo deve ser preenchido. As formas mais comuns de preenchimento são o preenchimento à esquerda com zeros para dados numéricos e o preenchimento à direita com espaços para texto.

Procedimentos

Quer um arquivo tenha largura fixa ou contenha campos delimitados, os programas de escrita e leitura devem seguir as mesmas convenções. Um programa que recebe um arquivo de largura fixa deve primeiro saber o comprimento e o tipo de dados de cada campo. Um programa que recebe arquivos delimitados deve saber o delimitador a ser procurado.

Registros Rejeitados

Em cada caso, os programas de importação devem ter procedimentos de relatório de exceção que gravam os registros rejeitados em um arquivo separado. O motivo mais comum para a rejeição de um registro delimitado é que o delimitador aparece nos dados, criando colunas extras. Registros de largura fixa geralmente são rejeitados por serem muito longos. Registros curtos geralmente não causam erros. Os campos finais não serão preenchidos. Se os campos finais forem obrigatórios, os registros curtos serão rejeitados.