Los archivos CSV se utilizan para leer datos en hojas de cálculo.
Credito de imagen: Stockbyte / Stockbyte / Getty Images
Cada línea de un archivo representa una fila de datos, pero esos datos generalmente se dividen en campos o columnas. Dos métodos estándar delimitan campos. Una es tener campos de longitud fija y, por lo tanto, registros de longitud fija; la otra es tener campos de longitud variable con registros de longitud variable. Los campos de longitud variable deben estar separados por un símbolo, que es el delimitador. Una base de datos de registros de longitud variable producirá un archivo delimitado, una base de datos de uno con registros de longitud fija producirá un archivo de ancho fijo.
Delimitadores
La forma más común de archivo delimitado utiliza la coma como separador de campo. Estos archivos se denominan archivos de valores separados por comas (CSV). La coma es adecuada para datos numéricos, pero puede causar problemas con el texto. Otros delimitadores incluyen la barra de espacio ("") ("|") o el signo de sombrero ("^"). El diseñador o programador de archivos tiene que encontrar un carácter que rara vez se utiliza en los datos. A veces puede ser necesario utilizar una combinación de caracteres.
Video del día
Campos fijos
No siempre es posible garantizar que nunca se utilizará un carácter en los datos que se almacenarán en archivos, por lo que la dificultad de encontrar un delimitador adecuado puede hacer que los campos de longitud fija sean preferibles. Este formato presenta gastos generales tanto en el almacenamiento como en el procesamiento, por lo que los archivos delimitados son más comunes. Se debe rellenar un campo de longitud fija. Las formas más comunes de relleno son el relleno izquierdo con ceros para datos numéricos y el relleno derecho con espacios para texto.
Procedimientos
Ya sea que un archivo tenga un ancho fijo o contenga campos delimitados, los programas de escritura y lectura deben seguir las mismas convenciones. Un programa que recibe un archivo de ancho fijo primero debe conocer la longitud y el tipo de datos de cada archivo. Un programa que recibe archivos delimitados debe conocer el delimitador que debe buscar.
Registros rechazados
En cada caso, los programas de importación deben tener procedimientos de notificación de excepciones que escriban los registros rechazados en un archivo separado. La razón más común por la que se rechaza un registro delimitado es que el delimitador aparece en los datos, creando columnas adicionales. Los registros de ancho fijo generalmente se rechazan por ser demasiado largos. Los registros breves no suelen provocar errores. Los campos finales quedarán despoblados. Si los campos finales son obligatorios, se rechazarán los registros breves.