
I file CSV vengono utilizzati per leggere i dati in fogli di calcolo.
Credito immagine: Stockbyte/Stockbyte/Getty Images
Ogni riga in un file rappresenta una riga di dati, ma tali dati sono generalmente divisi in campi o colonne. Due metodi standard delineano i campi. Uno è avere campi a lunghezza fissa e quindi record a lunghezza fissa; l'altro è avere campi di lunghezza variabile con record di lunghezza variabile. I campi a lunghezza variabile devono essere separati da un simbolo, che è il delimitatore. Un database di record a lunghezza variabile produrrà un file delimitato, un database di uno con record a lunghezza fissa produce un file a larghezza fissa.
Delimitatori
La forma più comune di file delimitato utilizza la virgola come separatore di campo. Questi file sono chiamati file con valori separati da virgola (CSV). La virgola è adatta ai dati numerici, ma può causare problemi con il testo. Altri delimitatori includono lo spazio (" ") barra ("|") o il segno del cappello ("^"). Il progettista o il programmatore di file deve trovare un carattere che viene utilizzato raramente nei dati. A volte può essere necessario utilizzare una combinazione di caratteri.
Video del giorno
Campi fissi
Non è sempre possibile garantire che un carattere non verrà mai utilizzato nei dati da archiviare nei file, quindi la difficoltà di trovare un delimitatore adatto può rendere preferibili i campi a lunghezza fissa. Questo formato presenta spese generali sia nell'archiviazione che nell'elaborazione, quindi i file delimitati sono più comuni. Un campo a lunghezza fissa deve essere riempito. Le forme più comuni di riempimento sono il riempimento sinistro con zeri per i dati numerici e il riempimento destro con spazi per il testo.
Procedure
Sia che un file sia di larghezza fissa o contenga campi delimitati, i programmi di scrittura e lettura devono seguire le stesse convenzioni. Un programma che riceve un file a larghezza fissa deve prima conoscere la lunghezza e il tipo di dati di ciascun file. Un programma che riceve file delimitati deve conoscere il delimitatore da cercare.
Record rifiutati
In ogni caso, i programmi di importazione dovrebbero avere procedure di segnalazione delle eccezioni che scrivono i record rifiutati in un file separato. Il motivo più comune per cui un record delimitato viene rifiutato è che il delimitatore appare nei dati, creando colonne aggiuntive. I record a larghezza fissa di solito vengono rifiutati perché troppo lunghi. I record brevi di solito non causano errori. I campi finali non saranno popolati. Se i campi finali sono obbligatori, i record brevi verranno rifiutati.