CSV-Dateien werden verwendet, um Daten in Tabellenkalkulationen einzulesen.
Bildnachweis: Stockbyte/Stockbyte/Getty Images
Jede Zeile in einer Datei stellt eine Datenzeile dar, die jedoch normalerweise in Felder oder Spalten unterteilt ist. Zwei Standardmethoden grenzen Felder ab. Eine besteht darin, Felder fester Länge und daher Datensätze fester Länge zu haben; die andere besteht darin, Felder variabler Länge mit Datensätzen variabler Länge zu haben. Felder mit variabler Länge müssen durch ein Symbol als Trennzeichen getrennt werden. Eine Datenbank mit Datensätzen variabler Länge erzeugt eine Datei mit Trennzeichen, eine Datenbank mit Datensätzen mit fester Länge erzeugt eine Datei mit fester Breite.
Trennzeichen
Die gebräuchlichste Form von Dateien mit Trennzeichen verwendet das Komma als Feldtrennzeichen. Diese Dateien werden als CSV-Dateien (Comma Separated Values) bezeichnet. Das Komma eignet sich für numerische Daten, kann jedoch bei Text zu Problemen führen. Andere Trennzeichen sind das Leerzeichen (""), der Strich ("|") oder das Hutzeichen ("^"). Der Dateidesigner oder Programmierer muss ein Zeichen finden, das in den Daten selten verwendet wird. Manchmal kann es notwendig sein, eine Kombination von Zeichen zu verwenden.
Video des Tages
Feste Felder
Es ist nicht immer möglich zu garantieren, dass niemals ein Zeichen in Daten verwendet wird, die in Dateien gespeichert werden sollen, daher kann die Schwierigkeit, ein geeignetes Trennzeichen zu finden, Felder mit fester Länge vorziehen. Dieses Format verursacht sowohl bei der Speicherung als auch bei der Verarbeitung Mehraufwand, sodass Dateien mit Trennzeichen häufiger vorkommen. Ein Feld mit fester Länge muss aufgefüllt werden. Die gebräuchlichsten Formen des Auffüllens sind linkes Auffüllen mit Nullen für numerische Daten und rechtes Auffüllen mit Leerzeichen für Text.
Verfahren
Unabhängig davon, ob eine Datei eine feste Breite hat oder begrenzte Felder enthält, müssen die Schreib- und Leseprogramme den gleichen Konventionen folgen. Ein Programm, das eine Datei mit fester Breite empfängt, muss zunächst die Länge und den Datentyp jeder Datei kennen. Ein Programm, das Dateien mit Trennzeichen empfängt, muss das Trennzeichen kennen, nach dem gesucht werden soll.
Abgelehnte Datensätze
In jedem Fall sollten Importprogramme über Verfahren zum Melden von Ausnahmen verfügen, die abgelehnte Datensätze in eine separate Datei schreiben. Der häufigste Grund, warum ein durch Trennzeichen getrennter Datensatz abgelehnt wird, besteht darin, dass das Trennzeichen in den Daten erscheint und zusätzliche Spalten erstellt. Datensätze mit fester Breite werden normalerweise abgelehnt, weil sie zu lang sind. Kurze Aufzeichnungen verursachen normalerweise keine Fehler. Die letzten Felder werden nicht ausgefüllt. Wenn die letzten Felder Pflichtfelder sind, werden kurze Datensätze abgelehnt.