Τι είναι ένα αρχείο οριοθετημένου και σταθερού πλάτους;

Φορητός υπολογιστής με υπολογιστικό φύλλο στην οθόνη

Τα αρχεία CSV χρησιμοποιούνται για την ανάγνωση δεδομένων σε υπολογιστικά φύλλα.

Πίστωση εικόνας: Stockbyte/Stockbyte/Getty Images

Κάθε γραμμή σε ένα αρχείο αντιπροσωπεύει μια σειρά δεδομένων, αλλά αυτά τα δεδομένα συνήθως χωρίζονται σε πεδία ή στήλες. Δύο τυπικές μέθοδοι οριοθετούν πεδία. Το ένα είναι να υπάρχουν πεδία σταθερού μήκους, και επομένως εγγραφές σταθερού μήκους. Το άλλο είναι να υπάρχουν πεδία μεταβλητού μήκους με εγγραφές μεταβλητού μήκους. Τα πεδία μεταβλητού μήκους πρέπει να χωρίζονται με ένα σύμβολο, το οποίο είναι ο οριοθέτης. Μια βάση δεδομένων με εγγραφές μεταβλητού μήκους θα παράγει ένα οριοθετημένο αρχείο, μια βάση δεδομένων ενός με εγγραφές σταθερού μήκους παράγει ένα αρχείο σταθερού πλάτους.

Οριοθέτες

Η πιο κοινή μορφή οριοθετημένου αρχείου χρησιμοποιεί το κόμμα ως διαχωριστικό πεδίου. Αυτά τα αρχεία ονομάζονται αρχείο τιμών διαχωρισμένων με κόμματα (CSV). Το κόμμα είναι κατάλληλο για αριθμητικά δεδομένα, αλλά μπορεί να προκαλέσει πρόβλημα με το κείμενο. Άλλοι οριοθέτες περιλαμβάνουν τη γραμμή διαστήματος (" ") ("|") ή το σύμβολο του καπέλου ("^"). Ο σχεδιαστής αρχείων ή ο προγραμματιστής πρέπει να βρει έναν χαρακτήρα που σπάνια χρησιμοποιείται στα δεδομένα. Μερικές φορές μπορεί να είναι απαραίτητο να χρησιμοποιήσετε έναν συνδυασμό χαρακτήρων.

Το βίντεο της ημέρας

Σταθερά Πεδία

Δεν είναι πάντα δυνατό να εγγυηθούμε ότι ένας χαρακτήρας δεν θα χρησιμοποιηθεί ποτέ σε δεδομένα που θα αποθηκευτούν σε αρχεία, επομένως η δυσκολία εύρεσης κατάλληλου οριοθέτη μπορεί να κάνει προτιμότερα τα πεδία σταθερού μήκους. Αυτή η μορφή παρουσιάζει γενικά έξοδα τόσο στην αποθήκευση όσο και στην επεξεργασία, επομένως τα οριοθετημένα αρχεία είναι πιο συνηθισμένα. Ένα πεδίο σταθερού μήκους πρέπει να συμπληρωθεί. Οι πιο συνηθισμένες μορφές συμπλήρωσης είναι η αριστερή συμπλήρωση με μηδενικά για τα αριθμητικά δεδομένα και η δεξιά συμπλήρωση με κενά για το κείμενο.

Διαδικασίες

Είτε ένα αρχείο έχει σταθερό πλάτος είτε περιέχει οριοθετημένα πεδία, τα προγράμματα γραφής και ανάγνωσης πρέπει να ακολουθούν τις ίδιες συμβάσεις. Ένα πρόγραμμα που λαμβάνει ένα αρχείο σταθερού πλάτους πρέπει πρώτα να γνωρίζει το μήκος και τον τύπο δεδομένων κάθε αρχείου. Ένα πρόγραμμα που λαμβάνει οριοθετημένα αρχεία πρέπει να γνωρίζει τον οριοθέτη που πρέπει να αναζητήσει.

Εγγραφές που απορρίφθηκαν

Σε κάθε περίπτωση, τα προγράμματα εισαγωγής θα πρέπει να έχουν διαδικασίες αναφοράς εξαιρέσεων που διαγράφουν τις απορριφθείσες εγγραφές σε ξεχωριστό αρχείο. Ο πιο συνηθισμένος λόγος που μια οριοθετημένη εγγραφή απορρίπτεται είναι ότι ο οριοθέτης εμφανίζεται στα δεδομένα, δημιουργώντας επιπλέον στήλες. Οι εγγραφές σταθερού πλάτους συνήθως απορρίπτονται επειδή είναι πολύ μεγάλες. Οι σύντομες εγγραφές συνήθως δεν προκαλούν σφάλματα. Τα τελικά πεδία θα είναι απλήρωτα. Εάν τα τελικά πεδία είναι υποχρεωτικά, οι σύντομες εγγραφές θα απορριφθούν.