Kas yra atskirtas ir fiksuoto pločio failas?

click fraud protection
Nešiojamasis kompiuteris su skaičiuokle ekrane

CSV failai naudojami duomenims nuskaityti į skaičiuokles.

Vaizdo kreditas: Stockbyte/Stockbyte/Getty Images

Kiekviena failo eilutė žymi duomenų eilutę, tačiau tie duomenys paprastai skirstomi į laukus arba stulpelius. Du standartiniai metodai apibrėžia laukus. Vienas iš jų yra turėti fiksuoto ilgio laukus, taigi ir fiksuoto ilgio įrašus; kita – turėti kintamo ilgio laukus su kintamo ilgio įrašais. Kintamo ilgio laukai turi būti atskirti simboliu, kuris yra skyriklis. Kintamo ilgio įrašų duomenų bazė sukurs atskirtą failą, o duomenų bazė su fiksuoto ilgio įrašais – fiksuoto pločio failą.

Skirstytuvai

Dažniausiai atskirtame faile naudojamas kablelis kaip lauko skyriklis. Šie failai vadinami kableliais atskirtų reikšmių (CSV) failais. Kablelis tinka skaitiniams duomenims, bet gali sukelti teksto problemų. Kiti skyrikliai yra tarpo (" ") juosta ("|") arba kepurės ženklas ("^"). Failų kūrėjas arba programuotojas turi rasti simbolį, kuris retai naudojamas duomenyse. Kartais gali prireikti naudoti simbolių derinį.

Dienos vaizdo įrašas

Fiksuoti laukai

Ne visada įmanoma garantuoti, kad failuose saugomuose duomenyse niekada nebus naudojamas vienas simbolis, todėl dėl sunkumų ieškant tinkamo skyriklio pageidautina naudoti fiksuoto ilgio laukus. Šis formatas apima pridėtines saugojimo ir apdorojimo išlaidas, todėl atskirti failai yra labiau paplitę. Fiksuoto ilgio laukas turi būti užpildytas. Dažniausios užpildymo formos yra užpildymas kairėje su nuliais skaitiniams duomenims ir dešinysis užpildymas su tarpais tekstui.

Procedūros

Nesvarbu, ar failas yra fiksuoto pločio, ar jame yra atskirtų laukų, rašymo ir skaitymo programos turi laikytis tų pačių taisyklių. Programa, gaunanti fiksuoto pločio failą, pirmiausia turi žinoti kiekvieno failo ilgį ir duomenų tipą. Programa, gaunanti atskirtus failus, turi žinoti skyriklį, kurio ieškoti.

Atmesti įrašai

Kiekvienu atveju importuojančios programos turėtų turėti išimčių ataskaitų teikimo procedūras, kurios išrašo atmestus įrašus į atskirą failą. Dažniausia priežastis, dėl kurios atskirtas įrašas atmetamas, yra ta, kad skirtukas pasirodo duomenyse, sukuriant papildomus stulpelius. Fiksuoto pločio įrašai paprastai atmetami, nes yra per ilgi. Trumpi įrašai dažniausiai nesukelia klaidų. Galutiniai laukai bus nepildyti. Jei galutiniai laukai yra privalomi, trumpi įrašai bus atmesti.