
Først den apokalyptiske advarsel: Vi er ved at løbe tør for datalagring.
Indhold
- Data, data, overalt
- Er DNA svaret?
- Det hele handler om opbevaring
- Forestil dig mulighederne
Chancerne er, at dette ikke er noget, du har skullet bekymre dig for meget om i de seneste år. Der var engang, for ikke så længe siden, hvor din computers begrænsede harddisk var al den lagerplads, du havde til rådighed. Ramte den grænse (som i tilfældet med min egen første computer var mindre end 100 MB), og du tyede til disketter og anden lokal ekstern lagring. Da du også løb tør for det, blev du slettet.
Hver dag skabes der omkring 2,5 kvintillion bytes data, takket være de 3,7 milliarder mennesker, der nu bruger internettet.
Vi sletter ikke mere. Det gør virksomheder heller ikke, især dem, der vurderes ud fra de data, de ejer. I stedet driver vi simpelthen vores filer til skyen, hvis selve navn er flygtig og æterisk; mangler nogen egentlig fysiskhed. Hvor opbevares dataene? Det betyder ikke noget, så længe vi kan få det tilbage. Hvad er farerne ved at løbe tør for skylager? Tilsyneladende meget lidt, udover at skulle øge dine månedlige abonnementsbetalinger for at låse op for mere herlig ledig plads.
Relaterede
- Den amerikanske regering og store teknologier ønsker at bruge lokationsdata til at bekæmpe coronavirus
- DNA, laserætset glas og mere: Et kig ind i fremtiden for datalagring
- Microsofts seneste gennembrud kan gøre DNA-baserede datacentre mulige
Som et resultat er tanken om, at vi en dag kan løbe tør for datalagring, lige så svær at pakke dit hoved rundt som forslaget om, at vi kunne løbe tør for vand: den herlige gratis ressource, der falder fra himmel. Men 2018 er året, hvor Cape Town, Sydafrika, kom brat tæt på at løbe tør for vand. Og vi kan også løbe tør for datalagring.
Data, data, overalt
Årsagen til dette er det ufattelige tempo, hvormed vi i øjeblikket producerer data. Hver dag skabes der omkring 2,5 kvintillion bytes data, takket være de 3,7 milliarder mennesker, der nu bruger internettet. Alene inden for de sidste to år er der blevet skabt forbløffende 90 procent af verdens data. Med et voksende antal smarte enheder, der er forbundet til Internet of Things, er det tal sat til at stige markant.


"Når vi tænker på cloud storage, tænker vi på disse uendelige lagre af data," Hyunjun Park, CEO og medstifter af datalagringsfirmaet Katalog, fortalte Digital Trends. "Men skyen er egentlig bare en andens computer. Hvad de fleste mennesker ikke er klar over, er, at vi genererer så meget data, at det tempo, hvormed vi genererer det, langt overgår vores evne til at gemme det hele. I den meget nære fremtid vil vi have en enorm kløft mellem de nyttige data, som vi genererer, og hvordan vi er i stand til at gemme dem ved hjælp af konventionelle medier."
Catalog har udviklet teknologi, som de mener kan ændre den måde, vi opbevarer data på.
Da cloud-lagringsvirksomheder har travlt med at bygge nye datacentre og udvide deres eksisterende med en fart på knob, er det svært at regne ud, hvornår vi kan løbe tør for datalagringskapacitet. Der er ikke noget nedtællingsur i filmstil. Ifølge Park kan menneskeheden dog allerede i 2025 have produceret mere end 160 zettabyte data kumulativt. (En zettabyte, hvis du undrer dig, er en billion gigabyte.) Hvor meget af dette vil vi være i stand til at gemme? Omkring 12,5 procent af det, foreslår Park.
Det er klart, at der skal gøres noget.
Er DNA svaret?
Det er her, Park og andre MIT-forsker og medstifter Nathaniel Roquet kommer ind i billedet. Deres startup Catalog har udviklet teknologi, som de mener kunne transformere datalagring, som vi kender det; tillader, eller det hævder de, at al verdens data komfortabelt passer ind i et rum på størrelse med et frakkeskab.

Katalogs løsning? Ved at indkode data i DNA. Det lyder måske som plottet i en Michael Crichton-roman, men deres skalerbare og overkommelige løsning er seriøs og har så langt modtaget 9 millioner dollars i venturefinansiering - sammen med støtte fra førende professorer fra Stanford og Harvard Universiteter.
"Et spørgsmål, jeg ofte bliver stillet, er: 'Hvis DNA bruger vi?'" Park grinede. "Folk er bange for, at vi tager DNA fra mennesker og forvandler dem til mutanter eller sådan noget."
I årevis har flaskehalse forhindret DNA i at leve op til dets enorme datalagringspotentiale.
Det er ikke, vi bør gøre det klart, hvad Catalog gør. Det DNA, som virksomheden koder data til, er en syntetisk polymer. Det er ikke noget, der kommer fra en biologisk oprindelse, og rækken af basepar, som dataene er kodet ind i, som en serie af enere og nuller, er ikke koden for noget levende. Men slutproduktet er ikke desto mindre biologisk umuligt at skelne fra noget, du måske finder i en levende celle.
Ideen om, at DNA er en potentiel lagringsmetode, har været spekuleret over i årtier nu, praktisk talt siden James Watson og Francis Crick opdagede den dobbelte helix i 1953. Indtil nu har der dog været en række flaskehalse, der har forhindret den i at leve op til sit massivt potentiale som en beregningsmæssig datalagringsløsning.
Traditionel tænkning om DNA-baseret datalagring fokuseret på syntesen af nye DNA-molekyler; at kortlægge sekvensen af bit til sekvensen af DNA's fire basepar og lave nok molekyler til at repræsentere alle de tal, du vil gemme. Problemet er, at denne proces er langsom og dyr, begge betydelige flaskehalse, når det kommer til lagring af data.


Catalogs tilgang er baseret på at afkoble synteseprocessen fra indkodningsprocessen. Grundlæggende genererer virksomheden enorme antal af blot nogle få forskellige molekyler (gør det meget billigere) og koder derefter informationen ved at generere en enorm diversitet fra de præfabrikerede molekyler.
Som en analogi sammenlignede Catalog den tidligere tilgang til fremstilling af brugerdefinerede harddiske med alle dine data fastkablet. Lagring af forskellige data betyder at bygge en helt ny harddisk fra bunden. Deres tilgang, foreslår de, er beslægtet med at masseproducere tomme harddiske og derefter udfylde den med den kodede information efter behov.
Det hele handler om opbevaring
Den spændende del af alt dette er den forbløffende mængde data, den kan gemme. Som et bevis på konceptet har Catalog brugt sin teknologi til at kode bøger som f.eks Blafferens guide til galaksen ind i DNA. Men det er ingenting i forhold til mulighederne.
Fra start til slut vil aflæsning af data fra DNA tage minimum flere timer.
"Hvis du sammenligner æbler med æbler, kommer de bits, du kan gemme i samme volumen, ud på noget i retning af 1 million gange informationstætheden af et solid-state-drev," sagde Park. "Uanset hvad du kan gemme på et flashdrev, kan du gemme 1 million gange så meget i samme volumen, hvis du gør det i DNA."
Sammenligningen med solid-state-drev er dog ikke nøjagtig. DNA kan muligvis gemme langt mere information i samme volumen, men det har ikke den øjeblikkelige adgang til for eksempel et USB-tilsluttet flashdrev. Catalogs tilgang transformerer data til en solid pellet af syntetisk polymer.
For at få adgang til dine data skal forskerne tage den nævnte pellet, rehydrere den ved at tilføje vand og derefter læse den ved hjælp af en DNA-sequencer. Dette giver DNA'ets basepar, som igen kan bruges til at beregne de eter og nuller, der samler dine data igen. Fra start til slut vil processen tage minimum flere timer.

Af denne grund retter Catalog sig i første omgang mod et marked, der er vant til den slags forsinkelser: arkiveringsmarkedet. Dette er den slags data, der i øjeblikket er gemt på formater som magnetbånd, der bruges til at holde styr på af den slags information, som du måske håber ikke at skulle gense, men som stadig er afgørende at hænge på. (Forestil dig virksomhedens ækvivalent til garantien til dit køleskab.)
Men er der nogensinde et tidspunkt, hvor dette vil have betydning for den gennemsnitlige bruger? Når alt kommer til alt, som vi påpegede øverst i denne artikel, tænker de fleste af os egentlig ikke så meget over vores data, og hvor de opbevares. Er det på magnetbånd? Er det på solid-state storage? Vi gider ikke, så længe det er der, når vi har brug for det.
DNA-baseret datakodning vil sandsynligvis være en langsigtet opbevaringsmulighed, mens kortsigtede data antager andre former.
På grund af den tid, det tager at hente information, er der næppe nogensinde et tidspunkt, hvor for eksempel er dine Google Cloud-oplysninger gemt i enorme beholdere med DNA eller som en række marmorlignende pellets i bjerget View, CA. Skulle Catalog være i stand til at bevise sit koncept over for virksomheder, vil dette sandsynligvis være en langsigtet opbevaringsmulighed, mens kortsigtede data antager andre former.
Forestil dig mulighederne

Der er dog spændende sci-fi-lydende muligheder. "Forestil dig en subkutan pellet, der indeholder alle dine sundhedsdata, alle dine MRA-scanninger, dine blodprøver, dine røntgenbilleder fra din tandlæge," sagde Park. "Du vil altid gerne have, at dataene er meget tilgængelige for dig, men du vil ikke nødvendigvis have dem op i skyen et eller andet sted eller på en usikret server på et hospital. Hvis du havde det med dig i form af DNA, kunne du fysisk kontrollere disse data og adgang til dem, samtidig med at du sikrede dig, at kun de autoriserede læger kunne have adgang til dem.”
Som han påpeger, har alle hospitaler i dag DNA-sekventører. "Jeg siger ikke, at vi forfølger det lige nu, men det er en mulig fremtid," sagde han.
Efter at have annonceret deres nye virksomhed til verden, er Catalog nu fokuseret på at udføre nogle pilotprojekter for at demonstrere, hvordan denne teknologi kan bruges effektivt. "Dette er ikke videnskabelige udfordringer, vi har tilbage at løse, men snarere mekaniske optimeringsproblemer," bemærkede han.
Efter at have indrømmet, at have gået ind på dette felt, fordi det lød som en cool teknologisk tilgang til en stor Park er nu overbevist om, at lagring af DNA-data kan vise sig at være en af vores vigtigste teknologier tid.
For pokker, når det kommer til at kunne arkivere menneskets historie, som vi kender den, er det svært at være uenig. "Det handler om at bevare vores livsstil, som vi kender den," forklarede han.
Redaktørens anbefalinger
- Er gammeldags magnetbånd fremtidens datalagringsmedie?
- Kina ønsker at bruge kontroversiel DNA-analyse til at gætte kriminelles ansigter
- Denne bioteknologiske startup ønsker at lægge dit DNA i en hvælving på månen
- Caltech-forskere brugte DNA til at spille verdens mindste spil med tik-tac-toe
- Præcisionsmedicin afhænger af DNA, men at sende dit spyt ud har stadig risici