![](/f/dabcd1a8a3c213f2c10d04ad0a03614e.jpg)
Eerst de apocalyptische waarschuwing: we hebben bijna geen gegevensopslag meer.
Inhoud
- Gegevens, gegevens, overal
- Is DNA het antwoord?
- Het draait allemaal om de opslag
- Stel je de mogelijkheden eens voor
De kans is groot dat u zich daar de afgelopen jaren niet al te veel zorgen over heeft gemaakt. Er was een tijd, nog niet zo lang geleden, dat de beperkte harde schijf van je computer de enige opslagruimte was die je ter beschikking had. Als je die limiet bereikte (die, in het geval van mijn eigen eerste computer, minder dan 100 MB was) en je je toevlucht nam tot diskettes en andere lokale externe opslag. Toen je dat ook opraakte, werd je verwijderd.
Elke dag worden er ongeveer 2,5 biljoen bytes aan gegevens gecreëerd, dankzij de 3,7 miljard mensen die nu internet gebruiken.
We verwijderen niets meer. Dat geldt ook voor bedrijven, vooral niet als ze worden gewaardeerd op basis van de gegevens die ze bezitten. In plaats daarvan sturen we onze bestanden eenvoudigweg naar de cloud, waarvan de naam kortstondig en etherisch is; zonder enige echte lichamelijkheid. Waar worden de gegevens opgeslagen? Het maakt niet uit, zolang we het maar terug kunnen krijgen. Wat zijn de gevaren als de cloudopslag opraakt? Schijnbaar heel weinig, afgezien van het feit dat je je maandelijkse abonnementsbetalingen moet verhogen om meer glorieuze vrije ruimte te ontgrendelen.
Verwant
- De Amerikaanse overheid en big tech willen locatiegegevens gebruiken om het coronavirus te bestrijden
- DNA, lasergeëtst glas en meer: een kijkje in de toekomst van gegevensopslag
- De nieuwste doorbraak van Microsoft zou op DNA gebaseerde datacenters mogelijk kunnen maken
Als gevolg hiervan is het idee dat we op een dag misschien geen gegevensopslag meer hebben, net zo moeilijk te begrijpen rond als de suggestie dat we zonder water kunnen komen te zitten: die glorieuze vrije hulpbron die uit de aarde valt lucht. Maar 2018 is het jaar waarin Kaapstad, Zuid-Afrika, kwam bijna zonder water komen te zitten. En het kan ook zijn dat we geen gegevensopslag meer hebben.
Gegevens, gegevens, overal
De reden hiervoor is het onvoorstelbare tempo waarin we momenteel data produceren. Elke dag worden er ongeveer 2,5 biljoen bytes aan gegevens gecreëerd, dankzij de 3,7 miljard mensen die nu internet gebruiken. Alleen al in de afgelopen twee jaar is een verbijsterende 90 procent van alle data in de wereld gecreëerd. Nu er steeds meer slimme apparaten met het internet der dingen verbonden zijn, zal dat cijfer aanzienlijk stijgen.
![Grafiek van de totale gegevenscreatie](/f/57a3ef77221abcf5af4374dfecbeeed7.png)
![Grafiek die laat zien hoeveel gegevens er moeten worden opgeslagen](/f/71d78f9fd230f868622b5031d5048e33.png)
“Als we aan cloudopslag denken, denken we aan deze oneindige dataopslag”, zegt Hyunjun Park, CEO en medeoprichter van het dataopslagbedrijf. Catalogus, vertelde Digitale Trends. “Maar de cloud is eigenlijk gewoon de computer van iemand anders. Wat de meeste mensen zich niet realiseren is dat we zoveel gegevens genereren dat de snelheid waarmee we deze genereren veel groter is dan ons vermogen om ze allemaal op te slaan. In de zeer nabije toekomst zal er een enorme kloof ontstaan tussen de nuttige gegevens die we genereren en de manier waarop we deze kunnen opslaan met behulp van conventionele media.”
Catalog heeft technologie ontwikkeld waarvan zij denken dat deze de manier waarop we gegevens opslaan kan transformeren.
Omdat cloudopslagbedrijven druk bezig zijn met het bouwen van nieuwe datacenters en het uitbreiden van hun bestaande, met een snelheid van knopen, is het moeilijk om te bepalen wanneer de dataopslagcapaciteit opraakt. Er is geen aftelklok in filmstijl. Volgens Park kan de mensheid echter al in 2025 cumulatief meer dan 160 zettabytes aan gegevens hebben geproduceerd. (Een zettabyte, voor het geval je het je afvraagt, is een biljoen gigabyte.) Hoeveel hiervan kunnen we opslaan? Ongeveer 12,5 procent daarvan, suggereert Park.
Het is duidelijk dat er iets moet gebeuren.
Is DNA het antwoord?
Dat is waar Park en collega-MIT-wetenschapper en mede-oprichter Nathaniel Roquet in beeld komen. Hun startup Catalog heeft technologie ontwikkeld waarvan zij denken dat deze de gegevensopslag zoals wij die kennen kan transformeren; waardoor, zo beweren zij, alle gegevens van de wereld comfortabel in een ruimte ter grootte van een garderobe passen.
![Het DNA-opslagteam van Catalog](/f/f13e4626afecbaa1e8907e32a8467a10.jpeg)
Catalogus oplossing? Door gegevens in DNA te coderen. Dat klinkt misschien als de plot van een roman van Michael Crichton, maar hun schaalbare en betaalbare oplossing is serieus, en dat is ook zo ontving tot nu toe negen miljoen dollar aan durfkapitaal – samen met de steun van vooraanstaande professoren van Stanford en Harvard Universiteiten.
“Een vraag die mij vaak wordt gesteld is: ‘Wiens DNA gebruiken we?’” Park lachte. “Mensen zijn bang dat we DNA van mensen afnemen en ze in mutanten veranderen, of dat soort dingen.”
Jarenlang hebben knelpunten het DNA ervan weerhouden zijn enorme potentieel voor gegevensopslag waar te maken.
We moeten duidelijk maken dat dit niet is wat Catalog doet. Het DNA waarin het bedrijf gegevens codeert, is een synthetisch polymeer. Het is niet iets dat van biologische oorsprong komt, en de reeks basenparen waarin de gegevens zijn gecodeerd, als een reeks enen en nullen, is niet de code voor iets levends. Maar het eindproduct is desalniettemin biologisch niet te onderscheiden van iets dat je in een levende cel aantreft.
Er wordt al tientallen jaren gespeculeerd over het idee dat DNA een mogelijke opslagmethode zou kunnen zijn, vrijwel sinds James Watson en Francis Crick in 1953 de dubbele helix ontdekten. Tot nu toe zijn er echter een aantal knelpunten geweest die het bedrijf ervan weerhielden zijn verwachtingen waar te maken enorm potentieel als oplossing voor computationele gegevensopslag.
Het traditionele denken over op DNA gebaseerde gegevensopslag was gericht op de synthese van nieuwe DNA-moleculen; het in kaart brengen van de reeks bits aan de reeks van de vier basenparen van DNA en het maken van voldoende moleculen om alle getallen weer te geven die u wilt opslaan. Het probleem is dat dit proces langzaam en duur is, beide aanzienlijke knelpunten als het gaat om het opslaan van gegevens.
![DNA-opslagcapaciteit versus traditioneel](/f/c232241fa6eef52b56ed60975dceadc5.png)
![Hoe Catalog de opslag van DNA synthetiseert](/f/dc8992c6bd3e686eb33755be952cc57c.png)
De aanpak van Catalog is gebaseerd op het loskoppelen van het syntheseproces van het coderingsproces. In wezen genereert het bedrijf enorme aantallen van slechts een paar verschillende moleculen (waardoor het veel goedkoper wordt) en codeert vervolgens de informatie door een enorme diversiteit te genereren uit de kant-en-klare moleculen.
Ter analogie vergeleek Catalog de vorige aanpak met het vervaardigen van op maat gemaakte harde schijven met al uw gegevens erop aangesloten. Het opslaan van verschillende gegevens betekent dat u een geheel nieuwe harde schijf vanaf de grond af aan moet bouwen. Hun aanpak, zo suggereren ze, lijkt op het massaal produceren van lege harde schijven, en deze vervolgens te vullen met de gecodeerde informatie wanneer dat nodig is.
Het draait allemaal om de opslag
Het opwindende van dit alles is de verbijsterende hoeveelheid gegevens die het kan opslaan. Als proof of concept heeft Catalog zijn technologie gebruikt om boeken zoals The Hitchhikers Guide to the Galaxy in DNA. Maar dat is niets vergeleken met de mogelijkheden.
Van begin tot eind zal het aflezen van DNA-gegevens minimaal enkele uren in beslag nemen.
"Als je appels met appels vergelijkt, komen de bits die je in hetzelfde volume kunt opslaan uit op ongeveer 1 miljoen keer de informatiedichtheid van een SSD", aldus Park. “Wat je ook op een flashdrive kunt opslaan, je zou een miljoen keer zoveel in hetzelfde volume kunnen opslaan als je het in DNA doet.”
De vergelijking met solid-state drives is echter niet exact. DNA kan misschien veel meer informatie in hetzelfde volume opslaan, maar het heeft niet de directe toegang van bijvoorbeeld een via USB aangesloten flashdrive. De aanpak van Catalog transformeert gegevens in een vaste pellet van synthetisch polymeer.
Om toegang te krijgen tot uw gegevens, moeten wetenschappers de pellet nemen, deze rehydrateren door water toe te voegen en deze vervolgens lezen met behulp van een DNA-sequencer. Dit levert de basenparen van het DNA op, die op hun beurt kunnen worden gebruikt om de enen en nullen te berekenen die uw gegevens opnieuw samenstellen. Van begin tot eind duurt het proces minimaal enkele uren.
![Het DNA-team van Catalog in het laboratorium](/f/9514535fea2b95fe0c1d27389f3ad40b.jpg)
Om deze reden richt Catalog zich in eerste instantie op een markt die gewend is aan dit soort vertragingen: de archiveringsmarkt. Dit is het soort gegevens dat momenteel wordt opgeslagen op formaten zoals magneetband, die worden gebruikt om bij te houden van het soort informatie waarvan u misschien hoopt dat u deze niet opnieuw hoeft te bekijken, maar die toch van cruciaal belang is om op te hangen op. (Stel je het zakelijke equivalent voor van de garantie op je koelkast.)
Maar is er ooit een punt waarop dit voor de gemiddelde gebruiker van belang zal zijn? Zoals we bovenaan dit artikel hebben aangegeven, denken de meesten van ons tenslotte niet zo veel na over onze gegevens en waar deze worden bewaard. Staat het op magneetband? Staat het op solid-state opslag? We vinden het niet erg, zolang het er maar is als we het nodig hebben.
Op DNA gebaseerde gegevenscodering is waarschijnlijk een optie voor opslag op de lange termijn, terwijl gegevens voor de korte termijn andere vormen aannemen.
Vanwege de hoeveelheid tijd die het kost om informatie op te halen, is het onwaarschijnlijk dat dit ooit zal gebeuren Uw Google Cloud-informatie wordt bijvoorbeeld opgeslagen in enorme vaten met DNA of als een reeks marmerachtige pellets in Mountain Uitzicht, CA. Mocht Catalog zijn concept aan bedrijven kunnen bewijzen, dan is dit waarschijnlijk een optie voor opslag op de lange termijn, terwijl gegevens voor de korte termijn andere vormen aannemen.
Stel je de mogelijkheden eens voor
![](/f/fc955cd7a2acbc8a359159242d2d7eeb.jpg)
Er zijn echter opwindende sci-fi-klinkende mogelijkheden. “Stel je een onderhuidse pellet voor die al je gezondheidsgegevens bevat, al je MRA-scans, je bloedonderzoeken, je röntgenfoto’s van je tandarts,” zei Park. “Je zou altijd willen dat die data heel toegankelijk voor je zijn, maar je wilt niet per se dat ze ergens in de cloud staan, of op een onbeveiligde server in een ziekenhuis. Als je dat bij je zou hebben in de vorm van DNA, zou je die gegevens fysiek kunnen controleren en er toegang toe hebben, terwijl je ervoor kunt zorgen dat alleen de bevoegde artsen er toegang toe hebben.”
Zoals hij opmerkt, beschikken alle ziekenhuizen tegenwoordig immers over DNA-sequencers. “Ik zeg niet dat we dat nu nastreven, maar het is een mogelijke toekomst”, zei hij.
Nadat Catalog hun nieuwe bedrijf aan de wereld heeft aangekondigd, richt zij zich nu op het uitvoeren van enkele proefprojecten om aan te tonen hoe deze technologie effectief kan worden gebruikt. “Dit zijn geen wetenschappelijke uitdagingen die we nog moeten oplossen, maar eerder mechanische optimalisatieproblemen”, merkte hij op.
Omdat hij, naar eigen zeggen, dit vakgebied was betreden omdat het klonk als een coole technologische benadering voor een grote Probleem is dat Park er nu van overtuigd is dat de opslag van DNA-gegevens een van de belangrijkste technologieën van onze tijd kan blijken te zijn tijd.
Ach, als het gaat om het kunnen archiveren van de menselijke geschiedenis zoals wij die kennen, kun je het moeilijk oneens zijn. “Het gaat om het behoud van onze manier van leven zoals we die kennen”, legde hij uit.
Aanbevelingen van de redactie
- Zijn ouderwetse magneetbanden het gegevensopslagmedium van de toekomst?
- China wil controversiële DNA-analyse gebruiken om gezichten van criminelen te raden
- Deze biotech-startup wil jouw DNA in een kluis op de maan stoppen
- Wetenschappers van Caltech gebruikten DNA om het kleinste boter-kaas-en-eierenspel ter wereld te spelen
- Precisiegeneeskunde is afhankelijk van DNA, maar het versturen van uw spuug brengt nog steeds risico's met zich mee