När vi får ont om utrymme för data vill forskare lagra dem i DNA

Google

Först den apokalyptiska varningen: Vi får slut på datalagring.

Innehåll

  • Data, data, överallt
  • Är DNA svaret?
  • Allt handlar om lagring
  • Föreställ dig möjligheterna

Chansen är stor att detta inte är något du har behövt oroa dig för mycket för de senaste åren. Det fanns en tid, för inte så länge sedan, när din dators ändliga hårddisk var allt lagringsutrymme du hade tillgängligt. Träffade den gränsen (som, i fallet med min egen första dator, var mindre än 100 MB) och du tog till disketter och annan lokal extern lagring. När du fick slut på det också, fick du radera.

Varje dag skapas cirka 2,5 kvintiljon byte data, tack vare de 3,7 miljarder människor som nu använder internet.

Vi tar inte bort fler. Inte heller företag, särskilt de som värderas utifrån den data de äger. Istället driver vi helt enkelt våra filer till molnet, vars namn är tillfälligt och eteriskt; saknar verklig kroppslighet. Var lagras uppgifterna? Det spelar ingen roll så länge vi kan få tillbaka det. Vilka är farorna med att få slut på molnlagring? Till synes väldigt lite, förutom att behöva öka dina månatliga prenumerationsbetalningar för att låsa upp mer härligt ledigt utrymme.

Relaterad

  • USA: s regering och stortekniker vill använda platsdata för att bekämpa coronaviruset
  • DNA, laseretsat glas och mer: En titt in i framtiden för datalagring
  • Microsofts senaste genombrott kan göra DNA-baserade datacenter möjliga

Som ett resultat av detta är tanken att vi en dag kan få slut på datalagring lika svår att slå in i huvudet runt som förslaget att vi skulle kunna få slut på vatten: den härliga fria resursen som faller från himmel. Men 2018 är året då Kapstaden, Sydafrika, kom brant nära att få slut på vatten. Och vi kan få slut på datalagring också.

Data, data, överallt

Anledningen till detta är den ofattbara takten i vilken vi för närvarande producerar data. Varje dag skapas cirka 2,5 kvintiljon byte data, tack vare de 3,7 miljarder människor som nu använder internet. Bara under de senaste två åren har häpnadsväckande 90 procent av världens data skapats. Med ett växande antal smarta enheter anslutna till Internet of Things kommer den siffran att öka avsevärt.

Graf över total dataskapande
Diagram som visar hur mycket data som kommer att behöva lagras
Katalog

"När vi tänker på molnlagring tänker vi på dessa oändliga datalager," Hyunjun Park, VD och medgrundare av datalagringsföretaget Katalog, berättade för Digital Trends. "Men molnet är egentligen bara någon annans dator. Vad de flesta inte inser är att vi genererar så mycket data att takten som vi genererar den i vida överskrider vår förmåga att lagra allt. Inom en mycket nära framtid kommer vi att ha ett stort gap mellan den användbara data som vi genererar och hur vi kan lagra den med konventionella medier."

Catalog har utvecklat teknik som de tror kan förändra sättet vi lagrar data på.

Eftersom molnlagringsföretag är upptagna med att bygga nya datacenter och utöka sina befintliga, i en hastighet av knop, är det svårt att räkna ut när vi kan få slut på datalagringskapacitet. Det finns ingen filmliknande nedräkningsklocka. Enligt Park kan dock mänskligheten redan 2025 ha producerat mer än 160 zettabyte data kumulativt. (En zettabyte, om du undrar, är en biljon gigabyte.) Hur mycket av detta kommer vi att kunna lagra? Runt 12,5 procent av det, föreslår Park.

Det är klart att något måste göras.

Är DNA svaret?

Det är där Park och andra MIT-forskare och medgrundare Nathaniel Roquet kommer in i bilden. Deras startup Catalog har utvecklat teknik som de tror skulle kunna transformera datalagring som vi känner den; tillåter, eller så hävdar de, att hela världens data bekvämt passar in i ett utrymme som är lika stort som en klädskåp.

Katalogs DNA-lagringsteam
Katalogs DNA-lagringsteam i labbet.Katalog

Katalogs lösning? Genom att koda in data i DNA. Det kan låta som handlingen i en Michael Crichton-roman, men deras skalbara och prisvärda lösning är seriös och har så far fick 9 miljoner dollar i riskfinansiering – tillsammans med stöd från ledande professorer från Stanford och Harvard universitet.

"En fråga jag ofta får är "Vems DNA använder vi?"" skrattade Park. "Folk är rädda för att vi ska ta DNA från människor och förvandla dem till mutanter, eller sånt."

I flera år har flaskhalsar hindrat DNA från att leva upp till sin enorma datalagringspotential.

Detta är inte, vi borde klargöra, vad Catalog gör. Det DNA som företaget kodar data till är en syntetisk polymer. Det är inte något som kommer från ett biologiskt ursprung, och serien av baspar som data kodas i, som en serie av ettor och nollor, är inte koden för något levande. Men slutprodukten är inte desto mindre biologiskt oskiljbar från något du kan hitta i en levande cell.

Idén om att DNA är en potentiell lagringsmetod har spekulerats över i decennier nu, praktiskt taget sedan James Watson och Francis Crick upptäckte dubbelhelixen 1953. Men fram till nu har det funnits ett antal flaskhalsar som har hindrat den från att leva upp till sina enorm potential som en beräkningsdatalagringslösning.

Traditionellt tänkande kring DNA-baserad datalagring fokuserade på syntesen av nya DNA-molekyler; kartlägga sekvensen av bitar till sekvensen av DNA: s fyra baspar och göra tillräckligt med molekyler för att representera alla siffror du vill lagra. Problemet är att denna process är långsam och dyr, båda stora flaskhalsar när det gäller att lagra data.

DNA-lagringskapacitet kontra traditionell
Hur Catalog syntetiserar lagring till DNA
Katalog

Catalogs tillvägagångssätt bygger på att frikoppla syntesprocessen från kodningsprocessen. I huvudsak genererar företaget ett enormt antal av bara några få olika molekyler (gör det mycket billigare) och kodar sedan informationen genom att generera en enorm mångfald från de färdigtillverkade molekylerna.

Som en analogi liknade Catalog det tidigare tillvägagångssättet för att tillverka anpassade hårddiskar med all din data fastansluten. Att lagra olika data innebär att bygga en helt ny hårddisk från grunden. De föreslår att deras tillvägagångssätt liknar att massproducera tomma hårddiskar och sedan fylla den med kodad information när det behövs.

Allt handlar om lagring

Den spännande delen av allt detta är den häpnadsväckande mängden data den kan lagra. Som ett bevis på konceptet har Catalog använt sin teknik för att koda böcker som Liftarens guide till galaxen in i DNA. Men det är ingenting jämfört med möjligheterna.

Från början till slut tar det minst flera timmar att läsa data från DNA.

"Om du jämför äpplen med äpplen, kommer bitarna du kan lagra i samma volym att vara ungefär 1 miljon gånger informationstätheten för en solid-state-enhet," sa Park. "Vad du än kan lagra på en flashenhet, kan du lagra 1 miljon gånger så mycket i samma volym om du gör det i DNA."

Jämförelsen med solid-state-enheter är dock inte exakt. DNA kanske kan lagra mycket mer information i samma volym, men det har inte omedelbar tillgång till, säg, en USB-ansluten flash-enhet. Catalogs tillvägagångssätt förvandlar data till en solid pellet av syntetisk polymer.

För att komma åt dina data skulle forskare behöva ta pelletsen, rehydrera den genom att tillsätta vatten och sedan läsa den med en DNA-sekvenserare. Detta ger DNA: ts baspar, som i sin tur sedan kan användas för att beräkna ettorna och nollorna som återmonterar dina data. Från början till slut kommer processen att ta minst flera timmar.

Katalogs DNA-team i labbet
För att hämta data från DNA, skulle forskare behöva ta pelleten den är lagrad på, rehydrera den genom att tillsätta vatten och sedan läsa den med en DNA-sekvenserare.Katalog

Av denna anledning riktar sig Catalog initialt till en marknad som är van vid dessa typer av förseningar: arkiveringsmarknaden. Detta är den typ av data som för närvarande lagras på format som magnetband, som används för att hålla reda på av den typ av information som du kanske hoppas att du inte behöver besöka igen, men som fortfarande är avgörande att hänga till. (Föreställ dig företagets motsvarighet till garantin för ditt kylskåp.)

Men finns det någonsin en punkt då detta kommer att vara viktigt för den genomsnittliga användaren? När allt kommer omkring, som vi påpekade överst i den här artikeln, tänker de flesta av oss inte så mycket på vår data och var den förvaras. Är det på magnetband? Är den på solid state-lagring? Vi har inget emot det så länge det finns där när vi behöver det.

DNA-baserad datakodning kommer sannolikt att vara ett långtidslagringsalternativ, medan korttidsdata tar andra former.

På grund av hur lång tid det tar att hämta information är det osannolikt att det någonsin kommer att finnas en punkt där, för till exempel lagras din Google Cloud-information i enorma kärl med DNA eller som en serie marmorliknande pellets i Mountain View, CA. Skulle Catalog kunna bevisa sitt koncept för företag, är detta sannolikt ett långtidslagringsalternativ, medan korttidsdata tar andra former.

Föreställ dig möjligheterna

Ett rör som innehåller miljontals kopior av data kodad till DNA.Katalog

Det finns dock spännande sci-fi-ljudmöjligheter. "Föreställ dig en subkutan pellet som innehåller alla dina hälsodata, alla dina MRA-skanningar, dina blodprov, dina röntgenbilder från din tandläkare," sa Park. "Du skulle alltid vilja att den informationen skulle vara mycket tillgänglig för dig, men du vill inte nödvändigtvis ha den uppe i molnet någonstans, eller på en osäkrad server på ett sjukhus. Om du hade det med dig i form av DNA, kunde du fysiskt kontrollera den datan och tillgången till den, samtidigt som du såg till att endast de auktoriserade läkarna kunde ha tillgång till dem.”

Trots allt, som han påpekar, har alla sjukhus idag DNA-sekvenserare. "Jag säger inte att vi eftersträvar det just nu, men det är en möjlig framtid", sa han.

Efter att ha annonserat sitt nya företag för världen, fokuserar Catalog nu på att genomföra några pilotprojekt för att visa hur denna teknik kan användas effektivt. "Det här är inte vetenskapliga utmaningar som vi har kvar att lösa, utan snarare mekaniska optimeringsproblem," noterade han.

Att, enligt hans eget erkännande, ha kommit in på detta område för att det lät som ett coolt tekniskt förhållningssätt till en stor Park är nu övertygad om att DNA-datalagring kan visa sig vara en av våra viktigaste teknologier tid.

Heck, när det gäller att kunna arkivera mänsklig historia som vi känner den, är det svårt att inte hålla med. "Det handlar om att bevara vårt sätt att leva som vi känner det," förklarade han.

Redaktörens rekommendationer

  • Är gamla skolans magnetband framtidens datalagringsmedium?
  • Kina vill använda kontroversiell DNA-analys för att gissa brottslingars ansikten
  • Denna bioteknikstartup vill lägga ditt DNA i ett valv på månen
  • Caltech-forskare använde DNA för att spela världens minsta spel med tick-tac-toe
  • Precisionsmedicin beror på DNA, men att skicka ut ditt spott har fortfarande risker