Kada nam ponestane prostora za podatke, znanstvenici ih žele pohraniti u DNK

Google

Prvo apokaliptično upozorenje: ponestaje nam prostora za pohranu podataka.

Sadržaj

  • Podaci, podaci, posvuda
  • Je li DNK odgovor?
  • Sve je u pohrani
  • Zamislite mogućnosti

Šanse su da ovo nije nešto o čemu ste morali previše brinuti posljednjih godina. Bilo je vrijeme, ne tako davno, kada je ograničeni tvrdi disk vašeg računala bio sva pohrana koju ste imali na raspolaganju. Dosegli ste to ograničenje (koje je, u slučaju mog prvog računala, bilo manje od 100 MB) i pribjegli ste disketama i drugoj lokalnoj vanjskoj pohrani. Kad vam je i to ponestalo, dobili ste brisanje.

Svaki dan se stvori oko 2,5 kvintilijuna bajtova podataka zahvaljujući 3,7 milijardi ljudi koji sada koriste internet.

Više ne brišemo. Kao ni tvrtke, pogotovo one koje se vrednuju na temelju podataka koje posjeduju. Umjesto toga, svoje datoteke jednostavno prenosimo u oblak, čije je samo ime prolazno i ​​eterično; bez ikakve stvarne tjelesnosti. Gdje su podaci pohranjeni? Nije važno sve dok ga možemo vratiti. Koje su opasnosti od nedostatka pohrane u oblaku? Naizgled vrlo malo, osim što morate povećati svoje mjesečne pretplate kako biste otključali više veličanstvenog besplatnog prostora.

Povezano

  • Američka vlada i velika tehnologija žele koristiti podatke o lokaciji u borbi protiv koronavirusa
  • DNK, laserski urezano staklo i više od toga: Zavirite u budućnost pohrane podataka
  • Microsoftovo najnovije otkriće moglo bi omogućiti podatkovne centre temeljene na DNK

Kao rezultat toga, pomisao da bi nam jednog dana moglo ponestati prostora za pohranu podataka teško je zamisliti okolo kao sugestija da bi nam moglo ponestati vode: taj veličanstveni besplatni resurs koji pada iz nebo. Ali 2018. je godina u kojoj je došao Cape Town, Južnoafrička Republika strmoglavo blizu da ostane bez vode. A mogli bismo ostati i bez pohrane podataka.

Podaci, podaci, posvuda

Razlog tome je nezamisliva brzina kojom trenutno proizvodimo podatke. Svaki dan se stvori oko 2,5 kvintilijuna bajtova podataka zahvaljujući 3,7 milijardi ljudi koji sada koriste internet. Samo u posljednje dvije godine stvoreno je nevjerojatnih 90 posto svjetskih podataka. Uz sve veći broj pametnih uređaja povezanih s Internetom stvari, ta će se brojka značajno povećati.

Grafikon ukupnog kreiranja podataka
Grafikon koji prikazuje koliko će podataka trebati pohraniti
Katalog

"Kad razmišljamo o pohrani u oblaku, mislimo na ove beskonačne pohrane podataka", Hyunjun Park, izvršni direktor i suosnivač tvrtke za pohranu podataka Katalog, rekao je za Digital Trends. “Ali oblak je zapravo samo tuđe računalo. Ono što većina ljudi ne shvaća jest da generiramo toliko podataka da brzina kojom ih generiramo daleko nadmašuje našu sposobnost da ih sve pohranimo. U vrlo bliskoj budućnosti imat ćemo veliki jaz između korisnih podataka koje generiramo i načina na koji ih možemo pohraniti koristeći konvencionalne medije.”

Catalog je razvio tehnologiju za koju vjeruju da bi mogla promijeniti način na koji pohranjujemo podatke.

Budući da su tvrtke za pohranu podataka u oblaku zauzete izgradnjom novih podatkovnih centara i širenjem postojećih, brzinom od čvorova, teško je predvidjeti kada bi nam moglo ponestati kapaciteta za pohranu podataka. Ne postoji sat za odbrojavanje u filmskom stilu. Međutim, prema Parku, već 2025. čovječanstvo je moglo proizvesti više od 160 zetabajta podataka kumulativno. (Zettabyte, ako se pitate, je trilijun gigabajta.) Koliko ćemo od toga moći pohraniti? Oko 12,5 posto, predlaže Park.

Jasno je da se nešto mora učiniti.

Je li DNK odgovor?

Tu na scenu stupaju Park i njegov kolega znanstvenik i suosnivač s MIT-a Nathaniel Roquet. Njihov startup Catalog razvio je tehnologiju za koju vjeruju da bi mogla transformirati pohranu podataka kakvu poznajemo; omogućujući, ili tako tvrde, da se cjelokupni svjetski podaci udobno smjeste u prostor veličine ormara za kapute.

Katalogov tim za pohranu DNK
Catalogov tim za pohranu DNK u laboratoriju.Katalog

Rješenje kataloga? Kodiranjem podataka u DNK. To bi moglo zvučati kao zaplet romana Michaela Crichtona, ali njihovo skalabilno i pristupačno rješenje je ozbiljno i ima toliko daleko dobio 9 milijuna dolara u pothvatnom financiranju — uz potporu vodećih profesora sa Stanforda i Harvarda Sveučilišta.

"Pitanje koje mi često postavljaju je: 'Čiji DNK koristimo?'", nasmijao se Park. "Ljudi se boje da uzimamo DNK od ljudi i pretvaramo ih u mutante ili slične stvari."

Godinama su uska grla sprječavala DNK da ispuni svoj ogromni potencijal za pohranu podataka.

To nije, trebali bismo razjasniti, što Catalog radi. DNK u koju tvrtka kodira podatke je sintetski polimer. To nije nešto što dolazi iz biološkog porijekla, a niz parova baza u koje su podaci kodirani, kao niz jedinica i nula, nije kod za bilo što živo. No krajnji proizvod se ipak biološki ne razlikuje od nečega što možete pronaći u živoj stanici.

O ideji da je DNK potencijalna metoda pohranjivanja nagađa se već desetljećima, praktički otkako su James Watson i Francis Crick otkrili dvostruku spiralu 1953. godine. Međutim, do sada je postojao niz uskih grla koja su ga sprječavala u životu ogroman potencijal kao računalno rješenje za pohranu podataka.

Tradicionalno razmišljanje o pohranjivanju podataka temeljenom na DNK usmjereno na sintezu novih molekula DNK; mapiranje niza bitova u niz četiri para baza DNK i stvaranje dovoljno molekula da predstavljaju sve brojeve koje želite pohraniti. Problem je u tome što je ovaj proces spor i skup, što predstavlja uska grla kada je u pitanju pohranjivanje podataka.

Kapacitet pohrane DNK u odnosu na tradicionalno
Kako Catalog sintetizira pohranu u DNK
Katalog

Catalogov pristup temelji se na odvajanju procesa sinteze od procesa kodiranja. U suštini, tvrtka generira ogroman broj od samo nekoliko različitih molekula (što ga čini puno jeftinijim), a zatim kodira informacije generiranjem ogromne raznolikosti iz prethodno napravljenih molekula.

Kao analogiju, Catalog je usporedio prethodni pristup proizvodnji prilagođenih tvrdih diskova u koje su svi vaši podaci ugrađeni. Pohranjivanje različitih podataka znači izgradnju potpuno novog tvrdog diska iz temelja. Njihov pristup, sugeriraju, sličan je masovnoj proizvodnji praznih tvrdih diskova, a zatim ih popunjava kodiranim informacijama po potrebi.

Sve je u pohrani

Uzbudljiv dio svega ovoga je nevjerojatna količina podataka koju može pohraniti. Kao dokaz koncepta, Catalog je upotrijebio svoju tehnologiju za kodiranje knjiga poput Vodič kroz galaksiju za autostopere u DNK. Ali to nije ništa u usporedbi s mogućnostima.

Od početka do kraja, čitanje podataka s DNK trajat će najmanje nekoliko sati.

"Ako uspoređujete jabuke s jabukama, bitovi koje možete pohraniti u istom volumenu imaju oko milijun puta veću gustoću informacija od SSD diska", rekao je Park. "Što god možete pohraniti na flash pogon, možete pohraniti milijun puta više u istom volumenu ako to radite u DNK."

Međutim, usporedba sa solid-state diskovima nije točna. DNK možda može pohraniti daleko više informacija u isti volumen, ali nema trenutni pristup kao, recimo, USB-povezan flash pogon. Catalogov pristup pretvara podatke u čvrstu kuglicu sintetskog polimera.

Da bi pristupili vašim podacima, znanstvenici bi trebali uzeti spomenutu kuglicu, rehidrirati je dodavanjem vode, a zatim je očitati pomoću DNK sekvencera. To daje parove baza DNK, koji se zatim mogu koristiti za izračunavanje jedinica i nula koje ponovno sastavljaju vaše podatke. Od početka do kraja, proces će trajati najmanje nekoliko sati.

Catalogov DNK tim u laboratoriju
Kako bi dohvatili podatke iz DNK, znanstvenici bi trebali uzeti kuglicu na kojoj je pohranjena, rehidrirati je dodavanjem vode, a zatim je očitati pomoću DNK sekvencera.Katalog

Iz tog razloga Catalog u početku cilja na tržište koje je naviklo na ovakva kašnjenja: tržište arhiviranja. Ovo je vrsta podataka koja se trenutno pohranjuje u formatima poput magnetske vrpce, koja se koristi za praćenje vrste informacija za koje se možda nadate da ih nećete morati ponovno pregledavati, ali ih je ipak ključno objesiti na. (Zamislite korporativni ekvivalent jamstva za vaš hladnjak.)

Ali postoji li ikada točka u kojoj će to biti važno prosječnom korisniku? Uostalom, kao što smo istaknuli na vrhu ovog članka, većina nas zapravo ne razmišlja previše o svojim podacima i o tome gdje se oni čuvaju. Je li na magnetnoj traci? Je li na solid-state memoriji? Ne smeta nam sve dok je tu kada nam treba.

Kodiranje podataka temeljeno na DNK vjerojatno će biti opcija dugoročne pohrane, dok kratkoročni podaci imaju druge oblike.

Zbog količine vremena potrebnog za dohvaćanje informacija, malo je vjerojatno da će ikada postojati točka u kojoj, za Na primjer, vaši Google Cloud podaci pohranjeni su u golemim posudama DNK ili kao niz kuglica poput klikera u Mountainu Pogled, CA. Ako Katalog uspije dokazati svoj koncept tvrtkama, ovo će vjerojatno biti opcija dugoročne pohrane, dok kratkoročni podaci imaju druge oblike.

Zamislite mogućnosti

Cijev koja sadrži milijune kopija podataka kodiranih u DNK.Katalog

Ipak, postoje uzbudljive mogućnosti koje zvuče znanstveno-fantastično. "Zamislite potkožnu kuglicu koja sadrži sve vaše zdravstvene podatke, sve vaše MRA snimke, vaše krvne pretrage, vaše rendgenske snimke vašeg zubara", rekao je Park. “Uvijek biste željeli da vam ti podaci budu vrlo dostupni, ali ne želite ih nužno negdje u oblaku ili na nezaštićenom poslužitelju u bolnici. Kad biste to imali sa sobom u obliku DNK, mogli biste fizički kontrolirati te podatke i pristup njima, a pritom paziti da im pristup imaju samo ovlašteni liječnici.”

Uostalom, kako ističe, danas sve bolnice imaju DNK sekvencer. "Ne kažem da sada težimo tome, ali to je moguća budućnost", rekao je.

Nakon što su svijetu najavili svoju novu tvrtku, Catalog je sada usredotočen na provođenje nekih pilot projekata kako bi pokazao kako se ova tehnologija može učinkovito koristiti. "Ovo nisu znanstveni izazovi koje moramo riješiti, već problemi mehaničke optimizacije", istaknuo je.

Nakon što je, prema vlastitom priznanju, ušao u ovo područje jer je zvučalo kao cool tehnološki pristup velikom Problem, Park je sada uvjeren da bi se pohranjivanje DNK podataka moglo pokazati kao jedna od najvažnijih naših tehnologija vrijeme.

K vragu, kada je u pitanju mogućnost arhiviranja ljudske povijesti kakvu poznajemo, teško je ne složiti se. "Radi se o očuvanju našeg načina života kakvog poznajemo", objasnio je.

Preporuke urednika

  • Jesu li stare magnetske trake medij za pohranu podataka budućnosti?
  • Kina želi upotrijebiti kontroverznu DNK analizu kako bi pogodila lica kriminalaca
  • Ovaj biotehnološki startup želi staviti vaš DNK u trezor na Mjesecu
  • Znanstvenici s Caltecha upotrijebili su DNK da igraju najmanju igru ​​tic-tac-toe na svijetu
  • Precizna medicina ovisi o DNK, ali slanje vaše pljuvačke i dalje nosi rizike