Keď nám dôjde miesto pre dáta, vedci ich chcú uložiť do DNA

Google

Najprv apokalyptické varovanie: Dochádza nám úložisko dát.

Obsah

  • Dáta, dáta, všade
  • Je DNA odpoveďou?
  • Všetko je to o úložisku
  • Predstavte si možnosti

Je pravdepodobné, že to nie je niečo, o čo by ste sa v posledných rokoch museli príliš starať. Boli časy, nie tak dávno, keď konečný pevný disk vášho počítača predstavoval všetko úložisko, ktoré ste mali k dispozícii. Dosiahli ste tento limit (ktorý bol v prípade môjho prvého počítača menej ako 100 MB) a uchýlili ste sa k disketám a iným lokálnym externým úložiskám. Keď vám došiel aj ten, dostali ste mazanie.

Každý deň sa vytvorí približne 2,5 bilióna bajtov údajov, vďaka 3,7 miliardám ľudí, ktorí v súčasnosti používajú internet.

Viac už nemažeme. Ani spoločnosti, najmä tie, ktoré sú oceňované na základe údajov, ktoré vlastnia. Namiesto toho jednoducho poháňame naše súbory do cloudu, ktorého samotné meno je pominuteľné a éterické; bez akejkoľvek skutočnej fyzickosti. Kde sú údaje uložené? Nezáleží na tom, pokiaľ to môžeme získať späť. Aké sú riziká nedostatku cloudového úložiska? Zdanlivo veľmi málo, okrem toho, že musíte zvýšiť svoje mesačné platby za predplatné, aby ste odomkli ešte úžasnejší bezplatný priestor.

Súvisiace

  • Americká vláda a veľké technológie chcú použiť údaje o polohe na boj proti koronavírusu
  • DNA, laserom leptané sklo a ďalšie: Nahliadnutie do budúcnosti ukladania údajov
  • Najnovší prielom spoločnosti Microsoft by mohol umožniť vznik dátových centier založených na DNA

Z toho vyplýva, že myšlienka, že by sme jedného dňa mohli mať nedostatok dátového úložiska, je také ťažké zabaliť si hlavu okolo ako návrh, že by nám mohla dôjsť voda: ten úžasný voľný zdroj, ktorý padá z obloha. Ale rok 2018 je rokom, v ktorom prišlo Kapské Mesto v Južnej Afrike prudko blízko k vyčerpaniu vody. A tiež sa nám môže vyčerpať úložisko dát.

Dáta, dáta, všade

Dôvodom je nepredstaviteľné tempo, akým v súčasnosti produkujeme dáta. Každý deň sa vytvorí približne 2,5 bilióna bajtov údajov, vďaka 3,7 miliardám ľudí, ktorí v súčasnosti používajú internet. Len za posledné dva roky bolo vytvorených ohromujúcich 90 percent celosvetových údajov. S rastúcim počtom inteligentných zariadení pripojených k internetu vecí sa toto číslo výrazne zvýši.

Graf celkovej tvorby údajov
Graf znázorňujúci, koľko údajov bude potrebné uložiť
Katalóg

„Keď premýšľame o cloudovom úložisku, myslíme na tieto nekonečné úložiská údajov,“ Hyunjun Park, generálny riaditeľ a spoluzakladateľ spoločnosti na ukladanie údajov Katalóg, povedal Digital Trends. „Ale cloud je v skutočnosti len počítač niekoho iného. Väčšina ľudí si neuvedomuje, že generujeme toľko údajov, že tempo, akým ich generujeme, ďaleko prevyšuje našu schopnosť ich všetky uložiť. Vo veľmi blízkej budúcnosti budeme mať obrovský rozdiel medzi užitočnými údajmi, ktoré generujeme, a tým, ako ich dokážeme ukladať pomocou konvenčných médií.“

Katalóg vyvinul technológiu, o ktorej sa domnievajú, že by mohla zmeniť spôsob, akým ukladáme údaje.

Keďže spoločnosti v oblasti cloudových úložísk sú zaneprázdnené budovaním nových dátových centier a rozširovaním svojich existujúcich, rýchlosťou uzlov, je ťažké zistiť, kedy by sa nám mohla minúť kapacita na ukladanie dát. Nechýbajú odpočítavacie hodiny v štýle filmu. Podľa Parka však už v roku 2025 mohlo ľudstvo vyprodukovať viac ako 160 zettabajtov dát kumulatívne. (Ak by vás to zaujímalo, zettabajt je bilión gigabajtov.) Koľko z toho budeme môcť uložiť? Park navrhuje približne 12,5 percenta z toho.

Je jasné, že treba niečo urobiť.

Je DNA odpoveďou?

To je miesto, kde do obrazu vstupuje Park a jeho kolega z MIT a spoluzakladateľ Nathaniel Roquet. Ich startup Catalog vyvinul technológiu, o ktorej sa domnievajú, že by mohla zmeniť ukladanie dát, ako ich poznáme; umožňujú, alebo to aspoň tvrdia, že sa všetky svetové údaje pohodlne zmestia do priestoru veľkosti skrine na kabáty.

Tím pre ukladanie DNA katalógu
Katalógový tím skladovania DNA v laboratóriu.Katalóg

Katalógové riešenie? Zakódovaním údajov do DNA. Môže to znieť ako zápletka z románu Michaela Crichtona, ale ich škálovateľné a cenovo dostupné riešenie je vážne a má ďaleko získal 9 miliónov dolárov rizikového financovania – spolu s podporou popredných profesorov zo Stanfordu a Harvardu univerzity.

„Často sa ma pýtam: ‚Čí DNA používame?‘“ zasmial sa Park. "Ľudia sa boja, že ľuďom vezmeme DNA a zmeníme ich na mutantov alebo podobné veci."

Prekážky už roky bránia DNA v plnení svojho obrovského potenciálu ukladania údajov.

Toto nie je, mali by sme objasniť, čo Katalóg robí. DNA, do ktorej spoločnosť kóduje údaje, je syntetický polymér. Nie je to niečo, čo pochádza z biologického pôvodu, a séria párov báz, do ktorých sú zakódované údaje, ako séria jednotiek a núl, nie je kódom pre nič živé. Ale konečný produkt je napriek tomu biologicky nerozoznateľný od niečoho, čo by ste mohli nájsť v živej bunke.

O myšlienke, že DNA je potenciálnou metódou ukladania, sa špekuluje už desaťročia, prakticky odvtedy, čo James Watson a Francis Crick objavili dvojitú špirálu v roku 1953. Doteraz sa však vyskytlo niekoľko prekážok, ktoré jej bránili v plnení svojich predstáv obrovský potenciál ako riešenie na ukladanie výpočtových dát.

Tradičné myslenie o ukladaní údajov na báze DNA zamerané na syntézu nových molekúl DNA; mapovanie sekvencie bitov na sekvenciu štyroch párov báz DNA a vytvorenie dostatočného množstva molekúl na reprezentáciu všetkých čísel, ktoré chcete uložiť. Problém je v tom, že tento proces je pomalý a drahý, čo predstavuje značné prekážky, pokiaľ ide o ukladanie údajov.

Skladovacia kapacita DNA vs
Ako Katalóg syntetizuje ukladanie do DNA
Katalóg

Prístup katalógu je založený na oddelení procesu syntézy od procesu kódovania. V podstate spoločnosť generuje obrovské množstvo len niekoľkých rôznych molekúl (čo je oveľa lacnejšie) a potom kóduje informácie generovaním obrovskej rozmanitosti z vopred pripravených molekúl.

Ako analógiu, Katalóg prirovnal predchádzajúci prístup k výrobe vlastných pevných diskov so všetkými vašimi dátami pevne zapojenými. Ukladanie rôznych údajov znamená postaviť úplne nový pevný disk od základov. Ich prístup, ako navrhujú, je podobný masovej výrobe prázdnych pevných diskov a ich následnému vypĺňaniu zakódovanými informáciami podľa potreby.

Všetko je to o úložisku

Vzrušujúcou časťou toho všetkého je ohromujúce množstvo dát, ktoré dokáže uložiť. Ako dôkaz konceptu, Katalóg použil svoju technológiu na kódovanie kníh ako Stopárov sprievodca po Galaxii do DNA. Ale to nie je nič v porovnaní s možnosťami.

Od začiatku do konca bude čítanie údajov z DNA trvať minimálne niekoľko hodín.

"Ak porovnávate jablká s jablkami, bity, ktoré môžete uložiť v rovnakom objeme, vyjdú na približne 1 miliónkrát vyššiu informačnú hustotu ako na SSD disku," povedal Park. "Čokoľvek môžete uložiť na flash disk, môžete uložiť 1 miliónkrát toľko v rovnakom objeme, ak to robíte v DNA."

Porovnanie s pevnými diskami však nie je presné. DNA môže byť schopná uložiť oveľa viac informácií v rovnakom objeme, ale nemá okamžitý prístup, povedzme, flash disk pripojený cez USB. Katalógový prístup transformuje údaje do pevnej pelety syntetického polyméru.

Ak chcete získať prístup k vašim údajom, vedci by museli vziať uvedenú peletu, rehydratovať ju pridaním vody a potom ju prečítať pomocou sekvenátora DNA. To poskytuje páry báz DNA, ktoré sa potom môžu použiť na výpočet jednotiek a núl, ktoré znovu zostavia vaše údaje. Od začiatku do konca bude proces trvať minimálne niekoľko hodín.

Katalógový DNA tím v laboratóriu
Aby vedci mohli získať údaje z DNA, museli by vziať peletu, na ktorej je uložená, rehydratovať ju pridaním vody a potom ju prečítať pomocou sekvenátora DNA.Katalóg

Z tohto dôvodu sa Katalóg spočiatku zameriava na trh zvyknutý na tieto druhy oneskorení: trh s archiváciou. Ide o druh údajov, ktoré sú v súčasnosti uložené na formátoch, ako je magnetická páska, ktorá sa používa na sledovanie typu informácií, o ktorých možno dúfate, že ich nebudete musieť znova navštevovať, no stále sú dôležité na ich uloženie na. (Predstavte si firemný ekvivalent záruky na vašu chladničku.)

Existuje však niekedy bod, v ktorom to bude pre bežného používateľa dôležité? Koniec koncov, ako sme zdôraznili v hornej časti tohto článku, väčšina z nás v skutočnosti až tak nepremýšľa o svojich údajoch a o tom, kde sú uložené. Je to na magnetickej páske? Je na pevnom úložisku? Nevadí nám to, pokiaľ je tam, keď to potrebujeme.

Kódovanie údajov založené na DNA je pravdepodobne dlhodobou možnosťou uchovávania, zatiaľ čo krátkodobé údaje majú iné formy.

Vzhľadom na množstvo času potrebného na získanie informácií, je nepravdepodobné, že by niekedy došlo k bodu, kedy napr. vaše informácie zo služby Google Cloud sú napríklad uložené v obrovských nádobách s DNA alebo ako séria peliet podobných mramoru v Mountain View, CA. Ak by katalóg dokázal podnikom dokázať svoju koncepciu, bude to pravdepodobne možnosť dlhodobého uchovávania, zatiaľ čo krátkodobé údaje budú mať iné formy.

Predstavte si možnosti

Skúmavka obsahujúca milióny kópií údajov zakódovaných do DNA.Katalóg

Existujú však vzrušujúce možnosti znejúce ako sci-fi. „Predstavte si subkutánnu tabletu obsahujúcu všetky vaše zdravotné údaje, všetky vaše MRA skeny, vaše krvné testy, vaše röntgenové snímky od vášho zubára,“ povedal Park. „Vždy by ste chceli, aby boli tieto údaje pre vás dobre dostupné, ale nemusíte ich nevyhnutne mať niekde v cloude alebo na nezabezpečenom serveri v nemocnici. Ak by ste to mali so sebou vo forme DNA, mohli by ste fyzicky kontrolovať tieto údaje a prístup k nim a zároveň zabezpečiť, aby k nim mali prístup len oprávnení lekári.“

Napokon, ako podotýka, všetky nemocnice dnes majú sekvenátory DNA. "Nehovorím, že sa o to práve teraz usilujeme, ale je to možná budúcnosť," povedal.

Po ohlásení svojej novej spoločnosti svetu sa Katalóg teraz zameriava na realizáciu niekoľkých pilotných projektov, ktoré demonštrujú, ako možno túto technológiu efektívne využiť. "Toto nie sú vedecké výzvy, ktoré musíme vyriešiť, ale skôr problémy s mechanickou optimalizáciou," poznamenal.

Ako sám priznal, vstúpil do tejto oblasti, pretože to znelo ako skvelý technologický prístup k veľkému Park je teraz presvedčený, že ukladanie údajov o DNA sa môže ukázať ako jedna z najdôležitejších našich technológií čas.

Sakra, pokiaľ ide o schopnosť archivovať ľudskú históriu, ako ju poznáme, je ťažké nesúhlasiť. „Ide o zachovanie nášho spôsobu života, ako ho poznáme,“ vysvetlil.

Odporúčania redaktorov

  • Sú starodávne magnetické pásky nosičom dát budúcnosti?
  • Čína chce pomocou kontroverznej analýzy DNA uhádnuť tváre zločincov
  • Tento biotechnologický startup chce umiestniť vašu DNA do trezoru na Mesiaci
  • Vedci z Caltechu použili DNA na hranie najmenšej hry tic-tac-toe na svete
  • Presná medicína závisí od DNA, ale vysielanie vašich pľuvancov stále prináša riziká