Kui meil saab andmete jaoks ruumi otsa, tahavad teadlased need DNA-sse salvestada

Esiteks apokalüptiline hoiatus: meil hakkab andmesalvestusruum otsa saama.

Sisu

Andmed, andmed, kõikjal
Kas DNA on vastus?
See kõik puudutab ladustamist
Kujutage ette võimalusi

On tõenäoline, et see pole midagi, mille pärast olete viimastel aastatel pidanud liiga palju muretsema. Oli aeg, mitte nii kaua aega tagasi, kui teie arvuti piiratud kõvaketas oli kogu vaba mäluruum. Saavutasite selle piiri (mis minu enda esimese arvuti puhul oli alla 100 MB) ja kasutasite diskette ja muud kohalikku välist salvestusruumi. Kui ka see sai otsa, tuli kustutada.

Iga päev luuakse umbes 2,5 kvintiljonit baiti andmeid tänu 3,7 miljardile inimesele, kes praegu Internetti kasutavad.

Rohkem me ei kustuta. Samuti mitte ettevõtted, eriti need, mida hinnatakse neile kuuluvate andmete põhjal. Selle asemel suuname oma failid lihtsalt pilve, mille nimi on lühiajaline ja eeterlik; puudub igasugune tegelik kehalisus. Kus andmeid hoitakse? See ei oma tähtsust seni, kuni saame selle tagasi. Millised on pilvesalvestuse ammendumise ohud? Näiliselt väga vähe, peale selle, et peate suurendama oma igakuisi tellimusmakseid, et avada rohkem kuulsusrikast vaba ruumi.

Seotud

USA valitsus ja suurtehnoloogia soovivad koroonaviiruse vastu võitlemiseks kasutada asukohaandmeid
DNA, laseriga söövitatud klaas ja palju muud: pilk andmesalvestuse tulevikku
Microsofti uusim läbimurre võib teha võimalikuks DNA-põhised andmekeskused

Seetõttu on mõtet, et meil võib ühel päeval andmesalvestusruum otsa lõppeda, sama raske mähkida umbes nagu vihje, et meil võib vesi otsa saada: see hiilgav vaba ressurss, mis kukub alla taevas. Kuid 2018. aastal saabus Lõuna-Aafrika Vabariik Kaplinn järsult lähedal vee lõppemisele. Ja ka andmesalvestusruum võib otsa saada.

Andmed, andmed, kõikjal

Selle põhjuseks on kujuteldamatu tempo, millega me praegu andmeid toodame. Iga päev luuakse umbes 2,5 kvintiljonit baiti andmeid tänu 3,7 miljardile inimesele, kes praegu Internetti kasutavad. Ainuüksi viimase kahe aasta jooksul on loodud 90 protsenti maailma andmetest. Asjade Internetti ühendatud nutiseadmete arvu suurenemisega suureneb see arv oluliselt.

Graafik, mis näitab, kui palju andmeid on vaja salvestada — Kataloog

"Kui mõtleme pilvesalvestusele, mõtleme me nendele lõpututele andmesalvedele," Hyunjun Park, andmesalvestusettevõtte tegevjuht ja kaasasutaja. Kataloog, ütles Digital Trends. "Kuid pilv on tegelikult lihtsalt kellegi teise arvuti. Enamik inimesi ei saa aru, et me genereerime nii palju andmeid, et nende genereerimise tempo ületab palju meie võimet seda kõike salvestada. Lähitulevikus tekib tohutu lõhe meie genereeritavate kasulike andmete ja selle vahel, kuidas me suudame neid tavapäraste andmekandjate abil salvestada.

Kataloog on välja töötanud tehnoloogia, mis nende arvates võib muuta meie andmete salvestamise viisi.

Kuna pilvesalvestusettevõtted ehitavad uusi andmekeskusi ja laiendavad oma olemasolevaid sõlmede kiirusega, on raske välja mõelda, millal võib andmesalvestusmaht otsa saada. Filmilaadset loenduskella pole. Parki sõnul võis inimkond aga juba 2025. aastal toota kumulatiivselt rohkem kui 160 zetabaiti andmeid. (Zetabait, juhuks kui huvitab, on triljon gigabaiti.) Kui palju me sellest salvestada suudame? Park soovitab, et sellest umbes 12,5 protsenti.

Selge, et midagi tuleb ette võtta.

Kas DNA on vastus?

Siin astuvad pilti Park ja MIT-i teadlane ja kaasasutaja Nathaniel Roquet. Nende idufirma Catalog on välja töötanud tehnoloogia, mis nende arvates võib muuta andmesalvestust selliseks, nagu me seda teame; võimaldades või nii nad väidavad, et kogu maailma andmed mahuvad mugavalt riidekapi suurusesse ruumi.

Kataloogi DNA säilitamise meeskond laboris.Kataloog

Kataloogi lahendus? Kodeerides andmeid DNA-sse. See võib kõlada nagu Michael Crichtoni romaani süžee, kuid nende skaleeritav ja taskukohane lahendus on tõsine ja nii sai kaugelt 9 miljonit dollarit riskikapitali – koos Stanfordi ja Harvardi juhtivate professorite toetusega ülikoolid.

"Küsimus, mida mulle sageli esitatakse, on:" Kelle DNA-d me kasutame?" Park naeris. "Inimesed kardavad, et võtame inimestelt DNA ja muudame nad mutantideks või muuks selliseks."

Aastaid on kitsaskohad takistanud DNA-l oma tohutut andmesalvestuspotentsiaali kasutamast.

Peaksime selgeks tegema, see pole see, mida Kataloog teeb. DNA, millesse ettevõte andmeid kodeerib, on sünteetiline polümeer. See ei ole midagi, mis pärineb bioloogilisest päritolust, ja aluspaaride jada, millesse andmed on kodeeritud, kui ühtede ja nullide jada, ei ole millegi elava kood. Kuid lõppsaadus on sellegipoolest bioloogiliselt eristamatu millestki, mida võite elusrakust leida.

Idee, et DNA on potentsiaalne säilitamismeetod, on spekuleeritud juba aastakümneid, peaaegu pärast seda, kui James Watson ja Francis Crick 1953. aastal kaksikheeliksi avastasid. Seni on aga esinenud mitmeid kitsaskohti, mis on takistanud tal oma nõuetekohast elamist tohutu potentsiaal arvutusliku andmesalvestuslahendusena.

Traditsiooniline mõtlemine DNA-põhisele andmesalvestusele keskendus uute DNA molekulide sünteesile; vastendada bittide jada DNA nelja aluspaari järjestusega ja luua piisavalt molekule, et esindada kõiki numbreid, mida soovite salvestada. Probleem on selles, et see protsess on aeglane ja kulukas, mis on mõlemad märkimisväärsed kitsaskohad andmete salvestamisel.

DNA salvestusmaht võrreldes traditsioonilisega — Kataloog

Kuidas kataloog sünteesib salvestust DNA-ks — Kataloog

Kataloogi lähenemisviis põhineb sünteesiprotsessi lahutamisel kodeerimisprotsessist. Põhimõtteliselt genereerib ettevõte tohutul hulgal vaid mõnda erinevat molekuli (mis muudab selle palju odavamaks) ja seejärel kodeerib teabe, luues valmis molekulidest tohutu mitmekesisuse.

Analoogiana võrdles Catalog varasemat lähenemist kohandatud kõvaketaste valmistamisele, kus kõik teie andmed on kõvasti ühendatud. Erinevate andmete salvestamine tähendab täiesti uue kõvaketta ehitamist algusest peale. Nende lähenemisviis sarnaneb tühjade kõvaketaste masstootmisega ja seejärel vajaduse korral kodeeritud teabega täitmisega.

See kõik puudutab ladustamist

Selle kõige põnevam osa on hämmastavalt palju andmeid, mida see suudab salvestada. Idee tõestuseks on Catalog kasutanud oma tehnoloogiat selliste raamatute kodeerimiseks Hitchhiker's Guide to the Galaxy DNA-sse. Kuid see pole võimalustega võrreldes midagi.

Algusest lõpuni võtab andmete lugemine DNA-st vähemalt mitu tundi.

"Kui võrdlete õunu õuntega, on samas mahus salvestatavate tükkide teabetihedus umbes 1 miljon korda suurem kui pooljuhtdraivis," ütles Park. "Mida iganes saate mälupulgale salvestada, saate salvestada miljon korda samas mahus, kui teete seda DNA-s."

Võrdlus pooljuhtketastega pole aga täpne. DNA võib olla võimeline samas mahus salvestama palju rohkem teavet, kuid sellel pole kiiret juurdepääsu näiteks USB-ga ühendatud välkmäluseadmele. Kataloogi lähenemisviis muudab andmed sünteetilise polümeeri tahkeks graanuliks.

Teie andmetele juurdepääsuks peavad teadlased selle pelleti võtma, vee lisamisega rehüdreerima ja seejärel DNA sekvenaatoriga lugema. See annab DNA aluspaarid, mida saab omakorda kasutada teie andmeid uuesti kokku panevate üheliste ja nullide arvutamiseks. Algusest lõpuni võtab protsess minimaalselt mitu tundi.

Kataloogi DNA meeskond laboris — DNA-st andmete hankimiseks peaksid teadlased võtma pelleti, millel see on salvestatud, rehüdreerima seda vee lisamisega ja seejärel lugema seda DNA sekvenaatori abil.Kataloog

Sel põhjusel on Catalog esialgu suunatud selliste viivitustega harjunud turule: arhiveerimisturule. Selliseid andmeid salvestatakse praegu sellistes vormingutes nagu magnetlint, mida kasutatakse jälgimiseks sellist teavet, mida võib-olla ei pea uuesti vaatama, kuid mille riputamiseks on siiski oluline peale. (Kujutage ette oma külmiku garantii ettevõtte ekvivalenti.)

Kuid kas on kunagi hetk, mil see tavakasutajale korda läheb? Lõppude lõpuks, nagu me selle artikli ülaosas märkisime, ei mõtle enamik meist oma andmetele ja nende säilitamiskohale nii palju. Kas see on magnetlindil? Kas see on tahkismälus? Me ei pahanda, kui see on olemas, kui seda vajame.

Tõenäoliselt on DNA-põhine andmete kodeerimine pikaajaliseks salvestusvõimaluseks, samas kui lühiajalised andmed võtavad muid vorme.

Kuna teabe hankimiseks kulub palju aega, on ebatõenäoline, et kunagi tekib hetk, kus Näiteks on teie Google Cloudi teave salvestatud tohututesse DNA vaatidesse või marmoritaoliste graanulite seeriana Mountainis. Vaade, CA. Kui Catalog suudab oma kontseptsiooni ettevõtetele tõestada, on see tõenäoliselt pikaajaline salvestusvõimalus, samas kui lühiajalised andmed võtavad muid vorme.

Kujutage ette võimalusi

Tuub, mis sisaldab miljoneid koopiaid DNA-sse kodeeritud andmetest.Kataloog

Põnevaid ulmeliselt kõlavaid võimalusi on siiski. "Kujutage ette nahaalust graanulit, mis sisaldab kõiki teie terviseandmeid, kõiki teie MRA-skaneeringuid, vereanalüüse, teie hambaarsti röntgenikiirgust," ütles Park. „Tahaksite alati, et need andmed oleksid teile väga juurdepääsetavad, kuid te ei soovi, et need oleksid kuskil pilves või haiglas asuvas turvamata serveris. Kui teil oleks see DNA kujul kaasas, saaksite neid andmeid ja neile juurdepääsu füüsiliselt kontrollida, tagades samal ajal, et ainult volitatud arstidel on juurdepääs neile.

Lõppude lõpuks, nagu ta märgib, on tänapäeval kõigil haiglatel DNA sekveneerijad. "Ma ei ütle, et me seda praegu taotleme, kuid see on võimalik tulevik," ütles ta.

Olles oma uuest ettevõttest maailmale teatanud, on Catalog nüüd keskendunud mõne pilootprojekti elluviimisele, et näidata, kuidas seda tehnoloogiat saab tõhusalt kasutada. "Need ei ole teaduslikud väljakutsed, mis meil on lahendada, vaid pigem mehaanilise optimeerimise probleemid," märkis ta.

Tema enda kinnitusel on ta sisenenud sellesse valdkonda, sest see kõlas kui lahe tehnoloogiline lähenemine suurele Park on nüüd veendunud, et DNA andmete salvestamine võib osutuda üheks meie olulisemaks tehnoloogiaks aega.

Pagan, kui rääkida võimalusest arhiveerida inimkonna ajalugu sellisena, nagu me seda teame, on raske nõustuda. "See on meie eluviisi säilitamine sellisena, nagu me seda teame," selgitas ta.

Toimetajate soovitused

Kas vana kooli magnetlindid on tuleviku andmekandja?
Hiina soovib kasutada vastuolulist DNA-analüüsi, et arvata kurjategijate nägusid
See biotehnoloogia idufirma soovib asetada teie DNA Kuu peal asuvasse varakambrisse
Caltechi teadlased kasutasid DNA-d, et mängida maailma väikseimat tic-tac-toe mängu
Täppismeditsiin sõltub DNA-st, kuid sülje väljasaatmisel on siiski riske

Kui meil saab andmete jaoks ruumi otsa, tahavad teadlased need DNA-sse salvestada

Andmed, andmed, kõikjal

Kas DNA on vastus?

See kõik puudutab ladustamist

Kujutage ette võimalusi

Toimetajate soovitused

Kategooriad

Viimased

Aura digitaalse raami praktiline ülevaade

Kas kõik hakkab varsti meie järele luurama alates põrandalampidest kuni nutikate külmikuteni?

Üksikema kujundas betoontoru sees pisikese kodu – ja see on hämmastav