Când rămânem fără spațiu pentru date, oamenii de știință vor să le stocheze în ADN

Google

În primul rând, avertismentul apocaliptic: rămânem fără stocare de date.

Cuprins

  • Date, date, peste tot
  • Este DNA răspunsul?
  • Totul tine de stocare
  • Imaginează-ți posibilitățile

Sunt șanse ca acesta să nu fie ceva pentru care ați trebuit să vă faceți prea multe griji în ultimii ani. A fost o vreme, nu cu mult timp în urmă, când hard disk-ul finit al computerului tău era tot spațiul de stocare disponibil. Atingeți limita (care, în cazul primului meu computer, era mai mică de 100 MB) și ați apelat la dischete și alte stocări externe locale. Când ai rămas fără asta, ai fost șters.

În fiecare zi, se creează aproximativ 2,5 chintilioane de octeți de date, datorită celor 3,7 miliarde de oameni care folosesc acum internetul.

Nu mai ștergem. Nici companiile, în special cele evaluate pe baza datelor pe care le dețin. În schimb, pur și simplu ne propulsăm fișierele în cloud, al cărui nume este efemer și eteric; lipsit de orice fizică reală. Unde sunt stocate datele? Nu contează atâta timp cât îl putem recupera. Care sunt pericolele de a rămâne fără stocare în cloud? Aparent foarte puțin, pe lângă faptul că trebuie să vă măriți plățile lunare de abonament pentru a debloca spațiu gratuit mai glorios.

Legate de

  • Guvernul SUA și marea tehnologie vor să folosească datele de locație pentru a lupta împotriva coronavirusului
  • ADN, sticlă gravată cu laser și nu numai: o privire în viitorul stocării datelor
  • Cea mai recentă descoperire a Microsoft ar putea face posibile centrele de date bazate pe ADN

Drept urmare, ideea că într-o zi am putea rămâne fără stocare de date este la fel de greu de înțeles în jur ca sugestia că am putea rămâne fără apă: acea glorioasă resursă gratuită care cade din cer. Dar 2018 este anul în care a venit Cape Town, Africa de Sud precipitat aproape de a rămâne fără apă. Și am putea rămâne fără stocare de date, de asemenea.

Date, date, peste tot

Motivul pentru aceasta este ritmul inimaginabil în care producem date în prezent. În fiecare zi, se creează aproximativ 2,5 chintilioane de octeți de date, datorită celor 3,7 miliarde de oameni care folosesc acum internetul. Numai în ultimii doi ani, 90% din datele lumii au fost create uluitoare. Având în vedere un număr tot mai mare de dispozitive inteligente conectate la Internetul lucrurilor, această cifră va crește semnificativ.

Graficul creării totale de date
Grafic care arată câte date vor trebui stocate
Catalog

„Când ne gândim la stocarea în cloud, ne gândim la aceste depozite infinite de date”, Hyunjun Park, CEO și co-fondator al companiei de stocare a datelor Catalog, a spus Digital Trends. „Dar cloud-ul este de fapt doar computerul altcuiva. Ceea ce majoritatea oamenilor nu realizează este că generăm atât de multe date încât ritmul în care le generăm depășește cu mult capacitatea noastră de a le stoca pe toate. În viitorul foarte apropiat, vom avea un decalaj uriaș între datele utile pe care le generăm și modul în care le putem stoca folosind medii convenționale.”

Catalog a dezvoltat o tehnologie despre care cred că ar putea transforma modul în care stocăm datele.

Deoarece companiile de stocare în cloud sunt ocupate cu construirea de noi centre de date și extinderea celor existente, cu un ritm de noduri, este dificil să ne dăm seama când am putea rămâne fără capacitatea de stocare a datelor. Nu există un ceas de numărătoare inversă în stil film. Potrivit lui Park, totuși, încă din 2025, omenirea ar fi putut produce mai mult de 160 zettabytes de date în mod cumulat. (Un zettabyte, în cazul în care vă întrebați, este un trilion de gigaocteți.) Cât de mult din acestea vom putea stoca? Aproximativ 12,5% din ea, sugerează Park.

În mod clar, trebuie făcut ceva.

Este DNA răspunsul?

Acolo intră în imagine Park și colegul om de știință și co-fondator al MIT, Nathaniel Roquet. Catalogul lor startup a dezvoltat tehnologie despre care cred că ar putea transforma stocarea datelor așa cum o cunoaștem noi; permițând, sau așa susțin ei, ca toate datele lumii să fie încadrate confortabil într-un spațiu de mărimea unui dulap de haine.

Echipa de stocare ADN a catalogului
Echipa de stocare ADN a catalogului în laborator.Catalog

Soluția de catalog? Prin codificarea datelor în ADN. Ar putea suna ca intriga unui roman Michael Crichton, dar soluția lor scalabilă și accesibilă este serioasă și are atât de mult a primit până acum 9 milioane de dolari în finanțare de risc – împreună cu sprijinul unor profesori de seamă de la Stanford și Harvard universități.

„O întrebare care mi se pune des este: „Al cui ADN folosim?”” a râs Park. „Oamenilor le este frică să luăm ADN de la oameni și să-i transformăm în mutanți sau lucruri de genul acesta.”

De ani de zile blocajele au împiedicat ADN-ul să se ridice la nivelul potențialului său masiv de stocare a datelor.

Acest lucru nu este, ar trebui să clarificăm, ceea ce face Catalog. ADN-ul în care compania codifică datele este un polimer sintetic. Nu este ceva care provine dintr-o origine biologică, iar seria de perechi de baze în care sunt codificate datele, ca o serie de unuri și zerouri, nu este codul pentru nimic viu. Dar produsul final este totuși imposibil de distins din punct de vedere biologic de ceva ce s-ar putea găsi într-o celulă vie.

Ideea ca ADN-ul să fie o metodă potențială de stocare a fost speculată de zeci de ani, practic de când James Watson și Francis Crick au descoperit dubla helix în 1953. Cu toate acestea, până acum au existat o serie de blocaje care l-au împiedicat să-și respecte potențial masiv ca soluție de stocare a datelor computaționale.

Gândirea tradițională asupra stocării de date bazate pe ADN s-a concentrat pe sinteza de noi molecule de ADN; maparea secvenței de biți la secvența celor patru perechi de baze ale ADN-ului și crearea de suficiente molecule pentru a reprezenta toate numerele pe care doriți să le stocați. Problema este că acest proces este lent și costisitor, ambele blocaje considerabile atunci când vine vorba de stocarea datelor.

Capacitatea de stocare a ADN-ului vs tradițional
Cum sintetizează Catalog stocarea în ADN
Catalog

Abordarea catalogului se bazează pe decuplarea procesului de sinteză de procesul de codificare. În esență, compania generează un număr masiv de doar câteva molecule diferite (făcându-l mult mai ieftin) și apoi codifică informațiile generând o diversitate uriașă din moleculele prefabricate.

Ca o analogie, Catalog a comparat abordarea anterioară a producției de hard disk-uri personalizate cu toate datele dvs. conectate. Stocarea diferitelor date înseamnă construirea unui hard disk complet nou de la zero. Abordarea lor, sugerează ei, este asemănătoare cu producerea în masă a hard disk-urilor goale și apoi completarea lor cu informațiile codificate, atunci când este necesar.

Totul tine de stocare

Partea interesantă a tuturor acestor lucruri este cantitatea uluitoare de date pe care o poate stoca. Ca o dovadă a conceptului, Catalog și-a folosit tehnologia pentru a codifica cărți precum Ghidul autostopistului galactic în ADN. Dar asta nu este nimic în comparație cu posibilitățile.

De la început până la sfârșit, citirea datelor din ADN va dura cel puțin câteva ore.

„Dacă comparați mere cu mere, bucățile pe care le puteți stoca în același volum au o densitate de aproximativ 1 milion de ori mai mare decât o densitate informațională a unei unități SSD”, a spus Park. „Orice poți stoca într-o unitate flash, ai putea stoca de un milion de ori mai mult în același volum dacă o faci în ADN.”

Comparația cu unitățile SSD nu este totuși exactă. ADN-ul poate stoca mult mai multe informații în același volum, dar nu are acces instantaneu, de exemplu, la o unitate flash conectată prin USB. Abordarea catalogului transformă datele într-o granulă solidă de polimer sintetic.

Pentru a vă accesa datele, oamenii de știință ar trebui să ia peleta respectivă, să o rehidrateze adăugând apă și apoi să o citească folosind un secvențior de ADN. Aceasta furnizează perechile de baze ale ADN-ului, care pot fi folosite, la rândul lor, pentru a calcula cele și zerourile care reasambla datele dumneavoastră. De la început până la sfârșit, procesul va dura cel puțin câteva ore.

Echipa ADN a catalogului în laborator
Pentru a extrage datele din ADN, oamenii de știință ar trebui să ia peleta pe care este stocată, să o rehidrateze adăugând apă și apoi să o citească folosind un secvențior de ADN.Catalog

Din acest motiv, Catalog vizează inițial o piață obișnuită cu astfel de întârzieri: piața de arhivare. Acesta este tipul de date care sunt stocate în prezent în formate precum bandă magnetică, utilizate pentru a ține evidența de tipul de informații pe care s-ar putea să sperați că nu trebuie să le revedeți, dar care este totuși esențial de agățat pe. (Imaginați-vă echivalentul corporativ al garanției pentru frigiderul dumneavoastră.)

Dar există vreodată un punct în care acest lucru va conta pentru utilizatorul obișnuit? La urma urmei, așa cum am subliniat în partea de sus a acestui articol, cei mai mulți dintre noi nu ne gândim prea mult la datele noastre și unde sunt păstrate. Este pe bandă magnetică? Este pe stocare în stare solidă? Nu ne deranjează atâta timp cât este acolo când avem nevoie.

Codificarea datelor bazată pe ADN este probabil o opțiune de stocare pe termen lung, în timp ce datele pe termen scurt iau alte forme.

Din cauza timpului necesar pentru a prelua informații, este puțin probabil să existe vreodată un moment în care, pentru De exemplu, informațiile dvs. Google Cloud sunt stocate în cuve enorme de ADN sau ca o serie de pelete asemănătoare marmurei în Munte. View, CA. În cazul în care Catalog poate să-și demonstreze conceptul întreprinderilor, aceasta va fi probabil o opțiune de stocare pe termen lung, în timp ce datele pe termen scurt iau alte forme.

Imaginează-ți posibilitățile

Un tub care conține milioane de copii de date codificate în ADN.Catalog

Există totuși posibilități interesante de sunet SF. „Imaginați-vă un granul subcutanat care conține toate datele dumneavoastră de sănătate, toate scanările MRA, testele de sânge, radiografiile de la medicul dentist”, a spus Park. „Ți-ai dori întotdeauna ca aceste date să fie foarte accesibile pentru tine, dar nu le vrei neapărat să fie în cloud undeva sau pe un server nesecurizat dintr-un spital. Dacă ai avea asta cu tine sub formă de ADN, ai putea controla fizic acele date și accesul la ele, asigurându-te în același timp că doar medicii autorizați ar putea avea acces la ele.”

La urma urmei, după cum subliniază el, toate spitalele de astăzi au secvențiere ADN. „Nu spun că urmărim asta chiar acum, dar este un viitor posibil”, a spus el.

După ce și-a anunțat noua companie în întreaga lume, Catalog se concentrează acum pe realizarea unor proiecte pilot pentru a demonstra modul în care această tehnologie poate fi utilizată în mod eficient. „Nu sunt provocări științifice pe care le rămâne de rezolvat, ci mai degrabă probleme de optimizare mecanică”, a menționat el.

Având, din propria recunoaștere, a intrat în acest domeniu pentru că suna ca o abordare tehnologică grozavă a unui mare problema, Park este acum convins că stocarea datelor ADN se poate dovedi a fi una dintre cele mai importante tehnologii ale noastre timp.

La naiba, când vine vorba de a putea arhiva istoria umană așa cum o știm, este greu să nu fii de acord. „Este vorba despre păstrarea modului nostru de viață așa cum îl cunoaștem”, a explicat el.

Recomandările editorilor

  • Sunt benzile magnetice vechi de școală mediul de stocare de date al viitorului?
  • China vrea să folosească analiza ADN controversată pentru a ghici fețele criminalilor
  • Acest startup biotehnologic vrea să-ți pună ADN-ul într-un seif pe Lună
  • Oamenii de știință de la Caltech au folosit ADN-ul pentru a juca cel mai mic joc de tic-tac-toe din lume
  • Medicina de precizie depinde de ADN, dar trimiterea scuipatului mai are riscuri