Quando esauriamo lo spazio per i dati, gli scienziati vogliono memorizzarli nel DNA

Google

Innanzitutto l’avvertimento apocalittico: stiamo esaurendo lo spazio di archiviazione dei dati.

Contenuti

  • Dati, dati, ovunque
  • Il DNA è la risposta?
  • È tutta una questione di spazio di archiviazione
  • Immagina le possibilità

È probabile che questo non sia qualcosa di cui ti sei dovuto preoccupare troppo negli ultimi anni. C'è stato un tempo, non molto tempo fa, in cui il disco rigido limitato del tuo computer era tutto lo spazio di archiviazione a tua disposizione. Raggiungi quel limite (che, nel caso del mio primo computer, era inferiore a 100 MB) e ricorra a floppy disk e altri dispositivi di archiviazione esterni locali. Quando hai finito anche quello, sei stato eliminato.

Ogni giorno vengono creati circa 2,5 quintilioni di byte di dati, per gentile concessione dei 3,7 miliardi di esseri umani che ora utilizzano Internet.

Non cancelliamo più. E nemmeno le aziende, soprattutto quelle valutate in base ai dati in loro possesso. Invece, spingiamo semplicemente i nostri file nel cloud, il cui nome stesso è effimero ed etereo; privo di qualsiasi vera fisicità. Dove vengono archiviati i dati? Non importa finché possiamo riaverlo indietro. Quali sono i pericoli se si esaurisce lo spazio di archiviazione nel cloud? Apparentemente molto poco, oltre a dover aumentare i pagamenti mensili dell'abbonamento per sbloccare più glorioso spazio libero.

Imparentato

  • Il governo degli Stati Uniti e le grandi tecnologie vogliono utilizzare i dati sulla posizione per combattere il coronavirus
  • DNA, vetro inciso al laser e oltre: uno sguardo al futuro dell'archiviazione dei dati
  • L’ultima innovazione di Microsoft potrebbe rendere possibili i data center basati sul DNA

Di conseguenza, l’idea che un giorno potremmo esaurire lo spazio di archiviazione dei dati è altrettanto difficile da comprendere in giro come il suggerimento che potremmo rimanere senza acqua: quella gloriosa risorsa gratuita che cade dal cielo. Ma il 2018 è l’anno in cui è arrivata Cape Town, in Sud Africa precipitosamente vicino a rimanere senza acqua. E potremmo anche esaurire la memoria dei dati.

Dati, dati, ovunque

La ragione di ciò è il ritmo inimmaginabile con cui attualmente produciamo dati. Ogni giorno vengono creati circa 2,5 quintilioni di byte di dati, per gentile concessione dei 3,7 miliardi di esseri umani che ora utilizzano Internet. Solo negli ultimi due anni è stato creato uno sbalorditivo 90% dei dati mondiali. Con un numero crescente di dispositivi intelligenti connessi all’Internet delle cose, tale cifra è destinata ad aumentare in modo significativo.

Grafico della creazione totale dei dati
Grafico che mostra la quantità di dati che dovranno essere archiviati
Catalogare

"Quando pensiamo al cloud storage, pensiamo a questi archivi infiniti di dati", Hyunjun Park, CEO e cofondatore della società di archiviazione dati Catalogare, ha detto a Digital Trends. “Ma il cloud in realtà è solo il computer di qualcun altro. Ciò che la maggior parte delle persone non capisce è che stiamo generando così tanti dati che il ritmo con cui li stiamo generando supera di gran lunga la nostra capacità di archiviarli tutti. Nel prossimo futuro, ci sarà un enorme divario tra i dati utili che stiamo generando e il modo in cui saremo in grado di archiviarli utilizzando i mezzi convenzionali”.

Catalog ha sviluppato una tecnologia che ritiene possa trasformare il modo in cui archiviamo i dati.

Poiché le società di cloud storage sono impegnate a costruire nuovi data center e ad espandere quelli esistenti, a ritmo serrato, è difficile capire quando potremmo esaurire la capacità di archiviazione dei dati. Non esiste un orologio per il conto alla rovescia in stile film. Secondo Park, tuttavia, già nel 2025 l’umanità potrebbe aver prodotto complessivamente più di 160 zettabyte di dati. (Uno zettabyte, nel caso ve lo stiate chiedendo, è un trilione di gigabyte.) Quanto di questo saremo in grado di archiviare? Circa il 12,5%, suggerisce Park.

Chiaramente bisogna fare qualcosa.

Il DNA è la risposta?

È qui che Park e il collega scienziato e co-fondatore del MIT Nathaniel Roquet entrano in scena. Il loro catalogo di startup ha sviluppato una tecnologia che secondo loro potrebbe trasformare l'archiviazione dei dati come la conosciamo; consentendo, o almeno così sostengono, che la totalità dei dati del mondo possa essere comodamente inserita in uno spazio delle dimensioni di un guardaroba.

Il team di archiviazione del DNA del catalogo
Il team di archiviazione del DNA di Catalog in laboratorio.Catalogare

La soluzione del catalogo? Codificando i dati nel DNA. Potrebbe sembrare la trama di un romanzo di Michael Crichton, ma la loro soluzione scalabile e conveniente è seria, e lo è ha ricevuto finora 9 milioni di dollari in finanziamenti di venture capital, insieme al sostegno di importanti professori di Stanford e Harvard Università.

“Una domanda che mi viene posta spesso è: ‘Di chi è il DNA che stiamo usando?’” Park rise. "La gente ha paura che prendiamo il DNA dalle persone e le trasformiamo in mutanti, o cose del genere."

Per anni i colli di bottiglia hanno impedito al DNA di essere all’altezza del suo enorme potenziale di archiviazione dei dati.

Questo non è, è bene chiarirlo, ciò che Catalog sta facendo. Il DNA in cui l'azienda sta codificando i dati è un polimero sintetico. Non è qualcosa che deriva da un’origine biologica, e la serie di coppie di basi in cui sono codificati i dati, come una serie di uno e zero, non è il codice di qualcosa di vivente. Ma il prodotto finale è comunque biologicamente indistinguibile da qualcosa che potresti trovare in una cellula vivente.

L’idea che il DNA possa essere un potenziale metodo di conservazione è stata ipotizzata ormai da decenni, praticamente da quando James Watson e Francis Crick scoprirono la doppia elica nel 1953. Tuttavia, fino ad ora si sono verificati numerosi colli di bottiglia che gli hanno impedito di essere all’altezza enorme potenziale come soluzione di archiviazione dei dati computazionali.

Il pensiero tradizionale sull’archiviazione dei dati basata sul DNA si concentrava sulla sintesi di nuove molecole di DNA; mappare la sequenza di bit sulla sequenza delle quattro paia di basi del DNA e creare abbastanza molecole per rappresentare tutti i numeri che desideri memorizzare. Il problema è che questo processo è lento e costoso, nonché notevoli colli di bottiglia quando si tratta di archiviare i dati.

Capacità di stoccaggio del DNA rispetto a quella tradizionale
Come Catalog sintetizza l'archiviazione nel DNA
Catalogare

L’approccio di Catalog si basa sul disaccoppiamento del processo di sintesi dal processo di codifica. In sostanza, l’azienda genera un numero enorme di poche molecole diverse (rendendolo molto più economico) e quindi codifica le informazioni generando un’enorme diversità dalle molecole prefabbricate.

Per analogia, Catalog ha paragonato l'approccio precedente alla produzione di dischi rigidi personalizzati con tutti i dati cablati. Archiviare dati diversi significa costruire un disco rigido completamente nuovo da zero. Il loro approccio, suggeriscono, è simile alla produzione di massa di dischi rigidi vergini, per poi riempirli con le informazioni codificate come e quando richiesto.

È tutta una questione di spazio di archiviazione

La parte interessante di tutto questo è l’incredibile quantità di dati che può archiviare. Come prova del concetto, Catalog ha utilizzato la sua tecnologia per codificare libri come La Guida di Hitchhiker alla Galassia nel DNA. Ma questo non è niente in confronto alle possibilità.

Dall'inizio alla fine, la lettura dei dati dal DNA richiederà almeno diverse ore.

"Se confronti mele con mele, i bit che puoi archiviare nello stesso volume risultano essere qualcosa come 1 milione di volte la densità informativa di un'unità a stato solido", ha affermato Park. "Qualunque cosa tu possa memorizzare in una chiavetta USB, potresti memorizzarne 1 milione di volte nello stesso volume se lo fai nel DNA."

Il confronto con i drive a stato solido, tuttavia, non è esatto. Il DNA potrebbe essere in grado di archiviare molte più informazioni nello stesso volume, ma non ha l’accesso istantaneo, ad esempio, di un’unità flash collegata tramite USB. L’approccio di Catalog trasforma i dati in una pallina solida di polimero sintetico.

Per accedere ai dati, gli scienziati dovrebbero prendere il pellet, reidratarlo aggiungendo acqua e quindi leggerlo utilizzando un sequenziatore di DNA. Ciò fornisce le coppie di basi del DNA, che a loro volta possono essere utilizzate per calcolare gli uno e gli zeri che riassemblano i dati. Dall'inizio alla fine, il processo richiederà almeno diverse ore.

Il team DNA di Catalog in laboratorio
Per recuperare i dati dal DNA, gli scienziati dovrebbero prendere il pellet in cui è immagazzinato, reidratarlo aggiungendo acqua e quindi leggerlo utilizzando un sequenziatore di DNA.Catalogare

Per questo motivo Catalog si rivolge inizialmente a un mercato abituato a questo tipo di ritardi: il mercato dell'archiviazione. Questo è il tipo di dati attualmente archiviati su formati come il nastro magnetico, utilizzato per tenerne traccia del tipo di informazioni che potresti sperare di non dover rivisitare, ma che è comunque fondamentale appendere su. (Immagina l'equivalente aziendale della garanzia sul tuo frigorifero.)

Ma c’è mai un punto in cui questo avrà importanza per l’utente medio? Dopotutto, come abbiamo sottolineato all’inizio di questo articolo, la maggior parte di noi non pensa molto ai propri dati e a dove vengono conservati. E' su nastro magnetico? È su una memoria a stato solido? Non ci importa finché è lì quando ne abbiamo bisogno.

È probabile che la codifica dei dati basata sul DNA costituisca un’opzione di archiviazione a lungo termine, mentre i dati a breve termine assumono altre forme.

A causa della quantità di tempo necessaria per recuperare le informazioni, è improbabile che si arrivi mai a un punto in cui, per Ad esempio, le tue informazioni su Google Cloud sono archiviate in enormi vasche di DNA o come una serie di palline simili a marmo in Mountain Visualizza, CA. Se Catalog fosse in grado di dimostrare il suo concetto alle aziende, questa sarebbe probabilmente un’opzione di archiviazione a lungo termine, mentre i dati a breve termine assumerebbero altre forme.

Immagina le possibilità

Un tubo contenente milioni di copie di dati codificati nel DNA.Catalogare

Ci sono però interessanti possibilità dal suono fantascientifico. "Immagina un pellet sottocutaneo contenente tutti i tuoi dati sanitari, tutte le tue scansioni MRA, i tuoi esami del sangue, le tue radiografie del tuo dentista", ha detto Park. “Vorresti sempre che quei dati fossero molto accessibili per te, ma non li vuoi necessariamente nel cloud da qualche parte o su un server non protetto in un ospedale. Se lo avessi con te sotto forma di DNA, potresti controllare fisicamente quei dati e accedervi, assicurandoti che solo i medici autorizzati possano accedervi.

Dopotutto, come sottolinea, tutti gli ospedali oggi dispongono di sequenziatori del DNA. “Non sto dicendo che lo stiamo perseguendo in questo momento, ma è un futuro possibile”, ha detto.

Dopo aver annunciato la sua nuova azienda al mondo, Catalog è ora concentrata sulla realizzazione di alcuni progetti pilota per dimostrare come questa tecnologia possa essere utilizzata in modo efficace. “Queste non sono sfide scientifiche che ci restano da risolvere, ma piuttosto problemi di ottimizzazione meccanica”, ha osservato.

Essendo, per sua stessa ammissione, entrato in questo campo perché sembrava un approccio tecnologico interessante per un grande problema, Park è ora convinto che l’archiviazione dei dati del DNA potrebbe rivelarsi una delle tecnologie più importanti del nostro tempo.

Diamine, quando si tratta di archiviare la storia umana come la conosciamo, è difficile non essere d’accordo. “Si tratta di preservare il nostro modo di vivere come lo conosciamo”, ha spiegato.

Raccomandazioni degli editori

  • I nastri magnetici della vecchia scuola sono il supporto di memorizzazione dei dati del futuro?
  • La Cina vuole utilizzare la controversa analisi del DNA per indovinare i volti dei criminali
  • Questa startup biotecnologica vuole mettere il tuo DNA in un deposito sulla luna
  • Gli scienziati del Caltech hanno utilizzato il DNA per giocare al più piccolo gioco del mondo, il tris
  • La medicina di precisione dipende dal DNA, ma sputare presenta comunque dei rischi