Cuando nos quedamos sin espacio para datos, los científicos quieren almacenarlos en el ADN

Google

Primero, la advertencia apocalíptica: nos estamos quedando sin almacenamiento de datos.

Contenido

  • Datos, datos, en todas partes
  • ¿Es el ADN la respuesta?
  • Se trata del almacenamiento
  • Imagina las posibilidades

Lo más probable es que esto no sea algo por lo que haya tenido que preocuparse demasiado en los últimos años. Hubo un tiempo, no hace mucho, en que el disco duro finito de su computadora era todo el almacenamiento que tenía disponible. Al alcanzar ese límite (que, en el caso de mi primera computadora, era menos de 100 MB), recurrió a disquetes y otros tipos de almacenamiento externo local. Cuando te quedaste sin eso, también lo eliminaste.

Cada día se crean alrededor de 2,5 quintillones de bytes de datos, cortesía de los 3.700 millones de seres humanos que ahora utilizan Internet.

No eliminamos más. Las empresas tampoco, especialmente aquellas valoradas en función de los datos que poseen. En lugar de eso, simplemente lanzamos nuestros archivos a la nube, cuyo mismo nombre es efímero y etéreo; carente de cualquier fisicalidad real. ¿Dónde se almacenan los datos? No importa mientras podamos recuperarlo. ¿Cuáles son los peligros de quedarse sin almacenamiento en la nube? Aparentemente muy poco, además de tener que aumentar los pagos de suscripción mensual para desbloquear más espacio gratuito.

Relacionado

  • El gobierno de EE. UU. y las grandes empresas tecnológicas quieren utilizar datos de ubicación para combatir el coronavirus
  • ADN, vidrio grabado con láser y más: un vistazo al futuro del almacenamiento de datos
  • El último avance de Microsoft podría hacer posibles los centros de datos basados ​​en ADN

Como resultado, la idea de que algún día podríamos quedarnos sin almacenamiento de datos es tan difícil de entender. como la sugerencia de que podríamos quedarnos sin agua: ese glorioso recurso gratuito que cae del cielo. Pero 2018 es el año en el que llegó Ciudad del Cabo, Sudáfrica. precipitadamente cerca de quedarse sin agua. Y también podríamos quedarnos sin almacenamiento de datos.

Datos, datos, en todas partes

La razón de esto es el ritmo inimaginable al que actualmente producimos datos. Cada día se crean alrededor de 2,5 quintillones de bytes de datos, cortesía de los 3.700 millones de seres humanos que ahora utilizan Internet. Sólo en los últimos dos años, se ha creado un alucinante 90 por ciento de los datos del mundo. Con un número creciente de dispositivos inteligentes conectados al Internet de las cosas, esa cifra aumentará significativamente.

Gráfico de creación total de datos.
Gráfico que muestra la cantidad de datos que será necesario almacenar
Catalogar

"Cuando pensamos en el almacenamiento en la nube, pensamos en estos infinitos almacenes de datos", Hyunjun Park, director ejecutivo y cofundador de la empresa de almacenamiento de datos. Catalogar, dijo a Digital Trends. “Pero la nube en realidad es sólo la computadora de otra persona. Lo que la mayoría de la gente no se da cuenta es que estamos generando tantos datos que el ritmo al que los generamos supera con creces nuestra capacidad para almacenarlos todos. En un futuro muy cercano, vamos a tener una brecha enorme entre los datos útiles que generamos y la forma en que podemos almacenarlos utilizando medios convencionales”.

Catalog ha desarrollado una tecnología que creen que podría transformar la forma en que almacenamos datos.

Dado que las empresas de almacenamiento en la nube están ocupadas construyendo nuevos centros de datos y ampliando los existentes a un ritmo vertiginoso, es difícil determinar cuándo podríamos quedarnos sin capacidad de almacenamiento de datos. No hay un reloj de cuenta regresiva al estilo de una película. Sin embargo, según Park, ya en 2025 la humanidad podría haber producido más de 160 zettabytes de datos de forma acumulada. (Un zettabyte, en caso de que se lo pregunte, es un billón de gigabytes). ¿Cuánto de esto podremos almacenar? Alrededor del 12,5 por ciento, sugiere Park.

Es evidente que es necesario hacer algo.

¿Es el ADN la respuesta?

Ahí es donde Park y su colega científico y cofundador del MIT, Nathaniel Roquet, entran en escena. Su startup Catalog ha desarrollado una tecnología que creen que podría transformar el almacenamiento de datos tal como lo conocemos; permitiendo, o al menos eso afirman, que todos los datos del mundo quepan cómodamente en un espacio del tamaño de un armario.

Equipo de almacenamiento de ADN del catálogo.
Equipo de almacenamiento de ADN del catálogo en el laboratorio.Catalogar

¿La solución del catálogo? Codificando datos en ADN. Puede parecer la trama de una novela de Michael Crichton, pero su solución escalable y asequible es seria y lo ha hecho. Hasta ahora ha recibido 9 millones de dólares en financiación de riesgo, junto con el apoyo de destacados profesores de Stanford y Harvard. Universidades.

"Una pregunta que me hacen a menudo es: '¿El ADN de quién estamos usando?'", se rió Park. "La gente tiene miedo de que tomemos ADN de la gente y los convirtamos en mutantes o cosas así".

Durante años, los cuellos de botella han impedido que el ADN esté a la altura de su enorme potencial de almacenamiento de datos.

Debemos dejar claro que esto no es lo que está haciendo Catalog. El ADN en el que la empresa codifica los datos es un polímero sintético. No es algo que tenga un origen biológico, y la serie de pares de bases en las que están codificados los datos, como una serie de unos y ceros, no es el código de nada vivo. Sin embargo, el producto final es biológicamente indistinguible de algo que podría encontrarse en una célula viva.

La idea de que el ADN sea un método potencial de almacenamiento se ha especulado durante décadas, prácticamente desde que James Watson y Francis Crick descubrieron la doble hélice en 1953. Sin embargo, hasta ahora ha habido una serie de obstáculos que le han impedido estar a la altura de sus objetivos. enorme potencial como solución de almacenamiento de datos computacionales.

El pensamiento tradicional sobre el almacenamiento de datos basado en ADN se centraba en la síntesis de nuevas moléculas de ADN; mapear la secuencia de bits a la secuencia de los cuatro pares de bases del ADN y producir suficientes moléculas para representar todos los números que desea almacenar. El problema es que este proceso es lento y costoso, ambos obstáculos considerables a la hora de almacenar datos.

Capacidad de almacenamiento de ADN vs tradicional
Cómo Catalog sintetiza el almacenamiento en ADN
Catalogar

El enfoque de Catalog se basa en desacoplar el proceso de síntesis del proceso de codificación. Básicamente, la empresa genera cantidades masivas de unas pocas moléculas diferentes (lo que las hace mucho más baratas) y luego codifica la información generando una enorme diversidad a partir de las moléculas prefabricadas.

Como analogía, Catalog comparó el enfoque anterior con la fabricación de discos duros personalizados con todos los datos conectados. Almacenar diferentes datos significa construir un disco duro completamente nuevo desde cero. Sugieren que su enfoque es similar a producir en masa discos duros vacíos y luego llenarlos con la información codificada cuando sea necesario.

Se trata del almacenamiento

Lo interesante de todo esto es la alucinante cantidad de datos que puede almacenar. Como prueba de concepto, Catalog ha utilizado su tecnología para codificar libros como La Guía del autoestopista galáctico en el ADN. Pero eso no es nada comparado con las posibilidades.

De principio a fin, la lectura de datos del ADN llevará como mínimo varias horas.

"Si comparas manzanas con manzanas, los bits que puedes almacenar en el mismo volumen tienen una densidad de información de aproximadamente 1 millón de veces la de una unidad de estado sólido", dijo Park. "Todo lo que puedas almacenar en una unidad flash, podrías almacenar 1 millón de veces más en el mismo volumen si lo haces en ADN".

Sin embargo, la comparación con las unidades de estado sólido no es exacta. El ADN puede almacenar mucha más información en el mismo volumen, pero no tiene el acceso instantáneo de, por ejemplo, una unidad flash conectada por USB. El enfoque del catálogo transforma los datos en una bolita sólida de polímero sintético.

Para acceder a sus datos, los científicos necesitarían tomar dicho gránulo, rehidratarlo agregando agua y luego leerlo usando un secuenciador de ADN. Esto proporciona los pares de bases del ADN, que, a su vez, pueden usarse para calcular los unos y los ceros que vuelven a ensamblar sus datos. De principio a fin, el proceso durará un mínimo de varias horas.

El equipo de ADN del catálogo en el laboratorio.
Para recuperar datos del ADN, los científicos necesitarían tomar el gránulo en el que está almacenado, rehidratarlo agregando agua y luego leerlo usando un secuenciador de ADN.Catalogar

Por este motivo, Catalog se dirige inicialmente a un mercado acostumbrado a este tipo de retrasos: el mercado del archivo. Este es el tipo de datos que actualmente se almacenan en formatos como la cinta magnética, que se utiliza para realizar un seguimiento del tipo de información que quizás esperes no tener que volver a visitar, pero que aún así es crucial colgarla sobre. (Imagínese el equivalente corporativo de la garantía de su refrigerador).

Pero, ¿hay algún momento en el que esto sea importante para el usuario medio? Después de todo, como señalamos al principio de este artículo, la mayoría de nosotros no pensamos mucho en nuestros datos y dónde se guardan. ¿Está en cinta magnética? ¿Está en almacenamiento de estado sólido? No nos importa siempre que esté ahí cuando lo necesitemos.

Es probable que la codificación de datos basada en ADN sea una opción de almacenamiento a largo plazo, mientras que los datos a corto plazo adoptan otras formas.

Debido a la cantidad de tiempo que lleva recuperar información, es poco probable que alguna vez llegue un punto en el que, por ejemplo, Por ejemplo, su información de Google Cloud se almacena en enormes cubas de ADN o como una serie de bolitas parecidas a mármol en Mountain Ver, California. Si Catalog pudiera demostrar su concepto a las empresas, es probable que sea una opción de almacenamiento a largo plazo, mientras que los datos a corto plazo toman otras formas.

Imagina las posibilidades

Un tubo que contiene millones de copias de datos codificados en ADN.Catalogar

Sin embargo, existen interesantes posibilidades que suenan a ciencia ficción. "Imagínese una bolita subcutánea que contiene todos sus datos de salud, todas sus exploraciones MRA, sus análisis de sangre, las radiografías de su dentista", dijo Park. “Siempre querrás que esos datos sean muy accesibles para ti, pero no necesariamente los querrás en algún lugar de la nube o en un servidor no seguro en un hospital. Si tuviera eso consigo en forma de ADN, podría controlar físicamente esos datos y acceder a ellos, asegurándose al mismo tiempo de que sólo los médicos autorizados pudieran tener acceso a ellos”.

Al fin y al cabo, como señala, hoy en día todos los hospitales cuentan con secuenciadores de ADN. "No estoy diciendo que estemos persiguiendo eso ahora, pero es un futuro posible", dijo.

Tras anunciar su nueva empresa al mundo, Catalog se centra ahora en llevar a cabo algunos proyectos piloto para demostrar cómo se puede utilizar esta tecnología de forma eficaz. “Estos no son desafíos científicos que nos quedan por resolver, sino problemas de optimización mecánica”, señaló.

Habiendo, según admitió él mismo, haber entrado en este campo porque parecía un enfoque tecnológico genial para una gran empresa. problema, Park ahora está convencido de que el almacenamiento de datos de ADN puede llegar a ser una de las tecnologías más importantes de nuestro tiempo. tiempo.

Diablos, cuando se trata de poder archivar la historia humana tal como la conocemos, es difícil no estar de acuerdo. "Se trata de preservar nuestra forma de vida tal como la conocemos", explicó.

Recomendaciones de los editores

  • ¿Son las cintas magnéticas de la vieja escuela el medio de almacenamiento de datos del futuro?
  • China quiere utilizar controvertidos análisis de ADN para adivinar los rostros de los criminales
  • Esta startup de biotecnología quiere poner tu ADN en una bóveda en la luna
  • Los científicos de Caltech utilizaron ADN para jugar el juego de tres en raya más pequeño del mundo
  • La medicina de precisión depende del ADN, pero enviar saliva todavía tiene riesgos