Lorsque nous manquons de place pour les données, les scientifiques veulent les stocker dans l'ADN

Google

Tout d’abord l’avertissement apocalyptique: nous manquons de stockage de données.

Contenu

  • Des données, des données, partout
  • L’ADN est-il la réponse ?
  • Tout est question de stockage
  • Imaginez les possibilités

Il y a de fortes chances que ce ne soit pas quelque chose dont vous avez eu à vous soucier outre mesure ces dernières années. Il fut un temps, il n’y a pas si longtemps, où le disque dur limité de votre ordinateur représentait tout l’espace de stockage dont vous disposiez. Atteignez cette limite (qui, dans le cas de mon premier ordinateur, était inférieure à 100 Mo) et vous avez eu recours à des disquettes et à d'autres stockages externes locaux. Lorsque vous en avez manqué également, vous avez été supprimé.

Chaque jour, environ 2,5 quintillions d’octets de données sont créés, grâce aux 3,7 milliards d’humains qui utilisent désormais Internet.

Nous ne supprimons plus. Les entreprises non plus, notamment celles évaluées en fonction des données qu’elles possèdent. Au lieu de cela, nous propulsons simplement nos fichiers vers le cloud, dont le nom même est éphémère et éthéré; dépourvu de toute réelle physicalité. Où sont stockées les données? Cela n’a pas d’importance tant que nous pouvons le récupérer. Quels sont les risques liés au manque de stockage cloud? Apparemment très peu, à part devoir augmenter vos paiements mensuels d'abonnement pour débloquer un espace gratuit plus glorieux.

En rapport

  • Le gouvernement américain et les grandes technologies veulent utiliser les données de localisation pour lutter contre le coronavirus
  • ADN, verre gravé au laser et au-delà: un aperçu de l'avenir du stockage de données
  • La dernière avancée de Microsoft pourrait rendre possible les centres de données basés sur l'ADN

En conséquence, l’idée que nous pourrions un jour manquer de stockage de données est aussi difficile à comprendre comme la suggestion selon laquelle nous pourrions manquer d’eau: cette glorieuse ressource gratuite qui tombe du ciel. Mais 2018 est l'année où Cape Town, en Afrique du Sud, est arrivée précipitamment sur le point de manquer d’eau. Et nous pourrions également manquer de stockage de données.

Des données, des données, partout

La raison en est la vitesse inimaginable à laquelle nous produisons actuellement des données. Chaque jour, environ 2,5 quintillions d’octets de données sont créés, grâce aux 3,7 milliards d’humains qui utilisent désormais Internet. Au cours des deux dernières années seulement, 90 % des données mondiales ont été créées. Avec le nombre croissant d’appareils intelligents connectés à l’Internet des objets, ce chiffre est appelé à augmenter considérablement.

Graphique de la création totale de données
Graphique montrant la quantité de données qui devront être stockées
Catalogue

"Quand nous pensons au stockage dans le cloud, nous pensons à ces réserves infinies de données", Hyunjun Park, PDG et co-fondateur de la société de stockage de données. Catalogue, a déclaré à Digital Trends. « Mais le cloud n’est en réalité que l’ordinateur de quelqu’un d’autre. Ce que la plupart des gens ne réalisent pas, c’est que nous générons tellement de données que la vitesse à laquelle nous les générons dépasse de loin notre capacité à toutes les stocker. Dans un avenir très proche, nous aurons un énorme fossé entre les données utiles que nous générons et la manière dont nous sommes capables de les stocker sur les supports conventionnels.

Catalog a développé une technologie qui, selon eux, pourrait transformer la façon dont nous stockons les données.

Étant donné que les sociétés de stockage dans le cloud sont occupées à construire de nouveaux centres de données et à étendre ceux qui existent déjà, à un rythme effréné, il est difficile de déterminer quand nous pourrions manquer de capacité de stockage de données. Il n’y a pas de compte à rebours de style film. Cependant, selon Park, dès 2025, l’humanité aurait produit plus de 160 zettaoctets de données au total. (Un zettaoctet, au cas où vous vous poseriez la question, équivaut à un billion de gigaoctets.) Quelle quantité serons-nous capables de stocker? Environ 12,5 pour cent, suggère Park.

De toute évidence, il faut faire quelque chose.

L’ADN est-il la réponse ?

C’est là que Park et son collègue scientifique du MIT et co-fondateur Nathaniel Roquet entrent en scène. Leur startup Catalog a développé une technologie qui, selon eux, pourrait transformer le stockage de données tel que nous le connaissons; permettant, du moins c’est ce qu’ils prétendent, que l’intégralité des données du monde s’intègre confortablement dans un espace de la taille d’un placard.

L'équipe stockage ADN du catalogue
L’équipe de stockage d’ADN du catalogue dans le laboratoire.Catalogue

La solution du catalogue? En codant les données dans l'ADN. Cela peut ressembler à l'intrigue d'un roman de Michael Crichton, mais leur solution évolutive et abordable est sérieuse, et a tellement jusqu'à présent, a reçu 9 millions de dollars en financement de capital-risque, ainsi que le soutien d'éminents professeurs de Stanford et de Harvard. Les universités.

« Une question qu’on me pose souvent est: « De quel ADN utilisons-nous? » » Park a ri. "Les gens ont peur que nous prenions l'ADN des gens et que nous les transformions en mutants, ou des choses comme ça."

Pendant des années, des goulots d’étranglement ont empêché l’ADN d’exploiter son énorme potentiel de stockage de données.

Ce n’est pas, il faut le préciser, ce que fait Catalog. L’ADN dans lequel l’entreprise code les données est un polymère synthétique. Ce n’est pas quelque chose qui vient d’une origine biologique, et la série de paires de bases dans lesquelles les données sont codées, sous la forme d’une série de uns et de zéros, n’est pas le code de quoi que ce soit de vivant. Mais le produit final est néanmoins biologiquement impossible à distinguer de quelque chose que l’on pourrait trouver dans une cellule vivante.

L’idée selon laquelle l’ADN pourrait être une méthode de stockage fait l’objet de spéculations depuis des décennies, pratiquement depuis que James Watson et Francis Crick ont ​​découvert la double hélice en 1953. Cependant, jusqu'à présent, il y a eu un certain nombre de goulots d'étranglement qui l'ont empêché de respecter ses objectifs. potentiel énorme en tant que solution de stockage de données informatiques.

La pensée traditionnelle sur le stockage de données basé sur l'ADN était axée sur la synthèse de nouvelles molécules d'ADN; mapper la séquence de bits sur la séquence des quatre paires de bases de l’ADN et créer suffisamment de molécules pour représenter tous les nombres que vous souhaitez stocker. Le problème est que ce processus est lent et coûteux, deux goulots d'étranglement considérables lorsqu'il s'agit de stocker des données.

Capacité de stockage de l'ADN par rapport au traditionnel
Comment Catalog synthétise le stockage en ADN
Catalogue

L’approche de Catalog est basée sur le découplage du processus de synthèse du processus d’encodage. Essentiellement, l’entreprise génère un nombre massif de quelques molécules différentes (ce qui la rend beaucoup moins chère), puis code les informations en générant une grande diversité à partir des molécules prédéfinies.

Par analogie, Catalog a comparé l'approche précédente consistant à fabriquer des disques durs personnalisés avec toutes vos données câblées. Stocker différentes données signifie créer un tout nouveau disque dur à partir de zéro. Leur approche, suggèrent-ils, s’apparente à la production en masse de disques durs vierges, puis à leur remplissage avec les informations codées au fur et à mesure des besoins.

Tout est question de stockage

Ce qui est intéressant dans tout cela, c’est la quantité ahurissante de données qu’il peut stocker. En guise de preuve de concept, Catalog a utilisé sa technologie pour encoder des livres comme Le Guide du voyageur galactique dans l'ADN. Mais ce n’est rien comparé aux possibilités.

Du début à la fin, la lecture des données de l’ADN prendra au minimum plusieurs heures.

"Si vous comparez des pommes avec des pommes, les bits que vous pouvez stocker dans le même volume ont une densité d'informations d'environ 1 million de fois supérieure à celle d'un disque SSD", a déclaré Park. "Tout ce que vous pouvez stocker dans une clé USB, vous pourriez en stocker 1 million de fois plus dans le même volume si vous le faites dans l'ADN."

La comparaison avec les disques SSD n’est cependant pas exacte. L’ADN est peut-être capable de stocker beaucoup plus d’informations dans le même volume, mais il n’a pas l’accès instantané, par exemple, d’une clé USB connectée. L’approche de Catalog transforme les données en une pastille solide de polymère synthétique.

Pour accéder à vos données, les scientifiques devront prélever ladite pastille, la réhydrater en ajoutant de l’eau, puis la lire à l’aide d’un séquenceur d’ADN. Cela fournit les paires de bases de l’ADN, qui peuvent ensuite être utilisées pour calculer les uns et les zéros qui réassemblent vos données. Du début à la fin, le processus prendra au minimum plusieurs heures.

L'équipe ADN de Catalog en laboratoire
Afin de récupérer des données sur l’ADN, les scientifiques devraient prendre le culot sur lequel il est stocké, le réhydrater en ajoutant de l’eau, puis le lire à l’aide d’un séquenceur d’ADN.Catalogue

C'est pourquoi Catalog s'adresse dans un premier temps à un marché habitué à ce genre de délais: le marché de l'archivage. C'est le type de données qui sont actuellement stockées sur des formats comme la bande magnétique, utilisées pour garder une trace du type d'informations que vous pourriez espérer ne pas avoir à revoir, mais qu'il est toujours crucial de conserver sur. (Imaginez l'équivalent corporatif de la garantie sur votre réfrigérateur.)

Mais y a-t-il un moment où cela sera important pour l’utilisateur moyen? Après tout, comme nous l’avons souligné en haut de cet article, la plupart d’entre nous ne pensent pas vraiment à nos données et à l’endroit où elles sont conservées. C'est sur bande magnétique? Est-ce sur un stockage SSD? Cela ne nous dérange pas tant qu’il est là quand nous en avons besoin.

Le codage des données basé sur l’ADN constituera probablement une option de stockage à long terme, tandis que les données à court terme prendront d’autres formes.

En raison du temps nécessaire pour récupérer les informations, il est peu probable qu'il y ait un jour un moment où, par exemple, Par exemple, vos informations Google Cloud sont stockées dans d'énormes cuves d'ADN ou sous la forme d'une série de pastilles semblables à du marbre dans Mountain. Vue, Californie. Si Catalog parvient à prouver son concept aux entreprises, il s’agira probablement d’une option de stockage à long terme, tandis que les données à court terme prendront d’autres formes.

Imaginez les possibilités

Un tube contenant des millions de copies de données codées dans l'ADN.Catalogue

Il existe cependant des possibilités passionnantes qui ressemblent à de la science-fiction. "Imaginez une pastille sous-cutanée contenant toutes vos données de santé, tous vos examens ARM, vos analyses de sang, vos radiographies de votre dentiste", a déclaré Park. « Vous voudriez toujours que ces données vous soient très accessibles, mais vous ne voulez pas nécessairement qu’elles soient stockées quelque part dans le cloud ou sur un serveur non sécurisé dans un hôpital. Si vous aviez cela avec vous sous forme d’ADN, vous pourriez contrôler physiquement ces données et y accéder, tout en vous assurant que seuls les médecins autorisés pourraient y avoir accès.

Après tout, comme il le souligne, tous les hôpitaux disposent aujourd’hui de séquenceurs d’ADN. « Je ne dis pas que nous poursuivons cela pour le moment, mais c’est un avenir possible », a-t-il déclaré.

Après avoir annoncé sa nouvelle entreprise au monde, Catalog se concentre désormais sur la réalisation de quelques projets pilotes pour démontrer comment cette technologie peut être utilisée efficacement. « Il ne s’agit pas de défis scientifiques à résoudre, mais plutôt de problèmes d’optimisation mécanique », a-t-il souligné.

Ayant, de son propre aveu, été entré dans ce domaine parce que cela ressemblait à une approche technologique cool pour un grand problème, Park est désormais convaincu que le stockage des données ADN pourrait s'avérer être l'une des technologies les plus importantes de notre temps.

Bon sang, lorsqu’il s’agit de pouvoir archiver l’histoire humaine telle que nous la connaissons, il est difficile d’être en désaccord. « Il s’agit de préserver notre mode de vie tel que nous le connaissons », a-t-il expliqué.

Recommandations des rédacteurs

  • Les bandes magnétiques à l’ancienne sont-elles le support de stockage de données du futur?
  • La Chine veut utiliser une analyse ADN controversée pour deviner les visages des criminels
  • Cette startup de biotechnologie veut mettre votre ADN dans un coffre-fort sur la lune
  • Des scientifiques de Caltech ont utilisé l'ADN pour jouer au plus petit jeu de tic-tac-toe au monde
  • La médecine de précision dépend de l’ADN, mais envoyer ses crachats comporte toujours des risques