Коли у нас закінчується місце для даних, вчені хочуть зберігати їх у ДНК

Google

Спочатку апокаліптичне попередження: у нас закінчується пам’ять даних.

Зміст

  • Дані, дані всюди
  • Чи є ДНК відповіддю?
  • Вся справа в сховищі
  • Уявіть собі можливості

Швидше за все, це не те, про що вам доводилося надто турбуватися останніми роками. Був час, не так давно, коли обмежений жорсткий диск вашого комп’ютера був усім доступним сховищем. Досягнувши цього ліміту (який у випадку мого першого комп’ютера становив менше 100 МБ), ви вдалися до використання дискет та інших локальних зовнішніх накопичувачів. Коли у вас закінчилося й це, ви отримали видалення.

Щодня створюється близько 2,5 квінтильйонів байт даних завдяки 3,7 мільярдам людей, які зараз користуються Інтернетом.

Більше не видаляємо. Також не компанії, особливо ті, які оцінюються на основі даних, якими вони володіють. Замість цього ми просто переміщуємо наші файли в хмару, сама назва якої ефемерна та ефірна; відсутність будь-якої реальної фізичності. Де зберігаються дані? Це не має значення, якщо ми зможемо його повернути. Які небезпеки нестачі хмарного сховища? Здавалося б, дуже мало, окрім того, щоб збільшити щомісячні платежі за підписку, щоб розблокувати більше чудового вільного простору.

Пов'язані

  • Уряд США та великі технологічні компанії хочуть використовувати дані про місцезнаходження для боротьби з коронавірусом
  • ДНК, лазерне гравіювання скла та інше: зазирніть у майбутнє зберігання даних
  • Останній прорив Microsoft може зробити центри обробки даних на основі ДНК можливими

Як наслідок, ідея про те, що одного дня у нас може закінчитися сховище даних, так само складна для вас навколо, як припущення, що у нас може закінчитися вода: цей чудовий безкоштовний ресурс, який падає з небо. Але 2018 рік - це рік, коли настав Кейптаун, Південна Африка раптово закінчиться вода. Крім того, у нас може закінчитися сховище даних.

Дані, дані всюди

Причиною цього є неймовірна швидкість, з якою ми зараз створюємо дані. Щодня створюється близько 2,5 квінтильйонів байт даних завдяки 3,7 мільярдам людей, які зараз користуються Інтернетом. Тільки за останні два роки було створено вражаючі 90 відсотків даних у світі. Із зростанням кількості розумних пристроїв, підключених до Інтернету речей, ця цифра значно зросте.

Графік загального створення даних
Графік, який показує, скільки даних потрібно буде зберегти
Каталог

«Коли ми думаємо про хмарне сховище, ми думаємо про ці нескінченні сховища даних», — Хюнджун Парк, генеральний директор і співзасновник компанії зі зберігання даних Каталог, розповіли Digital Trends. «Але насправді хмара — це лише чийсь комп’ютер. Більшість людей не усвідомлюють, що ми генеруємо стільки даних, що швидкість, з якою ми їх генеруємо, значно випереджає нашу здатність зберігати їх усі. У найближчому майбутньому ми матимемо величезний розрив між корисними даними, які ми генеруємо, і тим, як ми можемо зберігати їх за допомогою звичайних носіїв».

Catalog розробив технологію, яка, на її думку, може змінити спосіб зберігання даних.

Оскільки компанії, які займаються хмарним сховищем, зайняті будівництвом нових центрів обробки даних і розширенням існуючих зі швидкістю вузлів, важко визначити, коли у нас може вичерпатися ємність для зберігання даних. Немає годинника зворотного відліку в стилі кіно. Проте, за словами Парка, вже до 2025 року людство могло створити понад 160 зетабайт даних сукупно. (Зеттабайт, якщо вам цікаво, це трильйон гігабайт.) Скільки з цього ми зможемо зберегти? Приблизно 12,5 відсотка, припускає Парк.

Очевидно, що потрібно щось робити.

Чи є ДНК відповіддю?

Ось тут на сцену з’являються Парк і його колега, вчений і співзасновник Массачусетського технологічного інституту Натаніель Роке. Їх стартап Catalog розробив технологію, яка, на їхню думку, може змінити сховище даних у тому вигляді, в якому ми його знаємо; дозволяючи, принаймні вони стверджують, усі світові дані зручно розмістити в просторі розміром із шафу для одягу.

Команда зберігання ДНК Каталогу
Команда зберігання ДНК Каталогу в лабораторії.Каталог

Рішення каталогу? Шляхом кодування даних у ДНК. Це може звучати як сюжет роману Майкла Крайтона, але їх масштабоване та доступне рішення є серйозним і далеко отримав 9 мільйонів доларів венчурного фінансування — разом із підтримкою провідних професорів із Стенфорду та Гарварду ВНЗ.

«Мені часто задають питання: чию ДНК ми використовуємо?», — засміявся Парк. «Люди бояться, що ми беремо ДНК у людей і перетворюємо їх на мутантів або щось подібне».

Протягом багатьох років вузькі місця не дозволяли ДНК реалізувати свій величезний потенціал зберігання даних.

Це не так, ми повинні чітко пояснити, що робить Каталог. ДНК, у яку компанія кодує дані, є синтетичним полімером. Це не те, що походить від біологічного походження, і ряд пар основ, у які кодуються дані, як ряд одиниць і нулів, не є кодом для чогось живого. Але кінцевий продукт все одно біологічно не відрізняється від того, що ви можете знайти в живій клітині.

Ідея про те, що ДНК є потенційним методом зберігання, обговорюється протягом десятиліть, практично з тих пір, як Джеймс Уотсон і Френсіс Крік відкрили подвійну спіраль у 1953 році. Однак досі існувала низка вузьких місць, які не дозволяли йому відповідати своїм вимогам величезний потенціал як рішення для зберігання обчислювальних даних.

Традиційне мислення щодо зберігання даних на основі ДНК зосереджувалося на синтезі нових молекул ДНК; зіставляючи послідовність бітів із послідовністю чотирьох пар основ ДНК і створюючи достатню кількість молекул, щоб представити всі числа, які ви хочете зберегти. Проблема полягає в тому, що цей процес повільний і дорогий, обидва є значними вузькими місцями, коли справа доходить до зберігання даних.

Ємність зберігання ДНК проти традиційної
Як Catalog синтезує пам’ять у ДНК
Каталог

Підхід Catalog базується на відокремленні процесу синтезу від процесу кодування. По суті, компанія генерує величезну кількість лише кількох різних молекул (що робить це набагато дешевше), а потім кодує інформацію, генеруючи величезну різноманітність готових молекул.

Як аналогію, Catalog порівняв попередній підхід до виробництва жорстких дисків на замовлення, у які всі ваші дані були закріплені на жорсткому кабелі. Зберігання різних даних означає створення абсолютно нового жорсткого диска з нуля. Вони припускають, що їхній підхід схожий на масове виробництво порожніх жорстких дисків, а потім заповнення їх закодованою інформацією за потреби.

Вся справа в сховищі

Захоплююча частина всього цього — приголомшливий обсяг даних, який він може зберігати. Як доказ концепції Catalog використав свою технологію для кодування таких книг, як Путівник по галактиці автостопом в ДНК. Але це ніщо в порівнянні з можливостями.

Від початку до кінця зчитування даних з ДНК займе мінімум кілька годин.

«Якщо ви порівнюєте яблука з яблуками, біти, які ви можете зберігати в тому самому об’ємі, мають приблизно в 1 мільйон разів більшу щільність інформації, ніж твердотільний накопичувач», — сказав Парк. «Все, що ви можете зберегти на флеш-накопичувачі, ви можете зберегти в 1 мільйон разів більше в тому самому обсязі, якщо ви робите це в ДНК».

Однак порівняння з твердотільними накопичувачами не є точним. DNA може зберігати набагато більше інформації в тому самому обсязі, але вона не має миттєвого доступу, скажімо, до флеш-пам’яті, підключеної через USB. Підхід Catalog перетворює дані на тверді гранули синтетичного полімеру.

Щоб отримати доступ до ваших даних, вченим потрібно було б взяти згадану гранулу, регідратувати її, додавши воду, а потім прочитати за допомогою секвенатора ДНК. Це забезпечує пари основ ДНК, які, у свою чергу, можна використовувати для обчислення одиниць і нулів, які збирають ваші дані. Від початку до кінця процес займе мінімум кілька годин.

ДНК-команда Catalog у лабораторії
Щоб отримати дані з ДНК, вченим потрібно буде взяти гранулу, на якій вона зберігається, повторно зволожити її, додавши воду, а потім прочитати за допомогою секвенатора ДНК.Каталог

З цієї причини Catalog спочатку націлений на ринок, який звик до таких затримок: ринок архівування. Це тип даних, який зараз зберігається у таких форматах, як магнітна стрічка, яка використовується для відстеження інформації, яку, як ви сподіваєтеся, не доведеться переглядати, але її все одно важливо повісити на. (Уявіть собі корпоративний еквівалент гарантії на ваш холодильник.)

Але чи є момент, коли це матиме значення для середнього користувача? Зрештою, як ми зазначали у верхній частині цієї статті, більшість із нас насправді не дуже замислюються про наші дані та про те, де вони зберігаються. Це на магнітній стрічці? Він на твердотільному накопичувачі? Ми не заперечуємо, якщо воно є, коли нам це потрібно.

Кодування даних на основі ДНК, ймовірно, буде варіантом довгострокового зберігання, тоді як короткострокові дані приймають інші форми.

Через кількість часу, який потрібен для отримання інформації, навряд чи колись настане момент, коли для Наприклад, ваша інформація Google Cloud зберігається у величезних чанах ДНК або у вигляді серії кульок, схожих на мармур, у Mountain Погляд, Каліфорнія. Якщо Catalog зможе довести свою концепцію для компаній, це, швидше за все, буде варіант довгострокового зберігання, тоді як короткострокові дані прийматимуть інші форми.

Уявіть собі можливості

Труба, що містить мільйони копій даних, закодованих у ДНК.Каталог

Однак існують захоплюючі можливості, які звучать як науково-фантастичні. «Уявіть собі підшкірну гранулу, яка містить усі ваші дані про здоров’я, усі ваші МРА-сканування, аналізи крові, рентгенівські знімки вашого стоматолога», — сказав Парк. «Ви б завжди хотіли, щоб ці дані були для вас дуже доступними, але ви не обов’язково хочете, щоб вони були десь у хмарі або на незахищеному сервері в лікарні. Якби у вас було це у вигляді ДНК, ви могли б фізично контролювати ці дані та доступ до них, переконавшись, що доступ до них мають лише уповноважені лікарі».

Адже, як він зазначає, сьогодні в усіх лікарнях є секвенатори ДНК. «Я не кажу, що ми зараз займаємося цим, але це можливе майбутнє», — сказав він.

Оголосивши світові про свою нову компанію, Catalog зараз зосереджується на виконанні кількох пілотних проектів, щоб продемонструвати, як цю технологію можна ефективно використовувати. «Це не наукові проблеми, які нам залишилося вирішити, а скоріше проблеми механічної оптимізації», — зазначив він.

За його власним визнанням, увійшовши в цю сферу, тому що це звучало як крутий технологічний підхід до великого Парк тепер переконаний, що зберігання даних ДНК може виявитися однією з найважливіших наших технологій час.

Важко не погодитися, коли мова заходить про можливість архівувати історію людства, як ми її знаємо. «Йдеться про збереження нашого способу життя, яким ми його знаємо», — пояснив він.

Рекомендації редакції

  • Чи є старі магнітні стрічки носієм даних майбутнього?
  • Китай хоче використовувати суперечливий аналіз ДНК, щоб вгадувати обличчя злочинців
  • Цей біотехнологічний стартап хоче помістити вашу ДНК у сховище на Місяці
  • Вчені Каліфорнійського технологічного інституту використали ДНК, щоб зіграти в найменшу у світі гру в хрестики-нулики
  • Точна медицина залежить від ДНК, але розсилка вашого плюва все ще має ризики