Когда у нас заканчивается место для данных, ученые хотят сохранить их в ДНК

Google

Сначала апокалиптическое предупреждение: у нас заканчивается место для хранения данных.

Содержание

  • Данные, данные повсюду
  • Является ли ДНК ответом?
  • Все дело в хранении
  • Представьте себе возможности

Скорее всего, в последние годы вам не приходилось слишком беспокоиться об этом. Было время, не так уж давно, когда ограниченный жесткий диск вашего компьютера был единственным доступным хранилищем. Достигнув этого предела (который в случае с моим первым компьютером составлял менее 100 МБ), вы прибегли к использованию дискет и других локальных внешних хранилищ. Когда у вас это тоже закончилось, вам пришлось удалить.

Каждый день создается около 2,5 квинтиллионов байт данных благодаря 3,7 миллиардам людей, которые сейчас пользуются Интернетом.

Больше не удаляем. Не делают этого и компании, особенно те, которые оцениваются на основе имеющихся у них данных. Вместо этого мы просто переносим наши файлы в облако, само имя которого эфемерно и нереально; лишен какой-либо реальной телесности. Где хранятся данные? Это не имеет значения, пока мы можем вернуть его. Каковы опасности нехватки облачного хранилища? Казалось бы, очень мало, не считая необходимости увеличивать ежемесячные платежи по подписке, чтобы разблокировать еще больше свободного места.

Связанный

  • Правительство США и крупные технологические компании хотят использовать данные о местоположении для борьбы с коронавирусом
  • ДНК, стекло с лазерной гравировкой и многое другое: взгляд в будущее хранения данных
  • Последний прорыв Microsoft может сделать возможными центры обработки данных на основе ДНК

В результате мысль о том, что однажды у нас может закончиться хранилище данных, так же трудно уложить в голове. как предположение о том, что у нас может закончиться вода: этот великолепный бесплатный ресурс, который падает из небо. Но 2018 год — это год, когда пришел Кейптаун, Южная Африка. очень близко к тому, чтобы закончиться вода. И нам также может не хватить места для хранения данных.

Данные, данные повсюду

Причиной этого являются невообразимые темпы, с которыми мы в настоящее время производим данные. Каждый день создается около 2,5 квинтиллионов байт данных благодаря 3,7 миллиардам людей, которые сейчас пользуются Интернетом. Только за последние два года было создано ошеломляющие 90 процентов мировых данных. С ростом числа интеллектуальных устройств, подключенных к Интернету вещей, эта цифра значительно увеличится.

График общего создания данных
График, показывающий, какой объем данных необходимо будет хранить
Каталог

«Когда мы думаем об облачном хранилище, мы думаем об этих бесконечных хранилищах данных», — Хёнджун Пак, генеральный директор и соучредитель компании по хранению данных. Каталог, рассказал Digital Trends. «Но на самом деле облако — это всего лишь чужой компьютер. Большинство людей не осознают, что мы генерируем так много данных, что скорость, с которой мы их генерируем, намного превосходит нашу способность хранить их все. В самом ближайшем будущем у нас возникнет огромный разрыв между полезными данными, которые мы генерируем, и тем, как мы сможем их хранить, используя традиционные носители».

Каталог разработал технологию, которая, по их мнению, может изменить способ хранения данных.

Поскольку компании, занимающиеся облачными хранилищами, заняты строительством новых центров обработки данных и расширением существующих со скоростью узлов, трудно определить, когда у нас может закончиться емкость хранилища данных. Нет часов обратного отсчета в стиле кино. Однако, по мнению Пака, уже к 2025 году человечество, возможно, в совокупности создаст более 160 зеттабайт данных. (Зеттабайт, если вам интересно, — это триллион гигабайт.) Сколько из этого мы сможем хранить? Около 12,5 процентов, предполагает Пак.

Понятно, что нужно что-то делать.

Является ли ДНК ответом?

Именно здесь на сцену выходят Пак и его коллега, ученый и соучредитель Массачусетского технологического института Натаниэль Роке. Их стартап-каталог разработал технологию, которая, по их мнению, может преобразовать хранилище данных в том виде, в каком мы его знаем; позволяя, по крайней мере, так они утверждают, всем мировым данным удобно разместиться в пространстве размером с гардеробную.

Команда хранения ДНК Каталога
Команда хранения ДНК Каталога в лаборатории.Каталог

Решение каталога? Путем кодирования данных в ДНК. Это может звучать как сюжет романа Майкла Крайтона, но их масштабируемое и доступное решение является серьезным и имеет настолько Far получил $9 млн венчурного финансирования — наряду с поддержкой ведущих профессоров Стэнфорда и Гарварда. Университеты.

«Мне часто задают вопрос: «Чью ДНК мы используем?» — засмеялся Пак. «Люди боятся, что мы заберем ДНК у людей и превратим их в мутантов или что-то в этом роде».

В течение многих лет узкие места не позволяли ДНК реализовать свой огромный потенциал хранения данных.

Это не то, мы должны прояснить, чем занимается Каталог. ДНК, в которую компания кодирует данные, представляет собой синтетический полимер. Это не что-то биологическое, и серия пар оснований, в которых закодированы данные, как серия единиц и нулей, не является кодом чего-либо живого. Но конечный продукт, тем не менее, биологически неотличим от того, что можно найти в живой клетке.

Идея о том, что ДНК является потенциальным методом хранения, обсуждалась уже несколько десятилетий, практически с тех пор, как Джеймс Уотсон и Фрэнсис Крик открыли двойную спираль в 1953 году. Однако до сих пор существовал ряд узких мест, которые не позволяли ему соответствовать своим требованиям. огромный потенциал в качестве решения для хранения вычислительных данных.

Традиционное мышление о хранении данных на основе ДНК сосредоточено на синтезе новых молекул ДНК; сопоставить последовательность битов с последовательностью четырех пар оснований ДНК и создать достаточное количество молекул, чтобы представить все числа, которые вы хотите сохранить. Проблема в том, что этот процесс медленный и дорогой, что является серьезным препятствием для хранения данных.

Емкость хранения ДНК по сравнению с традиционными
Как Каталог синтезирует хранилище в ДНК
Каталог

Подход каталога основан на отделении процесса синтеза от процесса кодирования. По сути, компания генерирует огромное количество всего лишь нескольких разных молекул (что делает это намного дешевле), а затем кодирует информацию, создавая огромное разнообразие из готовых молекул.

В качестве аналогии Catalog сравнил предыдущий подход к производству индивидуальных жестких дисков со всеми вашими данными. Хранение различных данных означает создание совершенно нового жесткого диска с нуля. Их подход, по их мнению, сродни массовому производству чистых жестких дисков с последующим заполнением их закодированной информацией по мере необходимости.

Все дело в хранении

Самое интересное во всем этом — ошеломляющий объем данных, которые он может хранить. В качестве доказательства концепции Catalog использовал свою технологию для кодирования таких книг, как Автостопом по Галактике в ДНК. Но это ничто по сравнению с возможностями.

От начала до конца считывание данных с ДНК займет как минимум несколько часов.

«Если вы сравниваете яблоки с яблоками, то количество битов, которые вы можете хранить в одном и том же объеме, примерно в 1 миллион раз превышает информационную плотность твердотельного накопителя», — сказал Парк. «Все, что вы можете хранить на флэш-накопителе, вы можете сохранить в том же объеме в миллион раз больше, если сделаете это в ДНК».

Однако сравнение с твердотельными накопителями не совсем точно. ДНК может хранить гораздо больше информации в том же объеме, но у нее нет мгновенного доступа, как, скажем, к флэш-накопителю, подключенному через USB. Подход каталога преобразует данные в твердую гранулу синтетического полимера.

Чтобы получить доступ к вашим данным, ученым придется взять осадок, регидратировать его, добавив воды, а затем прочитать с помощью секвенатора ДНК. Это обеспечивает пары оснований ДНК, которые, в свою очередь, затем можно использовать для вычисления единиц и нулей, которые заново собирают ваши данные. От начала до конца процесс займет минимум несколько часов.

Команда ДНК каталога в лаборатории
Чтобы получить данные из ДНК, ученым придется взять осадок, на котором он хранится, регидратировать его, добавив воды, а затем прочитать с помощью секвенатора ДНК.Каталог

По этой причине Catalog изначально ориентируется на рынок, привыкший к такого рода задержкам: рынок архивирования. Это тот тип данных, который в настоящее время хранится в таких форматах, как магнитная лента, используемая для отслеживания. такого рода информации, к которой, возможно, вам не придется возвращаться, но которую все равно важно сохранить. на. (Представьте себе корпоративный эквивалент гарантии на ваш холодильник.)

Но есть ли когда-нибудь момент, когда это станет иметь значение для обычного пользователя? В конце концов, как мы отмечали в начале этой статьи, большинство из нас на самом деле не особо задумываются о наших данных и о том, где они хранятся. Это на магнитной ленте? Это на твердотельном накопителе? Мы не возражаем, пока оно есть, когда оно нам нужно.

Кодирование данных на основе ДНК, вероятно, будет вариантом долгосрочного хранения, в то время как краткосрочные данные принимают другие формы.

Из-за количества времени, которое требуется для получения информации, вряд ли когда-либо наступит момент, когда Например, ваша информация в Google Cloud хранится в огромных чанах с ДНК или в виде серии мрамороподобных гранул в горах. Вью, Калифорния. Если Каталог сможет доказать свою концепцию предприятиям, это, скорее всего, будет вариант долгосрочного хранения, в то время как краткосрочные данные примут другие формы.

Представьте себе возможности

Трубка, содержащая миллионы копий данных, закодированных в ДНК.Каталог

Однако есть захватывающие возможности, звучащие в духе научной фантастики. «Представьте себе подкожную таблетку, содержащую все данные о вашем здоровье, все ваши снимки MRA, ваши анализы крови, ваши рентгеновские снимки от вашего стоматолога», — сказал Пак. «Вы всегда хотели бы, чтобы эти данные были для вас очень доступны, но вам не обязательно нужно, чтобы они находились где-то в облаке или на незащищенном сервере в больнице. Если бы у вас это было с собой в виде ДНК, вы могли бы физически контролировать эти данные и доступ к ним, гарантируя при этом, что только уполномоченные врачи смогут иметь к ним доступ».

В конце концов, как он отмечает, сегодня во всех больницах есть секвенаторы ДНК. «Я не говорю, что мы стремимся к этому прямо сейчас, но это возможно в будущем», — сказал он.

Объявив миру о своей новой компании, Catalog теперь сосредоточен на реализации нескольких пилотных проектов, чтобы продемонстрировать, как можно эффективно использовать эту технологию. «Это не научные задачи, которые нам предстоит решить, а скорее проблемы механической оптимизации», — отметил он.

По его собственному признанию, он вошел в эту область потому, что это звучало как крутой технологический подход к большому проблемы, Пак теперь убежден, что хранение данных ДНК может оказаться одной из наиболее важных технологий нашего времени. время.

Черт возьми, когда дело доходит до возможности архивировать историю человечества в том виде, в котором мы ее знаем, трудно не согласиться. «Речь идет о сохранении нашего образа жизни в том виде, в каком мы его знаем», — объяснил он.

Рекомендации редакции

  • Являются ли магнитные ленты старой школы носителем данных будущего?
  • Китай хочет использовать спорный анализ ДНК, чтобы угадывать лица преступников
  • Этот биотехнологический стартап хочет поместить вашу ДНК в хранилище на Луне
  • Ученые Калифорнийского технологического института использовали ДНК, чтобы сыграть в самую крошечную в мире игру в крестики-нолики
  • Точная медицина зависит от ДНК, но отправка слюны по-прежнему сопряжена с риском