Първо апокалиптичното предупреждение: Изчерпваме мястото за съхранение на данни.
Съдържание
- Данни, данни, навсякъде
- ДНК ли е отговорът?
- Всичко е свързано със съхранението
- Представете си възможностите
Вероятно това не е нещо, за което трябва да се тревожите твърде много през последните години. Имаше време, не толкова отдавна, когато ограниченият твърд диск на вашия компютър беше всичкото хранилище, което разполагахте. Достигнахте това ограничение (което в случая на моя първи компютър беше по-малко от 100MB) и прибягнахте до флопи дискове и други локални външни памети. Когато и това ви свърши, вие сте изтрили.
Всеки ден се създават около 2,5 квинтилиона байта данни, благодарение на 3,7 милиарда души, които сега използват интернет.
Не изтриваме повече. Нито компаниите, особено тези, които се оценяват въз основа на данните, които притежават. Вместо това ние просто пренасяме нашите файлове в облака, чието само име е ефимерно и ефирно; липсва каквато и да е истинска физичност. Къде се съхраняват данните? Няма значение, стига да можем да си го върнем. Какви са опасностите от изчерпването на облачното хранилище? На пръв поглед много малко, освен че трябва да увеличите месечните си абонаментни плащания, за да отключите повече великолепно безплатно пространство.
Свързани
- Правителството на САЩ и големите технологии искат да използват данни за местоположението за борба с коронавируса
- ДНК, лазерно гравирано стъкло и не само: Надникване в бъдещето на съхранението на данни
- Последният пробив на Microsoft може да направи възможни центрове за данни, базирани на ДНК
В резултат на това идеята, че един ден може да ни свърши съхранението на данни, е също толкова трудна за обгръщане около като предположението, че може да ни свърши водата: този славен безплатен ресурс, който пада от небе. Но 2018 е годината, в която дойде Кейптаун, Южна Африка рязко близо до изчерпване на водата. И може да ни свърши и мястото за съхранение на данни.
Данни, данни, навсякъде
Причината за това е невъобразимото темпо, с което в момента произвеждаме данни. Всеки ден се създават около 2,5 квинтилиона байта данни, благодарение на 3,7 милиарда души, които сега използват интернет. Само през последните две години са създадени умопомрачителните 90 процента от данните в света. С нарастващия брой интелигентни устройства, свързани с Интернет на нещата, тази цифра ще се увеличи значително.
„Когато мислим за облачно съхранение, мислим за тези безкрайни хранилища на данни“, Hyunjun Park, главен изпълнителен директор и съосновател на компанията за съхранение на данни Каталог, каза Digital Trends. „Но облакът всъщност е просто компютър на някой друг. Това, което повечето хора не осъзнават, е, че генерираме толкова много данни, че скоростта, с която ги генерираме, далеч изпреварва способността ни да съхраняваме всички. В много близко бъдеще ще имаме огромна празнина между полезните данни, които генерираме, и начина, по който можем да ги съхраняваме, използвайки конвенционални носители.“
Catalog са разработили технология, която смятат, че може да промени начина, по който съхраняваме данни.
Тъй като компаниите за съхранение в облака са заети с изграждането на нови центрове за данни и разширяването на съществуващите със скорост от възела, е трудно да се определи кога можем да изчерпим капацитета за съхранение на данни. Няма часовник за обратно броене във филмов стил. Според Парк обаче още през 2025 г. човечеството може да е произвело повече от 160 зетабайта данни кумулативно. (Един зетабайт, в случай че се чудите, е трилион гигабайта.) Колко от това ще можем да съхраним? Около 12,5 процента от него, предполага Парк.
Ясно е, че трябва да се направи нещо.
ДНК ли е отговорът?
Това е мястото, където Парк и колегата му учен от MIT и съосновател Натаниел Роке влизат в картината. Техният стартъп Catalog е разработил технология, която смятат, че може да трансформира съхранението на данни, както го познаваме; позволявайки, или поне така твърдят те, всички данни в света да бъдат удобно поставени в пространство с размерите на гардероб.
Решението на каталога? Чрез кодиране на данни в ДНК. Това може да звучи като сюжет на роман на Майкъл Крайтън, но тяхното мащабируемо и достъпно решение е сериозно и има толкова получи 9 милиона долара рисково финансиране - заедно с подкрепата на водещи професори от Станфорд и Харвард университети.
„Въпрос, който често ми задават, е „Чия ДНК използваме?““ Парк се засмя. „Хората се страхуват от това, че вземаме ДНК от хора и ги превръщаме в мутанти или подобни неща.“
Години наред тесните места не позволяват на ДНК да изпълни своя огромен потенциал за съхранение на данни.
Това не е, трябва да изясним, какво прави Каталогът. ДНК, в която компанията кодира данните, е синтетичен полимер. Това не е нещо, което идва от биологичен произход и поредицата от базови двойки, в които са кодирани данните, като поредица от единици и нули, не е кодът за нищо живо. Но крайният продукт въпреки това е биологично неразличим от нещо, което може да намерите в жива клетка.
Идеята за ДНК като потенциален метод за съхранение се спекулира от десетилетия, почти откакто Джеймс Уотсън и Франсис Крик откриха двойната спирала през 1953 г. Досега обаче имаше редица пречки, които го спираха да отговаря на изискванията огромен потенциал като решение за съхранение на изчислителни данни.
Традиционното мислене за базирано на ДНК съхранение на данни, фокусирано върху синтеза на нови ДНК молекули; картографиране на последователността от битове към последователността от четирите базови двойки на ДНК и създаване на достатъчно молекули, за да представят всички числа, които искате да съхраните. Проблемът е, че този процес е бавен и скъп, като и двете са значителни затруднения, когато става въпрос за съхранение на данни.
Подходът на Catalog се основава на отделяне на процеса на синтез от процеса на кодиране. По същество компанията генерира огромен брой само няколко различни молекули (което я прави много по-евтина) и след това кодира информацията, като генерира огромно разнообразие от предварително направените молекули.
Като аналогия, Catalog оприличи предишния подход за производство на персонализирани твърди дискове с всичките ви данни, свързани вътре. Съхраняването на различни данни означава изграждане на изцяло нов твърд диск от нулата. Техният подход, според тях, е подобен на масовото производство на празни твърди дискове и след това запълването им с кодирана информация, както и когато е необходимо.
Всичко е свързано със съхранението
Вълнуващата част от всичко това е умопомрачителното количество данни, които може да съхранява. Като доказателство за концепцията, Catalog използва своята технология за кодиране на книги като Пътеводител на галактическия стопаджия в ДНК. Но това не е нищо в сравнение с възможностите.
От началото до края четенето на данни от ДНК ще отнеме минимум няколко часа.
„Ако сравнявате ябълки с ябълки, битовете, които можете да съхранявате в един и същи обем, излизат с около 1 милион пъти по-голяма информационна плътност от твърдотелно устройство“, каза Парк. „Каквото и да съхранявате във флаш устройство, можете да съхранявате 1 милион пъти повече в същия обем, ако го правите в ДНК.“
Сравнението със твърдотелните дискове обаче не е точно. ДНК може да е в състояние да съхранява много повече информация в същия обем, но няма незабавния достъп на, да речем, свързано с USB флаш устройство. Подходът на Catalog трансформира данните в твърда пелета от синтетичен полимер.
За да получат достъп до вашите данни, учените ще трябва да вземат споменатата пелета, да я рехидратират чрез добавяне на вода и след това да я прочетат с помощта на ДНК секвенсер. Това осигурява базовите двойки на ДНК, които на свой ред могат да бъдат използвани за изчисляване на единиците и нулите, които събират вашите данни. От началото до края процесът ще отнеме минимум няколко часа.
Поради тази причина Catalog първоначално се насочва към пазар, свикнал с този вид забавяния: пазарът на архивиране. Това е вид данни, които в момента се съхраняват във формати като магнитна лента, използвани за проследяване от вида информация, която може да се надявате да не се налага да преразглеждате, но все пак е от решаващо значение за закачане върху. (Представете си корпоративния еквивалент на гаранцията за вашия хладилник.)
Но има ли момент, в който това ще има значение за средния потребител? В края на краищата, както посочихме в началото на тази статия, повечето от нас всъщност не мислят толкова много за нашите данни и къде се съхраняват. На магнитна лента ли е? На твърдотелно хранилище ли е? Нямаме нищо против, стига да е там, когато имаме нужда от него.
Базираното на ДНК кодиране на данни вероятно ще бъде опция за дългосрочно съхранение, докато краткосрочните данни приемат други форми.
Поради количеството време, необходимо за извличане на информация, е малко вероятно някога да има точка, в която за например информацията ви в Google Cloud се съхранява в огромни вани с ДНК или като поредица от подобни на мрамор пелети в Mountain Изглед, Калифорния. Ако Catalog успее да докаже концепцията си на бизнеса, това вероятно ще бъде опция за дългосрочно съхранение, докато краткосрочните данни приемат други форми.
Представете си възможностите
Има обаче вълнуващи възможности, звучащи като научна фантастика. „Представете си подкожна пелета, съдържаща всичките ви здравни данни, всичките ви MRA сканирания, кръвните ви тестове, вашите рентгенови снимки от вашия зъболекар“, каза Парк. „Винаги бихте искали тези данни да са много достъпни за вас, но не е задължително да са някъде в облака или на незащитен сървър в болница. Ако имате това със себе си под формата на ДНК, бихте могли физически да контролирате тези данни и достъпа до тях, като същевременно се уверите, че само оторизираните лекари могат да имат достъп до тях.
В края на краищата, както той посочва, всички болници днес имат ДНК секвенатори. „Не казвам, че преследваме това в момента, но това е възможно бъдеще“, каза той.
След като обявиха новата си компания на света, Catalog сега се фокусира върху изпълнението на някои пилотни проекти, за да демонстрира как тази технология може да се използва ефективно. „Това не са научни предизвикателства, които трябва да решим, а по-скоро проблеми с механичната оптимизация“, отбеляза той.
След като, по собственото му признание, е навлязъл в тази област, защото звучи като страхотен технологичен подход към голям проблем, Парк вече е убеден, че съхранението на ДНК данни може да се окаже една от най-важните технологии в света време.
По дяволите, когато става въпрос за възможността да архивираме човешката история, такава каквато я познаваме, е трудно да не се съглася. „Става дума за запазване на начина ни на живот, какъвто го познаваме“, обясни той.
Препоръки на редакторите
- Магнитните ленти от старата школа са носителят на данни на бъдещето?
- Китай иска да използва спорен ДНК анализ, за да познае лицата на престъпниците
- Този биотехнологичен стартъп иска да постави вашето ДНК в трезор на Луната
- Учените от Калтех използваха ДНК, за да изиграят най-малката игра в света на тик-так
- Прецизната медицина зависи от ДНК, но изпращането на вашата плюнка все още крие рискове