Kiedy zabraknie miejsca na dane, naukowcy chcą przechowywać je w DNA

Google

Najpierw apokaliptyczne ostrzeżenie: kończy nam się miejsce na dane.

Zawartość

  • Dane, dane, wszędzie
  • Czy DNA jest odpowiedzią?
  • Wszystko dotyczy przechowywania
  • Wyobraź sobie możliwości

Są szanse, że nie było to coś, czym musiałeś się zbytnio martwić w ostatnich latach. Był czas, nie tak dawno temu, kiedy całą dostępną przestrzeń dyskową zajmował ograniczony dysk twardy komputera. Osiągnij ten limit (który w przypadku mojego pierwszego komputera był mniejszy niż 100MB) i skorzystałeś z dyskietek i innej lokalnej pamięci zewnętrznej. Kiedy ci się to również skończyło, musisz je usunąć.

Każdego dnia powstaje około 2,5 tryliona bajtów danych dzięki uprzejmości 3,7 miliarda ludzi korzystających obecnie z Internetu.

Więcej nie usuwamy. Nie robią tego również firmy, zwłaszcza te wyceniane na podstawie posiadanych danych. Zamiast tego po prostu przesyłamy nasze pliki do chmury, której sama nazwa jest efemeryczna i eteryczna; pozbawiony jakiejkolwiek prawdziwej fizyczności. Gdzie są przechowywane dane? To nie ma znaczenia, dopóki możemy to odzyskać. Jakie są zagrożenia związane z wyczerpaniem się miejsca w chmurze? Pozornie bardzo niewiele, poza koniecznością podniesienia miesięcznych opłat subskrypcyjnych, aby odblokować więcej wspaniałego wolnego miejsca.

Powiązany

  • Rząd USA i wielka technologia chcą wykorzystywać dane o lokalizacji do walki z koronawirusem
  • DNA, szkło trawione laserowo i nie tylko: spojrzenie w przyszłość przechowywania danych
  • Najnowsze przełomowe osiągnięcie Microsoftu może umożliwić powstanie centrów danych opartych na DNA

W rezultacie myśl, że pewnego dnia może zabraknąć nam miejsca na dane, jest tak trudna do przyjęcia wokół jako sugestia, że ​​może nam zabraknąć wody: tego wspaniałego, darmowego zasobu, który spada z niebo. Ale rok 2018 to rok, w którym przybył Kapsztad w Republice Południowej Afryki gwałtownie blisko wyczerpania się wody. Mogło nam też zabraknąć miejsca na dane.

Dane, dane, wszędzie

Powodem tego jest niewyobrażalne tempo, w jakim obecnie generujemy dane. Każdego dnia powstaje około 2,5 tryliona bajtów danych dzięki uprzejmości 3,7 miliarda ludzi korzystających obecnie z Internetu. Tylko w ciągu ostatnich dwóch lat powstało zadziwiające 90 procent światowych danych. Wraz z rosnącą liczbą inteligentnych urządzeń podłączonych do Internetu rzeczy liczba ta znacznie wzrośnie.

Wykres całkowitego utworzenia danych
Wykres pokazujący, ile danych będzie wymaganych do przechowywania
Katalog

„Kiedy myślimy o przechowywaniu w chmurze, myślimy o nieskończonych magazynach danych” – Hyunjun Park, dyrektor generalny i współzałożyciel firmy zajmującej się przechowywaniem danych Katalog, powiedział Digital Trends. „Ale chmura to tak naprawdę tylko komputer kogoś innego. Większość ludzi nie zdaje sobie sprawy, że generujemy tak dużo danych, że tempo, w jakim je generujemy, znacznie przekracza możliwości ich przechowywania. W najbliższej przyszłości będziemy mieli ogromną rozbieżność między użytecznymi danymi, które generujemy, a sposobem, w jaki jesteśmy w stanie je przechowywać przy użyciu konwencjonalnych nośników”.

Firma Catalog opracowała technologię, która według nich może zmienić sposób przechowywania danych.

Ponieważ firmy zajmujące się przechowywaniem w chmurze są zajęte budowaniem nowych centrów danych i rozbudową istniejących w błyskawicznym tempie, trudno jest ustalić, kiedy może zabraknąć pojemności przechowywania danych. Nie ma zegara odliczającego w stylu filmowym. Jednak według Parka już w 2025 roku ludzkość mogła wyprodukować łącznie ponad 160 zettabajtów danych. (Zettabajt, jeśli się zastanawiasz, to bilion gigabajtów.) Ile z tego będziemy w stanie przechowywać? Park sugeruje, że około 12,5 procent z tego.

To oczywiste, że trzeba coś zrobić.

Czy DNA jest odpowiedzią?

To tutaj wkraczają Park oraz inny naukowiec z MIT i współzałożyciel Nathaniel Roquet. Ich start-up Catalog opracował technologię, która według nich może zmienić sposób przechowywania danych, jaki znamy; pozwalając, a przynajmniej tak twierdzą, całość danych z całego świata wygodnie zmieścić się w przestrzeni wielkości szafy na ubrania.

Zespół zajmujący się przechowywaniem DNA w katalogu
Zespół ds. przechowywania DNA w katalogu w laboratorium.Katalog

Rozwiązanie katalogowe? Kodując dane w DNA. Może to brzmieć jak fabuła powieści Michaela Crichtona, ale ich skalowalne i niedrogie rozwiązanie jest poważne i ma tak far otrzymało fundusze venture capital w wysokości 9 milionów dolarów – wraz ze wsparciem czołowych profesorów ze Stanford i Harvardu Uniwersytety.

„Często zadawane mi pytanie brzmi: «Czyjego DNA używamy?»” Park się roześmiał. „Ludzie boją się, że pobierzemy od ludzi DNA i zamienimy ich w mutanty lub coś w tym rodzaju”.

Przez lata wąskie gardła uniemożliwiały DNA wykorzystanie jego ogromnego potencjału przechowywania danych.

To nie jest, co powinniśmy wyjaśnić, czym zajmuje się Katalog. DNA, w którym firma koduje dane, to syntetyczny polimer. Nie jest to coś, co ma pochodzenie biologiczne, a seria par zasad, w których zakodowane są dane, jako ciąg zer i jedynek, nie jest kodem niczego, co żyje. Niemniej jednak produkt końcowy jest biologicznie nie do odróżnienia od czegoś, co można znaleźć w żywej komórce.

Pomysł, że DNA może być potencjalną metodą przechowywania, spekuluje się od dziesięcioleci, praktycznie od czasu, gdy James Watson i Francis Crick odkryli podwójną helisę w 1953 roku. Jednak do tej pory istniało wiele wąskich gardeł, które uniemożliwiały jej osiągnięcie swoich celów ogromny potencjał jako rozwiązanie do przechowywania danych obliczeniowych.

Tradycyjne myślenie o przechowywaniu danych w oparciu o DNA skupiało się na syntezie nowych cząsteczek DNA; mapując sekwencję bitów na sekwencję czterech par zasad DNA i tworząc wystarczającą liczbę cząsteczek, aby reprezentowały wszystkie liczby, które chcesz przechowywać. Problem polega na tym, że proces ten jest powolny i kosztowny, co stanowi znaczne wąskie gardło, jeśli chodzi o przechowywanie danych.

Pojemność przechowywania DNA a tradycyjna
Jak Katalog syntetyzuje pamięć do DNA
Katalog

Podejście katalogu opiera się na oddzieleniu procesu syntezy od procesu kodowania. Zasadniczo firma generuje ogromne liczby zaledwie kilku różnych cząsteczek (co znacznie taniej), a następnie koduje informacje, generując ogromną różnorodność z gotowych cząsteczek.

Dla analogii firma Catalog porównała poprzednie podejście do produkcji niestandardowych dysków twardych, w których wszystkie dane są podłączone na stałe. Przechowywanie różnych danych oznacza zbudowanie od podstaw zupełnie nowego dysku twardego. Sugerują, że ich podejście przypomina masową produkcję pustych dysków twardych, a następnie wypełnianie ich zakodowanymi informacjami, kiedy i kiedy jest to wymagane.

Wszystko dotyczy przechowywania

Ekscytującą częścią tego wszystkiego jest zadziwiająca ilość danych, które może przechowywać. Jako dowód koncepcji, Katalog wykorzystał swoją technologię do kodowania książek takich jak Autostopem przez Galaktykę w DNA. Ale to nic w porównaniu z możliwościami.

Od początku do końca odczytanie danych z DNA zajmie co najmniej kilka godzin.

„Jeśli porównasz jabłka z jabłkami, liczba bitów, które można przechowywać w tej samej objętości, będzie wynosić około milion razy więcej informacji niż na dysku półprzewodnikowym” – powiedział Park. „Cokolwiek możesz przechowywać na dysku flash, możesz zapisać milion razy więcej w tej samej objętości, jeśli robisz to w DNA”.

Porównanie z dyskami półprzewodnikowymi nie jest jednak dokładne. DNA może być w stanie przechowywać znacznie więcej informacji w tej samej objętości, ale nie ma natychmiastowego dostępu, takiego jak, powiedzmy, dysk flash podłączony do USB. Podejście zastosowane w katalogu przekształca dane w stały granulat syntetycznego polimeru.

Aby uzyskać dostęp do danych, naukowcy musieliby pobrać wspomniany osad, nawodnić go poprzez dodanie wody, a następnie odczytać za pomocą sekwensera DNA. Zapewnia to pary zasad DNA, które z kolei można wykorzystać do obliczenia jedynek i zer, które ponownie składają dane. Od początku do końca proces zajmie minimum kilka godzin.

Zespół DNA katalogu w laboratorium
Aby odzyskać dane z DNA, naukowcy musieliby pobrać osad, na którym jest ono przechowywane, nawodnić go poprzez dodanie wody, a następnie odczytać za pomocą sekwencera DNA.Katalog

Z tego powodu Katalog jest początkowo skierowany na rynek przyzwyczajony do tego rodzaju opóźnień: rynek archiwizacji. Tego rodzaju dane są obecnie przechowywane w formatach takich jak taśma magnetyczna, które służą do śledzenia rodzaju informacji, do których możesz mieć nadzieję, że nie będziesz musiał wracać, ale nadal są one niezbędne do zawieszenia na. (Wyobraź sobie korporacyjny odpowiednik gwarancji na lodówkę.)

Ale czy kiedykolwiek będzie to miało znaczenie dla przeciętnego użytkownika? W końcu, jak wskazaliśmy na początku tego artykułu, większość z nas tak naprawdę nie myśli zbyt wiele o naszych danych i miejscu ich przechowywania. Czy to jest na taśmie magnetycznej? Czy jest to pamięć półprzewodnikowa? Nie przeszkadza nam to, dopóki jest przy nas, kiedy jej potrzebujemy.

Kodowanie danych w oparciu o DNA będzie prawdopodobnie długoterminową opcją przechowywania, podczas gdy dane krótkoterminowe przybierają inne formy.

Ze względu na ilość czasu potrzebnego na odzyskanie informacji, jest mało prawdopodobne, aby kiedykolwiek istniał punkt, w którym można to zrobić na przykład informacje z Google Cloud są przechowywane w ogromnych kadziach DNA lub w postaci serii marmuropodobnych granulek w Mountain Zobacz, Kalifornia. Jeśli Katalog będzie w stanie udowodnić swoją koncepcję przedsiębiorstwom, będzie to prawdopodobnie opcja przechowywania długoterminowego, podczas gdy dane krótkoterminowe przybierają inną formę.

Wyobraź sobie możliwości

Probówka zawierająca miliony kopii danych zakodowanych w DNA.Katalog

Istnieją jednak ekscytujące możliwości brzmiące w stylu science-fiction. „Wyobraźcie sobie podskórną pastylkę zawierającą wszystkie dane dotyczące waszego zdrowia, wszystkie skany MRA, badania krwi i zdjęcia rentgenowskie wykonane przez dentystę” – powiedział Park. „Zawsze chciałbyś, aby te dane były dla Ciebie łatwo dostępne, ale niekoniecznie chcesz, aby były przechowywane gdzieś w chmurze lub na niezabezpieczonym serwerze w szpitalu. Gdybyś miał to przy sobie w postaci DNA, mógłbyś fizycznie kontrolować te dane i dostęp do nich, upewniając się, że dostęp do nich będą mieli tylko upoważnieni lekarze.

W końcu, jak podkreśla, wszystkie dzisiejsze szpitale mają sekwencery DNA. „Nie twierdzę, że mamy to teraz realizować, ale jest to możliwa przyszłość” – powiedział.

Po ogłoszeniu światu powstania nowej firmy firma Catalog koncentruje się obecnie na przeprowadzeniu kilku projektów pilotażowych, aby zademonstrować, w jaki sposób można efektywnie wykorzystać tę technologię. „To nie są wyzwania naukowe, które pozostawiliśmy do rozwiązania, ale raczej problemy z optymalizacją mechaniczną” – zauważył.

Jak sam przyznał, wkroczył w tę dziedzinę, ponieważ brzmiało to jak fajne technologiczne podejście do dużego problemu, Park jest obecnie przekonany, że przechowywanie danych DNA może okazać się jedną z najważniejszych naszych technologii czas.

Do licha, jeśli chodzi o możliwość archiwizowania historii ludzkości, jaką znamy, trudno się z tym nie zgodzić. „Chodzi o zachowanie naszego stylu życia, jaki znamy” – wyjaśnił.

Zalecenia redaktorów

  • Czy taśmy magnetyczne starej szkoły są nośnikiem danych przyszłości?
  • Chiny chcą wykorzystać kontrowersyjną analizę DNA do odgadnięcia twarzy przestępców
  • Ten start-up biotechnologiczny chce umieścić Twoje DNA w skarbcu na Księżycu
  • Naukowcy z Caltech wykorzystali DNA do rozegrania najmniejszej na świecie gry w kółko i krzyżyk
  • Medycyna precyzyjna opiera się na DNA, ale wysłanie śliny nadal wiąże się z ryzykiem