Először az apokaliptikus figyelmeztetés: kifogy az adattárhely.
Tartalom
- Adatok, adatok, mindenhol
- A DNS a válasz?
- Minden a tárolásról szól
- Képzeld el a lehetőségeket
Valószínű, hogy ez nem olyan dolog, ami miatt az elmúlt években túl sokat kellett aggódnia. Volt idő, nem is olyan régen, amikor a számítógép véges merevlemeze volt az összes rendelkezésre álló tárhely. Elérte ezt a határt (ami az első számítógépem esetében kevesebb volt, mint 100 MB), és hajlékonylemezeket és egyéb helyi külső tárolókat használt. Amikor ez is elfogyott, törölni kellett.
Naponta körülbelül 2,5 kvintimillió bájt adat keletkezik annak a 3,7 milliárd embernek köszönhetően, akik jelenleg az internetet használják.
Többet nem törölünk. A cégek sem, különösen azok, amelyeket a birtokukban lévő adatok alapján értékelnek. Ehelyett egyszerűen továbbítjuk fájljainkat a felhőbe, amelynek már a neve is mulandó és éteri; hiányzik minden valódi testiségből. Hol tárolják az adatokat? Addig nem számít, amíg vissza tudjuk szerezni. Milyen veszélyekkel jár, ha kifogy a felhőalapú tárhely? Látszólag nagyon kevés, amellett, hogy meg kell emelnie a havi előfizetési befizetéseit, hogy több dicsőséges szabad területet szabadítson fel.
Összefüggő
- Az Egyesült Államok kormánya és a nagy technológia a helyadatokat akarja felhasználni a koronavírus elleni küzdelemben
- DNS, lézerrel maratott üveg és még sok más: Bepillantás az adattárolás jövőjébe
- A Microsoft legújabb áttörése DNS-alapú adatközpontok létrehozását teheti lehetővé
Emiatt nehéz beburkolni a gondolatot, hogy egy napon kifogyhat az adattárhelyünk körül, mint a javaslat, hogy elfogyhat a víz: ez a dicsőséges szabad erőforrás, amely lehullik a ég. De 2018 az az év, amikor eljött a dél-afrikai Fokváros rohamosan közel áll ahhoz, hogy kifogyjon a víz. És elfogyhat az adattárhely is.
Adatok, adatok, mindenhol
Ennek az az oka, hogy jelenleg elképzelhetetlen ütemben állítjuk elő az adatokat. Naponta körülbelül 2,5 kvintimillió bájt adat keletkezik annak a 3,7 milliárd embernek köszönhetően, akik jelenleg az internetet használják. Csak az elmúlt két évben a világ adatainak elképesztő 90 százaléka keletkezett. A dolgok internetéhez kapcsolódó okoseszközök növekvő számával ez a szám jelentősen növekedni fog.
„Amikor a felhőalapú tárolásra gondolunk, ezekre a végtelen számú adattárra gondolunk” – mondta Hyunjun Park, az adattároló cég vezérigazgatója és társalapítója. Katalógus, mondta a Digital Trendsnek. „De a felhő valójában csak valaki más számítógépe. A legtöbb ember nem veszi észre, hogy olyan sok adatot generálunk, hogy az előállítás üteme messze meghaladja az összes tárolási képességünket. A nagyon közeljövőben óriási szakadék tátong majd az általunk generált hasznos adatok és a között, hogy hogyan tudjuk ezeket hagyományos médiumokkal tárolni.”
A Catalog olyan technológiát fejlesztett ki, amely szerintük megváltoztathatja az adatok tárolásának módját.
Mivel a felhőalapú tároló cégek új adatközpontok építésével és a meglévők bővítésével vannak elfoglalva, csomós ütemben, nehéz kitalálni, mikor fogyhat el az adattároló kapacitásunk. Nincs filmszerű visszaszámláló óra. Park szerint azonban már 2025-ben az emberiség több mint 160 zettabájtnyi adatot termelhetett összesítve. (Egy zettabájt, ha kíváncsi vagy, egy billió gigabájt.) Mennyit fogunk ebből tárolni? Park szerint ennek körülbelül 12,5 százaléka.
Nyilvánvaló, hogy valamit tenni kell.
A DNS a válasz?
Itt lép be a képbe Park és az MIT tudóstársa és társalapítója, Nathaniel Roquet. Startup Catalogjuk olyan technológiát fejlesztett ki, amelyről úgy gondolják, hogy az általunk ismert adattárolást átalakíthatja; lehetővé téve, legalábbis azt állítják, hogy a világ összes adata kényelmesen elférjen egy kabátszekrény méretű térben.
Katalógus megoldás? Az adatok DNS-be való kódolásával. Ez úgy hangzik, mint egy Michael Crichton-regény cselekménye, de méretezhető és megfizethető megoldásuk komoly, és messze kapott 9 millió dollár kockázati finanszírozást – a Stanford és a Harvard vezető professzorainak támogatásával Egyetemek.
„Gyakran felteszik a kérdést: „Kinek a DNS-ét használjuk?” – nevetett Park. "Az emberek félnek attól, hogy DNS-t veszünk el az emberektől, és mutánssá változtatjuk őket, vagy ilyesmi."
Évek óta a szűk keresztmetszetek akadályozták a DNS-t abban, hogy kihasználja hatalmas adattárolási potenciálját.
Tisztáznunk kell, hogy ez nem az, amit a Katalógus csinál. A DNS, amelybe a cég adatokat kódol, szintetikus polimer. Ez nem valami biológiai eredetű, és a bázispárok sorozata, amelybe az adatokat kódolják, egyesek és nullák sorozataként, nem a kódja semmi élőnek. De a végtermék biológiailag megkülönböztethetetlen valamitől, amit egy élő sejtben találhat.
A DNS potenciális tárolási módszerének gondolata már évtizedek óta folyik, gyakorlatilag azóta, hogy James Watson és Francis Crick 1953-ban felfedezte a kettős hélixet. Mostanáig azonban számos szűk keresztmetszet akadályozta meg, hogy megfeleljen hatalmas potenciállal rendelkezik számítógépes adattárolási megoldásként.
A DNS-alapú adattárolás hagyományos gondolkodása az új DNS-molekulák szintézisére összpontosított; a bitszekvenciát leképezi a DNS négy bázispárjának szekvenciájára, és elegendő molekulát állít elő az összes tárolni kívánt szám reprezentálásához. A probléma az, hogy ez a folyamat lassú és költséges, mindkettő jelentős szűk keresztmetszetek az adatok tárolása terén.
A katalógus megközelítése a szintézis folyamat és a kódolási folyamat szétválasztásán alapul. Lényegében a vállalat néhány különböző molekulából hatalmas mennyiségű generál (sokkal olcsóbb), majd kódolja az információt azáltal, hogy az előre elkészített molekulákból hatalmas sokféleséget generál.
Analógiaként a Catalog a korábbi megközelítést az egyedi merevlemezek gyártásához hasonlította, az összes adatot bekötve. A különböző adatok tárolása egy teljesen új merevlemez felépítését jelenti az alapoktól kezdve. Megközelítésük szerintük az üres merevlemezek tömeggyártásához hasonlít, majd szükség szerint megtöltik azokat a kódolt információval.
Minden a tárolásról szól
Mindennek az izgalmas része az elképesztő mennyiségű adat, amelyet tárolni tud. A koncepció bizonyítékaként a Catalog technológiáját használta olyan könyvek kódolására, mint például A stopposok útmutatója a galaxishoz a DNS-be. De ez semmi a lehetőségekhez képest.
Az elejétől a végéig az adatok kiolvasása a DNS-ből legalább néhány órát vesz igénybe.
„Ha az almát az almával hasonlítjuk össze, az ugyanabban a kötetben tárolható darabok körülbelül 1 milliószorosa információs sűrűségűek egy szilárdtestalapú meghajtónál” – mondta Park. „Bármit is tárolhat egy flash meghajtón, annak egymilliószorosát is tárolhatja ugyanabban a kötetben, ha DNS-ben csinálja.”
A szilárdtestalapú meghajtókkal való összehasonlítás azonban nem pontos. Lehet, hogy a DNA sokkal több információt képes tárolni ugyanabban a kötetben, de nem rendelkezik azonnali hozzáféréssel, mint például egy USB-re csatlakoztatott pendrive. A katalógus megközelítése az adatokat szintetikus polimer szilárd pelletté alakítja.
Az adatok eléréséhez a tudósoknak ki kell venniük a pelletet, újra kell hidratálniuk víz hozzáadásával, majd DNS-szekvenáló segítségével le kell olvasniuk. Ez biztosítja a DNS bázispárjait, amelyek viszont felhasználhatók az egyesek és nullák kiszámításához, amelyek újra összeállítják az adatokat. Az elejétől a végéig a folyamat legalább néhány órát vesz igénybe.
Emiatt a Catalog kezdetben az ilyen jellegű késésekhez szokott piacot célozza meg: az archiválási piacot. Ez az a fajta adat, amelyet jelenleg olyan formátumokban tárolnak, mint a mágnesszalag, és amelyeket nyomon követésre használnak azokról az információkról, amelyeket remélhet, hogy nem kell újra meglátogatnia, de még mindig létfontosságú, hogy lefagyjon ra. (Képzelje el a jótállás vállalati megfelelőjét a hűtőszekrényére.)
De van-e valaha olyan pont, amikor ez számítani fog az átlagos felhasználónak? Végtére is, amint arra a cikk elején rámutattunk, a legtöbben nem gondolnak túl sokat adatainkon és azok tárolási helyén. Mágnesszalagon van? Szilárdtest tárolón van? Nem bánjuk, amíg ott van, amikor szükségünk van rá.
A DNS-alapú adatkódolás valószínűleg hosszú távú tárolási lehetőség, míg a rövid távú adatok más formákat öltenek.
Az információk lekéréséhez szükséges idő miatt nem valószínű, hogy valaha is lesz olyan pont, amikor Például az Ön Google Cloud-információit hatalmas DNS-tartályokban vagy márványszerű pellet-sorozatként tárolják a Mountainben. View, CA. Ha a Catalog be tudja bizonyítani koncepcióját a vállalkozások számára, ez valószínűleg hosszú távú tárolási lehetőség lesz, míg a rövid távú adatok más formákat öltenek.
Képzeld el a lehetőségeket
Vannak azonban izgalmas, sci-fi hangzású lehetőségek. „Képzeljen el egy szubkután pelletet, amely tartalmazza az összes egészségügyi adatát, az összes MRA-vizsgálatát, vérvizsgálatát, a fogorvosától származó röntgenfelvételeit” – mondta Park. „Mindig azt szeretné, ha ezek az adatok nagyon hozzáférhetőek lennének az Ön számára, de nem feltétlenül szeretné valahol a felhőben, vagy egy nem biztonságos kiszolgálón egy kórházban. Ha ez nálad lenne DNS formájában, akkor fizikailag ellenőrizhetnéd ezeket az adatokat és hozzáférhetnél, miközben gondoskodhatsz arról, hogy csak az arra jogosult orvosok férhessenek hozzá."
Végül is, mint rámutat, ma minden kórházban van DNS-szekvenáló. „Nem azt mondom, hogy jelenleg erre törekszünk, de ez egy lehetséges jövő” – mondta.
Miután bejelentették új cégüket a világnak, a Catalog most néhány kísérleti projekt végrehajtására összpontosít, hogy bemutassa, hogyan használható ez a technológia hatékonyan. „Ezek nem tudományos kihívások, amelyeket meg kell oldanunk, hanem inkább mechanikai optimalizálási problémák” – jegyezte meg.
Saját bevallása szerint azért lépett erre a területre, mert úgy hangzott, mint egy klassz technológiai megközelítés egy nagy Park most meg van győződve arról, hogy a DNS-adattárolás az egyik legfontosabb technológiánk lehet idő.
A fenébe is, ha arról van szó, hogy az általunk ismert emberi történelem archiválható-e, nehéz nem érteni egyet. „Arról van szó, hogy megőrizzük az általunk ismert életmódunkat” – magyarázta.
Szerkesztői ajánlások
- Az old-school mágnesszalagok a jövő adattároló eszközei?
- Kína ellentmondásos DNS-elemzést akar használni a bűnözők arcának kitalálására
- Ez a biotechnológiai startup egy holdi trezorba akarja helyezni az Ön DNS-ét
- A Caltech tudósai DNS segítségével játszották a világ legapróbb tic-tac-toe játékát
- A precíziós orvoslás a DNS-től függ, de a köpések kiküldése továbbra is kockázatokkal jár