Όταν μας τελειώνει ο χώρος για δεδομένα, οι επιστήμονες θέλουν να τα αποθηκεύσουν στο DNA

Google

Πρώτα η αποκαλυπτική προειδοποίηση: Εξαντλούμε την αποθήκευση δεδομένων.

Περιεχόμενα

  • Δεδομένα, δεδομένα, παντού
  • Είναι το DNA η απάντηση;
  • Είναι όλα σχετικά με την αποθήκευση
  • Φανταστείτε τις δυνατότητες

Οι πιθανότητες είναι ότι αυτό δεν είναι κάτι για το οποίο έπρεπε να ανησυχείτε πολύ τα τελευταία χρόνια. Υπήρξε μια εποχή, όχι πολύ καιρό πριν, όταν ο πεπερασμένος σκληρός δίσκος του υπολογιστή σας ήταν όλος ο αποθηκευτικός χώρος που είχατε διαθέσιμο. Χτυπήστε αυτό το όριο (το οποίο, στην περίπτωση του πρώτου μου υπολογιστή, ήταν μικρότερο από 100 MB) και καταφύγατε σε δισκέτες και άλλο τοπικό εξωτερικό χώρο αποθήκευσης. Όταν σας τελείωσε και αυτό, πήρατε τη διαγραφή.

Κάθε μέρα, δημιουργούνται περίπου 2,5 εκατομμύριο byte δεδομένων, χάρη στα 3,7 δισεκατομμύρια ανθρώπων που χρησιμοποιούν τώρα το Διαδίκτυο.

Δεν διαγράφουμε άλλο. Ούτε οι εταιρείες, ειδικά εκείνες που αποτιμώνται με βάση τα δεδομένα που κατέχουν. Αντίθετα, απλώς προωθούμε τα αρχεία μας στο σύννεφο, το όνομα του οποίου είναι εφήμερο και αιθέριο. στερείται οποιασδήποτε πραγματικής σωματικότητας. Πού αποθηκεύονται τα δεδομένα; Δεν έχει σημασία όσο μπορούμε να το πάρουμε πίσω. Ποιοι είναι οι κίνδυνοι της εξάντλησης του αποθηκευτικού χώρου στο cloud; Φαινομενικά πολύ λίγο, εκτός από το ότι πρέπει να αυξήσετε τις μηνιαίες συνδρομές σας για να ξεκλειδώσετε πιο ένδοξο ελεύθερο χώρο.

Σχετίζεται με

  • Η κυβέρνηση των ΗΠΑ και η μεγάλη τεχνολογία θέλουν να χρησιμοποιήσουν δεδομένα τοποθεσίας για την καταπολέμηση του κορωνοϊού
  • DNA, γυαλί χαραγμένο με λέιζερ και όχι μόνο: Μια ματιά στο μέλλον της αποθήκευσης δεδομένων
  • Η τελευταία ανακάλυψη της Microsoft θα μπορούσε να καταστήσει δυνατά κέντρα δεδομένων που βασίζονται στο DNA

Ως αποτέλεσμα, η ιδέα ότι κάποια μέρα μπορεί να μας τελειώσει ο αποθηκευτικός χώρος δεδομένων είναι τόσο δύσκολο να τυλίξετε το κεφάλι σας γύρω ως η πρόταση ότι θα μπορούσαμε να εξαντλήσουμε το νερό: αυτός ο ένδοξος δωρεάν πόρος που πέφτει από το ουρανός. Αλλά το 2018 είναι η χρονιά κατά την οποία ήρθε το Κέιπ Τάουν της Νότιας Αφρικής απότομα κοντά στο να ξεμείνει από νερό. Και θα μπορούσαμε να εξαντλήσουμε και την αποθήκευση δεδομένων.

Δεδομένα, δεδομένα, παντού

Ο λόγος για αυτό είναι ο ασύλληπτος ρυθμός με τον οποίο παράγουμε σήμερα δεδομένα. Κάθε μέρα, δημιουργούνται περίπου 2,5 εκατομμύριο byte δεδομένων, χάρη στα 3,7 δισεκατομμύρια ανθρώπων που χρησιμοποιούν τώρα το Διαδίκτυο. Μόνο τα τελευταία δύο χρόνια, έχει δημιουργηθεί ένα εντυπωσιακό 90 τοις εκατό των δεδομένων του κόσμου. Με έναν αυξανόμενο αριθμό έξυπνων συσκευών που συνδέονται στο Διαδίκτυο των Πραγμάτων, ο αριθμός αυτός αναμένεται να αυξηθεί σημαντικά.

Γράφημα συνολικής δημιουργίας δεδομένων
Γράφημα που δείχνει πόσα δεδομένα θα πρέπει να αποθηκευτούν
Κατάλογος

«Όταν σκεφτόμαστε την αποθήκευση στο cloud, σκεφτόμαστε αυτές τις άπειρες αποθήκες δεδομένων», δήλωσε ο Hyunjun Park, Διευθύνων Σύμβουλος και συνιδρυτής της εταιρείας αποθήκευσης δεδομένων. Κατάλογος, είπε στο Digital Trends. «Αλλά το cloud είναι στην πραγματικότητα απλώς ο υπολογιστής κάποιου άλλου. Αυτό που οι περισσότεροι άνθρωποι δεν συνειδητοποιούν είναι ότι παράγουμε τόσα πολλά δεδομένα που ο ρυθμός με τον οποίο τα παράγουμε ξεπερνά κατά πολύ την ικανότητά μας να τα αποθηκεύουμε όλα. Στο πολύ εγγύς μέλλον, θα έχουμε ένα τεράστιο χάσμα μεταξύ των χρήσιμων δεδομένων που δημιουργούμε και του τρόπου με τον οποίο μπορούμε να τα αποθηκεύσουμε χρησιμοποιώντας συμβατικά μέσα».

Η Catalog έχει αναπτύξει τεχνολογία που πιστεύουν ότι θα μπορούσε να μεταμορφώσει τον τρόπο αποθήκευσης δεδομένων.

Δεδομένου ότι οι εταιρείες αποθήκευσης cloud είναι απασχολημένες με την κατασκευή νέων κέντρων δεδομένων και την επέκταση των υπαρχόντων τους, με ρυθμό κόμβων, είναι δύσκολο να καταλάβουμε πότε μπορεί να εξαντληθεί η χωρητικότητα αποθήκευσης δεδομένων. Δεν υπάρχει ρολόι αντίστροφης μέτρησης σε στυλ ταινίας. Σύμφωνα με τον Park, ωστόσο, ήδη από το 2025 η ανθρωπότητα μπορεί να έχει παράγει περισσότερα από 160 zettabytes δεδομένων αθροιστικά. (Ένα zettabyte, σε περίπτωση που αναρωτιέστε, είναι ένα τρισεκατομμύριο gigabyte.) Πόσο από αυτό θα μπορούμε να αποθηκεύσουμε; Περίπου το 12,5 τοις εκατό, προτείνει η Park.

Σαφώς, κάτι πρέπει να γίνει.

Είναι το DNA η απάντηση;

Εκεί είναι που ο Park και ο συνάδελφος επιστήμονας και συνιδρυτής του MIT Nathaniel Roquet μπαίνουν στην εικόνα. Η startup Catalog τους έχει αναπτύξει τεχνολογία που πιστεύουν ότι θα μπορούσε να μεταμορφώσει την αποθήκευση δεδομένων όπως την ξέρουμε. επιτρέποντας, ή έτσι ισχυρίζονται, το σύνολο των παγκόσμιων δεδομένων να χωράει άνετα σε ένα χώρο στο μέγεθος μιας ντουλάπας.

Η ομάδα αποθήκευσης DNA του καταλόγου
Η ομάδα αποθήκευσης DNA του καταλόγου στο εργαστήριο.Κατάλογος

Λύση καταλόγου; Με την κωδικοποίηση δεδομένων στο DNA. Αυτό μπορεί να ακούγεται σαν την πλοκή ενός μυθιστορήματος του Michael Crichton, αλλά η επεκτάσιμη και οικονομικά προσιτή λύση τους είναι σοβαρή και έχει έτσι έλαβε πολύ 9 εκατομμύρια δολάρια σε επιχειρηματική χρηματοδότηση — μαζί με την υποστήριξη κορυφαίων καθηγητών από το Στάνφορντ και το Χάρβαρντ Πανεπιστήμια.

«Μια ερώτηση που με κάνουν συχνά είναι: «Ποιανού DNA χρησιμοποιούμε;» γέλασε η Παρκ. «Οι άνθρωποι φοβούνται μήπως πάρουμε DNA από ανθρώπους και τους μετατρέψουμε σε μεταλλαγμένους, ή τέτοια πράγματα».

Για χρόνια τα σημεία συμφόρησης εμπόδισαν το DNA να ανταποκρίνεται στις τεράστιες δυνατότητες αποθήκευσης δεδομένων.

Αυτό δεν είναι, θα πρέπει να καταστήσουμε σαφές, αυτό που κάνει η Catalog. Το DNA στο οποίο η εταιρεία κωδικοποιεί δεδομένα είναι ένα συνθετικό πολυμερές. Δεν είναι κάτι που προέρχεται από βιολογική προέλευση και η σειρά των ζευγών βάσεων στα οποία κωδικοποιούνται τα δεδομένα, ως σειρά μονάδων και μηδενικών, δεν είναι ο κώδικας για οτιδήποτε ζωντανό. Ωστόσο, το τελικό προϊόν δεν μπορεί να διακριθεί βιολογικά από κάτι που μπορεί να βρείτε σε ένα ζωντανό κύτταρο.

Η ιδέα ότι το DNA είναι μια πιθανή μέθοδος αποθήκευσης εικάζεται για δεκαετίες τώρα, σχεδόν από τότε που οι James Watson και Francis Crick ανακάλυψαν τη διπλή έλικα το 1953. Ωστόσο, μέχρι τώρα υπήρξαν μια σειρά από σημεία συμφόρησης που την εμπόδισαν να ανταποκριθεί τεράστιο δυναμικό ως λύση αποθήκευσης υπολογιστικών δεδομένων.

Η παραδοσιακή σκέψη για την αποθήκευση δεδομένων με βάση το DNA επικεντρώθηκε στη σύνθεση νέων μορίων DNA. χαρτογράφηση της αλληλουχίας των bit στην ακολουθία των τεσσάρων ζευγών βάσεων του DNA και δημιουργία αρκετών μορίων ώστε να αντιπροσωπεύουν όλους τους αριθμούς που θέλετε να αποθηκεύσετε. Το πρόβλημα είναι ότι αυτή η διαδικασία είναι αργή και δαπανηρή, και τα δύο σημαντικά σημεία συμφόρησης όσον αφορά την αποθήκευση δεδομένων.

Δυνατότητα αποθήκευσης DNA έναντι παραδοσιακής
Πώς ο Catalog συνθέτει την αποθήκευση στο DNA
Κατάλογος

Η προσέγγιση του Καταλόγου βασίζεται στην αποσύνδεση της διαδικασίας σύνθεσης από τη διαδικασία κωδικοποίησης. Ουσιαστικά, η εταιρεία παράγει τεράστιους αριθμούς λίγων διαφορετικών μορίων (καθιστώντας το πολύ φθηνότερο) και στη συνέχεια κωδικοποιεί τις πληροφορίες δημιουργώντας τεράστια ποικιλία από τα προκατασκευασμένα μόρια.

Κατ' αναλογία, η Catalog παρομοίασε την προηγούμενη προσέγγιση με την κατασκευή προσαρμοσμένων σκληρών δίσκων με όλα τα δεδομένα σας ενσύρματα. Η αποθήκευση διαφορετικών δεδομένων σημαίνει δημιουργία ενός εντελώς νέου σκληρού δίσκου από την αρχή. Η προσέγγισή τους, προτείνουν, είναι παρόμοια με τη μαζική παραγωγή κενών σκληρών δίσκων και στη συνέχεια την πλήρωσή τους με τις κωδικοποιημένες πληροφορίες όπως και όταν απαιτείται.

Είναι όλα σχετικά με την αποθήκευση

Το συναρπαστικό μέρος όλων αυτών είναι η εκπληκτική ποσότητα δεδομένων που μπορεί να αποθηκεύσει. Ως απόδειξη της ιδέας, η Catalog έχει χρησιμοποιήσει την τεχνολογία της για την κωδικοποίηση βιβλίων όπως The Hitchhiker's Guide to the Galaxy στο DNA. Αλλά αυτό δεν είναι τίποτα σε σύγκριση με τις δυνατότητες.

Από την αρχή μέχρι το τέλος, η ανάγνωση δεδομένων από το DNA θα διαρκέσει τουλάχιστον αρκετές ώρες.

«Αν συγκρίνετε τα μήλα με τα μήλα, τα κομμάτια που μπορείτε να αποθηκεύσετε στον ίδιο όγκο βγαίνουν σε περίπου 1 εκατομμύριο φορές την πυκνότητα πληροφοριών μιας μονάδας στερεάς κατάστασης», είπε ο Park. «Ό, τι μπορείτε να αποθηκεύσετε σε μια μονάδα flash, θα μπορούσατε να αποθηκεύσετε 1 εκατομμύριο φορές στον ίδιο όγκο, εάν το κάνετε στο DNA».

Ωστόσο, η σύγκριση με τους δίσκους στερεάς κατάστασης δεν είναι ακριβής. Το DNA μπορεί να μπορεί να αποθηκεύσει πολύ περισσότερες πληροφορίες στον ίδιο τόμο, αλλά δεν έχει την άμεση πρόσβαση, ας πούμε, μιας μονάδας flash συνδεδεμένης σε USB. Η προσέγγιση του Καταλόγου μετατρέπει τα δεδομένα σε ένα συμπαγές σφαιρίδιο συνθετικού πολυμερούς.

Για να έχουν πρόσβαση στα δεδομένα σας, οι επιστήμονες θα πρέπει να πάρουν το εν λόγω σφαιρίδιο, να το επανυδατώσουν προσθέτοντας νερό και στη συνέχεια να το διαβάσουν χρησιμοποιώντας έναν προσδιοριστή αλληλουχίας DNA. Αυτό παρέχει τα ζεύγη βάσεων του DNA, τα οποία μπορούν, με τη σειρά τους, να χρησιμοποιηθούν για τον υπολογισμό των μονάδων και των μηδενικών που συναρμολογούν εκ νέου τα δεδομένα σας. Από την αρχή μέχρι το τέλος, η διαδικασία θα διαρκέσει τουλάχιστον αρκετές ώρες.

Η ομάδα DNA του Καταλόγου στο εργαστήριο
Προκειμένου να ανακτήσουν δεδομένα από το DNA, οι επιστήμονες θα πρέπει να πάρουν το σφαιρίδιο στο οποίο είναι αποθηκευμένο, να το επανυδατώσουν προσθέτοντας νερό και στη συνέχεια να το διαβάσουν χρησιμοποιώντας έναν προσδιοριστή αλληλουχίας DNA.Κατάλογος

Για το λόγο αυτό, η Catalog στοχεύει αρχικά σε μια αγορά που χρησιμοποιείται σε αυτού του είδους τις καθυστερήσεις: την αγορά αρχειοθέτησης. Αυτό είναι το είδος των δεδομένων που αποθηκεύονται αυτήν τη στιγμή σε μορφές όπως η μαγνητική ταινία, που χρησιμοποιούνται για την παρακολούθηση από το είδος των πληροφοριών που μπορεί να ελπίζετε ότι δεν θα χρειαστεί να επανεξετάσετε, αλλά εξακολουθεί να είναι κρίσιμο να κρατήσετε επάνω σε. (Φανταστείτε το εταιρικό ισοδύναμο της εγγύησης για το ψυγείο σας.)

Αλλά υπάρχει ποτέ ένα σημείο στο οποίο αυτό θα έχει σημασία για τον μέσο χρήστη; Σε τελική ανάλυση, όπως επισημάναμε στην κορυφή αυτού του άρθρου, οι περισσότεροι από εμάς δεν σκεφτόμαστε τόσο πολύ τα δεδομένα μας και το πού διατηρούνται. Είναι σε μαγνητική ταινία; Είναι σε αποθήκευση στερεάς κατάστασης; Δεν μας πειράζει όσο είναι εκεί όταν το χρειαζόμαστε.

Η κωδικοποίηση δεδομένων με βάση το DNA είναι πιθανό να είναι μια επιλογή μακροπρόθεσμης αποθήκευσης, ενώ τα βραχυπρόθεσμα δεδομένα λαμβάνουν άλλες μορφές.

Λόγω του χρόνου που απαιτείται για την ανάκτηση πληροφοριών, είναι απίθανο να υπάρξει ποτέ ένα σημείο στο οποίο, για Για παράδειγμα, οι πληροφορίες σας στο Google Cloud αποθηκεύονται σε τεράστιες δεξαμενές DNA ή ως μια σειρά από σφαιρίδια που μοιάζουν με μάρμαρο στο Βουνό Προβολή, CA. Εάν ο Catalog μπορεί να αποδείξει την ιδέα του στις επιχειρήσεις, αυτό είναι πιθανό να είναι μια μακροπρόθεσμη επιλογή αποθήκευσης, ενώ τα βραχυπρόθεσμα δεδομένα λαμβάνουν άλλες μορφές.

Φανταστείτε τις δυνατότητες

Ένας σωλήνας που περιέχει εκατομμύρια αντίγραφα δεδομένων που κωδικοποιούνται στο DNA.Κατάλογος

Ωστόσο, υπάρχουν συναρπαστικές δυνατότητες επιστημονικής φαντασίας. «Φανταστείτε ένα υποδόριο σφαιρίδιο που περιέχει όλα τα δεδομένα για την υγεία σας, όλες τις σαρώσεις MRA, τις εξετάσεις αίματος, τις ακτινογραφίες σας από τον οδοντίατρό σας», είπε ο Park. «Θα θέλατε πάντα αυτά τα δεδομένα να είναι πολύ προσιτά σε εσάς, αλλά δεν τα θέλετε απαραίτητα κάπου στο cloud ή σε έναν μη ασφαλή διακομιστή σε ένα νοσοκομείο. Εάν το είχατε μαζί σας με τη μορφή DNA, θα μπορούσατε να ελέγξετε φυσικά αυτά τα δεδομένα και την πρόσβαση σε αυτά, ενώ βεβαιωθείτε ότι μόνο οι εξουσιοδοτημένοι γιατροί θα μπορούσαν να έχουν πρόσβαση σε αυτά».

Άλλωστε, όπως επισημαίνει, όλα τα νοσοκομεία σήμερα διαθέτουν αλληλουχίες DNA. «Δεν λέω ότι το επιδιώκουμε αυτή τη στιγμή, αλλά είναι ένα πιθανό μέλλον», είπε.

Έχοντας ανακοινώσει τη νέα τους εταιρεία στον κόσμο, η Catalog έχει πλέον επικεντρωθεί στην εκτέλεση ορισμένων πιλοτικών έργων για να δείξει πώς αυτή η τεχνολογία μπορεί να χρησιμοποιηθεί αποτελεσματικά. «Αυτές δεν είναι επιστημονικές προκλήσεις που έχουμε να επιλύσουμε, αλλά προβλήματα μηχανικής βελτιστοποίησης», σημείωσε.

Έχοντας, κατά τη δική του ομολογία, μπήκε σε αυτόν τον τομέα επειδή ακουγόταν σαν μια δροσερή τεχνολογική προσέγγιση σε ένα μεγάλο πρόβλημα, η Park είναι πλέον πεπεισμένη ότι η αποθήκευση δεδομένων DNA μπορεί να αποδειχθεί μια από τις πιο σημαντικές τεχνολογίες μας χρόνος.

Ε, όταν πρόκειται να μπορέσουμε να αρχειοθετήσουμε την ανθρώπινη ιστορία όπως τη γνωρίζουμε, είναι δύσκολο να διαφωνήσουμε. «Πρόκειται για τη διατήρηση του τρόπου ζωής μας όπως τον ξέρουμε», εξήγησε.

Συστάσεις των συντακτών

  • Είναι οι παλιές μαγνητικές ταινίες το μέσο αποθήκευσης δεδομένων του μέλλοντος;
  • Η Κίνα θέλει να χρησιμοποιήσει αμφιλεγόμενη ανάλυση DNA για να μαντέψει τα πρόσωπα των εγκληματιών
  • Αυτή η startup βιοτεχνολογίας θέλει να βάλει το DNA σας σε ένα θησαυροφυλάκιο στο φεγγάρι
  • Οι επιστήμονες του Caltech χρησιμοποίησαν DNA για να παίξουν το πιο μικροσκοπικό παιχνίδι τικ στον κόσμο
  • Η ιατρική ακριβείας εξαρτάται από το DNA, αλλά η αποστολή της σούβλας εξακολουθεί να έχει κινδύνους