כשנגמר לנו המקום לנתונים, מדענים רוצים לאחסן אותם ב-DNA

גוגל

ראשית האזהרה האפוקליפטית: אוזל לנו אחסון הנתונים.

תוכן

  • נתונים, נתונים, בכל מקום
  • האם DNA הוא התשובה?
  • הכל קשור לאחסון
  • תארו לעצמכם את האפשרויות

רוב הסיכויים שזה לא משהו שהיית צריך לדאוג ממנו יותר מדי בשנים האחרונות. הייתה תקופה, לא כל כך מזמן, שבה הכונן הקשיח הסופי של המחשב שלך היה כל האחסון שהיה לך. פגע במגבלה הזו (שבמקרה של המחשב הראשון שלי, היה פחות מ-100MB) ופניתם לתקליטון ואחסון חיצוני מקומי אחר. כשנגמר לך גם זה, יצא לך למחוק.

בכל יום נוצרים כ-2.5 קווינטיליון בתים של נתונים, באדיבותם של 3.7 מיליארד בני אדם שמשתמשים כעת באינטרנט.

אנחנו לא מוחקים יותר. גם לא חברות, במיוחד אלה שמוערכות על סמך הנתונים שבבעלותן. במקום זאת, אנו פשוט דוחפים את הקבצים שלנו אל הענן, שעצם שמו הוא ארעמי וערירי; חסר כל פיזיות אמיתית. היכן מאוחסנים הנתונים? זה לא משנה כל עוד אנחנו יכולים להחזיר את זה. מהן הסכנות שנגמר האחסון בענן? לכאורה מעט מאוד, מלבד הצורך להגדיל את תשלומי המנוי החודשיים שלך כדי לפתוח מקום פנוי מפואר יותר.

קָשׁוּר

  • ממשלת ארה"ב וטכנולוגיה גדולה רוצים להשתמש בנתוני מיקום כדי להילחם בנגיף הקורונה
  • DNA, זכוכית חרוטה בלייזר ומעבר לכך: הצצה לעתיד של אחסון נתונים
  • פריצת הדרך האחרונה של מיקרוסופט עשויה להפוך מרכזי נתונים מבוססי DNA אפשריים

כתוצאה מכך, הרעיון שאולי יום אחד ייגמר לנו אחסון הנתונים קשה לא פחות לעטוף את הראש מסביב כהצעה שנוכל להיגמר מים: המשאב החופשי המפואר הזה שנופל מה- שָׁמַיִם. אבל 2018 היא השנה שבה הגיעה קייפטאון, דרום אפריקה קרוב מאוד לגמר המים. ויכול להיות שיגמר לנו גם אחסון הנתונים.

נתונים, נתונים, בכל מקום

הסיבה לכך היא הקצב הבלתי נתפס בו אנו מייצרים כיום נתונים. בכל יום נוצרים כ-2.5 קווינטיליון בתים של נתונים, באדיבותם של 3.7 מיליארד בני אדם שמשתמשים כעת באינטרנט. בשנתיים האחרונות בלבד, נוצרו 90 אחוז מהנתונים בעולם המטריפים את הדעת. עם מספר הולך וגדל של מכשירים חכמים המחוברים לאינטרנט של הדברים, נתון זה אמור לעלות באופן משמעותי.

גרף של יצירת נתונים הכוללת
גרף המציג כמה נתונים יהיה צורך לאחסן
קָטָלוֹג

"כשאנחנו חושבים על אחסון בענן, אנחנו חושבים על מאגרי המידע האינסופיים האלה", היון פארק, מנכ"ל ומייסד שותף של חברת אחסון הנתונים קָטָלוֹג, אמר ל-Digital Trends. "אבל הענן הוא בעצם רק מחשב של מישהו אחר. מה שרוב האנשים לא מבינים הוא שאנחנו מייצרים כל כך הרבה נתונים שהקצב שבו אנחנו מייצרים אותם עולה בהרבה על היכולת שלנו לאחסן את כולם. בעתיד הקרוב מאוד, יהיה לנו פער עצום בין הנתונים השימושיים שאנו מייצרים, לבין האופן שבו אנו מסוגלים לאחסן אותם באמצעות מדיומים קונבנציונליים."

קטלוג פיתחה טכנולוגיה שלדעתם יכולה לשנות את הדרך שבה אנו מאחסנים נתונים.

מכיוון שחברות אחסון בענן עסוקות בבניית מרכזי נתונים חדשים, ובהרחבת מרכזי נתונים קיימים שלהם, בקצב של קשרים, קשה להבין מתי עלול להיגמר לנו קיבולת אחסון הנתונים. אין שעון ספירה לאחור בסגנון סרט. לפי פארק, עם זאת, כבר בשנת 2025 ייתכן שהמין האנושי ייצר יותר מ-160 זטה-בייט של נתונים במצטבר. (זטה-בייט, למקרה שאתם תוהים, הוא טריליון גיגה-בייט.) כמה מזה נוכל לאחסן? בסביבות 12.5 אחוזים ממנו, מציע פארק.

ברור שצריך לעשות משהו.

האם DNA הוא התשובה?

שם נכנסים לתמונה פארק ומדען MIT ומייסד שותף נתנאל רוקט. הסטארט-אפ Catalog שלהם פיתח טכנולוגיה שלדעתם תוכל לשנות את אחסון הנתונים כפי שאנו מכירים אותו; מה שמאפשר, או לפחות כך הם טוענים, את מכלול הנתונים העולמיים להשתלב בנוחות בחלל בגודל של ארון מעילים.

צוות אחסון DNA של קטלוג
צוות אחסון DNA של קטלוג במעבדה.קָטָלוֹג

הפתרון של קטלוג? על ידי קידוד נתונים ל-DNA. זה אולי נשמע כמו עלילה של רומן של מייקל קריכטון, אבל הפתרון הניתן להרחבה ובמחיר סביר הוא רציני, ויש לו כל כך far קיבלה 9 מיליון דולר במימון סיכון - יחד עם תמיכתם של פרופסורים מובילים מסטנפורד והרווארד אוניברסיטאות.

"שאלה שאני נשאל לעתים קרובות היא, 'של מי ה-DNA שלו אנחנו משתמשים?'" פארק צחק. "אנשים מפחדים שניקח DNA מאנשים ונהפוך אותם למוטנטים, או דברים כאלה".

במשך שנים צווארי בקבוק עצרו את ה-DNA מלממש את פוטנציאל אחסון הנתונים האדיר שלו.

זה לא, אנחנו צריכים להבהיר, מה קטלוג עושה. ה-DNA שאליו החברה מקודדת נתונים הוא פולימר סינתטי. זה לא משהו שמקורו ביולוגי, וסדרת זוגות הבסיס שלתוכם מקודדים הנתונים, כסדרה של אחדות ואפסים, אינה הקוד לכל דבר חי. אבל התוצר הסופי בכל זאת אינו ניתן להבחין ביולוגית ממשהו שאתה עשוי למצוא בתא חי.

הרעיון של דנ"א הוא שיטת אחסון פוטנציאלית הועלה על השערות כבר עשרות שנים, כמעט מאז שג'יימס ווטסון ופרנסיס קריק גילו את הסליל הכפול ב-1953. עם זאת, עד כה היו מספר צווארי בקבוק שמנעו ממנה לעמוד בה פוטנציאל עצום כפתרון אחסון נתונים חישובי.

חשיבה מסורתית על אחסון נתונים מבוסס DNA התמקדה בסינתזה של מולקולות DNA חדשות; מיפוי רצף הביטים לרצף של ארבעת זוגות הבסיסים של ה-DNA ויצירת מספיק מולקולות כדי לייצג את כל המספרים שברצונך לאחסן. הבעיה היא שתהליך זה איטי ויקר, שניהם צווארי בקבוק ניכרים בכל הנוגע לאחסון נתונים.

קיבולת אחסון DNA לעומת מסורתית
כיצד קטלוג מסנתז אחסון ל-DNA
קָטָלוֹג

הגישה של קטלוג מבוססת על ניתוק תהליך הסינתזה מתהליך הקידוד. בעיקרו של דבר, החברה מייצרת מספרים עצומים של רק כמה מולקולות שונות (מה שהופך אותו לזול הרבה יותר) ולאחר מכן מקודדת את המידע על ידי יצירת מגוון עצום מהמולקולות המוכנות מראש.

כאנלוגיה, Catalog השווה את הגישה הקודמת לייצור כוננים קשיחים מותאמים אישית עם כל הנתונים שלך מחוברים. אחסון נתונים שונים פירושו בניית כונן קשיח חדש לגמרי מהיסוד. הגישה שלהם, הם מציעים, דומה לייצור המוני של כוננים קשיחים ריקים, ולאחר מכן מילויו במידע המקודד לפי הצורך.

הכל קשור לאחסון

החלק המרגש בכל זה הוא כמות הנתונים המהממת שהוא יכול לאחסן. כהוכחה לקונספט, קטלוג השתמשה בטכנולוגיה שלה כדי לקודד ספרים כמו מדריך הטרמפיסט לגלקסיה לתוך DNA. אבל זה כלום לעומת האפשרויות.

מההתחלה ועד הסוף, קריאת נתונים מה-DNA תימשך לפחות מספר שעות.

"אם אתה משווה תפוחים לתפוחים, החלקים שאתה יכול לאחסן באותו נפח יוצאים במשהו כמו פי מיליון צפיפות המידע של כונן מצב מוצק", אמר פארק. "כל מה שאתה יכול לאחסן בכונן הבזק, אתה יכול לאחסן פי מיליון מזה באותו נפח אם אתה עושה את זה ב-DNA."

עם זאת, ההשוואה עם כונני מצב מוצק אינה מדויקת. ייתכן ש-DNA יוכל לאחסן הרבה יותר מידע באותו נפח, אבל אין לו גישה מיידית של, למשל, כונן הבזק המחובר ל-USB. הגישה של קטלוג הופכת נתונים לכדור מוצק של פולימר סינטטי.

כדי לגשת לנתונים שלך, המדענים יצטרכו לקחת את הכדור האמור, לייבש אותו מחדש על ידי הוספת מים, ולאחר מכן לקרוא אותו באמצעות רצף DNA. זה מספק את זוגות הבסיסים של ה-DNA, אשר, בתורו, יכולים לשמש כדי לחשב את האפסים והאלה שמרכיבים מחדש את הנתונים שלך. מתחילתו ועד סופו, התהליך ייקח לפחות מספר שעות.

צוות ה-DNA של קטלוג במעבדה
כדי לאחזר נתונים מה-DNA, מדענים יצטרכו לקחת את הכדור שעליו הוא מאוחסן, לייבש אותו מחדש על ידי הוספת מים, ולאחר מכן לקרוא אותו באמצעות רצף DNA.קָטָלוֹג

מסיבה זו, Catalog מכוונת תחילה לשוק הרגיל לעיכובים מסוג זה: שוק הארכיון. זהו סוג הנתונים המאוחסנים כיום בפורמטים כמו סרט מגנטי, המשמש למעקב אחר מסוג המידע שאולי תקווה שלא תצטרך לחזור עליו, אבל עדיין חיוני לתלות אותו עַל גַבֵּי. (דמיין את המקבילה הארגונית של האחריות למקרר שלך.)

אבל האם יש אי פעם נקודה שבה זה יהיה חשוב למשתמש הממוצע? אחרי הכל, כפי שציינו בראש מאמר זה, רובנו לא באמת חושבים כל כך הרבה על הנתונים שלנו והיכן הם נשמרים. זה על סרט מגנטי? האם זה באחסון במצב מוצק? לא אכפת לנו כל עוד זה שם כשאנחנו צריכים את זה.

קידוד נתונים מבוסס DNA עשוי להיות אפשרות אחסון לטווח ארוך, בעוד שנתונים לטווח קצר מקבלים צורות אחרות.

בגלל משך הזמן שלוקח לאחזור מידע, לא סביר שאי פעם תהיה נקודה שבה, עבור למשל, המידע שלך ב-Google Cloud מאוחסן במיכלים ענקיים של DNA או כסדרה של כדורים דמויי שיש בהר View, CA. אם קטלוג יצליח להוכיח את הרעיון שלו לעסקים, סביר להניח שזו תהיה אפשרות אחסון לטווח ארוך, בעוד שהנתונים לטווח קצר מקבלים צורות אחרות.

תארו לעצמכם את האפשרויות

שפופרת המכילה מיליוני עותקים של נתונים המקודדים ל-DNA.קָטָלוֹג

עם זאת, ישנן אפשרויות מרגשות של סאונד מדע בדיוני. "דמיין לעצמך גלולה תת עורית המכילה את כל הנתונים הבריאותיים שלך, כל סריקות ה-MRA שלך, בדיקות הדם שלך, צילומי הרנטגן שלך מרופא השיניים שלך", אמר פארק. "תמיד היית רוצה שהנתונים האלה יהיו מאוד נגישים לך, אבל אתה לא בהכרח רוצה שהם יהיו בענן איפשהו, או בשרת לא מאובטח בבית חולים. אם היה לך את זה איתך בצורה של DNA, אתה יכול לשלוט פיזית בנתונים האלה ובגישה אליהם, תוך כדי לוודא שרק לרופאים המורשים תהיה גישה אליהם".

אחרי הכל, כפי שהוא מציין, בכל בתי החולים כיום יש רצפי DNA. "אני לא אומר שאנחנו רודפים אחרי זה עכשיו, אבל זה עתיד אפשרי", אמר.

לאחר שהכריזו על החברה החדשה שלהם לעולם, Catalog מתמקד כעת בביצוע כמה פרויקטים פיילוטים כדי להדגים כיצד ניתן להשתמש בטכנולוגיה זו ביעילות. "אלה לא אתגרים מדעיים שנותרו לנו לפתור, אלא בעיות אופטימיזציה מכנית", ציין.

לאחר, על פי הודאתו, שנכנס לתחום הזה כי זה נשמע כמו גישה טכנולוגית מגניבה לתחום גדול בעיה, פארק משוכנע כעת שאחסון נתוני DNA עשוי להתברר כאחת הטכנולוגיות החשובות ביותר שלנו זְמַן.

לעזאזל, כשזה מגיע ליכולת לאחסן את ההיסטוריה האנושית כפי שאנו מכירים אותה, קשה לא להסכים. "מדובר בשמירה על דרך החיים שלנו כפי שאנו מכירים אותה", הסביר.

המלצות עורכים

  • האם קלטות מגנטיות מהאסכולה הישנה היא אמצעי אחסון הנתונים של העתיד?
  • סין רוצה להשתמש בניתוח DNA שנוי במחלוקת כדי לנחש פרצופים של פושעים
  • הסטארט-אפ הביוטי הזה רוצה לשים את ה-DNA שלך בכספת על הירח
  • מדעני קלטק השתמשו ב-DNA כדי לשחק את המשחק הקטן ביותר בעולם של טיק-טק-בוהן
  • רפואה מדויקת תלויה ב-DNA, אבל שליחת היריקה שלך עדיין טומנת בחובה סיכונים