데이터 공간이 부족해지면 과학자들은 데이터를 DNA에 저장하려고 합니다.

Google

먼저 종말론적 경고: 데이터 저장 공간이 부족합니다.

내용물

  • 데이터, 데이터, 어디서나
  • DNA가 답인가?
  • 스토리지에 관한 모든 것
  • 가능성을 상상해 보세요

이것은 최근 몇 년 동안 너무 많이 걱정해야 했던 것이 아닐 가능성이 있습니다. 얼마 전까지만 해도 컴퓨터의 유한한 하드 드라이브가 사용 가능한 저장 공간의 전부였던 시절이 있었습니다. 그 한계(내 첫 번째 컴퓨터의 경우 100MB 미만)에 도달하여 플로피 디스크와 기타 로컬 외부 저장소에 의존하게 되었습니다. 그 정보가 부족해지면 삭제하게 됩니다.

현재 인터넷을 사용하는 37억 명의 인류 덕분에 매일 약 250경 바이트의 데이터가 생성됩니다.

우리는 더 이상 삭제하지 않습니다. 기업, 특히 자신이 소유한 데이터를 기반으로 가치를 평가받는 기업도 마찬가지입니다. 대신에 우리는 파일을 클라우드로 옮기기만 하면 됩니다. 이름 자체가 임시적이고 영묘합니다. 실제 육체성이 부족합니다. 데이터는 어디에 저장되나요? 우리가 그것을 돌려받을 수 있는 한 그것은 중요하지 않습니다. 클라우드 스토리지 부족으로 인한 위험은 무엇입니까? 더 멋진 무료 공간을 잠금 해제하려면 월간 구독료를 인상해야 하는 것 외에는 거의 없어 보입니다.

관련된

  • 미국 정부와 거대 기술업체, 코로나바이러스 퇴치를 위해 위치 데이터 활용 원해
  • DNA, 레이저 에칭 유리, 그 이상: 데이터 스토리지의 미래 엿보기
  • Microsoft의 최신 혁신으로 DNA 기반 데이터 센터가 가능해졌습니다.

결과적으로 언젠가는 데이터 저장 공간이 부족할 수도 있다는 생각은 머리를 감싸는 것만큼 어렵습니다. 물이 부족할 수 있다는 제안이 주변에 떠돌고 있습니다. 바로 바다에서 떨어지는 영광스러운 무료 자원입니다. 하늘. 그런데 2018년은 남아프리카공화국 케이프타운이 찾아온 해다. 갑자기 물이 부족해지기 직전. 그리고 데이터 저장 공간도 부족할 수 있습니다.

데이터, 데이터, 어디서나

그 이유는 현재 우리가 데이터를 생성하는 상상할 수 없는 속도 때문입니다. 현재 인터넷을 사용하는 37억 명의 인류 덕분에 매일 약 250경 바이트의 데이터가 생성됩니다. 지난 2년 동안에만 전 세계 데이터의 90%가 놀라울 정도로 생성되었습니다. 사물 인터넷에 연결된 스마트 장치의 수가 증가함에 따라 그 수치도 크게 늘어날 것입니다.

전체 데이터 생성 그래프
저장해야 하는 데이터의 양을 보여주는 그래프
목록

“클라우드 스토리지라고 하면 무한한 데이터 저장소가 떠오릅니다.” 데이터 스토리지 기업 박현준 CEO 겸 공동 창업자 목록, Digital Trends에 말했습니다. “하지만 클라우드는 사실 다른 사람의 컴퓨터일 뿐입니다. 대부분의 사람들이 깨닫지 못하는 것은 우리가 너무 많은 데이터를 생성하고 있어서 데이터를 생성하는 속도가 모든 데이터를 저장하는 능력을 훨씬 앞지른다는 것입니다. 가까운 미래에 우리가 생성하는 유용한 데이터와 기존 매체를 사용하여 데이터를 저장하는 방법 사이에 큰 격차가 생길 것입니다.”

Catalog는 데이터 저장 방식을 변화시킬 수 있다고 믿는 기술을 개발했습니다.

클라우드 스토리지 회사는 새로운 데이터 센터를 구축하고 기존 데이터 센터를 엄청난 속도로 확장하느라 바쁘기 때문에 언제 데이터 스토리지 용량이 부족해질지 파악하기가 어렵습니다. 영화 스타일의 카운트다운 시계는 없습니다. 그러나 박 교수에 따르면 이르면 2025년부터 인류는 누적 160제타바이트 이상의 데이터를 생산했을 것으로 추정된다. (궁금하신 경우 1제타바이트는 1조 기가바이트입니다.) 우리는 이 중 얼마나 저장할 수 있을까요? 박씨는 그 중 약 12.5%를 제안했다.

분명히 뭔가 조치를 취해야 합니다.

DNA가 답인가?

이것이 바로 박 교수와 동료 MIT 과학자이자 공동 창립자인 Nathaniel Roquet가 등장하는 곳입니다. 그들의 스타트업 카탈로그는 우리가 알고 있는 데이터 스토리지를 변화시킬 수 있다고 믿는 기술을 개발했습니다. 그들은 전 세계의 데이터 전체가 옷장 크기의 공간에 편안하게 들어갈 수 있다고 주장합니다.

카탈로그 DNA 보관팀
카탈로그의 DNA 보관팀이 실험실에 있습니다.목록

카탈로그의 솔루션? 데이터를 DNA로 인코딩함으로써. 그것은 Michael Crichton 소설의 줄거리처럼 들릴지 모르지만 확장 가능하고 저렴한 솔루션은 심각합니다. 스탠포드와 하버드의 주요 교수들의 지원과 함께 지금까지 900만 달러의 벤처 자금 지원을 받았습니다. 대학.

“제가 자주 받는 질문은 ‘우리는 누구의 DNA를 사용하고 있나요?’입니다.” 박씨는 웃었다. “사람들은 우리가 사람에게서 DNA를 채취해 돌연변이로 바꾸는 것을 두려워합니다.”

수년 동안 병목 현상으로 인해 DNA가 막대한 데이터 저장 잠재력을 발휘하지 못했습니다.

이것은 Catalog가 하는 일이 아닙니다. 우리는 분명히 해야 합니다. 회사가 데이터를 코딩하는 DNA는 합성 폴리머입니다. 생물학적 기원에서 나온 것이 아니며, 1과 0의 연속으로 데이터가 암호화된 일련의 염기쌍은 생명체의 코드가 아닙니다. 그러나 최종 생성물은 그럼에도 불구하고 살아있는 세포에서 찾을 수 있는 것과 생물학적으로 구별할 수 없습니다.

DNA가 잠재적인 저장 방법이라는 생각은 사실상 1953년 제임스 왓슨(James Watson)과 프랜시스 크릭(Francis Crick)이 이중 나선을 발견한 이후 수십 년 동안 추측되어 왔습니다. 그러나 지금까지 그 목표를 달성하는 데 방해가 되는 수많은 병목 현상이 있었습니다. 컴퓨터 데이터 저장 솔루션으로서의 엄청난 잠재력.

DNA 기반 데이터 저장에 대한 전통적인 사고는 새로운 DNA 분자의 합성에 초점을 맞췄습니다. 비트 시퀀스를 DNA의 4개 염기쌍 시퀀스에 매핑하고 저장하려는 모든 숫자를 표현하기에 충분한 분자를 만듭니다. 문제는 이 프로세스가 느리고 비용이 많이 들며 데이터 저장과 관련하여 상당한 병목 현상이 발생한다는 것입니다.

DNA 저장 용량과 기존 비교
Catalog가 저장소를 DNA로 합성하는 방법
목록

카탈로그의 접근 방식은 인코딩 프로세스에서 합성 프로세스를 분리하는 데 기반을 두고 있습니다. 본질적으로 회사는 단지 몇 가지 다른 분자를 대량으로 생성한 다음(훨씬 더 저렴하게) 미리 만들어진 분자에서 엄청난 다양성을 생성하여 정보를 인코딩합니다.

이에 대해 Catalog는 모든 데이터가 내장된 맞춤형 하드 드라이브를 제조하는 이전 접근 방식을 비유했습니다. 다양한 데이터를 저장한다는 것은 처음부터 완전히 새로운 하드 드라이브를 구축하는 것을 의미합니다. 그들의 접근 방식은 빈 하드 드라이브를 대량 생산한 다음 필요할 때 인코딩된 정보로 채우는 것과 유사하다고 그들은 제안합니다.

스토리지에 관한 모든 것

이 모든 것의 흥미로운 부분은 저장할 수 있는 데이터의 양이 놀라울 정도로 크다는 것입니다. 개념 증명으로 Catalog는 기술을 사용하여 다음과 같은 책을 인코딩했습니다. 은하수를 여행하는 히치하이커를위한 안내서 DNA로. 하지만 가능성에 비하면 아무것도 아닙니다.

처음부터 끝까지 DNA에서 데이터를 읽는 데는 최소 몇 시간이 걸립니다.

박씨는 “사과를 사과와 비교한다면 같은 부피에 저장할 수 있는 비트의 양은 솔리드 스테이트 드라이브 정보 밀도의 100만 배에 달한다”고 말했다. "플래시 드라이브에 무엇을 저장할 수 있든 DNA에 저장할 수 있다면 같은 볼륨에 100만 배를 저장할 수 있습니다."

그러나 솔리드 스테이트 드라이브와의 비교는 정확하지 않습니다. DNA는 동일한 볼륨에 훨씬 더 많은 정보를 저장할 수 있지만 USB로 연결된 플래시 드라이브처럼 즉시 액세스할 수는 없습니다. Catalog의 접근 방식은 데이터를 합성 폴리머의 고체 펠렛으로 변환합니다.

데이터에 접근하려면 과학자들은 해당 펠렛에 물을 추가하여 재수화한 다음 DNA 서열 분석기를 사용하여 읽어야 합니다. 이는 DNA의 염기쌍을 제공하며, 이는 다시 데이터를 재조립하는 1과 0을 계산하는 데 사용될 수 있습니다. 처음부터 끝까지 프로세스는 최소 몇 시간이 소요됩니다.

실험실에 있는 카탈로그의 DNA 팀
DNA에서 데이터를 검색하려면 과학자들은 저장된 펠렛에 물을 추가하여 재수화시킨 다음 DNA 서열 분석기를 사용하여 읽어야 합니다.목록

이러한 이유로 Catalog는 처음에는 이러한 종류의 지연에 익숙한 시장, 즉 아카이빙 시장을 목표로 삼았습니다. 이는 현재 추적에 사용되는 자기 테이프와 같은 형식으로 저장되는 종류의 데이터입니다. 다시 방문하지 않기를 바라지만 여전히 중요한 정보입니다. 위에. (냉장고에 대한 기업 보증과 동등한 것을 상상해보십시오.)

그러나 이것이 일반 사용자에게 중요한 시점이 있습니까? 결국, 이 글의 상단에서 지적했듯이, 우리 대부분은 데이터와 데이터가 어디에 보관되어 있는지에 대해 그렇게 많이 생각하지 않습니다. 자기테이프에 있나요? 솔리드 스테이트 스토리지에 있습니까? 필요할 때 그것이 거기에 있는 한 우리는 신경쓰지 않습니다.

DNA 기반 데이터 인코딩은 장기 저장 옵션이 될 가능성이 높지만 단기 데이터는 다른 형태를 취합니다.

정보를 검색하는 데 시간이 많이 걸리기 때문에 정보를 검색하는 데 걸리는 시간이 거의 없습니다. 예를 들어 Google Cloud 정보는 거대한 DNA 통이나 Mountain의 일련의 대리석 같은 알갱이로 저장됩니다. 캘리포니아주 보기 카탈로그가 비즈니스에 자신의 개념을 입증할 수 있다면 이는 장기 저장 옵션이 될 가능성이 높지만 단기 데이터는 다른 형태를 취합니다.

가능성을 상상해 보세요

DNA로 암호화된 수백만 개의 데이터 사본이 들어 있는 튜브입니다.목록

하지만 공상 과학처럼 들리는 흥미로운 가능성이 있습니다. 박씨는 “모든 건강 데이터, 모든 MRA 스캔, 혈액 검사, 치과 의사의 엑스레이가 포함된 피하 펠릿을 상상해 보십시오.”라고 말했습니다. “항상 해당 데이터에 쉽게 액세스할 수 있기를 원하지만, 반드시 클라우드 어딘가에 있거나 병원의 보안되지 않은 서버에 저장되는 것을 원하지는 않습니다. DNA 형태로 가지고 있다면 해당 데이터를 물리적으로 통제하고 접근할 수 있으며, 승인된 의사만 접근할 수 있도록 할 수 있습니다.”

결국 그가 지적했듯이 오늘날 모든 병원에는 DNA 서열 분석기가 있습니다. “우리가 지금 당장 그것을 추구하고 있다고 말하는 것은 아니지만 가능한 미래입니다.”라고 그는 말했습니다.

새로운 회사를 전 세계에 발표한 Catalog는 이제 이 기술을 효과적으로 사용할 수 있는 방법을 보여주기 위해 몇 가지 파일럿 프로젝트를 수행하는 데 중점을 두고 있습니다. "이것은 우리가 해결해야 할 과학적 과제가 아니라 기계적 최적화 문제입니다."라고 그는 지적했습니다.

자신도 인정했듯이 이 분야에 뛰어든 이유는 그것이 큰 규모의 기술에 대한 멋진 기술적 접근 방식처럼 들렸기 때문입니다. 문제를 해결하기 위해 박씨는 이제 DNA 데이터 저장이 우리 사회의 가장 중요한 기술 중 하나가 될 수 있다고 확신합니다. 시간.

도대체, 우리가 알고 있는 인류 역사를 보관할 수 있다는 점에 대해서는 동의하기 어렵습니다. “우리가 알고 있는 삶의 방식을 보존하는 것입니다.”라고 그는 설명했습니다.

편집자의 추천

  • 구식 자기 테이프가 미래의 데이터 저장 매체입니까?
  • 중국, 논란의 여지가 있는 DNA 분석을 이용해 범죄자 얼굴 추측하려 한다
  • 이 생명공학 스타트업은 당신의 DNA를 달의 금고에 보관하고 싶어합니다.
  • Caltech 과학자들은 DNA를 사용하여 세계에서 가장 작은 틱택토 게임을 했습니다.
  • 정밀의료는 DNA에 달려 있지만, 침을 뱉는 것은 여전히 ​​위험이 있습니다