Quando ficamos sem espaço para dados, os cientistas querem armazená-los no DNA

Primeiro, o aviso apocalíptico: estamos ficando sem armazenamento de dados.

Conteúdo

Dados, dados, em qualquer lugar
O DNA é a resposta?
É tudo uma questão de armazenamento
Imagine as possibilidades

Provavelmente, isso não é algo com que você tenha se preocupado muito nos últimos anos. Houve um tempo, não muito tempo atrás, em que o disco rígido finito do seu computador era todo o armazenamento que você tinha disponível. Atingisse esse limite (que, no caso do meu primeiro computador, era inferior a 100 MB) e você recorreria a disquetes e outros armazenamentos externos locais. Quando você acabou com isso também, você teve que deletar.

Todos os dias, são criados cerca de 2,5 quintilhões de bytes de dados, cortesia dos 3,7 bilhões de humanos que agora usam a Internet.

Não excluímos mais. Nem as empresas, especialmente aquelas avaliadas com base nos dados que possuem. Em vez disso, simplesmente enviamos nossos arquivos para a nuvem, cujo nome é efêmero e etéreo; carente de qualquer fisicalidade real. Onde os dados são armazenados? Não importa, desde que possamos recuperá-lo. Quais são os perigos de ficar sem armazenamento em nuvem? Aparentemente muito pouco, além de ter que aumentar o pagamento da assinatura mensal para desbloquear mais espaço livre glorioso.

Relacionado

Governo dos EUA e big tech querem usar dados de localização para combater o coronavírus
DNA, vidro gravado a laser e muito mais: uma espiada no futuro do armazenamento de dados
A última inovação da Microsoft pode tornar possíveis data centers baseados em DNA

Como resultado, a ideia de que um dia poderemos ficar sem armazenamento de dados é tão difícil de entender como a sugestão de que poderíamos acabar com a água: aquele glorioso recurso gratuito que cai do céu. Mas 2018 é o ano em que a Cidade do Cabo, na África do Sul, veio precipitadamente perto de ficar sem água. E também poderíamos ficar sem armazenamento de dados.

Dados, dados, em qualquer lugar

A razão para isto é o ritmo inimaginável a que atualmente produzimos dados. Todos os dias, são criados cerca de 2,5 quintilhões de bytes de dados, cortesia dos 3,7 bilhões de humanos que agora usam a Internet. Só nos últimos dois anos, foram criados impressionantes 90% dos dados do mundo. Com um número crescente de dispositivos inteligentes conectados à Internet das Coisas, esse número deverá aumentar significativamente.

Gráfico da criação total de dados — Catálogo

Gráfico mostrando quantos dados precisarão ser armazenados — Catálogo

“Quando pensamos em armazenamento em nuvem, pensamos nesses armazenamentos infinitos de dados”, disse Hyunjun Park, CEO e cofundador da empresa de armazenamento de dados. Catálogo, disse Tendências Digitais. “Mas a nuvem é, na verdade, apenas o computador de outra pessoa. O que a maioria das pessoas não percebe é que estamos gerando tantos dados que o ritmo em que os geramos ultrapassa em muito a nossa capacidade de armazená-los todos. Num futuro muito próximo, teremos uma enorme lacuna entre os dados úteis que estamos gerando e como podemos armazená-los usando meios convencionais.”

A Catalog desenvolveu uma tecnologia que acredita poder transformar a forma como armazenamos dados.

Como as empresas de armazenamento em nuvem estão ocupadas construindo novos data centers e expandindo os existentes, a um ritmo acelerado, é difícil determinar quando poderemos ficar sem capacidade de armazenamento de dados. Não há relógio de contagem regressiva no estilo de filme. De acordo com Park, no entanto, já em 2025 a humanidade pode ter produzido mais de 160 zetabytes de dados cumulativamente. (Um zetabyte, caso você esteja se perguntando, equivale a um trilhão de gigabytes.) Quanto disso seremos capazes de armazenar? Cerca de 12,5% disso, sugere Park.

Claramente, algo precisa ser feito.

O DNA é a resposta?

É aí que Park e seu colega cientista e cofundador do MIT, Nathaniel Roquet, entram em cena. Sua startup Catalog desenvolveu tecnologia que eles acreditam poder transformar o armazenamento de dados como o conhecemos; permitindo, ou pelo menos é o que afirmam, que todos os dados mundiais caibam confortavelmente num espaço do tamanho de um armário de casacos.

Equipe de armazenamento de DNA do Catalog no laboratório.Catálogo

A solução do catálogo? Codificando dados em DNA. Isso pode soar como o enredo de um romance de Michael Crichton, mas sua solução escalonável e acessível é séria e tem tanto até agora recebeu US$ 9 milhões em financiamento de risco – juntamente com o apoio dos principais professores de Stanford e Harvard Universidades.

“Uma pergunta que me fazem com frequência é: ‘De quem é o DNA que estamos usando?’” Park riu. “As pessoas têm medo de que retiremos o DNA das pessoas e as transformemos em mutantes, ou coisas assim.”

Durante anos, gargalos impediram que o DNA correspondesse ao seu enorme potencial de armazenamento de dados.

Devemos deixar claro que não é isso que o Catalog está fazendo. O DNA no qual a empresa está codificando os dados é um polímero sintético. Não é algo que vem de origem biológica, e a série de pares de bases em que os dados são codificados, como uma série de uns e zeros, não é o código para nada vivo. Mas o produto final ainda assim é biologicamente indistinguível de algo que você pode encontrar em uma célula viva.

A ideia de o DNA ser um método potencial de armazenamento tem sido especulada há décadas, praticamente desde que James Watson e Francis Crick descobriram a dupla hélice em 1953. No entanto, até agora, registaram-se vários estrangulamentos que a impediram de cumprir os seus enorme potencial como solução de armazenamento de dados computacionais.

O pensamento tradicional sobre armazenamento de dados baseado em DNA concentrava-se na síntese de novas moléculas de DNA; mapear a sequência de bits para a sequência dos quatro pares de bases do DNA e produzir moléculas suficientes para representar todos os números que você deseja armazenar. O problema é que esse processo é lento e caro, ambos gargalos consideráveis no que diz respeito ao armazenamento de dados.

Capacidade de armazenamento de DNA versus tradicional — Catálogo

Como o Catalog sintetiza o armazenamento em DNA — Catálogo

A abordagem do Catálogo baseia-se na dissociação do processo de síntese do processo de codificação. Essencialmente, a empresa gera um grande número de apenas algumas moléculas diferentes (tornando-o muito mais barato) e depois codifica a informação gerando uma enorme diversidade a partir das moléculas pré-fabricadas.

Como analogia, o Catalog comparou a abordagem anterior à fabricação de discos rígidos personalizados com todos os seus dados conectados. Armazenar dados diferentes significa construir um disco rígido totalmente novo do zero. Sua abordagem, sugerem eles, é semelhante à produção em massa de discos rígidos virgens e, em seguida, preenchê-los com informações codificadas quando necessário.

É tudo uma questão de armazenamento

A parte interessante de tudo isso é a quantidade impressionante de dados que ele pode armazenar. Como prova de conceito, o Catalog usou sua tecnologia para codificar livros como O Guia do Mochileiro das Galáxias em ADN. Mas isso não é nada comparado às possibilidades.

Do início ao fim, a leitura dos dados do DNA levará no mínimo várias horas.

“Se você comparar maçãs com maçãs, os bits que você pode armazenar no mesmo volume chegam a algo como 1 milhão de vezes a densidade de informação de uma unidade de estado sólido”, disse Park. “Tudo o que você pode armazenar em um pen drive, você poderia armazenar 1 milhão de vezes isso no mesmo volume se estiver fazendo isso no DNA.”

A comparação com unidades de estado sólido não é exata, entretanto. O DNA pode ser capaz de armazenar muito mais informações no mesmo volume, mas não tem o acesso instantâneo de, digamos, uma unidade flash conectada por USB. A abordagem do Catalog transforma dados em um pellet sólido de polímero sintético.

Para acessar seus dados, os cientistas precisariam pegar o pellet, reidratá-lo adicionando água e depois lê-lo usando um sequenciador de DNA. Isto fornece os pares de bases do DNA, que podem, por sua vez, ser usados para calcular os uns e os zeros que remontam os seus dados. Do início ao fim, o processo levará no mínimo várias horas.

Equipe de DNA do catálogo no laboratório — Para recuperar dados do DNA, os cientistas precisariam pegar o pellet em que ele está armazenado, reidratá-lo adicionando água e depois lê-lo usando um sequenciador de DNA.Catálogo

Por esta razão, o Catalog visa inicialmente um mercado habituado a este tipo de atrasos: o mercado de arquivamento. Este é o tipo de dados que atualmente é armazenado em formatos como fita magnética, usados para acompanhar do tipo de informação que você espera não ter que revisitar, mas ainda é crucial para pendurar para. (Imagine o equivalente corporativo da garantia para sua geladeira.)

Mas haverá algum momento em que isso será importante para o usuário médio? Afinal, como apontamos no início deste artigo, a maioria de nós não pensa muito sobre nossos dados e onde eles são mantidos. Está em fita magnética? Está em armazenamento de estado sólido? Não nos importamos, desde que esteja disponível quando precisamos dele.

A codificação de dados baseada em DNA provavelmente será uma opção de armazenamento de longo prazo, enquanto os dados de curto prazo assumem outras formas.

Devido ao tempo que leva para recuperar informações, é improvável que algum dia chegue a um ponto em que, por Por exemplo, suas informações do Google Cloud são armazenadas em enormes tonéis de DNA ou como uma série de pellets semelhantes a mármore em Mountain Veja, CA. Se o Catalog conseguir provar o seu conceito às empresas, esta será provavelmente uma opção de armazenamento a longo prazo, enquanto os dados a curto prazo assumem outras formas.

Imagine as possibilidades

Um tubo contendo milhões de cópias de dados codificados em DNA.Catálogo

No entanto, existem possibilidades emocionantes de ficção científica. “Imagine um pellet subcutâneo contendo todos os seus dados de saúde, todos os seus exames de ressonância magnética, seus exames de sangue, as radiografias do seu dentista”, disse Park. “Você sempre desejaria que esses dados estivessem muito acessíveis para você, mas não necessariamente os quer na nuvem em algum lugar ou em um servidor inseguro em um hospital. Se você tivesse isso com você na forma de DNA, você poderia controlar fisicamente esses dados e o acesso a eles, garantindo ao mesmo tempo que apenas os médicos autorizados poderiam ter acesso a eles.”

Afinal, como ele ressalta, todos os hospitais hoje possuem sequenciadores de DNA. “Não estou dizendo que estamos buscando isso agora, mas é um futuro possível”, disse ele.

Depois de anunciar a sua nova empresa ao mundo, a Catalog está agora focada na realização de alguns projetos piloto para demonstrar como esta tecnologia pode ser utilizada de forma eficaz. “Estes não são desafios científicos que temos que resolver, mas sim problemas de otimização mecânica”, observou.

Tendo, como ele próprio admitiu, entrado neste campo porque parecia uma abordagem tecnológica interessante para um grande problema, Park está agora convencido de que o armazenamento de dados de DNA pode vir a ser uma das tecnologias mais importantes do nosso tempo.

Caramba, quando se trata de arquivar a história humana como a conhecemos, é difícil discordar. “Trata-se de preservar nosso modo de vida como o conhecemos”, explicou ele.

Recomendações dos Editores

As fitas magnéticas tradicionais são o meio de armazenamento de dados do futuro?
China quer usar polêmica análise de DNA para adivinhar rostos de criminosos
Esta startup de biotecnologia quer colocar seu DNA em um cofre na lua
Cientistas da Caltech usaram DNA para jogar o menor jogo de jogo da velha do mundo
A medicina de precisão depende do DNA, mas enviar sua saliva ainda apresenta riscos

Quando ficamos sem espaço para dados, os cientistas querem armazená-los no DNA

Dados, dados, em qualquer lugar

O DNA é a resposta?

É tudo uma questão de armazenamento

Imagine as possibilidades

Recomendações dos Editores

Categorias

Recente

Os cientistas desenvolveram glândulas de veneno de cobra em um prato. Aqui está o porquê.

Adoro que a Samsung continue levando a sério os dobráveis

Deepfakes são perigosos? Criadores e reguladores discordam