Ele salvou as habilidades de leitura de seu avô com um projeto DIY

leitor de texto para fala
Bennie Affleck

Todo aniversário, Bennie Affleck (não, esse não) compra para seu avô a melhor garrafa de vinho tinto chileno que consegue encontrar. Mas quando seu avô, também chamado Ben, foi deve completar 100 anos este ano, seu neto engenheiro de software britânico de 40 anos decidiu que a ocasião merecia um presente especial.

Conteúdo

  • Máquinas de leitura
  • Projetado para facilidade de uso
  • Ajudando mais pessoas

“Ele é um homem muito inspirador”, Affleck, que dirige uma consultoria de software no Reino Unido chamada Projeto Iônio, disse sobre Ben Sr. “Ainda alegre, apesar de ter sobrevivido a duas esposas e seus dois filhos.”

Vídeos recomendados

Para o centenário de seu avô, uma garrafa de vinho - ou mesmo algumas delas - simplesmente não seria suficiente. Então Affleck construiu para ele um dispositivo digital alimentado por IA conversão de texto em fala máquina de leitura para ajudar seu avô, que tem degeneração macular, a voltar a ler.

Relacionado

  • Leia a estranhamente bela “escritura sintética” de uma IA. que pensa que é Deus
  • IA de aprendizagem profunda está ajudando arqueólogos a traduzir tabuinhas antigas

Máquinas de leitura

“Meu avô começou a perder a visão há cerca de 10 anos”, disse Affleck ao Digital Trends. “Ele é um homem extremamente determinado e quer continuar independente, morando em casa e participando ativamente do mundo. Perder a capacidade de dirigir foi um golpe, mas ele substituiu isso pelos táxis. Perder a capacidade de ler foi mais difícil.”

leitor de texto para fala
Bennie Affleck

Apesar dos melhores recursos de visão disponíveis, Affleck disse que seu avô costumava levar mais de uma hora para decifrar uma única letra A4. “Embora haja muitos Smartphone e [ferramentas] baseadas em tablets disponíveis, elas são inadequadas para pessoas não familiarizadas com esses dispositivos, ou cuja visão, toque ou audição tornam as telas sensíveis ao toque inutilizáveis”, disse ele.

O que Affleck projetou para seu avô como alternativa foi um assistente de leitura digital DIY, feito com componentes e software disponíveis no mercado. Ele permite que os usuários coloquem um documento em uma plataforma iluminada, onde ele é digitalizado por uma câmera, decifrado por algoritmos de reconhecimento de texto e, por fim, lido com uma voz natural.

Para facilitar a interface para quem tem deficiência visual, a máquina é equipada com botões coloridos grossos. Acertar o azul digitaliza um documento. Green começa a ler o documento digitalizado mais recentemente. O botão amarelo esquerdo retrocede seis segundos, o amarelo direito avança seis segundos e o botão vermelho pausa e retoma. Por questões de segurança, Affleck disse que a máquina não armazena nenhum dos documentos digitalizados localmente ou na nuvem.

Projetado para facilidade de uso

Affleck disse que geralmente trabalha em uma cabana em seu jardim. No entanto, ele teve que juntar o presente do avô na mesa da cozinha, devido à falta de aquecimento externo. (Ele pratica snowboard por hobby e está acostumado com o frio, mas todo mundo tem seus limites!)

“Todo o dispositivo foi construído em três semanas”, disse ele. “Construir um recinto físico poderia ter sido assustador, mas tive a ideia de reaproveitar um antigo retroprojetor portátil da 3M. Todas as outras peças vieram de pequenas empresas do Reino Unido e [de uma grande empresa de componentes eletrônicos]. vizinho gentilmente usinou a metalurgia para um teclado robusto de meu projeto, que eu instalei com arcade botões.”

leitor de texto para fala
Bennie Affleck

O software da máquina de leitura é Python personalizado com o do Google Visão na nuvem e Conversão de texto para fala Wavenet Programas. É alimentado por um Framboesa Pi 3B com uma câmera Pi V2.

“O sistema completo funciona surpreendentemente bem”, disse Affleck, descrevendo isso como um “testamento” da IA ​​de alta qualidade do Google. ferramentas. “O texto impresso é lido com incrível precisão, mesmo considerando rotações, distorções [e outros desafios]. A voz também é muito audível. Nos testes, fiz a máquina ler páginas de O Leão, a Feiticeira e o Guarda-Roupa, e me vi envolvido na história.”

1 de 4

Bennie Affleck
Bennie Affleck
Bennie Affleck
Bennie Affleck

Um momento divertido, mas comovente, ocorreu quando Affleck deu o presente ao avô. “Depois de configurá-lo para ele, meu avô disse: ‘Agora posso usar isso para ler as instruções da minha lupa digital”, disse Affleck. “Foi engraçado e triste que ele não pudesse operar outro dispositivo que comprou para ajudá-lo porque não conseguia ler as instruções.”

Ajudando mais pessoas

A única dificuldade com a máquina atualmente, disse Affleck, é com dados estruturados espacialmente, como extratos bancários. “Acrescentarei heurísticas e algumas de minhas próprias IAs. para permitir que estes sejam lidos de uma maneira mais humana”, observou ele.

Affleck disse que a construção deste dispositivo deu-lhe uma nova apreciação dos desafios que as pessoas com visão limitada enfrentam. “À medida que comecei a desenvolver o conceito, tornou-se evidente que muitas outras pessoas têm problemas semelhantes. Percebi que há demanda por um dispositivo muito melhor, então construí o melhor protótipo que pude e estou construindo mais unidades para poder realizar testes de campo com voluntários em fevereiro.”

Se esses testes correrem bem, Affleck disse que consideraria transformar isso em um produto – completo com recursos adicionais e um case mais adequado. Por enquanto, porém, ele construiu um dispositivo revolucionário que seu avô pode usar diariamente – e, na verdade, foi exatamente isso que ele se propôs a fazer.

Recomendações dos Editores

  • Meta quer turbinar a Wikipedia com uma atualização de IA
  • Essa tecnologia era ficção científica há 20 anos. Agora é realidade
  • Aqui está uma IA. prévia do que as mudanças climáticas farão ao seu bairro