Він врятував читання свого дідуся за допомогою проекту «зроби сам».

читання тексту в мовлення
Бенні Аффлек

Кожен день народження Бенні Аффлек (ні, не той) купує своєму дідусеві найкращу пляшку чилійського червоного вина, яку тільки може знайти. Але коли був його дідусь, якого також звали Бен якому цього року виповнюється 100 років, його 40-річний онук, британський інженер-програміст, вирішив, що ця подія заслуговує особливого подарунка.

Зміст

  • Читальні машини
  • Створено для простоти використання
  • Допомога більшій кількості людей

«Він дуже надихаюча людина», — сказав Аффлек, який керує консультаційною компанією з програмного забезпечення у Великобританії. Ionium Design, сказав про Бена-старшого: «Все ще веселий, незважаючи на те, що пережив двох дружин і обох своїх дітей».

Рекомендовані відео

На столітній ювілей його діда пляшка вина — чи навіть пара — просто не збиралася різати. Тож Аффлек створив для нього цифровий пристрій на основі штучного інтелекту перетворення тексту в мовлення машину для читання, щоб допомогти своєму дідусеві, у якого є дегенерація жовтої плями, знову вміти читати.

Пов'язані

  • Прочитайте моторошно красиве «синтетичне писання» штучного інтелекту. що думає, що це Бог
  • Глибоке навчання А.І. допомагає археологам перекладати стародавні таблички

Читальні машини

«Мій дідусь почав втрачати зір близько 10 років тому», — сказав Аффлек Digital Trends. «Він надзвичайно рішучий чоловік і хоче залишатися незалежним, жити вдома та брати активну участь у світі. Втрата здатності керувати була важким ударом, але він замінив це таксі. Важче було втратити здатність читати».

читання тексту в мовлення
Бенні Аффлек

Незважаючи на найкращі доступні засоби для зору, Аффлек сказав, що його дідусь регулярно витрачав більше години, щоб розшифрувати одну літеру формату А4. «Хоча їх багато смартфон і доступні [інструменти] на основі планшетів, вони не підходять для людей, які не знайомі з цими пристроями, або для людей, чий зір, дотик чи слух роблять сенсорні екрани непридатними», — сказав він.

Те, що Аффлек розробив для свого дідуся як альтернативу, був цифровим помічником для читання своїми руками, виготовленим із використанням готових компонентів і програмного забезпечення. Це дозволяє користувачам розміщувати документ на освітленій платформі, де він сканується камерою, розшифровується алгоритмами розпізнавання тексту та, зрештою, зачитується природним голосом.

Щоб зробити інтерфейс зручнішим для людей із слабким зором, машина оснащена масивними кольоровими кнопками. Натискання синього сканує документ. Зелений починає читати останній сканований документ. Ліва жовта кнопка пропускає на шість секунд назад, права жовта — на шість секунд вперед, а червона кнопка призупиняє та відновлює паузу. З міркувань безпеки Аффлек сказав, що машина не зберігає відскановані документи ні локально, ні в хмарі.

Створено для простоти використання

Аффлек сказав, що зазвичай працює в будиночку у своєму саду. Однак йому довелося зібрати подарунок дідуся на кухонному столі через відсутність зовнішнього опалення. (Він займається сноубордингом як хобі та звик до холоду, але в кожного є свої межі!)

«Весь пристрій було створено за три тижні», — сказав він. «Створення фізичного корпусу могло бути непростим завданням, але в мене виникла думка перепрофілювати старий портативний проектор 3M. Усі інші запчастини надійшли від малих британських підприємств і [великої компанії з виробництва електронних компонентів.] Моє сусід люб’язно обробив металоконструкцію для міцної клавіатури мого дизайну, яку я оснастив аркадою кнопки».

читання тексту в мовлення
Бенні Аффлек

Програмне забезпечення машини для зчитування є спеціальним Python із Google Cloud Vision і Перетворення тексту в мовлення Wavenet програмне забезпечення. Він живиться через a Raspberry Pi 3B з камерою Pi V2.

«Вся система працює напрочуд добре», — сказав Аффлек, описуючи це як «свідчення» високоякісного штучного інтелекту Google. інструменти. «Друкований текст читається з дивовижною точністю, навіть з урахуванням поворотів, спотворень [та інших проблем]. Голос теж дуже чутний. Під час тестування я мав машину, яка читала сторінки з Лев, відьма і шафа, і я виявив, що втягнувся в історію».

1 з 4

Бенні Аффлек
Бенні Аффлек
Бенні Аффлек
Бенні Аффлек

Кумедний, але зворушливий момент стався, коли Аффлек зробив подарунок своєму дідусеві. «Налаштувавши його для нього, дідусь сказав: «Тепер я можу використовувати це, щоб прочитати інструкції до моєї цифрової лупи», — сказав Аффлек. «Це було смішно і сумно, що він не міг керувати іншим пристроєм, який купив, щоб допомогти йому, тому що він не міг прочитати його інструкції».

Допомога більшій кількості людей

За словами Аффлека, єдина проблема з машиною на даний момент полягає в просторово структурованих даних, таких як банківські виписки. «Я додам евристики та деякі з мого власного ШІ. дозволити читати їх більш схожим на людину», – зазначив він.

Аффлек сказав, що створення цього пристрою дало йому змогу по-новому оцінити проблеми, з якими стикаються люди з обмеженим зором. «Коли я почав розробляти концепцію, стало очевидно, що багато інших людей мають подібні проблеми. Я зрозумів, що є попит на набагато кращий пристрій, тож створив найкращий прототип, який міг, і будую більше одиниць, щоб у лютому я міг провести польові випробування з волонтерами».

Якщо ці тести пройдуть успішно, Аффлек сказав, що він подумає про те, щоб перетворити це на продукт — разом із додатковими функціями та більш відповідним корпусом. Однак наразі він створив кардинальний пристрій, яким його дідусь може користуватися щодня — і, насправді, це саме те, що він збирався зробити.

Рекомендації редакції

  • Meta хоче зарядити Вікіпедію оновленим штучним інтелектом
  • Ця технологія була науковою фантастикою 20 років тому. Тепер це реальність
  • Ось А.І. попередній перегляд того, що зміни клімату вплинуть на ваш район