![программа чтения текста в речь](/f/db9ff5da8c82cfd326bee7c9e78ae421.jpg)
Каждый день рождения Бенни Аффлек (нет, не тот) покупает дедушке лучшую бутылку чилийского красного вина, которую он может найти. Но когда его дедушку, которого тоже звали Бен, в этом году ему исполнится 100 лет, его 40-летний внук, британский инженер-программист, решил, что это событие заслуживает особого подарка.
Содержание
- Читающие машины
- Создан для простоты использования
- Помощь большему количеству людей
«Он очень вдохновляющий человек», — Аффлек, руководитель британской консалтинговой компании по программному обеспечению под названием Ионий Дизайн, сказал о Бене-старшем: «Все еще весел, несмотря на то, что пережил двух жен и обоих своих детей».
Рекомендуемые видео
К столетнему юбилею его деда бутылка вина – или даже пара бутылок – просто не справилась бы. Поэтому Аффлек построил для него цифровой компьютер с искусственным интеллектом. текст в речь читающая машина, которая помогла его дедушке, страдающему дегенерацией желтого пятна, снова научиться читать.
Связанный
- Прочтите устрашающе красивое «синтетическое писание» ИИ. который думает, что это Бог
- Глубокое обучение ИИ помогает археологам переводить древние таблички
Читающие машины
«Мой дедушка начал терять зрение около 10 лет назад», — рассказал Аффлек Digital Trends. «Он чрезвычайно решительный человек и хочет оставаться независимым, жить дома и принимать активное участие в жизни мира. Потеря способности водить машину была для него ударом, но он заменил ее такси. Потерять способность читать было труднее».
![программа чтения текста в речь](/f/a8450daddbabfa27307bbb1c8b7946f5.jpg)
Несмотря на лучшие доступные средства зрения, Аффлек говорит, что его дедушке регулярно требовалось больше часа, чтобы расшифровать одну букву формата А4. «Хотя существует много смартфон и доступные [инструменты] на базе планшетов, они не подходят для людей, незнакомых с этими устройствами или для тех, чье зрение, осязание или слух делают сенсорные экраны непригодными для использования», — сказал он.
В качестве альтернативы Аффлек разработал для своего дедушки цифровой помощник по чтению, сделанный своими руками, с использованием готовых компонентов и программного обеспечения. Оно позволяет пользователям размещать документ на освещенной платформе, где он сканируется камерой, расшифровывается алгоритмами распознавания текста и в конечном итоге зачитывается естественным голосом.
Чтобы облегчить интерфейс для людей с ослабленным зрением, машина оснащена массивными цветными кнопками. Нажатие на синюю кнопку сканирует документ. Грин начинает читать последний отсканированный документ. Левая желтая кнопка позволяет перейти на шесть секунд назад, правая желтая — на шесть секунд вперед, а красная кнопка делает паузу и возобновляет воспроизведение. По словам Аффлека, из соображений безопасности машина не хранит отсканированные документы ни локально, ни в облаке.
Создан для простоты использования
Аффлек рассказал, что обычно работает в хижине в своем саду. Однако ему пришлось собирать подарок дедушки на кухонном столе из-за отсутствия наружного отопления. (Он сноубордист в качестве хобби и привык к холоду, но у каждого есть свои пределы!)
«Все устройство было построено за три недели», — сказал он. «Создание физического корпуса могло быть сложной задачей, но мне пришла в голову идея перепрофилировать старый портативный проектор 3M. Все остальные детали были произведены небольшими британскими предприятиями и [крупной компанией по производству электронных компонентов]. Сосед любезно изготовил металлоконструкцию для прочной клавиатуры моей конструкции, которую я оснастил игровым автоматом. кнопки».
![программа чтения текста в речь](/f/ab0b8fb0f4a1bab5aba122d1c9dce3b1.jpg)
Программное обеспечение читающей машины — это специальный Python с использованием Google. Облачное видение и Преобразование текста в речь Wavenet программное обеспечение. Питание осуществляется через Малиновый Пи 3Б с камерой Pi V2.
«Вся система работает на удивление хорошо», — сказал Аффлек, назвав это «свидетельством» высокого качества искусственного интеллекта Google. инструменты. «Печатный текст читается с поразительной точностью, даже с учетом поворотов, искажений и других проблем. Голос тоже очень слушабельный. При тестировании у меня были страницы машинного чтения из Лев, Колдунья и Волшебный Шкаф, и я обнаружил, что увлекся этой историей».
1 из 4
Забавный, но острый момент произошел, когда Аффлек преподнес подарок своему дедушке. «Настроив его, дедушка сказал: «Теперь я могу использовать его, чтобы прочитать инструкции к моей цифровой лупе», — сказал Аффлек. «Было смешно и грустно, что он не мог использовать другое устройство, которое купил себе в помощь, потому что не мог прочитать его инструкции».
Помощь большему количеству людей
Единственная трудность с машиной в настоящее время, по словам Аффлека, связана с пространственно структурированными данными, такими как банковские выписки. «Я добавлю эвристику и немного собственного искусственного интеллекта. чтобы их можно было читать более человечно», — отметил он.
Аффлек сказал, что создание этого устройства позволило ему по-новому взглянуть на проблемы, с которыми сталкиваются люди с ограниченным зрением. «Когда я начал разрабатывать эту концепцию, стало очевидно, что у многих других людей есть подобные проблемы. Я понял, что существует спрос на гораздо лучшее устройство, поэтому построил лучший прототип, какой только мог, и строю больше устройств, чтобы в феврале провести полевые испытания с добровольцами».
Если эти испытания пройдут успешно, Аффлек сказал, что он рассмотрит возможность превращения этого устройства в продукт с дополнительными функциями и более подходящим корпусом. Однако на данный момент он создал революционное устройство, которое его дедушка может использовать ежедневно — и, на самом деле, это именно то, что он намеревался сделать.
Рекомендации редакции
- Meta хочет усовершенствовать Википедию с помощью обновления ИИ
- Эта технология была научной фантастикой 20 лет назад. Теперь это реальность
- Вот ИИ. предварительный просмотр того, как изменение климата повлияет на ваш район