Système d'assistance visuelle pour les malvoyants
Dans « Secondhand Spoke », le 15e épisode de la 12e saison de gars de famille, son fils adolescent Chris Griffin est victime d'intimidation. Alors que Chris est incapable de répondre aux quolibets verbaux de ses camarades de classe, son petit frère plus intelligent, Stewie, saute dans un sac à dos pour que Chris puisse le transporter subrepticement. Incité par Stewie, Chris parvient non seulement à se venger des intimidateurs, mais finit même par être nommé président de classe pour ses problèmes.
Contenu
- Un outil d'assistance utile
- Actuellement en phase de test
Vidéos recommandées
Que gars de famille L'intrigue B ne présente que quelques ressemblances avec un nouveau projet réalisé par Intel et l'Université de Géorgie. Il s’agit néanmoins d’un modèle intrigant: un sac à dos intelligent capable d’aider son porteur à mieux naviguer dans un environnement donné sans problème, grâce au pouvoir de la parole.
Quel chercheur Jagadish Mahendran et l'équipe ont développé un sac à dos alimenté par l'IA et activé par la voix, conçu pour aider son porteur à percevoir le monde environnant. Pour ce faire, le sac à dos — qui pourrait être particulièrement utile comme alternative aux chiens-guides pour les utilisateurs malvoyants — utilise une caméra connectée et un sac banane (l'ancien porté dans une veste gilet, cette dernière contenant une batterie), couplé à une unité informatique pour pouvoir répondre aux commandes vocales en décrivant de manière audible le monde qui l'entoure porteur.
Cela signifie détecter des informations visuelles sur les panneaux de signalisation, les conditions de circulation, les changements d'altitude et les passages pour piétons, aux côtés des informations de localisation, puis pouvoir les transformer en descriptions orales utiles, transmises via Bluetooth écouteurs.
Un outil d'assistance utile
"L'idée de développer un système d'assistance visuelle basé sur l'IA m'est venue il y a huit ans, en 2013, pendant ma maîtrise", a déclaré Mahendran à Digital Trends. "Mais je ne pouvais pas faire beaucoup de progrès à l'époque pour plusieurs raisons: j'étais nouveau dans le domaine et l'apprentissage en profondeur n’était pas courant dans la vision par ordinateur. Cependant, la véritable inspiration m’est venue l’année dernière lorsque j’ai rencontré mon ami malvoyant. Alors qu’elle expliquait ses défis quotidiens, j’ai été frappé par cette ironie: la perception et l’IA ingénieur Cela fait des années que j'enseigne aux robots à voir, alors qu'il y a des gens qui ne voient pas. Cela m’a motivé à utiliser mon expertise et à construire un système de perception qui peut aider.
Le système contient une technologie impressionnante, notamment un Luxonis OAK-D spatial A.I. caméra qui exploite le kit d’intelligence artificielle avec profondeur d’OpenCV, alimenté par Intel. Il est capable d'exécuter des réseaux neuronaux avancés d'apprentissage profond, tout en fournissant également des fonctionnalités de vision par ordinateur de haut niveau, avec une carte de profondeur en temps réel, des informations sur les couleurs, etc.
« Le succès du projet réside dans le fait que nous sommes capables d’exécuter de nombreux systèmes d’IA complexes. modèles sur une configuration qui a un facteur de forme simple et petit et est rentable, grâce au kit de caméra OAK-D alimenté par le Movidius VPU d'Intel, un A.I. puce, avec le logiciel Intel OpenVINO », Mahendran dit. "Outre l'IA, j'ai utilisé plusieurs technologies telles que le GPS, le traitement des nuages de points et la reconnaissance vocale."
Actuellement en phase de test
Comme pour tout appareil portable, un grand défi consiste à en faire quelque chose que les gens voudraient réellement porter. Personne ne veut ressembler à un cyborg de science-fiction en dehors du Comic-Con.
Heureusement, l’IA de Mahendran. le gilet fonctionne bien sous ces paramètres. Il est conforme aux normes de ce que Mark Weiser, informaticien de Xerox PARC, a déclaré être nécessaire à l’informatique omniprésente: passer au second plan sans attirer l’attention sur lui-même. Les composants sont tous cachés, même la caméra (qui, de par sa conception, doit être visible) afin d'enregistrer les images nécessaires) regardant le monde à travers trois petits trous dans le gilet.
"Le système est simple, portable et discret afin que l'utilisateur ne reçoive pas inutilement l'attention des autres piétons", a déclaré Mahendran.
Actuellement, le projet est en phase de test. « J'ai fait les premiers [tests moi-même] dans le centre-ville de Monrovia, en Californie », a déclaré Mahendran. « Le système est robuste et peut fonctionner en temps réel. »
Mahendran a noté qu'en plus de détecter les obstacles extérieurs, allant des vélos aux arbres en surplomb, branches - cela peut également être utile pour les environnements intérieurs, tels que la détection des portes d'armoires de cuisine non fermées et du comme. À l’avenir, il espère que les citoyens qui ont besoin d’un tel outil pourront l’essayer eux-mêmes.
"Nous avons déjà formé une équipe appelée Mira, qui est un groupe de bénévoles d'horizons divers, y compris des personnes malvoyantes », a déclaré Mahendran. «Nous développons davantage le projet avec pour mission de fournir une solution open source d'IA. système d'assistance visuelle basé gratuitement. Nous sommes actuellement en train de collecter des fonds pour notre première phase de tests.
Recommandations des rédacteurs
- Les illusions d'optique pourraient nous aider à construire la prochaine génération d'IA
- Lisez les « écritures synthétiques » étrangement belles d’un IA. qui pense que c'est Dieu
- L'IA qui détecte les émotions est là, et cela pourrait être lors de votre prochain entretien d'embauche
- Les scientifiques utilisent l’IA. créer un code génétique humain artificiel
- Dans la guerre qui s’intensifie rapidement entre les deepfakes et les détecteurs de deepfakes
Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.