Az új IBM Speech Tech célja, hogy emberfeletti legyen

IBM van bemutatta az Embedded ViaVoice 4.4-et, amely szabad formájú parancsfelismerést, menet közbeni fordítási és feliratozási szolgáltatásokat kínál, és azt állíthatja, hogy megérti a beszélt angol nyelv egyes árnyalatait. A technológiát úgy tervezték, hogy lehetővé tegye a felhasználók számára a járművekbe, kézi eszközökbe és más, nem számítógépbe ágyazott rendszerek vezérlését. alkalmazások, amelyek rugalmasan és természetesen beszélhetnek az eszközökhöz anélkül, hogy meg kellene jegyezni és gondosan kiejteni előre meghatározott beszédet parancsokat.

A „szabad formájú parancsfelismerés” példájaként az IBM felajánlja, hogy az autóban lévő rádióállomást 104,3 FM-re módosíthatja, így a felhasználók mondjon ki különféle parancsokat, például „Váltás 104.3-ra”, „Hangolás 104.3 FM-re” vagy „Állítsa be a rádióállomást 104.3-ra”. A rendszer engedélyezése Az intuitív parancsok szélesebb körének megértése lehetővé teszi, hogy a hangfelismerő technológiát a hangfelismerő technológia szélesebb körében sikeresebben használják alkalmazások. A ViaVoice a parancsok statisztikai és szemantikai elemzését használja az előre meghatározott, memorizált halmazon kívüli parancsok értelmezésére, és a továbbfejlesztett akusztikus modellezés nagyobb pontosságot biztosít zajos körülmények között, és ahol a beszédet tranziens megszakítja zajok.

Ajánlott videók

Két másik beszédfelismerő projekt az IBM-nél, a MASTOR és a Tales két érdekes új irányt kínál a beszédkutatáshoz. MESTER (Multilingual Automatic Speech-to-Speech Translator), egy IBM kutatási projekt, amely dinamikusan tudja lefordítani az angol beszédet mandarin kínaira. A felhasználó angolul beszél a mikrofonba, a MASTOR pedig menet közben lefordítja a mondatot mandarinra. A MASTOR a beszélt bemenet statisztikai elemzését használja, és először a mondatot strukturális halmazra bontja és fogalmi mintákat, majd ezek alapján lefordított mondatot állítunk össze a célnyelven minták. Némi késleltetés elkerülhetetlen az ilyen rendszerekben

Szerkesztői ajánlások

  • A legjobb beszéd-szöveg szoftver 2022-ben
  • A medvék arcfelismerő technológiájának célja az emberek biztonságának megőrzése
  • Az IBM a továbbiakban nem fejleszt és nem kutat arcfelismerő technológiát

Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.