Ny IBM Speech Tech siktar på att vara övermänsklig

IBM har avtäckte Embedded ViaVoice 4.4, som erbjuder friformskommandoigenkänning, direktöversättning och textningstjänster, och kan göra anspråk på att förstå vissa nyanser av talad engelska. Tekniken är utformad för att göra det möjligt för användare att styra system inbyggda i fordon, handhållna enheter och andra icke-datorer applikationer för att prata flexibelt och naturligt till enheter utan att behöva memorera och noggrant uttalad fördefinierad talad kommandon.

Som ett exempel på "freeform command recognition" erbjuder IBM att ett kommando för att ändra en radiostation i en bil till 104,3 FM, användare kan tala olika kommandon som "Ändra till 104.3", "Ställ in på 104.3 FM" eller "Ställ in radiostationen på 104.3". Aktivera systemet att förstå ett större utbud av intuitiva kommandon gör att röstigenkänningstekniken kan användas mer framgångsrikt i ett bredare utbud av applikationer. ViaVoice använder nu statistisk och semantisk analys av kommandon för att tolka kommandon utanför en fördefinierad, memorerad uppsättning, och förbättrad akustisk modellering ger större noggrannhet i bullriga förhållanden och där tal avbryts av transient ljud.

Rekommenderade videor

Två andra taligenkänningsprojekt hos IBM, MASTOR och Tales, erbjuder två spännande nya riktningar för talforskning. MASTOR (Multilingual Automatic Speech-to-Speech Translator), ett IBM-forskningsprojekt, kan dynamiskt översätta engelska tal till mandarinkinesiska. En användare talar i en mikrofon på engelska, och MASTOR översätter meningen till mandarin i farten. MASTOR använder statistisk analys av den talade inmatningen, först dekompilerar meningen till en uppsättning strukturella och konceptuella mönster, och sedan kompilera en översatt mening på målspråket med desamma mönster. Viss latens är oundviklig i system som detta

Redaktörens rekommendationer

  • Den bästa programvaran för tal-till-text för 2022
  • Ansiktsigenkänningsteknik för björnar syftar till att hålla människor säkra
  • IBM kommer inte längre att utveckla eller forska om teknik för ansiktsigenkänning

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.