IBM heeft onthulde ingebedde ViaVoice 4.4, dat vrije commandoherkenning, on-the-fly vertaal- en ondertitelingsdiensten biedt, en kan beweren sommige nuances van gesproken Engels te begrijpen. De technologie is ontworpen om gebruikers in staat te stellen systemen te besturen die zijn ingebed in voertuigen, draagbare apparaten en andere niet-computers toepassingen om flexibel en natuurlijk met apparaten te spreken zonder vooraf gedefinieerd gesproken woord te hoeven onthouden en zorgvuldig uit te spreken opdrachten.
Als voorbeeld van ‘freeform command-herkenning’ biedt IBM aan dat gebruikers een commando kunnen gebruiken om een radiostation in een auto te veranderen naar 104.3 FM. spreek verschillende commando's uit, zoals "Wijzig naar 104.3", "Stem af op 104.3 FM" of "Stel het radiostation in op 104.3." Het systeem inschakelen Door een groter scala aan intuïtieve commando's te begrijpen, kan de spraakherkenningstechnologie met meer succes worden gebruikt in een breder scala van toepassingen. ViaVoice gebruikt nu statistische en semantische analyse van commando's om commando's te interpreteren buiten een vooraf gedefinieerde, opgeslagen set. en verbeterde akoestische modellering zorgt voor grotere nauwkeurigheid in rumoerige omstandigheden en waar spraak wordt onderbroken door transienten geluiden.
Aanbevolen video's
Twee andere spraakherkenningsprojecten bij IBM, MASTOR en Tales, bieden twee intrigerende nieuwe richtingen voor spraakonderzoek. MEESTER (Multilingual Automatic Speech-to-Speech Translator), een onderzoeksproject van IBM, kan Engelse spraak dynamisch vertalen naar het Mandarijn Chinees. Een gebruiker spreekt Engels in een microfoon en MASTOR vertaalt de zin direct in het Mandarijn. MASTOR maakt gebruik van statistische analyse van de gesproken invoer, waarbij de zin eerst wordt gedecompileerd in een reeks structurele zinnen en conceptuele patronen, en vervolgens een vertaalde zin in de doeltaal samenstellen met behulp van deze patronen. Enige latentie is onvermijdelijk in systemen als deze
Aanbevelingen van de redactie
- De beste spraak-naar-tekst-software voor 2022
- Gezichtsherkenningstechnologie voor beren is bedoeld om mensen te beschermen
- IBM zal niet langer gezichtsherkenningstechnologie ontwikkelen of onderzoeken
Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.