Nova IBM-ova govorna tehnologija želi biti nadčloveška

click fraud protection

IBM ima predstavil vgrajeni ViaVoice 4.4, ki ponuja prepoznavanje ukazov v prosti obliki, sprotno prevajanje in storitve podnaslavljanja ter lahko trdi, da razume nekatere nianse govorjene angleščine. Tehnologija je zasnovana tako, da uporabnikom omogoča nadzor sistemov, vgrajenih v vozila, ročne naprave in druge neračunalniške aplikacije za fleksibilen in naraven govor z napravami, ne da bi si morali zapomniti in skrbno izgovarjati vnaprej določene govorjene ukazi.

Kot primer »prepoznavanja ukazov v prosti obliki« IBM ponuja ukaz za spremembo radijske postaje v avtomobilu na 104,3 FM, uporabniki pa lahko izgovorite različne ukaze, kot so »Spremeni na 104,3«, »Nastavi na 104,3 FM« ali »Nastavi radijsko postajo na 104,3«. Omogočanje sistema za razumevanje večjega obsega intuitivnih ukazov bo omogočilo uspešnejšo uporabo tehnologije za prepoznavanje glasu v širšem obsegu aplikacije. ViaVoice zdaj uporablja statistično in semantično analizo ukazov za razlago ukazov zunaj vnaprej določenega, zapomnilnega niza, in izboljšano akustično modeliranje zagotavlja večjo natančnost v hrupnih razmerah in kjer je govor prekinjen zaradi prehodnega zvoki.

Priporočeni videoposnetki

Dva druga projekta prepoznavanja govora pri IBM-u, MASTOR in Tales, ponujata dve intrigantni novi smeri za raziskovanje govora. MASTOR (Multilingual Automatic Speech-to-Speech Translator), IBM-ov raziskovalni projekt, lahko dinamično prevaja angleški govor v mandarinsko kitajščino. Uporabnik govori v mikrofon v angleščini, MASTOR pa stavek sproti prevede v mandarinščino. MASTOR uporablja statistično analizo govorjenega vnosa, pri čemer stavek najprej dekompilira v niz strukturnih in konceptualne vzorce, nato pa sestavite preveden stavek v ciljnem jeziku z uporabo istih vzorcev. V sistemih, kot je ta, je nekaj zakasnitve neizogibno

Priporočila urednikov

  • Najboljša programska oprema za pretvorbo govora v besedilo za leto 2022
  • Tehnologija za prepoznavanje obrazov medvedov je namenjena zaščiti ljudi
  • IBM ne bo več razvijal ali raziskoval tehnologije prepoznavanja obraza

Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.