5 sposobów, w jakie przyszła sztuczna inteligencja asystenci przeniosą technologię głosową na wyższy poziom

Od czasu debiutu Siri na iPhonie 4s w 2011 roku asystenci głosowi przekształcili się z niepraktycznego chwytu w podstawę technologii inteligentnych głośników, którą można znaleźć w jednym na sześć amerykańskich domów.

Zawartość

Więcej wiedzy, mniej problemów
Większa (i lepsza) personalizacja
Stawanie się proaktywnym
Wszystko zależy od informacji zwrotnej
Nowe metody interakcji

„Kiedy mówiłem o [tym, co robię] przed Siri, moje spojrzenia były puste” – Tom Hebner, szef ds. innowacji w firmie Komunikacja Nuance, która opracowuje najnowocześniejsze rozwiązania AI. technologii głosowej, powiedział Digital Trends. „Ludzie powiedzieliby: «Czy budujesz te okropne systemy telefoniczne?». Nienawidzę cię”. To była jedyna grupa ludzi, która miała kontakt z technologią głosową.

Polecane filmy

Dzisiaj już tak nie jest. Według prognoz eMarketera, prawie 100 milionów smartfon użytkownicy będą korzystać z asystentów głosowych do roku 2020. Ale podczas gdy A.I. Asystenci nie są już nowością, wciąż jesteśmy na początku ich ewolucji. Przed nimi długa droga, zanim w pełni spełnią obietnicę, jaką niosą asystenci głosowi jako kategoria produktów.

Oto pięć sposobów, w jakie można ulepszyć technologię, aby uczynić ją inteligentniejszą i wydajniejszą, a w rezultacie pomóc nam prowadzić bardziej produktywne życie. Nazwij je „prognozami” lub „listą życzeń”. Oto wyzwania, które należy rozwiązać.

Więcej wiedzy, mniej problemów

Aleksa może powiedzieć Ci, jaka jest pogoda w Kuala Lumpur w Malezji; łączną liczbę dolarów amerykańskich, które otrzymasz za 720 randów południowoafrykańskich, i jak się pisze „destamentarianizm”. Ale konsumencka sztuczna inteligencja asystenci są w istocie cyfrowym odpowiednikiem osoby posiadającej pełny zestaw aktualnych informacji encyklopedie. Otrzymujesz (miejmy nadzieję) właściwe informacje, ale nie ma tam profesjonalnego poziomu wiedzy specjalistycznej.

„Wyzwanie stojące przed systemami w Twoim domu polega na tym, że próbują wykonać tak szeroki zakres zadań” – Hebner powiedział Digital Trends.

Rozwiązanie tego problemu jest trudne, ale rozwiązanie tego mogłoby zmienić zasady gry. Firma Nuance opracowuje wiele specjalistycznych systemów przeznaczonych do jednego konkretnego zastosowania, np. pomagania klientom linii lotniczych w odpowiadaniu na zapytania lub pomaganiu lekarzom w sporządzaniu notatek. Takie postępowanie oznacza nie tylko, że systemy te mogą drążyć temat w celu uzyskania bardziej szczegółowych informacji, ale także oznacza, że można w nich wykorzystać więcej inteligencji. „Ludzie byli bardzo podekscytowani komputerami, które potrafią rozumieć słowa, ale nie musi to mieć znaczenia, jeśli nie wiesz, co zrobić z tymi słowami” – powiedział Hebner.

Jednym z przykładów, jaki podaje, jest system Nuance, który nie tylko rozumie, kiedy lekarze czytają pacjentom listę potencjalnych leków, ale może także wskazać potencjalne konflikty. To znacznie wykracza poza możliwości większości sztucznej inteligencji klasy użytkownika. asystenci.

Jednak posiadanie bardziej specjalistycznej, szczegółowej wiedzy z różnych dziedzin — coś zasugerowane przez Alexę Skills – może mieć charakter przemieniający. Proszenie inteligentnego głośnika o poradę prawną lub medyczną na pierwszy rzut oka wydaje się szalone. Ale były niezwykłe postępy w dziedzinach takich jak legalne boty, natomiast niedawno opublikowany raport sugeruje, że Apple chce, aby Siri mogła to mieć rozmowy z użytkownikami na temat zdrowia do 2021 r.

Wykresy wiedzy specjalistycznej dla A.I. asystenci to obecnie marzenie science-fiction, chociaż: najnowszy raport Voicebot.ai pokazuje, jak szybko rozwijają się umiejętności wirtualnych asystentów. Kiedy jednak umiejętności przeniosą się do obszaru specjalizacji, czeka nas nie lada gratka!

Większa (i lepsza) personalizacja

Personalizacja współczesnych inteligentnych głośników jest wciąż w powijakach. Możesz zmienić akcent i płeć asystentów głosowych, dodać lub usunąć umiejętności, a także przekazać mu fragmenty informacji, takie jak imię i nazwisko oraz miejsce pracy. W niektórych przypadkach można skonfigurować wiele profili głosowych Strona główna Google rozpozna poszczególnych członków Twojego gospodarstwa domowego.

Ale przed nami jeszcze długa droga – choć sok powinien być wart wyciśnięcia. Mattersight Corporation opracowała sztuczną inteligencję. technologia call center, tzw Predykcyjne wyznaczanie tras behawioralnych, który analizuje wzorce mowy rozmówców i dopasowuje ich do pracowników o zgodnych typach osobowości. Według firmy dopasowanie osoby o zgodnej osobowości spowoduje, że udana rozmowa będzie trwała tylko o połowę krócej niż w przypadku osoby o sprzecznym typie osobowości.

Zastosowanie podobnego podejścia może spowodować, że sztuczna inteligencja będzie asystenci, którzy zwracają się do Ciebie w sposób, w jaki lubisz, gdy się do Ciebie zwracają. Może to być coś tak prostego, jak dopasowanie akcentu i głośności głosu osoby, z którą rozmawia. Może też zmienić sposób, w jaki odnosi się do pomysłów, być może w przypadku niektórych użytkowników używając bardziej emocjonalnych słów w porównaniu z bardziej szczegółowymi informacjami, których mógłby użyć w przypadku innych. Być może niektórzy chcą, aby asystent głosowy mógł długo rozmawiać, a inni chcą po prostu, aby przekazał niezbędne informacje w możliwie zwięzły sposób. sztuczna inteligencja asystenci powinni umieć jedno i drugie.

Technologie takie jak Dupleks Google’a pokaż, jak przekonująco dokładne stają się syntetyczne głosy i rozmowy generowane przez sztuczną inteligencję. W miarę jak sztuczna inteligencja wkracza w obszary bardziej złożone niż przesyłanie próśb o piosenki i liczniki czasu na jedzenie, należy spodziewać się, że ta technologia odegra główną rolę.

Pomóc w tym mogą przełomowe rozwiązania w zakresie możliwości identyfikacji użytkowników za pomocą głosu. Hebner zauważa, że technologia Nuance może identyfikować użytkowników na podstawie zaledwie jednej sekundy dźwięku. „Kiedyś potrzeba było 10 sekund, aby zrozumieć, kim jesteś i uzyskać dokładny sygnał” – powiedział. „Siła tego jest znacząca.” Możliwość identyfikacji użytkowników na podstawie małego fragmentu głosu rozwiązuje problem problem z hasłem i otwiera możliwość korzystania z asystentów głosowych w celu uzyskania bardziej delikatnych informacji poufnych Informacja.

Stawanie się proaktywnym

Dobry asystent zrobi coś, gdy go o to poprosisz. Świetny asystent nie będzie musiał prosić. W tej chwili A.I. asystenci są wciąż na tym pierwszym etapie. Użytkownicy mogą otrzymać żądany utwór lub przypomnienie, którego potrzebują, ale zazwyczaj tylko wtedy, gdy zostanie o to wyraźnie poproszony. W miarę jak ludzie poczują się coraz bardziej komfortowo z asystentami głosowymi, pojawi się dla nich ogromna szansa, aby wyjść poza urządzenia czysto reaktywne i stać się urządzeniami proaktywnymi.

Pojawiają się poważne pytania dotyczące tego, czy ludzie chcą przekazywać pewne zadania maszynom.

Jak byś się czuł w związku ze sztuczną inteligencją? asystent podejmujący decyzje w Twoim imieniu? Może to być wszystko – na przykład podkręcenie termostatu, gdy ktoś mówi, że jest mu zimno, lub zmiana rezerwacji lunchu spotykasz się z powodu spóźnienia, po nakłanianie Cię do dalszych ćwiczeń lub lepszego oszczędzania wypłata. W miarę jak coraz więcej inteligentnych urządzeń będzie pojawiać się w domach, liczba czynności, którymi może sterować asystent głosowy, znacznie wzrośnie.

Częścią tego jest pytanie społeczne dotyczące tego, jak dobrze czują się ludzie, gdy maszyny podejmują decyzje za nich. Pojawiają się poważne pytania dotyczące tego, czy ludzie chcą przekazywać pewne zadania maszynom. Pomyśl o tym jak o oddaniu swojej karty kredytowej i kluczy do domu swojemu asystentowi z krwi i kości – tylko ze znacznie większą domieszką Skynetu. Wadą jest utrata pewnej kontroli. Potencjalną zaletą jest zwiększenie Twojego wolnego czasu. Oczywiście istnieje duże wyzwanie techniczne…

Wszystko zależy od informacji zwrotnej

Tom Hebner zwrócił uwagę na duże wyzwanie związane z proaktywnością: skąd nasze maszyny wiedzą, że robią dobrze? Wracając do idei dobra vs. świetny asystent, świetny asystent może udostępnić wszystkie Twoje pliki przed ważnym spotkaniem, bez konieczności proszenia. Ale co, jeśli są to niewłaściwe pliki? Duży problem z tworzeniem domowej sztucznej inteligencji. asystenci są bardziej proaktywni, jest to, że obecnie istnieją ograniczone możliwości sprawdzenia, czy otrzymujemy właściwe informacje.

sztuczna inteligencja to dobry pieprz, robot — Tomohiro Ohsumi/Getty Images

„Jeśli codziennie, kiedy wchodzę do domu, proszę o tę samą piosenkę, a potem pewnego dnia wchodzę i ona po prostu zaczyna grać, skąd mają wiedzieć, że dobrze ją zrobili?” powiedział Hebner. „Jeśli nie przestanę grać, czy to oznacza, że jest to słuszne? Jeśli powiem „przestań”, czy to oznacza, że się pomylił i nie powinien tego nigdy więcej robić? Mechanizm sprzężenia zwrotnego jest jednym z powodów, dla których nie otrzymujesz bardziej proaktywnych systemów.

Rozwiązanie tego problemu jest trudne dla inżynierów. Każdy, kto kiedykolwiek spotkał stażystę proszącego go o instrukcje i informacje zwrotne na temat każdego zadania, wie, że czasami łatwiej jest wykonać pracę samodzielnie, niż ją delegować. sztuczna inteligencja asystent jest po to, aby uczynić Twoje życie bardziej bezproblemowym; nie po to, aby codziennie wysyłać Ci dziesiątki miniankiet w celu potwierdzenia, czy dobrze wykonało swoje zadanie. Należy to rozwiązać w sposób, który nie pogarsza przyjazności obsługi tych urządzeń i nie wymaga wielu wcześniejszych szkoleń, zanim systemy nauczą się Twoich preferencji.

Jaka jest odpowiedź? Nie jestem pewny. Jednak, jak powiedział kiedyś Steve Jobs, zadaniem klienta nie jest rozwiązywanie problemów.

Nowe metody interakcji

Jest tam scena 2001: Odyseja kosmiczna w którym morderczy HAL 9000, niepokojąco wciąż najsłynniejsza fikcyjna sztuczna inteligencja A.I. asystent w historii, ujawnia, że nie używa mikrofonów tylko do sprawdzania, co się do niego mówi. Kiedy dwóch członków załogi próbuje wybrać miejsce do rozmowy, w którym wiedzą, że HAL nie słyszy, HAL odkrywa, że nadal ich rozumie, na podstawie odczytania ruchu ich warg.

Straszny moment filmu? Jasne. Przykład tego, jak A.I. asystenci mogliby pracować w przyszłości? Jasne!

Pomysł, że asystenci głosowi powinni ograniczać się do głosu, zmniejsza liczbę możliwych sposobów, w jakie mogliby z nami współdziałać. Wraz ze wzrostem rozpoznawanie twarzy I technologie śledzenia emocji, stale rosnąca liczba danych biometrycznych gromadzonych na temat użytkowników, a nawet możliwość technologia czytania w myślach na horyzoncieistnieje wiele różnych sygnałów, które mogą zostać wykorzystane przez sztuczną inteligencję. asystentów, aby wyciągnąć wnioski.

Pomysł, że za 10 lat do sterowania sztuczną inteligencją będziemy używać wyłącznie głosu. asystentów to jak patrzenie na komputery osobiste z początku lat 80. i myślenie, że nigdy nie będziemy mieli do dyspozycji nic poza klawiaturą.

Zalecenia redaktorów

Sztuczna inteligencja wyczuwająca emocje już tu jest i może pojawić się podczas Twojej następnej rozmowy kwalifikacyjnej
Nowy kampus Apple w Seattle może oznaczać wielkie rzeczy dla Siri – sztuczną inteligencję
Google znalazło sposób na wykorzystanie sztucznej inteligencji zwiększyć użyteczność energii wiatrowej

5 sposobów, w jakie przyszła sztuczna inteligencja asystenci przeniosą technologię głosową na wyższy poziom

Więcej wiedzy, mniej problemów

Większa (i lepsza) personalizacja

Stawanie się proaktywnym

Wszystko zależy od informacji zwrotnej

Nowe metody interakcji

Zalecenia redaktorów

Kategorie

Niedawny

Jestem już sprzedany na wspólne polowanie na dinozaury Exoprimal

Najlepsze tytuły dostępne wyłącznie na Xbox w 2022 roku: 6 świetnych gier z Game Pass

Jak kreskówki Gwiezdnych Wojen sprawiają, że programy telewizyjne są jeszcze lepsze