5 วิธีในอนาคต A.I. ผู้ช่วยจะยกระดับเทคโนโลยีเสียงไปอีกระดับ

นับตั้งแต่ Siri เปิดตัวบน iPhone 4s เมื่อปี 2011 ระบบสั่งงานด้วยเสียงได้เปลี่ยนจากกลไกที่ไม่สามารถใช้งานได้ไปสู่พื้นฐานของเทคโนโลยีลำโพงอัจฉริยะที่พบในบ้าน 1 ใน 6 ของชาวอเมริกัน

สารบัญ

โม'ความรู้ ปัญหาน้อย
การปรับเปลี่ยนในแบบของคุณมากขึ้น (และดีขึ้น)
เริ่มเชิงรุก
มันคือทั้งหมดที่เกี่ยวกับคำติชม
วิธีการโต้ตอบใหม่

“ก่อน Siri เมื่อฉันพูดถึง [สิ่งที่ฉันทำ] มีแต่สายตาว่างเปล่า” Tom Hebner หัวหน้าฝ่ายนวัตกรรมของ แตกต่างกันนิดหน่อยการสื่อสารซึ่งพัฒนา A.I. อันล้ำสมัย เทคโนโลยีเสียงบอกกับ Digital Trends “ผู้คนจะพูดว่า ‘คุณสร้างระบบโทรศัพท์ที่น่ากลัวเหล่านั้นเหรอ? ฉันเกลียดคุณ' นั่นเป็นเพียงกลุ่มเดียวที่ผู้คนโต้ตอบกับเทคโนโลยีเสียง”

วิดีโอแนะนำ

วันนี้ไม่เป็นเช่นนั้นอีกต่อไป ตามการคาดการณ์ของ eMarketerเกือบ 100 ล้าน สมาร์ทโฟน ผู้ใช้จะใช้ผู้ช่วยเสียงภายในปี 2563 แต่ในขณะที่ A.I. ผู้ช่วยไม่ใช่สิ่งแปลกใหม่อีกต่อไป เรายังอยู่ในช่วงเริ่มต้นของวิวัฒนาการ หนทางยังอีกยาวไกลก่อนที่พวกเขาจะปฏิบัติตามสัญญาที่ผู้ช่วยด้านเสียงมีไว้เป็นหมวดหมู่ผลิตภัณฑ์

ต่อไปนี้เป็นห้าวิธีที่เทคโนโลยีสามารถปรับปรุงเพื่อให้ฉลาดขึ้นและมีประสิทธิภาพมากขึ้น และช่วยให้เรามีชีวิตที่มีประสิทธิผลมากขึ้นด้วยผลที่ตามมา เรียกสิ่งเหล่านั้นว่า "การคาดการณ์" หรือ "สิ่งที่ปรารถนา" สิ่งเหล่านี้คือความท้าทายที่ต้องแก้ไข

โม'ความรู้ ปัญหาน้อย

อเล็กซา สามารถบอกคุณได้ว่าสภาพอากาศในกรุงกัวลาลัมเปอร์ ประเทศมาเลเซียเป็นอย่างไร จำนวนดอลลาร์สหรัฐทั้งหมดที่คุณจะได้รับจาก 720 แรนด์แอฟริกาใต้ และวิธีสะกดคำว่า “disestablishmentarianism” แต่ เอไอผู้บริโภค โดยพื้นฐานแล้วผู้ช่วยคือสิ่งที่เทียบเท่าทางดิจิทัลของบุคคลที่มีความทันสมัยครบถ้วน สารานุกรม คุณได้รับ (หวังว่า) ข้อมูลที่ถูกต้อง แต่ไม่มีความเชี่ยวชาญระดับโปรที่นั่น

“ความท้าทายที่ระบบในบ้านของคุณมีคือมีหลายสิ่งที่พวกเขาพยายามทำ” Hebner กล่าวกับ Digital Trends

นี่เป็นเรื่องยากที่จะแก้ไข แต่การทำเช่นนั้นจะเป็นตัวเปลี่ยนเกม Nuance พัฒนาระบบผู้เชี่ยวชาญจำนวนมากที่มุ่งเป้าไปที่กรณีการใช้งานเฉพาะด้านเดียว เช่น ช่วยให้ลูกค้าสายการบินตอบคำถามหรือแพทย์จดบันทึก การทำเช่นนี้ไม่เพียงแต่หมายความว่าระบบเหล่านี้สามารถเจาะลึกเพื่อรับข้อมูลที่มีรายละเอียดมากขึ้นเท่านั้น แต่ยังหมายความว่าสามารถรวบรวมข้อมูลอัจฉริยะได้มากขึ้นอีกด้วย “ผู้คนรู้สึกตื่นเต้นมากเกี่ยวกับคอมพิวเตอร์ที่สามารถเข้าใจคำศัพท์ได้ แต่นั่นก็ไม่จำเป็นเสมอไปหากคุณไม่รู้ว่าจะทำอย่างไรกับคำเหล่านั้น” Hebner กล่าว

ตัวอย่างหนึ่งที่เขายกให้คือระบบ Nuance ที่ไม่เพียงแต่เข้าใจเมื่อแพทย์อ่านรายการยาที่อาจใช้สำหรับผู้ป่วยเท่านั้น แต่ยังสามารถบอกถึงข้อขัดแย้งที่อาจเกิดขึ้นได้อีกด้วย นี่เป็นสิ่งที่เกินความสามารถของ A.I ระดับผู้ใช้ส่วนใหญ่ ผู้ช่วย

อย่างไรก็ตาม การมีความรู้โดยละเอียดโดยผู้เชี่ยวชาญมากขึ้นเกี่ยวกับโดเมนต่างๆ — บางอย่าง บอกใบ้โดย Alexa Skills - สามารถเปลี่ยนแปลงได้ การขอคำแนะนำด้านกฎหมายหรือทางการแพทย์จากลำโพงอัจฉริยะของคุณฟังดูบ้าไปเลย แต่ก็มีอยู่ ความก้าวหน้าที่ไม่ธรรมดาในด้านต่างๆ เช่น บอททางกฎหมายในขณะที่รายงานที่เผยแพร่เมื่อเร็วๆ นี้ระบุว่า Apple ต้องการให้ Siri มี การสนทนาที่เน้นด้านสุขภาพกับผู้ใช้ภายในปี 2564.

กราฟความรู้เฉพาะทางสำหรับ A.I. ผู้ช่วยเป็นสิ่งที่อยู่ในความฝันของไซไฟในขณะนี้แม้ว่าก รายงาน Voicebot.ai ล่าสุด แสดงให้เห็นว่าชุดทักษะของผู้ช่วยเสมือนมีการขยายตัวอย่างรวดเร็วเพียงใด เมื่อทักษะเคลื่อนเข้าสู่ภูมิประเทศของความเชี่ยวชาญพิเศษ เราจะต้องได้รับการดูแลอย่างดี!

การปรับเปลี่ยนในแบบของคุณมากขึ้น (และดีขึ้น)

การปรับแต่งลำโพงอัจฉริยะในปัจจุบันยังอยู่ในช่วงเริ่มต้น คุณสามารถเปลี่ยนสำเนียงของผู้ช่วยเสียงและการนำเสนอเพศ เพิ่มหรือลบทักษะ และป้อนข้อมูลเล็กๆ น้อยๆ เช่น ชื่อและสถานที่ทำงานของคุณ ในบางกรณี คุณสามารถตั้งค่าโปรไฟล์เสียงหลายโปรไฟล์ได้ หน้าแรกของ Google จะจดจำสมาชิกแต่ละคนในครัวเรือนของคุณ

แต่เส้นทางยังอีกยาวไกล แม้ว่าน้ำผลไม้ควรจะคุ้มค่ากับการบีบก็ตาม Mattersight Corporation ได้พัฒนา A.I. เทคโนโลยีคอลเซ็นเตอร์ที่เรียกว่า การกำหนดเส้นทางพฤติกรรมเชิงคาดการณ์ซึ่งวิเคราะห์รูปแบบคำพูดของผู้โทรและจับคู่ผู้ปฏิบัติงานด้วยประเภทบุคลิกภาพที่เข้ากันได้ จากข้อมูลของบริษัท การจับคู่บุคคลที่มีบุคลิกที่เข้ากันได้จะส่งผลให้การโทรสำเร็จโดยใช้เวลาเพียงครึ่งเดียว ถัดจากบุคคลที่มีบุคลิกภาพขัดแย้งกัน

การใช้แนวทางที่คล้ายกันอาจส่งผลให้ A.I. ผู้ช่วยที่พูดกลับกับคุณในแบบที่คุณต้องการให้ตอบ นั่นอาจเป็นอะไรง่ายๆ เช่น จับคู่สำเนียงและระดับเสียงของบุคคลที่พวกเขากำลังพูดด้วย หรืออาจเปลี่ยนวิธีจัดการกับแนวคิดต่างๆ โดยอาจใช้คำที่สื่ออารมณ์มากขึ้นสำหรับผู้ใช้บางราย เมื่อเทียบกับข้อมูลที่มีรายละเอียดหนาแน่นมากขึ้นที่สามารถนำมาใช้กับผู้อื่นได้ บางทีบางคนอาจต้องการให้ผู้ช่วยแบบเสียงสนทนาในระยะเวลาอันยาวนาน ในขณะที่บางคนอาจต้องการเพียงผู้ช่วยในการถ่ายทอดข้อมูลที่จำเป็นในลักษณะที่กระชับที่สุดเท่าที่จะเป็นไปได้ AI. ผู้ช่วยควรจะมีความสามารถทั้งสองอย่าง

เทคโนโลยีเช่น กูเกิลดูเพล็กซ์ แสดงให้เห็นว่าเสียงและบทสนทนาสังเคราะห์ที่ A.I. สร้างขึ้นนั้นแม่นยำเพียงใด เมื่อ A.I. เคลื่อนเข้าสู่พื้นที่ที่ซับซ้อนกว่าการขอเพลงและจับเวลาอาหาร คาดหวังว่าเทคโนโลยีนี้จะมีบทบาทสำคัญ

สิ่งนี้อาจได้รับความช่วยเหลือจากความก้าวหน้าในความสามารถในการระบุผู้ใช้ด้วยเสียง Hebner ตั้งข้อสังเกตว่าเทคโนโลยีของ Nuance สามารถระบุผู้ใช้จากเสียงเพียงเสี้ยววินาทีเดียว “เคยใช้เวลา 10 วินาทีในการทำความเข้าใจว่าคุณเป็นใคร เพื่อรับสัญญาณที่แม่นยำ” เขากล่าว “พลังนั้นสำคัญมาก” ความสามารถในการระบุผู้ใช้ด้วยตัวอย่างเสียงเล็กๆ น้อยๆ ช่วยแก้ปัญหาได้ ปัญหารหัสผ่านและเปิดโอกาสให้ใช้ผู้ช่วยเสียงเพื่อความลับที่ละเอียดอ่อนยิ่งขึ้น ข้อมูล.

เริ่มเชิงรุก

ผู้ช่วยที่ดีจะทำอะไรบางอย่างเมื่อคุณขอให้ทำ ผู้ช่วยที่ดีไม่จำเป็นต้องถาม ตอนนี้ A.I. ผู้ช่วยยังอยู่ในขั้นตอนแรกนี้ ผู้ใช้สามารถรับเพลงที่ต้องการหรือการแจ้งเตือนที่ต้องการได้ แต่โดยทั่วไปแล้วเมื่อมีการร้องขออย่างชัดเจนเท่านั้น เมื่อผู้คนคุ้นเคยกับผู้ช่วยด้านเสียงมากขึ้น จึงเป็นโอกาสอันดีสำหรับพวกเขาที่จะก้าวไปไกลกว่าการเป็นอุปกรณ์ที่มีปฏิกิริยาโต้ตอบล้วนๆ ไปสู่อุปกรณ์เชิงรุก

มีคำถามสำคัญๆ เกี่ยวกับว่าผู้คนต้องการส่งมอบงานบางอย่างให้กับเครื่องจักรหรือไม่

คุณจะรู้สึกอย่างไรเกี่ยวกับ A.I. ผู้ช่วยตัดสินใจแทนคุณ? สิ่งเหล่านี้อาจเป็นอะไรก็ได้ตั้งแต่การสตาร์ทเครื่องควบคุมอุณหภูมิเมื่อมีคนบอกว่าอากาศหนาวหรือจองอาหารกลางวันใหม่ ประชุมเพราะคุณมาสาย เพื่อกระตุ้นให้คุณออกกำลังกายมากขึ้น หรือประหยัดเงินได้ดีขึ้น เช็คเงินเดือน เมื่อมีอุปกรณ์อัจฉริยะเข้ามาในบ้านมากขึ้นเรื่อยๆ จำนวนสิ่งที่ผู้ช่วยด้านเสียงสามารถสั่งการได้ก็จะเพิ่มขึ้นอย่างมาก

ส่วนหนึ่งคือคำถามทางสังคมเกี่ยวกับความสะดวกสบายของผู้คนเกี่ยวกับเครื่องจักรในการตัดสินใจในส่วนของตน มีคำถามสำคัญๆ เกี่ยวกับว่าผู้คนต้องการส่งมอบงานบางอย่างให้กับเครื่องจักรหรือไม่ ลองคิดดูว่ามันเหมือนกับการมอบบัตรเครดิตและกุญแจบ้านให้กับผู้ช่วยทั้งเนื้อและเลือดของคุณ — เพียงแต่มอบ Skynet ที่ใหญ่กว่ามากเท่านั้น ข้อเสียคือการละทิ้งการควบคุมจำนวนหนึ่ง ข้อดีที่อาจเกิดขึ้นคือการเพิ่มเวลาว่างของคุณ แน่นอนว่ายังมีความท้าทายทางเทคนิคครั้งใหญ่...

มันคือทั้งหมดที่เกี่ยวกับคำติชม

Tom Hebner ชี้ให้เห็นถึงความท้าทายครั้งใหญ่ในประเด็นเชิงรุก: เครื่องจักรของเราจะรู้ได้อย่างไรว่าทำถูกต้องแล้ว? กลับมาที่แนวคิดเรื่องความดี vs. ผู้ช่วยที่ดี ผู้ช่วยที่ดีอาจจะเก็บไฟล์ทั้งหมดของคุณไว้ล่วงหน้าก่อนการประชุมใหญ่ โดยที่คุณไม่ต้องถาม แต่ถ้าเป็นไฟล์ผิดล่ะ? ปัญหาใหญ่ในการทำ A.I. ที่บ้าน ผู้ช่วยที่ทำงานเชิงรุกมากขึ้นคือปัจจุบันมีวิธีการเปิดเผยที่จำกัดว่าเราได้รับข้อมูลนั้นเป็นข้อมูลที่ถูกต้องหรือไม่

AI. เป็นพริกไทยที่ดีของหุ่นยนต์ — รูปภาพโทโมฮิโระโอสุมิ / Getty

“ถ้าฉันขอเพลงเดิมทุกวันตอนที่เดินเข้าไปในบ้าน แล้ววันที่ฉันเดินเข้าไปแล้วเพลงนั้นเริ่มเล่น พวกเขาจะรู้ได้อย่างไรว่าทำถูก” เฮบเนอร์กล่าวว่า “ถ้าฉันไม่หยุดเล่น นั่นหมายความว่ามันถูกใช่ไหม? ถ้าฉันพูดว่า 'หยุด' นั่นหมายความว่ามันผิดและไม่ควรทำอีกเลยใช่หรือไม่ กลไกการตอบรับเป็นเหตุผลหนึ่งที่คุณไม่ได้รับระบบเชิงรุกมากขึ้น”

นี่เป็นเรื่องท้าทายสำหรับวิศวกรที่จะเข้าใจ ใครก็ตามที่เคยมีเด็กฝึกงานมาขอคำแนะนำและขอความคิดเห็นเกี่ยวกับงานทุกๆ งานจะรู้ดีว่าบางครั้งการทำงานด้วยตัวเองยังง่ายกว่าการมอบหมายงาน เอไอ ผู้ช่วยอยู่ที่นั่นเพื่อทำให้ชีวิตของคุณราบรื่นยิ่งขึ้น ไม่ให้แบบสำรวจเล็กๆ น้อยๆ มากมายให้คุณในแต่ละวันเพื่อยืนยันว่ามันทำงานถูกต้องหรือไม่ สิ่งนี้จะต้องได้รับการแก้ไขในลักษณะที่ไม่ทำให้อุปกรณ์เหล่านี้เป็นมิตรกับผู้ใช้ และไม่จำเป็นต้องได้รับการฝึกอบรมล่วงหน้ามากมายก่อนที่ระบบจะเรียนรู้การตั้งค่าของคุณ

คำตอบคืออะไร? ฉันไม่แน่ใจ. แต่อย่างที่ Steve Jobs เคยกล่าวไว้ ไม่ใช่หน้าที่ของลูกค้าที่จะคิดออก

วิธีการโต้ตอบใหม่

มีฉากใน 2001: อะสเปซโอดิสซีย์ ซึ่ง HAL 9000 นักฆ่าที่ยังคงเป็น A.I. ที่โด่งดังที่สุดอย่างน่าตะลึง ผู้ช่วยในประวัติศาสตร์เผยว่าไม่ได้ใช้ไมโครโฟนเพื่อตัดสินว่ากำลังพูดอะไรอยู่เท่านั้น เมื่อลูกเรือสองคนพยายามเลือกสถานที่ที่จะพูดโดยที่พวกเขารู้ว่า HAL ไม่ได้ยิน HAL ก็เปิดเผยว่าเขายังคงเข้าใจพวกเขาได้ จากการอ่านการเคลื่อนไหวของริมฝีปาก.

ช่วงเวลาที่น่ากลัวของหนังเรื่องนี้? แน่นอน. ตัวอย่างวิธีการ A.I. ผู้ช่วยสามารถทำงานได้ในอนาคต? อืม แน่นอน!

แนวคิดที่ว่าผู้ช่วยเสียงควรถูกจำกัดให้ใช้แค่เสียงจะช่วยลดจำนวนวิธีที่พวกเขาสามารถโต้ตอบที่เป็นประโยชน์กับเราได้ ด้วยการเพิ่มขึ้นของ การจดจำใบหน้า และ เทคโนโลยีการติดตามอารมณ์จำนวนไบโอเมตริกซ์ที่เพิ่มมากขึ้นเรื่อยๆ รวบรวมเกี่ยวกับผู้ใช้อย่างต่อเนื่อง และแม้กระทั่งความเป็นไปได้ของ เทคโนโลยีการอ่านใจบนขอบฟ้ามีสัญญาณต่างๆ มากมายที่ A.I. สามารถใช้ ผู้ช่วยในการสรุปผล

แนวคิดที่ว่า 10 ปีต่อจากนี้ เราจะใช้เพียงเสียงเพื่อควบคุมเอไอเหล่านี้ ผู้ช่วยก็เหมือนกับการดูพีซีในช่วงต้นทศวรรษ 1980 และคิดว่าเราจะไม่มีคีย์บอร์ดให้เลือกใช้อีกแล้ว

คำแนะนำของบรรณาธิการ

A.I. การตรวจจับอารมณ์ มาแล้ว และอาจอยู่ในการสัมภาษณ์งานครั้งถัดไปของคุณ
วิทยาเขตซีแอตเทิลแห่งใหม่ของ Apple อาจมีความหมายที่ยิ่งใหญ่สำหรับ Siri หรือปัญญาประดิษฐ์
Google พบวิธีใช้ A.I. เพื่อเพิ่มคุณประโยชน์ของพลังงานลม

5 วิธีในอนาคต A.I. ผู้ช่วยจะยกระดับเทคโนโลยีเสียงไปอีกระดับ

โม'ความรู้ ปัญหาน้อย

การปรับเปลี่ยนในแบบของคุณมากขึ้น (และดีขึ้น)

เริ่มเชิงรุก

มันคือทั้งหมดที่เกี่ยวกับคำติชม

วิธีการโต้ตอบใหม่

คำแนะนำของบรรณาธิการ

หมวดหมู่

ล่าสุด

Lenovo Tab Extreme มาถึงงาน CES 2023 เพื่อแข่งขันกับ iPad Pro

การลอกเลียนแบบ AirTag ของ Google นั้นน่าทึ่งมากและนั่นทำให้ฉันกลัว

สหภาพยุโรปกำลังสร้าง iPhone เครื่องถัดไปของคุณ คงจะไม่เป็นไร