นับตั้งแต่ Siri เปิดตัวบน iPhone 4s เมื่อปี 2011 ระบบสั่งงานด้วยเสียงได้เปลี่ยนจากกลไกที่ไม่สามารถใช้งานได้ไปสู่พื้นฐานของเทคโนโลยีลำโพงอัจฉริยะที่พบในบ้าน 1 ใน 6 ของชาวอเมริกัน
สารบัญ
- โม'ความรู้ ปัญหาน้อย
- การปรับเปลี่ยนในแบบของคุณมากขึ้น (และดีขึ้น)
- เริ่มเชิงรุก
- มันคือทั้งหมดที่เกี่ยวกับคำติชม
- วิธีการโต้ตอบใหม่
“ก่อน Siri เมื่อฉันพูดถึง [สิ่งที่ฉันทำ] มีแต่สายตาว่างเปล่า” Tom Hebner หัวหน้าฝ่ายนวัตกรรมของ แตกต่างกันนิดหน่อยการสื่อสารซึ่งพัฒนา A.I. อันล้ำสมัย เทคโนโลยีเสียงบอกกับ Digital Trends “ผู้คนจะพูดว่า ‘คุณสร้างระบบโทรศัพท์ที่น่ากลัวเหล่านั้นเหรอ? ฉันเกลียดคุณ' นั่นเป็นเพียงกลุ่มเดียวที่ผู้คนโต้ตอบกับเทคโนโลยีเสียง”
วิดีโอแนะนำ
วันนี้ไม่เป็นเช่นนั้นอีกต่อไป ตามการคาดการณ์ของ eMarketerเกือบ 100 ล้าน สมาร์ทโฟน ผู้ใช้จะใช้ผู้ช่วยเสียงภายในปี 2563 แต่ในขณะที่ A.I. ผู้ช่วยไม่ใช่สิ่งแปลกใหม่อีกต่อไป เรายังอยู่ในช่วงเริ่มต้นของวิวัฒนาการ หนทางยังอีกยาวไกลก่อนที่พวกเขาจะปฏิบัติตามสัญญาที่ผู้ช่วยด้านเสียงมีไว้เป็นหมวดหมู่ผลิตภัณฑ์
ต่อไปนี้เป็นห้าวิธีที่เทคโนโลยีสามารถปรับปรุงเพื่อให้ฉลาดขึ้นและมีประสิทธิภาพมากขึ้น และช่วยให้เรามีชีวิตที่มีประสิทธิผลมากขึ้นด้วยผลที่ตามมา เรียกสิ่งเหล่านั้นว่า "การคาดการณ์" หรือ "สิ่งที่ปรารถนา" สิ่งเหล่านี้คือความท้าทายที่ต้องแก้ไข
โม'ความรู้ ปัญหาน้อย
อเล็กซา สามารถบอกคุณได้ว่าสภาพอากาศในกรุงกัวลาลัมเปอร์ ประเทศมาเลเซียเป็นอย่างไร จำนวนดอลลาร์สหรัฐทั้งหมดที่คุณจะได้รับจาก 720 แรนด์แอฟริกาใต้ และวิธีสะกดคำว่า “disestablishmentarianism” แต่ เอไอผู้บริโภค โดยพื้นฐานแล้วผู้ช่วยคือสิ่งที่เทียบเท่าทางดิจิทัลของบุคคลที่มีความทันสมัยครบถ้วน สารานุกรม คุณได้รับ (หวังว่า) ข้อมูลที่ถูกต้อง แต่ไม่มีความเชี่ยวชาญระดับโปรที่นั่น
“ความท้าทายที่ระบบในบ้านของคุณมีคือมีหลายสิ่งที่พวกเขาพยายามทำ” Hebner กล่าวกับ Digital Trends
นี่เป็นเรื่องยากที่จะแก้ไข แต่การทำเช่นนั้นจะเป็นตัวเปลี่ยนเกม Nuance พัฒนาระบบผู้เชี่ยวชาญจำนวนมากที่มุ่งเป้าไปที่กรณีการใช้งานเฉพาะด้านเดียว เช่น ช่วยให้ลูกค้าสายการบินตอบคำถามหรือแพทย์จดบันทึก การทำเช่นนี้ไม่เพียงแต่หมายความว่าระบบเหล่านี้สามารถเจาะลึกเพื่อรับข้อมูลที่มีรายละเอียดมากขึ้นเท่านั้น แต่ยังหมายความว่าสามารถรวบรวมข้อมูลอัจฉริยะได้มากขึ้นอีกด้วย “ผู้คนรู้สึกตื่นเต้นมากเกี่ยวกับคอมพิวเตอร์ที่สามารถเข้าใจคำศัพท์ได้ แต่นั่นก็ไม่จำเป็นเสมอไปหากคุณไม่รู้ว่าจะทำอย่างไรกับคำเหล่านั้น” Hebner กล่าว
ตัวอย่างหนึ่งที่เขายกให้คือระบบ Nuance ที่ไม่เพียงแต่เข้าใจเมื่อแพทย์อ่านรายการยาที่อาจใช้สำหรับผู้ป่วยเท่านั้น แต่ยังสามารถบอกถึงข้อขัดแย้งที่อาจเกิดขึ้นได้อีกด้วย นี่เป็นสิ่งที่เกินความสามารถของ A.I ระดับผู้ใช้ส่วนใหญ่ ผู้ช่วย
อย่างไรก็ตาม การมีความรู้โดยละเอียดโดยผู้เชี่ยวชาญมากขึ้นเกี่ยวกับโดเมนต่างๆ — บางอย่าง บอกใบ้โดย Alexa Skills - สามารถเปลี่ยนแปลงได้ การขอคำแนะนำด้านกฎหมายหรือทางการแพทย์จากลำโพงอัจฉริยะของคุณฟังดูบ้าไปเลย แต่ก็มีอยู่ ความก้าวหน้าที่ไม่ธรรมดาในด้านต่างๆ เช่น บอททางกฎหมายในขณะที่รายงานที่เผยแพร่เมื่อเร็วๆ นี้ระบุว่า Apple ต้องการให้ Siri มี การสนทนาที่เน้นด้านสุขภาพกับผู้ใช้ภายในปี 2564.
กราฟความรู้เฉพาะทางสำหรับ A.I. ผู้ช่วยเป็นสิ่งที่อยู่ในความฝันของไซไฟในขณะนี้แม้ว่าก รายงาน Voicebot.ai ล่าสุด แสดงให้เห็นว่าชุดทักษะของผู้ช่วยเสมือนมีการขยายตัวอย่างรวดเร็วเพียงใด เมื่อทักษะเคลื่อนเข้าสู่ภูมิประเทศของความเชี่ยวชาญพิเศษ เราจะต้องได้รับการดูแลอย่างดี!
การปรับเปลี่ยนในแบบของคุณมากขึ้น (และดีขึ้น)
การปรับแต่งลำโพงอัจฉริยะในปัจจุบันยังอยู่ในช่วงเริ่มต้น คุณสามารถเปลี่ยนสำเนียงของผู้ช่วยเสียงและการนำเสนอเพศ เพิ่มหรือลบทักษะ และป้อนข้อมูลเล็กๆ น้อยๆ เช่น ชื่อและสถานที่ทำงานของคุณ ในบางกรณี คุณสามารถตั้งค่าโปรไฟล์เสียงหลายโปรไฟล์ได้ หน้าแรกของ Google จะจดจำสมาชิกแต่ละคนในครัวเรือนของคุณ
แต่เส้นทางยังอีกยาวไกล แม้ว่าน้ำผลไม้ควรจะคุ้มค่ากับการบีบก็ตาม Mattersight Corporation ได้พัฒนา A.I. เทคโนโลยีคอลเซ็นเตอร์ที่เรียกว่า การกำหนดเส้นทางพฤติกรรมเชิงคาดการณ์ซึ่งวิเคราะห์รูปแบบคำพูดของผู้โทรและจับคู่ผู้ปฏิบัติงานด้วยประเภทบุคลิกภาพที่เข้ากันได้ จากข้อมูลของบริษัท การจับคู่บุคคลที่มีบุคลิกที่เข้ากันได้จะส่งผลให้การโทรสำเร็จโดยใช้เวลาเพียงครึ่งเดียว ถัดจากบุคคลที่มีบุคลิกภาพขัดแย้งกัน
การใช้แนวทางที่คล้ายกันอาจส่งผลให้ A.I. ผู้ช่วยที่พูดกลับกับคุณในแบบที่คุณต้องการให้ตอบ นั่นอาจเป็นอะไรง่ายๆ เช่น จับคู่สำเนียงและระดับเสียงของบุคคลที่พวกเขากำลังพูดด้วย หรืออาจเปลี่ยนวิธีจัดการกับแนวคิดต่างๆ โดยอาจใช้คำที่สื่ออารมณ์มากขึ้นสำหรับผู้ใช้บางราย เมื่อเทียบกับข้อมูลที่มีรายละเอียดหนาแน่นมากขึ้นที่สามารถนำมาใช้กับผู้อื่นได้ บางทีบางคนอาจต้องการให้ผู้ช่วยแบบเสียงสนทนาในระยะเวลาอันยาวนาน ในขณะที่บางคนอาจต้องการเพียงผู้ช่วยในการถ่ายทอดข้อมูลที่จำเป็นในลักษณะที่กระชับที่สุดเท่าที่จะเป็นไปได้ AI. ผู้ช่วยควรจะมีความสามารถทั้งสองอย่าง
เทคโนโลยีเช่น กูเกิลดูเพล็กซ์ แสดงให้เห็นว่าเสียงและบทสนทนาสังเคราะห์ที่ A.I. สร้างขึ้นนั้นแม่นยำเพียงใด เมื่อ A.I. เคลื่อนเข้าสู่พื้นที่ที่ซับซ้อนกว่าการขอเพลงและจับเวลาอาหาร คาดหวังว่าเทคโนโลยีนี้จะมีบทบาทสำคัญ
สิ่งนี้อาจได้รับความช่วยเหลือจากความก้าวหน้าในความสามารถในการระบุผู้ใช้ด้วยเสียง Hebner ตั้งข้อสังเกตว่าเทคโนโลยีของ Nuance สามารถระบุผู้ใช้จากเสียงเพียงเสี้ยววินาทีเดียว “เคยใช้เวลา 10 วินาทีในการทำความเข้าใจว่าคุณเป็นใคร เพื่อรับสัญญาณที่แม่นยำ” เขากล่าว “พลังนั้นสำคัญมาก” ความสามารถในการระบุผู้ใช้ด้วยตัวอย่างเสียงเล็กๆ น้อยๆ ช่วยแก้ปัญหาได้ ปัญหารหัสผ่านและเปิดโอกาสให้ใช้ผู้ช่วยเสียงเพื่อความลับที่ละเอียดอ่อนยิ่งขึ้น ข้อมูล.
เริ่มเชิงรุก
ผู้ช่วยที่ดีจะทำอะไรบางอย่างเมื่อคุณขอให้ทำ ผู้ช่วยที่ดีไม่จำเป็นต้องถาม ตอนนี้ A.I. ผู้ช่วยยังอยู่ในขั้นตอนแรกนี้ ผู้ใช้สามารถรับเพลงที่ต้องการหรือการแจ้งเตือนที่ต้องการได้ แต่โดยทั่วไปแล้วเมื่อมีการร้องขออย่างชัดเจนเท่านั้น เมื่อผู้คนคุ้นเคยกับผู้ช่วยด้านเสียงมากขึ้น จึงเป็นโอกาสอันดีสำหรับพวกเขาที่จะก้าวไปไกลกว่าการเป็นอุปกรณ์ที่มีปฏิกิริยาโต้ตอบล้วนๆ ไปสู่อุปกรณ์เชิงรุก
มีคำถามสำคัญๆ เกี่ยวกับว่าผู้คนต้องการส่งมอบงานบางอย่างให้กับเครื่องจักรหรือไม่
คุณจะรู้สึกอย่างไรเกี่ยวกับ A.I. ผู้ช่วยตัดสินใจแทนคุณ? สิ่งเหล่านี้อาจเป็นอะไรก็ได้ตั้งแต่การสตาร์ทเครื่องควบคุมอุณหภูมิเมื่อมีคนบอกว่าอากาศหนาวหรือจองอาหารกลางวันใหม่ ประชุมเพราะคุณมาสาย เพื่อกระตุ้นให้คุณออกกำลังกายมากขึ้น หรือประหยัดเงินได้ดีขึ้น เช็คเงินเดือน เมื่อมีอุปกรณ์อัจฉริยะเข้ามาในบ้านมากขึ้นเรื่อยๆ จำนวนสิ่งที่ผู้ช่วยด้านเสียงสามารถสั่งการได้ก็จะเพิ่มขึ้นอย่างมาก
ส่วนหนึ่งคือคำถามทางสังคมเกี่ยวกับความสะดวกสบายของผู้คนเกี่ยวกับเครื่องจักรในการตัดสินใจในส่วนของตน มีคำถามสำคัญๆ เกี่ยวกับว่าผู้คนต้องการส่งมอบงานบางอย่างให้กับเครื่องจักรหรือไม่ ลองคิดดูว่ามันเหมือนกับการมอบบัตรเครดิตและกุญแจบ้านให้กับผู้ช่วยทั้งเนื้อและเลือดของคุณ — เพียงแต่มอบ Skynet ที่ใหญ่กว่ามากเท่านั้น ข้อเสียคือการละทิ้งการควบคุมจำนวนหนึ่ง ข้อดีที่อาจเกิดขึ้นคือการเพิ่มเวลาว่างของคุณ แน่นอนว่ายังมีความท้าทายทางเทคนิคครั้งใหญ่...
มันคือทั้งหมดที่เกี่ยวกับคำติชม
Tom Hebner ชี้ให้เห็นถึงความท้าทายครั้งใหญ่ในประเด็นเชิงรุก: เครื่องจักรของเราจะรู้ได้อย่างไรว่าทำถูกต้องแล้ว? กลับมาที่แนวคิดเรื่องความดี vs. ผู้ช่วยที่ดี ผู้ช่วยที่ดีอาจจะเก็บไฟล์ทั้งหมดของคุณไว้ล่วงหน้าก่อนการประชุมใหญ่ โดยที่คุณไม่ต้องถาม แต่ถ้าเป็นไฟล์ผิดล่ะ? ปัญหาใหญ่ในการทำ A.I. ที่บ้าน ผู้ช่วยที่ทำงานเชิงรุกมากขึ้นคือปัจจุบันมีวิธีการเปิดเผยที่จำกัดว่าเราได้รับข้อมูลนั้นเป็นข้อมูลที่ถูกต้องหรือไม่
“ถ้าฉันขอเพลงเดิมทุกวันตอนที่เดินเข้าไปในบ้าน แล้ววันที่ฉันเดินเข้าไปแล้วเพลงนั้นเริ่มเล่น พวกเขาจะรู้ได้อย่างไรว่าทำถูก” เฮบเนอร์กล่าวว่า “ถ้าฉันไม่หยุดเล่น นั่นหมายความว่ามันถูกใช่ไหม? ถ้าฉันพูดว่า 'หยุด' นั่นหมายความว่ามันผิดและไม่ควรทำอีกเลยใช่หรือไม่ กลไกการตอบรับเป็นเหตุผลหนึ่งที่คุณไม่ได้รับระบบเชิงรุกมากขึ้น”
นี่เป็นเรื่องท้าทายสำหรับวิศวกรที่จะเข้าใจ ใครก็ตามที่เคยมีเด็กฝึกงานมาขอคำแนะนำและขอความคิดเห็นเกี่ยวกับงานทุกๆ งานจะรู้ดีว่าบางครั้งการทำงานด้วยตัวเองยังง่ายกว่าการมอบหมายงาน เอไอ ผู้ช่วยอยู่ที่นั่นเพื่อทำให้ชีวิตของคุณราบรื่นยิ่งขึ้น ไม่ให้แบบสำรวจเล็กๆ น้อยๆ มากมายให้คุณในแต่ละวันเพื่อยืนยันว่ามันทำงานถูกต้องหรือไม่ สิ่งนี้จะต้องได้รับการแก้ไขในลักษณะที่ไม่ทำให้อุปกรณ์เหล่านี้เป็นมิตรกับผู้ใช้ และไม่จำเป็นต้องได้รับการฝึกอบรมล่วงหน้ามากมายก่อนที่ระบบจะเรียนรู้การตั้งค่าของคุณ
คำตอบคืออะไร? ฉันไม่แน่ใจ. แต่อย่างที่ Steve Jobs เคยกล่าวไว้ ไม่ใช่หน้าที่ของลูกค้าที่จะคิดออก
วิธีการโต้ตอบใหม่
มีฉากใน 2001: อะสเปซโอดิสซีย์ ซึ่ง HAL 9000 นักฆ่าที่ยังคงเป็น A.I. ที่โด่งดังที่สุดอย่างน่าตะลึง ผู้ช่วยในประวัติศาสตร์เผยว่าไม่ได้ใช้ไมโครโฟนเพื่อตัดสินว่ากำลังพูดอะไรอยู่เท่านั้น เมื่อลูกเรือสองคนพยายามเลือกสถานที่ที่จะพูดโดยที่พวกเขารู้ว่า HAL ไม่ได้ยิน HAL ก็เปิดเผยว่าเขายังคงเข้าใจพวกเขาได้ จากการอ่านการเคลื่อนไหวของริมฝีปาก.
ช่วงเวลาที่น่ากลัวของหนังเรื่องนี้? แน่นอน. ตัวอย่างวิธีการ A.I. ผู้ช่วยสามารถทำงานได้ในอนาคต? อืม แน่นอน!
แนวคิดที่ว่าผู้ช่วยเสียงควรถูกจำกัดให้ใช้แค่เสียงจะช่วยลดจำนวนวิธีที่พวกเขาสามารถโต้ตอบที่เป็นประโยชน์กับเราได้ ด้วยการเพิ่มขึ้นของ การจดจำใบหน้า และ เทคโนโลยีการติดตามอารมณ์จำนวนไบโอเมตริกซ์ที่เพิ่มมากขึ้นเรื่อยๆ รวบรวมเกี่ยวกับผู้ใช้อย่างต่อเนื่อง และแม้กระทั่งความเป็นไปได้ของ เทคโนโลยีการอ่านใจบนขอบฟ้ามีสัญญาณต่างๆ มากมายที่ A.I. สามารถใช้ ผู้ช่วยในการสรุปผล
แนวคิดที่ว่า 10 ปีต่อจากนี้ เราจะใช้เพียงเสียงเพื่อควบคุมเอไอเหล่านี้ ผู้ช่วยก็เหมือนกับการดูพีซีในช่วงต้นทศวรรษ 1980 และคิดว่าเราจะไม่มีคีย์บอร์ดให้เลือกใช้อีกแล้ว
คำแนะนำของบรรณาธิการ
- A.I. การตรวจจับอารมณ์ มาแล้ว และอาจอยู่ในการสัมภาษณ์งานครั้งถัดไปของคุณ
- วิทยาเขตซีแอตเทิลแห่งใหม่ของ Apple อาจมีความหมายที่ยิ่งใหญ่สำหรับ Siri หรือปัญญาประดิษฐ์
- Google พบวิธีใช้ A.I. เพื่อเพิ่มคุณประโยชน์ของพลังงานลม