เสียงสังเคราะห์เช่นเสียงที่ Siri และ Alexa ใช้นั้นใช้ได้ดีในการบอกพยากรณ์อากาศในแต่ละวันหรืออย่างไร เหลือเวลาอีกไม่กี่นาทีในการจับเวลาการทำอาหาร แต่คุณอยากให้เสียงเรียบๆ จำเจของมันอ่านใจคุณจริงๆ หรือเปล่า หนังสือเสียง? อาจไม่ใช่ ซึ่งเป็นเหตุผลว่าทำไมพวกเราส่วนใหญ่จึงหันมาใช้บริการที่พูดด้วยเสียงของมนุษย์ เช่น Audible เพื่อรับการแก้ไขหนังสือเสียงของเรา นักพากย์เสียงมนุษย์อาจไม่ได้รับการยอมรับอีกต่อไป เนื่องจากผลงานบุกเบิกของสตาร์ทอัพในลอนดอนชื่อ ดีพเซน.
การใช้อัลกอริธึมปัญญาประดิษฐ์เสริมด้วยอำนาจการยิงทางเทคโนโลยีของ Power A.I. ของไอบีเอ็ม และเทคโนโลยีวัตสันDeepZen ได้พัฒนาเครื่องมือแปลงข้อความเป็นคำพูดที่ไม่เพียงแต่ฟังดูเป็นมนุษย์ตั้งแต่ฟังครั้งแรกเท่านั้น แต่ยังสามารถรับสัญญาณทางอารมณ์ที่จำเป็นสำหรับการอ่านข้อความในลักษณะที่น่าสนใจอีกด้วย ในการทำเช่นนั้น บริษัทอ้างว่าสามารถลดเวลาและต้นทุนในการผลิตหนังสือเสียงได้มากถึง 90%
วิดีโอแนะนำ
“ระบบของเราเป็นการปฏิวัติอย่างแท้จริง” Taylan Kamis ซีอีโอและผู้ร่วมก่อตั้ง DeepZen กล่าวกับ Digital Trends “มันทำงานโดยใช้การเรียนรู้เชิงลึกและโครงข่ายประสาทเทียมเพื่อทำความเข้าใจว่ามนุษย์พูดและอ่านอย่างไร จากนั้นเราจะฝึกระบบเพื่อให้สามารถจดจำตำแหน่งที่จะใช้อารมณ์และน้ำเสียงที่ถูกต้องเมื่ออ่านข้อความ ผลลัพธ์ที่ได้คือคำพูดที่เหมือนมนุษย์ซึ่งใกล้เคียงกับของจริงมาก”
ที่เกี่ยวข้อง
- ภาพลวงตาสามารถช่วยให้เราสร้าง AI รุ่นต่อไปได้
- สัมผัสสุดท้าย: วิธีที่นักวิทยาศาสตร์ให้ประสาทสัมผัสสัมผัสเหมือนมนุษย์กับหุ่นยนต์
- อ่าน 'พระคัมภีร์สังเคราะห์' ที่สวยงามน่าขนลุกของ A.I. ที่คิดว่าเป็นพระเจ้า
หลีกเลี่ยงไม่ได้ที่งานแบบนี้จะกลายเป็นอีกตัวอย่างหนึ่งของ A.I ที่ล้ำสมัย เครื่องมือ คุกคามอาชีพของมนุษย์. ในกรณีนี้ อาชีพนั้นเกี่ยวข้องกับนักแสดงที่ถึงแม้ว่าบุคคลที่มีชื่อเสียงเพียงไม่กี่คนจะประสบความสำเร็จได้ แต่ก็ไม่มีอาชีพที่มั่นคงและมั่นคงเท่าที่เป็นอยู่ คงจะไร้เดียงสาหากคิดว่าซอฟต์แวร์เช่นนี้จะไม่ส่งผลกระทบต่ออนาคตของนักพากย์ แต่เนื่องจาก Kamis ชี้ให้เห็นว่ามีสถานการณ์มากมายที่เครื่องมือเช่น DeepZen อาจเป็นผลบวกสุทธิ มนุษยชาติ.
ตัวอย่างเช่น อาจทำให้สามารถสร้างหนังสือเสียงจากผลงานของนักเขียนหน้าใหม่และนักเขียนหน้าใหม่ หรือจากผู้จัดพิมพ์ที่ไม่มีงบประมาณจำนวนมาก นอกจากนี้ยังสามารถใช้เพื่อช่วยพัฒนาเครื่องมือการอ่านออกเสียงข้อความที่เหนือชั้นสำหรับผู้ที่มีความบกพร่องในการอ่านหรือมีปัญหาในการอ่านอีกด้วย
“สำหรับอนาคต เรายังมองหาการผลิตเสียงพากย์สำหรับอุตสาหกรรมการผลิตวิดีโอด้วย เช่นเดียวกับการเล่นเกมที่จำเป็นต้องมีการอ่านออกเสียงข้อความแบบเรียลไทม์เพื่อยกระดับประสบการณ์ของผู้เล่น” คามิ พูดว่า. “เรากำลังดูภาษาอื่นด้วย”
สามารถตรวจสอบตัวอย่างระบบได้ ที่นี่.
คำแนะนำของบรรณาธิการ
- หุ่นยนต์รักษาความปลอดภัยอาจมาที่โรงเรียนใกล้บ้านคุณ
- เราจะรู้ได้อย่างไรว่า AI มีความรู้สึกจริง ๆ แล้ว?
- อะนาล็อกเอไอ? ฟังดูบ้าบอ แต่อาจจะเป็นอนาคตก็ได้
- อนาคตของ A.I.: 4 เรื่องสำคัญที่ต้องจับตามองในอีกไม่กี่ปีข้างหน้า
- เทคโนโลยีนี้เป็นนิยายวิทยาศาสตร์เมื่อ 20 ปีที่แล้ว ตอนนี้มันเป็นความจริงแล้ว
อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร