คำพูดสังเคราะห์ที่สมจริงนี้อาจเป็นอนาคตของหนังสือเสียง

เสียงสังเคราะห์เช่นเสียงที่ Siri และ Alexa ใช้นั้นใช้ได้ดีในการบอกพยากรณ์อากาศในแต่ละวันหรืออย่างไร เหลือเวลาอีกไม่กี่นาทีในการจับเวลาการทำอาหาร แต่คุณอยากให้เสียงเรียบๆ จำเจของมันอ่านใจคุณจริงๆ หรือเปล่า หนังสือเสียง? อาจไม่ใช่ ซึ่งเป็นเหตุผลว่าทำไมพวกเราส่วนใหญ่จึงหันมาใช้บริการที่พูดด้วยเสียงของมนุษย์ เช่น Audible เพื่อรับการแก้ไขหนังสือเสียงของเรา นักพากย์เสียงมนุษย์อาจไม่ได้รับการยอมรับอีกต่อไป เนื่องจากผลงานบุกเบิกของสตาร์ทอัพในลอนดอนชื่อ ดีพเซน.

การใช้อัลกอริธึมปัญญาประดิษฐ์เสริมด้วยอำนาจการยิงทางเทคโนโลยีของ Power A.I. ของไอบีเอ็ม และเทคโนโลยีวัตสันDeepZen ได้พัฒนาเครื่องมือแปลงข้อความเป็นคำพูดที่ไม่เพียงแต่ฟังดูเป็นมนุษย์ตั้งแต่ฟังครั้งแรกเท่านั้น แต่ยังสามารถรับสัญญาณทางอารมณ์ที่จำเป็นสำหรับการอ่านข้อความในลักษณะที่น่าสนใจอีกด้วย ในการทำเช่นนั้น บริษัทอ้างว่าสามารถลดเวลาและต้นทุนในการผลิตหนังสือเสียงได้มากถึง 90%

วิดีโอแนะนำ

“ระบบของเราเป็นการปฏิวัติอย่างแท้จริง” Taylan Kamis ซีอีโอและผู้ร่วมก่อตั้ง DeepZen กล่าวกับ Digital Trends “มันทำงานโดยใช้การเรียนรู้เชิงลึกและโครงข่ายประสาทเทียมเพื่อทำความเข้าใจว่ามนุษย์พูดและอ่านอย่างไร จากนั้นเราจะฝึกระบบเพื่อให้สามารถจดจำตำแหน่งที่จะใช้อารมณ์และน้ำเสียงที่ถูกต้องเมื่ออ่านข้อความ ผลลัพธ์ที่ได้คือคำพูดที่เหมือนมนุษย์ซึ่งใกล้เคียงกับของจริงมาก”

ที่เกี่ยวข้อง

  • ภาพลวงตาสามารถช่วยให้เราสร้าง AI รุ่นต่อไปได้
  • สัมผัสสุดท้าย: วิธีที่นักวิทยาศาสตร์ให้ประสาทสัมผัสสัมผัสเหมือนมนุษย์กับหุ่นยนต์
  • อ่าน 'พระคัมภีร์สังเคราะห์' ที่สวยงามน่าขนลุกของ A.I. ที่คิดว่าเป็นพระเจ้า

หลีกเลี่ยงไม่ได้ที่งานแบบนี้จะกลายเป็นอีกตัวอย่างหนึ่งของ A.I ที่ล้ำสมัย เครื่องมือ คุกคามอาชีพของมนุษย์. ในกรณีนี้ อาชีพนั้นเกี่ยวข้องกับนักแสดงที่ถึงแม้ว่าบุคคลที่มีชื่อเสียงเพียงไม่กี่คนจะประสบความสำเร็จได้ แต่ก็ไม่มีอาชีพที่มั่นคงและมั่นคงเท่าที่เป็นอยู่ คงจะไร้เดียงสาหากคิดว่าซอฟต์แวร์เช่นนี้จะไม่ส่งผลกระทบต่ออนาคตของนักพากย์ แต่เนื่องจาก Kamis ชี้ให้เห็นว่ามีสถานการณ์มากมายที่เครื่องมือเช่น DeepZen อาจเป็นผลบวกสุทธิ มนุษยชาติ.

ตัวอย่างเช่น อาจทำให้สามารถสร้างหนังสือเสียงจากผลงานของนักเขียนหน้าใหม่และนักเขียนหน้าใหม่ หรือจากผู้จัดพิมพ์ที่ไม่มีงบประมาณจำนวนมาก นอกจากนี้ยังสามารถใช้เพื่อช่วยพัฒนาเครื่องมือการอ่านออกเสียงข้อความที่เหนือชั้นสำหรับผู้ที่มีความบกพร่องในการอ่านหรือมีปัญหาในการอ่านอีกด้วย

“สำหรับอนาคต เรายังมองหาการผลิตเสียงพากย์สำหรับอุตสาหกรรมการผลิตวิดีโอด้วย เช่นเดียวกับการเล่นเกมที่จำเป็นต้องมีการอ่านออกเสียงข้อความแบบเรียลไทม์เพื่อยกระดับประสบการณ์ของผู้เล่น” คามิ พูดว่า. “เรากำลังดูภาษาอื่นด้วย”

สามารถตรวจสอบตัวอย่างระบบได้ ที่นี่.

คำแนะนำของบรรณาธิการ

  • หุ่นยนต์รักษาความปลอดภัยอาจมาที่โรงเรียนใกล้บ้านคุณ
  • เราจะรู้ได้อย่างไรว่า AI มีความรู้สึกจริง ๆ แล้ว?
  • อะนาล็อกเอไอ? ฟังดูบ้าบอ แต่อาจจะเป็นอนาคตก็ได้
  • อนาคตของ A.I.: 4 เรื่องสำคัญที่ต้องจับตามองในอีกไม่กี่ปีข้างหน้า
  • เทคโนโลยีนี้เป็นนิยายวิทยาศาสตร์เมื่อ 20 ปีที่แล้ว ตอนนี้มันเป็นความจริงแล้ว

อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร

หมวดหมู่

ล่าสุด

โดรนส่งพัสดุในเขตเมืองครั้งแรกในการทดสอบอย่างเป็นทางการ

โดรนส่งพัสดุในเขตเมืองครั้งแรกในการทดสอบอย่างเป็นทางการ

เจ้าชู้วันที่สินค้าที่คุณสั่งซื้อมาถึงโดยคอปเตอ...

ทีวีซีรีส์ Supergirl เพิ่ม Lynda Carter จาก Wonder Woman

ทีวีซีรีส์ Supergirl เพิ่ม Lynda Carter จาก Wonder Woman

วอร์เนอร์บราเธอร์ส โทรทัศน์ที่ ซูเปอร์เกิร์ล ละ...

Palmer Luckey Hand ส่งมอบ Oculus Rift ตัวแรก

Palmer Luckey Hand ส่งมอบ Oculus Rift ตัวแรก

ในที่สุด Oculus Rift ก็มาถึงแล้ว ที่ไหนสักแห่งใ...