AI นี้สามารถปลอมแปลงเสียงของคุณได้ภายในเวลาเพียงสามวินาที

ปัญญาประดิษฐ์ (AI) คือ มีช่วงเวลาหนึ่งตอนนี้และลมยังคงพัดมาอย่างต่อเนื่องพร้อมกับข่าวที่ว่า Microsoft กำลังทำงานเกี่ยวกับ AI ที่สามารถเลียนแบบเสียงของใครก็ได้หลังจากป้อนตัวอย่างสั้นๆ สามวินาที

เครื่องมือใหม่นี้มีชื่อว่า VALL-E ได้รับการฝึกอบรมเกี่ยวกับข้อมูลเสียงในภาษาอังกฤษประมาณ 60,000 ชั่วโมง ซึ่งไมโครซอฟต์กล่าวว่า "มีขนาดใหญ่กว่าระบบที่มีอยู่หลายร้อยเท่า" ผู้สร้างอ้างว่าต้องใช้ความรู้เพียงเล็กน้อยในการป้อนข้อมูลเสียงเพื่อทำความเข้าใจวิธีจำลองเสียงของผู้ใช้

ผู้ชายกำลังพูดใส่โทรศัพท์ — ฟิซเคส/Shutterstock

ที่น่าประทับใจยิ่งกว่านั้นคือ VALL-E สามารถสร้างอารมณ์ โทนเสียงร้อง และสภาพแวดล้อมทางเสียงที่พบในแต่ละตัวอย่าง ซึ่งเป็นสิ่งที่โปรแกรม AI เสียงอื่นๆ ประสบปัญหา นั่นทำให้มีออร่าที่สมจริงยิ่งขึ้น และนำผลลัพธ์มาใกล้กับสิ่งที่สามารถถ่ายทอดได้ว่าเป็นคำพูดของมนุษย์อย่างแท้จริง

ที่เกี่ยวข้อง

GPT-4: วิธีใช้แชทบอท AI ที่ทำให้ ChatGPT อับอาย
Google Bard สามารถพูดได้แล้ว แต่จะทำให้ ChatGPT จมหายไปได้หรือไม่
บริษัท AI แห่งใหม่ของ Elon Musk ตั้งเป้าที่จะ 'เข้าใจจักรวาล'

เมื่อเปรียบเทียบกับคู่แข่งการอ่านออกเสียงข้อความ (TTS) อื่นๆ Microsoft กล่าวว่า VALL-E “มีประสิทธิภาพเหนือกว่าระบบ TTS แบบ Zero-shot ที่ล้ำสมัยอย่างมากในแง่ของคำพูด ความเป็นธรรมชาติและความคล้ายคลึงของผู้พูด” กล่าวอีกนัยหนึ่ง VALL-E ฟังดูคล้ายกับมนุษย์จริงๆ มากกว่า AI ของคู่แข่งที่ต้องเผชิญกับอินพุตเสียงที่ไม่ได้รับการฝึกฝน บน.

วิดีโอแนะนำ

บน GitHub นั้น Microsoft ได้สร้างไฟล์ ห้องสมุดตัวอย่างขนาดเล็ก สร้างโดยใช้ VALL-E ผลลัพธ์ที่ได้ส่วนใหญ่จะน่าประทับใจมาก โดยมีตัวอย่างจำนวนมากที่สร้างเสียงที่ไพเราะและสำเนียงของผู้พูด ตัวอย่างบางส่วนมีความน่าเชื่อถือน้อยกว่า โดยระบุว่า VALL-E อาจไม่ใช่ผลิตภัณฑ์สำเร็จรูป แต่ผลลัพธ์โดยรวมมีความน่าเชื่อถือ

ศักยภาพมหาศาล — และความเสี่ยง

บุคคลที่กำลังสนทนาทางวิดีโอบนอุปกรณ์ Microsoft Surface ที่ใช้ Windows 11 — ไมโครซอฟต์/อันสแปลช

ใน เอกสารแนะนำ VALL-E, Microsoft อธิบายว่า VALL-E “อาจมีความเสี่ยงในการใช้งานโมเดลในทางที่ผิด เช่น เสียงปลอมแปลง ระบุตัวตนหรือแอบอ้างเป็นวิทยากรคนใดคนหนึ่ง” เครื่องมือที่มีความสามารถดังกล่าวในการสร้างเสียงพูดที่ฟังดูสมจริง ปีศาจของ ของปลอมที่น่าเชื่อถือมากขึ้นเรื่อยๆซึ่งสามารถใช้เพื่อเลียนแบบอะไรก็ได้ตั้งแต่อดีตคู่รักที่โรแมนติกไปจนถึงบุคลิกที่โดดเด่นระดับนานาชาติ

เพื่อบรรเทาภัยคุกคามดังกล่าว Microsoft กล่าวว่า "เป็นไปได้ที่จะสร้างโมเดลการตรวจจับเพื่อแยกแยะว่าคลิปเสียงถูกสังเคราะห์โดย VALL-E หรือไม่" บริษัทบอกว่าจะใช้ของตัวเองด้วย หลักการของเอไอ เมื่อพัฒนางานแล้ว หลักการเหล่านั้นครอบคลุมถึงประเด็นต่างๆ เช่น ความเป็นธรรม ความปลอดภัย ความเป็นส่วนตัว และความรับผิดชอบ

VALL-E เป็นเพียงตัวอย่างล่าสุดของการทดลอง AI ของ Microsoft ล่าสุดทางบริษัทได้ดำเนินการเกี่ยวกับ บูรณาการ ChatGPT เข้ากับ Bingโดยใช้ AI เพื่อ สรุปการประชุม Teams ของคุณและการปลูกถ่ายเครื่องมือขั้นสูงลงในแอปเช่น Outlook, Word และ PowerPoint. และจากข้อมูลของ Semafor นั้น Microsoft กำลังมองหา ลงทุน 1 หมื่นล้านดอลลาร์ใน OpenAI ผู้สร้าง ChatGPTซึ่งเป็นบริษัทที่ได้ทุ่มเงินทุนจำนวนมากเข้าไปแล้ว

แม้จะมีความเสี่ยงที่ชัดเจน แต่เครื่องมืออย่าง VALL-E ก็อาจมีประโยชน์อย่างยิ่งในด้านการแพทย์ เป็นต้น เพื่อช่วยให้ผู้คนกลับมามีเสียงได้อีกครั้งหลังเกิดอุบัติเหตุ ความสามารถในการจำลองคำพูดด้วยชุดอินพุตขนาดเล็กเช่นนี้อาจเป็นประโยชน์อย่างยิ่งในสถานการณ์เหล่านี้ หากทำถูกต้อง แต่ด้วยเงินทั้งหมดที่ใช้ไปกับ AI ทั้งจาก Microsoft และบริษัทอื่น ๆ เห็นได้ชัดว่ามันจะไม่หายไปในเร็วๆ นี้

คำแนะนำของบรรณาธิการ

นักเขียนชั้นนำเรียกร้องเงินจากบริษัท AI เพื่อใช้งานของพวกเขา
เครื่องมือตัดต่อวิดีโอ AI ที่ดีที่สุด
OpenAI ผู้ผลิต ChatGPT เผชิญกับการสอบสวน FTC เกี่ยวกับกฎหมายคุ้มครองผู้บริโภค
นักวิทยาศาสตร์กล่าวว่าความก้าวหน้าของ AI อาจมาจากสมองของผึ้ง
OpenAI สร้างทีมใหม่เพื่อหยุดยั้ง AI อัจฉริยะที่โกง

อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร

AI นี้สามารถปลอมแปลงเสียงของคุณได้ภายในเวลาเพียงสามวินาที

ศักยภาพมหาศาล — และความเสี่ยง

คำแนะนำของบรรณาธิการ

หมวดหมู่

ล่าสุด

ชุดเติมน้ำมันเพื่อกลับสู่สูตร 1 ใน 2017

นักฟิสิกส์ค้นหาวิธีในการผลิตกราฟีนจำนวนมากในราคาถูก

ด้วยชื่ออื่น: Windows 10 build จะทิ้ง "Technical"