มี วิดีโอ ที่ปรากฏขึ้นเป็นระยะๆ บนฟีด YouTube ของฉัน เป็นการสนทนาระหว่างแร็ปเปอร์ Snoop Dogg และ 50 Cent คร่ำครวญถึงความจริงที่ว่า เมื่อเทียบกับรุ่นของพวกเขาแล้ว ศิลปินฮิปฮอปยุคใหม่ทุกคนก็ฟังดูเหมือนกัน “เมื่อบุคคลตัดสินใจที่จะเป็นตัวของตัวเอง พวกเขาจะเสนอสิ่งที่ไม่มีใครสามารถเป็นได้” 50 Cent กล่าว “ใช่แล้ว เพราะเมื่อคุณเป็นคุณแล้ว ใครจะเป็นคุณได้บ้างนอกจากคุณ” สนูปตอบกลับ
สารบัญ
- “เราสามารถนำกลับมาใช้ใหม่ได้มาก”
- ประชาชนจะมีปฏิกิริยาอย่างไร?
- คิดถึงอนาคต
Snoop Dogg เลียนแบบกระแสเสียงของแร็ปเปอร์ในปัจจุบัน
เมื่อวิดีโอถูกอัปโหลดในเดือนตุลาคม 2014 นั่นอาจเป็นเรื่องจริงในวงกว้าง แต่เพียงไม่กี่ปีต่อมามันก็ไม่ใช่อย่างแน่นอน ในโลกของการปลอมแปลงเสียง คุณสามารถฝึก A.I. ให้ฟังดูคล้ายกับบุคคลอื่นอย่างน่าขนลุกโดยป้อนคลังเสียงซึ่งประกอบด้วยข้อมูลคำพูดของพวกเขาหลายชั่วโมง ผลลัพธ์ก็คือ แม่นยำจนน่าตกใจ.
วิดีโอแนะนำ
บุคคลสาธารณะเช่น แร็ปเปอร์ Jay-Z และนักจิตวิทยา Jordan Peterson ได้บ่นไปแล้วเกี่ยวกับผู้คนที่ยักยอกเสียงของตนโดยการสร้างเสียงที่ล้ำลึก จากนั้นทำให้พวกเขาพูดเรื่องไร้สาระบนอินเทอร์เน็ต "ตื่น," เขียนปีเตอร์สัน
. “ความศักดิ์สิทธิ์ของเสียงและภาพลักษณ์ของคุณกำลังตกอยู่ในความเสี่ยงร้ายแรง” นี่เป็นเพียงกรณีซุกซนเท่านั้น ในส่วนอื่นๆ ผลลัพธ์อาจพลิกไปสู่ความผิดทางอาญาที่ไม่มีนัยสำคัญ ใน เหตุการณ์หนึ่งในปี 2019อาชญากรใช้เสียงปลอมแปลงเพื่อเลียนแบบเสียงของ CEO ของบริษัทพลังงานแห่งหนึ่ง และชักชวนลูกน้องทางโทรศัพท์ให้โอนเงินจำนวน 243,000 ดอลลาร์เข้าบัญชีธนาคารอย่างเร่งด่วนVeritone เอ.ไอ. บริษัทที่สร้างเครื่องมืออัจฉริยะสำหรับการติดฉลากสื่อสำหรับวงการบันเทิงคือ นำพลังเสียง Deepfake กลับมาอยู่ในมือ (หรือทำผิดพลาดในลำคอ) ของผู้ที่ได้รับอย่างถูกต้อง เป็นของ เดือนนี้บริษัทได้ประกาศ มาร์เวล.ไอซึ่งประธานบริษัท Ryan Steelberg อธิบายกับ Digital Trends ว่าเป็น "โซลูชันเสียงเป็นบริการที่สมบูรณ์แบบ" Veritone จะสร้าง A.I. โมเดลนั้น ฟังดูเหมือนคุณ (หรือน่าจะเป็นบุคคลที่มีชื่อเสียงและมีเสียงที่จดจำได้ทันที) ซึ่งสามารถขอใบอนุญาตให้ยืมได้เหมือนกับเวอร์ชันไฮเทคของ ของแอเรียล การต่อรองด้วยเสียงเป็นหลักประกัน จาก นางเงือกน้อย.
เสียงสังเคราะห์ โดย MARVEL.ai
“เสียงของคุณมีคุณค่าพอๆ กับเนื้อหาหรือคุณลักษณะของแบรนด์อื่นๆ ที่คุณมี” สตีลเบิร์กกล่าว “[มันอยู่ในระดับเดียวกับ] ชื่อและความเหมือนของคุณ ใบหน้าของคุณ ลายเซ็นของคุณ หรือเพลงที่คุณเขียนหรือเนื้อหาที่คุณสร้างขึ้น”
“เราสามารถนำกลับมาใช้ใหม่ได้มาก”
แน่นอนว่าบุคคลบางคนขายเสียงของตนมายาวนานในรูปแบบของการบันทึกโฆษณาหรือการพากย์เสียง ร้องเพลง และสร้างรายได้ในรูปแบบอื่นๆ อีกนับไม่ถ้วน แต่ความพยายามเหล่านี้ล้วนทำให้บุคคลนั้นต้องพูดคำนั้นจริงๆ สิ่งที่โซลูชันของ Veritone สัญญาว่าจะทำคือทำให้สามารถปรับขนาดได้ทีละรายการ
จะเป็นอย่างไรหากเควิน ฮาร์ท มีสิทธิ์ใช้เสียงของเขากับแบรนด์หรูที่สามารถใช้เสียงดังกล่าวเพื่อสร้างโฆษณาที่ปรับตามโปรไฟล์ของผู้ใช้ได้ แสดงชื่อของผู้ชม ตำแหน่งของร้านขายหน้าร้านที่ใกล้ที่สุด และผลิตภัณฑ์เฉพาะเจาะจงที่พวกเขาน่าจะขายมากที่สุด ซื้อ? แทนที่จะใช้เวลาหลายวันในบูธบันทึกเสียง A.I. สามารถอนุญาตให้ทำสิ่งนี้ได้มากกว่านี้อีกเล็กน้อย (บน อย่างน้อยก็ในส่วนของฮาร์ท) มากกว่าการลงนามบนเส้นประเพื่อตกลงว่าเสียงของเขาจะถูกควบคุมโดยบุคคลที่สามดังกล่าว งานสังสรรค์. ในขณะที่เขาออกไปถ่ายภาพยนตร์ ออกทัวร์แสดงตลก ไปเที่ยวพักผ่อน หรือแม้แต่นอนหลับ เสียงดิจิทัลของเขาอาจกลายเป็นเงินสดได้
“เราสามารถนำกลับมาใช้ใหม่ได้มากมาย” สตีลเบิร์กอธิบายเกี่ยวกับกระบวนการฝึกอบรม “คนที่พูดเยอะอยู่แล้ว ไม่ว่าจะผลิตพอดแคสต์หรือออกสื่อ ก็จะมีข้อมูลมากมาย เราอาจมีมันอยู่มากมายหากพวกเขาเป็นลูกค้าของเรา”
“สิ่งที่เราพบว่าน่าสนใจมากเกี่ยวกับหมวดหมู่ใหม่ของ A.I. คือความสามารถในการขยายและความแปรปรวน”
Steelberg กล่าวว่าแนวคิดการใช้เสียงเป็นบริการเกิดขึ้นกับ Veritone เมื่อหลายปีก่อน อย่างไรก็ตาม ในเวลานั้นเขาไม่มั่นใจว่าโมเดลแมชชีนเลิร์นนิงจะสามารถสร้างเสียงสังเคราะห์ที่สมจริงเกินจริงที่เขากำลังมองหาได้ นี่เป็นสิ่งสำคัญอย่างยิ่งเมื่อพูดถึงเสียงที่เรารู้จักอย่างใกล้ชิด แม้ว่าเราจะไม่เคยพบกับผู้พูดที่เป็นปัญหาก็ตาม ผลลัพธ์อาจเป็นเช่นไรก็ได้ ได้ยิน หุบเขาอันน่าพิศวง ด้วยเสียงผิด ๆ คอยเตือนผู้ฟังว่าพวกเขากำลังฟังของปลอมอยู่ แต่ในปี 2021 เขามั่นใจว่าสิ่งต่างๆ ได้ก้าวหน้าไปถึงจุดที่สามารถทำได้แล้ว ดังนั้น Marvel.ai
Steelberg พูดด้วยคำศัพท์ที่น่าตื่นเต้นเกี่ยวกับศักยภาพมหาศาลของเทคโนโลยี โดยพูดถึง "รูปแบบการดำเนินการ" ที่เป็นไปได้มากมายเหลือเฟือ Veritone สามารถสร้างแบบจำลองสำหรับการอ่านออกเสียงข้อความ นอกจากนี้ยังสามารถสร้างแบบจำลองสำหรับการพูดเป็นคำพูด โดยที่นักพากย์สามารถ “ขับเคลื่อน” การแสดงเสียงร้องโดยการอ่าน คำที่มีการผันคำที่เหมาะสมแล้วมีเสียงที่เสร็จแล้วซ้อนทับในตอนท้ายเหมือน Snapchat กรอง. บริษัทยังสามารถพิมพ์ลายนิ้วมือแต่ละเสียงเพื่อให้สามารถบอกได้ว่าเสียงจริงที่ปรากฏขึ้นที่ใดที่หนึ่งนั้นถูกสร้างขึ้นโดยใช้เทคโนโลยีของตนหรือไม่
“ยิ่งคุณคิดถึงเรื่องนี้มากเท่าไร คุณจะพบกับ [กรณีการใช้งานที่เป็นไปได้] อีก 50 กรณีอย่างแท้จริง” เขากล่าว “สิ่งที่เราพบว่าน่าสนใจมากเกี่ยวกับหมวดหมู่ใหม่ของ A.I. คือความสามารถในการขยายและความแปรปรวน”
พิจารณาคนอื่นบ้าง นักกีฬาที่มีชื่อเสียงอาจเป็นพระเจ้าในสนามบาสเก็ตบอล แต่เป็นปีศาจเมื่อมาถึง การอ่านบรรทัดในสคริปต์ในลักษณะที่ฟังดูเป็นธรรมชาติ. การใช้เทคโนโลยีของ Veritone การมีส่วนร่วมของพวกเขาในฉากคัตซีนของวิดีโอเกม หรือการอ่านหนังสือเสียงบันทึกความทรงจำของพวกเขา (ซึ่งพวกเขา อาจไม่ได้เขียนด้วย) สามารถทำได้โดยนักพากย์ซึ่งจะถูกปรับแต่งแบบดิจิทัลให้เสียงเหมือน นักกีฬา. ความเป็นไปได้อีกอย่างหนึ่งคือ ภาพยนตร์สามารถแปลไปยังประเทศอื่นที่มีเสียงนักแสดงคนเดียวกันที่อ่านอยู่ได้ บทพูดเป็นภาษาฝรั่งเศส จีนกลาง หรือภาษาอื่นๆ แม้ว่านักแสดงจะไม่ได้พูดจริงๆ ก็ตาม พวกเขา.
ประชาชนจะมีปฏิกิริยาอย่างไร?
แน่นอนว่าคำถามสำคัญที่แขวนอยู่เหนือเรื่องทั้งหมดนี้ก็คือ ประชาชนจะตอบสนองต่อเรื่องทั้งหมดนี้อย่างไร นี่เป็นบิตที่ยุ่งยากและคาดเดาไม่ได้ คนดังในปัจจุบันต้องมีบทบาทที่ซับซ้อน: ทั้งร่างที่ใหญ่กว่าชีวิตควรค่าแก่การฉาบหน้าบนป้ายโฆษณาและยัง บุคคลที่เกี่ยวข้องที่มีปัญหาด้านความสัมพันธ์ ทวีตเกี่ยวกับการดูทีวีในชุดนอน และทำหน้าโง่เมื่อกินร้อน ซอส.
จะเกิดอะไรขึ้นเมื่อโฆษณาปรากฏซึ่งไม่เพียงแต่มีข้อความอ่านของคนดังเท่านั้น แต่ในกรณีที่เรารู้ว่าเป็นเช่นนั้น นักแสดงไม่เคยพูดประโยคเหล่านั้นจริงๆ แต่ใช้เสียงของพวกเขาโดยทางโปรแกรมเพื่อนำเราไปสู่เป้าหมาย โฆษณา? Steelberg กล่าวว่ามันแตกต่างเล็กน้อยกับการที่คนดังมอบการควบคุมโซเชียลมีเดียให้กับผู้จัดการบัญชีบุคคลที่สาม หากเราเห็นทวีตของ Taylor Swift เรารู้ว่าอาจไม่ใช่เทย์เลอร์เองที่แตะข้อความ โดยเฉพาะอย่างยิ่งหากเป็นการรับรองหรือเนื้อหาส่งเสริมการขาย
แต่เสียงนั้นแตกต่างออกไปตามความเป็นจริง เพราะมันเป็นเรื่องส่วนตัวมากกว่า โดยเฉพาะอย่างยิ่งถ้ามันมาพร้อมกับระดับของความเป็นส่วนตัว ซึ่งเป็นหนึ่งในกรณีการใช้งานที่สมเหตุสมผลที่สุด ความจริงก็คือ เมื่อพูดถึงผู้เขียนบท วิลเลียม โกลด์แมน ไม่มีใครรู้ว่ากระแสตอบรับของสาธารณชนจะเป็นอย่างไร แม่นยำเพราะไม่มีใครเคยทำสิ่งนี้มาก่อน
“มันจะรันสเปกตรัมใช่ไหม?” สตีลเบิร์กกล่าวว่า “[บางคน] จะพูดว่า ‘ฉันจะใช้เครื่องมือนี้สักหน่อยเพื่อเพิ่มวันของฉันเพื่อช่วยฉันประหยัดเวลา’ คนอื่นจะพูดเต็มปากว่า 'ฉันต้องการเสียงของฉันไปทุกที่เพื่อขยายแบรนด์ของฉัน และฉันจะอนุญาต ออก.'"
การคาดเดาที่ดีที่สุดของเขาคือการยอมรับจะเป็นกรณีไป “คุณต้องปรับตัวให้เข้ากับปฏิกิริยาของผู้ฟัง และถ้าคุณเห็นว่าสิ่งต่าง ๆ กำลังได้ผลหรือไม่ได้ผล” เขากล่าว “พวกเขาอาจจะรักมัน พวกเขาอาจพูดว่า 'คุณรู้อะไรไหม? ฉันชอบความจริงที่ว่าคุณเผยแพร่เนื้อหามากกว่า 10 เท่าหรือเนื้อหาส่วนตัวให้ฉันมากขึ้น แม้ว่าฉันจะรู้ว่าคุณใช้เนื้อหาสังเคราะห์เพื่อเพิ่มเนื้อหาก็ตาม ขอบคุณ ขอบคุณ.'"
คิดถึงอนาคต
ส่วนเรื่องอนาคตล่ะ? Steelberg กล่าวว่า "เราต้องการทำงานร่วมกับเอเจนซี่ที่มีพรสวรรค์รายใหญ่ทั้งหมด เราคิดว่าใครก็ตามที่อยู่ในธุรกิจสร้างรายได้จากแบรนด์ที่หายากควรคิดถึงกลยุทธ์ด้านเสียงของตน”
และอย่าคาดหวังว่ามันจะเกี่ยวกับเสียงเพียงอย่างเดียว “เรารู้สึกทึ่งกับศักยภาพของการใช้เนื้อหาสังเคราะห์มาโดยตลอดเพื่อขยาย เพิ่ม หรือทดแทนการผลิตเนื้อหารูปแบบเดิมบางรูปแบบโดยสิ้นเชิง” เขากล่าวต่อ “จงเป็นอย่างนั้นในแง่เสียง หรือในท้ายที่สุดในอนาคต ก ความรู้สึกวิดีโอ.”
ถูกต้อง: เมื่อเข้าสู่ตลาดในโลกของออดิโอดีพเฟคแล้ว Veritone วางแผนที่จะก้าวไปอีกขั้นหนึ่งและเข้าสู่โลกแห่ง อวตารเสมือนที่รับรู้ได้อย่างสมบูรณ์ ที่ทั้งเสียงและดูไม่แตกต่างจากแหล่งกำเนิด
ทันใดนั้นพวกนั้น โฆษณาส่วนบุคคลจาก รายงานผู้ถือหุ้นส่วนน้อย ฟังดูไม่เหมือนนิยายวิทยาศาสตร์มากนัก
คำแนะนำของบรรณาธิการ
- รางวัลเทคโนโลยีเพื่อการเปลี่ยนแปลงของ Digital Trends CES 2023
- ภายในสงครามที่ทวีความรุนแรงขึ้นอย่างรวดเร็วระหว่างเครื่องตรวจจับ Deepfakes และ Deepfake
- Alexa และ Siri ไม่เข้าใจน้ำเสียงของคุณ แต่ Oto เข้าใจได้
- แคลิฟอร์เนียกำลังปราบปราม Deepfakes ที่เกี่ยวข้องกับการเมืองและสื่อลามก
- ไม่เปิดเผยตัวตนทางออนไลน์ด้วยเทคโนโลยี Deepfake ที่สร้างใบหน้าใหม่ให้กับคุณ