Veritone Sesinizi Deepfake Klonlamak İstiyor

Orada bir video YouTube feed'imde periyodik olarak ortaya çıkıyor. Rapçiler Snoop Dogg ve 50 Cent arasında geçen ve kendi nesilleriyle karşılaştırıldığında tüm modern hip-hop sanatçılarının sesinin aynı olduğu gerçeğinden yakınan bir konuşma. 50 Cent, "Bir kişi kendisi olmaya karar verdiğinde, başka kimsenin sunamayacağı bir şey sunmuş olur" diyor. “Evet, çünkü bir kez kendin olursan, sen dışında kim olabilir?” Snoop yanıt veriyor.

İçindekiler

  • “Birçok şeyi yeniden tasarlayabiliriz”
  • Halkın tepkisi nasıl olacak?
  • Geleceği düşün

Snoop Dogg günümüzün rapçilerinin ses benzeri akışını taklit ediyor

Video Ekim 2014'te yüklendiğinde bu genel olarak doğru olabilirdi. Ama sadece birkaç yıl sonra kesinlikle öyle değil. Sesli deepfake'lerin olduğu bir dünyada, bir yapay zekayı eğitmek mümkün. saatlerce konuşulan veriden oluşan bir ses külliyatı besleyerek başka bir kişiye ürkütücü bir şekilde benzemek. Sonuçlar: sinir bozucu derecede doğru.

Önerilen Videolar

Kamuya mal olmuş kişiler bunun gibi rapçi Jay-Z

ve psikolog Jordan Peterson, insanların derin ses sahtekarlıkları yaratarak seslerini kötüye kullandıklarından ve onlara internette aptalca şeyler söylettiklerinden zaten şikayetçiydi. "Uyanmak," Peterson'ı yazdı. “Sesiniz ve imajınızın kutsallığı ciddi risk altındadır.” Bunlar sadece kötü vakalar. Diğerlerinde, sonuçlar incelikli olmayan suçluluğa dönüşebilir. İçinde 2019'daki bir olay, suçlular bir enerji şirketinin CEO'sunun sesini taklit etmek ve bir astını telefonda bir banka hesabına acilen 243.000 dolar aktarmaya ikna etmek için derin sahte ses kullandı.

Veritone, bir yapay zeka. Eğlence sektörü için medyayı etiketlemeye yönelik akıllı araçlar üreten şirket, sesin deepfake gücünü, doğru şekilde verildiği kişilerin ellerine (veya, yani, boğazlarına) geri vermek aittir. Şirket bu ay duyurdu Marvel.aiŞirket başkanı Ryan Steelberg'in Digital Trends'e "eksiksiz bir hizmet olarak ses çözümü" olarak tanımladığı şey. Veritone bir ücret karşılığında bir yapay zeka oluşturacak. bunu modelle tıpkı size benziyor (ya da büyük olasılıkla sesi anında tanınabilen ünlü bir kişi), bu daha sonra yüksek teknolojili bir versiyonu gibi ödünç olarak lisanslanabiliyor. Ariel'in teminat olarak ses pazarlığı itibaren Küçük Denizkızı.

MARVEL.ai'den Sentetik Ses

Steelberg, "Sesiniz, sahip olduğunuz diğer içerik veya marka özellikleri kadar değerlidir" dedi. "Adınız ve benzerliğiniz, yüzünüz, imzanız veya yazdığınız bir şarkı veya yarattığınız içerikle [aynı seviyededir.''

“Birçok şeyi yeniden tasarlayabiliriz”

Elbette bazı kişiler uzun süredir seslerini reklam veya seslendirme kaydetme, şarkı söyleme ve diğer sayısız para kazanma biçimi yoluyla satıyorlar. Ancak bu çabaların tümü, kişinin kelimeleri gerçekten söylemesini gerektiriyordu. Veritone'un çözümünün vaat ettiği şey, bunu bireysel olarak ölçeklenebilir kılmaktır.

Örneğin, Kevin Hart'ın sesini lüks bir markaya lisanslaması ve bu markanın bunu daha sonra kişiselleştirilmiş reklamlar oluşturmak için kullanması mümkün olsaydı ne olurdu? izleyicinin adını, en yakın fiziksel satış noktasının konumunu ve büyük olasılıkla satın alabilecekleri belirli ürünü içeren satın almak? A.I., kayıt kabininde kelimenin tam anlamıyla günler geçirmek yerine. bunun biraz daha fazlasıyla yapılmasına izin verebilir (üzerinde En azından Hart'ın payına düşen) ses benzerliğinin adı geçen üçüncü kişi tarafından kullanılması konusunda anlaşmaya varmak için noktalı çizgiyi imzalamaktan Parti. Bir film çekerken, bir komedi turu yaparken, tatile çıkarken, hatta uyurken bile dijital sesi nakit para kazanabiliyordu.

Steelberg eğitim süreciyle ilgili olarak "Pek çok şeyi yeniden tasarlayabiliriz" dedi. "Halihazırda tonlarca konuşan insanlar, eğer bir podcast hazırlıyorlarsa ya da medyada, ortada çok fazla veri var. Eğer onlar bizim müşterimiz olursa muhtemelen zaten bir ton paramız vardır.”

“Bu yeni yapay zeka kategorisinde bu kadar büyüleyici bulduğumuz şey şu ki; genişletilebilirlik ve değişkenliktir.”

Steelberg, hizmet olarak ses fikrinin Veritone'un aklına birkaç yıl önce geldiğini söyledi. Ancak o zamanlar makine öğrenimi modellerinin aradığı hiper gerçekçi sentetik sesleri yaratabileceğine ikna olmamıştı. Bu, söz konusu konuşmacıyla gerçekte hiç tanışmamış olsak bile, yakından tanıdığımız sesler söz konusu olduğunda özellikle önemlidir. Sonuçlar bir çeşit olabilir duyulabilir Her yanlış sesin dinleyicileri sahte bir şarkı dinledikleri konusunda uyardığı tekinsiz bir vadi. Ancak 2021'de işlerin artık bunun mümkün olduğu noktaya geldiğine inanıyor. Dolayısıyla Marvel.ai.

Steelberg heyecan verici moda sözcüklerle teknolojinin muazzam potansiyeli hakkında konuşuyor ve olası çok sayıda "uygulama yönteminden" söz ediyor. Veritone, metinden konuşmaya yönelik modeller oluşturabilir. Aynı zamanda, bir seslendirme sanatçısının okuyarak bir vokal performansını "yönlendirebileceği" konuşma-konuşma modelleri de oluşturabilir. kelimelerin uygun bir şekilde bükülmesi ve ardından bitmiş sesin bir Snapchat gibi sonuna yerleştirilmesi filtre. Şirket ayrıca her sesin parmak izini alabiliyor ve böylece bir yerde ortaya çıkan, gerçek gibi görünen bir ses parçasının kendi teknolojisi kullanılarak yaratılıp yaratılmadığını anlayabiliyor.

"Bunun hakkında ne kadar çok düşünürseniz, kelimenin tam anlamıyla 50 tane daha [olası kullanım durumu] bulacaksınız" dedi. “Bu yeni yapay zeka kategorisinde bu kadar büyüleyici bulduğumuz şey şu ki; genişletilebilirlik ve değişkenliktir.”

Başkalarını da düşünün. Ünlü bir atlet basketbol sahasında bir tanrı olabilir ama iş basketbola gelince bir şeytandır. bir senaryodaki satırları doğal görünecek şekilde okumak. Veritone'un teknolojisini kullanarak, video oyunu ara sahnelerindeki rollerini veya anılarının sesli kitabını okuyarak (ki bunu yaptılar) da yazılmamış olabilir) bir seslendirme sanatçısı tarafından gerçekleştirilebilir, bu daha sonra dijital olarak ses gibi ses çıkaracak şekilde ayarlanır. atlet. Başka bir olasılık olarak, şu anda aynı oyuncu sesiyle bir film başka ülkelere de çevrilebilir. Aktör aslında konuşmasa bile Fransızca, Mandarin Çincesi veya başka dillerden herhangi birindeki replikler onlara.

Halkın tepkisi nasıl olacak?

Elbette tüm bunların üzerinde asılı kalan büyük bir soru, halkın tüm bunlara nasıl tepki vereceğidir. Bu zor ve öngörülemeyen kısımdır. Günümüzde ünlülerin karmaşık bir rol oynaması gerekiyor: Hem yüzleri reklam panolarına asılmaya layık, olağanüstü figürler, hem de İlişki sorunları yaşayan, pijamalarıyla TV izledikleri hakkında tweet atan ve sıcak yemek yerken komik suratlar yapan, bağdaştırılabilir kişiler Sos.

Öyleyse, yalnızca bir ünlünün okuma satırlarını içeren reklamlar göründüğünde değil, aynı zamanda bunun söylendiğini bildiğimiz durumlarda ne olur? sanatçı aslında bu satırları asla söylemedi, bunun yerine seslerini programlı olarak bize hedeflenen bir şey getirmek için kullandı. reklam mı? Steelberg, bunun bir ünlünün sosyal medyasının kontrolünü üçüncü taraf bir hesap yöneticisine devretmesinden pek de farklı olmadığını söyledi. Taylor Swift'in tweet'ini görürsek, özellikle de bu bir onay veya tanıtım içeriğiyse, mesajı yazanın muhtemelen Taylor olmadığını biliyoruz.

Ancak ses, gerçek anlamda farklıdır, çünkü daha kişiseldir. Özellikle de en anlamlı kullanım durumlarından biri olan bir dereceye kadar kişiselleştirme eşlik ediyorsa. Gerçek şu ki, senarist William Goldman'dan alıntı yaparsak, hiç kimse halkın tepkisinin ne olacağını bilmiyor; çünkü bunu daha önce kimse tam olarak yapmamıştı.

"Spektrumu çalıştıracak, değil mi?" Steelberg dedi. "[Bazıları] insanlar şöyle diyecek: 'Bu aracı, zaman kazanmama yardımcı olması için günümü biraz daha güzelleştirmek için kullanacağım.' Diğerleri ise tüm gücüyle şöyle diyecek: 'Sesimin her yerde markamı genişletmesini istiyorum ve bunun lisansını vereceğim dışarı.'"

En iyi tahmini, kabulün duruma göre olacağıdır. "İzleyicilerinizin tepkisine ve işlerin işe yarayıp yaramadığını görmenize göre uyum içinde olmanız gerekiyor" dedi. “Bunu sevebilirler. Şöyle diyebilirler: 'Biliyor musun? Sentetik içeriği arttırmak için kullandığınızı bilmeme rağmen bana 10 kat daha fazla içerik veya daha fazla kişisel içerik sunmanızı seviyorum. Teşekkür ederim. Teşekkür ederim.'"

Geleceği düşün

Veritone MARVEL.ai
Veriton

Geleceğe gelince? Steelberg şunları söyledi: “Tüm büyük yetenek ajanslarıyla çalışmak istiyoruz. Az bulunan bir marka üzerinden para kazanma işinde olan herkesin ses stratejisini düşünmesi gerektiğini düşünüyoruz."

Ve bunun tamamen ses ile ilgili kalmasını da beklemeyin. "İçerik üretiminin bazı eski biçimlerini genişletmek, geliştirmek veya potansiyel olarak tamamen değiştirmek için sentetik içerik kullanma potansiyeli bizi her zaman büyülemiştir" diye devam etti. “İster işitsel anlamda olsun, ister nihai olarak gelecekte bir video hissi.”

Doğru: Veritone, derin ses sahtekarlığı dünyasında pazarı ele geçirdikten sonra bir adım daha ileri giderek ses dünyasına girmeyi planlıyor. tamamen gerçekleştirilmiş sanal avatarlar Hem sesi hem de kaynağından ayırt edilemez görünüyor.

Aniden bunlar kişiselleştirilmiş reklamlar Azınlık Raporu bilim kurguya çok daha az benziyor.

Editörlerin Önerileri

  • Dijital Trendlerin Değişim İçin Teknolojisi CES 2023 Ödülleri
  • Deepfake ve deepfake dedektörleri arasında hızla tırmanan savaşın içinde
  • Alexa ve Siri sesinizin tonunu anlayamaz ama Oto anlayabilir
  • Kaliforniya siyaset ve porno amaçlı deepfake'lere karşı önlem alıyor
  • Sizin için yepyeni bir yüz oluşturan deepfake teknolojisiyle çevrimiçi ortamda anonim kalın