Veritone хочет клонировать ваш голос

Есть видео это периодически появляется в моей ленте на YouTube. Это разговор рэперов Snoop Dogg и 50 Cent, в которых они сокрушаются по поводу того, что по сравнению с их поколением все современные хип-хоп исполнители, очевидно, звучат одинаково. «Когда человек решает быть самим собой, он предлагает то, чем не может быть никто другой», — говорит 50 Cent. «Да, потому что, когда ты станешь собой, кто может быть тобой, кроме тебя?» Снуп отвечает.

Содержание

  • «Мы можем многое перепрофилировать»
  • Как отреагирует общественность?
  • Подумайте о будущем

Снуп Догг изображает флоу современных рэперов

Когда видео было загружено в октябре 2014 года, в целом это могло быть правдой. Но всего несколько лет спустя это определенно не так. В мире аудио-дипфейков можно обучить ИИ. звучать до жути похоже на другого человека, снабдив его аудиокорпусом, состоящим из нескольких часов его разговорных данных. Результаты пугающе точный.

Рекомендуемые видео

Общественные деятели, такие как рэпер Джей-Зи и психолог Джордан Петерсон уже жаловались на то, что люди неправильно присваивают свои голоса, создавая аудиофейки, а затем заставляя их говорить глупости в Интернете. "Проснуться,"

написал Петерсон. «Святость вашего голоса и вашего имиджа находятся под серьезной угрозой». Это просто курьезные случаи. В других случаях результаты могут перерасти в бессмысленную преступность. В один инцидент в 2019 годуПреступники использовали аудиодипфейк, чтобы выдать себя за голос генерального директора энергетической компании и убедить его подчиненного по телефону срочно перевести 243 000 долларов на банковский счет.

Веритон, искусственный интеллект. компания, создающая интеллектуальные инструменты для маркировки медиа для индустрии развлечений, возвращение силы аудиодипфейков в руки (или, ошибочно, в горло) тех, кому это по праву принадлежит. В этом месяце компания объявила Марвел.ай, который президент компании Райан Стилберг назвал Digital Trends «полным решением голоса как услуги». За определенную плату Veritone создаст систему искусственного интеллекта. модель, которая звучит так же, как вы (или, что более вероятно, известный человек с узнаваемым голосом), который затем можно лицензировать на время, как высокотехнологичную версию Ариэль сделка с залогом голоса от Русалочка.

Синтетический голос от MARVEL.ai

«Ваш голос так же ценен, как и любой другой контент или атрибут бренда, который у вас есть», — сказал Стилберг. «[Оно находится на уровне] вашего имени и образа, вашего лица, вашей подписи, песни, которую вы написали, или части контента, который вы создали».

«Мы можем многое перепрофилировать»

Некоторые люди, конечно, уже давно продают свои голоса в форме записи рекламы или озвучки, пения песен и бесчисленных других форм монетизации. Но все эти усилия требовали, чтобы человек действительно произнес эти слова. Решение Veritone обещает сделать это индивидуально масштабируемым.

Что, если бы, например, Кевин Харт мог передать лицензию на свой голос люксовому бренду, который затем мог бы использовать его для создания персонализированной рекламы? с указанием имени зрителя, местонахождения ближайшей торговой точки и конкретного продукта, который он, скорее всего, купит. купить? Вместо того, чтобы проводить буквально дни в записывающей кабинке, А.И. можно было бы позволить это сделать с небольшими дополнительными затратами (на по крайней мере со стороны Харта), чем подписать пунктирную линию, чтобы дать согласие на использование его голосового сходства указанным третьим лицом. вечеринка. Пока он был на съемках фильма, или в комедийном туре, или в отпуске, или даже спал, его цифровой голос мог зарабатывать деньги.

«Мы можем многое перепрофилировать», — объяснил Стилберг относительно тренировочного процесса. «Люди, которые уже много говорят, если они создают подкасты или работают в средствах массовой информации, имеют много данных. У нас, вероятно, уже есть тонна этого, если они оказались нашими клиентами».

«Что мы находим таким интересным в этой новой категории искусственного интеллекта? — это расширяемость и изменчивость».

Стилберг рассказал, что идея «голос как услуга» пришла в голову Veritone несколько лет назад. Однако в то время он не был убежден, что модели машинного обучения способны создавать гиперреалистичные синтетические голоса, которые он искал. Это особенно важно, когда речь идет о голосах, которые мы близко знаем, даже если мы никогда не встречались с говорящим, о котором идет речь. Результаты могут быть какими-то слышимый жуткая долина, где каждый неправильный звук предупреждает слушателей о том, что они слушают фальшивку. Но здесь, в 2021 году, он убежден, что дело дошло до того, что это стало возможным. Отсюда и Marvel.ai.

Стилберг взволнованно говорит об огромном потенциале этой технологии, упоминая о возможном множестве «способов реализации». Veritone может создавать модели преобразования текста в речь. Он также может создавать модели преобразования речи в речь, благодаря чему актер озвучивания может «управлять» вокальным исполнением, читая слова с подходящим изменением, а затем наложение готового голоса в конце, как в Snapchat фильтр. Компания также может отпечатки пальцев каждого голоса, чтобы определить, был ли фрагмент реального звука, который появляется где-то, создан с использованием ее технологии.

«Чем больше вы об этом думаете… вы буквально придумаете еще 50 [возможных вариантов использования]», — сказал он. «Что мы находим таким интересным в этой новой категории искусственного интеллекта? — это расширяемость и изменчивость».

Рассмотрим некоторые другие. Знаменитый спортсмен может быть богом на баскетбольной площадке, но дьяволом, когда дело касается баскетбола. чтение строк в сценарии так, чтобы это звучало естественно. Используя технологию Veritone, участие в роликах видеоигр или чтение аудиокниги своих мемуаров (которые они возможно, также не писал) может быть исполнен актером озвучки, а затем в цифровом виде настраивается так, чтобы звук звучал как спортсмен. Еще одна возможность: фильм можно было бы перевести для других стран с тем же актерским голосом, который сейчас читает фильм. строки на французском, китайском или любом другом из множества языков, даже если актер на самом деле не говорит их.

Как отреагирует общественность?

Большой вопрос, конечно, висит над всем этим, заключается в том, как представители общественности собираются на все это реагировать. Это сложный и непредсказуемый момент. Знаменитости сегодня должны играть сложную роль: как огромные фигуры, лица которых достойны того, чтобы их лица были изображены на рекламных щитах, так и привлекательные люди, у которых проблемы в отношениях, которые пишут в Твиттере о том, что смотрят телевизор в пижаме, и строят глупые рожицы, когда едят горячее соус.

Что происходит тогда, когда появляются рекламные объявления, в которых не только присутствуют строки, читающие знаменитости, но и в тех случаях, когда мы знаем, что сказано исполнитель никогда на самом деле не произносил эти строки, а его голос программно использовался, чтобы донести до нас целевую информацию. объявление? Стилберг сказал, что это мало чем отличается от того, как знаменитость передает контроль над своими социальными сетями стороннему менеджеру по работе с клиентами. Если мы видим твит Тейлор Свифт, мы знаем, что вполне возможно, что это не сама Тейлор выстукивает сообщение, особенно если это одобрение или часть рекламного контента.

Но голос в действительности отличается именно потому, что он более личный. Особенно, если это сопровождается определенной степенью персонализации, что является одним из наиболее разумных вариантов использования. Правда в том, что, по словам сценариста Уильяма Голдмана, никто не знает, какой будет общественная реакция — именно потому, что никто раньше этого не делал.

«Он будет управлять спектром, верно?» — сказал Стилберг. «[Некоторые] люди скажут: «Я собираюсь немного использовать этот инструмент, чтобы улучшить свой день и сэкономить время». Другие скажут во весь голос: «Я хочу, чтобы мой голос повсюду распространял мой бренд, и я собираюсь лицензировать его». вне.'"

По его мнению, принятие будет осуществляться в индивидуальном порядке. «Вы должны быть в курсе реакции вашей аудитории и того, видите ли вы, что что-то работает или не работает», — сказал он. «Им это может понравиться. Они могут сказать: «Знаешь что? Мне нравится тот факт, что вы предоставляете мне в 10 раз больше контента или больше личного контента, хотя я знаю, что вы использовали синтетический контент, чтобы дополнить его. Спасибо. Спасибо.'"

Подумайте о будущем

Веритон MARVEL.ai
Веритон

Что касается будущего? Стилберг сказал: «Мы хотим работать со всеми крупными агентствами по поиску талантов. Мы думаем, что любой, кто занимается зарабатыванием денег на дефицитном бренде, должен задуматься о своей голосовой стратегии».

И не ожидайте, что это останется исключительно аудио. «Нас всегда восхищала возможность использования синтетического контента для расширения, дополнения или потенциально полной замены некоторых устаревших форм производства контента», — продолжил он. «Будь то в аудио смысле или, в конечном счете, в будущем, смысл видео.”

Это верно: завоевав рынок в мире дипфейков, Veritone планирует сделать еще один шаг вперед и войти в мир аудиофейков. полностью реализованные виртуальные аватары которые и звучат, и выглядят неотличимо от их источника.

Внезапно эти персонализированная реклама от Отчет меньшинства звучит гораздо менее похоже на научную фантастику.

Рекомендации редакции

  • Награды Digital Trends Tech For Change CES 2023
  • Внутри быстро обостряющейся войны между дипфейками и детекторами дипфейков
  • Алекса и Сири не могут понять тон вашего голоса, но Ото может.
  • Калифорния борется с дипфейками, связанными с политикой и порнографией
  • Сохраняйте анонимность в Интернете с помощью технологии deepfake, которая создает для вас совершенно новое лицо