Veritone은 귀하의 음성을 딥페이크 복제하려고 합니다.

거기에 동영상 내 YouTube 피드에 주기적으로 표시됩니다. 래퍼 스눕독(Snoop Dogg)과 50센트(50 Cent)가 자신의 세대에 비해 현대 힙합 아티스트는 모두 똑같은 소리를낸다는 사실을 한탄하는 대화입니다. 50 Cent는 “사람이 자기 자신이 되기로 결정하면 다른 누구도 할 수 없는 것을 제공하게 됩니다.”라고 말합니다. "그렇습니다. 일단 당신이 당신이라면, 당신 외에 누가 당신이 될 수 있습니까?" 스눕이 대답한다.

내용물

“우리는 많은 용도를 변경할 수 있습니다”
대중은 어떻게 반응할까?
미래에 대해 생각해보세요

Snoop Dogg는 오늘날의 래퍼들의 사운드와 유사한 플로우를 흉내냅니다.

2014년 10월에 동영상이 업로드되었을 당시에는 그 말이 대체로 사실이었을 수 있습니다. 그러나 불과 몇 년이 지난 지금은 확실히 그렇지 않습니다. 오디오 딥페이크의 세계에서는 AI를 훈련시키는 것이 가능합니다. 몇 시간 분량의 음성 데이터로 구성된 오디오 코퍼스를 제공하여 다른 사람과 이상하게 비슷하게 들리도록 합니다. 결과는 엄청나게 정확하다.

“우리는 많은 용도를 변경할 수 있습니다”

물론 어떤 개인들은 오랫동안 광고나 음성 해설 녹음, 노래 부르기, 기타 수많은 형태의 수익 창출 형태로 자신의 목소리를 판매해 왔습니다. 그러나 이러한 노력은 모두 그 사람이 실제로 말을 해야 한다는 것을 요구했습니다. Veritone의 솔루션이 약속하는 것은 이를 개별적으로 확장 가능하게 만드는 것입니다.

예를 들어, 케빈 하트(Kevin Hart)가 자신의 목소리를 명품 브랜드에 라이선스하여 개인화된 광고를 만드는 데 사용할 수 있다면 어떨까요? 시청자의 이름, 가장 가까운 오프라인 매장 위치, 시청자가 가장 관심을 가질 만한 특정 제품 등을 표시합니다. 구입하다? 말 그대로 녹음 부스에서 며칠을 보내는 대신 A.I. 조금 더 노력하면 이 작업을 수행할 수 있습니다( 적어도 Hart의 부분) 그의 목소리 유사성이 제3자에 의해 활용되는 데 동의하기 위해 점선에 서명하는 것보다 파티. 그가 영화를 촬영 중이거나, 코미디 투어를 하고 있거나, 휴가를 가거나 심지어 잠을 자는 동안에도 그의 디지털 목소리는 현금을 긁어모을 수 있습니다.

Steelberg는 훈련 과정에 대해 “우리는 많은 용도를 변경할 수 있습니다.”라고 설명했습니다. “이미 말을 많이 하는 사람들이 팟캐스트를 제작하거나 미디어를 통해 보도되고 있다면 수많은 데이터가 있습니다. 만약 그들이 우리 고객이라면 우리는 이미 그것을 엄청나게 갖고 있을 것입니다.”

“이 새로운 AI 범주에 대해 우리가 매우 흥미로운 점을 발견했습니다. 확장성과 가변성이다.”

Steelberg는 서비스로서의 음성 아이디어가 Veritone에서 몇 년 전에 떠올랐다고 말했습니다. 그러나 당시 그는 기계 학습 모델이 자신이 찾고 있던 초현실적인 합성 음성을 생성할 수 있다는 사실을 확신하지 못했습니다. 이는 문제의 화자를 실제로 만난 적이 없더라도 우리가 친밀하게 알고 있는 목소리의 경우 특히 중요합니다. 결과는 일종의 것일 수 있습니다. 들리는 잘못된 소리가 나올 때마다 청취자에게 자신이 가짜 음악을 듣고 있다는 사실을 경고하는 불쾌한 계곡. 그러나 2021년에 그는 상황이 지금 가능한 수준까지 발전했다고 확신합니다. 따라서 Marvel.ai.

Steelberg는 기술의 막대한 잠재력에 대해 흥분된 유행어를 사용하여 가능한 과다한 "실행 방식"에 대해 이야기합니다. Veritone은 텍스트 음성 변환을 위한 모델을 만들 수 있습니다. 또한 성우가 낭독을 통해 보컬 퍼포먼스를 '추진'할 수 있는 음성 대 음성 모델을 구축할 수도 있습니다. 적절한 억양을 가진 단어를 마지막에 Snapchat처럼 완성된 음성을 오버레이하는 것 필터. 이 회사는 또한 각 음성의 지문을 채취하여 어딘가에서 나타나는 실제 오디오 조각이 자사 기술을 사용하여 생성되었는지 여부를 알 수 있습니다.

"당신이 그것에 대해 더 많이 생각할수록... 문자 그대로 [가능한 사용 사례]가 50개 더 나올 것입니다."라고 그는 말했습니다. “이 새로운 AI 범주에 대해 우리가 매우 흥미로운 점을 발견했습니다. 확장성과 가변성이다.”

다른 사람들도 고려해 보십시오. 유명한 운동선수는 농구장에서는 신일 수도 있지만 농구장에서는 악마일 수도 있습니다. 자연스럽게 들리는 방식으로 스크립트의 줄 읽기. Veritone의 기술을 사용하여 비디오 게임 컷씬에 참여하거나 회고록의 오디오북을 읽습니다(그들은 작성하지 않았을 수도 있음)은 성우가 수행할 수 있으며 디지털 방식으로 조정하여 다음과 같은 소리를 냅니다. 운동 선수. 또 다른 가능성으로, 현재 같은 배우 목소리로 영화가 다른 나라로 번역될 수도 있습니다. 배우가 실제로 말하지 않더라도 프랑스어, 중국어 또는 기타 여러 언어 중 하나로 대사 그들을.

대중은 어떻게 반응할까?

물론 이 모든 것에 걸려 있는 큰 질문은 대중이 이 모든 것에 어떻게 반응할 것인가입니다. 이것은 까다롭고 예측할 수 없는 부분입니다. 오늘날 유명인들은 복잡한 역할을 수행해야 합니다. 광고판에 얼굴을 장식할 만큼 실물보다 큰 인물이자 동시에 인간관계에 문제가 있고, 잠옷을 입고 TV를 본다고 트윗하고, 뜨거운 음식을 먹으면 우스꽝스러운 표정을 짓는 친밀한 사람들 소스.

그렇다면 유명 인사의 낭독 대사를 특징으로 하는 광고가 나타날 뿐만 아니라, 우리가 그 내용을 알고 있는 경우에는 어떻게 될까요? 연기자는 실제로 그런 대사를 말한 적이 없으며 오히려 자신의 목소리를 프로그래밍 방식으로 활용하여 목표한 대사를 전달했습니다. 기원 후? Steelberg는 유명인이 자신의 소셜 미디어에 대한 통제권을 제3자 계정 관리자에게 넘겨주는 것과 거의 다르지 않다고 말했습니다. Taylor Swift 트윗을 보면 Taylor 자신이 메시지를 전달하는 것이 아닐 수도 있다는 것을 알 수 있습니다. 특히 그것이 보증이나 홍보 콘텐츠인 경우에는 더욱 그렇습니다.

하지만 목소리는 실제로는 다릅니다. 더 개인적인 것이기 때문입니다. 특히 가장 적합한 사용 사례 중 하나인 어느 정도의 개인화가 수반되는 경우에는 더욱 그렇습니다. 진실은 시나리오 작가 윌리엄 골드먼(William Goldman)의 말을 인용하면 대중의 반응이 어떻게 될지 아무도 모른다는 것입니다. 이전에 누구도 정확히 이런 일을 해본 적이 없기 때문입니다.

"스펙트럼을 실행하는 거죠, 그렇죠?" 스틸버그가 말했다. “[일부] 사람들은 '이 도구를 사용하여 하루를 좀 더 효율적으로 활용하여 시간을 절약할 것입니다.'라고 말할 것입니다. 다른 사람들은 '나는 내 목소리가 내 브랜드를 확장하기 위해 어디에서나 내 목소리를 내고 싶고 라이선스를 취득할 것입니다'라고 본격적으로 말할 것입니다. 밖으로.'"

그의 최선의 추측은 승인이 사례별로 이루어질 것이라는 것입니다. “청중의 반응에 주의를 기울여야 하며, 일이 잘 되고 있는지 안 되는지를 확인해야 합니다.”라고 그는 말했습니다. “그들은 그것을 좋아할 수도 있습니다. 그들은 '그거 알아요? 나는 당신이 합성 콘텐츠를 사용하여 강화했다는 것을 알고 있음에도 불구하고 당신이 나에게 10배 더 많은 콘텐츠 또는 더 많은 개인 콘텐츠를 제공한다는 사실을 좋아합니다. 감사합니다. 감사합니다.'"

미래에 대해 생각해보세요

미래는? Steelberg는 “우리는 모든 주요 연예 기획사와 협력하고 싶습니다. 희소한 브랜드로 돈을 버는 사업을 하는 사람이라면 누구나 자신의 목소리 전략에 대해 생각해 봐야 한다고 생각합니다.”

그리고 그것이 순전히 오디오에만 국한될 것이라고 기대하지도 마십시오. "우리는 합성 콘텐츠를 사용하여 일부 기존 콘텐츠 제작 형식을 확장, 강화 또는 잠재적으로 완전히 대체할 수 있는 잠재력에 항상 매료되어 왔습니다."라고 그는 계속했습니다. “오디오 측면에서 그렇게 되거나, 궁극적으로 미래에는 비디오 감각.”

그렇습니다. Veritone은 오디오 딥페이크 세계 시장을 장악한 후 한 단계 더 나아가 오디오 딥페이크 세계로 진출할 계획입니다. 완전히 실현된 가상 아바타 소리와 모양 모두 소스와 구별할 수 없습니다.

갑자기 그 사람들 개인화된 광고 마이너리티 리포트 공상 과학 소설처럼 들리지 않습니다.

편집자의 추천

디지털 트렌드의 변화를 위한 기술 CES 2023 어워드
딥페이크와 딥페이크 탐지기 사이의 급속도로 확대되는 전쟁 속으로
Alexa와 Siri는 사용자의 목소리 톤을 이해할 수 없지만 Oto는 이해할 수 있습니다.
캘리포니아는 정치와 포르노를 위한 딥페이크를 단속하고 있습니다.
완전히 새로운 얼굴을 생성하는 딥페이크 기술로 온라인에서 익명성을 유지하세요

Veritone은 귀하의 음성을 딥페이크 복제하려고 합니다.

“우리는 많은 용도를 변경할 수 있습니다”

대중은 어떻게 반응할까?

미래에 대해 생각해보세요

편집자의 추천

카테고리

충적세

궁극의 PC 게임 컨트롤러에 대한 검색이 끝났습니다.

이 중요한 것이 Apple Vision Pro를 만들거나 깨뜨릴 것입니다.

RTX 4060 Ti 대신 구매해야 하는 5개의 GPU는 다음과 같습니다.