티저 -- 오바마 합성: 오디오에서 립싱크 배우기
글쎄요, 상황이 훨씬 더 나빠질 것이라는 사실을 말씀드리게 되어 유감입니다!
추천 동영상
적어도 그것은 인공 지능의 솔직하고 미친 시연에 기초한 것입니다. 워싱턴 대학의 컴퓨터 과학자들이 수행한. 최첨단을 사용하여 인공 신경망, 그들은 버락 오바마 전 대통령이 연설하는 새로운 영상을 생성할 수 있는 AI를 개발했는데, 이는 그의 녹음된 오디오와 완벽하게 일치합니다.
“우리는 그의 목소리를 기반으로 오바마의 믿을 수 있는 비디오를 생성할 수 있는 알고리즘을 개발했습니다. 오바마의 주간 연설 시간을 분석하여 이를 수행하는 방법을 학습하는 순환 신경망 피트 길이," 수파손 수와자나콘 박사, 프로젝트 연구원은 Digital Trends에 말했습니다. “이전 작업과 달리 피사체를 스캔하거나 많은 사람들이 미리 정해진 문장을 말하는 비디오로 구성된 음성 데이터베이스를 요구하지 않습니다. 우리는 기존 영상을 통해 이를 배웁니다. 이는 최소한의 노력으로 누구에게나 확장될 수 있는 잠재력을 가지고 있습니다.”
그렇다면 연구자들은 왜 입이 떡 벌어질 기술 데모를 수행하기 위해 버락 오바마 같은 사람을 선택했을까요? 아니요, 당파적인 정치적 이유가 아닙니다. Suwajanakorn은 "우리가 사용한 기술인 딥 러닝에는 많은 데이터가 필요합니다."라고 말했습니다. "그리고 이 데이터 세트는 규모가 크므로 매우 적합합니다. 20시간이 넘고 수집하기 쉽고 고해상도의 Obama만 포함되어 있으며 연구자가 무료로 사용할 수 있는 공개 도메인입니다."
연구원들이 처음부터 CGI 버전의 Obama를 만들지 않는다는 점은 주목할 가치가 있습니다. 대신에 그들은 영화 제작자들이 만든 것보다 더 정교한 버전을 만들고 있습니다.
영화 같은 포레스트 검프 아카이브 영상으로 했어요: 기존 비디오를 촬영한 다음 새 대화에 맞게 편집합니다. 이 경우 이는 오바마가 오디오에서 말하는 내용과 일치하도록 입을 움직이는 것을 의미합니다. AI가 그의 독특한 입 움직임에 대해 배운 모든 것을 통합하여 그것이 나타나게 합니다. 진본인.우리는 비록 당황하기는 하지만 누군가가 워싱턴 대학의 연구와 이 연구를 혼합하면 어떤 일이 일어나는지 보고 흥미를 느낍니다. 이전 프로젝트, 신경망을 사용하여 (다른 사람들 중에서) 오바마 대통령의 목소리를 흉내낸다.
가짜 뉴스의 미래에 대해 우리가 뭐라고 말했는지 아시나요?
편집자의 추천
- 포토샵 AI는 '행복'을 썩은 치아의 미소라고 생각한다
- 착시 현상은 차세대 AI를 구축하는 데 도움이 될 수 있습니다
- AI의 부상 재검토: 2010년 이후 인공지능은 어디까지 발전했나요?
- 미래의 주택 감정사는 아마도 AI일 것이다. 연산
- 일체 포함. 수백만 광년 떨어진 은하단을 발견할 수 있다
당신의 라이프스타일을 업그레이드하세요Digital Trends는 독자들이 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 빠르게 변화하는 기술 세계를 계속해서 살펴볼 수 있도록 도와줍니다.