이 AI는 단 3초 만에 당신의 목소리를 스푸핑할 수 있습니다.

인공지능(AI)은 지금은 잠시 시간을 갖고 있어, 그리고 마이크로소프트가 3초의 짧은 샘플을 제공받은 후 누구의 목소리도 모방할 수 있는 AI를 개발하고 있다는 소식이 계속해서 돛에 불고 있습니다.

VALL-E라고 불리는 새로운 도구는 영어로 된 약 60,000시간의 음성 데이터에 대해 교육을 받았습니다. Microsoft는 이 데이터가 "기존 시스템보다 수백 배 더 크다"고 말합니다. 이 지식을 사용하여 제작자는 사용자의 음성을 복제하는 방법을 이해하려면 약간의 음성 입력만 필요하다고 주장합니다.

전화로 말하는 남자
피즈케스/Shutterstock

더욱 인상적인 점은 VALL-E가 각 샘플에서 발견되는 감정, 보컬 톤 및 음향 환경을 재현할 수 있다는 점입니다. 이는 다른 음성 AI 프로그램이 어려움을 겪는 부분입니다. 이는 보다 사실적인 아우라를 제공하고 결과를 진정한 인간의 말처럼 전달할 수 있는 것에 더 가깝게 만듭니다.

관련된

  • GPT-4: ChatGPT를 부끄럽게 만드는 AI 챗봇을 사용하는 방법
  • Google Bard는 이제 말할 수 있지만 ChatGPT를 압도할 수 있습니까?
  • 엘론 머스크의 새로운 AI 회사는 '우주 이해'를 목표로 한다

Microsoft는 다른 TTS(텍스트 음성 변환) 경쟁업체와 비교할 때 VALL-E가 "음성 측면에서 최첨단 제로 샷 TTS 시스템보다 훨씬 뛰어난 성능을 발휘합니다"라고 말합니다. 자연스러움과 화자 유사성.” 즉, VALL-E는 훈련되지 않은 오디오 입력을 접하는 경쟁 AI보다 실제 인간과 훨씬 더 비슷하게 들립니다. 에.

추천 동영상

GitHub에서 Microsoft는 작은 샘플 라이브러리 VALL-E를 사용하여 생성되었습니다. 스피커 목소리의 경쾌함과 악센트를 재현하는 많은 샘플을 통해 결과는 대부분 매우 인상적이었습니다. 일부 예는 덜 설득력이 있어 VALL-E가 완제품이 아닐 수도 있지만 전체적인 결과는 설득력이 있습니다.

엄청난 잠재력과 위험

Windows 11을 실행하는 Microsoft Surface 장치에서 화상 통화를 진행하는 사람.
마이크로소프트/언스플래시

안에 VALL-E를 소개하는 논문, Microsoft는 VALL-E가 “음성 스푸핑과 같은 모델 오용으로 인해 잠재적인 위험을 초래할 수 있다고 설명합니다. 특정 화자를 식별하거나 사칭하는 행위.” 사실적으로 들리는 음성 인상을 생성하기 위한 이러한 유능한 도구 유령

점점 더 설득력 있는 딥페이크, 이는 이전의 낭만적인 파트너부터 저명한 국제적 인물까지 무엇이든 모방하는 데 사용될 수 있습니다.

이러한 위협을 완화하기 위해 Microsoft는 "오디오 클립이 VALL-E에 의해 합성되었는지 여부를 구별하는 탐지 모델을 구축하는 것이 가능합니다"라고 말합니다. 회사에서는 자사 제품도 사용할 것이라고 밝혔습니다. AI 원리 작업을 개발할 때. 이러한 원칙은 공정성, 안전, 개인 정보 보호 및 책임과 같은 영역을 다룹니다.

VALL-E는 Microsoft의 AI 실험의 최신 사례일 뿐입니다. 최근 회사에서 일을 하고 있어요. ChatGPT를 Bing에 통합, AI를 사용하여 Teams 회의 요약, 다음과 같은 앱에 고급 도구를 접목합니다. 아웃룩, 워드, 파워포인트. 그리고 Semafor에 따르면 Microsoft는 다음을 기대하고 있습니다. ChatGPT 제조사 OpenAI에 100억 달러 투자, 이미 상당한 자금을 투자한 회사입니다.

명백한 위험에도 불구하고 VALL-E와 같은 도구는 사고 후 사람들이 목소리를 회복하도록 돕는 등 의학 분야에서 특히 유용할 수 있습니다. 이러한 작은 입력 세트로 음성을 복제할 수 있다는 것은 올바르게 수행된다면 이러한 상황에서 매우 유망할 수 있습니다. 그러나 Microsoft와 타사 모두 AI에 모든 돈을 지출하고 있으므로 조만간 사라지지 않을 것이 분명합니다.

편집자의 추천

  • 최고 저자는 AI 회사에 자신의 작품 사용에 대한 대가를 요구합니다.
  • 최고의 AI 비디오 편집 도구
  • ChatGPT 제조사 OpenAI, 소비자 보호법 위반으로 FTC 조사에 직면
  • AI 혁신은 꿀벌의 뇌를 통해 이루어질 수 있다고 과학자들은 말합니다.
  • OpenAI는 초지능 AI의 사기 행위를 막기 위해 새로운 팀을 구성합니다.

당신의 라이프스타일을 업그레이드하세요Digital Trends는 독자들이 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 빠르게 변화하는 기술 세계를 계속해서 살펴볼 수 있도록 도와줍니다.