Siri와 Alexa가 사용하는 것과 같은 합성된 음성은 그날의 일기 예보나 날씨를 알려주는 데 적합합니다. 요리 타이머가 몇 분 남았는데, 단조롭고 단조로운 톤이 당신의 말을 읽어주기를 정말로 원하시나요? 오디오북? 아마도 그렇지 않을 것입니다. 이것이 바로 우리 대부분이 오디오북 수정을 위해 Audible과 같은 인간 음성 서비스를 사용하는 이유입니다. 그러나 인간 성우는 런던에 본사를 둔 스타트업의 선구적인 작업으로 인해 오랫동안 고개를 끄덕이지 못할 수도 있습니다. 딥젠.
인공지능 알고리즘을 활용하고, 기술력을 바탕으로 IBM의 파워 AI. 그리고 왓슨 기술, DeepZen은 처음 들을 때 사람처럼 들릴 뿐만 아니라 텍스트를 설득력 있게 읽는 데 필요한 감정적 신호를 포착할 수 있는 텍스트 음성 변환 도구를 개발했습니다. 이를 통해 오디오북 제작에 드는 시간과 비용을 최대 90%까지 줄일 수 있다고 회사 측은 주장한다.
추천 동영상
DeepZen의 CEO이자 공동 창업자인 Taylan Kamis는 Digital Trends에 “우리 시스템은 정말 혁명적입니다.”라고 말했습니다. “딥러닝과 신경망을 사용해 인간이 말하고 읽는 방식을 이해합니다. 그런 다음 텍스트를 읽을 때 올바른 감정과 억양을 적용할 위치를 인식할 수 있도록 시스템을 훈련시킵니다. 그 결과 실제와 매우 흡사한 인간다운 말이 탄생하게 되었습니다.”
관련된
- 착시 현상은 차세대 AI를 구축하는 데 도움이 될 수 있습니다
- 마무리: 과학자들이 로봇에게 인간과 같은 촉각을 부여하는 방법
- AI의 섬뜩할 정도로 아름다운 '종합 성서'를 읽어보세요. 그게 신이라고 생각하는 거야
필연적으로 이와 같은 작업은 최첨단 AI의 또 다른 예가 될 수 있습니다. 도구 인간의 직업을 위협하는. 이 경우 해당 직업에는 소수의 유명 인사가 달성할 수 있는 능력에도 불구하고 가장 꾸준하고 안정적인 경력을 갖고 있지 않은 배우가 포함됩니다. 이와 같은 소프트웨어가 성우의 미래에 영향을 미치지 않을 것이라고 생각하는 것은 순진한 생각일 것입니다. Kamis는 DeepZen과 같은 도구가 긍정적인 결과를 가져올 수 있는 많은 시나리오가 있다고 지적합니다. 인류.
예를 들어, 신인 작가나 큰 예산이 없는 출판사의 작품을 바탕으로 오디오북을 만드는 것이 가능해질 수 있습니다. 또한 난독증이 있거나 읽기에 어려움이 있는 사람들을 위한 우수한 텍스트 음성 변환 도구를 개발하는 데 도움이 될 수도 있습니다.
“미래에는 비디오 제작 산업을 위한 음성 해설 제작도 검토하고 있습니다. 게임뿐만 아니라 플레이어 경험을 향상시키기 위해 실시간 텍스트 음성 변환이 필요한 경우에도 마찬가지입니다.” Kami 말했다. “다른 언어도 검토하고 있습니다.”
시스템 샘플을 확인하실 수 있습니다. 여기.
편집자의 추천
- 보안 로봇이 가까운 학교에 올 수 있다
- AI가 실제로 지각을 갖게 되는 시점을 어떻게 알 수 있나요?
- 아날로그 AI? 이상하게 들리겠지만, 미래일 수도 있습니다
- AI의 미래: 향후 몇 년 동안 주목해야 할 4가지 주요 사항
- 이 기술은 20년 전에는 공상과학 소설이었습니다. 이제 현실이다
당신의 라이프스타일을 업그레이드하세요Digital Trends는 독자들이 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 빠르게 변화하는 기술 세계를 계속 확인할 수 있도록 도와줍니다.