와 함께 챗봇 그리고 텍스트-이미지 생성기 인터넷을 폭풍으로 몰아넣은 AI의 다음 개척지는 텍스트-비디오 생성기일 수 있습니다.
Nvidia는 최근 자사의 실험에 대해 "잠재 확산 모델을 사용한 고해상도 비디오 합성"이라는 연구 논문을 발표했습니다. 토론토 AI 연구소에서는 Stable Diffusion을 사용하여 텍스트 프롬프트에서 움직이는 예술 결과를 만들 수 있는 도구를 만드는 방법을 자세히 설명합니다.
추천 동영상
이 기술 회사는 대량의 컴퓨터 처리 없이 텍스트를 사용하여 비디오 클립을 생성하는 LDM(잠재 확산 모델)의 데모를 선보였습니다. 기술 레이더 유명한.
이 도구는 1,280 x 2,048 해상도에서 약 4.7초 길이의 동영상인 GIF 스타일 동영상을 생성할 수 있습니다. 연구 논문에 따르면 512 x 1024의 낮은 해상도에서도 긴 동영상을 제작할 수 있다고 합니다.
TechRadar는 이 기술의 데모를 본 후 이 도구가 현재 시점에서 텍스트-GIF 생성기로 이상적일 가능성이 높다고 말했습니다. 출판물에서는 다음과 같은 간단한 프롬프트를 쉽게 처리할 수 있다고 언급했습니다. 해변에서 진공청소기를 청소하는 폭풍우 조종사 또는 테디베어가 일렉트릭 기타를 연주하고 있다, 고화질 4K. 그럼에도 불구하고 결과는 여전히 무작위 아티팩트와 GIF에 번짐을 생성했으며, 이는 다음과 같이 정기적으로 사용되는 다른 AI 도구에서 흔히 발생합니다. 중간 여정.
이 출판물은 긴 비디오가 황금 시간대에 도달하기 전에 여전히 조금 더 개발이 필요하다고 생각하지만 Nvidia가 기술을 준비하기 위해 신속하게 노력할 것이라고 생각합니다. 스톡 라이브러리 및 유사한 목적에 적합할 수 있습니다.
AI 텍스트-비디오 생성기를 실험하는 다른 회사도 있습니다. Google은 20초 길이의 클립을 생성하는 더 긴 프롬프트를 허용하는 Phenaki 생성기를 시연했습니다. Runway라는 또 다른 스타트업은 지난달 Stable Diffusion을 기반으로 하는 2세대 비디오 모델을 발표했습니다. 프롬프트 데모 뉴욕시 로프트 창문을 통해 엿보는 늦은 오후의 태양 스틸 이미지에 약간의 움직이는 효과를 추가하는 방법을 보여줍니다.
TechRadar에 따르면 사용자는 Adobe Firefly 및 Adobe Premiere Rush와 같은 다른 프로그램에 AI를 추가함으로써 이점을 얻을 수도 있습니다.
다음과 같은 다른 회사들 나라케트와 루메5, 텍스트-비디오 생성기를 보유하고 있다고 홍보합니다. 그러나 이러한 도구 중 다수는 PowerPoint 프레젠테이션과 유사하게 작동하여 텍스트, 오디오, 고유한 이미지를 생성하는 대신 프롬프트가 포함된 이미 제작된 비디오 클립도 있을 수 있습니다. 일하다.
편집자의 추천
- AI 혁신은 꿀벌의 뇌를 통해 이루어질 수 있다고 과학자들은 말합니다.
- Nvidia가 ChatGPT 스타일의 AI를 비디오 게임에 도입하고 있는데 벌써부터 걱정이 됩니다.
- 생성 AI가 '더 넓고, 더 크고, 더 깊은 세계'를 갖춘 게임을 만드는 방법
- ChatGPT와 같은 생성 AI 도구 사용을 중단하고 삼성은 직원에게 지시합니다.
- Microsoft의 새로운 Designer 앱으로 생성 AI를 간단하게 만듭니다.
당신의 라이프스타일을 업그레이드하세요Digital Trends는 독자들이 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 빠르게 변화하는 기술 세계를 계속해서 살펴볼 수 있도록 도와줍니다.