AI 이미지 생성기가 여전히 어려움을 겪는 5가지

다음과 같은 AI 이미지 생성기 달이, 안정적인 확산, 중도, 그리고 빙 이미지 크리에이터 놀라운 결과를 얻을 수 있지만 때로는 매우 실망스러울 수 있습니다. 몇 단어만 포함된 간단한 프롬프트로 AI는 전문적인 사진처럼 보이는 인상적인 이미지와 설득력 있는 예술을 다양한 스타일로 출력할 수 있습니다. 그러나 동일한 프롬프트가 때때로 끔찍한 생물체나 유감스럽게도 결함이 있는 렌더링을 생성합니다.

내용물

  • 핸드 샐러드와 손가락 공
  • 텍스트 및 쓰기 문제
  • 눈이 없다.
  • 귀찮은 도구
  • 악몽의 이빨
  • AI 예술이 빠르게 발전하고 있습니다.

부정적인 프롬프트는 이러한 오류의 가능성을 줄이는 데 도움이 될 수 있지만 복잡성이 항상 당신을 구할 수는 없습니다. AI 전문가조차도 기형 생물과 비현실적인 장면으로 어려움을 겪습니다. 기존 사진 편집기로 이미지를 다듬거나 수정하는 데 오랜 시간이 필요합니다. 당분간은 이미지의 올바른 영역을 주의 깊게 살펴보면 기계로 만든 것인지 식별할 수 있는 좋은 기회가 있습니다.

추천 동영상

핸드 샐러드와 손가락 공

AI 개발자들은 인간의 손이 어떻게 보여야 하는지 인공 지능 도구를 가르치는 데 진전을 이루었지만 개선의 여지가 많습니다. 손가락이 눈에 잘 띄지 않으면 오류를 놓치기 쉽지만 계속되는 문제입니다.

관련된

  • Stable Diffusion은 손가락 생성 문제를 해결하는 것을 목표로 합니다.
  • AI로 생성된 비디오가 도착했으며 빠르게 진화하고 있습니다.
  • Bing Image Creator는 DALL-E AI 생성 이미지를 브라우저로 가져옵니다.
Dall-E는 초기 AI 리더였지만 손은 그것의 것이 아닙니다.
Dall-E는 초기 AI 리더였지만 손은 그의 것이 아닙니다.Alan Truly가 제안한 Dal-E

대중에게 제공되는 최초이자 최고의 AI 이미지 생성기 중 하나인 OpenAI의 DALL-E, 손을 잡고 있는 사람들의 사진을 만들었습니다. 언뜻 보면 괜찮아 보일 수 있습니다. 자세히 살펴보면 몇 가지 문제가 분명해집니다. 여분의 손가락, 이상한 손톱, 병합된 숫자에 주의하십시오.

복잡한 그립과 얽힌 손가락은 훨씬 더 어렵습니다. AI 이미지가 "핸드 샐러드" 또는 "손가락 공"이라고 하는 고전적인 결함과 함께 반환되더라도 놀라지 마십시오.

Dall-E의 엇갈린 손이 불안합니다.
달이의 엇갈린 손이 불안하다.Alan Truly가 제안한 Dal-E

텍스트 및 쓰기 문제

텍스트는 컴퓨터에서 생성하기 쉬울 것이라고 예상할 수 있습니다. 전화를 받거나 브라우저를 열면 매일 화면에 단어의 증거가 표시됩니다. 초기 컴퓨터와 달리 최고의 게이밍 PC 어떤 종류의 그래픽도 표시할 수 없습니다. 모든 것이 텍스트 또는 숫자였습니다.

Leonardo AI는 스타일을 알고 있지만 인쇄된 텍스트는 어렵습니다.
Leonardo AI는 스타일을 알고 있지만 인쇄된 텍스트는 어렵습니다.Alan Truly가 제안한 Leonardo AI

그러나 실제 문자와 기호를 인쇄되거나 쓰여진 단어로 표시하는 것은 놀랍도록 까다롭습니다. AI 이미지 생성기. 해결하기 쉬운 문제처럼 들릴지 모르지만 그렇지 않습니다. 앱은 일반 텍스트를 오버레이할 수 없습니다. 설득력을 얻으려면 텍스트 스타일, 음영, 각도 및 원근이 장면의 나머지 부분과 일치해야 합니다.

이 예에서는 비교적 새로운 AI 이미지 생성기인 Leonardo AI가 Jack Rabbit Slim의 식당을 위한 빈티지 광고판으로 용감한 노력을 기울였습니다. 여러 번 시도한 후 AI는 요청에 매우 가까운 "Jack Rabbit's"를 철자하는 데 성공했습니다. 빈티지 사진 스타일은 각 이미지에서 정확했지만 글자와 단어에는 대부분 결함이 있었습니다.

Leonardo AI는 이러한 렌더링 중 하나에서 텍스트를 거의 정확하게 가져왔습니다.
Leonardo AI는 왼쪽의 렌더링에서 텍스트를 거의 수정했습니다.Alan Truly가 제안한 Leonardo AI 렌더링

눈이 없다.

Bing Image Creator는 눈으로 고생합니다.
Alan Truly가 제안한 Bing Image Creator

흔히 눈은 마음의 창이라고 합니다. 사실적인 인물 사진을 만드는 데 가장 중요한 세부 사항이 될 수 있도록 눈맞춤에 크게 의존합니다. 그러나 많은 AI 도구는 인간의 눈을 렌더링하는 데 어려움이 있습니다.

Bing 이미지 크리에이터는 스튜디오 배경과 여러 세대의 가족 사진을 잘 처리했습니다. 그러나 거의 모든 사람은 외계인이 삽입한 것 같은 기이한 눈을 가지고 있거나 미소를 짓고 있는 이 사람들은 이 세상의 생명체로 변해가는 과정에 있습니다.

Bing Image Creator의 눈 문제에 대한 두 가지 더 가까운 예입니다.
Bing Image Creator의 불안한 눈 문제에 대한 두 가지 더 가까운 예입니다.Alan Truly가 제안한 Bing Image Creator

귀찮은 도구

인간은 AI와 같은 디지털 다양성뿐만 아니라 도구에 능숙합니다. 우리는 손에 닿는 모든 물리적 도구를 빠르게 마스터합니다. 반면에 AI는 자신이 무엇이며 어떻게 사용되는지 이해하기 위해 고군분투합니다.

Midjourney는 손을 이해하지만 렌치는 의아해합니다.
Midjourney는 손을 이해하지만 렌치는 의아해합니다. 왼쪽 하단에 전구인가요?Alan Truly가 제안한 Midjourney

Midjourney는 인간의 얼굴과 손으로 문제를 해결하는 데 환상적인 진전을 이루고 있는 AI 이미지 생성기입니다. 그러나 렌치로 볼트를 조이는 기계공을 보여 달라는 메시지가 표시되면 도구가 전혀 없습니다. 어떤 경우에는 장갑에 손톱이 추가되고 다른 경우에는 전구가 나타납니다.

가위는 자르는 머리카락의 클로즈업 렌더링에서 Bing Image Creator에 너무 복잡합니다. 그것들은 하나의 이미지 안에서만 열려 있을 뿐 결코 자르는 행위로 보이지 않는다.

Bing Image Creator는 가위를 알아낼 수 없습니다.
Bing Image Creator는 가위 작동 방식을 파악할 수 없습니다.Alan Truly가 제안한 Bing Image Creator

악몽의 이빨

미소의 안정적인 확산 렌더에는 때때로 치아가 너무 많습니다.
Alan Truly가 제안한 Leonardo AI를 통한 안정적인 확산

사람들이 미소를 짓고 웃으면 대개 그림이 좋아지고 즐겁고 재미있어집니다. 두 학생이 웃고 웃는 것과 같은 간단한 프롬프트가 주어지면 AI는 이것을 여러 줄의 이빨과 다른 이상한 왜곡이 있는 악몽의 연료로 바꿀 수 있습니다.

Leonardo AI를 사용하면 여러 모델 중에서 선택할 수 있으며 일부는 치아를 잘 처리합니다. 인기있는 안정적인 확산 2.1 모델 올바른 치아를 얻기 위해 약간의 도움이 필요했습니다. 일부 부정적인 메시지로 문제가 해결되었습니다. 이러한 AI 이미지 문제에 대한 솔루션이 있지만 좋은 결과를 얻으려면 여전히 작업이 필요합니다.

안정적인 확산 미소는 부정적인 프롬프트의 이점을 얻습니다.
안정적인 확산 미소는 "이상한 치아"와 "비뚤어진 입"을 제거하라는 부정적인 프롬프트의 이점을 얻습니다.Alan Truly가 제안한 Leonardo AI를 통한 안정적인 확산

AI 예술이 빠르게 발전하고 있습니다.

AI 예술의 초기에는 그 결과가 이상하고 훌륭했으며, 아름다움과 공포를 똑같이 포기했습니다. 새로운 업데이트가 있을 때마다 오류가 눈에 띄지 않게 되고 있으며 일부 개선을 통해 많은 문제를 극복할 수 있습니다.

와 함께 사용 가능한 많은 AI 도구, 다른 시스템을 시도하기 쉽습니다. 많은 AI 이미지 생성기는 부정적인 프롬프트 또는 기타 옵션을 허용하여 알고리즘을 조정하고 더 나은 결과를 얻습니다.

특히 얼굴이나 손에 초점이 있는 경우 사용 가능한 사진을 얻으려면 여러 번 시도해야 할 수 있습니다. 인쇄된 단어나 서면 단어를 포함하려면 이미지 편집기에서 AI의 의미 없는 문자를 지우고 올바른 텍스트에 혼합하는 데 시간을 할애할 준비를 하세요.

좋은 소식은 많은 AI 이미지 생성기가 무료이고 구독 모델이 상대적으로 저렴하다는 것입니다. 1년 이내에 이러한 남아 있는 문제가 해결되어 AI 렌더를 완성된 예술 작품으로 사용하거나 사진으로 대체.

편집자 추천

  • Midjourney의 새로운 축소 기능은 차세대 AI 센세이션이 되고 있습니다.
  • 업데이트된 Bing Chat은 6가지 중요한 새로운 방식으로 ChatGPT를 뛰어 넘습니다.
  • 이 바이럴 AI 이미지는 세상을 속였고 이미 보셨을 것입니다.
  • Grammarly의 새로운 ChatGPT와 유사한 AI 생성기는 글을 교정하는 것보다 더 많은 일을 할 수 있습니다.
  • 저는 AI 웹 검색의 (먼) 미래를 보았습니다. 여기가 놀라운 부분과 어려움을 겪고 있는 부분입니다.

라이프스타일을 업그레이드하세요Digital Trends는 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 독자가 빠르게 변화하는 기술 세계를 파악할 수 있도록 도와줍니다.