Model języka Midjourney v5 dodaje realizmu ludzkim dłoniom

Midjourney v5 to najnowszy model językowy popularnego generatora zamiany tekstu na obraz, znanego z realistycznych kreacji.

The aktualizacja została wdrożona w środę do płatnej bazy klientów Midjourney, a wielu użytkowników, w tym projektantka graficzna Julie Wieland, udostępniało swoje nowe grafiki wygenerowane przez sztuczną inteligencję. Szczegóły sztucznej inteligencji, które niesie ze sobą model języka v5, obejmują lepszą „wydajność, spójność i jakość” – powiedział Midjourney na swojej stronie internetowej.

Tylko jedna informacja – sztuczna inteligencja Midjourney może teraz poprawnie układać ręce. Bądź szczególnie krytyczny wobec wszelkich obrazów politycznych (zwłaszcza fotografii), które widzisz w Internecie i które próbują wywołać reakcję. pic.twitter.com/ebEagrQAQq

— Del Walker (@TheCartelDel) 16 marca 2023 r

Wielu użytkowników szczególnie zauważyło poprawę szczegółów ludzkiej dłoni, przy czym badani częściej mieli po pięć palców w każdej dłoni. W poprzednich modelach ludzkie dłonie często zawierały nieprawidłową liczbę cyfr, wahającą się od czterech do siedmiu i dziesięciu. Ci, którzy mieli okazję przetestować Midjourney v5, byli pod wrażeniem ulepszeń wizualnych.

Polecane filmy

„Najnowszy model Midjourney v5 jest zarówno niezwykle przytłaczający/przerażający, jak i niezwykle fascynujący” – powiedział Wieland PetaPixel.

„Jego zdolność do odtwarzania skomplikowanych szczegółów i tekstur, takich jak realistyczna tekstura skóry/rysy twarzy i oświetlenie, jest niezrównana” – dodała.

Chociaż Midjourney jest nieco unikalnym modelem językowym, działa w podobny sposób jak inne generatory tekstu na obraz, takie jak Stabilna dyfuzja i DALL-E, używając słownych deskryptorów podpowiedzi do tworzenia obrazów zgodnie z modelem, który jest szkolony na podstawie sztuki stworzonej przez człowieka jako odniesienia, zgodnie z ArsTechnica.

Trwa debata na temat tego, czy sztuka generowana przez sztuczną inteligencję jest legalna czy etyczna; jednak wielu użytkowników Midjourney v5 uważa, że ​​w przypadku ciągłych aktualizacji może on być nie do odróżnienia od prawdziwej sztuki i fotografii. Wieland uważa, że ​​generatory obrazów AI, takie jak Midjourney, będą prawdopodobnie raczej towarzyszami fotografów niż zamiennikami.

Midjourney v5 już jest! (tym razem naprawdę, lol)

Oto kilka zestawień moich podpowiedzi, wersja 4 i wersja 5, a także kilka nowych podpowiedzi i ujęć tłumu. Dodam do tego więcej w trakcie eksperymentów.

🧵 pic.twitter.com/qSEZWQBXou

— Nick St. Pierre (@nickfloats) 15 marca 2023 r

Jednak Midjourney v5 nie jest pozbawiony błędów. Twórca obrazów AI, Nick St. Pierre, udostępnił wiele swoich prac, do których wykorzystał te same podpowiedzi w poprzednich wersjach Midjourney v4 i Midjourney v5. Jedno ze zdjęć przedstawiało fascynujące ujęcie młodych kobiet w stylu ulicznym z lat 60. XX wieku, przypominającym sesję mody na świeżym powietrzu. Po bliższym przyjrzeniu się można dostrzec w tle pływające ręce, które nie są przymocowane do ciał, a także zniekształcone twarze.

W swoim najnowszym modelu v5 założyciel Midjourney, David Holz, zalecił na Discordzie marki, aby użytkownicy unikali krótkich podpowiedzi na rzecz „dłuższego, bardziej wyraźnego tekstu”, aby uzyskać lepsze wyniki.

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.