5 რამ, რომელთანაც AI გამოსახულების გენერატორები კვლავ იბრძვიან

AI გამოსახულების გენერატორებს მოსწონთ დალ-ე, სტაბილური დიფუზია, შუა მოგზაურობა, და Bing გამოსახულების შემქმნელი იძლევა გასაოცარ შედეგებს, მაგრამ ზოგჯერ ისინი შეიძლება წარმოუდგენლად იმედგაცრუებული იყოს. მარტივი მოთხოვნით, რომელიც შეიცავს მხოლოდ რამდენიმე სიტყვას, AI-ს შეუძლია გამოაქვეყნოს შთამბეჭდავი სურათები, რომლებიც, როგორც ჩანს, არის პროფესიონალური ფოტოები და დამაჯერებელი ხელოვნება სხვადასხვა სტილში. თუმცა, იგივე მოწოდება ხანდახან შექმნის რაღაც საშინელ არსებას ან მხიარულად გაუმართავ რენდერს.

შინაარსი

  • ხელის სალათი და თითების ბურთულები
  • პრობლემური ტექსტი და წერა
  • თვალები არ აქვს
  • პრობლემური იარაღები
  • კოშმარული კბილები
  • AI ხელოვნება სწრაფად იხვეწება

უარყოფითმა მოთხოვნებმა შეიძლება შეამციროს ამ შეცდომების ალბათობა, მაგრამ სირთულე ყოველთვის ვერ გიშველის. ხელოვნური ინტელექტის ექსპერტებიც კი ებრძვიან არაფორმირებულ არსებებს და არაამქვეყნიურ სცენებს, რაც მოითხოვს ხანგრძლივი საათის დახვეწას ან სურათებს ტრადიციული ფოტო რედაქტორით. ამ დროისთვის, თუ ყურადღებით დააკვირდებით გამოსახულების სწორ უბნებს, დიდი შანსია, რომ შეძლოთ იმის დადგენა, არის თუ არა ის მანქანით შექმნილი.

რეკომენდებული ვიდეოები

ხელის სალათი და თითების ბურთულები

ხელოვნური ინტელექტის დეველოპერებმა მიაღწიეს პროგრესს ხელოვნური ინტელექტის ინსტრუმენტების სწავლებისთვის, თუ როგორ უნდა გამოიყურებოდეს ადამიანის ხელები, მაგრამ გასაუმჯობესებლად ბევრი ადგილია. თუ თითები არ არის გამოკვეთილი, ადვილია შეცდომების გამოტოვება, მაგრამ ეს მუდმივი პრობლემაა.

დაკავშირებული

  • სტაბილური დიფუზია მიზნად ისახავს მისი პრობლემის მოგვარებას თითების გენერირებით
  • ხელოვნური ინტელექტის მიერ გენერირებული ვიდეოები მოვიდა და ისინი სწრაფად ვითარდებიან
  • Bing Image Creator მოაქვს DALL-E AI-ით გენერირებული სურათები თქვენს ბრაუზერში
Dall-E იყო ადრეული AI ლიდერი, მაგრამ ხელები მისი საქმე არ არის.
Dall-E იყო ადრეული AI ლიდერი, მაგრამ ხელები მისი საქმე არ არის.დალ-ე ალან ტრულის მიერ მოწოდებული

ერთ-ერთი პირველი და საუკეთესო AI გამოსახულების გენერატორი, რომელიც ხელმისაწვდომია საზოგადოებისთვის, OpenAI-ის Dall-E, შექმნა ხელჩაკიდებული ადამიანების ეს სურათები. ერთი შეხედვით, შეიძლება კარგად გამოიყურებოდეს. უფრო მჭიდრო შემოწმებისას, გარკვეული პრობლემები აშკარა ხდება. უფრთხილდით ზედმეტი თითებს, უცნაურ ფრჩხილებს და შერწყმულ ციფრებს.

რთული ხელები და გადახლართული თითები კიდევ უფრო რთულია. არ გაგიკვირდეთ, თუ თქვენი AI სურათები დაბრუნდება კლასიკური ხარვეზებით, რომლებიც მოიხსენიება როგორც „ხელის სალათი“ ან „თითების ბურთულები“.

დალ-ე-ს გადახლართული ხელები შემაშფოთებელია.
დალ-ე-ის გადახლართული ხელები შემაშფოთებელია.დალ-ე ალან ტრულის მიერ მოწოდებული

პრობლემური ტექსტი და წერა

თქვენ შეიძლება ველოდოთ, რომ ტექსტი ადვილი იქნება კომპიუტერისთვის. თქვენ ხედავთ სიტყვების მტკიცებულებებს ეკრანებზე ყოველდღიურად, როდესაც იღებთ ტელეფონს ან გახსნით ბრაუზერს. ადრეული კომპიუტერები, განსხვავებით საუკეთესო სათამაშო კომპიუტერები დღეს, ვერ აჩვენა რაიმე სახის გრაფიკა. ყველაფერი იყო ტექსტი ან ნომრები.

ლეონარდო AI-მ იცის სტილები, მაგრამ დაბეჭდილი ტექსტი რთულია.
ლეონარდო AI-მ იცის სტილები, მაგრამ დაბეჭდილი ტექსტი რთულია.ლეონარდო ხელოვნური ინტელექტი ალან ტრულის მიერ

მაგრამ რეალური ასოებისა და სიმბოლოების ჩვენება, როგორც დაბეჭდილი ან დაწერილი სიტყვები, გასაოცრად სახიფათოა AI გამოსახულების გენერატორი. შეიძლება ჟღერდეს, როგორც ადვილი მოსაგვარებელი პრობლემა, მაგრამ ეს ასე არ არის. აპს არ შეუძლია უბრალოდ გადაფაროს უბრალო ტექსტი. დამაჯერებლად, ტექსტის სტილი, დაჩრდილვა, კუთხე და პერსპექტივა უნდა შეესაბამებოდეს დანარჩენ სცენას.

მაგალითში, შედარებით ახალმა ხელოვნური ინტელექტის გამოსახულების გენერატორი, ლეონარდო AI, დიდი ძალისხმევა გამოიჩინა ვინტაჟური ბილბორდით ჯეკ კურდღლის სლიმის სასადილოსთვის. მრავალჯერადი მცდელობის შემდეგ, AI-მ მოახერხა დაწერა "Jack Rabbit's", რაც საკმაოდ ახლოსაა მოთხოვნასთან. ვინტაჟური ფოტოგრაფიის სტილი თითოეულ გამოსახულებაში აშკარა იყო, მაგრამ ასოები და სიტყვები ძირითადად ხარვეზები იყო.

ლეონარდო AI ახლოს იყო ტექსტის სწორად მიღებასთან ერთ-ერთ ამ რენდერში.
ლეონარდო AI ახლოს იყო ტექსტის გასწორებასთან მარცხნივ რენდერში.ლეონარდო AI რენდერებს ალან ტრულის მიერ მოთხოვნილი

თვალები არ აქვს

Bing Image Creator ებრძვის თვალებს.
Bing გამოსახულების შემქმნელი ალან Truly-ს მიერ

ხშირად ამბობენ, რომ თვალები სულის სარკმელია. ჩვენ იმდენად ვეყრდნობით თვალის კონტაქტს, რომ ეს შეიძლება იყოს ყველაზე კრიტიკული დეტალი რეალისტური პორტრეტის შესაქმნელად. მაგრამ ხელოვნური ინტელექტის ბევრ ხელსაწყოს უჭირს ადამიანის თვალის დახატვა.

Bing Image Creator-მა ღირსეული სამუშაო შეასრულა სტუდიის ფონზე და მოახდინა მრავალთაობის ოჯახის ფოტო. თუმცა, თითქმის ყველა ადამიანს აქვს უცნაური თვალები, რომლებიც თითქოს უცხოპლანეტელებმა ჩასვეს, ან შესაძლოა ეს მომღიმარი ხალხი არამიწიერ არსებებად გარდაქმნის პროცესშია.

Bing Image Creator-ის თვალის პრობლემების ორი უფრო ახლო მაგალითი.
Bing Image Creator-ის თვალის შემაშფოთებელი პრობლემების ორი უფრო ახლო მაგალითი.Bing გამოსახულების შემქმნელი ალან Truly-ს მიერ

პრობლემური იარაღები

ადამიანები შესანიშნავნი არიან ინსტრუმენტებით და არა მხოლოდ ციფრული მრავალფეროვნებით, როგორიცაა AI. ჩვენ სწრაფად ვითვისებთ ჩვენს ხელთ არსებულ ნებისმიერ ფიზიკურ ინსტრუმენტს. მეორეს მხრივ, ხელოვნური ინტელექტი ცდილობს გაიგოს რა არის და როგორ გამოიყენება.

Midjourney-ს ხელები ესმის, მაგრამ საგონებელში ჩავარდნილი ქანჩები.
Midjourney-ს ესმის ხელები, მაგრამ საგონებელში ჩავარდნილი ქანჩები. ეს არის ნათურა ქვედა მარცხენა მხარეს?შუა მოგზაურობა ალან ტრულის მიერ

Midjourney არის AI გამოსახულების გენერატორი, რომელიც ფანტასტიკურ პროგრესს აღწევს ადამიანის სახეებთან და ხელებთან დაკავშირებული პრობლემების გადაჭრაში. თუმცა, როდესაც მოთხოვნილია აჩვენოს მექანიკოსს, რომელიც ამაგრებს ჭანჭიკს ქანჩით, ინსტრუმენტი სრულიად არ არის. ხელთათმანებს ერთ შემთხვევაში უმატებენ ფრჩხილებს, მეორეში კი რატომღაც ნათურა ჩნდება.

მაკრატელი ზედმეტად რთულია Bing Image Creator-ისთვის ამ ახლოდან მოჭრილი თმის რენდერში. ისინი მხოლოდ ერთ გამოსახულებაშია გახსნილი და არასოდეს ჩანს ჭრის პროცესში.

Bing Image Creator-ს არ შეუძლია მაკრატლის გარჩევა.
Bing Image Creator ვერ ხვდება როგორ მუშაობს მაკრატელი.Bing გამოსახულების შემქმნელი ალან Truly-ს მიერ

კოშმარული კბილები

ღიმილის სტაბილური დიფუზიური რენდერი ზოგჯერ ძალიან ბევრი კბილია.
სტაბილური დიფუზია ლეონარდო AI-ს მეშვეობით, ალან ტრულის მიერ მოწოდებული

როდესაც ადამიანები იღიმებიან და იცინიან, ეს ჩვეულებრივ აუმჯობესებს სურათს, ხდის მას სასიამოვნო და სახალისო. როდესაც აძლევენ მარტივ მოთხოვნას, როგორიცაა ორი სტუდენტი იღიმება და იცინის, AI-ს შეუძლია ეს კოშმარულ საწვავად გადააქციოს კბილების მრავალი რიგით და სხვა უცნაური დამახინჯებით.

Leonardo AI საშუალებას გაძლევთ აირჩიოთ რამდენიმე მოდელს შორის, ზოგი კი კარგად უმკლავდება კბილებს. პოპულარული სტაბილური დიფუზია 2.1 მოდელი სჭირდებოდა გარკვეული დახმარება კბილების გასასწორებლად. გარკვეული უარყოფითი მოწოდებით, საკითხი მოგვარდა. არსებობს AI გამოსახულების ამ პრობლემების გადაწყვეტა, მაგრამ კარგი შედეგის მისაღწევად მაინც საჭიროა მუშაობა.

სტაბილური დიფუზიური ღიმილი სარგებლობს უარყოფითი მოთხოვნით.
სტაბილური დიფუზიური ღიმილი სარგებლობს უარყოფითი მოთხოვნით, რათა ამოიღონ "უცნაური კბილები" და "დამახინჯებული პირი".სტაბილური დიფუზია ლეონარდო AI-ს მეშვეობით, ალან ტრულის მიერ მოწოდებული

AI ხელოვნება სწრაფად იხვეწება

ხელოვნური ინტელექტის ხელოვნების ადრეულ დღეებში შედეგები იყო უცნაური და მშვენიერი, რაც ქმნიდა სილამაზესა და საშინელებას თანაბარი მიტოვებით. შეცდომები სულ უფრო ნაკლებად შესამჩნევი ხდება ყოველი ახალი განახლებით და ბევრი პრობლემის დაძლევა შესაძლებელია გარკვეული დახვეწით.

თან ამდენი AI ინსტრუმენტი ხელმისაწვდომია, ადვილია სხვა სისტემის ცდა. ბევრი AI გამოსახულების გენერატორი იძლევა უარყოფით მოთხოვნებს ან სხვა ვარიანტებს ალგორითმის კორექტირებისთვის და უკეთესი შედეგების მისაღებად.

გამოსაყენებელი სურათის მისაღებად შეიძლება დაგჭირდეთ რამდენიმე მცდელობა, განსაკუთრებით იმ შემთხვევაში, თუ აქცენტი კეთდება სახეებზე ან ხელებზე. როდესაც გსურთ ბეჭდური ან წერილობითი სიტყვების ჩასმა, მოემზადეთ გამოსახულების რედაქტორში დროის გასატარებლად, ხელოვნური ინტელექტის უაზრო ასოების წაშლაში და სწორ ტექსტში შერევით.

კარგი ამბავი ის არის, რომ ბევრი AI გამოსახულების გენერატორი უფასოა და გამოწერის მოდელები შედარებით იაფია. ერთი წლის განმავლობაში, ეს ხანგრძლივი პრობლემები შეიძლება მოგვარდეს, რაც საშუალებას მოგცემთ გამოიყენოთ AI რენდერი, როგორც მზა ნამუშევარი ან ფოტოს შემცვლელი.

რედაქტორების რეკომენდაციები

  • Midjourney-ის ახალი მასშტაბის ფუნქცია ხდება შემდეგი დიდი AI სენსაცია
  • განახლებული Bing Chat ახტებს ChatGPT-ს 6 მნიშვნელოვანი ახალი გზით
  • ხელოვნური ინტელექტის ამ ვირუსულმა სურათმა მოატყუა მსოფლიო და შესაძლოა ის უკვე ნანახი გქონდეთ
  • Grammarly-ის ახალ ChatGPT-ის მსგავსი AI გენერატორს შეუძლია ბევრად მეტი გააკეთოს, ვიდრე თქვენი ნაწერის კორექტირება
  • მე ვნახე AI ვებ ძიების (შორეული) მომავალი – აი, სად არის ის საოცარი და სად იბრძვის

განაახლეთ თქვენი ცხოვრების წესიDigital Trends ეხმარება მკითხველს თვალყური ადევნონ ტექნოლოგიების სწრაფ სამყაროს ყველა უახლესი სიახლეებით, სახალისო პროდუქტების მიმოხილვებით, გამჭრიახი რედაქციებითა და უნიკალური თვალით.

კატეგორიები

Ბოლო

10 წლის წინ, Breaking Bad-მა შექმნა თავისი უდიდესი ეპიზოდი

10 წლის წინ, Breaking Bad-მა შექმნა თავისი უდიდესი ეპიზოდი

AMCიმ მომენტიდან Breaking Bad დაიწყო, მაყურებლე...

ჩვენ შევქმენით ჩვენი Nintendo Switch 2 გაშვების თამაშის ოცნების სია

ჩვენ შევქმენით ჩვენი Nintendo Switch 2 გაშვების თამაშის ოცნების სია

ჩვენ ოფიციალურად ვართ "ახალ კონსოლის საათზე". ც...

ერთადერთი სათამაშო ლეპტოპი, რომელიც უნდა იყიდოთ 2023 წელს

ერთადერთი სათამაშო ლეპტოპი, რომელიც უნდა იყიდოთ 2023 წელს

არ ვაპირებ მოტყუებას: ბევრია შესანიშნავი სათამა...