5 cose con cui i generatori di immagini AI hanno ancora problemi

I generatori di immagini AI come Dall-E, Diffusione stabile, A metà viaggio, E Creatore di immagini Bing producono risultati sorprendenti, ma a volte possono essere incredibilmente frustranti. Con semplici suggerimenti contenenti solo poche parole, un'intelligenza artificiale può produrre immagini impressionanti che sembrano essere fotografie professionali e opere d'arte convincenti in vari stili. Tuttavia, lo stesso prompt creerà occasionalmente alcune creature orribili o un rendering esilarantemente imperfetto.

Contenuti

  • Insalata di mano e polpastrelli
  • Testo e scrittura inquietanti
  • Gli occhi non ce l'hanno
  • Strumenti fastidiosi
  • Denti da incubo
  • L'arte dell'intelligenza artificiale sta migliorando rapidamente

I prompt negativi potrebbero aiutare a ridurre la probabilità di questi errori, ma la complessità non può sempre salvarti. Anche gli esperti di intelligenza artificiale lottano con creature deformi e scene non mondane, che richiedono lunghe ore di perfezionamento dei suggerimenti o ritocco delle immagini con un editor di foto tradizionale. Per il momento, se guardi attentamente nelle aree giuste di un'immagine, ci sono buone probabilità che tu possa identificare se è stata creata da una macchina.

Video consigliati

Insalata di mano e polpastrelli

Gli sviluppatori di intelligenza artificiale hanno fatto progressi nella lotta per insegnare agli strumenti di intelligenza artificiale come dovrebbero apparire le mani umane, ma c'è molto spazio per miglioramenti. Se le dita non sono ben visibili, è facile perdere errori, ma è un problema continuo.

Imparentato

  • Stable Diffusion mira a risolvere il suo problema con la generazione delle dita
  • I video generati dall'intelligenza artificiale sono arrivati ​​e si stanno evolvendo rapidamente
  • Bing Image Creator porta le immagini generate da DALL-E AI nel tuo browser
Dall-E è stato uno dei primi leader dell'IA, ma le mani non fanno per lui.
Dall-E è stato uno dei primi leader dell'IA, ma le mani non fanno per lui.Dall-E suggerito da Alan Truly

Uno dei primi e migliori generatori di immagini AI disponibili al pubblico, Dall-E di OpenAI, ha creato queste immagini di persone che si tengono per mano. A prima vista, potrebbe sembrare a posto. A un esame più attento, alcuni problemi diventano evidenti. Fai attenzione alle dita extra, alle unghie strane e alle dita unite.

Le impugnature complicate e le dita intrecciate sono ancora più impegnative. Non sorprenderti se le tue immagini AI tornano con i classici problemi noti come "insalata di mani" o "palline di dita".

Le mani intrecciate di Dall-E sono inquietanti.
Le mani intrecciate di Dall-E sono inquietanti.Dall-E suggerito da Alan Truly

Testo e scrittura inquietanti

Potresti aspettarti che il testo sia facile da generare per un computer. Vedi prove di parole sugli schermi ogni giorno quando alzi il telefono o apri un browser. I primi computer, a differenza i migliori PC da gioco di oggi, non poteva visualizzare grafica di alcun tipo. Tutto era testo o numeri.

Leonardo AI conosce gli stili ma il testo stampato è impegnativo.
Leonardo AI conosce gli stili, ma il testo stampato è impegnativo.Leonardo AI suggerito da Alan Truly

Eppure visualizzare lettere e simboli reali come parole stampate o scritte è sorprendentemente complicato per un Generatore di immagini AI. Potrebbe sembrare un problema facile da risolvere, ma non lo è. Un'app non può semplicemente sovrapporre il testo normale. Per essere convincenti, lo stile del testo, l'ombreggiatura, l'angolazione e la prospettiva devono corrispondere al resto della scena.

Nell'esempio, un generatore di immagini AI relativamente nuovo, Leonardo AI, ha compiuto uno sforzo coraggioso con un cartellone pubblicitario vintage per la tavola calda di Jack Rabbit Slim. Dopo diversi tentativi, l'intelligenza artificiale è riuscita a pronunciare "Jack Rabbit's", che è abbastanza vicino alla richiesta. Lo stile della fotografia vintage era perfetto in ogni immagine, ma le lettere e le parole erano per lo più imperfette.

Leonardo AI è arrivato vicino a ottenere il testo giusto in uno di questi rendering.
Leonardo AI si è avvicinato alla correzione del testo nel rendering a sinistra.I rendering di Leonardo AI suggeriti da Alan Truly

Gli occhi non ce l'hanno

Bing Image Creator ha problemi con gli occhi.
Bing Image Creator suggerito da Alan Truly

Si dice spesso che gli occhi siano lo specchio dell'anima. Facciamo così tanto affidamento sul contatto visivo che potrebbe essere il dettaglio più critico nella creazione di un ritratto realistico. Ma molti strumenti di intelligenza artificiale hanno difficoltà a rendere gli occhi umani.

Bing Image Creator ha fatto un lavoro decente con lo sfondo dello studio e ha posato una foto di famiglia multigenerazionale. Tuttavia, quasi ogni persona ha occhi bizzarri che sembrano essere stati inseriti dagli alieni, o forse queste persone sorridenti si stanno trasformando in creature soprannaturali.

Due esempi più ravvicinati dei problemi agli occhi di Bing Image Creator.
Due esempi più ravvicinati dei fastidiosi problemi agli occhi di Bing Image Creator.Bing Image Creator suggerito da Alan Truly

Strumenti fastidiosi

Gli esseri umani sono fantastici con gli strumenti e non solo con la varietà digitale come l'IA. Padroneggiamo rapidamente qualsiasi strumento fisico alla nostra portata. Un'intelligenza artificiale, d'altra parte, fatica a capire cosa sono e come vengono utilizzati.

Midjourney capisce le mani ma è sconcertato dalle chiavi inglesi.
Midjourney comprende le mani, ma è sconcertato dalle chiavi inglesi. Quella in basso a sinistra è una lampadina?A metà viaggio suggerito da Alan Truly

Midjourney è un generatore di immagini AI che sta facendo progressi fantastici nella risoluzione di problemi con volti e mani umane. Tuttavia, quando viene richiesto di mostrare un meccanico che stringe un bullone con una chiave inglese, lo strumento è del tutto assente. Le unghie vengono aggiunte ai guanti in un caso e una lampadina appare in qualche modo in un altro.

Le forbici sono troppo complicate per Bing Image Creator in questo rendering in primo piano di capelli tagliati. Sono aperti solo in un'immagine e non sembrano mai essere nell'atto di tagliare.

Bing Image Creator non riesce a capire le forbici.
Bing Image Creator non riesce a capire come funzionano le forbici.Bing Image Creator suggerito da Alan Truly

Denti da incubo

Diffusione stabile I rendering dei sorrisi a volte hanno troppi denti.
Diffusione stabile tramite Leonardo AI, suggerita da Alan Truly

Quando le persone sorridono e ridono, questo di solito migliora un'immagine, rendendola piacevole e divertente. Quando viene dato un semplice suggerimento come due studenti che sorridono e ridono, un'intelligenza artificiale può trasformarlo in carburante da incubo con più file di denti e altre strane distorsioni.

Leonardo AI ti consente di scegliere tra diversi modelli e alcuni gestiscono bene i denti. Il popolare Modello a diffusione stabile 2.1 aveva bisogno di aiuto per rimettere i denti a posto. Con qualche suggerimento negativo, il problema è stato risolto. Esistono soluzioni a questi problemi di immagine AI, ma ci vuole ancora del lavoro per ottenere buoni risultati.

I sorrisi Stable Diffusion beneficiano di suggerimenti negativi.
I sorrisi Stable Diffusion beneficiano di suggerimenti negativi per rimuovere "denti strani" e "bocca distorta".Diffusione stabile tramite Leonardo AI, suggerita da Alan Truly

L'arte dell'intelligenza artificiale sta migliorando rapidamente

Agli albori dell'arte dell'intelligenza artificiale, i risultati erano strani e meravigliosi, creando bellezza e orrore con uguale abbandono. Gli errori stanno diventando meno evidenti con ogni nuovo aggiornamento e molti problemi possono essere superati con un po' di raffinatezza.

Con così tanti strumenti AI disponibili, è facile provare un altro sistema. Molti generatori di immagini AI consentono prompt negativi o altre opzioni per regolare l'algoritmo e ottenere risultati migliori.

Potrebbe essere necessario eseguire diversi tentativi per ottenere un'immagine utilizzabile, in particolare se c'è un focus su volti o mani. Quando vuoi includere parole stampate o scritte, preparati a trascorrere del tempo in un editor di immagini cancellando le lettere senza senso dell'IA e mescolando il testo corretto.

La buona notizia è che molti generatori di immagini AI sono gratuiti e i modelli di abbonamento sono relativamente economici. Entro un anno, questi problemi persistenti potrebbero essere risolti, consentendoti di utilizzare un rendering AI come opera d'arte finita o un sostituto per una fotografia.

Raccomandazioni della redazione

  • La nuova funzione di zoom indietro di Midjourney sta diventando la prossima grande sensazione di intelligenza artificiale
  • La chat di Bing aggiornata scavalca ChatGPT in 6 nuovi modi importanti
  • Questa immagine AI virale ha ingannato il mondo e potresti averla già vista
  • Il nuovo generatore di intelligenza artificiale simile a ChatGPT di Grammarly può fare molto di più che correggere le bozze della tua scrittura
  • Ho visto il (lontano) futuro della ricerca web basata sull'intelligenza artificiale: qui è incredibile e dove fa fatica

Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, recensioni divertenti sui prodotti, editoriali penetranti e anticipazioni uniche.