KI-Bildgeneratoren mögen Dall-E, Stabile Verbreitung, Mitten auf der Reise, Und Bing Image Creator führen zu erstaunlichen Ergebnissen, können aber manchmal unglaublich frustrierend sein. Mit einfachen Eingabeaufforderungen, die nur wenige Wörter umfassen, kann eine KI beeindruckende Bilder ausgeben, die wie professionelle Fotos und überzeugende Kunst in verschiedenen Stilrichtungen wirken. Allerdings führt die gleiche Eingabeaufforderung gelegentlich zu einer schrecklichen Kreatur oder einer urkomisch fehlerhaften Darstellung.
Inhalt
- Handsalat und Fingerballen
- Beunruhigender Text und Schreibstil
- Die Augen haben es nicht
- Störende Werkzeuge
- Albtraumzähne
- Die KI-Kunst verbessert sich rasant
Negative Aufforderungen können dazu beitragen, die Wahrscheinlichkeit dieser Fehler zu verringern, aber Komplexität kann Sie nicht immer retten. Sogar KI-Experten haben mit missgestalteten Kreaturen und weltfremden Szenen zu kämpfen und müssen stundenlang Eingabeaufforderungen verfeinern oder Bilder mit einem herkömmlichen Bildbearbeitungsprogramm nachbessern. Wenn Sie vorerst die richtigen Bereiche eines Bildes genau betrachten, besteht eine gute Chance, dass Sie erkennen können, ob es von einer Maschine erstellt wurde.
Empfohlene Videos
Handsalat und Fingerballen
KI-Entwickler haben Fortschritte gemacht, wenn es darum geht, künstlichen Intelligenzwerkzeugen beizubringen, wie menschliche Hände aussehen sollten, aber es gibt noch viel Raum für Verbesserungen. Wenn die Finger nicht hervorstechen, kann es leicht passieren, dass Fehler übersehen werden, aber das ist ein anhaltendes Problem.
Verwandt
- Stable Diffusion zielt darauf ab, das Problem der Fingergenerierung zu beheben
- KI-generierte Videos sind angekommen und entwickeln sich schnell weiter
- Bing Image Creator bringt von DALL-E AI generierte Bilder in Ihren Browser
Einer der ersten und besten KI-Bildgeneratoren, die der Öffentlichkeit zugänglich sind, Dall-E von OpenAIEr hat diese Bilder von Händchen haltenden Menschen geschaffen. Auf den ersten Blick könnte es gut aussehen. Bei näherer Betrachtung werden einige Probleme deutlich. Hüten Sie sich vor überzähligen Fingern, seltsamen Fingernägeln und verschmolzenen Fingern.
Komplizierte Griffe und verschränkte Finger stellen eine noch größere Herausforderung dar. Seien Sie nicht überrascht, wenn Ihre KI-Bilder klassische Störungen aufweisen, die als „Handsalat“ oder „Fingerballen“ bezeichnet werden.
Beunruhigender Text und Schreibstil
Man könnte annehmen, dass Text für einen Computer einfach zu generieren wäre. Sie sehen täglich Hinweise auf Wörter auf Bildschirmen, wenn Sie zum Telefon greifen oder einen Browser öffnen. Im Gegensatz zu frühen Computern Die Top-Gaming-PCs von heute konnte keine Grafiken jeglicher Art anzeigen. Alles war Text oder Zahlen.
Doch die Darstellung tatsächlicher Buchstaben und Symbole als gedruckte oder geschriebene Wörter ist für einen überraschend schwierig KI-Bildgenerator. Es hört sich vielleicht wie ein leicht zu lösendes Problem an, ist es aber nicht. Eine App kann nicht einfach einfachen Text überlagern. Um zu überzeugen, müssen Textstil, Schattierung, Winkel und Perspektive zum Rest der Szene passen.
In diesem Beispiel hat ein relativ neuer KI-Bildgenerator, Leonardo AI, große Anstrengungen unternommen, um eine Vintage-Werbetafel für Jack Rabbit Slims Diner zu erstellen. Nach mehreren Versuchen gelang es der KI, „Jack Rabbit’s“ zu buchstabieren, was der Anfrage ziemlich nahe kommt. Der Vintage-Fotostil war in jedem Bild genau richtig, aber die Buchstaben und Wörter waren größtenteils fehlerhaft.
Die Augen haben es nicht
Es wird oft gesagt, dass die Augen die Fenster zur Seele sind. Wir verlassen uns so sehr auf den Augenkontakt, dass er das wichtigste Detail bei der Erstellung eines realistischen Porträts sein könnte. Doch viele KI-Tools haben Schwierigkeiten, menschliche Augen darzustellen.
Bing Image Creator hat mit dem Studiohintergrund und der Erstellung eines generationenübergreifenden Familienfotos gute Arbeit geleistet. Allerdings hat fast jeder Mensch bizarre Augen, die aussehen, als wären sie von Außerirdischen eingesetzt worden, oder vielleicht verwandeln sich diese lächelnden Menschen gerade in überirdische Kreaturen.
Störende Werkzeuge
Menschen können gut mit Werkzeugen umgehen, und zwar nicht nur mit der digitalen Vielfalt wie KI. Wir beherrschen schnell jedes physische Werkzeug, das uns zur Verfügung steht. Eine KI hingegen hat Schwierigkeiten zu verstehen, was sie sind und wie sie verwendet werden.
Midjourney ist ein KI-Bildgenerator, der fantastische Fortschritte bei der Lösung von Problemen mit menschlichen Gesichtern und Händen macht. Als man ihn jedoch dazu auffordert, einem Mechaniker zu zeigen, wie er eine Schraube mit einem Schraubenschlüssel festzieht, fehlt das Werkzeug vollständig. In einem Fall werden Fingernägel zu Handschuhen hinzugefügt, und in einem anderen Fall erscheint irgendwie eine Glühbirne.
Scheren sind für Bing Image Creator in dieser Nahaufnahme des Haareschneidens zu kompliziert. Sie sind nur auf einem Bild geöffnet und scheinen nie gerade geschnitten zu werden.
Albtraumzähne
Wenn Menschen lächeln und lachen, verbessert das normalerweise ein Bild und macht es angenehm und unterhaltsam. Wenn eine KI eine einfache Aufforderung wie das Lächeln und Lachen zweier Schüler erhält, kann sie dies in Albtraumtreibstoff mit mehreren Zahnreihen und anderen seltsamen Verzerrungen verwandeln.
Mit Leonardo AI können Sie zwischen mehreren Modellen wählen, von denen einige gut mit Zähnen umgehen können. Der populäre Stable Diffusion 2.1-Modell Ich brauchte Hilfe, um die Zähne richtig zu machen. Mit einigen negativen Aufforderungen wurde das Problem gelöst. Es gibt Lösungen für diese KI-Bildprobleme, aber es bedarf noch einiger Arbeit, um gute Ergebnisse zu erzielen.
Die KI-Kunst verbessert sich rasant
In den Anfängen der KI-Kunst waren die Ergebnisse seltsam und wunderbar und schufen gleichermaßen Schönheit und Horror. Die Fehler werden mit jedem neuen Update weniger auffällig und viele Probleme können mit etwas Verfeinerung behoben werden.
Mit Es sind so viele KI-Tools verfügbar, ist es einfach, ein anderes System auszuprobieren. Viele KI-Bildgeneratoren ermöglichen negative Eingabeaufforderungen oder andere Optionen, um den Algorithmus anzupassen und bessere Ergebnisse zu erzielen.
Möglicherweise müssen Sie mehrere Versuche durchführen, um ein brauchbares Bild zu erhalten, insbesondere wenn der Fokus auf Gesichtern oder Händen liegt. Wenn Sie gedruckte oder geschriebene Wörter einfügen möchten, müssen Sie darauf vorbereitet sein, Zeit in einem Bildeditor zu verbringen, um die unsinnigen Buchstaben der KI zu löschen und den richtigen Text einzublenden.
Die gute Nachricht ist, dass viele KI-Bildgeneratoren kostenlos und Abonnementmodelle relativ günstig sind. Innerhalb eines Jahres könnten diese verbleibenden Probleme gelöst werden, sodass Sie einen KI-Render als fertiges Kunstwerk verwenden können ein Ersatz für ein Foto.
Empfehlungen der Redaktion
- Die neue Zoom-Out-Funktion von Midjourney wird zur nächsten großen KI-Sensation
- Der aktualisierte Bing Chat übertrifft ChatGPT auf sechs wichtige neue Arten
- Dieses virale KI-Bild hat die Welt getäuscht, und Sie haben es vielleicht schon gesehen
- Der neue ChatGPT-ähnliche KI-Generator von Grammarly kann viel mehr als nur Ihr Schreiben Korrektur lesen
- Ich habe die (ferne) Zukunft der KI-Websuche gesehen – hier ist sie erstaunlich und wo sie schwierig ist
Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.