Die neueste Entwicklung der künstlichen Intelligenz ist ein Tool, mit dem Sie ein bereits generiertes Bild nach Ihren Vorgaben bearbeiten können.
Angenommen, Sie möchten „durch einfaches Klicken und Ziehen die Abmessungen eines Autos ändern oder ein Lächeln in ein Stirnrunzeln verwandeln“, könnten Sie dies mit diesem Modell namens DragGAN tun.
Ziehen Sie Ihr GAN: Interaktive punktbasierte Manipulation auf dem generativen Bildverteiler
Papierseite: https://t.co/Gjcm1smqflpic.twitter.com/XHQIiMdYOA
– AK (@_akhaliq) 19. Mai 2023
Das Generative Adversarial Network (GAN) befindet sich derzeit in Form eines Forschungspapiers, hat jedoch bei Interessierten, die sich seine Demos ansehen möchten, so viel Aufmerksamkeit erregt, dass das Homepage des Forschungsteams Aufgrund des starken Verkehrs kam es zu einem Unfall.
Empfohlene Videos
Der Rand verglich DragGAN mit dem Warp-Tool in Photoshop und fügte hinzu, dass es seitdem viel leistungsfähiger sei „verschleudert keine Pixel“, sondern „erzeugt das darunter liegende Objekt neu“ und kann sogar 3D drehen Bilder.
Das Potenzial eines solchen Tools liegt in der Tatsache, dass die generative Text-zu-Bild-KI nicht immer das ausgibt, was Sie möchten. So können Sie später noch einmal hineingehen und Änderungen an einem vorhandenen Bild vornehmen, anstatt automatisch ein neues Bild erstellen zu müssen.
Einige Demos, die Teil der Forschungsarbeit sind, umfassen das Hinzufügen von Höhe zu einem Berg, das Ändern der Positionierung eines Modells usw Sie ändert die Länge und Form ihrer Kleidung, öffnet oder schließt das Maul eines Löwen und verändert das Gesicht einer Person von einem einfachen zu einem einfachen lächeln. Bei vielen derzeit verfügbaren KI-Tools müssen Benutzer ein Bild mit einer spezifischeren Eingabeaufforderung neu generieren, um ein wünschenswerteres Ergebnis zu erzielen.
Das Forschungsteam stellte in seiner Arbeit fest, dass bei der Neugenerierung der bearbeiteten Aspekte von Bildern neue Details hinzugefügt werden können, die für die Aktualisierung von Vorteil sind. „Unser Ansatz kann verschlossene Inhalte halluzinieren, wie die Zähne im Maul eines Löwen, und er kann sich entsprechend der Starrheit des Objekts verformen, wie die Biegung eines Pferdebeins.“
Es gibt viele Marken, die versuchen, Bearbeitungsmöglichkeiten für generative KI-Inhalte anzubieten. Allerdings gehen die meisten nicht so weit, die eigentliche Bearbeitung von Bildern zu ermöglichen, sondern eher Aspekte wie die Bearbeitung rund um Bilder. Zum Beispiel, Die Designer-App von Microsoft ermöglicht es Ihnen, KI-Bilder aus einer Textaufforderung zu generieren, und Sie können aus drei Ergebnissen Ihren Favoriten auswählen und ihn dann ins Designstudio bringen, wo Sie können Erstellen Sie eine Vielzahl kreativer und produktivitätsbasierter Projekte, z. B. Social-Media-Beiträge, Einladungen, digitale Postkarten oder Grafiken, bei denen das Bild im Mittelpunkt steht Punkt. Sie können das von der KI generierte Bild jedoch nicht bearbeiten.
Da es sich beim DragGAN-Tool derzeit noch um eine Demoversion handelt, lässt sich nicht sagen, welche Qualität ein sofort verfügbares Tool hat Technologie wäre, oder ob es überhaupt möglich wäre, zumal die Demos auf niedriger Auflösung basieren Videos. Es ist jedoch ein interessantes Beispiel dafür, wie schnell sich KI weiterentwickelt.
Empfehlungen der Redaktion
- Die besten KI-Videobearbeitungstools
- Diese genialen Ideen könnten dazu beitragen, die KI ein wenig weniger böse zu machen
- Diese beiden neuen ChatGPT-Funktionen werden alles verändern
- 5 Dinge, mit denen KI-Bildgeneratoren immer noch Probleme haben
- KI könnte im Zuge einer Einstellungspause rund 7.800 Stellen bei IBM ersetzen
Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.