Die neueste KI-Technologie von Nvidia verwandelt Wörter in realistische Bilder

12

Im Kontext: Nvidias GauGAN-Technologie hat bereits gezeigt, was sie kann, indem sie einfache Skizzen in fotorealistische Bilder verwandelt. Seitdem haben wir gesehen, dass es in Nvidia Canvas eingesetzt wird, aber es scheint, dass der GPU-Riese mit seiner KI auf höhere Ebenen abzielt und eine neue Version auf den Markt bringt, die Wörter in Bilder verwandeln kann.

Nvidia zeigte seine GauGAN-Technologie zum ersten Mal im Jahr 2019, aber erst vor kurzem haben wir gesehen, dass sie in einem Produkt enthalten ist, das für die breite Öffentlichkeit erhältlich ist. Diese Software mit dem Namen Canvas kann sehr viel Spaß machen und es Benutzern ermöglichen, erstaunliche fotoähnliche Bilder mit einfachen Skizzen zu erstellen.

Seit der Ankündigung von Canvas sind einige Monate vergangen, aber die Arbeit an GauGAN wurde fortgesetzt und erreicht nun die Version 2.0. Die Technologie ist sogar noch beeindruckender geworden, da sie jetzt in der Lage ist, Wörter in fotorealistische Bilder umzuwandeln, was ein ähnliches Ergebnis liefert wie das, das wir mit der Draw-to-Image-Funktion erhalten.

Wie im obigen Video zu sehen, schreiben Sie etwas in das Textfeld, und basierend auf Ihren Worten wird sofort ein Bild generiert. Fügen Sie ein Adjektiv hinzu oder ersetzen Sie ein Substantiv in der Phrase, und das Bild ändert sich entsprechend.

Für zusätzliche Personalisierung können Benutzer Text- und Draw-to-Image-Funktionen kombinieren. Indem Sie geschriebene Wörter verwenden, um die Basis und Zeichnungen zu erstellen, um das Bild zu detaillieren, können Sie die Form, Größe und Textur jedes Objekts innerhalb des Bildes ändern.

Um diese Ergebnisse zu erzielen, verwendet Nvidias Text-to-Image-Funktion GauGAN 2 ein generatives gegnerisches netzwerkbasiertes KI-Modell, das „Segmentation Mapping, Inpainting und Text-to-Image-Generierung kombiniert”. Dieses Modell wurde mit 10 Millionen Landschaftsbildern trainiert, daher sollte es auf alles, was Sie darauf werfen (oder auch nicht), gut vorbereitet sein.

Sie können es mit der interaktiven KI-Demo von Nvidia für GauGAN 2 in Ihrem Webbrowser ausprobieren. Um damit zu spielen, müssen Sie zuerst den Nutzungsbedingungen von Nvidia zustimmen (aktivieren Sie das Kästchen unten auf der Seite).

Aufnahmequelle: www.techspot.com

Diese Website verwendet Cookies, um Ihre Erfahrung zu verbessern. Wir gehen davon aus, dass Sie damit einverstanden sind, Sie können sich jedoch abmelden, wenn Sie möchten. Annehmen Weiterlesen