Das neue Tool für künstliche Intelligenz DragGAN revolutioniert die Landschaftsbearbeitung

Das experimentelle KI-Tool macht das Bearbeiten (Bearbeiten) von Bildern mit einer einfachen Klick- und Ziehgeste zum Kinderspiel. DragGANDas generative künstliche Intelligenz-Tool namens radikale Veränderungen es ermöglicht Ihnen, dies zu tun. Sie können sich DragGAN wie das Warp-Tool von Photoshop vorstellen, aber viel leistungsfähiger.

Das produktive KI-Rennen

Mittlerweile kennt selbst der gelegentlichste Tech-News-Follower produktive KI-Tools wie ChatGPT, Stable Diffusion, Midjourney und DALL-E. Die fünf weltweit führenden Unternehmen konkurrieren darum, die besten großen Sprachmodelle zu entwickeln und sie in jede von uns verwendete Software oder jeden Webdienst zu integrieren. Diese Tools können mithilfe von Eingabeaufforderungen nützliche Bilder oder Texte generieren. Andererseits sind viele dieser Tools auf von Menschen geschriebene Werke „trainiert“ und erfordern die Aufsicht eines Menschen, um ihre Ergebnisse auf ein sinnvolles Niveau zu bringen.

Revolutionierung der visuellen Bearbeitung mit DragGAN

Neue KI-Forschung zeigt jedoch unglaubliche Fortschritte, insbesondere bei der Landschaftsmanipulation. Google, MYTHOS, Universität von Pennsylvaniaund in Deutschland Max-Planck-Institut für InformatikEine Gruppe von Wissenschaftlern aus einfach und zugänglichentwickelte ein experimentelles Werkzeug, das dies könnte

Es reicht aus, sich die Beispiele in dieser Nachricht anzusehen, um zu verstehen, was das neue Tool namens DragGAN leisten kann. Nur wenige Klicks und wenige SekundenObjekt im Bild 3Dals Modell drehen, die Worte des Gesichtsändern oder irgendetwas anderes, was Ihnen einfällt schwierige Vorkehrungen treffen möglich. Wir möchten auch darauf hinweisen, dass DragGAN kein öffentliches Modell ist. Aus diesem Grund hatten wir keine Gelegenheit, das Fahrzeug auszuprobieren.

Ihre Traumszene ist nur wenige Sekunden entfernt

Forscher sagen, dass DragGAN von Nvidia stammt GeForce RTX 3090Bei Verwendung einer Grafikkarte können Sie nur den Inhalt eines Bildes anzeigen. in wenigen Sekunden Er gibt an, dass sich dies ändern kann, da ihre Anwendung nicht mehr als ein Grenznetzwerk verwenden muss, um die gewünschten Ergebnisse zu erzielen. Im nächsten Schritt soll ein ähnliches Modell zur punktbasierten Bearbeitung von 3D-Modellen entwickelt werden.

Wie die entsprechende Forschungsgruppe feststellte, besteht der Hauptunterschied dieser Studie jedoch nicht in der Landschaftsmanipulation, sondern Benutzeroberfläche. Wir können seit einiger Zeit künstliche Intelligenztools wie GANs verwenden, um realistische Bilder zu erstellen, aber mehreren Formeln mangelt es an Flexibilität und Präzision. Bitten Sie einen KI-Landschaftsgenerator, „ein Bild von einem Löwen zu machen, der durch die Savanne streift“, und Sie erhalten eins, aber es ist möglicherweise nicht genau die Pose, die Sie wollen oder brauchen. Sogar KI-Prompt-Engineering ist entstanden, um das Beste aus diesen Eingabeaufforderungen herauszuholen, und kann mehr als 300.000 US-Dollar pro Jahr verdienen. Mit DragGAN können Sie Ihre Traumszene erstellen, ohne dass diese detaillierten Eingabeaufforderungen erforderlich sind.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert