Wie wir bei TRITON IT mit dem Midjourney AI-Tool arbeiten

Im Internet gibt es eine Vielzahl von Tools, die die Prinzipien der künstlichen Intelligenz und des maschinellen Lernens nutzen und bei richtiger Anwendung die Arbeit sowohl von normalen Nutzern als auch von Fachleuten verschiedener Disziplinen erleichtern und viel Zeit sparen können. TRITON IT ist Mitglied des tschechischen Verbandes für künstliche Intelligenz, daher verwenden wir KI-Tools nicht nur bei der Erstellung von Textinhalten (wie ChatGPT oder Google Bard), sondern auch bei der Erstellung von visuellen Inhalten. Das Tool, das sich für uns bisher als am erfolgreichsten erwiesen hat, ist Midjourney.

Midjourney arbeitet nach einem ähnlichen Prinzip wie die bekannteren Chatbots – basierend auf den Eingaben des Nutzers generieren sie Inhalte, die dann durch Verfeinerung der Eingaben weiter bearbeitet und verbessert werden können. Midjourney erstellt auf Basis der Eingaben vier Varianten von Grafikdesigns und es liegt dann am Nutzer, welches der Designs er in hoher Auflösung generieren und einsetzen möchte, oder z.B. welches der Designs er nimmt und Midjourney bittet, diese Variante anhand einer anderen Eingabe weiter zu modifizieren und zu entwickeln.

Wie man Eingabeaufforderungen für Midjourney korrekt eingibt

Im Gegensatz zu anderen bekannten Tools haben die Entwickler von Midjourney keine eigene Benutzeroberfläche für das Tool erstellt, sondern die Kommunikationsplattform Discord verwendet. Nachdem man sich mit dem Midjourney Discord Server verbunden hat, wird man in einen Chatraum weitergeleitet und kann dort seine eigenen Prompts erstellen.

Midjourney ist heutzutage Teil der täglichen Arbeit einer großen Anzahl von Menschen. Damit dieses Werkzeug der künstlichen Intelligenz den Fachleuten Zeit spart, ist es jedoch notwendig zu verstehen, wie es funktioniert und zu lernen, “seine Sprache” zu sprechen. Midjourney “spricht” nicht mit dem Benutzer, wie wir es von klassischen Chatbots wie ChatGPT gewohnt sind. Stattdessen müssen Sie mit Midjourney über spezielle Befehle, sogenannte Prompts, kommunizieren. Diese Prompts haben ein klar definiertes Format und werden durch einen Schrägstrich gefolgt von einem Befehl eingeleitet, der durch zusätzlichen Text oder Parameter ergänzt werden kann. Der Basisprompt ist /imagine und der darauf folgende Text definiert die Grundvoraussetzungen für die Erstellung eines Grafikdesigns.

In Midjourney erzeugtes Bild
Abb. 1: Generiertes Bild in Midjourney, Eingabeaufforderung: “Menschen nur in der Mitte ernten weißen Mohn auf einem Feld im Stil historischer Fotografie”

Wie man die richtigen Slogans auswählt

Um das volle Potential von Midjourney nutzen zu können, muss der Nutzer lernen, die richtigen Prompts zu verwenden, um mit dem KI-Roboter zu kommunizieren. Eine Möglichkeit ist, die komplette Dokumentation zu studieren, aber Midjourney bietet auch eine einfachere Möglichkeit. Wenn ein Benutzer nicht weiß, welche Eingabeaufforderungen er verwenden soll, um z.B. einen Teil eines Bildes zu beschreiben, das neu gezeichnet werden soll, ist es am einfachsten, mit einem bestehenden Bild zu beginnen und es von Midjourney beschreiben zu lassen. So können Sie sehen, wie das Werkzeug selbst jeden Teil wahrnimmt und beschreibt und welche Befehle zu verwenden sind.

Ein Vorteil von Midjourney ist die Möglichkeit, eigene Fotos hochzuladen, die der Nutzer als Inspiration für ein neues Grafikdesign verwenden möchte. Die Bilder können entweder direkt vom Computer hochgeladen werden oder mit einer URL verlinkt werden. Leider kann Midjourney derzeit ein auf diese Weise hochgeladenes Foto nicht übernehmen und bearbeiten, aber wenn der Benutzer eine Vorstellung von der endgültigen Form des Grafikdesigns hat, kann es als Vorlage verwendet werden.

Von Midjourney erzeugtes Originalbild
Abb. 2: Original generiertes Bild in Midjourney, Eingabeaufforderung: “photorealistisches Bild eines Feldes mit blauen Mohnblumen bei sonnigem Wetter –ar 4:3”
Neu gezeichnetes Bild in Midjourney
Abb. 3: Umgezeichnetes Bild in Midjourney in weiße Blumen mit Hilfe der Vary-Funktion

Wie man Teile der generierten Bilder verändert

Wenn der Benutzer nur mit einem bestimmten Teil des generierten Bildes nicht zufrieden ist, kann er mehrere Möglichkeiten nutzen, um Midjourney nur diesen spezifischen Bereich neu zeichnen zu lassen. Die erste Möglichkeit ist die Verwendung der Vary-Funktion, die es erlaubt, einen bestimmten Teil des Bildes zu markieren. Die Funktion Remix Mode arbeitet nach einem ähnlichen Prinzip und bietet ebenfalls an, die Eingabeaufforderung so zu verändern, daß Midjourney nur einen bestimmten Teil der erzeugten Grafik verändert.

Allerdings arbeitet Midjourney nicht mit dem markierten Teil des Bildes und versucht auch nicht, ihn entsprechend der vorgegebenen Aufforderung zu verändern. Stattdessen entfernt die KI einfach diesen Teil des Bildes und erzeugt einen neuen, fehlenden Teil entsprechend der Aufforderung. Dieser neu generierte Teil des Bildes wird dank der Übergänge zwischen dem ursprünglichen und dem neuen Teil sensibel in das ursprüngliche Design eingebettet.

Wie man ein Weblayout mit Midjourney erzeugt

Unser Entwicklungsteam nutzt Midjourney nicht nur zur Generierung einzelner grafischer Elemente, sondern mittlerweile auch zur Generierung des gesamten Weblayouts. Basierend auf der Spezifikation, die hinter der Eingabeaufforderung /imagine steht, kann Midjourney das gesamte Website-Layout entwerfen, aber es ist große Vorsicht geboten. Auf den ersten Blick mag das gerenderte Design fehlerfrei und sofort einsatzbereit erscheinen, bei näherer Betrachtung ist jedoch ein menschliches Eingreifen erforderlich. Einige Fehler können durch Neuzeichnen der betreffenden Teile behoben werden, andere müssen direkt vom Entwickler oder Grafikdesigner beseitigt werden, damit sie ordnungsgemäß funktionieren.

Wie wir die Agra-Microsite mit Midjourney erstellt haben

Für Agra, den größten tschechischen Mohnverarbeiter, haben wir eine neue Microsite für den internationalen Markt erstellt. Als die Aktivitäten von Agra, die tschechischen Mohn in ganz Europa zu exportieren, begannen, sich signifikant auf den internationalen Markt auszudehnen, wurde eine Website benötigt, um die geplante Kampagne zum Export von Mohn zu unterstützen. So wurde eine Kontakt-Mikroseite erstellt, die nun z. B. die Möglichkeit bietet, eine kostenlose Mohnprobe zu versenden.

Um diese Mikroseite zu erstellen, entschieden wir uns, Midjourney zu benutzen, um alle grafischen Elemente der Website zu generieren. Die Fotobanken im Internet sind voll von fotogenen roten Mohnblumen, aber wir wussten aus dem Studium des Produkts, dass Mohn mit weißen Blüten hauptsächlich in der Lebensmittelindustrie verwendet wird. Midjourney hat aber auch dieses Problem gelöst und die roten Blüten durch eine weiße Variante ersetzt. Dadurch konnten wir die Intervention eines Grafikers überflüssig machen, was einen signifikanten Unterschied in der Gesamtzeit für die Entwicklung dieser Microsite ausmachte. Durch den Einsatz von künstlicher Intelligenz bei der Erstellung der grafischen Elemente konnten wir den Arbeitsaufwand für das eingereichte Angebot insgesamt reduzieren.

In Midjourney erzeugtes Bild
Abb. 4: Generiertes Bild in Midjourney, Aufforderung: “Mohnlebkuchen, Mohnbonbons, Mohnglasur auf einem Teller – oder 4:3”
In Midjourney erzeugtes Bild
Abb. 5: Generiertes Bild in Midjourney, Aufforderung: “eine weiße Mohnblume mit weißer Mitte liegt in einem Blumenbeet, im Stil von dunkelblau und dunkelschwarz”

Möchten Sie mit uns AI entwickeln?