«Liebe KI, bitte wandle meine Zeichnung
in ein fotorealistisches Bild um.»

  Swisscom Campus Newsletter
Erhalten Sie neue Inhalte vom Swisscom Campus direkt in Ihre Mailbox, dank dem Swisscom Campus Newsletter.

8 Minuten

Generative Bild-KIs und Bildgenerierungsmodelle

Ein Bild von einer im Meer surfenden, jubelnden Kuh in fotorealistischer Umsetzung – das war lange Zeit ein Ding der Unmöglichkeit. Heute gehören solche Sujets bereits zum Alltag. Verantwortlich dafür sind generative Bild-KIs und Diffusionsmodelle, die ein Bild einem Prompt gemäss Pixel für Pixel aufbauen können. Auf dieser Seite fragen wir nach bekannten Modellen, schleifen an Bildgenerierung-Prompts und wägen die Chancen und Risiken der generativen Bild-KI gegeneinander ab. 

Folgende Themen finden Sie auf dieser Seite:

Wie funktionieren Bild-KIs?

Thema

Wie funktionieren Bild-KIs?

Um Bilder zu generieren, stehen einer Künstlichen Intelligenz zwei verschiedene Methoden zur Verfügung: Einerseits Generative Adversarial Networks (GANs) und andererseits Diffusionsmodelle. Doch was verbirgt sich hinter diesen Begriffen?

Thema

Was sind die bekanntesten
KI-Bildgeneratoren?

Wie bei der Text-KI gibt es auch bei den KI-Bildgeneratoren immer mehr Angebote. An der qualitativen Spitze stehen nach wie vor Midjourney, Dall-E, Stable Diffusion und Adobe Firefly.

In einem Vergleich zeigen wir Ihnen die unterschiedlichen Qualitäten der vier bekanntesten Bildgeneratoren: Denselben Prompt lassen wir von allen vier Modellen ausführen und vergleichen das Ergebnis.  

Realistic photos, high level of detail. A wooden house on a small lake. A jetty leads out into the lake. A rowing boat is tied to it. It is raining. 

Thema

Wie prompte ich bessere Bilder?

Damit die generative Künstliche Intelligenz Bilder erzeugt, die Ihren Vorstellungen entsprechen, gilt es beim Prompten bestimmte Dinge zu beachten. Ein guter Prompt gibt Vorgaben zum visuellen Stil, zu konkreten Inhalten sowie zum Seitenverhältnis (je nach Modell).

Achten Sie beim Prompten generell darauf, keine Füllwörter zu verwenden. Die richtige Prompt-Länge ist zentral, denn längere Prompts helfen der KI bei der Umsetzung Ihrer Idee. Bei zu ausführlichen Vorgaben kann sich die KI jedoch verlieren und Elemente visualisieren, die Ihnen vielleicht gar nicht so wichtig sind. 

Recherchieren Sie auch Fachbegriffe aus der visuellen Kunst(öffnet ein neues Fenster), um der KI ganz konkrete Stilvorgaben machen zu können. 

Jede generative KI arbeitet leicht anders. Aber bei allen lohnt es sich, auf diese grundlegenden Dinge zu achten:

«cute comic style, wide angle, plush elephant shaking hand of a mouse, sunset, warm colors –ar 16:9» 

Thema

Anwendungsbeispiele  der generativen Bild-KI

Während Bildgenerierungsmodelle anfangs primär Bilder aus Text generierten, sind die Anwendungsbereiche generativer Bild-KI inzwischen sehr vielfältig. So können verschiedene Modelle zum Beispiel auch Skizzen in stilisierte Kunst verwandeln oder Teilbereiche eines Fotos neu generieren.

Weihnachtskarte mit KI erstellen.

Drei solcher Anwendungsbeispiele für generative Bild-KI finden Sie hier:

Thema

Was sind die Chancen und Risiken
der generativen Bild-KI?

Wie alles auf der Welt haben auch generative Bild-KIs Vorteile und Nachteile. Eine Auswahl der wichtigsten Aspekte haben wir hier für Sie zusammengefasst.

Chancen

Risiken

Das Wichtigste in Kürze

  • Die Diffusionsmodelle haben sich in der Funktionsweise von generativen Bild-KIs durchgesetzt. 
  • Midjourney, Dall-E, Stable Diffusion und Adobe Firefly gehören zu den bekanntesten generativen Bild-KIs.
  • Um von den Bildgenerierungsmodellen Ergebnisse zu erhalten, die Ihren Vorstellungen entsprechen, lohnt sich ein strukturierter Aufbau der Prompts.
  • Unterschiedliche Bild-KIs sind auf unterschiedliche Anwendungsgebiete spezialisiert. 
  • Generative Bild-KI bietet Vorteile wie die Förderung von Kreativität und Personalisierung, weist mit den Thematiken Deepfakes oder Urheberrechts aber auch Risiken auf. 

Marcel fragen

Marcel ist Trainer bei Swisscom. Er steht Ihnen bei allen Fragen rund um das Thema KI zur Verfügung.

Portrait des Leiters Jugendmedienschutz Michael In Albon
Marcel

Trainer bei Swisscom