Swisscom Campus Newsletter
Erhalten Sie neue Inhalte vom Swisscom Campus direkt in Ihre Mailbox, dank dem Swisscom Campus Newsletter.
Ein Bild von einer im Meer surfenden, jubelnden Kuh in fotorealistischer Umsetzung – das war lange Zeit ein Ding der Unmöglichkeit. Heute gehören solche Sujets bereits zum Alltag. Verantwortlich dafür sind generative Bild-KIs und Diffusionsmodelle, die ein Bild einem Prompt gemäss Pixel für Pixel aufbauen können. Auf dieser Seite fragen wir nach bekannten Modellen, schleifen an Bildgenerierung-Prompts und wägen die Chancen und Risiken der generativen Bild-KI gegeneinander ab.
Wie funktionieren Bild-KIs?
Um Bilder zu generieren, stehen einer Künstlichen Intelligenz zwei verschiedene Methoden zur Verfügung: Einerseits Generative Adversarial Networks (GANs) und andererseits Diffusionsmodelle. Doch was verbirgt sich hinter diesen Begriffen?
Wie bei der Text-KI gibt es auch bei den KI-Bildgeneratoren immer mehr Angebote. An der qualitativen Spitze stehen nach wie vor Midjourney, Dall-E, Stable Diffusion und Adobe Firefly.
In einem Vergleich zeigen wir Ihnen die unterschiedlichen Qualitäten der vier bekanntesten Bildgeneratoren: Denselben Prompt lassen wir von allen vier Modellen ausführen und vergleichen das Ergebnis.
Realistic photos, high level of detail. A wooden house on a small lake. A jetty leads out into the lake. A rowing boat is tied to it. It is raining.
Damit die generative Künstliche Intelligenz Bilder erzeugt, die Ihren Vorstellungen entsprechen, gilt es beim Prompten bestimmte Dinge zu beachten. Ein guter Prompt gibt Vorgaben zum visuellen Stil, zu konkreten Inhalten sowie zum Seitenverhältnis (je nach Modell).
Achten Sie beim Prompten generell darauf, keine Füllwörter zu verwenden. Die richtige Prompt-Länge ist zentral, denn längere Prompts helfen der KI bei der Umsetzung Ihrer Idee. Bei zu ausführlichen Vorgaben kann sich die KI jedoch verlieren und Elemente visualisieren, die Ihnen vielleicht gar nicht so wichtig sind.
Recherchieren Sie auch Fachbegriffe aus der visuellen Kunst(öffnet ein neues Fenster), um der KI ganz konkrete Stilvorgaben machen zu können.
Jede generative KI arbeitet leicht anders. Aber bei allen lohnt es sich, auf diese grundlegenden Dinge zu achten:
«cute comic style, wide angle, plush elephant shaking hand of a mouse, sunset, warm colors –ar 16:9»
Während Bildgenerierungsmodelle anfangs primär Bilder aus Text generierten, sind die Anwendungsbereiche generativer Bild-KI inzwischen sehr vielfältig. So können verschiedene Modelle zum Beispiel auch Skizzen in stilisierte Kunst verwandeln oder Teilbereiche eines Fotos neu generieren.
Weihnachtskarte mit KI erstellen.
Drei solcher Anwendungsbeispiele für generative Bild-KI finden Sie hier:
Wie alles auf der Welt haben auch generative Bild-KIs Vorteile und Nachteile. Eine Auswahl der wichtigsten Aspekte haben wir hier für Sie zusammengefasst.
Weitere Informationen und Inhalte zum Thema «Bild-KIs und Bildgeneratoren» haben wir hier zusammengetragen.
Marcel ist Trainer bei Swisscom. Er steht Ihnen bei allen Fragen rund um das Thema KI zur Verfügung.
Trainer bei Swisscom