"Chère IA, veuillez convertir mon dessin en
une image photoréaliste".

ⓘ Cette page a été traduite à l'aide de l'intelligence artificielle.

16 minutes

IA d'images génératives et modèles de génération d'images

Une image photoréaliste d'une vache surfant dans la mer et jubilant: cela a longtemps été impossible. Aujourd'hui, de tels sujets font déjà partie de notre quotidien. Cela est rendu possible grâce à l'IA générative et aux modèles de diffusion, qui peuvent construire une image pixel par pixel à partir d'une simple suggestion. Sur cette page, nous vous présentons des modèles connus, discutons des cas d'utilisation utiles et expliquons comment distinguer les images générées par l'IA des images réelles.

Aller directement au sujet

Comment fonctionnent les IA d'images?

Quels sont les générateurs d'images IA les plus connus?

Modèles multimodaux: concevoir dans le dialogue

Comment obtenir de meilleures images?

Exemples d'utilisation au quotidien

Comment reconnaître les images générées par l'IA?

Quelles sont les opportunités et les limites dans le domaine de l'éducation?

Contenus complémentaires

Autres thèmes intéressants

Partager la page

Vous trouverez les thèmes suivants sur cette page:

Pour expliquer comment fonctionne l'IA visuelle, nous vous présentons deux méthodes de génération d'images.
Nous nous intéressons aux quatre générateurs d'images IA les plus connus et les comparons à l'exécution d'une commande.
Nous vous montrons des exemples d'application utiles d'une IA génératrice d'images dans la vie quotidienne.
Et nous abordons le thème de l'IA visuelle dans le domaine de l'éducation.

Thème

Comment fonctionnent les IA d'images?

Pour générer des images, l'intelligence artificielle dispose de deux méthodes différentes: d'une part, les réseaux antagonistes génératifs (GAN) et, d'autre part, les modèles de diffusion. Mais que se cache-t-il derrière ces termes?

GANs

Modèles de diffusion

Images générées par l'IA et droit d'auteur:
ce que vous devez savoir

Lorsque des images sont créées à l'aide de l'IA, la situation juridique est intéressante : actuellement, elles ne sont en principe pas protégées par le droit d'auteur en Suisse, ce qui rend leur utilisation flexible. Néanmoins, les droits des marques et les droits de la personnalité doivent être pris en compte. Les évolutions rapides de la technologie pourraient entraîner des changements dans le droit d'auteur à l'avenir. Reste informé pour rester à jour.

Thème

Quels sont les générateurs
d'images IA les plus connus?

Comme pour l'IA textuelle, il existe de plus en plus de modèles d'IA générateurs d'images. GPT-4o et Midjourney sont actuellement les modèles les plus performants en termes de qualité.

GPT-4o (OpenAI) 

Le «o» dans GPT-4o signifie «omni» et décrit le modèle d'OpenAI comme multimodal. Il peut donc traiter nativement (c'est-à-dire de manière autonome) du texte, des images et du son. GPT-4o peut générer des images, mais aussi les analyser ou en parler. Cela est particulièrement utile pour les tâches qui nécessitent les deux (comme la création d'une présentation). GPT-4o fonctionne depuis mars 2025 comme générateur d'images standard dans ChatGPT. Auparavant, le modèle de diffusion DALL·E (également développé par OpenAI) était utilisé pour la génération d'images depuis 2023.

Âge minimum requis (GPT-4o)

Recommandé à partir de 13 ans

Accès (GPT-4o)

Web, application mobile, API pour développeurs

Points forts (GPT-4o)

Traite le texte, l'image et l'audio (ainsi que la vidéo grâce à l'intégration de Sora) sous forme de modèle multimodal.
Transitions fluides entre les types de médias possibles.
Peut générer des images, les analyser et les développer dans le cadre d'un dialogue.

Points faibles (GPT-4o)

Nombre limité d'images par jour (dans la version gratuite).
Peu de liberté artistique lors de la création d'images.
Modification limitée des images existantes (dans la boîte de dialogue).

Sécurité (GPT-4o)

Les conversations sont enregistrées par défaut.
Les données sont utilisées par défaut à des fins de formation (possibilité de refus).
Directives strictes en matière de contenu visant à empêcher l'utilisation du modèle à des fins malveillantes.

Valeur éducative (GPT-4o)

Idéal pour créer des feuilles d'exercices ou des illustrations pour le matériel pédagogique.
Permet d'illustrer ou d'expliquer des concepts à l'aide de graphiques.
Facile à prendre en main pour les enseignants et les élèves.

Classification (GPT-4o)

Polyvalent pour les familles et les écoles.
Peu adapté aux projets artistiques professionnels.
Convient pour la création de combinaisons texte-image.

Essayer GPT-4o: https://chat.openai.com/ (ouvre une nouvelle fenêtre)

Midjourney 

Midjourney est une IA générative spécialisée dans la génération d'images, et elle le fait très bien: cette IA est bien connue pour ses images de haute qualité et souvent surréalistes. Les paramètres disponibles offrent de nombreuses possibilités pour influencer et développer l'image lors de sa création. Le facteur communautaire joue également un rôle important chez Midjourney.

Âge minimum requis (Midjourney)

À partir de 13 ans

Accès (Midjourney)

via Discord ou Midjourney Alpha

Points forts (Midjourney)

Haute qualité d'image et liberté artistique.
Réalise bien les portraits et les compositions complexes.
Inspiration grâce à une communauté active.

Points faibles (Midjourney)

Principalement utilisable via Discord, peut être compliqué pour les débutants.
Pas de version gratuite disponible.
Comprendre les paramètres de commande nécessite un certain effort lors de la prise en main.

Sécurité (Midjourney)

Les images générées sont affichées publiquement (selon l'abonnement).
Risque d'être confronté à des contenus inappropriés (filtres de contenu modérés et modération de la communauté pas toujours fiables).
L'environnement Discord peut être source de distraction.

Valeur éducative (Midjourney)

Présente et intègre différents styles artistiques ou différentes époques.
Enseigne notamment la composition dans la pratique et favorise ainsi la pensée visuelle.
Peu adapté à la création de supports pédagogiques.

Classification (Midjourney)

Le meilleur choix pour les projets artistiques.
Nécessite de la persévérance lors de l'apprentissage, mais offre au final des images créatives et de grande qualité.
Un outil haut de gamme pour les artistes ambitieux.

Essayer Midjourney (compte Discord ou Google requis): https://midjourney.com/home(ouvre une nouvelle fenêtre)

Pour les utilisateurs avancés: Midjourney Parameter(ouvre une nouvelle fenêtre)

Canva AI (Magic Studio)

Canva est une plateforme de conception très appréciée qui intègre également une fonctionnalité intelligente de génération d'images grâce à Magic Media. Elle met l'accent sur la simplicité d'utilisation et la possibilité d'intégrer directement les contenus dans les projets créés (flyers, stories pour les réseaux sociaux, candidatures, etc.).

Âge minimum requis (Canva AI)

Recommandé à partir de 13 ans

Accès (Canva AI)

Web, application mobile

Points forts (Canva AI)

Facile à utiliser.
Intégration directe dans les projets de conception dans Canva.
Fournit également des suggestions et de l'inspiration pour la génération d'images.

Points faibles (Canva AI)

Retouche d'image ultérieure possible dans une mesure limitée.
Les fonctionnalités premium (telles que le téléchargement d'images de référence) sont payantes.
Peu expérimental et résultats parfois répétitifs.

Sécurité (Canva AI)

Environnement adapté aux enfants grâce à des filtres de contenu efficaces.
Différents rôles peuvent être attribués aux utilisateurs afin de gérer, concevoir ou accéder aux contenus.
Les activités, contenus et téléchargements multimédias peuvent être utilisés à des fins de formation (peut être désactivé).

Valeur éducative (Canva AI)

Canva Education propose de nombreux modèles pour le matériel pédagogique.
Canva Education est disponible sur invitation des enseignants pour les élèves du primaire et du secondaire.
Convient pour les présentations scolaires ou pour acquérir de manière ludique les bases du design.

Classification (Canva AI)

Idéal pour les débutants ou les enfants.
Moins adapté aux projets purement artistiques.
Avec Canva Education, offre une bonne base pour les écoles.

Essayer Canva AI: https://www.canva.com/ (ouvre une nouvelle fenêtre)

Adobe Firefly

Adobe Firefly est le générateur d'images basé sur l'IA d'Adobe, intégré aux programmes de la suite Adobe Creative. Cette IA est guidée par des valeurs éthiques: selon les propres déclarations(ouvre une nouvelle fenêtre) du fournisseur, le premier modèle commercial Firefly a été entraîné à l'aide d'images Adobe Stock ainsi que d'œuvres et de contenus sous licence libre (ou dont les droits d'auteur ont expiré).

Âge minimum requis (Adobe Firefly)

À partir de 13 ans (licence Adobe)

Accès (Adobe Firefly)

Adobe Creative Cloud, Web

Points forts (Adobe Firefly)

Intégration transparente dans Adobe Creative Suite.
Offre la gamme complète d'outils Adobe pour le traitement ultérieur.
Les éléments d'une image peuvent être remplacés.

Points faibles (Adobe Firefly)

L'interface utilisateur complexe nécessite des connaissances Adobe.
Les crédits génératifs varient en fonction de l'abonnement Creative Cloud.
Parfois un peu trop «corporate» et peu artistique.

Sécurité (Adobe Firefly)

Utilisation transparente des données et octroi de licences.
En règle générale, aucun problème en matière de droits d'auteur, ce qui permet d'utiliser les images à des fins commerciales.
Directives strictes.

Valeur éducative (Adobe Firefly)

Idéal pour les projets scolaires à caractère commercial.
Convient pour les présentations publiques.
Convient plutôt aux niveaux d'enseignement supérieurs.

Classification (Adobe Firefly) 

L'approche la plus professionnelle parmi tous les outils mentionnés.
Qualité professionnelle pour la communication des entreprises.
Intéressant et sûr en termes d'utilisation commerciale.

Essayer Adobe Firefly: https://firefly.adobe.com/ (ouvre une nouvelle fenêtre)

Stable Diffusion

Stable Diffusion a été publié en août 2022 en tant que modèle de génération d'images open source. Aujourd'hui, cette IA est souvent intégrée dans des programmes tiers tels que civitai.com ou leonardo.ai. Stable Diffusion offre un contrôle et une personnalisation maximaux, mais nécessite des connaissances techniques et est donc principalement utilisé par les professionnels du design.

Âge minimum requis (Stable Diffusion)

En fonction de la plateforme utilisée

Accès (Stable Diffusion)

Application, Web, installations locales

Points forts (Stable Diffusion)

Gratuit et open source.
Installée localement, l'IA fonctionne même sans connexion Internet.
Contrôle maximal de tous les paramètres.

Points faibles (Stable Diffusion)

Nécessite des compétences techniques.
En cas d'utilisation locale: configuration et maintenance fastidieuses.
Nécessite un matériel puissant.

Sécurité (Stable Diffusion)

Peut également générer des contenus inappropriés, car il n'y a que peu ou pas de censure ou de restriction de contenu.
L'utilisation locale offre une protection maximale des données.
Les conditions préalables peuvent varier en fonction de la plateforme (tierce) utilisée.

Valeur éducative (Stable Diffusion)

Favorise les compétences en matière de résolution de problèmes et les compétences techniques.
Présente les principes de l'open source.
Moins adapté aux jeunes élèves.

Classification (Stable Diffusion)

Convient aux personnes ayant des connaissances techniques.
Solution idéale pour les institutions soucieuses de la protection des données.
Non adapté à une utilisation familiale classique.

Essayer Stable Diffusion en ligne: stablediffusionweb.com(ouvre une nouvelle fenêtre)

Quelle est la différence de qualité entre les générateurs d'images les plus connus lorsqu'ils exécutent la même commande?

« Style bande dessinée mignon, grand angle, éléphant en peluche serrant la main d'une souris, coucher de soleil, couleurs chaudes – format 16:9 »

Ein KI-generiertes Bild von einem rothaarigen Kind, dass ein Eis isst. Generiert durch Midjourney Version 2.

Image générée par GPT-4o (OpenAI).

Thème

Modèles multimodaux: concevoir dans le dialogue

La nouvelle génération de générateurs d'images basés sur l'IA fonctionne légèrement différemment de ses prédécesseurs: au lieu de se contenter de comprendre du texte, les modèles multimodaux «Omni» tels que GPT-4o peuvent traiter à la fois du texte, des images et du son. Cela ressemble à du multitâche, et c'est effectivement le cas. Mais cela ne concerne que l'IA: pour vous, l'utilisation devient plus simple et plus naturelle.

L'IA multimodale va au-delà du texte et des images (vidéo en allemand).

Ce que cela signifie pour tes invites:

Modèles d'images classiques

Tu écris une invite textuelle (par exemple « Une pomme rouge sur une table ») et laisses l'IA générer une image.

Modèles multimodaux

Tu peux également télécharger une image d'une pomme rouge sur une table et demander à l'IA: «Rends la pomme bleue et ajoute une banane» ou «Crée une scène similaire, mais en hiver».

Avec les modèles multimodaux, il est devenu plus facile de peaufiner l'image de vos rêves à l'aide d'un exemple et en dialoguant avec l'IA. Contrairement aux générateurs d'images purs tels que DALL·E, les modèles multimodaux tels que GPT-4o peuvent se souvenir de l'historique des discussions et des versions précédentes de l'image, ce qui leur permet de modifier l'image de manière itérative et collaborative avec vous. Imaginez l'IA d'image comme un designer personnel que vous observez par-dessus son épaule tout en échangeant avec lui. Utilisez la fonction de dialogue si vous avez des questions sur le traitement de l'image pour obtenir des alternatives ou donnez un retour concret sur les résultats (j'aime ça, mais pas ça).

Petit bémol: les modèles multimodaux en sont encore à leurs balbutiements et ne sont parfois pas encore tout à fait au point. Il peut donc arriver que l'IA oublie certaines parties de l'image d'origine ou que tous les détails de l'image ne puissent pas être contrôlés pendant la conversation.

Thème

Comment obtenir de meilleures images?

Une bonne consigne fournit des indications sur le style visuel, le contenu concret et le format (selon le modèle). Nous te dévoilons ici d'autres éléments à prendre en compte pour que l'IA génère les images que tu imagines.

Quelques principes à respecter au préalable: veillez à ne pas utiliser de mots de remplissage lorsque vous rédigez votre prompt. La longueur du prompt est essentielle, car les prompts plus longs aident l'IA à mettre en œuvre votre idée. Si vos instructions sont trop détaillées, l'IA peut se perdre et visualiser des éléments qui ne sont peut-être pas si importants pour vous.

Recherchez également des termes techniques issus des arts visuels(ouvre une nouvelle fenêtre) afin de pouvoir donner à l'IA des instructions stylistiques très concrètes.

Chaque IA générative fonctionne légèrement différemment. Mais pour toutes, il est utile de prêter attention à ces éléments fondamentaux:

Langue

Style visuel

Contenu

Palette de couleurs et ambiance

Rapport hauteur/largeur

Thème

Exemples d'utilisation au quotidien

La génération d'images par IA peut faire bien plus que «simplement» favoriser l'expression artistique. Elle peut également t'aider dans ta vie quotidienne, en famille ou à l'école. De la décoration de ta chambre aux cours d'histoire, les possibilités sont plus variées que tu ne le penses.

Créer une carte de Noël avec l'IA (vidéo en allemand).

Pour les familles

Personnaliser des histoires

Repenser l'aménagement intérieur

Créer des invitations ou des cartes

Pour le contexte scolaire

Donner vie à l'histoire

La biologie en zoom et en accéléré

Des images pédagogiques à la place des fiches

Compétence clé: reconnaître les images générées par l'IA

Pour le travail

Concevoir des approches créatives

Marketing de contenu et campagnes

Créer des présentations

Remarques pour une utilisation professionnelle

Si vous souhaitez utiliser des contenus générés par l'IA à des fins commerciales, renseignez-vous au préalable sur les droits d'utilisation et les conditions de protection des données des modèles. Pour des raisons éthiques et juridiques, identifiez clairement les contenus générés par l'IA comme tels. Respectez bien sûr également les éventuelles directives en matière de design d'entreprise. Et considérez l'IA comme un complément, mais pas comme un substitut aux capacités et à la créativité humaines.

Thème

Comment reconnaître les images générées par l'IA?

Savoir reconnaître les images générées par l'IA devient une compétence médiatique importante. Nous te montrons ici ce à quoi tu dois faire attention et ce que tu peux faire si tu n'es pas sûr. Avec un peu de pratique, tu développeras un bon instinct. Reste toutefois vigilant, car les technologies s'améliorent chaque jour.

Ce qui vaut pour la détection des deepfakes vidéo aide généralement aussi à démasquer les images générées par l'IA. Mais cela n'est pas pour autant simple. Même les experts se trompent parfois. Il est donc tout à fait normal d'avoir des doutes. L'important est de rester critique et de faire des recherches en cas d'incertitude.

Les caractéristiques distinctives des images générées par l'IA peuvent être les suivantes

Mains et doigts

Visages et yeux

Texte et écriture

Arrière-plans et ombres

Recherche inversée

Filigrane

En règle générale, ne vous fiez pas à une seule caractéristique, mais vérifiez plutôt plusieurs aspects. Restez particulièrement sceptique face aux images parfaites.

Les deepfakes et les dangers de l'IA générative

Outre les vidéos, les deepfakes existent également sous forme d'images. C'est le cas lorsque des éléments d'une image sont remplacés à l'aide d'une IA générative, de sorte que le message change, mais que l'image reste d'un réalisme trompeur. Dans le cas des images, le droit d'auteur est également un sujet très controversé.

Quels sont les dangers de l'IA générative?

Thème

Quelles sont les opportunités et les
limites dans le domaine de l'éducation?

En tant qu'enseignant, vous êtes confronté à la question suivante: dois-je utiliser l'IA visuelle pour préparer mes cours ou pendant ceux-ci, et si oui, comment ? Comme souvent, la règle suivante s'applique ici aussi: bien sûr, profitez des opportunités offertes par les nouvelles technologies, mais soyez également conscient de leurs limites et de leurs risques. Vous pourrez ainsi prendre vos propres décisions et contribuer activement à développer les compétences médiatiques de vos élèves.

Opportunités

Illustrer le matériel pédagogique

Surmonter les barrières linguistiques

Limites

La vérification des faits est indispensable

L'imagination a-t-elle fait son temps?

Webinaire pour enseignants: comprendre et utiliser les générateurs d'images IA

Dans ce cours, les enseignants découvrent les générateurs d'images IA et apprennent ce qui se passe en arrière-plan dès que les requêtes sont envoyées. Nous abordons les questions suivantes: où et comment les générateurs d'images peuvent-ils être utilisés dans l'enseignement? Comment aborder la réalité, la manipulation et la responsabilité dans le cadre de la génération d'images en classe? Ce webinaire de 90 minutes a été développé en collaboration avec LerNetz.

Informations sur le cours(ouvre une nouvelle fenêtre)

L'essentiel en bref

Les modèles de diffusion se sont imposés dans le fonctionnement des IA génératives d'images.
GPT-4o et Midjourney font partie des IA génératives d'images les plus connues actuellement.
Pour obtenir des résultats qui correspondent à vos attentes à partir des modèles de génération d'images, il est utile de structurer les invites.
Une IA d'images peut offrir de nombreuses aides visuelles dans la vie quotidienne.

Liens utiles

Contenus complémentaires

Nous avons réuni ici d'autres informations et contenus sur le thème "IA d'images et générateurs d'images".

Liens utiles

Mise à jour : Adobe Firefly est désormais disponible commercialement(ouvre une nouvelle fenêtre)

Le Conseil du numérique présente un générateur d'images d'IA pour les PME suisses(ouvre une nouvelle fenêtre)

Images contrefaites : Les avertissements sont plus nuisibles que les contrefaçons(ouvre une nouvelle fenêtre)

Est-il difficile de démasquer les images d'IA ?(ouvre une nouvelle fenêtre)

Quand l'ordinateur démasque la contrefaçon d'art(ouvre une nouvelle fenêtre)

L'intelligence artificielle doit détecter les images manipulées(ouvre une nouvelle fenêtre)

Google intègre son rival Dall-E dans son moteur de recherche(ouvre une nouvelle fenêtre)

Droit d'auteur et IA: facilitateur ou rabat-joie?(ouvre une nouvelle fenêtre)

Autres thèmes intéressants

Guide de l'intelligence artificielle

L’avenir est déjà là.

Voir les contenus

IA textuelles génératives et modèles linguistiques

"Chère IA, écrivez-moi ma candidature".

zu den Inhalten

Swisscom Campus

Promouvoir la compétence en matière de médias pour la population suisse.

au contenu

Demander à Marcel

Marcel est formateur chez Swisscom. Il est à votre disposition pour toutes les questions autour de l’IA.

Portrait des Leiters Jugendmedienschutz Michael In Albon

Marcel

Formateur chez Swisscom

"Chère IA, veuillez convertir mon dessin en une image photoréaliste".

IA d'images génératives et modèles de génération d'images

Vous trouverez les thèmes suivants sur cette page:

Thème

Comment fonctionnent les IA d'images?

GANs

Modèles de diffusion

Images générées par l'IA et droit d'auteur: ce que vous devez savoir

Thème

Quels sont les générateurs d'images IA les plus connus?

GPT-4o (OpenAI)

Âge minimum requis (GPT-4o)

Accès (GPT-4o)

Points forts (GPT-4o)

Points faibles (GPT-4o)

Sécurité (GPT-4o)

Valeur éducative (GPT-4o)

Classification (GPT-4o)

Midjourney

Âge minimum requis (Midjourney)

Accès (Midjourney)

Points forts (Midjourney)

Points faibles (Midjourney)

Sécurité (Midjourney)

Valeur éducative (Midjourney)

Classification (Midjourney)

Canva AI (Magic Studio)

Âge minimum requis (Canva AI)

Accès (Canva AI)

Points forts (Canva AI)

Points faibles (Canva AI)

Sécurité (Canva AI)

Valeur éducative (Canva AI)

Classification (Canva AI)

Adobe Firefly

Âge minimum requis (Adobe Firefly)

Accès (Adobe Firefly)

Points forts (Adobe Firefly)

Points faibles (Adobe Firefly)

Sécurité (Adobe Firefly)

Valeur éducative (Adobe Firefly)

Classification (Adobe Firefly)

Stable Diffusion

Âge minimum requis (Stable Diffusion)

Accès (Stable Diffusion)

Points forts (Stable Diffusion)

Points faibles (Stable Diffusion)

Sécurité (Stable Diffusion)

Valeur éducative (Stable Diffusion)

Classification (Stable Diffusion)

Thème

Modèles multimodaux: concevoir dans le dialogue

Modèles d'images classiques

Modèles multimodaux

Thème

Comment obtenir de meilleures images?

Langue

Style visuel

Contenu

Palette de couleurs et ambiance

Rapport hauteur/largeur

Thème

Exemples d'utilisation au quotidien

Pour les familles

Personnaliser des histoires

Exemple

Repenser l'aménagement intérieur

Exemple

Créer des invitations ou des cartes

Exemple

Pour le contexte scolaire

Donner vie à l'histoire

Exemple

La biologie en zoom et en accéléré

Exemple

Des images pédagogiques à la place des fiches

Exemples

Compétence clé: reconnaître les images générées par l'IA

Exemple

Pour le travail

"Chère IA, veuillez convertir mon dessin en
une image photoréaliste".

Images générées par l'IA et droit d'auteur:
ce que vous devez savoir

Quels sont les générateurs
d'images IA les plus connus?

GPT-4o (OpenAI) 

Midjourney 

Classification (Adobe Firefly) 

Quelles sont les opportunités et les
limites dans le domaine de l'éducation?