L'intelligence artificielle générative a le vent en poupe et se retrouve désormais non seulement dans le format bien connu du chat, mais aussi sous de nombreuses formes en tant qu'assistant IA, par exemple dans les applications de productivité. Nous nous demandons: quelles sont les IA textuelles génératives et comment fonctionnent-elles? Sur cette page, nous fournissons des informations intéressantes sur l'IA textuelle générative, des aides au prompt et des exemples d'application classiques ou créatifs.
Aller directement au sujet
Partager la page
Comment fonctionnent les IA textuelles?
Pour répondre à cette question, le mieux est de regarder de plus près le nom du modèle de transformation le plus connu d'OpenAI, ChatGPT.
Car c'est dans ce dernier que se cache la recette du succès du modèle linguistique le plus répandu:
l'IA n'apprend pas seulement à calculer la probabilité du prochain mot correct, mais génère également des mots et des phrases cohérentes à partir de ces probabilités calculées.
Pour pouvoir calculer ces probabilités, l'IA a été entraînée avec une grande quantité de données de connaissances humaines.
Transformer désigne la technique par laquelle le réseau neuronal peut comprendre et utiliser le contexte et les relations dans les textes.
En somme, cela signifie que les IA textuelles génératives sont toujours une combinaison du modèle et des données collectées lors de l'entraînement, dont la combinaison permet à l'IA de répondre correctement aux questions en prédisant uniquement le mot ou le jeton suivant.
Les fournisseurs d'IA textuelle générative se multiplient de manière explosive depuis quelques mois. Parmi les plus connus, on trouve ChatGPT, Google Gemini, Meta Llama ou Claude.
Avec ChatGPT, OpenAI est à la pointe de la qualité des générateurs de texte d'IA. L'entreprise développe rapidement son modèle de génération de texte et assure ainsi une diffusion rapide du champ d'application du modèle d'IA.
Version | Utilisation depuis | Modalités | Fonctions principales |
---|---|---|---|
GPT-4o | Mai 2024 |
|
|
GPT-4 | Mars 2023 |
|
|
GPT-3.5 | Novembre 2022 |
|
|
Le modèle est également de plus en plus disponible en tant qu'extension pour d'autres logiciels, par exemple en tant qu'assistant GPT pour certains thèmes.
ChatGPT | Gratuit | GPT-4o et GPT-3.5 |
ChatGPT Plus | 20 $ / mois | GPT-4o, GPT-4 et GPT-3.5 |
Pour ChatGPT: https://chat.openai.com/(ouvre une nouvelle fenêtre)
Google Gemini est un modèle d'IA génératif de Google AI. Situé dans le cosmos de Google, Google Gemini peut être intégré et appliqué directement dans les applications de productivité Google avec l'abonnement Premium AI correspondant.
Version | Données de formation jusqu'à | Modalités | Fonctions principales |
---|---|---|---|
Gemini 1.5 Pro | Mai 2024 |
|
|
Gemini (1.0) Pro | Février 2023 |
|
|
Gemini (1.0) Ultra | Décembre 2023 |
|
|
Gemini Pro | Gratuit | Gemini 1.0 Pro |
Gemini Advanced (AI Premium) | CHF 17 / mois | Gemini 1.5 Pro |
Vers le Google Gemini: https://gemini.google.com/app(ouvre une nouvelle fenêtre)
Llama de Meta est un modèle de génération de texte open source, conçu en particulier pour les développeurs*, les chercheurs et les entreprises. La base open source permet à Meta Llama de fonctionner directement sur son propre ordinateur, moyennant une intégration appropriée.
Avec Meta AI, un assistant intelligent est disponible pour les particuliers, basé sur la dernière version de Llama 3 et capable de résoudre des tâches complexes et nuancées, de raisonner ou de visualiser des idées.
Version | Utilisation depuis | Modalités | Fonctions principales |
---|---|---|---|
Meta AI | disponible pour l'instant uniquement aux États-Unis |
|
|
Meta Llama 3 | Avril 2024 |
|
|
Meta Llama 2 | Juillet 2023 |
|
|
A propos de Llama 3: https://llama.meta.com/llama3(ouvre une nouvelle fenêtre)
Vers Meta AI: https://www.meta.ai/(ouvre une nouvelle fenêtre)
Claude est une intelligence artificielle générative qui a été entraînée par Anthropic avec Constitutional AI. Claude peut traiter des informations, collecter des idées ou générer du texte et du code en réponse.
Version | Utilisation depuis | Modalités | Fonctions principales |
---|---|---|---|
Claude 3 Opus | Mars 2024 |
|
|
Claude 3 Sonnet | Mars 2024 |
|
|
Claude 3 Haiku | Mars 2024 |
|
|
Claude Free | Gratuit | Claude 3 Sonnet |
Claude Pro | 20 $ / mois | Claude 3 Opus |
Pour Claude: https://claude.ai/(ouvre une nouvelle fenêtre)
Bien que les modèles linguistiques soient conçus et très performants pour comprendre le langage naturel et réagir en conséquence, une structure et un langage clairs permettent d'anticiper et d'obtenir des réponses pertinentes de la part de l'IA.
Chaque IA générative fonctionne un peu différemment, mais ce schéma de prompt aide comme principe pour toutes:
Qui explique / écrit / formule? Définis un persona pour l'IA, par exemple: une enseignante, un professeur d'astrophysique, une mère, etc.
À qui s'adresse le texte? Indique le niveau de fluence souhaité de la réponse, par exemple: Explique comme à un petit enfant, à un spécialiste, etc.
Que veux-tu savoir exactement? Définis clairement les informations que tu souhaites obtenir, par exemple: Comment se forme un trou noir?
Sous quelle forme (de texte) la réponse doit-elle être générée? Indique le format cible souhaité et les éventuels souhaits de présentation et de structuration, par exemple: sous forme d'article avec des intertitres.
Pour les tâches complexes avec plusieurs questions partielles, il est judicieux de les soumettre individuellement à l'IA. Dans le cas contraire, il y a un risque que certains détails ne soient pas pris en compte par l'IA. Il est donc préférable de commencer le chat avec une base simple et de construire à partir de là avec des invitations et des questions continues.
Utilise des exemples pour faire comprendre à l'IA ce que tu veux et sous quelle forme. Tu as peut-être un texte dont la structure ou le ton correspond à tes attentes? Utilise-le comme référence pour réduire le temps de travail nécessaire à l'écriture du prompt. De cette manière, tu obtiendras beaucoup plus facilement et efficacement des résultats de qualité.
Un exemple d'invite:
"Tu es un professeur d'astrophysique. Explique-moi, comme à un petit enfant, comment se forme un trou noir. Rédige ta réponse sous la forme d'un article avec des intertitres. Utilise le texte ci-dessous comme exemple de style d'écriture".
Lors de l'utilisation de l'intelligence artificielle générative, il est important de garder à l'esprit qu'il ne faut pas fournir de données personnelles inutiles. A cet égard, gardez à l'esprit ce qui suit:
Les nombreux guides et astuces disponibles sur le web, qui promettent des réponses encore plus pertinentes de l'IA générative, prouvent à quel point il est essentiel de savoir anticiper pour atteindre ses objectifs lors de l'utilisation de l'IA générative.
CO-STAR et TIDD-EC sont deux de ces schémas d'invite qui peuvent vous aider à créer une invite efficace. Les noms de ces schémas sont composés des premières lettres anglaises de leurs composants:
CO-STAR: Le schéma CO-STAR (ou: framework) se compose de six éléments et vous aide à créer des messages-guides clairs et efficaces.
Context (Contexte): Expliquez le cadre et les circonstances de la tâche.
Objective (But): Définissez l'objectif à atteindre.
Scope (Portée): Limitez le domaine ou la portée de la tâche.
Task (Tâche): Décrivez la tâche spécifique que l'IA doit effectuer pour vous.
Action (Action): Indiquez les actions à effectuer.
Result (Résultat): Décrivez le résultat souhaité.
Un exemple de prompteur:
"J'ai peu de temps et je n'ai pas d'expérience en cuisine. Peux-tu me donner une recette de pâtes simple et rapide? Les ingrédients devraient être disponibles dans n'importe quel supermarché. Explique-moi la préparation étape par étape".
Le schéma TIDD-EC (ou: framework) se compose également de six éléments et vous aide ainsi à faire des invitations structurées.
Task Type (type de tâche): Donnez au modèle linguistique une idée claire du type de tâche qu'il doit effectuer.
Instructions (Instructions): Décrivez des étapes ou des directives spécifiques que le modèle linguistique doit suivre pour exécuter la tâche.
Do (Exécuter): Quelles sont les actions qui aideront le modèle linguistique à réaliser la tâche ?
Don't (Éviter): Quels sont les éléments que le modèle linguistique doit éviter lorsqu'il répond à l'invite ?
Examples (Exemples): Fournissez des exemples concrets du type de résultats ou de réponses souhaités.
Content (Contenu): En tant qu'utilisateur*, fournissez certaines données (attention: uniquement des données générales, pas de données personnelles !) avec lesquelles le modèle linguistique peut travailler, utiliser les données dans la réponse ou y faire référence.
Un exemple de prompteur:
"Explique-moi en termes simples les avantages du thé vert pour la santé. Référez-vous aux connaissances scientifiques et aux résultats actuels de la recherche. La réponse doit être facile à comprendre et ne doit pas contenir de termes techniques compliqués. Un exemple serait: 'Le thé vert peut aider à renforcer le système immunitaire'".
Le champ d'application de l'IA textuelle générative est immense. Depuis que l'intelligence artificielle générative (également sous la forme d'assistants IA) est à la disposition du grand public, ce champ d'application s'est encore élargi.
Vous trouverez ici deux exemples d'application de ce type - du plus classique au plus créatif :
Utilisez le contexte de votre CV et de l'offre d'emploi sélectionnée pour générer une première ébauche de votre candidature, que vous pourrez ensuite modifier manuellement. Vous pouvez utiliser l'exemple d'invite suivant:
"Veuillez rédiger, sur la base de mon CV, un projet de candidature en réponse à l'offre d'emploi ci-jointe".
CV:
Attention: pour des raisons de protection des données, essayez de ne pas fournir de données personnelles à l'IA, même si elles se rapportent à votre CV personnel.
C'est justement lorsqu'il s'agit d'écrire de la fiction que les IA textuels génératifs sont très bons. Voici une idée de la manière dont vous pouvez utiliser cette créativité pour un jeu d'aventure textuel comme dans les années 80, pour jouer à un jeu sans limites dans la programmation.
"Tu es une machine de jeu IA. Simulez un jeu appelé "AI-dventures", un jeu basé sur le texte dans lequel le joueur doit atteindre un objectif dans un lieu de son choix en utilisant sa créativité. Utilise un formatage passionnant au cours du jeu et un langage vivant pour rendre le jeu amusant. Commence le jeu... Maintenant"!
L'intelligence artificielle générative a également ses faiblesses. La force des modèles linguistiques réside - comme leur nom l'indique - dans le traitement du langage. Mais comme les mécanismes du monde des nombres ne fonctionnent pas de manière analogue à ceux du langage, la plupart des modèles linguistiques ont du mal à générer de manière cohérente des réponses correctes à des tâches mathématiques.
ChatGPT-4, par exemple, est souvent très proche du résultat, mais ne l'atteint jamais exactement. Avec ChatGPT-4o, OpenAI a trouvé une solution à ce problème: Le modèle de langage reformule le problème mathématique en code, l'exécute dans un environnement de programmation et affiche le résultat ainsi généré comme réponse à la question.
L'intelligence artificielle générative offre un grand potentiel pour l'humanité, par exemple dans le domaine de l'automatisation, mais elle est également liée à certains risques.
De nouvelles idées peuvent être rapidement conçues grâce à l'IA générative. Cela offre un grand potentiel pour les projets privés.
Dans la vie quotidienne, les modèles linguistiques nous offrent un grand potentiel pour effectuer ou faire effectuer plus facilement des tâches quotidiennes. Les tâches dont l'exécution n'a pas de valeur ajoutée pour nous peuvent être confiées à une IA (lorsqu'elle existe).
Étant donné que les connaissances d'une IA sont toujours limitées par la base de données avec laquelle elle a été entraînée, il est presque impossible de créer une IA qui soit totalement exempte de valeurs ou de préjugés.
Lorsqu'une IA ne connaît pas de réponse probable à une question donnée, il peut arriver qu'elle invente simplement une réponse. Si de tels résultats hallucinés sont ensuite partagés, la désinformation est inconsciemment renforcée et le mélange de la vérité et des résultats inventés rend difficile l'établissement de faits objectifs.
Lors de la création de nouveaux contenus, on a volontiers recours à l'aide de modèles linguistiques. Ce n'est en principe pas une mauvaise chose, mais les solutions "en un clic" et une grande quantité d'idées ne conduisent pas nécessairement à une production de haute qualité, mais plutôt à des idées standard. La capacité d'interagir avec des idées et de les (continuer à) développer reste donc particulièrement importante, même ou surtout lorsqu'on travaille avec l'IA générative.
Dans quelle direction l'intelligence artificielle générative va-t-elle évoluer à l'avenir? Une grande partie du monde de la technologie voit dans ce que l'on appelle les "Large Action Models" ou "agents IA" l'avenir des modèles linguistiques. Mais qu'est-ce que cela signifie?
Les Large Action Models (LAM) devraient à l'avenir constituer l'interface entre l'intelligence artificielle et l'homme. L'objectif est fixé à l'IA par le biais d'une saisie textuelle, vocale ou autre. Pour atteindre cet objectif, le LAM divise le processus nécessaire en tâches partielles et les fait exécuter par des agents autonomes - les assistants IA. Ces derniers renvoient ensuite les résultats au LAM central.
Voici un exemple de ce à quoi cela pourrait ressembler:
L'utilisateur* est invité :
"Prévois-moi un dîner avec mon meilleur ami Daniel ce soir".
LAM divise la tâche en sous-tâches :
1. Vérifier dans le calendrier de l'utilisateur* (et de Daniel) quand les deux sont disponibles (à partir de).
2. Où se trouvent actuellement l'utilisateur/l'utilisatrice et Daniel?
3. Quel est le temps sur place?
4. Quels sont les restaurants à proximité?
5. Quel est le menu?
6. Est-il possible de réserver via un formulaire sur le site web du restaurant?
Des assistants IA répondent à toutes ces tâches partielles. Dès que toutes les tâches partielles ont été effectuées, le LAM reçoit un feed-back correspondant et en informe l'utilisateur ou l'utilisatrice.
LAM répond:
"Avec plaisir! Comme il pleut aujourd'hui, je t'ai choisi le restaurant L'interno à Olten, qui propose une cuisine italienne avec des options végétariennes et végétaliennes. Voulez-vous que je vous le réserve pour 19 heures"?
Comme vous pouvez le constater, les capacités des modèles vocaux dépasseront très probablement à l'avenir la simple génération de texte. En conséquence, le format "chat sur le web" disparaîtra probablement à nouveau et sera remplacé par un assistant IA qui accompagnera et soutiendra les utilisateurs au quotidien sur tous les appareils.
Marcel est formateur chez Swisscom. Il est à votre disposition pour toutes les questions autour de l’IA.
Formateur chez Swisscom
Thème
Comment fonctionne une IA générative?
Nous, les êtres humains, ne pensons pas tout à nouveau à chaque instant, mais nous apprenons et construisons de nouvelles connaissances sur ce que nous avons appris précédemment. Nos pensées et nos souvenirs restent dans notre mémoire et forment ainsi la base de nouvelles connexions.
Nous, les êtres humains, ne pensons pas tout à nouveau à chaque instant, mais nous apprenons et construisons de nouvelles connaissances sur ce que nous avons appris précédemment. Nos pensées et nos souvenirs restent dans notre mémoire et forment ainsi la base de nouvelles connexions.
1995: Méthode LSTM
La méthode LSTM (Long Short-Term Memory) est un logiciel qui existe depuis 1995 et qui sert à reconnaître certains modèles dans les données. Le logiciel est ainsi capable de se souvenir d'informations antérieures et de les réutiliser en cas de besoin.
Pour que cette technique fonctionne, le LSTM utilise un réseau neuronal spécial, appelé Recurrent Neural Network (RNN), qui fonctionne avec des processus répétitifs. Cela signifie qu'il est capable de traiter les informations étape par étape.
Toutefois, le LSTM a aussi ses limites. Comme il traite les informations les unes après les autres, il ne gère pas bien les grandes quantités de données et a tendance à négliger des informations plus éloignées.
2017: Transformer
En 2017, Google a présenté le document scientifique "Attention is All You Need"(ouvre une nouvelle fenêtre). Dans ce document, les auteurs suggèrent que de nouveaux mécanismes d'attention peuvent améliorer considérablement la qualité et l'efficacité des modèles actuels de réseaux neuronaux:
L'équipe de recherche propose une "architecture de réseau simple, le Transformer, basée exclusivement sur des mécanismes attentionnels [...]"(ouvre une nouvelle fenêtre). Ce transformateur utilise des mécanismes inédits pour mieux comprendre le contexte et le traiter plus efficacement. L'expérimentation a porté sur des tâches de traduction automatique de la langue.
Le Transformer a largement contribué au développement de l'IA textuelle générative. Comme il gère mieux les longues dépendances dans les textes et qu'il peut être entraîné plus efficacement, il convient parfaitement aux tâches telles que la génération de texte, les chatbots et autres applications qui doivent générer ou comprendre le langage naturel. Il n'est donc pas étonnant que toutes les IA textuelles connues soient aujourd'hui construites sur l'architecture Transformer.