"Chère IA, écrivez-moi ma candidature".

9 minutes

IA textuelles génératives et modèles linguistiques

L'intelligence artificielle générative a le vent en poupe et se retrouve désormais non seulement dans le format bien connu du chat, mais aussi sous de nombreuses formes en tant qu'assistant IA, par exemple dans les applications de productivité. Nous nous demandons: quelles sont les IA textuelles génératives et comment fonctionnent-elles? Sur cette page, nous fournissons des informations intéressantes sur l'IA textuelle générative, des aides au prompt et des exemples d'application classiques ou créatifs. 

Thème

Comment fonctionne une IA générative? 

Nous, les êtres humains, ne pensons pas tout à nouveau à chaque instant, mais nous apprenons et construisons de nouvelles connaissances sur ce que nous avons appris précédemment. Nos pensées et nos souvenirs restent dans notre mémoire et forment ainsi la base de nouvelles connexions. 

Nous, les êtres humains, ne pensons pas tout à nouveau à chaque instant, mais nous apprenons et construisons de nouvelles connaissances sur ce que nous avons appris précédemment. Nos pensées et nos souvenirs restent dans notre mémoire et forment ainsi la base de nouvelles connexions. 

La méthode LSTM (Long Short-Term Memory) est un logiciel qui existe depuis 1995 et qui sert à reconnaître certains modèles dans les données. Le logiciel est ainsi capable de se souvenir d'informations antérieures et de les réutiliser en cas de besoin.  

Pour que cette technique fonctionne, le LSTM utilise un réseau neuronal spécial, appelé Recurrent Neural Network (RNN), qui fonctionne avec des processus répétitifs. Cela signifie qu'il est capable de traiter les informations étape par étape.  

Toutefois, le LSTM a aussi ses limites. Comme il traite les informations les unes après les autres, il ne gère pas bien les grandes quantités de données et a tendance à négliger des informations plus éloignées.  

En 2017, Google a présenté le document scientifique "Attention is All You Need"(ouvre une nouvelle fenêtre). Dans ce document, les auteurs suggèrent que de nouveaux mécanismes d'attention peuvent améliorer considérablement la qualité et l'efficacité des modèles actuels de réseaux neuronaux:  

L'équipe de recherche propose une "architecture de réseau simple, le Transformer, basée exclusivement sur des mécanismes attentionnels [...]"(ouvre une nouvelle fenêtre). Ce transformateur utilise des mécanismes inédits pour mieux comprendre le contexte et le traiter plus efficacement. L'expérimentation a porté sur des tâches de traduction automatique de la langue.  

Le Transformer a largement contribué au développement de l'IA textuelle générative. Comme il gère mieux les longues dépendances dans les textes et qu'il peut être entraîné plus efficacement, il convient parfaitement aux tâches telles que la génération de texte, les chatbots et autres applications qui doivent générer ou comprendre le langage naturel. Il n'est donc pas étonnant que toutes les IA textuelles connues soient aujourd'hui construites sur l'architecture Transformer. 

Thème

Pourquoi les modèles Transformer
fonctionnent-ils si bien? 

Pour répondre à cette question, le mieux est de regarder de plus près le nom du modèle de transformation le plus connu d'OpenAI, ChatGPT. 

Car c'est dans ce dernier que se cache la recette du succès du modèle linguistique le plus répandu: 

l'IA n'apprend pas seulement à calculer la probabilité du prochain mot correct, mais génère également des mots et des phrases cohérentes à partir de ces probabilités calculées.

Pour pouvoir calculer ces probabilités, l'IA a été entraînée avec une grande quantité de données de connaissances humaines. 

Transformer désigne la technique par laquelle le réseau neuronal peut comprendre et utiliser le contexte et les relations dans les textes. 

En somme, cela signifie que les IA textuelles génératives sont toujours une combinaison du modèle et des données collectées lors de l'entraînement, dont la combinaison permet à l'IA de répondre correctement aux questions en prédisant uniquement le mot ou le jeton suivant.

Thème

Quels sont les meilleurs générateurs de texte
d'intelligence artificielle?  

Les fournisseurs d'IA textuelle générative se multiplient de manière explosive depuis quelques mois. Parmi les plus connus, on trouve ChatGPT, Google Gemini, Meta Llama ou Claude.

Avec ChatGPT, OpenAI est à la pointe de la qualité des générateurs de texte d'IA. L'entreprise développe rapidement son modèle de génération de texte et assure ainsi une diffusion rapide du champ d'application du modèle d'IA. 

Version Utilisation depuis Modalités Fonctions principales
GPT-4o Mai 2024
  • Texte
  • Image
  • Manipulation de l'image, de la voix et du texte
GPT-4   Mars 2023
  • Texte
  • Image
  • PDF
  • Analyse de sites web
  • Analyser des PDF
  • Analyser des pages web comme source
  • Créer des images
    (grâce à l'intégration DALL-E)
GPT-3.5 Novembre 2022
  • Texte
  • Générer des textes

Le modèle est également de plus en plus disponible en tant qu'extension pour d'autres logiciels, par exemple en tant qu'assistant GPT pour certains thèmes. 

ChatGPT Gratuit GPT-4o et GPT-3.5
ChatGPT Plus 20 $ / mois GPT-4o, GPT-4 et GPT-3.5 

Google Gemini est un modèle d'IA génératif de Google AI. Situé dans le cosmos de Google, Google Gemini peut être intégré et appliqué directement dans les applications de productivité Google avec l'abonnement Premium AI correspondant.  

Version Données de formation jusqu'à Modalités Fonctions principales
Gemini 1.5 Pro Mai 2024
  • Texte
  • Audio
  • Image
  • Vidéo
  • Fichiers PDF
  • Fenêtre contextuelle plus grande que les modèles standard
    (donc adaptée aux textes plus longs et aux contextes plus complexes)
Gemini (1.0) Pro Février 2023
  • Texte
  • Version légère pour les demandes de base
Gemini (1.0) Ultra  Décembre  2023
  • Texte
  • Modèle le plus performant
    (optimisé pour le traitement de tâches complexes)
Gemini Pro Gratuit Gemini 1.0 Pro
Gemini Advanced (AI Premium) CHF 17 / mois Gemini 1.5 Pro

Llama de Meta est un modèle de génération de texte open source, conçu en particulier pour les développeurs*, les chercheurs et les entreprises. La base open source permet à Meta Llama de fonctionner directement sur son propre ordinateur, moyennant une intégration appropriée.  

Avec Meta AI, un assistant intelligent est disponible pour les particuliers, basé sur la dernière version de Llama 3 et capable de résoudre des tâches complexes et nuancées, de raisonner ou de visualiser des idées.  

Version Utilisation depuis Modalités Fonctions principales
Meta AI disponible pour l'instant uniquement aux États-Unis
  • Texte
  • Image
  • Résoudre des tâches complexes
  • visualiser des images
Meta Llama 3 Avril 2024
  • Texte
  • PDF
  • Génération de texte
  • analyse PDF
Meta Llama 2 Juillet 2023
  • Texte
  • Générer des textes
  • Résumer des textes
  • Réécrire des textes

Claude est une intelligence artificielle générative qui a été entraînée par Anthropic avec Constitutional AI. Claude peut traiter des informations, collecter des idées ou générer du texte et du code en réponse. 

Version Utilisation depuis Modalités Fonctions principales
Claude 3 Opus Mars 2024
  • Texte
  • Image
  • PDF
  • Le modèle le plus performant pour les tâches complexes
Claude 3 Sonnet Mars 2024
  • Texte
  • Image
  • PDF 
  • Pour des tâches efficaces et à haut débit
Claude 3 Haiku Mars 2024
  • Texte
  • Modèle le plus rapide pour les tâches peu complexes
Claude Free Gratuit Claude 3 Sonnet
Claude Pro 20 $ / mois Claude 3 Opus

Thème

Comment puis-je être plus prompt? 

Bien que les modèles linguistiques soient conçus et très performants pour comprendre le langage naturel et réagir en conséquence, une structure et un langage clairs permettent d'anticiper et d'obtenir des réponses pertinentes de la part de l'IA.

Chaque IA générative fonctionne un peu différemment, mais ce schéma de prompt aide comme principe pour toutes: 

Qui explique / écrit / formule? Définis un persona pour l'IA, par exemple: une enseignante, un professeur d'astrophysique, une mère, etc.

À qui s'adresse le texte? Indique le niveau de fluence souhaité de la réponse, par exemple: Explique comme à un petit enfant, à un spécialiste, etc.

Que veux-tu savoir exactement? Définis clairement les informations que tu souhaites obtenir, par exemple: Comment se forme un trou noir?

Sous quelle forme (de texte) la réponse doit-elle être générée? Indique le format cible souhaité et les éventuels souhaits de présentation et de structuration, par exemple: sous forme d'article avec des intertitres.

Pour les tâches complexes avec plusieurs questions partielles, il est judicieux de les soumettre individuellement à l'IA. Dans le cas contraire, il y a un risque que certains détails ne soient pas pris en compte par l'IA. Il est donc préférable de commencer le chat avec une base simple et de construire à partir de là avec des invitations et des questions continues.

Utilise des exemples pour faire comprendre à l'IA ce que tu veux et sous quelle forme. Tu as peut-être un texte dont la structure ou le ton correspond à tes attentes? Utilise-le comme référence pour réduire le temps de travail nécessaire à l'écriture du prompt. De cette manière, tu obtiendras beaucoup plus facilement et efficacement des résultats de qualité.

Un exemple d'invite: 

"Tu es un professeur d'astrophysique. Explique-moi, comme à un petit enfant, comment se forme un trou noir. Rédige ta réponse sous la forme d'un article avec des intertitres. Utilise le texte ci-dessous comme exemple de style d'écriture". 

Les modèles linguistiques et la protection des données

Lors de l'utilisation de l'intelligence artificielle générative, il est important de garder à l'esprit qu'il ne faut pas fournir de données personnelles inutiles. A cet égard, gardez à l'esprit ce qui suit:  

  1. Stockage des données sur les serveurs du modèle: les données fournies à l'IA sous la forme d'un prompt sont traitées et stockées sur les serveurs du modèle. Cela signifie que ces données peuvent également être utilisées pour l'entraînement ultérieur des modèles d'IA.
  2. Éviter les informations personnelles: Afin d'éviter que vos informations personnelles ne soient intégrées à la formation à l'IA et diffusées de cette manière, il est recommandé de soumettre des demandes entièrement dépourvues d'informations personnelles ou de les censurer avant de les envoyer. 
  3. Activer l'opt-out pour la formation: Afin que vos données ne soient pas utilisées par l'entreprise pour la formation de l'IA, vous pouvez activer l'opt-out correspondant dans les paramètres de confidentialité respectifs: ChatGPT(ouvre une nouvelle fenêtre), Google Gemini(ouvre une nouvelle fenêtre), Meta Llama(ouvre une nouvelle fenêtre) et Claude(ouvre une nouvelle fenêtre)

Thème

Schémas d'invite: CO-STAR et TIDD-EC

Les nombreux guides et astuces disponibles sur le web, qui promettent des réponses encore plus pertinentes de l'IA générative, prouvent à quel point il est essentiel de savoir anticiper pour atteindre ses objectifs lors de l'utilisation de l'IA générative. 

CO-STAR et TIDD-EC sont deux de ces schémas d'invite qui peuvent vous aider à créer une invite efficace. Les noms de ces schémas sont composés des premières lettres anglaises de leurs composants: 

CO-STAR: Le schéma CO-STAR (ou: framework) se compose de six éléments et vous aide à créer des messages-guides clairs et efficaces. 

Context (Contexte): Expliquez le cadre et les circonstances de la tâche.

Objective (But): Définissez l'objectif à atteindre.  

Scope (Portée): Limitez le domaine ou la portée de la tâche.

Task (Tâche): Décrivez la tâche spécifique que l'IA doit effectuer pour vous. 

 Action (Action): Indiquez les actions à effectuer.

Result (Résultat): Décrivez le résultat souhaité.

Un exemple de prompteur:

"J'ai peu de temps et je n'ai pas d'expérience en cuisine. Peux-tu me donner une recette de pâtes simple et rapide? Les ingrédients devraient être disponibles dans n'importe quel supermarché. Explique-moi la préparation étape par étape".

Le schéma TIDD-EC (ou: framework) se compose également de six éléments et vous aide ainsi à faire des invitations structurées. 

Task Type (type de tâche): Donnez au modèle linguistique une idée claire du type de tâche qu'il doit effectuer.  

Instructions (Instructions): Décrivez des étapes ou des directives spécifiques que le modèle linguistique doit suivre pour exécuter la tâche.  

Do (Exécuter): Quelles sont les actions qui aideront le modèle linguistique à réaliser la tâche ?

Don't (Éviter): Quels sont les éléments que le modèle linguistique doit éviter lorsqu'il répond à l'invite ?

Examples (Exemples): Fournissez des exemples concrets du type de résultats ou de réponses souhaités.

Content (Contenu): En tant qu'utilisateur*, fournissez certaines données (attention: uniquement des données générales, pas de données personnelles !) avec lesquelles le modèle linguistique peut travailler, utiliser les données dans la réponse ou y faire référence.

Un exemple de prompteur:

"Explique-moi en termes simples les avantages du thé vert pour la santé. Référez-vous aux connaissances scientifiques et aux résultats actuels de la recherche. La réponse doit être facile à comprendre et ne doit pas contenir de termes techniques compliqués. Un exemple serait: 'Le thé vert peut aider à renforcer le système immunitaire'".

Thème

Exemples d'application de l'IA textuelle générative

Le champ d'application de l'IA textuelle générative est immense. Depuis que l'intelligence artificielle générative (également sous la forme d'assistants IA) est à la disposition du grand public, ce champ d'application s'est encore élargi. 

Vous trouverez ici deux exemples d'application de ce type - du plus classique au plus créatif :

Assistant d'écriture: Rédiger une candidature

Utilisez le contexte de votre CV et de l'offre d'emploi sélectionnée pour générer une première ébauche de votre candidature, que vous pourrez ensuite modifier manuellement. Vous pouvez utiliser l'exemple d'invite suivant:

"Veuillez rédiger, sur la base de mon CV, un projet de candidature en réponse à l'offre d'emploi ci-jointe". 

Appel d'offres: 
  • Annonce d'emploi: Architecte*in 80-100   
  • L'entreprise: Bureau d'architecture Muster  
  • Lieu d'implantation: Berne 
  • Tâches à accomplir: Conception et planification de bâtiments, d'espaces intérieurs et de paysages, élaboration de plans de construction et de dessins techniques, collaboration avec des ingénieurs civils*, des clients et d'autres professionnels, suivi des projets de construction de la conception à l'achèvement. 
  • Exigences: Diplôme d'architecture HES ou EPF, expérience dans la phase de conception et de planification, connaissance des logiciels de CAO (par ex. AutoCAD, ArchiCAD), capacité à travailler en équipe et à communiquer. 
  • Nous offrons: des projets passionnants dans un environnement créatif, des possibilités de formation continue, des conditions de travail attrayantes et des horaires de travail flexibles. 

CV:  

  • Expérience professionnelle: Plus de 5 ans d'expérience dans la planification de biens immobiliers résidentiels et commerciaux. 
  • Spécialisation: design durable et solutions innovantes. 
  • Connaissance des logiciels: AutoCAD, SketchUp et Adobe Creative Suite. 
  • Poste précédent: collaboration à des projets d'urbanisme au sein de l'atelier d'architecture de Bâle. 
  • L'enseignement: Master d'architecture

Attention: pour des raisons de protection des données, essayez de ne pas fournir de données personnelles à l'IA, même si elles se rapportent à votre CV personnel. 

Moteur créatif: jouer à des jeux basés sur le texte

C'est justement lorsqu'il s'agit d'écrire de la fiction que les IA textuels génératifs sont très bons. Voici une idée de la manière dont vous pouvez utiliser cette créativité pour un jeu d'aventure textuel comme dans les années 80, pour jouer à un jeu sans limites dans la programmation.

"Tu es une machine de jeu IA. Simulez un jeu appelé "AI-dventures", un jeu basé sur le texte dans lequel le joueur doit atteindre un objectif dans un lieu de son choix en utilisant sa créativité. Utilise un formatage passionnant au cours du jeu et un langage vivant pour rendre le jeu amusant. Commence le jeu... Maintenant"!

Mathématiques - La faiblesse des modèles linguistiques

L'intelligence artificielle générative a également ses faiblesses. La force des modèles linguistiques réside - comme leur nom l'indique - dans le traitement du langage. Mais comme les mécanismes du monde des nombres ne fonctionnent pas de manière analogue à ceux du langage, la plupart des modèles linguistiques ont du mal à générer de manière cohérente des réponses correctes à des tâches mathématiques.   

ChatGPT-4, par exemple, est souvent très proche du résultat, mais ne l'atteint jamais exactement. Avec ChatGPT-4o, OpenAI a trouvé une solution à ce problème: Le modèle de langage reformule le problème mathématique en code, l'exécute dans un environnement de programmation et affiche le résultat ainsi généré comme réponse à la question.  

Thème

Quelles sont les chances et les risques de
l'IA textuelle générative?  

L'intelligence artificielle générative offre un grand potentiel pour l'humanité, par exemple dans le domaine de l'automatisation, mais elle est également liée à certains risques.  

Opportunités

De nouvelles idées peuvent être rapidement conçues grâce à l'IA générative. Cela offre un grand potentiel pour les projets privés.

Dans la vie quotidienne, les modèles linguistiques nous offrent un grand potentiel pour effectuer ou faire effectuer plus facilement des tâches quotidiennes. Les tâches dont l'exécution n'a pas de valeur ajoutée pour nous peuvent être confiées à une IA (lorsqu'elle existe). 

Risques

Étant donné que les connaissances d'une IA sont toujours limitées par la base de données avec laquelle elle a été entraînée, il est presque impossible de créer une IA qui soit totalement exempte de valeurs ou de préjugés. 

Lorsqu'une IA ne connaît pas de réponse probable à une question donnée, il peut arriver qu'elle invente simplement une réponse. Si de tels résultats hallucinés sont ensuite partagés, la désinformation est inconsciemment renforcée et le mélange de la vérité et des résultats inventés rend difficile l'établissement de faits objectifs. 

Lors de la création de nouveaux contenus, on a volontiers recours à l'aide de modèles linguistiques. Ce n'est en principe pas une mauvaise chose, mais les solutions "en un clic" et une grande quantité d'idées ne conduisent pas nécessairement à une production de haute qualité, mais plutôt à des idées standard. La capacité d'interagir avec des idées et de les (continuer à) développer reste donc particulièrement importante, même ou surtout lorsqu'on travaille avec l'IA générative. 

Thème

Perspectives d'avenir:
Potentiel pour les "agents IA"

Dans quelle direction l'intelligence artificielle générative va-t-elle évoluer à l'avenir? Une grande partie du monde de la technologie voit dans ce que l'on appelle les "Large Action Models" ou "agents IA" l'avenir des modèles linguistiques. Mais qu'est-ce que cela signifie?

Les Large Action Models (LAM) devraient à l'avenir constituer l'interface entre l'intelligence artificielle et l'homme. L'objectif est fixé à l'IA par le biais d'une saisie textuelle, vocale ou autre. Pour atteindre cet objectif, le LAM divise le processus nécessaire en tâches partielles et les fait exécuter par des agents autonomes - les assistants IA. Ces derniers renvoient ensuite les résultats au LAM central.

Voici un exemple de ce à quoi cela pourrait ressembler:  

L'utilisateur* est invité :

"Prévois-moi un dîner avec mon meilleur ami Daniel ce soir". 

LAM divise la tâche en sous-tâches :

1. Vérifier dans le calendrier de l'utilisateur* (et de Daniel) quand les deux sont disponibles (à partir de). 

2. Où se trouvent actuellement l'utilisateur/l'utilisatrice et Daniel?  

3. Quel est le temps sur place?

 4. Quels sont les restaurants à proximité?  

5. Quel est le menu? 

6. Est-il possible de réserver via un formulaire sur le site web du restaurant?  

Des assistants IA répondent à toutes ces tâches partielles. Dès que toutes les tâches partielles ont été effectuées, le LAM reçoit un feed-back correspondant et en informe l'utilisateur ou l'utilisatrice.

LAM répond: 

"Avec plaisir! Comme il pleut aujourd'hui, je t'ai choisi le restaurant L'interno à Olten, qui propose une cuisine italienne avec des options végétariennes et végétaliennes. Voulez-vous que je vous le réserve pour 19 heures"? 

Comme vous pouvez le constater, les capacités des modèles vocaux dépasseront très probablement à l'avenir la simple génération de texte. En conséquence, le format "chat sur le web" disparaîtra probablement à nouveau et sera remplacé par un assistant IA qui accompagnera et soutiendra les utilisateurs au quotidien sur tous les appareils. 

Demander à Marcel

Marcel est formateur chez Swisscom. Il est à votre disposition pour toutes les questions autour de l’IA.

Portrait des Leiters Jugendmedienschutz Michael In Albon
Marcel

Formateur chez Swisscom