"Cara AI, per favore scrivi la mia domanda".

9 minuti

IA generative di testo e modelli linguistici

L'intelligenza artificiale generativa è in aumento e ora si può trovare non solo nel familiare formato della chat, ma anche in numerose forme come assistenti AI, ad esempio nelle app di produttività. Ci chiediamo: quali sono le AI generative di testo e come funzionano? In questa pagina forniamo informazioni interessanti sull'IA
generativa del testo, suggerimenti e esempi classici di applicazioni creative.

Tema

Come funziona l'IA generativa?

Noi esseri umani non ripensiamo a tutto in ogni momento, ma impariamo e costruiamo nuove conoscenze su ciò che abbiamo appreso in precedenza. I nostri pensieri e i nostri ricordi rimangono nella memoria e costituiscono quindi la base per nuove connessioni.

Anche l'IA generativa lavora con tali collegamenti e deve quindi essere in grado di accedere a una rete neurale in cui le informazioni rimangono disponibili. Ma come si crea una memoria artificiale di questo tipo e come può l'IA generare risposte da essa?

Il metodo LSTM (Long Short-Term Memory) è un software che esiste dal 1995 e che viene utilizzato per riconoscere determinati schemi nei dati. Ciò consente al software di ricordare le informazioni precedenti e di riutilizzarle quando necessario.

Per far funzionare questa tecnologia, l'LSTM utilizza una rete neurale speciale, la cosiddetta Recurrent Neural Network (RNN), che funziona con processi ripetitivi. Ciò significa che il software è in grado di elaborare le informazioni passo dopo passo.

Tuttavia, anche l'LSTM ha i suoi limiti. Poiché elabora le informazioni in modo sequenziale, non può gestire bene grandi quantità di dati e tende a trascurare le informazioni più distanti.  

Nel 2017, Google ha presentato il documento scientifico "Attention is All You Need"(apre una nuova finestra). In esso gli autori suggeriscono che nuovi meccanismi di attenzione possono migliorare significativamente la qualità el'efficienza dei modelli di rete neurale esistenti:

Il team di ricerca propone una "semplice architettura di rete, il Transformer, che si basa esclusivamente su meccanismi di attenzione [...]"(apre una nuova finestra). Questotrasformatore utilizza meccanismi innovativi per comprendere meglio il contesto ed elaborarlo in modo più efficiente. Gli esperimenti sono stati condotti con compiti di traduzione automatica.

Il Transformer ha fatto progredire in modo significativo lo sviluppo dell'intelligenza artificiale generativa del testo. Poiché è in grado di gestire meglio le lunghe dipendenze nei testi e può essere addestrato in modo più efficiente, è ideale per compiti come la generazione di testi, i chatbot e altre applicazioni che devono generare o comprendere il linguaggio naturale. Non c'è quindi da stupirsi che tutte le IA testuali oggi conosciute siano costruite sull'architettura Transformer.

Tema

Perché i modelli Transformer
funzionano così bene?

Per rispondere a questa domanda, diamo un'occhiata più da vicino al nome del
modello di trasformatore più noto di OpenAI, ChatGPT. 

Perché è qui che si nasconde la ricetta del successo del modello linguistico ampiamente utilizzato: 

L'intelligenza artificiale non solo impara a calcolare la probabilità della prossima parola corretta,
ma genera anche parole e frasi coerenti a partire da queste probabilità calcolate. 

Per calcolare queste probabilità, l'IA è stata addestrata con una grande quantità di dati di conoscenza umana. 

Transformer descrive la tecnica utilizzata dalla rete neurale per comprendere e utilizzare il contesto e le relazioni presenti nei testi. 

In definitiva, ciò significa che le IA testuali generative sono sempre una combinazione del modello e dei dati raccolti durante l'addestramento, la cui combinazione consente all'IA di rispondere correttamente alle domande semplicemente prevedendo la parola o il token successivo. 

Tema

Quali sono i migliori generatori
  di testo AI?

Negli ultimi mesi è esploso il numero di fornitori di IA testuale generativa. I più noti sono ChatGPT, Google Gemini, Meta Llama e Claude.

Con ChatGPT,
OpenAI è leader nella qualità dei generatori di testo AI. L'azienda sta sviluppando rapidamente il suo modello di generazione di testi, garantendo una rapida diffusione del campo di applicazione del modello di IA.

Version Aggiornato a Modalità Funzioni principali 
GPT-4o Maggio 2024
  • Testo
  • Immagine
  • Gestione di immagini, voce e testo
GPT-4   Marzo 2023
  • Testo
  • Immagine
  • PDF
  • Analisi di siti web 
  • Analizzare PDF
  • Analizzare pagine web come fonte
  • Creare immagini
    (attraverso l'integrazione di DALL-E)
GPT-3.5 Novembre 2022
  • Testo
  • Generare testi

Il modello è sempre più disponibile anche come estensione per altri software, ad esempio come assistente GPT per determinati argomenti.

ChatGPT Gratuito GPT-4o e GPT-3.5
ChatGPT Plus $20 / mese GPT-4o, GPT-4 e GPT-3.5 

Google
Gemini è un modello di intelligenza artificiale generativa di Google AI. Situato nel cosmo di Google, Google Gemini può essere integrato e utilizzato direttamente nelle app di produttività di Google con il relativo abbonamento AI Premium. 

Versione Dati di allenamento fino a bis Modalità Funzioni principali
Gemini 1.5 Pro Maggio 2024
  • Testo
  • Audio
  • Immagini
  • Video
  • File PDF
  • Finestra di contesto più ampia rispetto ai modelli standard
    (adatto a testi più lunghi e a contesti più complessi)
Gemini (1.0) Pro Febbraio 2023
  • Testo
  • Versione leggera per le richieste di base
Gemini (1.0) Ultra  Dicembre 2023
  • Testo
  • Il modello più potente
    (elaborazione di compiti complessi ottimizzata)
Gemini Pro Gratuito Gemini 1.0 Pro
Gemini Advanced (AI Premium) CHF 17/mese Gemini 1.5 Pro

Llama di Meta è un modello di generazione di testo open source, sviluppato appositamente per sviluppatori, ricercatori e aziende. La base open source garantisce che Meta Llama possa essere eseguito anche direttamente sul vostro computer, con l'opportuna integrazione.

 Meta AI è un assistente intelligente per privati, basato sull'ultima versione di Llama 3, in grado di risolvere compiti complessi e sfumati, ragionare o visualizzare idee.

Versione Utilizzare da Modalità Funzioni principali
Meta AI Inizialmente disponibile solo negli Stati Uniti
  • Testo
  • Immagine
  • Risolvere compiti complessi 
  • Visualizzare immagini
Meta Llama 3 Aprile 2024
  • Testo
  • PDF
  • Generazione di testo 
  • Analisi PDF
Meta Llama 2 Luglio 2023
  • Testo
  • Generare testi
  • Riassumere testi
  • Riscrivere testi

Claude è un'intelligenza artificiale generativa che è stata addestrata da Anthropic con Constitutional AI. Claude può elaborare informazioni, raccogliere idee o generare testo e codice in risposta.

Versione Utilizzare da  Modalità Funzioni principali
Claude 3 Opus Marzo 2024
  • Testo
  • Immagine
  • PDF
  • Il modello più potente per compiti complessi
Claude 3 Sonnet Marzo 2024
  • Testo
  • Immagine
  • PDF 
  • Per attività efficienti e ad alta produttività
Claude 3 Haiku Marzo 2024
  • Testo
  • Il modello più veloce per le attività meno complesse
Claude Free Gratuito Claude 3 Sonnet
Claude Pro $20/mese Claude 3 Opus

Tema

Come posso fare un prompt migliore?

Sebbene i modelli linguistici siano stati progettati e siano molto bravi a comprendere il linguaggio naturale e a rispondere di conseguenza, una struttura e un linguaggio chiari aiutano a ottenere risposte accurate dall'IA.

Ogni IA generativa funziona in modo leggermente diverso, ma questo schema di prompt è utile come principio per tutte:

Chi spiega / scrive / formula? Definire un personaggio per l'IA, ad esempio: un insegnante, un docente di astrofisica, una madre, ecc.

A chi è rivolto il testo? Indicare il livello di risposta desiderato, ad esempio: Spiegare come a un bambino piccolo, a uno specialista, ecc.

Cosa volete sapere esattamente? Definite chiaramente quali informazioni desiderate ricevere, ad esempio: come si crea un buco nero.

In quale forma (testo) deve essere generata la risposta? Specificare il formato di destinazione desiderato ed eventuali requisiti di progettazione e strutturazione, ad esempio: sotto forma di articolo con sottotitoli.

Per compiti complessi con diverse sotto-domande, è utile fornirle all'IA singolarmente. Altrimenti, c'è il rischio che alcuni dettagli non vengano presi in considerazione dall'IA. È quindi meglio iniziare la chat con una base semplice e costruire su di essa con continue richieste e domande.

Utilizzate degli esempi per aiutare l'IA a capire cosa volete e in quale forma. Forse avete un testo la cui struttura o tono di voce corrisponde alle vostre idee? Utilizzatelo come riferimento per non dover scrivere il prompt in modo così laborioso. In questo modo sarà molto più facile ed efficace ottenere risultati di alta qualità.

Un esempio di richiesta: 

"Sei è  un docente di astrofisica. Spiegami come a un bambino piccolo come si forma un buco nero. Scrivi la risposta sotto forma di articolo con sottotitoli. Utilizza il testo seguente come esempio di stile di scrittura".

Modelli linguistici e protezione dei dati

Quando si utilizza l'intelligenza artificiale generativa, è importante rendersi conto che non devono essere resi disponibili dati personali non necessari. Tenga presente quanto segue:    

  1. Memorizzazione dei dati sui server del modello: i dati forniti all'AI sotto forma di prompt vengono elaborati e memorizzati sui server del modello. Ciò significa che questi dati possono essere utilizzati anche per un'ulteriore formazione dei modelli AI.
  2. Evitare le informazioni personali: Per evitare che le sue informazioni personali confluiscano nell'addestramento dell'IA e vengano diffuse in questo modo, è consigliabile inviare richieste completamente prive di informazioni personali o censurarle prima di inviarle. 
  3. Attivare l'opt-out per la formazione: Per evitare che i suoi dati vengano utilizzati dall'azienda per la formazione AI, può attivare un opt-out corrispondente nelle rispettive impostazioni di protezione dei dati: ChatGPT(apre una nuova finestra)Google Gemini(apre una nuova finestra)Meta Llama(apre una nuova finestra) und Claude(apre una nuova finestra).

Tema

Schemi di promemoria: CO-STAR e TIDD-EC

Le numerose istruzioni e suggerimenti presenti sul web che promettono risposte ancora più pertinenti da parte dell'intelligenza artificiale generativa dimostrano quanto sia importante un prompt mirato quando si utilizza l'intelligenza artificiale generativa.

CO-STAR e TIDD-EC sono due schemi di prompt che possono aiutarvi a creare un prompt efficace. I nomi di questi schemi sono costituiti dalle lettere iniziali dei componenti:

Io schema (o struttura) CO-STAR è composto da sei elementi e aiuta a creare suggerimenti chiari ed efficaci.

Contesto: spiegare il contesto e le circostanze del compito.

Obiettivo: definire l'obiettivo da raggiungere. 

Ambito: limita l'area o l'ambito del compito.

Compito: descrivere il compito specifico che si vuole far eseguire all'intelligenza artificiale. 

Azione: specificare le azioni da eseguire.

Risultato: descrivere il risultato desiderato. 

Un esempio di prompt:

"Non ho molto tempo e non ho esperienza di cucina. Puoi darmi una ricetta di pasta facile e veloce? Gli ingredienti dovrebbero essere disponibili in qualsiasi supermercato. Spiegami la preparazione passo dopo passo".

Anche lo schema (o struttura) TIDD-EC si compone di sei elementi e vi supporta nel prompt strutturato. 

Task type (Tipo di compito): Dare al modello linguistico un'idea chiara del tipo di compito che deve svolgere.  

Instructions (Istruzioni): Descrivere i passi specifici o le linee guida che il modello linguistico deve seguire durante l'esecuzione del compito.  

Do (Fare): Quali azioni aiuteranno il modello linguistico a svolgere il compito? 

Don’t (Evitare): Quali sono gli elementi che il modello linguistico deve evitare quando risponde al prompt? 

Examples (Esempi): Fornire esempi concreti del tipo di risultati o risposte desiderate. 

Content (Contenuto): In qualità di utente, fornire dati specifici (attenzione: solo generali, nessun dato personale!) con cui il modello linguistico possa lavorare, utilizzare nella risposta o a cui fare riferimento.

Un esempio di prompt:

"Spiegatemi  in termini semplici i benefici del tè verde per la salute. Fate  riferimento alle scoperte scientifiche e ai risultati delle ricerche attuali. La risposta deve essere facile da capire e non deve contenere termini tecnici complicati. Un esempio potrebbe essere: 'Il tè verde può aiutare a rafforzare il sistema immunitario'".

Tema

Esempi di applicazione dell'IA generativa del testo

Il campo di applicazione dell'intelligenza artificiale generativa del testo è immenso. Da quando l'intelligenza artificiale generativa (anche sotto forma di assistenti AI) è diventata disponibile al grande pubblico, questo campo di applicazione è cresciuto ulteriormente.

Due esempi di applicazione di questo tipo - dal classico al creativo - sono disponibili qui:

Assistente di scrittura: scrivere una domanda

Utilizzate il contesto del vostro CV e dell'annuncio di lavoro selezionato per generare una prima bozza della vostra candidatura, che potrete poi modificare manualmente. 

"Scrivimi  una bozza di candidatura basata sul mio CV per l'annuncio di lavoro allegato."

Bando di concorso: 
  • Annuncio di lavoro: Architetto 80-100%
  • Azienda: Studio di architettura Muster
  • Posizione: Berna
  • Compiti: Progettazione e pianificazione di edifici, interni e paesaggi, preparazione di piani di costruzione e disegni tecnici, collaborazione con ingegneri civili, clienti e altri professionisti, supervisione di progetti di costruzione dalla concezione al completamento.
  • Requisiti: Laurea in architettura FH o ETH, esperienza nella fase di progettazione e pianificazione, conoscenza di software CAD (es. AutoCAD, ArchiCAD), capacità di lavorare in team e spiccate doti comunicative.
  • Offriamo: progetti stimolanti in un ambiente creativo, opportunità di formazione continua, condizioni di lavoro interessanti e orari flessibili.

Curriculum vitae:  

  • Esperienza professionale: Oltre 5 anni di esperienza nella progettazione di immobili residenziali e commerciali.
  • Specializzazione: Design sostenibile e soluzioni innovative.
  • Competenze software: AutoCAD, SketchUp e Adobe Creative Suite.
  • Posizione precedente: collaborazione a progetti di sviluppo urbano presso l'Architekturwerkstatt di Basilea.
  • Formazione: Master in Architettura".

Attenzione: per motivi di protezione dei dati, cercate di non fornire all'AI alcun dato personale, anche se si tratta del vostro CV.

Motore creativo: giochi basati sul testo

Le IA generative di testo sono particolarmente brave a scrivere narrativa. Ecco un'idea di come si può usare questa creatività per un gioco di avventura testuale come negli anni '80 per giocare senza limiti di programmazione.

"Sei una macchina da gioco AI. Simula un gioco chiamato "AI-dventures", un gioco basato sul testo in cui il giocatore deve raggiungere un obiettivo in un luogo a sua scelta usando la sua creatività. Utilizzate una formattazione emozionante durante il gioco e un linguaggio vivace per rendere il gioco divertente. Inizia il gioco... ora!"

Matematica - La debolezza dei modelli linguistici

Anche l'intelligenza artificiale generativa ha i suoi punti deboli. Come suggerisce il nome, la forza dei modelli linguistici risiede nell'elaborazione del linguaggio. Tuttavia, poiché i meccanismi del mondo dei numeri non funzionano come quelli del linguaggio, la maggior parte dei modelli linguistici ha difficoltà a generare risposte corrette a compiti matematici. 

ChatGPT-4, ad esempio, spesso si avvicina molto al risultato, ma non lo raggiunge mai esattamente. Con ChatGPT-4o, OpenAI ha trovato una soluzione a questo problema: Il modello linguistico riformula il problema matematico in codice, lo esegue in un ambiente di programmazione e fornisce il risultato generato come risposta alla domanda. 

Tema

Quali sono le opportunità e i rischi
dell'IA generativa del testo?

L'intelligenza artificiale generativa offre un grande potenziale all'umanità, ad esempio nell'automazione, ma comporta anche alcuni rischi.

Opportunità

Con l'IA generativa è possibile progettare rapidamente nuove idee. Questo offre un grande potenziale per i progetti privati.

I modelli linguistici ci offrono un grande potenziale nella vita di tutti i giorni per svolgere o far svolgere più facilmente le attività quotidiane. I compiti che non hanno alcun valore aggiunto per noi possono essere affidati a un'intelligenza artificiale (se disponibile).

Rischi

Poiché la conoscenza di un'IA è sempre limitata dal database con cui è stata addestrata, è quasi impossibile creare un'IA completamente priva di valori o pregiudizi.

Se un'intelligenza artificiale non conosce una risposta probabile a una certa domanda, può semplicemente inventare una risposta. Se questi risultati allucinati vengono poi condivisi, la disinformazione viene inconsciamente rafforzata e la miscela di verità e risultati inventati rende difficile stabilire fatti oggettivi.

Quando si creano nuovi contenuti, si ricorre volentieri all'aiuto di modelli linguistici. In linea di principio non è sbagliato, ma le "soluzioni one-click" e un gran numero di idee non portano necessariamente a risultati di alta qualità, ma piuttosto a idee standard. La capacità di interagire con le idee e di svilupparle (ulteriormente) rimane quindi particolarmente importante, anche o soprattutto quando si lavora con l'IA generativa.

Tema

Prospettive: Potenziale degli "agenti AI"

In quale direzione si svilupperà l'intelligenza artificiale generativa in futuro? Gran parte del mondo tecnologico vede i cosiddetti "modelli di azione di grandi dimensioni" o "agenti AI" come il futuro dei modelli linguistici. Ma cosa significa?

I Large Action Models (LAM) sono destinati a diventare l'interfaccia tra l'intelligenza artificiale e gli esseri umani. All'intelligenza artificiale viene assegnato un obiettivo tramite testo, voce o altri input. Per raggiungere l'obiettivo, il LAM divide il processo richiesto in sottoattività che vengono eseguite da agenti autonomi, gli assistenti dell'IA. Questi ultimi trasmettono poi i risultati al LAM centrale. 

Un esempio di come potrebbe apparire: 

Richieste dell'utente:

"Organizzare una cena con il mio migliore amico Daniel stasera".

LAM divide l'attività in sottoattività:

1. controllare il calendario dell'utente (e di Daniel) quando entrambi sono disponibili.

2. dove si trovano attualmente l'utente e Daniel? 

3 Qual è il clima locale?  

4. Quali ristoranti ci sono nelle vicinanze?

5 . Cosa c'è nel menu?

6. È possibile effettuare una prenotazione tramite il modulo sul sito web del ristorante? 

A tutti questi compiti secondari rispondono gli assistenti AI. Non appena tutti i sottocompiti sono stati risolti, il LAM riceve un feedback appropriato e informa l'utente.

Le risposte di LAM: 

"Non c'è di che! Visto che oggi piove, ho scelto il ristorante L'interno a Olten, che offre cucina italiana con opzioni vegetariane e vegane. Vuole che lo prenoti per le 19:00?".

Come si può notare, in futuro le capacità dei modelli linguistici andranno molto probabilmente oltre la pura generazione di testo. Di conseguenza, il formato "chat del sito web" probabilmente scomparirà di nuovo e un assistente AI accompagnerà e supporterà la vita quotidiana su tutti i dispositivi. 

Chiedere a Marcel

Marcel è un formatore di Swisscom. È a vostra completa disposizione per tutte le domande sull'IA.

Portrait des Leiters Jugendmedienschutz Michael In Albon
Marcel

Formatore di Swisscom