Intelligenza artificiale generativa

tipo di IA Da Wikipedia, l'enciclopedia libera

Intelligenza artificiale generativa

L'intelligenza artificiale generativa (o IA generativa) è un tipo di intelligenza artificiale che è in grado di generare testo, immagini, video, musica o altri media in risposta a richieste dette prompt.[1][2] I sistemi di intelligenza artificiale generativa utilizzano modelli generativi, che sono modelli statistici di una distribuzione congiunta di una variabile osservabile e di una variabile dipendente, che nel contesto del data mining è detta variabile target. Un esempio di questi modelli sono i modelli linguistici di grandi dimensioni (in sigla LLM) che producono dati a partire da un dataset di addestramento (tra cui grandi database accademici, aziendali e istituzionali, metadata SEO, log di motori di ricerca, grafi di conoscenza e endpoints) utilizzato per crearli.[3]

Voce principale: Intelligenza Artificiale.
Thumb
Le immagini generate dall'intelligenza artificiale sono diventate molto più avanzate.

Tra i sistemi di intelligenza artificiale generativa degni di nota si ricordano ChatGPT, un chatbot creato da OpenAI utilizzando i modelli linguistici GPT-3 e GPT-4.[4] Altri sistemi includono Bard di Google (basato sul modello LaMDA[5]), Bedrock di Amazon, Ernie Bit di Baidu, Pangu-Σ di Huawei, Claude di Anthropic, xAI di Elon Musk, Jais in lingua araba, Poe di Quora e Llama di Meta (open source e gratuito, ma dedicato a sviluppatori, ricercatori e aziende). Dolly 2.0 è il primo LLM interamente open source e libero da restrizioni anche per finalità commerciali e di ricerca, creato da Databricks, società che condivide gli stessi fondatori di Apache Spark.[6] Nel 2023 è stato rilasciato su GitHub OpenChat AI, LLM addestrato con 7 miliardi di parametri su fonti offline, associate a un ranking e a un feedback positivo/negativo dei risultati da parte degli utenti.[7] Esistono, inoltre, sistemi capaci di generare immagini 3D come Stable Diffusion, Midjourney e DALL-E.[8]

L'intelligenza artificiale generativa ha potenziali applicazioni in una vasta gamma di settori, tra cui lo sviluppo software, il marketing e la moda[9][10], l'editoria, la predizione di struttura proteica e la scoperta di farmaci (a partire da catene di aminoacidi o rappresentazioni di molecole, come la codifica SMILES che rappresenta DNA o proteine).[11]

Storia

Gli investimenti nell'IA generativa sono aumentati nei primi anni 2020: Microsoft che ha investito 10 miliardi di dollari in OpenAI, Google e Baidu e numerose aziende più piccole che sviluppano modelli di IA generativa.[1][12][13]

Anche in Italia, nel 2023, Microsoft Italia ha annunciato il progetto "Ambizione Italia #DigitalChamps" per sollecitare la trasformazione digitale puntando sulle piccole e medie imprese (PMI) e le nuove startup, sfruttando le ultime innovazioni per lo sviluppo economico del paese[14].

Nell'ottobre 2023 la Coalition for Content Provenance and Authenticity (C2PA, una coalizione formata da Adobe, Microsoft, Nikon, Leica, Camera Bits, Truepic e Publicis Groupe) ha sviluppato Content CRedentials, la prima etichetta che identifica univocamente la provenienza dei contenuti digitali generati dall'intelligenza artificiale. Essa si applica a Adobe Photoshop, Adobe Premiere e Bing Image Creator. L'icona permette di visualizzare il proprietario autore del contenuto, lo storico delle modifiche fino all'inserimento dell'icona e il software utilizzato per la sua realizzazione.[15]

Modalità

Riepilogo
Prospettiva

Un sistema di intelligenza artificiale generativa viene costruito applicando l'apprendimento automatico non supervisionato o auto-supervisionato a un insieme di dati. Le capacità di un sistema di intelligenza artificiale generativa dipendono dalla modalità o dal tipo di set di dati utilizzato.

  • Testo: I sistemi di intelligenza artificiale generativa addestrati su parole o token di parole includono GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 e altri. Sono capaci di elaborazione del linguaggio naturale, traduzione automatica, e generazione di linguaggio naturale e possono essere usati come modelli di base per altri compiti[16]. I set di dati includono BookCorpus, Wikipedia e altri.
  • Codice: Oltre al testo in linguaggio naturale, i grandi modelli linguistici possono essere addestrati su testi di linguaggio di programmazione, permettendo loro di generare codice sorgente per nuovi programmi informatici. Esempi includono OpenAI Codex.
  • Immagini: I sistemi di intelligenza artificiale generativa addestrati su set di immagini con didascalie di testo includono Imagen, DALL-E, Midjourney, Stable Diffusion e altri. Sono comunemente usati per la generazione di immagini da testo e il trasferimento di stile neurale. I set di dati includono LAION-5B e altri (vedi Set di dati in visione computazionale).
  • Molecole: I sistemi di intelligenza artificiale generativa possono essere addestrati su sequenze di amminoacidi o rappresentazioni molecolari come SMILES che rappresentano DNA o proteine. Questi sistemi, come AlphaFold, vengono utilizzati per la previsione della struttura delle proteine e la scoperta di farmaci. I set di dati includono vari set di dati biologici.
  • Musica: Sistemi di intelligenza artificiale generativa come MusicLM possono essere addestrati sulle forme d'onda audio di musica registrata insieme a annotazioni di testo, al fine di generare nuovi campioni musicali basati su descrizioni di testo come "una melodia di violino rilassante supportata da un riff di chitarra distorto".
  • Video: L'intelligenza artificiale generativa addestrata su video annotati può generare clip video coerenti nel tempo. Esempi includono Gen1 di RunwayML[17] e Make-A-Video di Meta Platforms[18].
  • Multimodale: Un sistema di intelligenza artificiale generativa può essere costruito da più modelli generativi, o un modello addestrato su più tipi di dati. Ad esempio, una versione di GPT-4 di OpenAI accetta sia input di testo che di immagini[19].
  • voce: mediante il riconoscimento vocale e la sintesi vocale, in grado di elaborare domande complesse. Al 2023, è in via di introduzione su ChatGPT, Alexa di Amazon e nel chatbot Bard di Google.[20]

Oltre a testo e immagini 2D, le intelligenze artificiali generative possono anche generare immagini 3D ricche di dettagli, utili per gaming, realtà virtuale, cinema animato ed esperienze multimediali.[21]

Token e finestra di contesto

Un token è un’unità che il modello elabora. Può essere: Una output intero (1 token), Una output scomposto ( 2 token), Un segno, uno spazio, un simbolo, un' azione.

L’estensione del contesto di un modello di intelligenza artificiale si riferisce alla quantità di token che può “ricordare” o "generare" contemporaneamente durante la sua funzione. Una finestra di contesto più ampia permette al modello di gestire input più lunghi. Modelli con finestre di contesto più ampie sono utili per compiti che richiedono l’elaborazione di grandi quantità di dati in un'unica sessione.[22]

L'intelligenza artificiale nelle arti grafiche e nella Memetica

Lo stesso argomento in dettaglio: Memetica, Filosofia della mente e Filosofia del linguaggio.

La memetica e le immagini generate artificialmente (o anche solo crittografate) si stanno inserendo prepotentemente nei manuali di arte. Questo mette in luce come l'arte sia talvolta ante segnale nei tempi e nelle vicende umane. Oggi se dovessimo chiederci chi risponderebbe più velocemente ad un meme se un'intelligenza artificiale o un novantenne. Ma si veda anche il riconoscimento di meme come termine proprio stesso o l'uso delle emoji come forma di linguaggio.

Impatti

Uno studio di Ambrosetti-The European House ha stimato che nel 2023 un'adozione diffusa pervasiva dell'intelligenza artificiale generativa in Italia potrebbe creare 312 miliardi di ore lavorate di valore aggiunto ovvero liberare 5,4 miliardi di ore lavorate ogni anno, pari al 18% del PIL.[23] Secondo il World Economic Forum, dal 2024 al 2029 l'intelligenza artificiale generativa comporterà la perdita di 14 milioni di posti di lavoro.[24] Secondo Goldman Sachs, i progressi dell'intelligenza artificiale raggiunti al 2023 consentirebbero di automatizzare 300 milioni di posti di lavoro a tempo pieno.[25]

Secondo uno studio McKinsey, si prevede che dal 2025 il 20% della domanda di chip sia trainato dall'intelligenza artificiale.[26]

Secondo uno studio del think thank Authonomy, l'intelligenza artificiale potrebbe ridurre la settimana lavorativa a 4 giorni entro il 2033 per 28 milioni di lavoratori della Gran Bretagna (88% della forza lavoro) e 128 milioni degli Stati Uniti (78% della forza lavoro).[27]

Al 2023, l'intelligenza artificiale generativa ha già superato quella umana in alcuni ambiti specifici come la ricerca di nuove proteine e i giochi di strategia.[28]

Rilevatori

Sul mercato esistono software gratuiti capaci di riconoscere il testo generato dall'intelligenza artificiale generativa (come GPTZero), nonché immagini, audio o video provenienti da quest'ultima.[29][30][31]

Costi

Nel febbraio 2025, Sundar Pichai, ceo di Google, ha detto che i costi dell'IA sono calati del 97% in 18 mesi, da quattro dollari a 13 centesimi per milione di token, l’unità di testo elaborata dalla IA.[32]

La Francia usa energia nucleare a basso costo per alimentare i data center dell'intelligenza artificiale.

Critiche

L'efficacia di questi modelli è talvolta situazione di dibattito. Sono note, specialmente in modelli "poco informati", le allucinazioni sono un esempio.[33]

Note

Voci correlate

Altri progetti

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.