Articolo scritto per il blog Medium dagli esperti di Artefact in collaborazione con la Tech Corporate Community francese.
L'abbondanza e la diversità delle risposte a ChatGPT e ad altre IA generative, scettiche o entusiaste, dimostrano i cambiamenti che stanno apportando e l'impatto che stanno avendo ben oltre i soliti circoli tecnologici. Questo è in netto contrasto con le precedenti generazioni di IA, che erano essenzialmente predittive e generalmente oggetto di articoli o tesi di laurea confinate nel campo della ricerca e dell'innovazione.
Per le aziende, l'IA generativa è anche diversa dalle precedenti intelligenze artificiali. Se le confrontiamo con le tecnologie più simili, come l'elaborazione del linguaggio naturale (NLP) per i corpora di testo o la computer vision per i dati audiovisivi, le IA generative apportano quattro importanti cambiamenti di cui le aziende si stanno rendendo conto man mano che le sperimentano.
In primo luogo, rispetto all'IA precedente, l'IA generativa accelera significativamente l'implementazione dei casi d'uso, nel senso che accelera il proof of concept. In secondo luogo, aprono un nuovo campo di possibilità, consentendo una valorizzazione più semplice, più efficiente e meno costosa dei dati non strutturati. Inoltre, i risultati ottenuti con l'IA generativa sono nuovi in termini di qualità, quantità e diversità rispetto ai modelli utilizzati in precedenza. Tutti questi fattori implicano la necessità di rispondere alle accresciute aspettative degli utenti finali, alimentate dal clamore suscitato da questa tecnologia. Di seguito sviluppiamo questi quattro punti.
L'IA generativa consente di testare più rapidamente il valore aggiunto dei casi d'uso
Nel campo dell'IA generativa, l'implementazione di casi d'uso è spesso più rapida e meno laboriosa rispetto alle IA precedenti. L'approccio adottato con l'IA generativa è spesso paragonato all'assemblaggio dei Lego, dove i componenti preesistenti possono essere combinati per creare nuovi risultati. Questa facilità di sperimentazione e implementazione può consentire cicli di sviluppo più brevi. Inoltre, una modalità di interazione conversazionale con gli utenti ne accelera l'adozione.
Un caso d'uso dei dati può essere ridotto a un problema aziendale, a dati, a un modello e a una richiesta. Tradizionalmente, la creazione e l'ottimizzazione del modello rappresentano la parte più complessa e lunga del processo. Con l'IA generativa, questa fase diventa più semplice. L'IA generativa fornisce modelli pre-addestrati e pronti all'uso, consentendo alle aziende di beneficiare di competenze avanzate senza investire molto tempo nello sviluppo e nel perfezionamento dei modelli. In pratica, i modelli (come il GPT 4.0 di Azure) sono accessibili "on-demand" o possono essere distribuiti tramite API (come Gemini Pro BARD di Google). Alcuni fornitori offrono anche modelli appositamente perfezionati per domini specifici, come la generazione di testi legali, medici o finanziari.
Una volta che il modello è stato implementato, l'unico compito che rimane è quello di "mettere a terra" il modello di intelligenza artificiale generativa, cioè di ancorare i risultati generati dal modello alle informazioni del mondo reale in modo da costringere il modello a rispondere entro un determinato perimetro. Questo spesso comporta l'aggiunta di vincoli o informazioni supplementari per guidare il modello verso la produzione di risultati coerenti e rilevanti in un contesto specifico. Tuttavia, questo è molto lontano dal tempo necessario per addestrare i modelli di intelligenza artificiale che abbiamo usato finora.
Prendiamo l'esempio di un caso d'uso per l'analisi dei verbali dei call center per illustrare il nostro punto. Secondo uno studio di Artefact , per sviluppare questo tipo di caso d'uso utilizzando modelli basati sull'IA precedente, occorrevano in genere dalle tre alle quattro settimane dal momento in cui i dati venivano recuperati e resi utilizzabili. Oggi, grazie all'IA generativa, questo processo richiede solo una settimana, con un fattore di accelerazione superiore a tre. La sfida principale consiste nello scegliere la classificazione aziendale appropriata per adattare il modello.
L'IA generativa estende il campo di applicazione dell'IA a dati precedentemente poco utilizzati o utilizzati in modo improprio.
Alcuni giacimenti di petrolio sono redditizi solo quando il prezzo del petrolio sale alle stelle. Lo stesso principio può essere applicato ai dati. Alcuni dati non strutturati possono essere estratti grazie all'IA generativa, aprendo un nuovo campo di dati sfruttabili per l'addestramento o la messa a punto di modelli e offrendo numerose prospettive per applicazioni specializzate in domini specifici.
E c'è una promessa emergente: quella di IA generative in grado di gestire e combinare qualsiasi tipo di dati nei loro processi di addestramento, aggirando il lavoro lungo e noioso di strutturare e migliorare la qualità dei dati aziendali per renderli utilizzabili. Una promessa non ancora mantenuta, stando alle osservazioni attuali.
L'IA generativa non ha solo beneficiato di una vera e propria svolta nei meccanismi di attenzione. Ha anche beneficiato della potenza sempre maggiore - e necessaria - delle macchine.
I meccanismi di attenzione funzionano un po' come la capacità di concentrarsi su una parte importante di un'immagine o di un testo quando si cerca di capire o creare qualcosa. Immaginate di cercare di disegnare un paesaggio da una fotografia. Invece di guardare l'intera immagine in una volta sola, ci si concentra su alcune parti che sembrano importanti, come le montagne o gli alberi. Questo aiuta a comprendere meglio i dettagli importanti e a creare un disegno più accurato. Allo stesso modo, i meccanismi di attenzione permettono al modello di concentrarsi su parti specifiche di un'immagine o di un testo quando genera contenuti. Invece di elaborare tutti gli input in una volta sola, il modello può concentrarsi sulle parti più rilevanti e importanti per produrre risultati più accurati e significativi. Questo gli permette di imparare a creare immagini, testi o altri tipi di contenuti in modo più efficiente e realistico.
I meccanismi di attenzione si parallelizzano molto bene. L'uso di meccanismi di attenzione multipli fornisce una rappresentazione più ricca e robusta dei dati, portando a un miglioramento delle prestazioni in vari compiti come la traduzione automatica, la generazione di testi, la sintesi vocale, la generazione di immagini e molti altri.
Di conseguenza, casi d'uso che sembravano impossibili fino a poco tempo fa sono diventati pienamente accessibili. È il caso, ad esempio, del calcolo del tempo di parola nei media durante le campagne presidenziali. Solo due anni fa, calcolare con precisione il tempo di parola di ciascun candidato era un'operazione noiosa. Oggi, grazie all'uso dell'IA generativa, è possibile.
Per quanto riguarda le capacità di calcolo, sei anni fa OpenAI ha pubblicato un'analisi che mostrava come dal 2012 la quantità di calcolo utilizzata nelle sessioni di addestramento dell'IA più significative sia aumentata in modo esponenziale, con un tempo di raddoppio di 3,4 mesi (per fare un paragone, la legge di Moore prevedeva un periodo di raddoppio di due anni). Dal 2012, questa misura è aumentata di oltre 300.000 volte (un periodo di raddoppio di due anni produrrebbe solo un aumento di sette volte).
I modelli di intelligenza artificiale generativa spesso richiedono enormi quantità di potenza di calcolo per l'addestramento, soprattutto perché i modelli sono progettati per essere generalisti e necessitano di grandi quantità di contenuti per l'addestramento. Per elaborare grandi serie di dati ed eseguire complessi algoritmi di ottimizzazione sono necessarie potenti risorse di calcolo, come le GPU o le TPU di fascia alta. La nuova GPU NVIDIA A100 Tensor Core sembra fornire un'accelerazione senza precedenti. Secondo Nvidia, l'A100 offre prestazioni fino a 20 volte superiori rispetto alla generazione precedente e può essere partizionata in sette istanze di GPU per adattarsi dinamicamente alle mutevoli esigenze. Inoltre, secondo quanto riferito, vanta la larghezza di banda della memoria più veloce al mondo, con oltre due terabyte al secondo (TB/s) per l'esecuzione dei modelli e dei set di dati più grandi.
Va notato che i miglioramenti nel campo dell'informatica sono stati un elemento chiave nel progresso dell'intelligenza artificiale. Finché questa tendenza continuerà, dovremo essere pronti ad affrontare le implicazioni di sistemi che superano di gran lunga le capacità attuali e che si spingeranno sempre più in là, soppesando il valore che questi sistemi apportano rispetto ai costi che comportano, soprattutto in termini di energia e ambiente. Discuteremo questi punti in un prossimo articolo.
L'IA generativa migliora la diversità, la qualità e la quantità dei risultati ottenuti.
L'IA generativa si distingue chiaramente dall'IA precedente per l'impatto sui risultati generati dai suoi modelli. Non solo è aumentata la quantità di risultati generati, ma anche la loro qualità e diversità. Tuttavia, tutti questi aspetti positivi devono essere mitigati da una minore riproducibilità dei modelli di IA generativa.
Se consideriamo l'immagine di un puzzle, l'analisi dei dati può essere paragonata al suo assemblaggio, dove ogni dato rappresenta un pezzo da disporre per rivelare un'immagine coerente. L'intelligenza artificiale svolge un ruolo fondamentale nel tentativo di riempire i dati mancanti, utilizzando le informazioni disponibili per dedurre e ricreare i pezzi mancanti. L'IA generativa va oltre il semplice completamento dei dati esistenti, creando nuovi dati ispirati a quelli già esistenti. Questo processo espande le capacità di analisi e permette di scoprire nuove informazioni dai dati esistenti, portando in primo piano l'aspetto generativo.
A differenza delle precedenti generazioni di IA, che tendono a produrre risultati spesso simili, i modelli di IA generativa sono in grado di generare una maggiore diversità di risultati esplorando diverse varianti e alternative. Questa maggiore diversità consente di generare contenuti più ricchi e diversificati, passando dal quantitativo al qualitativo e coprendo una gamma più ampia di esigenze e preferenze.
OpenAI è stata di recente a Hollywood per presentare il suo ultimo modello chiamato "Sora", in grado di generare video a partire dal testo. "Sentire dire che è in grado di fare tutte queste cose è una cosa, ma vederne effettivamente le capacità è stato sorprendente", ha dichiarato il produttore di Hollywood Mike Perry, sottolineando la diversità e la qualità delle capacità offerte dall'IA generativa.
Tuttavia, a causa della loro capacità di esplorare uno spazio più ampio di possibilità, i modelli di IA generativa possono essere meno riproducibili rispetto alle IA precedenti e l'accuratezza dei risultati è compromessa. In concreto, è più difficile riprodurre esattamente gli stessi risultati ogni volta che il modello viene eseguito, il che può porre problemi in termini di affidabilità e prevedibilità in alcune applicazioni mission-critical.
Questa limitazione costituisce una sfida importante per le applicazioni di IA generativa che richiedono risposte precise. È un'area su cui le aziende stanno lavorando nei loro attuali sviluppi: specializzare meglio i modelli in domini altamente specifici per migliorare l'accuratezza delle risposte e combinare la robustezza dei modelli basati su regole o interrogazioni su dati strutturati con la facilità d'uso e di interazione con gli utenti delle IA generative, collegando queste ultime agli output dei primi.
Maggiori aspettative da parte degli utenti finali
Quando si tratta di gestire le aspettative e il rapporto degli utenti finali con la tecnologia, l'IA generativa presenta diverse sfide specifiche. Grazie alla sua capacità di produrre rapidamente risultati, l'IA generativa può suscitare aspettative particolarmente elevate. Al contrario, il verificarsi di allucinazioni e risultati indesiderati può minare notevolmente la fiducia degli utenti in queste soluzioni.
L'IA generativa è in grado di produrre risultati in modo rapido e automatizzato, il che può dare agli utenti finali l'impressione che la tecnologia sia in grado di risolvere tutti i loro problemi in modo istantaneo ed efficiente. Questo può portare ad aspettative sproporzionate sulle reali capacità dell'IA generativa e a delusioni se i risultati non soddisfano pienamente queste elevate aspettative.
L'IA generativa non è ovviamente perfetta e può talvolta produrre risultati inaspettati o indesiderati, come contenuti incoerenti, falsi o inappropriati. Il verificarsi di tali risultati indesiderati può portare a una perdita di fiducia dell'utente finale nella tecnologia, mettendone in dubbio l'affidabilità e l'utilità. Può anche sollevare preoccupazioni sulla sicurezza dei dati e sulla privacy, quando risultati inattesi compromettono l'integrità delle informazioni generate dall'IA generativa.
Nel febbraio 2023, il chatbot Bard di Google (ribattezzato Gemini) ha fornito informazioni errate quando gli sono state chieste informazioni sulle scoperte del telescopio spaziale James Webb della NASA. Ha erroneamente affermato che il telescopio ha scattato le prime foto di un esopianeta. Questa affermazione non è corretta, poiché le prime foto di un esopianeta risalgono al 2004, mentre il James Webb Telescope è stato lanciato solo nel 2021 (fonte: CNET France team, 2024).
È quindi fondamentale che gli utenti finali dei sistemi di IA generativa siano consapevoli dei loro limiti. Per questo motivo, la maggior parte delle aziende che implementano queste soluzioni si sforzano di supportare gli utenti nel loro utilizzo: addestrandoli all'arte del prompt, spiegando i limiti di questi sistemi, chiarendo quali aspettative possono o non possono essere soddisfatte e ricordando loro le regole applicabili in termini di protezione dei dati.
A più di un anno dal rilascio di ChatGPT, le aspettative per questa nuova tecnologia sono più alte che mai. Tuttavia, il valore associato deve ancora concretizzarsi in casi d'uso tangibili. Nel prossimo articolo tratteremo gli argomenti relativi all'adozione della tecnologia da parte delle aziende e alla sua diffusione all'interno dell'organizzazione.
Sotto la guida di: