Modelli generativi

L'ascesa dei modelli generativi

L'AI generativa si riferisce a modelli di apprendimento profondo che possono prendere dati non elaborati – ad esempio, tutta Wikipedia o le opere raccolte di Rembrandt – e “imparare” a generare risultati statisticamente probabili quando richiesto. Ad un livello superiore, i modelli generativi codificano una rappresentazione semplificata dei dati di addestramento e ne attingono per creare un risultato simile, ma non identico, ai dati originali.

I modelli generativi sono stati utilizzati per anni in statistica per analizzare i dati numerici.L’ascesa dell'apprendimento profondo, tuttavia, ha reso possibile l'estensione a immagini, parlato e altri tipi di dati complessi.Tra la prima classe di modelli che hanno raggiunto questa impresa trasversale ci sono gli autoencoder variazionali, o VAE, introdotti nel 2013. I VAE sono stati i primi modelli di apprendimento profondo ad essere ampiamente utilizzati per generare immagini e discorsi realistici.

"I VAE hanno aperto le porte alla modellazione generativa profonda rendendo i modelli più facili da scalare", ha dichiarato Akash Srivastava, esperto di AI generativa presso il MIT-IBM Watson AI Lab.
"Gran parte di ciò che oggi consideriamo AI generativa è iniziata da qui".

I primi esempi di modelli, come GPT-3, BERT o DALL-E 2, hanno dimostrato cosa sia possibile fare.Il futuro è rappresentato da modelli addestrati su un ampio insieme di dati non etichettati che possono essere utilizzati per attività diverse, con una ottimizzazione minima.I sistemi che eseguono attività specifiche in un singolo dominio lasciano posto a un'AI più ampia, che apprende in modo più generale e opera su più domini e problemi.I modelli di fondazione, addestrati su dataset di grandi dimensioni non etichettati e ottimizzati per una serie di applicazioni, stanno guidando questo cambiamento.

Per quanto riguarda l'AI generativa, si prevede che i modelli di fondazione accelereranno drasticamente l'adozione dell'IA nelle aziende.La riduzione dei requisiti di etichettatura renderà molto più facile per le aziende lanciarsi in questa impresa e l'automazione altamente accurata ed efficiente guidata dall'IA che essi consentono di realizzare significherà consentirà a un numero molto maggiore di aziende di impiegare l'AI in una gamma più ampia di situazioni mission-critical.Per IBM, la speranza è che la potenza dei modelli di fondazione possa essere portata a tutte le aziende in un ambiente cloud ibrido senza precedenti.