OpenAI lancia il modello o1 di AI generativa: caratteristiche e prezzi

OpenAI ha rivelato la novità tanto attesa: un modello di intelligenza artificiale generativa, nome in codice “Strawberry“, ufficialmente chiamato OpenAI o1. Più precisamente, o1 rappresenta una famiglia di modelli. Due versioni sono già disponibili tramite ChatGPT e l’API di OpenAI: o1-preview e o1-mini, una variante più piccola ed efficiente, pensata per la generazione di codice.

L’accesso a o1 nella versione ChatGPT è riservato agli abbonati a ChatGPT Plus o Team, mentre per gli utenti Enterprise e del settore educativo l’accesso sarà possibile a partire dalla prossima settimana. Attualmente, l’esperienza chatbot con o1 è piuttosto limitata. Diversamente dal predecessore GPT-4o, o1 non ha ancora funzionalità di navigazione web o analisi di file. Sebbene includa capacità di analisi delle immagini, queste sono temporaneamente disattivate in attesa di ulteriori test. Inoltre, o1 ha un limite di utilizzo: al momento, gli utenti possono inviare fino a 30 messaggi settimanali con o1-preview e 50 con o1-mini.

Un altro aspetto critico è il costo: o1 è decisamente caro. Nell’API, il prezzo per o1-preview è di 15 dollari per ogni milione di token in input e 60 dollari per ogni milione di token in output, costando tre volte di più rispetto a GPT-4o per l’input e quattro volte di più per l’output. (Un milione di token equivale a circa 750.000 parole.)

OpenAI ha annunciato l’intenzione di rendere o1-mini disponibile a tutti gli utenti gratuiti di ChatGPT, anche se non è stata ancora fissata una data di lancio. Vedremo se l’azienda manterrà questa promessa.

ChatGPT OpenAI

Capacità di ragionamento

Il modello OpenAI o1 evita alcuni degli errori di ragionamento che spesso affliggono i modelli di intelligenza artificiale, in quanto è in grado di “verificare” i propri output dedicando più tempo all’analisi delle domande. Ciò che distingue o1 dagli altri modelli è la sua capacità di “riflettere” prima di fornire una risposta. Quando dispone di più tempo per elaborare una richiesta, o1 riesce a ragionare in maniera più completa, pianificando e svolgendo una serie di azioni coordinate che lo portano alla risposta finale. Questo lo rende particolarmente efficace per attività che richiedono la sintesi di diversi sotto-compiti, come individuare email riservate nella casella di posta di un avvocato o creare strategie di marketing.

o1 è stato addestrato con il metodo dell’apprendimento per rinforzo, che insegna al sistema a “pensare” tramite una catena di pensieri privata. In questo modo, riceve ricompense per risposte corrette e penalità per quelle errate.

Noam Brown, scienziato presso OpenAI ha spiegato che OpenAI ha utilizzato un nuovo algoritmo di ottimizzazione e un set di dati progettato appositamente per compiti di ragionamento, contenente anche letteratura scientifica. “Più tempo impiega [o1] per riflettere, migliori sono i risultati”, ha detto. Come riportato da Techcrunch, Pablo Arredondo, VP di Thomson Reuters, ha avuto accesso anticipato e ha dichiarato che il modello supera le prestazioni dei precedenti (come GPT-4o) in ambiti come l’analisi di documenti legali e la risoluzione di problemi nei giochi di logica dell’LSAT.

Arredondo ha sottolineato che il modello è stato in grado di affrontare analisi più complesse e articolate, con miglioramenti anche nei compiti più semplici, secondo i test automatizzati.

In un esame di qualificazione per l’Olimpiade Internazionale di Matematica, o1 ha risolto correttamente l’83% dei problemi, contro il 13% risolto da GPT-4o. OpenAI ha inoltre affermato che o1 ha raggiunto l’89° percentile nei round di sfide di programmazione su Codeforces, superando AlphaCode 2 di DeepMind.

Limiti di o1

Nonostante le sue capacità, o1 presenta alcune limitazioni. Può risultare più lento rispetto ad altri modelli, con tempi di risposta superiori ai 10 secondi per alcune richieste, durante i quali indica lo stato del sotto-compito in corso.

Dato che i modelli di AI generativa possono avere comportamenti imprevedibili, o1 presenta comunque difetti. Secondo Brown, ad esempio, può commettere errori persino in giochi semplici come il tris. OpenAI ha inoltre ricevuto segnalazioni dai tester riguardo alla tendenza di o1 a generare contenuti inesatti o a non ammettere quando non ha la risposta corretta.

Concorrenza agguerrita

OpenAI non è l’unico player del settore che sta esplorando metodi di ragionamento avanzati per migliorare la precisione dei modelli. Recentemente, i ricercatori di Google DeepMind hanno dimostrato che concedendo più tempo e indicazioni ai modelli per soddisfare le richieste, le prestazioni possono migliorare significativamente senza ulteriori modifiche. La concorrenza è agguerrita: OpenAI ha deciso di non mostrare le “catene di pensieri” generate da o1 in ChatGPT, per proteggere il proprio vantaggio competitivo.

Sebbene OpenAI sia stata la prima a lanciare un modello come o1, la vera sfida sarà rendere questo strumento accessibile a un pubblico più ampio e a un prezzo inferiore.

Vedremo presto quanto rapidamente OpenAI riuscirà a sviluppare versioni ancora più avanzate di o1. L’azienda ha dichiarato di voler sperimentare modelli o1 in grado di ragionare per ore, giorni o addirittura settimane, al fine di migliorare ulteriormente le sue capacità di ragionamento.

fonte: TechCrunch