La nuova versione di ChatGPT delude e blocca il sogno della promessa intelligenza artificiale sovrumana.

Come se fosse stato Steve Jobs ad annunciare l'iPhone nel 2007, ieri Sam Altman ha presentato la nuova pupilla dei suoi occhi: GPT-5, l'ultimo aggiornamento di ChatGPT . In generale, è una versione più intelligente, veloce e ragionata rispetto ai suoi predecessori. Tuttavia, è proprio questo il punto. Questa non è l' intelligenza artificiale generale (AGI) che Altman sta perseguendo, né è superiore, per esempio, al miglior programmatore sulla Terra.
Ciò ha deluso tutti gli esperti di intelligenza artificiale che, in attesa degli annunci della scorsa settimana, hanno visto Altman generare clamore twittando cose come una Morte Nera, insinuando che GPT-5 avrebbe "annientato" tutti gli altri sistemi di intelligenza artificiale sul mercato. Non è stato così, e ha anche ricordato il fiasco del lancio di Apple Intelligence , rispetto alle promesse fatte nel suo annuncio durante la WWDC 2024.
Matt Shumer, esperto di intelligenza artificiale e proprietario di OthersideAI, è riuscito ad accedere a GPT-5 alcune settimane fa e ha spiegato ad ABC che, sebbene sia il miglior modello finora disponibile, "bisogna impegnarsi molto per sfruttarlo al meglio", cosa che l'utente medio non è in grado di fare al momento, quindi non noterà molte differenze rispetto al GPT-4.5 utilizzato finora.
"GPT-5 è molto attento ai dettagli, focalizzato sull'essere il migliore in contesti lunghi, perché in questo caso commette meno errori stupidi. Abbiamo scoperto che è l'intelligenza artificiale ideale, se non la migliore, per la programmazione", osserva Shumer. Infatti, Altman ha sottolineato durante la presentazione del nuovo modello che si trattava di "l'assistente perfetto per un programmatore".

Nel benchmark SWE-bench Verified, incentrato su attività GitHub reali, GPT-5 raggiunge un tasso di successo del 74,9% al primo tentativo. Nessun'altra alternativa ha mai raggiunto questo livello. Secondo l'azienda guidata da Sam Altman, supera Claude Opus 4.1 (74,5%) e Gemini 2.5 Pro (59,6%). Può creare siti web da zero con poche istruzioni, progettare applicazioni, giochi interattivi o eseguire il debug di codice in repository di grandi dimensioni senza perdere precisione. Non solo esegue, ma spiega anche cosa fa e perché.
D'altra parte, GPT-5 non si limita a migliorare l'interfaccia: cambia anche il modo in cui interagiamo con esso. Con il suo arrivo, ChatGPT incorpora quattro nuove personalità: Cinico, Robot, Ascoltatore e Nerd. Ognuna risponde con il proprio stile, adattando tono, atteggiamento e approccio senza bisogno di istruzioni. Permette anche di cambiare il colore della chat con l'IA, sebbene questa opzione sia disponibile solo per gli utenti con account a pagamento. Tutto indica che il rapporto di OpenAI con Jony Ive, ex designer Apple, abbia influenzato le nuove funzionalità di GPT-5.
Tuttavia, sembra che GPT-o3 rimanga l'opzione migliore per la ricerca scientifica, mentre GPT-4.5 è il modello ideale per la scrittura. La buona notizia è che, da ieri, GPT-5 è stato distribuito gratuitamente a tutti gli utenti di ChatGPT a partire da oggi. Gli utenti della versione gratuita avranno accesso sia a GPT-5 che a una versione più veloce ma meno accurata, GPT-5 mini, segnando la prima volta che un modello di ragionamento avanzato è disponibile senza abbonamento.
Sebbene ci siano motivi per essere entusiasti di GPT-5 (il modello abbandona la suddivisione in versioni per diventare un modello unico che decide in tempo reale se dare priorità al ragionamento o alla velocità), il balzo in avanti non è quello promesso. Due dei primi tester del nuovo modello hanno dichiarato a Reuters di essere rimasti colpiti anche dalla sua capacità di programmare e risolvere problemi scientifici e matematici, ma ritengono che il balzo in avanti da GPT-4 a GPT-5 non sia così grande come quello da GPT-3 a GPT-4. "È ben lontano da quell'idea di intelligenza quasi umana a cui alcuni, dentro e fuori OpenAI, accennano da anni", sottolineano. Noi di ABC abbiamo condotto un paio di test e, come sottolineano gli esperti, il modello vacilla quando gli vengono poste domande molto basilari, come se GPT-5 esista già o qual è la quinta parola della sua risposta.

Anche lo sviluppo di GPT-5 non è stato facile. Altman ha pubblicamente riconosciuto che il lancio ha dovuto essere ritardato di diversi mesi perché non riuscivano a integrare tutti i componenti del modello. Ha anche affermato che volevano assicurarsi di avere una capacità sufficiente per quella che prevedevano sarebbe stata una domanda "senza precedenti". Ma c'era di più dietro a questi ritardi. Da un lato, OpenAI si è trovata ad affrontare un problema di dati: non ci sono più molte fonti nuove, grandi e pulite per addestrare modelli di questo tipo.
Ilya Sutskever, ex responsabile scientifico dell'azienda, lo ha spiegato in questo modo: "Possiamo aumentare la potenza, ma non i dati". Un altro problema era che le "prove di addestramento" per modelli di grandi dimensioni sono più soggette a problemi hardware, data la complessità del sistema, e i ricercatori potrebbero non conoscere le prestazioni finali dei modelli fino alla fine della prova, che può richiedere mesi.
ABC.es