L'IA di Claude di Anthropic gioca a Pokémon su Twitch, lentamente

Martedì pomeriggio, Anthropic ha lanciato Claude Plays Pokémon su Twitch, un live streaming del nuovo modello di IA di Anthropic, Claude 3.7 Sonnet , che gioca a Pokémon Red. È diventato una specie di esperimento affascinante, che mostra le capacità della tecnologia di IA odierna e le reazioni delle persone a queste.

I ricercatori di intelligenza artificiale hanno utilizzato tutti i tipi di videogiochi , da Street Fighter a Pictionary , per testare nuovi modelli, spesso più per divertimento che per utilità. Ma Anthropic ha affermato che Pokémon si è rivelato un utile punto di riferimento per Claude 3.7 Sonnet, che può effettivamente "pensare" attraverso i tipi di puzzle contenuti nel gioco.

Come l'o3-mini di OpenAI e l'R1 di DeepSeek, Claude 3.7 Sonnet può "ragionare" per superare sfide difficili, come giocare a un videogioco pensato per bambini. Mentre il predecessore non razionale del modello, Claude 3.5 Sonnet , ha fallito all'inizio di Pokémon Rosso, uscendo dalla casa del giocatore a Biancavilla, Claude 3.7 Sonnet è riuscito a vincere tre medaglie da capopalestra.

Claude fa fatica a uscire da un edificio in Pokémon Rosso. **Crediti immagine:** Claude gioca a Pokémon su Twitch

Il nuovo Claude, però, ha ancora dei problemi. Dopo ore di streaming su Twitch, il modello è stato scoraggiato da un muro di roccia, che non riusciva a superare nonostante i suoi sforzi.

Un utente di Twitch ha riassunto la situazione in questo modo: "Chi vincerebbe, un'intelligenza artificiale con migliaia di ore investite nella programmazione o un muro di roccia?"

Alla fine Claude si rese conto che era possibile aggirare il muro.

Da un lato, è frustrante guardare Claude attraversare Pokémon Rosso con la velocità di uno Slowpoke , ragionando su ogni singolo passo con straziante contemplazione. Ma è anche stranamente avvincente. La parte sinistra dello stream mostra il "processo di pensiero" di Claude, mentre la parte destra mostra il gameplay in tempo reale.

A un certo punto, Claude ha tentato di localizzare il Professor Oak all'interno del suo laboratorio, ma si è confuso perché nella scena c'erano altri PNG.

"Ho notato che un nuovo personaggio è apparso sotto di me, un personaggio con i capelli neri e quello che sembra un camice bianco alle coordinate (2, 10)", ha scritto Claude. "Potrebbe essere il Professor Oak! Lasciatemi scendere e parlargli".

Claude ha quindi iniziato a parlare per errore con un NPC diverso dal Processor, un NPC con cui il modello aveva parlato diverse volte in precedenza. Alcune delle migliaia di persone nella chat di Twitch hanno iniziato a innervosirsi. Altri, in particolare quelli che avevano seguito lo streaming per più di qualche minuto, erano meno preoccupati.

"Ragazzi, rilassatevi", ha scritto una persona nella chat. "Prima siamo usciti e rientrati nel laboratorio di Oak circa 10 volte prima di capire come andare avanti".

Pokemon Rosso Antropico — **Crediti immagine:** Anthropic

Per gli utenti di lunga data di Twitch, il formato dello streaming di Anthropic potrebbe sembrare nostalgico. Più di un decennio fa, milioni di persone hanno provato a giocare a Pokémon Rosso contemporaneamente in un esperimento sociale online unico nel suo genere chiamato Twitch Plays Pokémon . Ogni utente poteva controllare il personaggio del giocatore tramite la chat di Twitch, con il risultato di un gameplay prevedibilmente caotico.

Alcuni ricercatori di intelligenza artificiale hanno citato Twitch Plays Pokémon come fonte di ispirazione per il loro lavoro. Nell'ottobre 2023, l'ingegnere informatico di Seattle Peter Whidden ha pubblicato un video su YouTube in cui spiegava nel dettaglio come ha addestrato un algoritmo di apprendimento per rinforzo per giocare a Pokémon. La sua intelligenza artificiale ha trascorso oltre 50.000 ore giocando al gioco prima di imparare a orientarsi con successo. Una sfida era che l'intelligenza artificiale preferiva ammirare lo scenario pixelato invece di giocare effettivamente al gioco.

Le "ricostruzioni" basate sull'intelligenza artificiale di Pokémon di Twitch Plays come Whidden e Anthropic sono divertenti, ma allo stesso tempo un po' agrodolci. Lo streaming originale è stato un momento cruciale nella storia di Twitch perché ha unito le persone in un modo inaspettato. Tutti erano nella stessa squadra, impegnati a raggiungere l'obiettivo di far sì che il personaggio del giocatore smettesse di girare in tondo e progredisse effettivamente nel gioco.

Nel 2025, sembra che non siamo più compagni di squadra, ma spettatori, che guardano un modello di IA provare a giocare a un gioco che molti di noi hanno imparato quando avevano cinque anni. È un microcosmo motivato dall'IA di una tendenza più ampia: le nostre esperienze online si stanno spostando da attività condivise e comunitarie a quelle più solitarie.

techcrunch

L'IA di Claude di Anthropic gioca a Pokémon su Twitch, lentamente

Il nuovo Claude, però, ha ancora dei problemi. Dopo ore di streaming su Twitch, il modello è stato scoraggiato da un muro di roccia, che non riusciva a superare nonostante i suoi sforzi.

Un utente di Twitch ha riassunto la situazione in questo modo: "Chi vincerebbe, un'intelligenza artificiale con migliaia di ore investite nella programmazione o un muro di roccia?"

Alla fine Claude si rese conto che era possibile aggirare il muro.

A un certo punto, Claude ha tentato di localizzare il Professor Oak all'interno del suo laboratorio, ma si è confuso perché nella scena c'erano altri PNG.

"Ragazzi, rilassatevi", ha scritto una persona nella chat. "Prima siamo usciti e rientrati nel laboratorio di Oak circa 10 volte prima di capire come andare avanti".

techcrunch

L'IA di Claude di Anthropic gioca a Pokémon su Twitch, lentamente

Notizie simili

L'IA di Claude di Anthropic gioca a Pokémon su Twitch, lentamente

Notizie simili

Tre cicloni tropicali si stanno abbattendo sul Pacifico meridionale

Microsoft consente agli utenti di Copilot AI gratuiti di utilizzare strumenti di conversazione vocale e query complesse

OpenAI abbandona l'accesso a Deep Research agli utenti Plus, infiammando le guerre tra agenti AI con DeepSeek e Claude

Clicks estende le sue custodie con tastiera per smartphone ai modelli Pixel e Galaxy Android

Microsoft Copilot offre gratuitamente Voice e Think Deeper basato su o1