AlphaZero: la nuova IA che apprende da sé stessa
Le intelligenze artificiali possono battere i giocatori umani in giochi sempre più complessi, come gli scacchi, il Go e lo shogi. Un gruppo di ricerca di Google DeepMind è riuscito a sviluppare AlphaZero, un programma in grado di imparare autonomamente a giocare a questi tre giochi, allenandosi direttamente in gioco.
AlphaZero, sviluppato a Londra da David Silver e colleghi è riuscito ad oltrepassare i limiti finora raggiunti nel campo delle intelligenze artificiali alle prese con i giochi complessi quali scacchi, Go e shogi (un equivalente giapponese degli scacchi). La novità sta nel fatto che questo software sia stato in grado di imparare a giocare a tutti e tre questi giochi e non a specializzarsi in un unico gioco come avevano finora fatto le IA.
Il gioco degli scacchi è sempre stato uno degli ambiti più studiati nella storia delle intelligenze artificiali, anzi si può dire che il suo studio sia nato insieme all’informatica, fin dai tempi di Babbage, Turing, Shannon e von Neumann. Grazie alla sua complessità e variabilità, si è infatti sempre posto come una sfida per i ricercatori in ambito IA. Insieme allo sviluppo di hardware e software, gli algoritmi per il gioco degli scacchi sono diventati sempre più complessi, fino a raggiungere livelli superiori a quelli dei giocatori professionisti.
Il problema principale però è sempre stato che questi algoritmi non erano versatili e non potevano essere adattati anche ad altre tipologie di giochi. La novità di AlphaZero (partito da AlphaGo Zero e poi generalizzato anche agli altri giochi) è che è in grado di apprendere e raffinare la tecnica direttamente giocando, e per di più in diversi giochi.
AlphaZero è in grado di raggiungere un livello superiore a quello dei campioni in carica nei tre giochi in poche ore di allenamento. Ad esempio, il software campione del mondo degli scacchi, Stockfish, ha giocato 100 partite contro AlphaZero, perdendo 28 e pareggiando nelle altre. Si stima che il livello tecnico di Stockfish sia stato superato dopo sole 4 ore di gioco.
Se da una parte il risultato sembra essere prodigioso, dall’altra non sono mancate anche aspre critiche metodologiche nei suoi confronti. Non essendo il software AlphaZero liberamente disponibile, non è infatti possibile riprodurre gli esperimenti ed analizzarne l’andamento con altro hardware. Un’altra critica è stata mossa anche riguardo il mancato studio delle sconfitte oltre che delle vittorie, che potrebbe portare ad un’ulteriore sviluppo in questo ambito tramite l’analisi dei punti deboli.
Fonte: Science