L'IA di Google eviterà gli ostacoli grazie a un algoritmo

La figura stilizzata creata da DeepMind per illustrare il movimento parkour (Screenshot video)
2' di lettura

Il programma di Intelligenza artificiale su cui sta lavorando DeepMind è in grado di apprendere in automatico a muoversi in territori sconosciuti  

Con solo l'aiuto di pochi sensori virtuali, l'intelligenza artificiale di Google ha dimostrato di essere in grado di poter procedere in un territorio sconosciuto, evitando gli ostacoli che si frappongono al suo movimento. Il team di DeepMind (società acquisita dal colosso di Mountain View) che lavora al Reinforcement learning ha infatti spiegato con un video divertente come un giorno i computer saranno in grado di muoversi agilmente anche in spazi totalmente nuovi, un po' come fa chi si cimenta nel parkour. Come si può vedere nel video realizzato dagli esperti, la figura si muove con sicurezza nell'ambiente. E tutto ciò che fa, lo ha imparato da sola, rispondendo all'algoritmo impostato. Lo riporta il sito specializzato The Verge.

Cos'è il reinforcement learning

La scoperta è stata annunciata in un nuovo lavoro elaborato da DeepMind, realtà di Google impegnata nello sviluppo dell'intelligenza artificiale, dal titolo "Emergence of Locomotion Behaviours in Rich Environments". Gli esperti hanno studiato come il reinforcement learning, detto anche RL, può essere usato per insegnare a un computer a navigare ambienti non familiari e complessi. L'apprendimento per rinforzo, è una tecnica di auto-miglioramento automatico che punta a settare sistemi in grado di adattarsi ai cambiamenti ambientali in cui si trovano attraverso la distribuzione di una "ricompensa", che punta a valutare le prestazioni. Tutto il processo avviene mediante un algoritmo, che elabora i dati di ogni esperienza e li tuilizza come base per i miglioramenti del programma.

Il “miracolo” dell'intelligenza artificiale

Tutto ciò che la figura nel video fa l'ha imparato da sola. I salti, l'abbassarsi per superare un ostacolo, gli scarti per evitare oggetti sono il risultato di una valutazione del computer su ciò che è meglio fare per arrivare da un punto A a un punto B. Quello che i programmatori hanno fatto è stato incentivare la figura a muoversi in avanti: il resto è tutta opera del computer, che tramite vari tentativi trova diversi modi efficienti di muoversi. Lo scopo di DeepMind è capire quanto sia difficile insegnare a questi agenti robotici a destreggiarsi in ambienti difficili. Al momento, attraverso la tecnica di RL, sembra che sia possibile trasferire un metodo di apprendimento resistente.

 

Leggi tutto
Prossimo articolo