Un equip de neurocientífics ha descobert per què els cervells biològics aprenen més ràpidament que les intel·ligències artificials (IA). En un article publicat a ‘Neuron’, els investigadors exposen com les accions exploratòries permeten als animals ser més eficients en l’aprenentatge espacial, en un estudi que podria ajudar a que les IAs puguin aprendre més ràpid, necessitant menys experiència per fer-ho.
Als experiments duts a terme en ratolins, els científics van observar com les activitats institintives d’exploració dels animals no són aleatòries sinó que els permeten fer un ‘mapa’ del seu entorn de manera eficient. Així, per exemple, quan corren cap a un objecte, no és perquè sí sinó que és important perquè aprenguin a navegar en l’espai.

Explorant les teories sobre l’aprenentatge
Hi ha moltes teories psicològiques sobre com algunes accions faciliten l’aprenentatge, i en aquest experiment es va voler provar si la simple observació era suficient per entendre quins obstacles hi ha a l’entorn o si les accions intencionades i guiades pels sentits ajuden a la construcció d’un mapa cognitiu més complet i de manera més ràpida.
En estudis anteriors, els mateixos investigadors havien observat la relació entre com de bé es mouen els animals en l’entorn, especialment al voltant d’un obstacle, i la quantitat de vegades que havien corregut fins a ell. És per això que es van dissenyar uns experiments per veure quin efecte té impedir aquestes incursions exploratòries, fent-los activar una proteïna que els impedia córrer cap als obstacles.

Un element molt important a l’hora d’aprendre
Els resultats són clars: encara que els ratolins passessin molt de temps observant i ensumant els obstacles, si no podien córrer cap a ells, no aprenien prou. Això, per sí mateix, ja demostra que les accions exploratòries instintives són una part molt important de la creació del mapa mental de l’entorn. Per mirar d’entendre els ‘algoritmes’ que podria estar fent servir per aprendre, els investigadors van crear diversos models de reforç desenvolupats per a intel·ligències artificials i observant quin reproduïa de manera més fidel el comportament dels ratolins
Hi ha dos grans tipus de models d’aprenentatge per reforç, el que és lliure de models i el que es basa en un model. Els investigadors van veure que, en alguns casos, els ratolins es comporten com si estiguessin lliure de models i, en d’altres, sembla que el tenen. És per això que van crear un agent que pogués decidir entre tots dos tipus, una forma que no és necessàriament igual a la del funcionament del cervell dels ratolins però que els va ajudar a entendre què necessita un algoritme perquè el comportament sigui semblant.

Una ajuda per al desenvolupament d’intel·ligències artificials
A dia d’avui, un dels problemes de les IAs és que necessiten molta experiència per aprendre, explorant l’entorn milers de vegades mentre que un animal real ho pot fer en menys de 10 minuts. Això és, si més no en part, perquè l’exploració dels animals no és aleatòria sinó que es centra en els objectes que destaquen més, en una exploració dirigida que fa l’aprenentatge més eficient i, per tant, necessita menys experiència.
A partir d’aquí, els investigadors volen explorar la relació entre aquestes accions exploratòries i la representació de ‘sub-metes’, enregistrant el cervell per veure quines zones estan implicades en la seva representació i com les accions d’exploració contribueixen a formar aquestes representancions de l’entorn.