Être capable de prédire correctement ce qui va se produire permet de :
- prendre de meilleures décisions ;
- mieux percevoir le monde qui nous entoure ;
- réagir plus vite face aux événements.
Dans de nombreuses situations, notre cerveau produit des prédictions de qualité en se basant sur ce qu'il a déjà observé. Mais comment procède-t-il quand il est confronté à des aléas, par définition imprévisibles, et à un environnement complexe et est-il possible de s'en inspirer pour élaborer un modèle d'intelligence artificielle ?
En première approche, on peut supposer que le cerveau emploie une méthode d'inférence bayésienne : il estime la probabilité de la cause des événements à partir d'observations antérieures et en déduit des prédictions statistiquement optimales. Mais reproduire ce modèle suppose de connaître le modèle statistique qui caractérise nos observations.
On peut aussi considérer que le cerveau cherche rapidement une solution acceptable, et pas nécessairement idéale, en travaillant de manière heuristique. Cependant, dans beaucoup de situations, cette méthode n'est pas assez performante et ne peut pas être généralisée.
Deux chercheurs de NeuroSpin se sont donc demandé s'il existe un modèle généralisable et biologiquement plausible qui permettrait, dans différents environnements, de faire des prédictions simples, efficaces et qui reproduirait les aspects qualitatifs de la prédiction optimale de notre cerveau.
Pour cela, ils ont examiné des modèles de réseaux de neurones artificiels récurrents – dont les composantes interagissent de manière non linéaire – et entraînés à des tâches de prédiction de séquences analogues à celles utilisées dans les études cognitives humaines.
Ils montrent qu'une architecture spécifique de réseau neuronal récurrent permet de trouver des solutions simples et précises dans plusieurs environnements.
Comme le cerveau humain, ces réseaux développent des représentations internes de leur environnement, incluant des estimations de sa variabilité et de leur précision. Ils adaptent leur taux d'apprentissage aux changements en cours, sans modifier le poids de connexion des neurones.
Omniprésent dans le cerveau, ce modèle de « récurrence modulée » pourrait servir de bloc de construction générique pour la prédiction dans des environnements réels. Ces résultats inédits et remarquables ouvrent de nouvelles voies à la modélisation cognitive.
Ce travail a été réalisé dans le cadre d'une bourse ERC Starting.