DE LA DIFFICULTÉ D'APPRENDRE DANS UN MONDE QUI CHANGE
Pour être efficace dans un monde qui évolue, nos mécanismes d'apprentissage doivent s'adapter. En effet, quand un bouleversement rend inutile ce nous avons appris précédemment, il faut alors réapprendre rapidement à partir de nouvelles observations (flexibilité). En revanche, si rien ne change, nous avons tout intérêt à combiner informations passées et présentes pour affiner nos connaissances (stabilité). Cet équilibre, au cœur de l'apprentissage adaptatif, est particulièrement difficile à trouver en pratique. Les outils mathématiques comme l'inférence Bayésienne offrent des solutions optimales à ce type de problème (voir notre actualité de février 2022). Les modèles bayésiens postulent en outre l'existence d'un mécanisme de pondération par la confiance : l'apprentissage devrait être modulé par le niveau de confiance qui accompagne les prédictions. En partant de l'idée que notre sens de la confiance nous permet d'arbitrer entre connaissances passées (stabilité) et nouvelles observations (flexibilité), les chercheurs ont conçu des algorithmes pour l'apprentissage adaptatif de plus en plus performants. Cependant, les bases neuronales de cette confiance sont beaucoup moins connues que celles de la surprise.
IDENTIFICATION DES RÉGIONS IMPLIQUÉES DANS LA REPRÉSENTATION DE LA CONFIANCE
Dans cette étude, les chercheurs ont utilisé une tâche d'apprentissage dynamique des probabilités et l'IRM fonctionnelle à haut champ pour identifier les régions corticales potentiellement impliquées dans la représentation de la confiance dans les prédictions pendant l'apprentissage humain. Leur travail s'est appuyé sur quatre critères de représentation couramment utilisés en neurosciences : sensibilité, spécificité, invariabilité, fonctionnalité. Ils montrent que la représentation de la confiance est computationnellement distincte de celle de la surprise et que les effets des deux quantités se chevauchent anatomiquement, notamment dans les cortex pariétal et frontal, d'une manière compatible qualitativement avec la méthode bayésienne et de manière invariante à l'item prédit. En montrant que les profils d'activité des régions localisées correspondent à la fois à un effet de confiance et de surprise en accord avec le principe de pondération de la confiance, les auteurs suggèrent que la représentation de la confiance à un rôle fonctionnel dans l'apprentissage.
D'autres études devraient permettre de clarifier les mécanismes de l'apprentissage pondéré en fonction de la confiance et la mesure dans laquelle les représentations de la confiance sont subjectives ou basées sur le stimulus (et éventuellement idéales), consciemment accessibles ou implicites, et invariantes en fonction de la tâche et du domaine. La localisation précise des effets permise par l'analyse basée sur la surface et l'IRMf 7T pourrait guider des enregistrements plus ciblés à l'avenir, comme l'électrophysiologie.
Contact : Florent Meyniel (florent.meyniel@cea.fr) florent.meyniel@gmail.com