Au cours de l'apprentissage de la lecture, une nouvelle aire cérébrale, associant vision et langage, se développe : elle permet à l'écolier d'identifier de plus en plus efficacement les lettres écrites et leurs successions (analyse « orthographique »). Or cette aire sélective (Visual Word Form Area, VWFA), qui répond aux mots écrits plus qu'à tout autre stimulus visuel, est localisée de manière identique chez tous les lecteurs, dans le cortex visuel ventral gauche.
Sa genèse – le « recyclage » d'une aire spécialisée dans la reconnaissance des objets – reste controversée. L'IRM fonctionnelle a révélé quelques-unes de ses propriétés (invariance par translation, sensibilité à la fréquence des mots, etc.). Les caractéristiques concourant à la reconnaissance efficace des mots écrits (« préférence » pour la zone fovéale d'acuité visuelle maximale, etc.) sont cependant communes aux deux hémisphères cérébraux et ne peuvent expliquer sa localisation très précise. D'où la nécessité d'une hypothèse supplémentaire : ce site porterait l'« empreinte » de connexions avec des aires du langage, antérieures à l'apprentissage de la lecture. Il serait possible de prédire la localisation de VWFA chez un enfant de 8 ans en se fondant sur l'observation de certaines connexions cérébrales à 5 ans.
Pour en savoir plus, les chercheurs de Joliot ont mis en œuvre un modèle simple du cortex visuel ventral gauche : un réseau neuronal « profond » (à 4 « couches ») « convolutif », entraîné à reconnaître des visages et des objets. Ils l'ont ensuite entraîné avec des mots écrits, avec et sans connexions aux « unités de sortie » lexicales. Ce modèle suffit-il à décrire l'apparition de l'aire VWFA ?
Au terme de leur expérience, les neurobiologistes observent que certains neurones se spécialisent dans la reconnaissance des mots. Ils sont capables d'identifier, grâce à un code neuronal robuste (« parcimonieux »), les mille mots les plus fréquents et ils ne répondent plus aux autres images (visages, corps, maisons ou outils). Leur codage utilise des lettres individuelles et leur position ordinale par rapport au début ou à la fin du mot, ou encore des paires de lettres (bigrammes).
Ces résultats pourront bientôt être confrontées à des expériences en IRM fonctionnelle à très haute résolution et à haut champ, ou à des enregistrements intracrâniens à haute densité.
Après cette première étape de modélisation, les chercheurs étudieront une architecture de réseau neuronal plus complexe (« récurrente ») afin de mieux rendre compte des représentations phonologiques.