Un des « miracles » les plus incroyables du développement reste l'apprentissage du langage par un bébé : comment en à peine trois ans, parvient-il à maitriser le français alors que vous-même peinez toujours sur l'anglais malgré de longues années de cours intensifs ? En quelques mois, des étapes essentielles sont franchies : comprendre que la parole transmet de l'information, mais aussi que ce signal acoustique continu est composé de briques élémentaires qui peuvent se combiner de multiples façons pour créer de nouveaux messages. Malgré la différence acoustique importante entre la voix aigüe de sa grande sœur et celle grave de son papa, le bébé doit comprendre que tous les deux parlent de lui, le « bébé » et non pas de « pépé ». Pourtant la différence entre « b » et « p » est minime par rapport à la différence de voix, un problème que les ingénieurs ont mis du temps à résoudre pour permettre la reconnaissance vocale dans votre smartphone. Ils l'ont résolu, mais différemment du bébé en créant et analysant des bases de données gigantesques, ce qui n'est évidemment pas à la portée du nourrisson. Alors comment fait-il ?
Une solution efficace pour se débarrasser du « bruit » dans le signal, proposée dans le domaine de la perception visuelle, est de factoriser ce signal, en le projetant sur un ensemble réduit de composantes orthogonales. Dans cette étude, les chercheurs se sont donc demandés si une stratégie de décomposition similaire était utilisée pour la parole. En effet, les linguistes décrivent chaque phonème ou son, utilisé dans les langues, comme une suite de traits distinctifs binaires, par exemple b est occlusive, bilabiale et sonore, et s'oppose à p également occlusive et bilabiale mais sourde alors que m est bilabiale et sonore mais nasale, etc... Ce code basé sur des caractéristiques articulatoires de comment le son est produit, peut-il être utilisé par des nourrissons trop jeunes même pour babiller ?
À l'aide d'un système électroencéphalographique (EEG) à haute résolution (256 canaux), les chercheurs ont enregistré les réponses neurales de nourrissons âgés de 3 mois à 120 syllabes Consonnes-Voyelles naturelles présentées dans un ordre pseudo-aléatoire avec des profils acoustiques et phonétiques variés pendant environ 1 heure. Grâce à des analyses multivariées, ils montrent qu'effectivement chaque trait phonétique est codé, puis ces traits sont combinés pour percevoir l'identité de la consonne puis de la voyelle, qui restent clairement séparées.
Crédit: UNICOG (NeuroSpin/CEA)
En conclusion, les nourrissons humains sont équipés d'un code combinatoire structuré pour l'analyse de la parole, qui pourrait expliquer le rythme rapide de l'acquisition du langage au cours de la première année. L'analyse rapide et stable de la parole permet de découvrir les règles de combinaisons de ces briques élémentaires pour créer des mots, mots qui très rapidement sont utilisés comme des étiquettes de catégories de l'environnement.
Contact : ghislaine.dehaene-lambertz@cea.fr