Une nouvelle approche de la détection des mots-clés
« La fonction de détection de mots-clés convertit les commandes vocales en signaux électriques, qui sont ensuite traités par un circuit intégré pour en extraire les caractéristiques fréquentielles.”
explique Franck Badets, directeur de recherche au CEA-Leti. « Ces données peuvent être analysées par un réseau de neuronespour identifier les mots prononcés. Lorsqu'un mot-clé est détecté, le circuit déclenche une action spécifique, comme le réveil d'un autre système. »
Pour minimiser la consommation d'énergie, les chercheurs ont exploré des architectures innovantes basées sur des oscillateurs verrouillés par injection.
« Le verrouillage par injection est une propriété commune des oscillateurs, qu'ils soient biologiques, optiques, mécaniques ou électriques »,
ajoute Franck Badets.
De 2017 à 2020, les premiers travaux de recherche ont permis de valider les concepts fondamentaux et d'obtenir des financements Carnot, de l'IPCEI et de France 2030.
« Nous avons ensuite pu développer un prototype, qui est aujourd'hui protégé
par cinq brevets. »
Des performances optimisées avec une puissance minimale
L'utilisation d'oscillateurs verrouillés par injection permet un traitement efficace du signal, explique Ali Mostafa, ingénieur en conception de circuits intégrés au CEA-Leti :
« En une seule étape, nous pouvons diviser le signal en bandes de fréquence, extraire son énergie et le convertir dans un format facilement exploitable par le réseau de neurones. »
Cette solution innovante utilise jusqu'à quatre fois moins de surface de silicium que les technologies existantes et consomme jusqu'à dix fois moins d'énergie, tout en atteignant un taux de reconnaissance de 91 % pour dix mots-clés.
Un autre avantage clé de cette avancée est que le système peut fonctionner avec des tensions d'alimentation aussi basses que 400 millivolts.
« Notre approche est compatible avec les sources de récupération d'énergie et les nœuds de semi-conducteurs avancés comme la technologie 22nm et ceux de la prochaine génération, tel que la technologie 10 nm en cours de développement au CEA-Leti[BF21] »,
souligne Ali Mostafa.
Des applications élargies au-delà de la reconnaissance vocale
Au-delà de la détection de mots-clés, l'efficacité du traitement neuronal du système ouvre la voie à des applications plus larges.
« Nous proposons un réseau neuronal récurrent qui nécessite des ressources matérielles minimales », explique Emmanuel Hardy, ingénieur en architecture Edge AI au CEA-Leti. « Nous avons optimisé le compromis entre la précision et la consommation d'énergie, et entraîné le réseau en utilisant des milliers d'échantillons de parole provenant d'un benchmark bien connu. Enfin, nous avons modélisé avec précision le circuit d'extraction d'énergie et nous avons pu ajuster les paramètres du système pour obtenir des performances optimales. »
La capacité d'optimiser et d'affiner cette technologie innovante permet d'étendre les applications à d'autres domaines :
« La prochaine phase de développement portera sur l'adaptation de la technologie à d'autres domaines nécessitant des capacités de surveillance tels que la santé, les grandes infrastructures et la maintenance prédictive », conclut Emmanuel Hardy.
Avec cette avancée, le CEA-Leti continue de repousser les limites de l'IA basse consommation, offrant de nouvelles possibilités d'intelligence autonome et embarquée dans de multiples secteurs d'activité.