Alors qu’il y a 20 ans, les systèmes de reconnaissance automatique dans l’image identifiaient laborieusement un chiffre écrit à la main, l’essor de l’intelligence artificielle (IA) a ouvert des perspectives à l’exploitation massive des données, dans des applications aussi diverses que l’imagerie médicale, le contrôle qualité en usine, et la conduite autonome. Toujours plus performants, les systèmes intelligents se voient attribuer de plus en plus de tâches et de responsabilité. Il est donc crucial pour les industriels qui utilisent ou commercialisent ces systèmes de constituer des bases de données pertinentes pour les entraîner, les évaluer et valider leurs capacités.
L’expertise du List, institut du CEA dédié aux systèmes numériques intelligents lui a permis de relever ce défi en concevant
PIXANO (Pixel Annotation), une solution open source pour l’annotation web efficace à grande échelle d’images et de vidéos. L’annotation consiste à décrire les éléments présents dans les images par des étiquettes ou tags localisés pouvant prendre des formes variables et présentant différents niveaux de détail (descriptions textuelles, formes géométriques englobant les objets, propriétés des objets, labels des pixels, etc.).
L’outil PIXANO propose une large gamme de types d'étiquettes (boîte englobante, polygone, cuboïde, masque pixellique) intégrées dans des composants web ouverts, modulaires, réutilisables et personnalisables. Les modules sont alimentés par de l’intelligence artificielle qui vient assister l’humain dans sa tâche d’annotation et réduire le nombre de clics nécessaires à la création d’étiquettes.
La pertinence de cette solution a été validée par des acteurs majeurs de l’industrie, notamment automobile, dans le cadre de partenariats et projets collaboratifs2 favorisant la capitalisation des développements réalisés. Par sa modularité et sa capacité à intégrer de nouveaux composants personnalisables et intelligents, PIXANO ouvre de larges perspectives de création de solutions adaptées aux besoins des concepteurs d’IA.
Le marché mondial des services d’annotation de données a dépassé les 300 millions d’euros en 2018 et restera en forte augmentation dans les prochaines années. La distribution à grande échelle des tâches est devenue le modèle prépondérant, grâce au Web qui fournit une plateforme accessible partout, centralise les données et rend facile la collaboration d’une multitude d’annotateurs (“crowdsourcing”).