Les équipes de l’institut contribuent à la transition vers le numérique, pour l’analyse et la modélisation des données biologiques et de santé. En effet, l’exploration du vivant par des technologies comme la biologie structurale, les omiques ou l’imagerie biomédicale, génère des masses de données (big data) dont le traitement, l’exploitation, la modélisation nécessitent de nouveaux outils numériques développés au sein de l’institut, en faisant largement appel à l’IA.
La mutation des activités de recherche liée à la révolution des technologies digitales est au cœur des enjeux du CEA. Leader historique dans le domaine de la
simulation et du
calcul intensif, son expertise s’étend à l’ensemble des
sciences des données (bases de connaissances, analyse de données haut-débit, intelligence artificielle).
A l’institut, la
simulation et le
calcul haute performance sont centraux pour les activités de
modélisation moléculaire (trajectoires moléculaires à partir de modèles physiques) et
tissulaire (microarchitecture du tissu cérébral et
cartographie du connectome humain).
Le
traitement du signal et l’apprentissage statistique constituent, quant à eux, le socle de l’analyse des données omiques (métabolomique,
métaprotéomique) et d’imagerie pour comprendre le fonctionnement physiologique et détecter les perturbations pathologiques.
Ces dernières années, les algorithmes d’apprentissage profond (deep learning) et d’intelligence artificielle jouent un rôle croissant en raison de leurs performances prédictives (par exemple, architecture 3D des macromolécules et anomalies du plissement cortical dans des pathologies développementales).
Plus généralement, l’analyse à
haut-débit de données de
cohortes de patients nécessite des innovations constantes dans les domaines de la
gestion des données et des connaissances (larges volumes de données hétérogènes, protection des données, standardisation, curation) et de leur
traitement algorithmique au sein de
workflows (clusters de calculs CPU et GPU, reproductibilité, interopérabilité).
L’intégration de ces données hétérogènes et de grande dimension (génétique et imagerie, protéomique et métabolomique) constitue un axe structurant des recherches en bio-statistique et bio-informatique, pour approfondir la compréhension des processus physiopathologiques.