Le concept de pangénome vise à compiler toute la diversité génomique d'une espèce. Au sein d'un pangénome, on distingue généralement le cœur, la part qui regroupe l'ensemble des gènes conservés dans l'espèce, et la part accessoire ou variable qui correspond à des gènes spécifiques à certaines souches. Cette partie variable qui représente entre 5% et 40% du contenu en gènes d'un génome est de toute importance car elle confère un ensemble de facteurs nécessaires, par exemple, à l'adaptation à l'environnement et la résistance face à une agression.
L'analyse de cette masse de données exige le développement de nouvelles méthodes bioinformatiques. Des chercheurs du CEA-Jacob (Genoscope), en collaboration avec le LaMME et l'Institut Pasteur, ont développé une nouvelle méthode, nommée PPanGGOLiN permettant d'analyser le pangénome d'espèces procaryotes[1] pour lesquelles plusieurs milliers de génomes sont disponibles. Une des originalités de PPanGGOLiN réside dans l'utilisation d'un modèle de graphe capturant non seulement l'intégralité des familles de gènes observées dans une espèce mais également leur information de co-localisation sur les génomes. De plus, une méthode d'apprentissage automatique reposant sur la structure du graphe réalise une classification des familles de gènes en génome persistent (familles présentes dans la majorité des génomes), shell (présentes dans un sous-ensemble des génomes) et cloud (présentes uniquement dans quelques génomes).
A partir de ces graphes de pangénome, les scientifiques du CEA-Jacob ont développé un second outil, plus performant et rapide que les méthodes actuelles, pour faire de la génomique comparée, prédire les régions de plasticité génomique et leur site d'intégration.
Exemple d'un graphe de pangénome construit à partir de 3 117 génomes d'Acinetobacter baumannii. Les nœuds de couleur orange, verte et bleue correspondent respectivement aux familles de gènes du persistent, shell et cloud. Le cadre en haut à gauche correspond à un zoom sur la région de biosynthèse des polysaccharides de la capsule antigénique. © PLoS
[1] Etre vivant unicellulaire dont les cellules ne possèdent pas de noyau (exemple : bactéries). S'oppose à l'eucaryote (ex: Homme)