Vous êtes ici : Accueil > Actualités > Les données de séquençage modélisées comme un jeu d'échecs

Résultat scientifique | Bioinformatique | ADN | Simulation & modélisation | Mécanismes cellulaires

Les données de séquençage de nouvelle génération modélisées à la manière d’un jeu d’échecs


​Une équipe de l'I2BC propose une expérience de pensée, appelée le problème d'échecs NGS (Next Generation Sequencing), qui considère les données de séquençage comme une image superposée de plusieurs parties d'échecs indépendantes. Une approche plus réaliste de la dynamique des processus cellulaires au sein de chaque cellule qui peut ne pas suivre la même trajectoire temporelle, même pour une population cellulaire homogène. Ce point de vue révèle les limites des approches NGS d'analyse temporelle.

Publié le 17 février 2025

​COMMENT EXTRAIRE DES DONNÉES Du SÉQUENÇAGE MASSIF LE COMPORTEMENT SPATIO-TEMPOREL DES PROCESSUS CELLULAIRES SOUS-JACENTS ?

Le développement des technologies de séquençage à haut débit ou Next-Generation Sequencing (NGS) a ouvert la voie à l'étude de la coordination spatio-temporelle des processus cellulaires le long du génome (réparation de l'ADN, disposition des nucléosomes, méthylation d'ADN). Cependant, les ensembles de données sont généralement limités à quelques points temporels et les informations manquantes doivent être interpolées. La plupart des modèles supposent que les dynamiques étudiées sont similaires entre cellules individuelles, de sorte qu'une culture cellulaire homogène peut être représentée par une moyenne à l'échelle de la population.
Depuis plusieurs années, l'équipe de Julie Soutourina développe des outils informatiques pour évaluer les interactions moléculaires entre les protéines et l'ADN en utilisant les données du séquençage NGS et, contrairement aux études qui considèrent les signaux de séquençage comme un comportement moyen, les chercheurs de l'équipe les prennent en compte comme étant une superposition d'interactions stochastiques dans des cellules indépendantes. Le problème central soulevé par les chercheurs est que toute méthode de séquençage fige la configuration cellulaire à un instant t et que les observations temporelles antérieures et ultérieures sont inaccessibles.

EN JOUANT AUX ÉCHECS

Dans cette étude, les chercheurs ont proposé un algorithme formel minimal reliant les possibles trajectoires temporelles des processus cellulaires considérés à des données NGS à l'échelle d'une population, de manière à inférer des informations manquantes pour étudier les processus cellulaires dans le temps. Pour cela, ils ont utilisé des simulations numériques basées sur une expérience de pensée, qu'ils ont appelé le problème d'échecs NGS, dans laquelle ils ont comparé l'analyse des données de séquençage temporelle à l'observation d'une image superposée de plusieurs parties d'échecs indépendantes. L'analyse de la cinétique spatio-temporelle obtenue plaide en faveur d'une nouvelle méthodologie qui prendrait en compte la trajectoire temporelle des processus cellulaires considérés dans chaque cellule de manière indépendante, même pour une population cellulaire homogène.

© L.Zeitler

En représentant la dynamique des processus biologiques de manière arbitraire comme un jeu d'échecs, ces travaux soulignent l'importance de développer de nouvelles approches computationnelles et montrent comment il est possible d'obtenir des informations sur la dynamique interne aux cellules vivantes à partir de données sur le comportement à l'échelle de la population cellulaire.

ContactJulie Soutourina (julie.soutourina@i2bc.paris-saclay.fr ; julie.soutourina@cea.fr)

NGS : Le séquençage à haut débit ou Next-Generation Sequencing (NGS) est une méthodologie moléculaire qui permet le séquençage rapide de milliers à des millions de molécules d'ADN ou d'ARN simultanément, en déterminant l'ordre unique et spécifique des bases des acides nucléiques. Il s'agit d'une technologie de rupture qui a considérablement accru notre compréhension des maladies telle que le cancer. ​


Haut de page