L'expression des gènes est le processus par lequel l'information génétique est traduite en macromolécules fonctionnelles. La première étape de ce processus (transcription) consiste à synthétiser des ARN messagers (ARNm) à partir de la matrice d'ADN du gène.
Depuis plusieurs décennies, les approches de profilage transcriptionnel à l'échelle du génome entier ont permis d'évaluer les niveaux d'expression de milliers de gènes en parallèle, dans divers contextes biologiques. Dans ces analyses statistiques, l'expression d'un gène est mesurée par le nombre d'occurrences des séquences de l'ARNm correspondant dans un grand ensemble d'échantillons. Les chercheurs définissent alors la moyenne de l'expression du gène et sa variabilité, et plus précisément sa variance statistique (égale au carré de l'écart-type).
L'écrasante majorité des analyses transcriptomiques identifient des gènes dont l'expression moyenne change de manière significative lorsque l'on compare des échantillons dans différentes conditions associées à des processus biologiques (biologie du développement, étiologie des maladies, découverte de cibles thérapeutiques, etc.). Dans cette approche, la variance est considérée comme un bruit statistique.
Et pourtant, l'expression des gènes peut fluctuer, par exemple en raison de la nature stochastique de la transcription des gènes, ou encore suite à des modifications de la chromatine ou à la dégradation des ARNm.
Des gènes différentiellement variants
C'est pourquoi des chercheurs de l'Irig ont voulu étudier des gènes « différentiellement variants ». Ils ont évalué quatre méthodes récentes qui détectent les différences dans la moyenne et dans la dispersion des données de séquençage ARN. En appliquant ces méthodes à des données simulées, ils ont pu caractériser de manière fiable les gènes présentant une variance d'expression entre deux conditions. Ils les ont ensuite appliquées aux données de l'Atlas du génome du cancer.
Parmi les gènes présentant une variance d'expression accrue dans les tumeurs et sans changement dans l'expression moyenne, certaines fonctions cellulaires clés ont été identifiées, dont la majorité sont liées au catabolisme – la phase du métabolisme au cours de laquelle des composés organiques sont dégradés – et sont surreprésentées dans la plupart des cancers analysés.