Les scientifiques ont extrait, dans les séquences génomiques issues des 35000 échantillons renfermant des organismes flottants prélevés dans les océans, celles contenant un gène appelé RdRp essentiel aux virus à ARN mais absent des autres virus et cellules. Ils ont ainsi identifié 5500 espèces de virus jusque-là inconnues.
Pour les classifier, les chercheuses et chercheurs se sont basés sur les variations de ce même gène RdRp, qui existe probablement depuis l’époque où la vie est apparue sur Terre. Afin de prendre en compte son évolution sur des milliards d’années et tracer ces divergences de séquences, l’équipe s’est appuyée sur l’apprentissage automatique (machine learning), en s’aidant d’arbres phylogénétiques traditionnels et de la classification précise de séquences de virus à ARN déjà identifiés.
Résultat, si certaines des espèces identifiées font partie des 5 branches phylogénétiques (ou phylums) déjà existantes dans le royaume Orthornavirae, qui regroupent la plupart des virus pathogènes à ARN, ce n’est pas le cas des autres, qui n’entrent dans aucune branche connue à ce jour. Pour classer ces nouvelles espèces, les chercheurs proposent au moins 5 phylums supplémentaires. Ils ont montré que ces espèces étaient répandues dans la totalité des océans de la planète, avec une abondance notable dans les eaux de l'océan Arctique.
Selon l’équipe de recherche, une meilleure connaissance de la diversité et de l'abondance des virus dans les océans du monde permettra de mieux comprendre le rôle des microbes marins. Cette étude fournit ainsi des connaissances fondamentales essentielles à l’intégration des virus à ARN dans les modèles écologiques.
Ces travaux sont notamment soutenus par la Fondation Tara Ocean, le CNRS (Fédération de Recherche pour l’étude de l’écologie et de l’évolution du système océan global FR2022/Tara Oceans), le Laboratoire Européen de Biologie Moléculaire EMBL et le CEA-Genoscope.