Responsable : Claude Scarpelli, CEA
Contact : claudegenoscope.cns.fr
Le laboratoire d'informatique scientifique est constitué de 3 équipes qui interviennent sur l'ensemble du périmètre du Genoscope et du CNRGH. Ses missions sont focalisées sur l'architecture système et réseau, le développement et l'opération de systèmes de gestion de production, et enfin la prise en charge des données massives de séquence.
Les 3 groupes accueillent des stagiaires, des jeunes en contrat d'apprentissage, et offrent régulièrement des postes temporaires ou permanents.
En savoir plus sur l'informatique scientifique du Genoscope et du CNRGH.
Elle a en charge l'architecture système et réseau de l'informatique scientifique de l'institut. Le modèle général est une architecture centrée sur les données (environ 2 Po, NFS, serveurs de fichiers Netapp), qui sont alors accessibles avec un niveau de performance élevé par les unités de calcul (environ 1.500 cœurs (environ 30 Tflops), nœuds de 64 Go de mémoire et plus, noeuds "grande mémoire" ccNUMA à 2 et 3 To de mémoire) et les postes de travail.
En outre, l'équipe met en œuvre un ensemble de serveurs pour des fonctions supports : courrier électronique, Web, base de données, sauvegarde, archivage, supervision... Cette configuration s'appuie sur une solution de virtualisation VMWare.
L'équipe a en charge l'installation des logiciels sur les calculateurs (ainsi que leurs éventuelles adaptations) et la gestion du cycle de vie des données.
L'environnement système est majoritairement UNIX (Linux CentOS + Slurm), mais une attention particulière est portée à la bonne intégration de l'environnement Microsoft.
Elle développe et maintien des applications permettant la traçabilité et l'imputabilité des activités de production de l'institut. En outre, l'équipe conçoit et met en oeuvre des outils supports pour l'automatisation des processus (pipeline, workflow).
Elle prend en charge les données, principalement de séquence, issues des instruments.
Le groupe interagit avec les laboratoires du Genoscope: séquençage, équipe développement technologique (développement de nouveaux protocoles et mise en place de nouveaux séquenceurs), et équipe de recherche (analyse). Les missions sont multiples: la mise en forme des données produites par les séquenceurs, le contrôle qualité des données, l'assemblage de génomes et de transcriptomes, l'annotation de génomes eucaryotes.