La disparition d'un logiciel peut se comparer à la perte de l'édition originale d'un livre. Omniprésents depuis des décennies, et aujourd'hui parmi les artefacts les plus complexes jamais créés par l'humanité, les logiciels sont des trésors de connaissances, techniques et scientifiques évidemment, mais également culturelles et sociologiques. C'est pour garantir la préservation de ces connaissances que la Fondation Software Heritage a été créée en 2016. En 2021, le CEA-List s'est associé à cette initiative comme membre stratégique aux côtés d'Inria et des 19 autres membres.
La base de données de Software Heritage est la plus grande archive ouverte de codes sources de logiciels ayant jamais vu le jour. Elle conserve non seulement la version finale d'un logiciel, mais également toutes ses variantes, et les versions qui les ont précédées. Le CEA-List contribue aux ressources de cette initiative avec des moyens propres, et conçoit avec Inria les stratégies à mettre en place pour la pérenniser et en faire un des « Communs » du numérique.
Le CEA-List a notamment mis en place des moyens dédiés dans ses locaux pour aider à stocker et structurer l'ensemble des objets logiciels collectés. Il est doté d'une capacité de stockage ultra rapide de 2000 To, sur lesquels les 13 milliards de codes sources de Software Heritage seront stockés.
En préservant la connaissance, Software Heritage constitue une base précieuse pour nourrir l'excellence scientifique et contribuer à l'innovation.