Et si le meilleur système de stockage des données était sous les yeux de l’humanité depuis toujours ? L’ADN a dix milliards de fois la capacité d’un CD. Il n’a pas besoin d’électricité et peut résister pendant des millions d’années aux conditions climatiques les plus extrêmes. Grâce à lui, on pourrait un jour stocker toutes les données du monde – les 2,5 trillions d’octets générés actuellement chaque jour – dans le coffre d’une voiture, par exemple. L’ADN (acide désoxyribonucléique), présent dans les cellules de tous les êtres vivants, contient nos précieuses informations génétiques. L’idée d’y stocker des données n’est pas nouvelle. Depuis des années, des chercheurs planchent sur ce projet qui mêle la génétique à l’informatique, puisque l’ADN est la molécule par excellence capable de transporter des informations. Aujourd’hui, on peut écrire, lire, puis copier l’ADN comme une imprimante peut imprimer des lettres sur une page.
L’ADN a l’avantage d’être immensément plus dense que n’importe quel autre support de stockage : il peut stocker un milliard de fois plus que les appareils électroniques traditionnels. Un picogramme (un millionième de millionième) d’ADN a la même capacité de stockage qu'un CD.
Mais comment encoder une information sur de l’ADN ? La première chose à savoir est qu’il ne s’agit pas d’ADN humain ou animal. « Nous allons créer de l’ADN synthétique sous forme de poudre blanche », schématise Didier Gasparutto, biochimiste et chercheur au CEA. L’acide désoxyribonucléique se caractérise par quatre composants qui répondent aux lettres A, C, G, T. Les informations contenues dans l'ADN sont décryptables par des séries de base, des séquences d’ADN, à partir de ces quatre lettres. Or, les données informatiques sont, elles, codées en chiffres. Pour inscrire ces informations sur un brin d’ADN, il faut donc convertir ces données, dites binaires, par des séries de lettres contenant les A, C, G et T de l’ADN.
Technologies pointues
L’enjeu derrière ces nouveaux modes de stockage est aussi et surtout la récupération intacte des données après encodage. Et la science connaît déjà la technique depuis plusieurs années : une fois encodé, il suffit de séquencer l’ADN synthétisé, puis de reconvertir les lettres en une série binaire. Tout ce qui peut être stocké sous la forme d’une série de chiffres peut être stocké sur l’ADN. À titre d’exemple, chaque pixel d’une photo en noir et blanc est un 0 ou un 1. Pour stocker la photo, il faut convertir tous ces chiffres en lettres puis réaliser le processus inverse pour la récupérer. Garder à l’abri de la lumière et dans un endroit frais, le brin d’ADN contenant les informations peut alors traverser les siècles.
Bien sûr, ces processus répondent à des technologies très pointues. « Aujourd’hui, le challenge de cette technologie est de pouvoir créer des longs fragments d’ADN », souligne Didier Gasparutto. Plus les fragments d’ADN synthétiques sont longs, plus on peut y stocker des données. Et face à l’obsolescence - inexorable - des supports de stockage actuels, l’ADN peut survivre des centaines de milliers d’années. « On a plus de chance de retrouver des informations d’un humain ancestral que d’un vieux téléphone », résume la bioinformaticienne Zina Zielinski.