Le stockage sur des brins synthétiques d'ADN ouvre des perspectives en matière de stockage de données, et particulièrement pour la conservation de grandes quantités d'informations sur des périodes de plusieurs milliers d'années. Microsoft Resarch, qui a manifesté son intérêt dans ce domaine, estime que grâce au stockage sur ADN, " toutes les données publiques accessibles sur l'Internet pourraient se glisser dans une boîte à chaussures. "

ADN Le principe repose sur la traduction de données numériques (0 et 1) dans une information génétique composée des quatre bases nucléotidiques d'un brin d'ADN (adénine, cytosine, guanine et thymine) et en fonction de leur ordre d'enchaînement. D'abord sous forme électronique, les lettres A, C, G et T sont directement traduites dans les molécules elles-mêmes.

Des chercheurs de l'université Columbia et du New York Genome Center ont utilisé cette technique pour stocker le tout petit système d'exploitation KolibriOS, un film de Louis Lumière de 50 secondes, une carte cadeau Amazon de 50 $, un virus informatique, une plaque d'une sonde spatiale Pioneer et une étude de 1948 de Claude Shannon.

Ces fichiers ne représentent au total qu'un peu plus de 2 Mo mais les chercheurs avancent que leur méthode a permis de stocker 60 % de données en plus que précédemment dans des conditions d'expérimentation similaires. Pour cela, ils ont tiré parti d'un algorithme de correction d'erreurs (codes fontaines).

Un communiqué explique que les six fichiers ont été " compressés dans un fichier maître, puis les données ont été divisées dans des chaînes de code binaire. " En utilisant l'algorithme, ces chaînes ont été " intégrées de manière aléatoire dans des gouttelettes " et cartographiées sur les bases nucléotidiques d'ADN (A, G, C, T).

" L'algorithme a supprimé des combinaisons de lettres connues pour créer des erreurs, et a ajouté un code à barres à chaque gouttelette pour aider à rassembler ultérieurement les fichiers. " Une liste numérique de 72 000 brins d'ADN a été générée. Les données ont été converties en données biologiques. Leur récupération a nécessité du séquençage d'ADN.

Selon les chercheurs, il serait possible de stocker 215 Po de données dans un seul gramme d'ADN mais il se pose le problème du coût. Les chercheurs ont dépensé 7 000 $ afin de synthétiser l'ADN pour le stockage de leurs 2 Mo de données, et 2 000 $ pour les lire.