Stocker ses données numériques dans de l'ADN : une solution d'avenir


L'International Data Corporation estime que le volume de données passera de 33 zettaoctets en 2018 à 175 zettaoctets à l'échelle mondiale d'ici l'année 2025. Bien que ces données ne soient pas toutes destinées à être conservées, la demande de capacité de stockage sera elle aussi en augmentation. Cette évolution suscite donc une réflexion sur la limite des supports actuels de stockage.

Pourquoi ne pas utiliser de l'ADN synthétique comme support de stockage de données? Si cette approche étonnante fait l'objet de recherches depuis plusieurs années, des chercheurs de Microsoft et de l'Université de Washington ont récemment réalisé une percée considérable en la matière.

Ils ont réussi à automatiser dans son intégralité le processus de stockage et de récupération de données sur de l'ADN. Jusqu'alors, cette pratique nécessitait encore une intervention manuelle à certaines étapes. Les détails du dispositif que les chercheurs ont développé ont été présentés dans Nature Scientific Reports.

Cette réussite marque un progrès majeur en matière de stockage de données. En effet, l'automatisation est une étape nécessaire à toute utilisation de cette technologie à plus large échelle, hors du cadre d'un laboratoire. Bien que le dispositif actuel ne soit pas encore optimal, il s'agit d'une référence solide qui, selon les auteurs, pourrait être commercialement viable après certaines améliorations.

Comment stocker des données numériques dans des brins d'ADN?

Rappelons tout d'abord que l'acide désoxyribonucléique (ADN) est une molécule porteuse d'information génétique constituée « de deux brins enroulés en double hélice et formés chacun d'une succession de nucléotides ». La composition de ces nucléotides varie, notamment au niveau de leur base azotée, qui peut se trouver sous quatre formes :

  • adénine (A);

  • guanine (G);

  • cytosine (C);

  • thymine (T).

En ce qui concerne le stockage de données sur des brins d'ADN, ces derniers sont synthétisés à partir d'information numérique encodée. Les données numériques initialement présentées sous forme binaire (une suite de zéros et de uns) sont transcrites en une succession de A, de G, de C et de T. Cette séquence sert ainsi à produire de l'ADN synthétique grâce à un synthétiseur. Pour récupérer les données, l'ADN synthétisé est alors lu par un séquenceur. Celui-ci permet de retrouver la séquence A, G, C, T qui sera alors retranscrite sous forme binaire.