Alors que la quantité de données générées dans le monde continue d’augmenter à un rythme agressif, les chercheurs recherchent des technologies de stockage ultra-denses et ultra-durables capables de tout héberger.
Par exemple, Microsoft examine la possibilité d’utiliser des lasers pour graver des données dans du verre de quartz ou de stocker des informations sous forme d’hologramme à l’intérieur de cristaux. De nouveaux développements dans le domaine du stockage sur bande, le premier choix actuel pour les cas d’utilisation d’archives, sont également prometteurs.
Cependant, un nouveau support de stockage en particulier semble avoir tous les attributs nécessaires : l’acide désoxyribonucléique, ou ADN. Les chercheurs ont découvert qu’un seul gramme d’ADN est capable de stocker 215 Po (220 000 To) de données.
Pour en savoir plus sur les travaux visant à faire du stockage de l’ADN une réalité commerciale, TechRadar Pro s’est entretenu avec la DNA Data Storage Alliance, fondée l’année dernière par Microsoft, Western Digital, Twist Bioscience et Ilumina.
L’Alliance a été lancée dans le but de faire connaître la technologie de stockage émergente et d’établir un ensemble de normes et de spécifications sur lesquelles l’industrie peut s’appuyer.
Sommaire
Qu’est-ce que le stockage de l’ADN et quels défis doit-il relever ?
Le stockage des données ADN est le processus d’encodage et de décodage de données binaires sur et à partir de brins d’ADN synthétisés (acide désoxyribonucléique). L’ADN a plusieurs propriétés uniques, y compris la densité, il est essentiellement libre de copier, le code sera toujours lisible et le coût de possession au fil du temps sera moindre en raison de la longévité. De plus, il permet d’économiser considérablement sur les coûts énergétiques par rapport au stockage numérique actuel.
Les solutions de stockage héritées ont considérablement évolué au fil des ans, mais la densité surfacique des supports magnétiques (disque dur et bande), qui permet aujourd’hui les solutions de stockage d’archives grand public, ralentit et la taille des bibliothèques devient lourde. En bref, la croissance des données dépasse l’évolutivité des solutions de stockage d’aujourd’hui. L’industrie a besoin d’un nouveau support de stockage plus dense, durable, durable et rentable afin de faire face à la croissance future attendue des données d’archivage.
Comment est-il possible de traduire l’information numérique dans un format biologique (et inversement) ?
Quels types de complications peuvent survenir ici?
Pour stocker des données dans l’ADN, les données numériques (binaires) d’origine sont codées (mappées de 1 et de 0 à des séquences de bases d’ADN, ACGT), puis écrites (synthétisées à l’aide de processus chimiques/biologiques) et stockées. Lorsque les données stockées sont à nouveau nécessaires, les molécules d’ADN sont lues (séquencées pour révéler chaque ACG ou T individuel dans l’ordre) et décodées (remappées à partir des bases d’ADN en 1 et 0).
Il existe certaines préoccupations concernant l’exactitude des données potentiellement introduites par les erreurs de synthèse et de séquençage d’oligonucléotides (courts morceaux d’ADN). Cependant, contrairement à la synthèse oligo pour les soins de santé, qui doit être parfaite, le stockage d’ADN peut tolérer des erreurs dues aux algorithmes de correction d’erreurs généralement utilisés dans le stockage aujourd’hui. Les pionniers du stockage de données ADN travaillent déjà sur l’amélioration de l’algorithme de codage/correction d’erreurs qui atténuera ce risque et récupérera les données avec précision. De plus, le coût, la vitesse, la logistique et d’autres défis restent des obstacles pour les centres de données à adopter cette technologie.
La DNA Data Storage Alliance a été formée par Illumina, Microsoft Research, Twist Bioscience et Western Digital. Notre mission est de créer et de promouvoir un écosystème de stockage interopérable basé sur l’ADN fabriqué comme support de stockage de données. Notre objectif initial est d’éduquer le public et de le sensibiliser à cette technologie émergente. En outre, à mesure que les méthodes et les outils de stockage de données ADN commercialement viables seront mieux compris et plus largement disponibles, l’Alliance envisagera la création de spécifications et de normes (par exemple, codage, interfaces physiques, conservation, systèmes de fichiers) pour promouvoir l’émergence de des solutions interopérables basées sur le stockage de données ADN qui complètent les hiérarchies de stockage existantes.
Quel pourrait être l’impact du stockage ADN sur l’industrie des centres de données ?
L’ADN est un support intrinsèquement respectueux de l’environnement en termes de puissance, d’espace et de durabilité, en plus de réduire considérablement le besoin de migrer les données toutes les quelques années. Lorsqu’il est utilisé comme principal support de stockage d’archives dans un centre de données, il a le potentiel de modifier la taille du centre de données ainsi que le coût total de possession et, en alternative, d’imposer des charges nettement inférieures aux technologies de stockage d’archives héritées sur les ressources de la planète.
Quels sont les principaux obstacles que le stockage d’ADN devra surmonter ?
Les coûts de synthèse et de séquençage de l’ADN sont encore relativement élevés par rapport aux supports de stockage d’archives actuellement utilisés tels que les disques durs ou les bandes et une réduction significative des coûts est nécessaire pour que le stockage des données ADN soit adopté à grande échelle. En outre, l’éducation et le renforcement de la confiance pour préparer le marché à ce nouveau support de stockage seront également essentiels, c’est pourquoi la DNA Data Storage Alliance a été formée.
Quelles sont les dernières innovations en R&D qui rapprochent le stockage de l’ADN de la réalité ?
Les coûts continuent de baisser en raison de la miniaturisation du processus de synthèse d’ADN par Twist Bioscience. D’autres sociétés poursuivent des méthodes alternatives de synthèse d’ADN, les deux approches permettant une synthèse massivement parallélisée et des réductions de coûts. Le coût et le débit du NGS s’améliorent également en permanence, ce qui rend la récupération des données ADN plus prometteuse. En outre, le développement d’algorithmes de codage et de décodage a fait ses preuves.
À quel type de calendrier avons-nous affaire ?
Le stockage des données ADN sera disponible à moyen terme. Il y a encore du travail à faire et beaucoup d’élan pour en faire une réalité. Les premiers utilisateurs du stockage de données ADN sont susceptibles d’être des applications où ils ont des données Write Once, Read Never (WORN) ou Write Once, Read Rarement si jamais (PIRE). Au fur et à mesure que la technologie évolue et devient acceptée au sein de la communauté, le marché va s’étendre et évoluer.
Quelles technologies de stockage historiques l’ADN est-il le plus susceptible de rivaliser ?
La demande de stockage de données à long terme dans le cloud atteint des niveaux sans précédent. Les technologies de stockage existantes n’offrent pas une solution rentable pour stocker des données de longue durée. Opérer à de telles échelles dans le cloud nécessite une refonte fondamentale de la façon dont nous construisons des systèmes de stockage à grande échelle, ainsi que des technologies de stockage sous-jacentes qui les sous-tendent.
Existe-t-il d’autres technologies de stockage émergentes en cours de développement qui pourraient être tout aussi prometteuses ?
Les chercheurs explorent diverses technologies pour soutenir cette évolution, notamment le stockage de données dans de l’ADN synthétique, du verre de quartz et d’autres systèmes optiques évolutifs. Le stockage des données ADN est unique dans ses caractéristiques et ses propriétés – on peut affirmer qu’il permettra un nouveau niveau de stockage.