TechRadar Pro récemment rencontré David Turek, CTO chez Catalog, une entreprise pionnière dans le stockage de données basé sur l’ADN.
La pratique est considérée par beaucoup comme la prochaine frontière dans l’enregistrement (et la lecture) de bits et d’octets à l’échelle exascale, au-delà du memristor et d’autres méthodes d’enregistrement de données exotiques.
Voici ce que Turek avait à dire à propos du prototype Shannon de son entreprise:
Sommaire
À propos de la machine
«Il s’appelle Shannon en l’honneur de Claude Shannon, qui est connu comme le ‘père de la théorie de l’information’. Shannon est encore un prototype à un stade relativement précoce utilisé pour explorer les problèmes de stockage et de calcul associés à la capacité de coder des données dans l’ADN. Il n’est pas encore prêt pour la vente commerciale. »
«Shannon est écrivain. Il peut actuellement écrire sur les données à environ 10 Mo / s, mais nous avons découvert des moyens d’améliorer la conception pour atteindre des vitesses de gigabit par seconde. La lecture des données est réalisée avec les types de machines utilisées pour le séquençage de l’ADN. Dans notre cas, nous utilisons des machines d’Oxford Nanopore Technologies. »
Comment ça fonctionne
« Dans l’informatique conventionnelle, les données sont représentées par une chaîne de 1 et 0. Une version compressée des données est également représentée par une chaîne de 1 et de 0 et peut être codée en ADN. Par conséquent, Shannon peut gérer n’importe quel schéma de compression de données conventionnel. Comme un tel algorithme de compression numérique standard utilisé dans la représentation numérique peut être implémenté dans notre schéma de codage. «
« Cependant, nous pouvons réduire davantage la quantité de données stockées dans l’ADN grâce à la façon dont nous codons les données pour réduire le nombre de molécules utilisées pour représenter les données. Dans un sens, nous compressons les données de manière conventionnelle et nouvelle au niveau en même temps; nous effectuons une compression conventionnelle sur les données d’entrée de manière standard, puis nous prenons cette représentation compressée et la compactons davantage dans son schéma de codage d’ADN en réduisant le nombre de molécules utilisées pour représenter les données d’entrée numériques précédemment compressées. [as it stands] nous pouvons produire 186 Go de données compressées avec Shannon. «
L’avenir de Shannon
« L’augmentation de la capacité peut être réalisée de plusieurs façons. Par exemple, nous pouvons ajuster la chimie à l’intérieur de Shannon, nous pouvons accélérer les aspects mécaniques de Shannon (par exemple, faire bouger la sangle dans la machine plus rapidement), et nous pouvons ajuster l’impression. configuration de la tête. «
« Nous nous attendons à ce que ce ne soit que quelques-uns des leviers que nous pouvons ajuster sur Shannon pour augmenter le débit et la capacité. Les problèmes de production de masse seront résolus sur la base de ce que nos premiers clients nous apprennent concernant leurs cas d’utilisation. En général, nous s’attendrait à ce que la mise en œuvre de degrés d’automatisation plus élevés soit la clé de l’acceptation massive de la solution. «
«La miniaturisation de Shannon sera le sous-produit de l’innovation interne de la chimie et de l’ingénierie, avec une compréhension claire de la façon dont les clients voudraient utiliser l’appareil. Il est prématuré de spéculer sur le facteur de forme de l’appareil. «
Combien ça coûtera?
« Le prix de vente de la version finale sera un déterminant des réductions de coûts attendues dans l’amélioration de la conception et sera informé par la demande du marché. Cela deviendra plus clair au cours de l’année prochaine. »
« Le support sera soit de l’ADN dans une solution, soit une forme desséchée dans quelque chose comme un très petit caillou. Dans les deux formes, il est probable que la quantité de données que vous écrivez sera contenue dans un volume plus petit qu’un seul tube à essai. Il y a aucun concept équivalent à la protection en écriture dans les supports conventionnels; les données sont préservées en générant des copies de l’ADN codé presque gratuitement. «