Comme beaucoup d’entre nous, Dan Jacobson a grandi en jouant avec des ordinateurs – mais ses machines étaient un peu plus sophistiquées que vous ne l’imaginez probablement.
Gracieuseté de son père scientifique, Jacobson a passé ses années de formation à proximité des ordinateurs centraux (bêtes imposantes conçues pour des tâches particulièrement gourmandes en calcul) et même, dit-il, des types de calculatrices non disponibles en dehors des laboratoires à l’époque.
Cette enfance non conventionnelle a probablement jeté les bases de la romance professionnelle de 30 ans avec le calcul haute performance (HPC) qui allait suivre, au cours de laquelle il a travaillé avec certaines des machines les plus puissantes existantes.
Aujourd’hui, il est biologiste des systèmes informatiques au Oak Ridge National Laboratory (ORNL) aux États-Unis, qui se trouve être le siège du supercalculateur IBM Summit, auparavant le plus rapide au monde avec plus de 200 petaFLOPS (selon la référence HPL).
Jacobson et son équipe de 20 personnes – composée d’experts dans des domaines aussi divers que la biologie, l’intelligence artificielle, l’ingénierie, les statistiques et plus – exploitent le supercalculateur d’IBM pour enquêter sur les mystères du coronavirus.
Le produit de cette expérience est une nouvelle théorie sur la nature du virus qui, si elle est vérifiée, pourrait avoir des implications significatives sur la manière dont les patients sont traités.
Sommaire
Jeter les bases
Lorsqu’on lui a demandé à quoi ressemblait une journée typique dans la vie d’un biologiste des systèmes informatiques, Jacobson n’avait pas de réponse pour nous. En fait, il a ri.
«Je ne suis pas sûr qu’il y ait un quotidien typique. Le travail est une combinaison de brainstorming, de rencontres avec des collaborateurs, de gestion de projets existants, de revue de littérature, d’écriture de subventions et de manuscrits, etc. », nous dit-il.
Aussi varié que puisse être son travail, cependant, un fil conducteur est resté tout au long du temps de Jacobson à ORNL et de sa carrière dans son ensemble – celui de l’intégration de données.
Il décrit cette pratique comme une «tentative de relier des types disparates de données pour mieux comprendre un système dans son ensemble». Cela semble assez simple, mais la poursuite de cet objectif l’a porté à travers les secteurs, les disciplines et les continents au cours des trois dernières décennies.
Comme on pouvait s’y attendre, il a travaillé dans des environnements de laboratoire et des environnements académiques (y compris un passage à l’Université Johns Hopkins), mais il a également essayé l’esprit d’entreprise et a même dirigé une ONG pendant un certain temps.
Dans chacun de ces rôles, Jacobson s’est trouvé attiré par les détails complexes qui composaient le tout; les micro événements qui contribuent à un effet macro.
Dans le cadre de ses recherches sur les coronavirus, par exemple, son souci est de décortiquer la biologie fondamentale et l’évolution moléculaire du virus, dans le but ultime de comprendre comment il se manifeste dans le corps humain et, à l’occasion, tue son hôte.
Le problème avec les détails complexes, cependant, est qu’il y en a invariablement beaucoup. Et pour analyser les détails, Jacobson a besoin d’un moyen d’effectuer des calculs le plus rapidement possible.
Besoin de vitesse
Entrez dans les superordinateurs – les héros silencieux de ce récit – qui fournissent le moyen de faire exactement cela: effectuer des calculs et traiter des grandeurs d’informations plus rapidement qu’il ne serait possible autrement.
Jacobson estime que son équipe s’est vu allouer des centaines de milliers d’heures de nœuds avec Summit et utilisait même la machine avant la fin de la construction. Donc, il est prudent de dire qu’il connaît son chemin autour d’un superordinateur.
Au cours de sa carrière, il a appliqué des ressources de calcul intensif dans une gamme ahurissante de contextes, de la bioénergie et de la microbiologie à la biomédecine, aux neurosciences (en relation avec les problèmes de suicide, d’autisme et de toxicomanie) et plus encore.
«Ce que nous constatons, c’est que les outils et algorithmes que nous développons pour un système s’appliquent parfaitement aux autres. Les algorithmes ne se soucient pas vraiment des espèces auxquelles nous avons affaire », a-t-il expliqué.
«Si vous comparez le travail que nous faisons sur les plantes et le travail que nous faisons sur les humains, nous apprenons en fait beaucoup de l’un qui peut être appliqué à l’autre.
Un élément crucial pour travailler de ce type est l’optimisation de l’utilité des algorithmes par un processus de rationalisation. Moins un algorithme est à exécuter, plus un supercalculateur peut effectuer de calculs par seconde.
Pour leur travail dans ce domaine, l’équipe de Jacobson a remporté le prestigieux prix Gordon Bell en 2018, décerné pour «l’innovation dans l’application du HPC aux défis de la science, de l’ingénierie et de l’analyse à grande échelle».
Ils avaient développé un algorithme pour identifier les gènes qui pourraient être plus sensibles à la dépendance aux opioïdes, ainsi que les traitements potentiels. Coulé dans une matrice de 16 bits, cet algorithme était capable de fonctionner à 2,35 exaFLOPS sur IBM Summit, ce qui en fait le premier du genre à franchir la barrière exascale (égale à 1 milliard de calculs par seconde).
Pour atteindre ces sommets, l’équipe avait minimisé la précision numérique nécessaire de l’algorithme et l’a encore peaufinée pour utiliser spécifiquement les cœurs Tensor à l’intérieur des 27 648 GPU Nvidia Volta de Summit.
Cependant, alors que le travail de Jacobson avec les supercalculateurs a toujours été important, sa richesse d’expérience n’a peut-être jamais été canalisée vers un sujet plus digne qu’il ne l’est aujourd’hui: le virus hautement infectieux qui a coûté la vie à plus d’un million de personnes à ce jour.
Coronavirus et tempête de bradykinine
Discutant de la recherche sur les coronavirus de son équipe, Jacobson n’a pas pu s’empêcher de plonger directement dans la science fondamentale. Il n’y avait pas de place pour le profane sur cette expédition particulière, donc TechRadar Pro juste dû attacher sa ceinture.
En termes aussi simples que possible, son équipe propose que Covid-19 soit en fait une maladie vasculaire (des veines et des artères, etc.) plutôt qu’un simple problème respiratoire spécifique (des poumons).
Cela peut sembler ringard, mais Jacobson s’est rendu compte sous la forme d’un moment eureka un dimanche après-midi – et il centré sur une protéine appelée bradykinine, responsable de la dilatation des vaisseaux sanguins.
Lorsqu’il infecte un hôte humain, le coronavirus provoque ce que Jacobson appelle une «tempête de bradykinine», ce qui signifie que l’activité liée à la protéine augmente considérablement, bien au-delà des niveaux normaux.
Cela déclenche une série d’événements biologiques (par exemple, une augmentation de la perméabilité des vaisseaux sanguins et la production d’acide hyaluronique) qui inonde finalement les poumons avec une «substance semblable à la gélatine», ce qui rend la respiration plus difficile pour le patient.
«Sur la surface interne de vos poumons, vous avez environ 70 à 100 mètres carrés de surface, recouverts de capillaires. Vous pouvez imaginer que si vous rendez ces capillaires vraiment perméables et que du liquide se déverse dans vos poumons, ce n’est pas une bonne chose », a expliqué Jacobson.
Une analyse des effets en aval d’une tempête de bradykinine dans le corps montre une corrélation étroite avec d’autres symptômes affichés par les patients atteints de coronavirus – y compris une toux sèche, une perte d’odeur, des douleurs musculaires, de la confusion, de la diarrhée, des nausées, etc. – qui semblent tous corroborez les conclusions de l’équipe.
La bonne nouvelle, selon Jacobson, est qu’il existe «une douzaine ou plus de médicaments connus pour toucher différentes parties de ce mécanisme». En fin de compte, nous a-t-il dit, traiter efficacement les personnes atteintes de coronavirus consistera à résoudre à tour de rôle chacun des différents problèmes provoqués par la tempête de bradykinine.
«Si vous naviguez sur un récif avec votre bateau et percez cinq trous dans le fond de votre bateau, un bouchon ne résoudra peut-être pas votre problème. Vous allez vouloir cinq bouchons », expliqua-t-il, sentant peut-être que nous ne suivions pas tout à fait la science.
Jacobson est le premier à admettre qu’il y a beaucoup plus de travail à faire, beaucoup plus d’essais à mener et des données encore à analyser – mais la théorie, dit-il, est «bien plus qu’un début prometteur».
Se déplacer dans la mélasse
Malgré tout l’enthousiasme de Jacobson pour la signification potentielle des découvertes de son équipe, un puissant barrage routier se dresse toujours sur son chemin: le processus d’examen scientifique.
Quand on lui a demandé combien de temps il pensait qu’il faudrait pour que sa découverte, si elle était vérifiée, se manifeste par des changements dans la façon dont les patients sont traités, Jacobson ne pouvait tout simplement pas répondre.
« Quelle est la longueur d’une ficelle? » il a plaisanté. «Il y a beaucoup de collaboration, de discussion et de négociation. Il y a de nombreux éléments en mouvement, mais nous faisons tout notre possible pour que cela se produise.
Il dit que la vitesse à laquelle les études liées aux coronavirus sont menées et examinées est beaucoup plus rapide que d’habitude, pour des raisons évidentes. Mais l’attente n’est pas moins atroce.
«Tout se déplace à la vitesse de la fusée, selon les délais scientifiques normaux, mais pour nous, cela ressemble à de la mélasse. Bien sûr, suivre le processus d’examen normal est extrêmement important, mais c’est tellement pénible d’attendre.
«Mais, c’est la nature de la bête», ajouta-t-il, imaginons-nous avec un haussement d’épaules réticent.