Comment ça marche, un réseau de neurones enzymatique ?
⏱ 5 minLes “réseaux de neurones enzymatiques” fonctionnent par le biais d’interactions entre des brins d’ADN, qui matérialisent les variables du système, et des enzymes. Nous tentons ici de décrire leur drôle de mécanique, qui exploite des processus inventés par le vivant.
Dans notre précédent article, nous avons présenté les “réseaux de neurones enzymatiques”, cette nouvelle approche pour réaliser des réseaux de neurones artificiels, reposant sur les propriétés de l’ADN et faisant appel de surcroit à des enzymes. C’est la voie explorée par une équipe franco-japonaise pilotée par Anthony Genot, un chercheur du Limms (Laboratory for Integrated Micro-Mechatronic Systems) de Tokyo, une unité mixte du CNRS et de son homologue japonais. Il précisait : « Les réseaux à ADN classiques [ne faisant pas appel à des enzymes, ndlr] ne permettent pas de réaliser efficacement une fonction essentielle dans les réseaux de neurones : la fonction d’activation (step function). Ils donnent des résultats intéressants pour des preuves de principe comme la reconnaissance de chiffres, mais ne permettent pas de s’attaquer à des problèmes plus généraux, où le rôle de cette fonction non linéaire est plus crucial. » Son équipe a récemment publié1 dans Nature des travaux ayant abouti à la réalisation de réseaux de neurones enzymatiques multicouches incluant une solide fonction non-linéaire.
Mais comment fonctionne concrètement un réseau de neurones reposant sur des brins d’ADN et des enzymes ? Yannick Rondelez, responsable de l’équipe SPM (Molecular Programs and Systems) du laboratoire Gulliver de l’ESPCI, et cosignataire de cette publication, a joué un rôle essentiel dans la mise au point de la “boîte à outils” sur laquelle s’appuient ces travaux. Il expliquait : « Pour réaliser un neurone, il faut essentiellement pouvoir effectuer trois opérations. Tout d’abord multiplier ses entrées (inputs) par les poids. Puis additionner les résultats obtenus. Enfin, il faut appliquer au résultat de cette addition une fonction d’activation, en général une fonction non linéaire. »
A, C, G, T : le code quaternaire du vivant
Comment concrétiser ces trois opérations en phase liquide, à l’aide de brins d’ADN et d’enzymes ? Pour matérialiser les “inputs” et “outputs” (les états), mais aussi les “poids” de leurs neurones, les chercheurs utilisent de minuscules brins d’ADN “monocaténaires”. C’est-à-dire des séquences de nucléobases (ou plus simplement bases) appartenant au fameux alphabet de la génétique : A, C, G, T, pour adénine, cytosine, guanine, thymine. Ils font par ailleurs appel à trois types d’enzymes : polymérases, nickases et exonucléases. La polymérase transforme un brin monocaténaire en bicaténaire, en associant à chacune des bases du brin initial une base complémentaire (adénine face à thymine, guanine face à cytosine, et inversement). A contrario, la nickase est une sorte de ciseau. Quand elle reconnait un certain motif sur un brin d’un double brin, elle coupe et libère la section de ce brin qui lui succède. Le brin double devient simple au-delà du motif reconnu et un brin simple complémentaire est libéré dans le milieu. Enfin, l’exonucléase dissocie les brins d’ADN en nucléobases.
Dans une solution contenant ces enzymes, les chercheurs introduisent donc des brins d’ADN. « Des brins très courts, comportant dix à quinze bases, représentent les inputs des neurones, précise Yannick Rondelez. » Cette longueur est suffisante pour coder des millions de variables distinctes. « C’est la concentration respective de chaque séquence qui représente la valeur de la variable considérée, précise le chercheur. De leur côté, les poids d’un neurone sont matérialisés par des brins deux fois plus longs (vingt à trente bases). Ils sont constitués de deux séquences consécutives du type évoqué plus haut. » Appelés “converter templates” dans la publication, ils jouent un peu le rôle d’une instruction, comme nous allons le voir. Les deux segments de ces “convertisseurs” sont les compléments (adénine vs thymine, guanine vs cytosine…) des brins codant pour un input d’un neurone et pour son output. « Considérons un brin constitué du motif complémentaire de l’input A suivi de celui de l’output B, poursuit le chercheur. Lorsqu’il rencontre un brin représentant l’input A, ce dernier va s’apparier à la première partie de ce convertisseur. »
Des enzymes qui construisent, éditent et démontent l’ADN
Les enzymes entrent alors en scène. « La polymérase prolonge ce brin partiellement double en complémentant, base après base, le segment codant pour le complément de l’output B, explique Yannick Rondelez. » On se retrouve alors avec un petit brin bicaténaire codant sur l’un de ses brins pour l’input A suivi de l’output B (et pour leur complément sur l’autre brin). Intervient alors la nickase. « Elle reconnait cet assemblage, grâce à une petite sous-séquence (cinq ou six bases) commune à toutes les variables, elle sectionne le brin après l’input A et libère le segment représentant l’output B. » Cette opération a donc produit un exemplaire de B, mais laisse intact l’assemblage convertisseur-A. Sur lequel peut aussitôt agir à nouveau la polymérase, puis la nickase… Et ainsi de suite, ce qui fait grimper la concentration de B. Dans le même temps, le même processus se reproduit pour tous les brins représentant les poids des neurones constituant le modèle. Par ailleurs, en toile de fond, l’exonucléase joue son rôle. Elle ne cesse de “démonter” les brins qu’elle rencontre en pièces détachées (en bases isolées), ce qui modère le processus.
Nous avons tenté de décrire ci-dessus le mécanisme qui “traduit” la multiplication d’un input par un poids. Rappelons que ce sont les concentrations dans le milieu des brins codant pour chaque variable qui représentent leur valeur. Ainsi, la concentration du convertisseur décrit ci-dessus, que l’on peut interpréter comme une instruction qui signifierait : « si tu rencontres A, fabrique B », représente le poids affecté à l’input A dans le neurone dont l’output est B. Un mécanisme supplémentaire permet de régler avec précision la valeur d’un poids. Il s’agit d’un “faux” convertisseur, concurrent du vrai, signifiant « si tu rencontres un A, fabrique… rien » (en fait, une séquence neutre), qui entre donc en compétition avec le premier, en mobilisant une fraction des A disponibles. C’est en fixant le ratio entre les concentrations de vrais et faux convertisseurs que l’on peut ajuster très précisément la valeur d’un poids.
L’addition est gratuite
Nous avons vu comment est obtenue la multiplication d’un “input” par un poids. L’addition des produits correspondant aux multiples inputs d’un neurone résulte très simplement de l’accumulation dans le milieu du brin représentant l’output B. Si de multiples convertisseurs “Si Ai => B” sont présents, ils contribueront tous à la production de B. Dans ce paradigme où les variables sont représentées par des concentrations, l’addition est gratuite. Reste à évoquer la fonction non linéaire d’activation. Sa mise en œuvre est complexe, nous la résumerons en disant qu’elle fait appel à deux mécanismes antagonistes qui réalisent une sorte de bistable. D’une part, un convertisseur “Si B => B” amplifie exponentiellement la variable output B, et d’autre part un autre convertisseur qui a pour effet d’inactiver cette même variable. Une sorte d’effet de seuil résulte de cette compétition, qui produit une courbe proche d’une sigmoïde.
Les diverses opérations décrites ci-dessus se déroulent en parallèle sur un très grand nombre d’exemplaires de brins d’ADN. « Même dans une microgoutte de l’ordre du picolitre (un millième de milliardième de litre), les copies de chaque séquence en jeu se comptent par dizaines de milliers, assure Yannick Rondelez. » Pour travailler à cette échelle, il faut faire appel à la microfluidique, cette technologie qui fait circuler des gouttelettes infimes dans des canaux microscopiques au sein de circuits comportant des aiguillages, des capteurs et actionneurs permettant de séparer ou réunir des trains de gouttelettes, de les réchauffer ou refroidir, mais aussi de les fusionner pour doser à la demande des concentrations, sous le contrôle d’un logiciel. « La microfluidique nous permet de travailler en parallèle sur des milliers, voire des dizaines de milliers d’hypothèses en parallèle, indique Yannick Rondelez. On peut ainsi tester un réseau de neurones sur de nombreuses combinaisons des valeurs d’entrée. Ce qui permet d’étudier la fonction qu’il calcule. »
Pierre Vandeginste
1. Okumura, S., Gines, G., Lobato-Dauzier, N. et al. Nonlinear decision-making with enzymatic neural networks. Nature, 2022. doi.org