Flashmag Digizine Edition Issue 110 October 2020 - Page 128

..............128............

automatique aux besoins de la biologie synthétique pour guider le développement de manière systématique. Cette innovation signifie que les scientifiques n'auront pas à passer des années à développer une compréhension méticuleuse de chaque partie d'une cellule et pour savoir ce qu'elle fait pour la manipuler; Au lieu de cela, avec un ensemble limité de données d'entraînement, les algorithmes sont capables de prédire comment les changements dans l'ADN ou la biochimie d'une cellule affecteront son comportement, puis de faire des recommandations pour le prochain cycle d'ingénierie ainsi que des prédictions probabilistes pour atteindre l'objectif souhaité.

«Les possibilités sont révolutionnaires», a déclaré Hector Garcia Martin, chercheur à la division des systèmes biologiques et de l’ingénierie (ESB) de Berkeley Lab, qui a dirigé la recherche. «À l'heure actuelle, la bio-ingénierie est un processus très lent. Si vous êtes capable de créer de nouvelles cellules selon les spécifications en quelques semaines ou quelques mois au lieu d'années, vous pourriez vraiment révolutionner ce que vous pouvez faire avec la bio-ingénierie. "

En collaboration avec la spécialiste des données sur l'ESB Tijana Radivojevic et un groupe international de chercheurs, l'équipe a développé et démontré un algorithme en instance de brevet appelé (automated recommandation tool) Outil de recommandation automatisée (ART), décrit dans deux articles récemment publiés dans la revue Nature Communications. L'apprentissage automatique permet aux ordinateurs de faire des prédictions après avoir «appris» à partir de quantités substantielles de données d’essai disponibles.

Dans « l’outil de recommandation automatisé d'apprentissage automatique pour la biologie synthétique», dirigé par Radivojevic, les chercheurs ont présenté l'algorithme, qui est adapté aux particularités du domaine de la biologie synthétique: petits ensembles de données utilisées pour les essais , la nécessité de quantifier l'incertitude et les cycles récursifs. Les capacités de l’outil ont été démontrées avec des données simulées et historiques de projets d’ingénierie métabolique antérieurs, tels que l’amélioration de la production de biocarburants renouvelables.

En «Combinant des modèles mécanistiques et d'apprentissage automatique pour l'ingénierie prédictive et l'optimisation du métabolisme du tryptophane», l'équipe a utilisé l'ART pour guider le processus d'ingénierie métabolique afin d'augmenter la production de tryptophane, un acide aminé aux utilisations diverses, par une espèce de levure appelée Saccharomyces cerevisiae , ou de la levure de boulanger. Le projet a été dirigé par Jie Zhang et Soren Petersen du Novo Nordisk Foundation Center for Biosustainability de l'Université technique du Danemark, en collaboration avec des scientifiques du Berkeley Lab et de Teselagen, une start-up basée à San Francisco.

Pour mener l'expérience, ils ont sélectionné cinq gènes, chacun contrôlé par différents promoteurs de gènes et d'autres mécanismes au sein de la cellule et représentant, au total, près de 8 000 combinaisons potentielles de voies biologiques. Les chercheurs danois ont ensuite obtenu des données expérimentales sur 250 de ces voies, représentant à peine 3% de toutes les combinaisons possibles, et ces données ont été utilisées pour entraîner l'algorithme. En d'autres termes, l’ART a appris quelle sortie (production d'acides aminés) est associée à quelle entrée (expression génique).

Ensuite, en utilisant l'inférence statistique, l'outil a pu extrapoler comment chacune des 7 000 combinaisons restantes affecterait la production de tryptophane. La conception qu'il a finalement recommandée a augmenté la production de tryptophane de 106% par rapport à la souche de référence de pointe et de 17% par rapport aux meilleures conceptions utilisées pour la formation du modèle.

«Il s'agit d'une démonstration claire que la bio-ingénierie menée par l'apprentissage automatique est faisable et perturbatrice si elle est évolutive. Nous l'avons fait pour cinq gènes, mais nous pensons que cela pourrait être fait pour le génome complet », a déclaré Garcia Martin, membre de l'Agile BioFoundry et également directeur de l'équipe de modélisation métabolique quantitative au Joint BioEnergy Institute (JBEI) , un centre de recherche sur la bioénergie du ministère de l’énergie des Etats-Unis; tous deux ont soutenu une partie de ce travail. "Ce n'est que le début. Avec cela, nous avons montré qu'il existe une autre façon de faire de l'ingénierie métabolique. Les algorithmes peuvent automatiquement effectuer les parties de routine de la recherche pendant que vous consacrez votre temps aux parties les plus créatives de l'entreprise scientifique: décider des questions importantes, concevoir les expériences et consolider les connaissances obtenues.

Plus de données nécessaires

Les chercheurs se disent surpris du peu de données nécessaires pour obtenir des résultats. Pourtant, pour vraiment réaliser le potentiel de la biologie

Flashmag October 2020 www.flashmag.net