Des chercheurs du laboratoire IBISC (Informatique, bioinformatique et systèmes complexes, Université d’Evry Paris-Saclay) ont conçu GraphGONet, un algorithme d’intelligence artificielle qui fournit un diagnostic médical accompagné de l’explication biologique.
GraphGONet est un réseau de neurones, dit aussi modèle d’apprentissage profond. Il porte dans les couches cachées de ces neurones virtuels un ensemble d’informations formalisées, hiérarchisées et reliées issues de la connaissance des gènes et de leurs fonctions. Grâce à cette architecture, les chercheurs ont créé un modèle « auto-explicatif » associant prédiction et explication : une nouveauté dans les réseaux de neurones. C’est aussi un outil directement utilisable par les cliniciens, pour une médecine personnalisée !
Alors qu’un nouveau pas vient d’être franchi dans l’exploration du génome humain, la connaissance grandissante des gènes et de leur expression ouvre la voie à une nouvelle médecine, capable d’appréhender les maladies de manière beaucoup plus juste et de proposer des diagnostics précoces, notamment pour les cancers, les maladies cardio-vasculaires, maladies métaboliques… L’intelligence artificielle (IA), et en particulier les méthodes d’apprentissage profond, peuvent grandement contribuer à l’essor de cette médecine de précision.
Diagnostic par l’IA : il faut pouvoir l’expliquer !
Pourtant, en pratique, l’usage de l’IA est limité car la plupart des algorithmes sont des « boîtes noires » dont les décisions ne sont accompagnées d’aucune explication. Or, les chercheurs, les cliniciens et les patients doivent avoir l’assurance que les prédictions reposent bien sur des caractéristiques médicales fiables et non sur des artefacts.
Pour réaliser les prédictions diagnostiques, les informaticiens d’IBISC entrent dans leur réseau de neurones les données d’expression génique des patients, c’est-à-dire les gènes actifs ou non, et leur niveau d’expression. Pour parvenir à interpréter ces prédictions, ils ont cherché à intégrer dans les couches plus profondes les concepts issus du consortium de bio-informatique Gene Ontology. Ce projet a uniformisé les connaissances des gènes et des protéines pour lesquelles ils codent, et les a rattachées aux fonctions réalisées, aux composants cellulaires et aux mécanismes biologiques impliqués. Chaque élément (fonction, mécanisme…), appelé « terme GO », est décrit dans un vocabulaire et des règles standardisées, et codifié.
GraphGONet prédit et interprète biologiquement
Les chercheurs d’IBISC ont ainsi créé GraphGONet, un outil qui fournit aux utilisateurs une prédiction et son interprétation biologique sous la forme d’un ensemble des termes GO les plus impliqués dans la prise de décision, avec leur score de contribution. Le modèle est publié dans la revue Bioinformatics du 10 mars 2022.
« Nous prévoyons d’inclure d’autres ontologies, telles que les voies métaboliques, pour enrichir les explications biologiques et rectifier certaines incertitudes » projette Blaise Hanczar, co-responsable de l’axe IA du laboratoire IBISC.
Directement utilisable par les chercheurs biologistes et par les cliniciens, l’outil peut également contribuer à des découvertes biologiques en mettant en lumière les mécanismes impliqués dans la pathologie.
Les recherches du laboratoire IBISC participent à la construction de la filière de la Génomique numérique à Genopole