Spécialisé dans l’identification des séquences d’ARN et la détermination de leurs structures, le groupe de bioinfomatique dirigé par Fariza Tahi au sein du laboratoire IBISC (Université d’Evry Paris-Saclay) vient de franchir une nouvelle étape : les chercheurs ont créé le modèle C-RCPred qui prédit l’organisation spatiale de complexes formés de plusieurs ARN, aux fonctions importantes dans la cellule.
C-RCPred est le premier algorithme qui intègre des données biochimiques de liaison, expérimentales ou prédites, ainsi que les connaissances ponctuelles acquises sur le complexe par le biologiste utilisateur.
L’outil est librement accessible à la communauté scientifique sur la plateforme logicielle génopolitaine EvryRNA.
Dans la cellule, certains ARN ont la propriété de s’apparier pour produire des structures aux rôles biologiques majeurs. C’est par exemple le cas des ribosomes, ces complexes d’ARN et de protéines qui participent à la traduction du message génétique en synthèse protéique, et donc au bon fonctionnement de la machinerie cellulaire.
D’autres assemblages formés uniquement d’ARN agissent comme des catalyseurs de réactions dans la cellule. Dans tous les cas, la conformation dans l’espace de ces complexes d’ARN est déterminante pour leur fonction biologique.
L’équipe Bioinformatique des ARN du laboratoire génopolitain IBISC (Université d’Evry Paris-Saclay) a conçu l’outil « C-RCPred » qui permet aux biologistes de prédire la structure secondaire de ces complexes d’ARN, c’est-à-dire les repliements et liaisons entre nucléotides en 2 dimensions, ainsi que les « pseudonoeuds » , repliements 3D caractéristiques des ARN. La méthode développée est dite « multi-objectif ».
Elle repose sur l’algorithme RCPred conçu par l’équipe en 2019 mais optimise la prédiction de la structure en ajoutant à l’objectif initial d’une énergie libre de liaison minimale (donc d’une affinité maximale des éléments du complexe), d’une part, les données de probabilité d’appariement des nucléotides constituant les ARN, obtenues par expérimentation ou prédiction, et d’autre part, les connaissances issues de l’expertise du biologiste (appariements en des sites précis, motifs chimiques particuliers, conformations spatiales de certaines parties du complexe…). Il existe actuellement très peu d’outils de prédiction de complexes formés de plus de 2 ARN et C-RCPred est le premier intégrant ces connaissances.
A cette spécificité unique de l’outil, s’ajoutent deux atouts majeurs :
- La visualisation des structures prédites grâce à une interface graphique dynamique.
- La possibilité pour le biologiste d’apporter des corrections sur la structure et de réexécuter C-RCPred avec ces nouvelles contraintes, autant de fois qu’il le souhaite.
Performance démontrée de C-RCPred pour la structure de complexes d’ARN
Les chercheurs d’IBISC ont démontré la performance de l’outil multi-objectif C-RCPred en l’appliquant à la prédiction de la structure secondaire d’un assemblage de 5 ARN indispensables à la réplication du bactériophage φ29, « PDB1FOQ ». Sa structure est bien caractérisée (structure A sur la figure ci-dessous).
A la différence des autres outils de prédiction disponibles, et sans apporter au modèle les connaissances des biologistes, C-RCPred (prédiction B sur la figure) est parvenu à déterminer avec précision cette structure complexe de grande longueur (597 nucléotides au total). L’outil RCPred (prédiction C sur la figure) précédemment développé par l’équipe a réussi à prédire correctement une branche de la structure, tandis que les autres outils de la littérature aboutissent à des conformations très différentes de la réalité.