Campus

Premier biocluster français, Genopole est un incubateur de projets d’excellence dédié aux biotechnologies. Situé à Evry-Courcouronnes, il offre un environnement unique aux chercheurs et aux entrepreneurs qui souhaitent innover et faire avancer la recherche.

Découvrir >

Offres

Que vous soyez chercheur, post-doctorant ou une jeune startup, Genopole vous accompagne à toutes les étapes de votre projet pour vous offrir les meilleures conditions possibles de développement business.

Découvrir >

Genopolitains

Chaque jour à Genopole chercheurs, entrepreneurs et étudiants se croisent, cohabitent et collaborent, pour une véritable émulation au service de l’innovation.

Découvrir >

Temps forts

Donner de l’envergure à la recherche et au travail de notre communauté fait aussi partie de nos missions à Genopole. Retrouvez les dernières avancées scientifiques, les succès des acteurs de la biotechnologie et les événements qui animent notre biocluster.

Découvrir >

Innover à nos côtés

Découvrir >
Success stories

Plateforme EvryRNA, une panoplie d’outils pour accélérer les découvertes sur les ARN non-codants


Plateforme EvryRNA Plateforme EvryRNA

EvryRNA est une plateforme logicielle génopolitaine qui met à disposition de la communauté scientifique des outils pour l’analyse des acides ribonucléiques (ARN) non codants.
Ces molécules ont révélé ces dernières décennies leur rôle majeur dans les mécanismes biologiques et dans diverses maladies dont les cancers.
La plateforme EvryRNA, dirigée par le Pr Fariza TAHI, est hébergée au sein du laboratoire IBISC (Informatique, Bio-informatique et Systèmes Complexes – Université d’Évry Paris-Saclay).
Elle fait partie des 24 plateformes et plateaux techniques mutualisés sur le biocluster Genopole.

L’équipe Bioinformatique des ARN dirigée par Fariza Tahi développe des algorithmes et des méthodes computationnelles dédiés à l’analyse des ARN. Il s’agit là d’identifier les ARN dans les séquences génomiques, de déterminer leur caractère codant ou non-codant, ou encore de prédire leurs conformations dans l’espace, déterminantes pour leur fonction. Les ARN ont en effet la propriété de se replier grâce aux liaisons des acides ribonucléiques qui les constituent.

Les ARN non codants ouvrent un large champ scientifique

Les deux dernières décennies ont été le théâtre de la découverte d’une multitude d’ARN non codants, issus des régions de notre génome qui ne codent pas de protéines et que l’on a longtemps pensé inutiles. Les biologistes connaissaient bien la fonction des ARN ribosomiques et des ARN de transfert pour traduire le message des gènes en protéines. Mais récemment, ils ont révélé le rôle biologique essentiel de nombreux autres ARN (micro-ARN, petits ARN interférents, longs ARN non-codants…). Ces ARN non-codants agissent comme des régulateurs de l’expression des gènes, donc comme des acteurs du développement des organismes, de l’adaptation aux changements environnementaux, etc. Ils interviennent dans les processus biologiques, mais aussi dans les maladies, notamment les cancers et les maladies neuro-dégénératives. Mieux connaître les ARN non-codants pourra notamment contribuer à mieux comprendre ces pathologies, mais aussi à envisager de nouvelles approches thérapeutiques.

Plateforme EvryRNA : Une vingtaine d’outils interactifs, librement accessibles

Pour s’inscrire dans cette dynamique scientifique et répondre aux besoins des biologistes, le laboratoire IBISC a conçu une panoplie d’outils bio-informatiques librement accessibles sur la plateforme EvryRNA. Ils reposent pour les plus récents sur des technologies et approches algorithmiques comme l’optimisation multi-objectif, les cartes auto-organisatrices (SOM pour Self Organizing Map), les réseaux de neurones profonds, …

En plus de la performance, les chercheurs d’IBISC ont cherché à rendre l’utilisation de ces logiciels aisée et interactive.
La plupart présentent ainsi de nombreux atouts :

  • Une interface web intuitive ;
  • Une représentation graphique des résultats facilement interprétable ;
  • La possibilité pour le biologiste utilisateur d’agir sur les paramètres puis réexécuter le modèle pour améliorer sa performance ;
  • La possibilité d’inclure les jeux de données ou les connaissances du biologiste dans le modèle.

Une plateforme labellisée et soutenue par Genopole

Genopole soutient l’activité de la plateforme EvryRNA, profitable notamment à son axe stratégique des thérapies innovantes. Genopole a financé la mise à niveau de l’infrastructure informatique, notamment un serveur de calcul et des baies de stockages, à hauteur de 60 K€.

Les principaux logiciels à disposition sur la plateforme EvryRNA

L’ensemble des ses outils sont ouverts à la communauté scientifique, rendez-vous sur les pages dédiées et vous aurez accès à toutes les informations pour les utiliser.

RANdvisor

RANdvisor permet l’utilisation de manière intégrée et holistique des métriques d’évaluation des prédictions de structures 3D d’ARN.
Différentes métriques existent pour évaluer la qualité de prédiction de structure 3D des ARN, mais aucune n’est suffisante à elle seule, d’où l’intérêt d’en utiliser plusieurs à chaque fois.
👉 Toutes les métriques peuvent se calculer en une simple ligne de commande
📍Accès à l’outil

DivideFold

DivideFold prédit la structure secondaire de longs ARN non-codants. Il découpe grâce à une méthode basée sur l’apprentissage profond la séquence initiale en sous-séquences de plus petites tailles sur lesquelles est réalisée la prédiction de structure secondaire.
👉 DivideFold permet de traiter de longues séquences, un défi pour les outils de la littérature.
👉 La méthode de découpage peut être ré-entraînée sur de nouveaux jeux de données, ce qui est appréciable étant donnée le faible nombre d’ARN longs non-codants connus à ce jour.

📍Accès à l’outil

RCPred

RCPred prédit la structure secondaire de complexes d’ARN formés de plusieurs ARN interagissant entre eux. Il prédit la structure de chacun des ARN puis recherche la conformation qui minimise l’énergie libre du complexe.
👉 RCPred est interactif : l’utilisateur peut intervenir dans les différentes étapes de prédiction, en apportant les informations dont il dispose, choisissant les structures les plus probables, etc.

📍Accès à l’outil

C-RCPred

C-RCPred optimise la prédiction de la structure secondaire de complexes d’ARN en intégrant à RCPred des données de probing (données expérimentales sur l’appariement de certains nucléotides) et des connaissances utilisateurs.
👉 L’utilisateur peut intégrer au système des connaissances et des contraintes, qui peuvent ainsi guider la prédiction. Il peut par ailleurs apporter des corrections sur la structure et réexécuter C-RCPred avec ses nouvelles contraintes autant de fois qu’il le souhaite.

📍Accès à l’outil
🗞 Actualité sur C-RCPred

IRSOM

IRSOM distingue dans un ensemble d’ARN les ARN non-codants des ARN codant pour la synthèse d’une protéine.
👉 Sa particularité est de rejeter les séquences ambiguës. L’algorithme repose sur les cartes auto-organisatrices (SOM). Cette classe de réseaux de neurones propose avantageusement à l’utilisateur une visualisation des résultats sous forme de cartes.

📍Accès à l’outil

IRSOM2

IRSOM2 exploite la propriété d’IRSOM de rejet des cas ambigus pour aider à l’identification des ARN bi-fonctionnels, c’est-à-dire cumulant une activité biologique propre non codante et la capacité à être traduits en protéines fonctionnelles.
👉 L’outil offre aux biologistes l’option de réentraîner en autonomie le modèle sur leurs jeux de données, de manière à générer leur propre modèle, un atout utile compte tenu des connaissances encore parcellaires de cette nouvelle classe d’ARN.

📍Accès à l’outil
🗞 Actualité sur IRSOM2

RNANet

RNANet est un pipeline permettant de générer un dataset intégré avec des données sur les ARN, allant de la séquence à la structure 3D, en passant par les familles et les structures secondaires, ainsi qu’un grand nombre de statistiques.
👉 Dataset idéal pour les méthodes d’apprentissage sur les ARN.
👉 Le dataset est mis à jour mensuellement.

📍Accès à l’outil
🗞 Actualité sur RNANet

Biorseo

Biorseo () prédit les structures secondaires (structure 2D révélant les repliements et les liaisons dans la molécule) des ARN en intégrant des motifs 3D.
👉 Permet de prédire efficacement les structures des ARN, incluant différents motifs, dont les pseudonoeuds (repliements caractéristiques des ARN).

📍Accès à l’outil

BioKoP

BioKoP ( ) prédit les structures secondaires des ARN en incluant les pseudonoeuds (repliements caractéristiques des ARN).
👉 Sa particularité est de combiner deux modèles de prédiction et de proposer ainsi un ensemble de solutions optimales. Cette fonctionnalité augmente la probabilité de générer une structure la plus proche possible de la structure réelle.

📍Accès à l’outil

miRNAFold

miRNAFold () recherche des précurseurs de microARN (pré-miARN) à grande échelle dans les génomes.
👉 Serveur web convivial facile à utiliser par les biologistes.
👉 Peut traiter des chromosomes entiers.

📍Accès à l’outil

miRBoost

miRBoost permet de classifier des candidats pré-miARN en vrais et faux pré-miARN, grâce à une méthode de machine learning (SVM).
👉 Il est possible de ré-entraîner le modèle sur de nouvelles données.

📍Accès à l’outil

IpiRId

IpiRId prédit les piARN (piwi ARN) grâce à une approche holistique, combinant un grand nombre de fonctionnalités dans une méthode de machine learning.
La méthode utilisée est le Multiple Kernel Learning, permettant de définir un noyau (kernel) par type de fonctionnalités (feature), aboutissant à une méthode adaptable et extensible selon les données dont l’utilisateur dispose.
👉 Serveur web permettant à l’utilisateur de choisir les données qu’il souhaite considérer.
👉 Possibilité à l’utilisateur de ré-entraîner le modèle.

📍Accès à l’outil

L'offre plateformes : une spécificité génopolitaine


Genopole met à la disposition des laboratoires et entreprises du biocluster 24 plateformes technologiques et plateaux techniques mutualisés.
L’objectif est de leur apporter des solutions concrètes dans l’ensemble des champs de recherche associés aux biotechnologies : biologie cellulaire et imagerie, biologie moléculaire, biologie structurale, bioproduction, ressources biologiques, exploration fonctionnelle, bio-informatique, robotisation et automatisation.

Équipées de plus de 650 appareils mutualisés, dont des équipements de très haute technologie, les plateformes de Genopole sont un facteur clé de succès pour les laboratoires académiques qui participent à de nouvelles découvertes comme pour les entreprises biotech qui confirment le potentiel de leur innovation.

@: Julien.Picot@genopole.fr

Partager
Avec le soutien de
Région île de France