Campus

Premier biocluster français, Genopole est un incubateur de projets d’excellence dédié aux biotechnologies. Situé à Evry-Courcouronnes, il offre un environnement unique aux chercheurs et aux entrepreneurs qui souhaitent innover et faire avancer la recherche.

Découvrir >

Offres

Que vous soyez chercheur, post-doctorant ou une jeune startup, Genopole vous accompagne à toutes les étapes de votre projet pour vous offrir les meilleures conditions possibles de développement business.

Découvrir >

Genopolitains

Chaque jour à Genopole chercheurs, entrepreneurs et étudiants se croisent, cohabitent et collaborent, pour une véritable émulation au service de l’innovation.

Découvrir >

Temps forts

Donner de l’envergure à la recherche et au travail de notre communauté fait aussi partie de nos missions à Genopole. Retrouvez les dernières avancées scientifiques, les succès des acteurs de la biotechnologie et les événements qui animent notre biocluster.

Découvrir >

Innover à nos côtés

Découvrir >
    Temps forts

    Entraîner l’IA pour la génomique : le premier jeu de données standardisé


    Le laboratoire IBISC a construit le premier jeu de données standardisé sur des structures d’ARN non codants*. L’objectif est de fournir aux chercheurs en apprentissage automatique, une des branches de l’intelligence artificielle, les moyens d’entraîner leurs modèles et d’accélérer les recherches dans ce domaine d’intérêt majeur.
    En savoir plus >
    IBISC : Entraîner l’IA pour la génomique IBISC : Entraîner l’IA pour la génomique

    L’apprentissage automatique ou machine learning, est une méthode d’intelligence artificielle qui consiste à créer des modèles mathématiques capables d’améliorer leurs performances en « s’entraînant » sur des données, en « apprenant » progressivement et en ajustant le modèle en fonction des réponses. L’approche démontre son potentiel en sciences du vivant, notamment pour l’exploitation des données massives et complexes issues du séquençage des génomes et autres données moléculaires.

    La recherche appliquée en apprentissage automatique progresse donc plus rapidement lorsqu’un jeu de données exploitables est disponible et prêt à l’emploi.

    De nombreux jeux de données standardisés ont été construits au cours du temps, pour la classification d’images, la reconnaissance vocale, et plus récemment pour la prédiction de structure des protéines. En revanche pour la prédiction in silico de structures d’ARN, les données sont dispersées entre différentes bases de données publiques, selon l’échelle d’intérêt : séquence, structure secondaire, ou structure tridimensionnelle.

    Pour accélérer les progrès en apprentissage dans ce domaine, il était nécessaire de construire un jeu de données intégrant toutes sortes d’informations et d’annotations à différentes échelles, pour éviter ce travail aux chercheurs en IA. L’équipe AROB@S (Algorithmique, Recherche Opérationnelle, Bioinformatique et Apprentissage Statistique) du laboratoire IBISC propose le premier jeu de données standardisé de structures d’ARN non codants, construit automatiquement à partir des données publiques. Il combine des séquences d’ARN, des informations d’homologie entre séquences (alignements, fréquences des mutations, appartenance à une famille de molécules), et des informations disponibles sur les structures 3D (contacts entre nucléotides distants, descripteurs géométriques de la chaîne de nucléotides).

    Le jeu de données est utilisable dans différentes applications bioinformatiques d’apprentissage et de « data mining », comme l’entraînement de modèles statistiques pour prédire les structures des ARN non codants, les interactions avec d’autres macromolécules, la classification en familles d’ARN, ou la construction de bibliothèque de motifs structuraux.

    Le jeu de données est automatiquement mis à jour une fois par mois sous une forme directement exploitable par la communauté scientifique, sur le site de la plateforme EvryRNA** : https://evryrna.ibisc.univ-evry.fr/evryrna/rnanet.

    Ces travaux de recherche participent à la construction de la filière de Génomique numérique à Genopole.

    • Les ARN non codants

      Les deux dernières décennies ont été le théâtre de la découverte d’une multitude de petits ARN non codants. On connaissait la fonction des ARN ribosomiques et ARN de transfert pour traduire le message des gènes en protéines. Mais aujourd’hui, les biologistes dévoilent de nombreux autres ARN et démontrent progressivement leur rôle biologique. Ils proviennent par exemple de la transcription de la grande part non codante des génomes. Les ARN non codants agissent comme des régulateurs de l’expression des gènes, donc comme des acteurs de l’adaptation aux changements environnementaux, du développement des organismes…

      Si les fonctions biologiques de micro ARN (miARN) ou de petits ARN interférents (siARN) sont connues, de nouvelles classes d’ARN non codants restent à découvrir. Le domaine est en pleine évolution. Pour tenir compte de cette dynamique scientifique et répondre aux besoins des biologistes, le laboratoire IBISC mène des recherches et développent des outils bio-informatiques d’analyse, d’identification, de classification, de prédiction de structures secondaires et de structures tridimensionnelles et de leurs interactions de ces ARN non codants.

    • Les outils développés par IBISC

      Les outils bio-informatiques conçus par le laboratoire IBISC pour l’étude des ARN non codants sont mis à disposition de la communauté scientifique sur la plateforme logicielle de bioinformatique EvryRNA.
      EvryRNA, dirigée par Fariza Tahi, est l’une des 26 plateformes mutualisées du biocluster Genopole.

      Retrouvez le jeu de données sur le site de la plateforme EvryRNA :  https://evryrna.ibisc.univ-evry.fr/evryrna/rnanet.

    Références

    RNANet: an automatically built dual-source dataset integrating homologous sequences and RNA structures.

    Article posté le 12 juillet 2021

    Partager
    Temps forts

    Les dernières actualités


    Cellule musculaire dotée de la mutation L1341P montrant la relocalisation de la dyspherine (en vert) dans la cellule ©I-Stem & Généthon

    I-Stem & Généthon : approche thérapeutique pour la LGMDR2

    Le laboratoire Ibisc a conçu un système de débriefing immersif et démontré son efficacité pour optimiser cette phase clé des formations en réalité virtuelle.

    Découvrir
    Genopole Research Day 2025 - 13 février

    Genopole Research Day pour dynamiser la recherche

    Genopole organise le Research Day pour valoriser les projets scientifiques et renforcer les synergies entre recherche académique et industrielle, avec des innovations en biotechnologie et des collaborations prometteuses.

    Découvrir
    Bioket 2025 - Du 11 au 13 mars 2025 - Conférence dédié à la bioéconomie

    Genopole, acteur clé de la bioéconomie à Bioket 2025

    Genopole, partenaire Platinium de Bioket 2025, renforce son rôle dans la bioéconomie et présente les innovations en agriculture cellulaire et les synergies entre recherche et industrie pour le développement de solutions durables.

    Découvrir
    Voir tout >
    Avec le soutien de
    Région île de France
    Ministère de l'Enseignement supérieur et de la recherche AFM-Téléthon
    Communauté d'agglomération Grand Paris Sud
    Département de l'Essonne - Terre d'avenirs
    Ville d'Evry-Courcouronnes 2023
    CEA
    Inserm