Traduire les données génomiques en information pertinente pour les biologistes : la prédiction des gènes et l'annotation de séquences du génome complet de l'arabette
Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Résumé du colloque
Le choix de l'arabette (Arabidopsis thaliana) comme espèce modèle pour l'étude de la structure et de l'expression des génomes végétaux il y a près de dix ans, justifié entre autres par la petite taille de son génome (140 Mb) a conduit à une énorme accumulation de données, structurales d'abord (cartes et séquences), fonctionnelles ensuite (mutants d'insertions, données d'expression relatives au transcriptome et au protéome). Le défi de la bioinformatique n'est pas tant de gérer ce flux de données génomiques que d'en extraire le maximum d'information biologique pertinente pour l'organisme modèle et utile pour d'autres espèces, en particulier les plantes cultivées, de guider et assister l'expérimentation et de bâtir un corpus intégré des connaissances. L'annotation de la séquence génomique est une étape de ce processus. La séquence complète du génome de l'arabette produite par les six consortiums publics (USA :3, EU :2, Japon :1) est attendue pour cette année 2000. Cependant en disposer est d'une utilité limitée si on n'est pas en mesure de localiser sur la séquence chacun des +/-25000 gènes attendus - et chacun de leurs éléments, exons et introns notamment - et d'attribuer à chacun les informations fonctionnelles les plus pertinentes. L'annotation actuelle des contigs de l'arabette est très médiocre (1) et non cohérente (2). Après avoir participé au développement des outils de prédictions de sites d'épissage NetPlantGene (3) et NetGene2 (4), notre équipe contribue au développement d'Eugène, un logiciel intégré de recherche de gènes, et d'une plate-forme de gestion de tâches pour l'annotation. Pour ce faire nous avons évalué la performance des programmes existants avec un jeu d'essai réaliste, et montré leur complémentarité (6). Nous avons aussi démontré que les gènes de l'arabette se groupaient en deux classes selon l'usage des codons, classes qui recouvrent une réalité biologique, et que la prédiction des gènes pouvait être améliorée en utilisant cette observation (7). Nous participons maintenant à la ré-annotation effective du génome de l'arabette selon une approche qui sera décrite.
Vous devez être connecté pour ajouter un élément à vos favoris.
Veuillez vous connecter ou créer un compte pour continuer.
Outils de citation
Citer cet article :
MLA
APA
Chicago
Ajouter un dossier
Vous pouvez ajouter vos contenus préférés à des dossiers organisés. Une fois le dossier créé,
vous pouvez ajouter un article ou un contenu de la liste ou de la vue détaillée au dossier sélectionné dans la liste.