Workshop 'Traitement intensif de données et Sciences de la Vie'
Amphithéâtre
CC-IN2P3
-
-
Accueil Amphithéâtre
Amphithéâtre
CC-IN2P3
-
Calcul intensif en génomique comparative Amphithéâtre
Amphithéâtre
CC-IN2P3
La biologie moderne a été révolutionnée par les progrès du séquençage de l'ADN. L'interprétation de l'information génétique contenue dans les génomes repose en grande partie sur l'analyse de l'évolution de leur séquence, par comparaison de différentes espèces (génomique comparative). Les calculs nécessaires à la génomique comparative (recherche de similarité de séquences, alignement de séquences, calcul d'arbres phylogénétiques, calcul des taux d'évolution) sont pour la plupart proportionnels au carré du volume de données à traiter. Du fait de l'immense quantité de données déjà disponible et de la vitesse d'accumulation de nouvelles données (le nombre de séquences publiées double tous les 18 mois), la génomique comparative nécessite désormais des ressources informatiques très importantes. Nous ferons le bilan de notre expérience de l'utilisation du centre de calcul de l'IN2P3 (depuis 2002) pour l'analyse comparative de génomes.
-
Projets Embryomics et BioEmergences Amphithéâtre
Amphithéâtre
CC-IN2P3
Reconstruction multi échelles des processus de la morphogenèse animale
Notre problématique est de suivre in vivo aux résolutions spatio-temporelles adéquates, les mouvements cellulaires, les patterns d’expression génétique, les flux ioniques voire même à terme les mouvements moléculaires dans un embryon en cours de développement. Les stratégies d’imagerie 4-D que nous avons choisies répondent aux exigences des mathématiciens et informaticiens qui réalisent le traitement d’image nécessaire à la reconstruction des données. De manière ultime, nous espérons que les données acquises et reconstruites sont à même de nous permettre d’accéder aux dynamiques spatio-temporelles des processus biologiques. Nous avons tout d’abord fait le choix d’observer les mouvements cellulaires et d’automatiser la reconstruction du lignage cellulaire à partir d’embryons dont toutes les cellules sont marquées par l’expression de protéines fluorescentes (deux couleurs distinctes pour les membranes et les noyaux). Nos modèles animaux ont été choisis pour la transparence de leurs tissus, leur accessibilité et aussi leur position phylogénétiques. Il s’agit de Danio rerio (zebrafish), Phallusia mammillata (ascidie) et Paracentrotus lividus (oursin). La possibilité de travailler avec un embryon virtuel reconstruit à partir des données nous permet de mesurer un grand nombre de paramètres caractéristiques de la cellule et de ses comportements in vivo (forme et déformations, volume, mobilité…). Ces mesures nous permettent une nouvelle approche de la morphogenèse. Il s’agit ensuite d’appréhender la dynamique des réseaux d’interaction moléculaires et génétiques dans le contexte des cellules qui prolifèrent et se déplacent. Finalement, ces mêmes fondements conceptuels et expérimentaux devraient nous permettre de travailler aux différentes échelles du vivant, de la molécule unique à l’organisme vivant. Ces stratégies développées dans les projets européens Embryomics et BioEmergences et dans le projet ANR BioSys Morphoscale ous conduisent à produire et manipuler de grandes quantités de données (images brutes, traitées et reconstruites)*. En outre les stratégies de reconstruction à partir des données exigent une importante puissance de calcul. Notre partenariat avec l’IN2P3 nous permet de résoudre ces questions.
- A titre d’exemple : nous travaillons avec deux microscopes MSLM (multiphoton laser scanning qui produisent actuellement 2Go toutes les 40 minutes, nous commençons à travailler avec un SPIM (selective plane illumination microscope) qui produit 80 Go toutes les 40 minutes et mettons actuellement au point avec nos collègues de l’IN2P3 (Collaboration Rémi Barbier) une détection par EB CMOS qui produira 100 fois plus de données durant le même temps.
-
LyNDA - une plateforme d’imagerie mutualisée pour le traitement et le stockage de données en neurosciences Amphithéâtre
Amphithéâtre
CC-IN2P3
-
Déjeuner Amphithéâtre
Amphithéâtre
CC-IN2P3
-
Comparaison à haut débit de sites actifs de protéines d'intérêt thérapeutique Amphithéâtre
Amphithéâtre
CC-IN2P3
Autant de nombreux descripteurs physicochimiques et diverses métriques permettent de mesurer une similarité (distance) entre molécules de faible poids moléculaires, autant la comparaison tridimensionnelle de macromolécules reste un domaine de recherches peu exploré. Il est pourtant crucial de pouvoir comparer des protéines entre elles, et notamment leurs sites de liaisons à des candidats médicaments. En effet, de nombreuses approches chémogénomiques sont en ce moment développées afin de prédire à grande échelle les ligands possibles de multiples protéines et de prévoir ainsi leurs profils biologiques. On peut considérer que deux protéines présentant des sites de liaisons similaires ont de fortes chances de reconnaître les mêmes ligands. Il devient ainsi possible de prévoir les ligands d'une protéine nouvelle par simple calcul de distance avec des sites de liaisons de protéines pour lesquels des ligands sont connus. Nous avons développé un nouvel algorithme [1] permettant l'alignement structural et la comparaison quantitative de ces sites de liaisons. Un site de liaison putatif est transformé en un vecteur de 640 réels par projection de 8 propriétés physicochimiques des acides aminés délimitant le site de liaison sur une sphère discrétisée en 80 triangles et placée au centre du site. Notre approche permet un alignement structural rapide et une comparaison quantitative de sites différents par mesure d'une distance normalisée (allant de 0 à 1) entre chacun des 8 descripteurs sur les 80 triangles représentatifs. Nous avons pu ainsi définir une valeur seuil de similarité à partir de laquelle deux sites actifs peuvent être considérés comme similaires. Diverses applications de cette méthode seront présentées: annotation fonctionnelle de protéines, comparaison de sites de liaisons à l'ATP, prédiction de cibles secondaires pour des médicaments connus.
-
Les grilles pour l'étude des maladies émergentes et négligées: résultats et perspectives Amphithéâtre
Amphithéâtre
CC-IN2P3
Les infrastructures de grille sont utilisées aujourd'hui pour le criblage virtuel à très grande échelle. Les résultats obtenus sur des cibles biologiques de la malaria et la grippe aviaire confirment la pertinence de l'approche. De nouvelles perspectives s'ouvrent maintenant pour l'utilisation des grilles dans la gestion a l'échelle internationale de la connaissance sur ces maladies.
-
Pause Amphithéâtre
Amphithéâtre
CC-IN2P3
-
Table ronde sur le thème "Quelle infrastructure de traitement de données pour la recherche en SDV et en santé ?" Amphithéâtre
Amphithéâtre
CC-IN2P3
Animée par Laurent DURET (du Laboratoire Biométrie et Biologie Evolutive, UMR CNRS 5558, Université Lyon 1).
-
Visite de la salle informatique du CC-IN2P3 Salle informatique
Salle informatique
CC-IN2P3
-