En naviguant sur notre site vous acceptez l'installation et l'utilisation des cookies sur votre ordinateur. En savoir +

Menu Logo Principal réseau MiDi logo Région Centre-Val de Loire

RTR MIDI

Traitement informatique de larges données en biologie

6 et 7 juillet 2017 - Tours

données informatique
Ces journées organisées par l'équipe de recherche Biomolécules et Biotechnologies Végétales (BBV), en partenariat avec le réseau MiDi sont l'opportunité d'échanger avec des collègues biologistes et d’autres disciplines sur l’importance et les méthodologies des développements d’analyses bioinformatiques de larges données dans nos stratégies de recherche en biologie. Outre la possibilité de réunir des spécialistes du domaine du territoire, ce sera aussi l’occasion d’avoir une vision éclairée de ce qui se développe dans ce domaine dans les équipes de la Région afin d’organiser à l’avenir des travaux collaboratifs ou de partager des méthodologies efficaces.
logo BBV
6 et 7 juillet 2017 – UFR Sciences et Techniques, bat.E, Université de Tours

 

 Contexte Scientifique

L’avènement des approches -omiques (transcriptomique, génomique, protéomique et métabolomique) a très largement contribué à l’acquisition de connaissances sur les organismes vivants, aussi bien modèles que non modèles. Plus particulièrement, le séquençage haut débit de l’ADN et de l’ARN ont permis de mieux appréhender le fonctionnement de ces organismes. La protéomique et la métabolomiques arrivent également en support de ces nombreuses études. Parallèlement aux larges jeux de données générés par ces technologies, le développement, l’utilisation et la maîtrise d’outils informatiques ont été absolument nécessaires et sont toujours des pré-requis pour leur traitement et leur exploitation. Au-delà de ces sciences omiques, l’informatique et les statistiques sont indispensables pour mener à bien des études phylogénétiques (d’autant plus performantes avec le nombre croissant de séquences génomiques disponibles), des approches de modélisations de processus biologiques ainsi que du traitement d’images.

L’analyse de larges données en biologie impose plusieurs défis : le traitement statistique, la visualisation et l’interprétation. Ceci a entraîné des collaborations fructueuses entre mathématiciens, informaticiens et biologistes, entraînant l’essor de la bioinformatique. Cette discipline a aussi amené des biologistes à diversifier leur activité, afin de réaliser des analyses pour lesquelles ils n’ont pas toujours été formés. Les stratégies pour mener à bien ces études sont nombreuses mais demandent souvent un effort important pour les maîtriser, en plus d’une certaine connaissance des langages de programmation informatique (R, bash, Python ou Perl).

 

Contexte Local

Les équipes de recherche en sciences expérimentales à Tours ont bien évidemment engagé ce virage lié à l’obtention de données en masse. En biologie, la plateforme génomique de la Faculté de Médecine de l’Université de Tours s’est doté de nouveaux équipements capables de séquencer rapidement et à haut débit de l’ADN ou de l’ARN, notamment pour la mise au point de techniques de diagnostics moléculaires de pathologies humaines. Les approches métabolomiques ont également pris de l’ampleur avec l’essor du PST Analyses de Systèmes biologiques. Le développement croissant des ressources informatiques du Centre de Calcul Scientifique en région Centre (CCSC) témoigne également du besoin de cet outil par la communauté scientifique notamment en modélisation. Des équipes de recherche en biologie telles que l’EA2106 et celles localisées à l’IRBI utilisent largement le CCSC pour l’analyse de données transcriptomiques. Le tissu local dispose donc de capacités analytiques, de ressources et d’un savoir-faire réels dans ces approches. Des journées ayant un focus similaire existent (journées CaSciModOT (Calcul Scientifique et Modélisation Orléans-Tours), association Biotechnocentre, RTR MISC) mais restent très généralistes et ne permettent généralement que d’obtenir une vision des thématiques de recherche. Par conséquent, un focus sur les stratégies et méthodes envisageables pour le traitement de ces données biologiques pourrait être utile à la communauté scientifique.

 

Objectif

Ces journées thématiques sont prévues sur 2 1/2 journées (1 après-midi, moment de convivialité le soir, 1 matinée). L’objectif est de fournir un support au dialogue entre différentes disciplines (informatique, statistique et biologie) et de promouvoir des échanges interdisciplinaires sur des aspects méthodologiques, de traitement et de visualisation de données biologiques. Elles seront l’occasion de renforcer une communauté nationale existante sur le web qui permettrait notamment aux biologistes isolés de recevoir un support pour les aider à mener à bien leurs analyses. Ces moments offriront aussi l’opportunité à des équipes désireuses d’initier des recherches impliquant des larges données de recevoir une aide et des conseils sur les stratégies appropriées. De plus l’ouverture de ce colloque à des informaticiens et mathématiciens pourrait permettre d’assurer un fondement robuste sur la validité des analyses conduites pour ces données larges en biologie. Le format volontairement restreint permettra d’organiser les discussions davantage sous forme de réunions de travail. Des formations sur ces aspects vont être proposées au printemps 2017 dans le cadre de la fédération CaSciModOT pour des doctorants et étudiants en master. Les journées thématiques proposées ici pourront donc être un complément et bonne illustration des thématiques de recherches impliquant le traitement de ce type de données. Ces journées thématiques seront également organisées en partenariat avec l’ARC Tours- Poitiers MathBio (Modélisation stochastique et analyse statistique en expression génétique). A la suite de ces journées, une liste de contact sera mise en place et une interface de type Google Group pourrait être créée en tant que plateforme d’échange et de partage de scripts en différents langages de programmation (R, bash, Python ou Perl).

 

 

PROGRAMME

Jeudi 6 Juillet 2017

 

12h00-14h00 - Accueil des participants, déjeuner

14h00-16h00 - SESSION 1: STRATÉGIES OMIQUES (1)

(2 conférenciers invités, 1 doctorant/post-doctorant)

 PAUSE

16h00-18h00 - SESSION 2: OUTILS OMIQUES (GALAXY, CYTOSCAPE)

(sous forme d’atelier dynamique, prévoir l’installation de logiciels sur les ordinateurs personnels)

19h00 - Soirée de Colloque et Dîner

 
Vendredi 7 Juillet 2017

9h00-10h30 - SESSION 3: ANALYSES MULTIVARIÉES

(2 conférenciers invités, 1 doctorant/post-doctorant)

 PAUSE

 10h30-13h00 - SESSION 4: STRATÉGIES OMIQUES (2)

(2 conférenciers invités, 1 doctorant/post-doctorant)

 

13h00-15h00 – Déjeuner et Clôture du Congrès