Objectifs

Contexte : La protéomique

Comme nous l’avons dit en introduction, l’analyse du protéome nécessite d’avoir recours aux développements les plus récents de la biologie des systèmes, de la spectrométrie, mais aussi de la bio-informatique, de l’apprentissage automatique et de la visualisation de données. En effet, il faut souligner le changement d’ordre de complexité dans l’analyse à effectuer par rapport à ce qui a été nécessaire pour accéder aux génomes. Tout d’abord,  l’ensemble des protéines du vivant est largement plus vaste (facteur × 10^4) que celui des gènes du fait notamment des modifications post-transcriptionnelles et post-traductionnelles et surtout, à la différence du génome qui est plus ou moins stable dans les cellules d'un organisme, le protéome présente une forte variabilité temporelle et spatiale qui fait que son étude doit être envisagée dans une perspective dynamique dans laquelle chaque donnée (protéine) expérimentale ne peut être caractérisée que par un quadruplet : <identité, quantité, localisation, temps>. 

Ainsi, en dépit des progrès considérables accomplis au cours de la dernière décennie dans les méthodes d’analyse « à haut débit » (High Throughput Analysis), la cartographie complète des protéomes doit faire actuellement face à des verrous scientifiques et technologiques majeurs, en particulier : les processus d’analyse bio-informatique, d’apprentissage automatique et de fouille de données, d’accès et de traitement de l’information, de visualisation de masses de données et surtout les processus de confrontation et d’intégration des résultats obtenus en protéomique avec ceux déjà contenus dans les grandes bases de données et de connaissances qui sont collectées par les autres sciences « omiques » telles que la génomique, la transcriptomique et la métabolomique.

De surcroît, la complexité des données d’origine protéomique est telle, que leur gestion automatisée soulève de nouvelles questions fondamentales en informatique : en apprentissage automatique (l’absence de vérité terrain rend difficile l’usage de benchmarks, et les méthodes incrémentales ou semi-supervisées doivent être favorisées), en statistique et traitement du signal (quel modèle ou représentation privilégier ? comment gérer les fortes non-linéarités ?), en étude des réseaux sociaux (prise en compte la multiplicité des relations dans les complexes protéiques), en ingénierie des connaissance (interopérabilité entre les points de vue génomique, protéomique, métabolomique, etc.). Dans ce contexte, la protéomique est à même de proposer une partie des défis qui demain amèneront l’état de l’art de ces champs de l’informatique à évoluer.

Les ateliers Prospectom

Ces ateliers gratuits (édition 2012, édition 2014) qui se déroulent sur plusieurs jours, sont organisés par le projet PROSPECTOM. Ils ont pour objectif l’animation d’une communauté scientifique française élargie à d'autres acteurs venant des domaines de l'apprentissage, de l'analyse des réseaux et de la visualisation autour des enjeux de la « computational proteomics » . Cette émergence ne peut aboutir que par la définition d’un vocabulaire commun, l’acceptation de la différence entre les enjeux propres à chacune des communautés, et la mise place d’un lien fort entre les données à analyser et les connaissances à en tirer, grâce à l’élaboration de modèles formels adaptés aux spécificités de la protéomique. Les  ateliers sont organisés autour des trois axes de recherche complémentaires dans lesquels les participants peuvent soumettre des contributions :

  • Axe 1 : Du spectre à la protéine : caractérisation des données et maîtrise des incertitudes
  • Axe 2 : Analyse de grands réseaux biologiques et intégration des donnée et connaissances « omics »
  • Axe 3 : Visualisation et navigation dans des masses de données dynamiques et multi-échelles

Au sein de chaque axe de recherche, des sessions de travail ont pour objectif de présenter les contributions acceptées mais surtout de faire un bilan des défis que doit relever la protéomique ces prochaines années et d'imaginer comment inciter les chercheurs appartenant aux disciplines mathématiques et informatiques (apprentissage automatique, traitement du signal, statistiques, visualisation, etc.) à se joindre à cet effort.

© Projet PROSPECTOM 2012, 2013, 2014