Fiche de proposition de stage - Master Bioinformatique biologie

Université Paris 7 - Denis Diderot
UFR de Biochimie
UFR de Biologie et
Sciences de la Nature
UFR d'Informatique
MASTER « SCIENCES ET APPLICATIONS »
MENTION BIOLOGIE - INFORMATIQUE
M2 - 2ème Année - Année 2008/2009
Fiche de proposition de stage
NOM :
COGNET
Prénom :
Jean
Adresse Professionnelle :
HDR :
UMR 7033 BioMoCeTi CNRS UPMC
GENOPOLE Campus 1
5 rue Henri Desbruères
91030 EVRY cedex
oui
Ecole doctorale de rattachement :
Inter///Bio ED 387
Appartenance Unité, nom et code:
UMR 7033 BioMoCeTi CNRS UPMC
Tel:
01 69 87 43 53
Fax:
01 69 87 43 60
Courriel: jean.cognet@upmc.fr
Spécialité du stage : Bioinformatique, Génome et Transcriptome (BGT)
Structure et dynamique des systèmes macromoléculaires (SDSM)
Informatique et Modélisation en Biologie Intégrative (IMI)
(ex Ingénierie Logicielle en Biologie (ILB))
Titre du stage: Développement d’une nouvelle approche de modélisation moléculaire
Ce sujet constitue-t-il un premier pas vers un travail de thèse : Oui
Description du sujet:
L’objectif général de la modélisation moléculaire est de se doter des outils nécessaires pour
déformer et calculer les conformations des molécules. Jusqu’à présent la plupart des programmes de
modélisation des biomolécules s’appuient sur des espaces de conformation cartésiens (xi, yi, zi) ou des
espaces de coordonnées internes (angles de torsion). Pourtant la représentation qui s’est imposée en
pratique pour les biologistes est la visualisation des protéines et des acides nucléiques sous forme de
rubans. Elle reflète naturellement la topologie du squelette peptidique (protéines) ou sucre-phosphate
(acides nucléiques), et donc l’architecture des liaisons les plus fortes (covalentes). Les développements
les plus récents en modélisation moléculaire : « gros grains », calculs sur réseau, analyses statistiques de
la PDB, …etc…, ainsi que nos propres résultats, démontrent et quantifient effectivement l’importance
centrale du squelette macromoléculaire.
Nous développons au laboratoire une approche de modélisation moléculaire des macromolécules
biologiques à la fois d’un point de vue théorique et informatique (ce stage), en même temps que des
applications pour la biologie (voir l’autre stage proposéa). Cette nouvelle approche est appelée BCE pour
« Biopolymer Chain Elasticity ». Elle assimile le squelette de la chaîne polymérique de l'ADN ou de
l’ARN à un fil flexible déformable au moyen de la théorie de l’élasticité.1-4 Elle montre en particulier que
le squelette d’oligonucléotides très divers a des propriétés très structurantes à une échelle intermédiaire
(« mésoscopique ») pour les conformations de molécules en épingles à cheveux. Elle est la première
méthode ab initio qui rend compte de la déformation globale de structures biomoléculaires complexes
tout en conservant une description à l’échelle atomique.2-3 Plus récemment, nous avons montré qu’elle
permettait de prédire les conformations tridimensionnelles complètes de tri-boucles d’ADN en épingles à
cheveux à l’échelle atomique.b Les structures en épingles à cheveux sont les motifs structuraux les plus
importants dans l’ADN et l’ARN (et protéines) après les motifs en hélice aussi bien sur le plan de la
structure que de la reconnaissance.
Les résultats évoqués ci-dessus indiquent que la description moléculaire en termes d’un fil mathématique
(courbe 1D dans un espace 3D) est particulièrement pertinente pour les macromolécules biologiques.
Avec BCE, il est ainsi possible de modéliser de nouvelles classes de déformation des macromolécules
d’acides nucléiques difficilement accessibles jusqu’à maintenant.
Le but de ce projet est de développer une approche et un programme pour opérer ces nouvelles
déformations tout en respectant les spécificités des acides nucléiques. Dans un premier temps, il s’agit
donc d’une approche géométrique assez générale utilisant BCE et comportant des paramètres physiques
ou géométriques. Puis, nous étudierons les déformations réellement permises en tenant compte des
contraintes de liaisons hydrogène ou des contraintes stériques. Nous déterminerons ainsi les paramètres
pertinents en confrontant les déformations possibles avec celles qui sont observées expérimentalement
dans la PDB. Une première application des résultats attendus sera de générer des conformations initiales
déformables indispensables à la résolution automatique de structures par RMN ou par cristallographie.
Profil souhaité :
Étudiant(e) intéressé(e) à la fois par le développement, la programmation, les mathématiques et les
structures moléculaires à l’échelle atomique et mésoscopique.
Quelques publications récentes du groupe BioInformatique Structurale :
1. Thèses de Doctorat : Pakleza (2002) & Santini (2005)
2. C. Pakleza, and J. A. H. Cognet (2003) Nucleic Acids Research, 31, 1075-1085.
3. G. P. H. Santini, C. Pakleza, and J. A. H. Cognet (2003) Nucleic Acids Research, 31, 1086-1096.
4. M. Lamoureux, et al. (2006) Spectrochim. Acta part A, 84-94.
5. G. P. H. Santini, et al. (2007) J. Phys. Chem. B, 111, 31, 9400-9409.
a
b
Proposition de stage de M2 : Prédiction des structures 3D d’ADN pour la biologie
soumis pour publication