Modélisation statistique de profils de recombinaison / Statistical modeling of recombination patterns

Job Type: 
Stage Master 2

Français (english version below)

Présentation

La recombinaison est un processus biologique fondamental chez les eucaryotes. Il assure la ségrégation équilibrée des chromosomes parentaux dans les gamètes et conduit à la formation de nouvelles combinaisons alléliques dans les populations.

Le génotypage dense de populations dont les généalogies sont connues permet d'identifier la localisation des évènements de recombinaison. Ces jeux de données fournissent alors l'opportunité de caractériser finement la distribution de la recombinaison le long des chromosomes (profils de recombinaison). De nombreuses études ont ainsi pu mettre en évidence des différences de profils de recombinaison entre sexes ou entre groupes d'individus. Cependant, les méthodes utilisées pour ce faire ne sont pas standardisées et ne tiennent pas suffisamment compte de l'hétérogénéité de l'information disponible entre groupes (taille d'échantillon par exemple) ou le long du génome (détecter des recombinaisons est plus difficile aux extrémités des chromosomes).

L'objectif de ce stage est de développer des modèles statistiques expliquant les données de répartition des recombinaisons le long du génome qui incluent des paramètres permettant de caractériser les différences de profils entre groupes d'observations (sexe, populations, individus ...). Nous chercherons à étendre un modèle Bayésien Poisson-Gamma décrit dans Petit et al. (2017) pour y intégrer différents niveaux de structuration hiérarchique. Ces modèles seront implémentés dans un programme informatique et appliqués sur plusieurs jeux de données publics existants pour leur validation.

Profil Recherché

  • Master 2 en statistiques appliquées avec un intérêt pour la biologie / en génétique avec des compétences en statistiques et programmation
  • Langages de programmation : python / R

English

Synopsis

Recombination is a fundamental biological process in eucaryotes. It ensures proper segregation of chromosomes during gametogenesis and leads to the creation of new allelic combination in populations.

Dense genotyping of populations with known genealogies allows to identify the localization of recombination events. These datasets offer the opportunity to characterize precisely the distribution of recombination along chromosomes (recombination profiles). Many studies have evidenced that different sexes or populations have different recombination profiles. However, statistical methods to do so are not standardized and typically fail to account for the heterogeneity in the amount of information available between groups (different sample sizes for example) or along the genome (detecting recombination events is harder near chromosome extremities).

The aim of this internship is to develop new statistical models of the distribution of recombinations alog the genome. These models will include parameters that characterize differences in recombination profiles between groups of observations (sex, populations, individuals ...). The goal is to extend the Bayesian Gamma-Poisson model described in Petit et al. (2017) to include different hierarchical levels. These models will be implemented in a computer program and applied to various public datasets.

Profile

  • Master 2 in applied statistics with interest in biology / in genetics with skills/interest in statistics and programming
  • Programming languages : python / R

References

Petit M, et al. Variation in Recombination Rate and Its Genetic Determinism in Sheep Populations. Genetics. 2017;207(2):767-784. doi:10.1534/genetics.117.300123

Contact: 

Bertrand Servin

email: 
Bertrand dot Servin at inra dot fr
Phone: 
0561285117