Ingénieur en statistiques pour l’analyse de données épigénétiques temporelles
Contexte
Le fonctionnement et la régulation du génome d'un individu dépend non seulement de sa séquence d'ADN (l'information génétique ) mais également d'autres facteurs plus ou moins transients regroupés sous le terme d'information épigénétique. Il peut s'agir par exemple de l'état de la méthylation de l'ADN ou de modifications des histones.
Les technologies de séquençage longue lecture haut débit offrent aujourd'hui la possibilité d'accéder non seulement à la séquence d'ADN d'un échantillon mais également au statut de méthylation des bases. Elles rendent donc possible d'étudier conjointement les effets génétiques et certains effets épigénétiques sur le fonctionnement du génome et le déterminisme des caractères.
Dans le cadre du projet Européen Geronimo, visant entre autre à intégrer l’information épigénétique aux schémas de sélection chez les monogastriques (porcs et volaille), nous étudions l'évolution du génome d'une population de porc en sélection dans le but d'identifier les modifications génétiques et épigénétiques induites par le processus de sélection. Pour ce faire, l'équipe dispose de données provenant de séquençage longue lecture, produit par la technologie Oxford Nanopore, en mélange sur plusieurs générations nous donnant accès aux données temporelles des fréquences alléliques et du taux de méthylation des CpG pour l'intégralité du génome porcin. Si nous diposons de modèles permettant d'interpréter les évolutions génétiques temporelles (Paris et al. 2019), nous manquons de ce type de modèles pour les évolutions épigénétiques.