Utilisation de séquençage haut débit pour la détection de traces de sélection dans des lignées divergentes de caille et de lapin

Job Type: 
Stage Master 2

Contexte :
La sélection de lignées divergentes pendant plusieurs générations permet d'obtenir des populations très différentes phénotypiquement pour le caractère sélectionné. Ces lignées constituent un outil de choix dans l'analyse du déterminisme génétique du caractère étudié : après un grand nombre de générations de sélection, les régions du génome gouvernant la variabilité du caractère sélectionné sont très différentes entre les deux populations, voire fixées pour des allèles alternatifs. La détection de ces "traces de sélection" permet d'accéder à une liste de gènes candidats, potentiellement impliqués dans la variabilité du caractère d'intérêt.
Des lignées de cailles (Coturnix Japonica) sélectionnées à l’unité expérimentale INRA de Tours permettent l'étude de caractères comportementaux révélateurs de la capacité d’adaptation des animaux aux conditions d’élevage à travers leur sensibilité au stress, sujet qui entre dans le débat très sensible aujourd’hui du bien-être animal et de l’acceptabilité sociale de la sélection. La sensibilité à la peur et la motivation sociale sont des caractères complexes qui dépendent de nombreux facteurs et dont le contrôle génétique reste encore assez mal connu. Nous disposons de 2 populations de cailles, chacune constituée de 2 lignées sélectionnées de façon divergente depuis plus de 30 générations sur l'un des caractères étudiés : la durée d’immobilité tonique (temps pendant lequel l'animal - maintenu sur le dos quelques secondes pour induire le comportement catatonique - reste immobile), qui mesure la sensibilité à une peur intense, et la motivation sociale (distance parcourue par un animal sur un tapis roulant pour rejoindre ses congénères). En complément d'analyses QTL (Quantitative Trait Loci) déjà réalisées sur des croisements issus de ces lignées, nous avons obtenu les séquences de 10 individus de chaque lignée, en mélange.
De manière similaire, nous disposerons pendant le stage de données de séquençage haut-débit en mélange de lignées de lapin sélectionnées. Contrairement aux dispositifs précédents, une seule lignée (et non deux lignées divergentes) est sélectionnée sur un caractère d’intérêt. L’identification de traces de sélection sera alors réalisée par comparaison des fréquences alléliques entre des échantillons collectés à la génération d’origine (G0) et à l’issue de n générations de sélection (Gn). Cette analyse sera menée pour deux lignées indépendantes : la lignée 1777 (G0 vs G16) est une lignée sélectionnée sur la prolificité et la croissance des jeunes lapereaux ; le progrès réalisé au cours de ces 16 générations est de 0,2 lapereau par portée et une augmentation de 20g du poids des jeunes lapereaux au moment du sevrage. La lignée 1001 a quant à elle été sélectionnée depuis 12 générations sur l’efficacité alimentaire dans l’objectif de sélectionner des animaux prédisposés à mieux transformer l’aliment consommé.

Objectif du stage
L'objectif de ce projet est d'identifier des traces de sélection dans les différentes lignées divergentes qui ont été séquencées. Chez la caille, ces régions candidates seront comparées aux régions QTL préalablement mises en évidence, pour identifier des gènes candidats gouvernant la variabilité de caractères de comportement ou de production. Chez le lapin, outre l'intérêt de disposer d'un set de marqueurs informatifs dans nos populations d'étude, les traces de sélection détectées devraient donner des pistes pour comprendre le déterminisme génétique des caractères étudiés.

Déroulement/méthodologies
Les séquences de chacune des lignées seront alignées sur les génomes de référence correspondants. Une recherche de SNP (Single Nucleotide Polymorphism) sera réalisée, et les fréquences alléliques calculées au sein de chaque lignée. Ces données permettront de détecter les régions à fréquences significativement différentes entre les lignées, et d'identifier les traces de sélection correspondantes.
Les outils utilisés sont des pipe-lines d'analyse de données haut-débit classiques ; les traces de sélection seront analysées par un algorithme adapté aux données de séquençage en mélange, développé au laboratoire.

Compétences acquises durant le stage
- Analyse de données de séquençage haut-débit
- Utilisation, et développement si nécessaire, de scripts bioinformatiques pour le traitement de gros fichiers de données
- Détection de traces de sélection
- Utilisation de bases de données génomiques pour l'identification de gènes candidats

Contact: 

Frédérique Pitel

email: 
Frédérique dot Pitel at inra dot fr
Phone: 
0561285435