swissherdbook bulletin 3-2013-f
swissherdbook bulletin 3-2013-f
swissherdbook bulletin 3-2013-f
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
ulletin <strong>swissherdbook</strong> I numéro 3/<strong>2013</strong><br />
Sélection génomique<br />
Imputation : 9’000 SNP deviennent 50’000<br />
Franz Seefried, Qualitas<br />
Dès à présent, les animaux sont<br />
génotypés au moyen de la puce LD.<br />
Cette puce ne comporte que 9’000<br />
SNP. Elle est donc plus petite que la<br />
puce 50k utilisée jusqu’à présent. Les<br />
valeurs d’élevage génomiques continuent<br />
toutefois d’être calculées avec<br />
50’000 SNP. Les SNP manquants<br />
dans l’analyse LD sont complétés à<br />
l’aide d’une méthode de calcul nommée<br />
imputation (imputing).<br />
La puce LD permet à l’éleveur de<br />
faire faire une analyse génomique<br />
à un prix avantageux. En jetant un<br />
coup d’œil à l’étranger, on se rend<br />
vite compte que la puce LD y est<br />
déjà routine. Aux USA par exemple,<br />
au mois de janvier <strong>2013</strong>, plus de<br />
7’000 femelles Holstein ont été génotypées.<br />
Néanmoins, les valeurs d’élevage<br />
génomiques sont estimées avec<br />
des données 50k. Il faut donc une<br />
méthode, la dite imputation, pour<br />
compléter les 9’000 SNP de sorte à<br />
en faire une analyse 50k. L’imputation<br />
se sert de deux sources d’information<br />
: l’ascendance et l’ensemble<br />
de la population génotypée.<br />
L’ascendance comme source<br />
d’information<br />
Imaginons la situation suivante : Un<br />
veau a été analysé au moyen de la<br />
puce LD. Le père et la mère ont des<br />
analyses 50k. L’imputation déduit les<br />
SNP manquants du veau à l’aide des<br />
génotypes du père et de la mère.<br />
Admettons que le père et la mère<br />
soient AA. Le veau doit donc également<br />
être AA. Si le père est AA et la<br />
mère BB, la seule possibilité qui en<br />
résulte pour le veau est AB. Dans ces<br />
cas, l’imputation peut se faire avec<br />
une sûreté de 100 %. La situation est<br />
pourtant différente si le père est AA<br />
et la mère AB. Le veau aura un A du<br />
père. La mère a toutefois les deux<br />
variantes, à savoir A et B. Sans informations<br />
supplémentaires, il n’est pas<br />
clair quelle variante elle a transmise<br />
au veau. Sur la seule base de l’ascendance,<br />
il résulte le génotype A pour<br />
le veau (cf. graphique 1).<br />
Même si le père et la mère ont des<br />
analyses 50k, il faut une autre source<br />
d’information pour compléter tous<br />
les SNP manquants du veau. A cela<br />
s’ajoute le fait que jusqu’à présent,<br />
on n’a typé que très peu de vaches.<br />
Par conséquent, la plupart des veaux<br />
n’ont que des ascendants typés mâles<br />
(pères, grands-pères, arrière-grandspères,<br />
etc.). Néanmoins, l’imputation<br />
fonctionne très bien puisqu’on utilise<br />
en plus l’ensemble de la population<br />
génotypée comme source d’information.<br />
La population comme source<br />
d’information<br />
On considère les SNP 50k de tous les<br />
animaux, sans tenir compte de l’ascendance.<br />
On connaît la localisation<br />
des SNP dans le patrimoine héréditaire<br />
et les SNP dépendent l’un de<br />
l’autre. Plus deux SNP sont proches,<br />
plus leur dépendance mutuelle est<br />
grande. Lorsque par exemple deux<br />
SNP sont complètement dépendants<br />
l’un de l’autre, l’un des deux suffit<br />
pour prévoir le génotype sur l’autre<br />
SNP (cf. graphique 2). Pour illustrer,<br />
on met des chaînes sur les SNP 50k,<br />
les dits haplotypes. Ceux-ci contiennent<br />
toutes les combinaisons observées<br />
des SNP voisins suivant la fréquence<br />
de leur présence parmi les<br />
animaux 50k. Etant donné que les<br />
SNP de la puce LD se trouvent aussi<br />
sur la puce 50k, la chaîne SNP fournit<br />
d’autres informations qui permettent<br />
de compléter l’analyse LD à une analyse<br />
50k.<br />
Quelle est la fiabilité de l’imputation<br />
<br />
Bien que l’on ne dispose à ce jour<br />
que d’analyses 50k, la fiabilité de<br />
l’imputation a pu être analysée. A<br />
cet effet, on n’a retenu que les 9’000<br />
SNP de la puce LD des animaux les<br />
plus jeunes avec des génotypes 50k.<br />
Les restants ont été mis à « inconnu<br />
», c’est-à-dire masqués. Avec ce<br />
jeu de données, on a fait l’imputation.<br />
Ensuite, les génotypes imputés<br />
des animaux masqués ont été comparés<br />
avec les génotypes originaux<br />
et l’on a dénombré les conformités<br />
(cf. tableau 1). Avec 97 %, celles-ci<br />
Graphique 1 : L’ascendance comme information de l’imputation<br />
Lorsque le père et la mère sont génotypés moyennant la puce 50k, les SNP manquants du jeune animal<br />
se font partiellement déduire du seul typage du père et de la mère, à l’exception des SNP dont l’un des<br />
parents est hétérozygote (AB). Dans ces cas, le génotype du veau ne se fait pas déduire avec fiabilité<br />
moyennant le seul typage du père et de la mère. L’illustration présente un exemple père/mère avec 5<br />
SNP, dont 2 SNP se trouvent aussi sur la puce LD.<br />
25 I