Nutzung nicht-additiver Geneffekte bei der genomischen Selektion ...
Nutzung nicht-additiver Geneffekte bei der genomischen Selektion ...
Nutzung nicht-additiver Geneffekte bei der genomischen Selektion ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Nutzung</strong> <strong>nicht</strong>-<strong>additiver</strong> <strong>Geneffekte</strong> <strong>bei</strong> <strong>der</strong> <strong>genomischen</strong> <strong>Selektion</strong><br />
Jörn Bennewitz und Robin Wellmann<br />
Institut für Tierhaltung und Tierzüchtung, Universität Hohenheim<br />
Einleitung<br />
In <strong>der</strong> Tierzüchtung wird <strong>der</strong> Phänotyp (P) beeinflusst vom Genotyp (G)<br />
<strong>der</strong> Individuen und von <strong>der</strong> Umwelt (U), P = G + U. Der Genotyp kann<br />
weiter aufgeteilt werden in einen additiven Geneffekt (A), eine<br />
Dominanzabweichung (D) und in eine Interaktionskomponente, die durch<br />
Interaktionen zwischen Genen entsteht (Epistasie, E), G = A + D + E. Die<br />
Variation <strong>der</strong> Phänotypen setzt sich entsprechend zusammen, Var(P) =<br />
Var(G) + Var(U) und Var(G) = Var(A) + Var(D) + Var(E). Die additivgenetische<br />
Varianz, Var(A), ist die wichtigste und auch die größte <strong>der</strong><br />
drei genetischen Varianzkomponenten (Hill et al. 2009). Die statistische<br />
Modellierung <strong>der</strong> <strong>nicht</strong>-additiven <strong>Geneffekte</strong> ist ungleich schwieriger als<br />
die <strong>der</strong> additiven <strong>Geneffekte</strong>. Dies gilt insbeson<strong>der</strong>e für die Epistasie.<br />
Aus diesem Grund werden <strong>bei</strong> <strong>der</strong> Zuchtwertschätzung in <strong>der</strong> Regel nur<br />
die additiven <strong>Geneffekte</strong> modelliert und die Dominanz und Epistasie<br />
fließen in den Restfehler <strong>der</strong> Modelle mit ein. Dies gilt bisher auch für die<br />
Modelle <strong>der</strong> <strong>genomischen</strong> Zuchtwertschätzung.<br />
Dieser Beitrag soll die Perspektiven <strong>der</strong> Berücksichtigung <strong>der</strong> Dominanz<br />
<strong>bei</strong> <strong>der</strong> <strong>genomischen</strong> <strong>Selektion</strong> aufzeigen und die Modelle zur Schätzung<br />
<strong>der</strong> <strong>genomischen</strong> Zuchtwerte und Dominanzabweichungen in gebotener<br />
Kürze skizzieren. Komplexere <strong>nicht</strong>-additive <strong>Geneffekte</strong> (z.B. Epistasie<br />
und/o<strong>der</strong> Genotyp-Umwelt-Interaktionen) werden <strong>nicht</strong> behandelt. Der<br />
Beitrag ist in enger Anlehnung an einen Artikel aufgebaut, den die<br />
Autoren in <strong>der</strong> Son<strong>der</strong>ausgabe <strong>der</strong> Züchtungskunde zur <strong>genomischen</strong><br />
<strong>Selektion</strong> veröffentlicht haben (Züchtunksunde 83, S. 361-370, 2011).<br />
Dominanzabweichungen und genomische <strong>Selektion</strong><br />
Die genomische <strong>Selektion</strong> ermöglichte es den Rin<strong>der</strong>züchtern innerhalb<br />
kurzer Zeit für viele Merkmale Zuchtwerte mit beachtlicher Sicherheit zu<br />
berechnen, die eine frühe <strong>Selektion</strong> <strong>der</strong> Zuchttiere ermöglichen. Für<br />
Merkmale mit geringer Erblichkeit und relativ großer Dominanzvarianz<br />
sind die Sicherheiten allerdings noch deutlich geringer. In bisherigen<br />
Anwendungen wurden ausschließlich additive <strong>Geneffekte</strong> berücksichtigt.<br />
Ein Grund hierfür ist sicherlich, dass häufig als Beobachtungen<br />
konventionell geschätzte Zuchtwerte o<strong>der</strong> Derivate davon genutzt
werden. Zunehmend werden nun auch weibliche Tiere für eine<br />
reduzierte Anzahl an SNP typisiert. Fehlende Genotypen können dann<br />
durch Imuptierungstechniken abgeleitet werden. Dies ermöglicht in<br />
steigendem Maße die Einbeziehung von Kühen in die Lernstichprobe.<br />
Diese Kühe sind dann genotypisiert und auch eigenleistungsgeprüft. Die<br />
Eigenleistungen können als Beobachtungen zur Schätzung <strong>der</strong><br />
Markereffekte genutzt werden und somit ist prinzipiell die<br />
Berücksichtigung von Dominanzeffekten <strong>bei</strong> <strong>der</strong> <strong>genomischen</strong><br />
Zuchtwertschätzung möglich. Dies kann zum einen die Genauigkeit <strong>der</strong><br />
<strong>genomischen</strong> Zuchtwerte erhöhen, kann zum an<strong>der</strong>en aber auch für die<br />
Anpaarungsplanung genutzt werden.<br />
Anpaarungsplanung<br />
Das Ziel einer Anpaarungsplanung ist es, eine eventuelle<br />
Inzuchtdepression zu verringern und eine mögliche Überdominanz zu<br />
nutzen, indem die Anpaarungspartner so gewählt werden, dass die<br />
erwarteten Leistungen <strong>der</strong> Nachkommen maximiert werden. Die Leistung<br />
eines Tieres kann bekanntlich deutlich vom mittleren Zuchtwert <strong>der</strong><br />
Eltern abweichen. Ursachen hierfür können neben mendelscher<br />
Segregation und Umwelteffekten auch Dominanzeffekte, epistatische<br />
Effekte, o<strong>der</strong> Imprinting sein, wo<strong>bei</strong> den Dominanzeffekten wohl die<br />
größte Bedeutung zukommt. Vernachlässigt man epistatische Effekte<br />
und Imprinting, dann ist <strong>der</strong> Genotypwert eines Tieres die Summe <strong>der</strong><br />
Genotypwerte aller QTL. Dessen Erwartungswert weicht aufgrund <strong>der</strong><br />
Dominanzeffekte vom mittleren Zuchtwert <strong>der</strong> Eltern ab. Der optimale<br />
Anpaarungspartner einer Kuh ist <strong>der</strong> Bulle, <strong>der</strong> den erwarteten<br />
Genotypwert <strong>der</strong> Nachkommen maximiert. Dieser erwartete Genotypwert<br />
des Nachkommen hängt ab von den Genotypwahrscheinlichkeiten <strong>der</strong><br />
QTL und von <strong>der</strong>en genotypischen Werten. Betrachtet man ein QTL j mit<br />
Allelen 0 und 1, dann haben die möglichen Genotypen 00, 01 und 11<br />
00 01 11<br />
Genotypwahrscheinlichkeiten p j , p j , p j und Genotypwerte − a j , d j , a j ,<br />
wo<strong>bei</strong> j a <strong>der</strong> additive Effekt und d j <strong>der</strong> Dominanzeffekt des QTL ist.<br />
00<br />
01 11<br />
Damit ist <strong>der</strong> erwartete Genotypwert µ p j ( −a<br />
j ) + p j d j + p j a j . Die<br />
Genotypwahrscheinlichkeiten ergeben sich entsprechend <strong>der</strong><br />
mendelschen Gesetze aus den Genotypen <strong>der</strong> Eltern. Da die QTL und<br />
<strong>der</strong>en Effekte aber größtenteils unbekannt sind, werden statt <strong>der</strong> QTL-<br />
Effekte die geschätzten Effekte j j d aˆ , ˆ <strong>der</strong> Marker gewichtet und<br />
aufsummiert, siehe Tabelle (1). Die Differenz zwischen Genotypwert und<br />
Zuchtwert eines Tieres wird als die Dominanzabweichung bezeichnet.<br />
Eine von 0 verschiedene Dominanzabweichung ist also <strong>der</strong> Grund,<br />
weshalb eine Anpaarungsplanung erfolgversprechend ist.<br />
+∑<br />
j
Tabelle 1: Berechnung des erwarteten Genotypwertes eines<br />
Nachkommen.<br />
Genotyp Genotypwahrsch. Beitrag zum<br />
Marker Eltern Nachkomme erwarteten Genotypwert<br />
Vater<br />
Mutter<br />
00 01 11<br />
1 01 00 0.5 0.5 0 0.5⋅ ( −aˆ<br />
1)<br />
+ 0.5⋅<br />
d1<br />
+ 0⋅<br />
aˆ<br />
1<br />
2 00 11 0 1 0 0⋅ ( −aˆ<br />
2)<br />
+ 1⋅<br />
d2<br />
+ 0⋅<br />
aˆ<br />
2<br />
3 01 01 0.25 0.5 0.25 0.25⋅ ( −aˆ<br />
ˆ<br />
3)<br />
+ 0.5⋅<br />
d3<br />
+ 0.25⋅<br />
a3<br />
: : : : : : :<br />
M 00 00 1 0 0 1⋅ ( −aˆ<br />
M ) + 0⋅<br />
dM<br />
+ 0⋅<br />
aˆ<br />
M<br />
erwarteter Genotypwert<br />
µ +∑<br />
j<br />
00<br />
j<br />
j<br />
ˆ<br />
ˆ<br />
p ( −aˆ<br />
) + p dˆ<br />
+ p aˆ<br />
Der geschätzte genomische Zuchtwert eines Tieres ist bis auf eine<br />
additive Konstante gegeben durch<br />
EBV = ∑αˆ<br />
j ( v j + m j ),<br />
ˆ<br />
j<br />
wo<strong>bei</strong> ˆ α j = aˆ<br />
j + ( q j − p j ) d j <strong>der</strong> Substitutionseffekt ist, v j ∈{0,1}<br />
das<br />
paternale, und m j ∈{0,1}<br />
das maternale Allel des Tieres an Marker j ist.<br />
Hier<strong>bei</strong> ist j p die Frequenz des 1-Alleles und q j = 1−<br />
p j ist die Frequenz<br />
des 0-Alleles. Die geschätzte genomische Dominanzabweichung des<br />
Tieres ist<br />
∑<br />
EDV = − 2dˆ<br />
j ( v j − p j )( m j − p j ).<br />
j<br />
Siehe auch Falconer und Mackay (1996). Eine Anpaarungsplanung ist<br />
nur dann erfolgversprechend, wenn sowohl Zuchtwert als auch<br />
Dominanzabweichung mit ausreichen<strong>der</strong> Genauigkeit geschätzt werden<br />
können.<br />
Schätzung genomischer Zuchtwerte und Dominanzabweichungen<br />
Ein Modell zur gemeinsamen Schätzung von additiven Effekten und<br />
Dominanzeffekten berücksichtigt im Idealfall die Abhängigkeit von<br />
ˆ<br />
ˆ<br />
01<br />
j<br />
j<br />
11<br />
j<br />
j
additiven Effekten, Dominanzeffekten und Allelfrequenzen so, wie sie <strong>bei</strong><br />
dem jeweils betrachteten Merkmal zu erwarten ist. Einfache Modelle<br />
nehmen Unabhängigkeit an, doch aus <strong>der</strong> Literatur ist gut bekannt, dass<br />
dies in <strong>der</strong> Realität <strong>nicht</strong> zutrifft (Charlesworth und Willis 2009).<br />
Die additiven <strong>Geneffekte</strong>, Dominanzabweichungen und Genfrequenzen<br />
sind in einer komplexen Weise abhängig. Der Dominanzgrad eines QTL,<br />
also das Verhältnis vom Dominanzeffekt zum absoluten additiven Effekt,<br />
liegt <strong>bei</strong> <strong>der</strong> großen Mehrheit <strong>der</strong> QTL zwischen -1 und 1, d. h.<br />
überdominante QTL sind selten (Bennewitz und Meuwissen 2010).<br />
Schädliche Allele sind in <strong>der</strong> Regel nahezu rezessiv. Zudem haben sie<br />
eine geringe Frequenz, da gegen diese Allele selektiert wird.<br />
Entsprechend sind vorteilhafte Allele in <strong>der</strong> Regel dominant und haben<br />
eine hohe Frequenz. Viele Merkmale sind von Inzuchtdepression<br />
betroffen. Bei solchen Merkmalen sind die Dominanzeffekte <strong>der</strong> QTL im<br />
Mittel positiv. Die Frequenz eines QTL ist in <strong>der</strong> Regel <strong>der</strong>art, dass die<br />
Än<strong>der</strong>ung <strong>der</strong> Allelfrequenz je Generation aufgrund von <strong>Selektion</strong> gering<br />
ist, d.h. <strong>der</strong> Beitrag des QTL zur additiven Varianz ist gering. Dies<br />
induziert eine Abhängigkeit zwischen Dominanzeffekten, Allelfrequenzen<br />
und den Vorzeichen <strong>additiver</strong> Effekte. Das Vorzeichen eines additiven<br />
Effektes ist wahrscheinlich negativ wenn ein Allel selten ist und positiv,<br />
falls es häufig ist, denn ansonsten würde das QTL <strong>bei</strong> positivem<br />
Dominanzeffekt einen größeren Beitrag zur additiven Varianz haben.<br />
Dieser Zusammenhang ist ausführlich in Wellmann und Bennewitz<br />
(2011) begründet.<br />
Die Standard-G-BLUP-Modelle sind <strong>nicht</strong> in <strong>der</strong> Lage, diese komplexen<br />
Abhängigkeiten zu modellieren. Bei Bayes-Modellen ist es jedoch<br />
möglich, diese Abhängigkeiten adäquat zu berücksichtigen. Wellmann<br />
und Bennewitz (2012) haben hierfür BayesD-Modelle entwickelt und<br />
anhand einer Simulationsstudie gezeigt, dass diese eine genaue<br />
Schätzung von Dominanzabweichungen und von genotypischen Werten<br />
ermöglichen.<br />
Fazit<br />
Die Berücksichtigung von Dominanzabweichungen ist <strong>bei</strong> einer<br />
Lernstichprobe mit genotypisierten und leistungsgeprüften Kühen<br />
prinzipiell möglich und ermöglicht eine gezielte Anpaarungsplanung. Zur<br />
Schätzung <strong>der</strong> <strong>genomischen</strong> Werte sollten BayesD-Modelle genutzt<br />
werden. Voraussetzungen für den Erfolg einer solchen Stratgie sind eine<br />
große Lernstsichprobe und eine hohe Markerdichte. Beides ist <strong>der</strong>zeit<br />
noch <strong>nicht</strong> gegeben. Es ist jedoch zu erwarten, dass in naher Zukunft<br />
viele Kühe zumindest mit einem Low-Desity-SNP-Chip genotypisiert
sind. Zudem werden zunehmend Bullen mit einem High-Density-SNP-<br />
Chips genotypisiert und auch sequenziert. Durch Imputierungen können<br />
dann die fehlenden SNPs und evtl. sogar die Sequenzinformation <strong>der</strong><br />
Kühe aufgedeckt werden (Meuwissen und Goddard 2010a, 2010b).<br />
Sollten diese technischen Errungenschaften Einzug in die Praxis<br />
gefunden haben, ist die Berücksichtigung <strong>der</strong> Dominanz <strong>bei</strong> <strong>der</strong><br />
<strong>genomischen</strong> <strong>Selektion</strong> möglich. Die Ausgestaltung und Auswirkungen<br />
<strong>der</strong> Anpaarungsplanungen müssen dann evaluiert werden.<br />
Literatur<br />
Bennewitz, J., and T. H. E. Meuwissen (2010). The distribution of QTL<br />
additive and dominance effects in porcine F2 crosses. Journal of<br />
Animal Breeding and Genetics 127: 171-179<br />
Charlesworth, D., and J. H. Willis (2009). The genetics of inbreeding<br />
depression. Nature Reviews Genetics 10: 783-796<br />
Falconer, D. S., and T. F. C. Mackay (1996). Introduction to quantitative<br />
genetics. London, UK: Longman<br />
Hill, W. G., M. E. Goddard, P. M. Visscher (2008). Data and Theory Point<br />
880 to Mainly Additive Genetic Variance for Complex Traits. PLoS<br />
Genet 4 (2): 881.<br />
Meuwissen, T. H. E., and M. E. Goddard (2010a). Accurate prediction of<br />
genetic values for complex traits by whole genome resequencing.<br />
Genetics 185: 623-631<br />
Meuwissen, T. H. E., and M. E. Goddard (2010b). The Use of Family<br />
Relationships and Linkage Disequilibrium to Impute Phase and<br />
Missing Genotypes in Up to Whole-Genome Sequence Density<br />
Genotypic Data. Genetics 185: 1441-1449<br />
Wellmann, R. Bennewitz, J. (2011). The contribution of dominance to the<br />
un<strong>der</strong>standing of quantitative genetic variation. Genetics Research<br />
93: 139-154.<br />
Wellmann, R. Bennewitz, J. (2012). Genomic evaluation with hierarchical<br />
Bayes including dominance effects. Genetics Research. In press.