Ülegenoomne assotsiatsiooniuuring kubemesonga geneetiliste ...
Ülegenoomne assotsiatsiooniuuring kubemesonga geneetiliste ... Ülegenoomne assotsiatsiooniuuring kubemesonga geneetiliste ...
TARTU ÜLIKOOL LOODUS JA TEHNOLOOGIA TEADUSKOND MOLEKULAAR- JA RAKUBIOLOOGIA INSTITUUT BIOTEHNOLOOGIA ÕPPETOOL Natalia Tšernikova Ülegenoomne assotsiatsiooniuuring kubemesonga geneetiliste markerite leidmiseks Eesti populatsioonis Magistritöö TARTU 2012 Juhendajad: Evelin Mihailov, M.Sc. Reedik Mägi, Ph.D. Prof. Andres Metspalu, M.D., Ph.D.
- Page 2 and 3: Sisukord 1 Kasutatud lühendid ....
- Page 4 and 5: 1 Kasutatud lühendid CR Edukalt ge
- Page 6 and 7: 3 Kirjanduse ülevaade 3.1 Song Son
- Page 8 and 9: Joonis 1. Kubemesonga klassifikatsi
- Page 10 and 11: Kollageeni regulatsiooni häired ku
- Page 12 and 13: ekstratsellulaarmaatriksi (Extracel
- Page 14 and 15: dest. Näiteks Illumina HumanOmniEx
- Page 16 and 17: ja leitud GWAS tulemuste z-skooride
- Page 18 and 19: 5 Materjalid ja metoodika 5.1 Valim
- Page 20 and 21: 3. Hardy - Weinbergi tasakaalustatu
- Page 22 and 23: programmiga PLINK (http://pngu.mgh.
- Page 24 and 25: Joonis 4. Kubemesonga assotsiatsioo
- Page 26 and 27: Tabel 3. Kubemesonga assotsiatsioon
- Page 28 and 29: lookus. Lisaks on regionaalsel joon
- Page 30 and 31: tegemist võib olla kas DTNBP1 geen
- Page 34 and 35: 7 Arutelu Mitmed eelnevad tööd on
- Page 36 and 37: geen piisavalt uuritud, kuigi on le
- Page 38 and 39: 9 Summary Repair of inguinal hernia
- Page 40 and 41: 10 Kasutatud kirjandus Abrahamson J
- Page 42 and 43: Jenkins JT, O`Dwyer PJ (2008) Ingui
- Page 44 and 45: Risch N, Merikangas K (1996) The fu
- Page 46 and 47: 11 Kasutatud veebilehed 1000 Genoom
- Page 48 and 49: Lisa 1. Regionaalsed joonised kõik
- Page 50 and 51: Lisa 1. (järg) 50
TARTU ÜLIKOOL<br />
LOODUS JA TEHNOLOOGIA TEADUSKOND<br />
MOLEKULAAR- JA RAKUBIOLOOGIA INSTITUUT<br />
BIOTEHNOLOOGIA ÕPPETOOL<br />
Natalia Tšernikova<br />
<strong>Ülegenoomne</strong> <strong>assotsiatsiooniuuring</strong><br />
<strong>kubemesonga</strong> <strong>geneetiliste</strong> markerite leidmiseks<br />
Eesti populatsioonis<br />
Magistritöö<br />
TARTU 2012<br />
Juhendajad: Evelin Mihailov, M.Sc.<br />
Reedik Mägi, Ph.D.<br />
Prof. Andres Metspalu, M.D., Ph.D.
Sisukord<br />
1 Kasutatud lühendid .............................................................................................................. 4<br />
2 Sissejuhatus ......................................................................................................................... 5<br />
3 Kirjanduse ülevaade ............................................................................................................ 6<br />
3.1 Song .............................................................................................................................. 6<br />
3.1.1 Songa klassifikatsioon ............................................................................................... 6<br />
3.1.2 Songa epidemioloogia ................................................................................................ 6<br />
3.1.3 Kubemesong .............................................................................................................. 7<br />
3.1.4 Kubemesonga riskitegurid ......................................................................................... 8<br />
3.1.5 Kubemesong kui sidekoehaigus ................................................................................. 9<br />
3.2 Ülegenoomsed <strong>assotsiatsiooniuuring</strong>ud ...................................................................... 13<br />
3.2.1 SNP markerid ........................................................................................................... 13<br />
3.2.2 Markerite imputatsioon ............................................................................................ 14<br />
3.2.3 Populatsiooni geneetiline stratifikatsioon ................................................................ 14<br />
3.2.4 Uuringute võimsus ja valimi suurus ........................................................................ 15<br />
3.2.5 Tulemuste visualiseerimine ..................................................................................... 15<br />
4 Töö eesmärk ........................................................................................................................ 17<br />
5 Materjalid ja metoodika ..................................................................................................... 18<br />
5.1 Valimi kirjeldus .......................................................................................................... 18<br />
5.2 Fenotüüp ..................................................................................................................... 18<br />
5.3 Genotüpiseerimine ja andmete kvaliteedikontroll ...................................................... 19<br />
5.4 Imputeerimine ............................................................................................................. 20<br />
5.5 Assotsiatsioonianalüüs ................................................................................................ 20<br />
5.6 Ekspressioonianalüüs .................................................................................................. 21<br />
5.7 Bioloogiliste radade analüüs ....................................................................................... 21<br />
5.8 Haplotüübianalüüs ...................................................................................................... 21<br />
6 Tulemused ......................................................................................................................... 23<br />
2
6.1 Regionaaljoonised ....................................................................................................... 27<br />
6.2 Haplotüübianalüüs ...................................................................................................... 28<br />
5.3 Bioloogiliste radade analüüs ....................................................................................... 29<br />
7 Arutelu ............................................................................................................................... 34<br />
8 Kokkuvõte ......................................................................................................................... 37<br />
9 Summary ............................................................................................................................ 38<br />
10 Kasutatud kirjandus ......................................................................................................... 40<br />
11 Kasutatud veebilehed ....................................................................................................... 46<br />
12 Lisad ................................................................................................................................ 47<br />
3
1 Kasutatud lühendid<br />
CR Edukalt genotüpiseeritud indiviidide protsent markeril (Call Rate)<br />
ECM Ekstratsellulaarne maatriks (Extracellular matrix)<br />
EGV Eesti Geenivaramu (Estonian Genome Center)<br />
GWAS <strong>Ülegenoomne</strong> <strong>assotsiatsiooniuuring</strong> (Genome-Wide Association Study)<br />
HMM Peitud Markovi Mudel (Hidden Markov Model)<br />
HWE Hardy-Weinbergi tasakaalustatus (Hardy-Weinbergi Equilibrium)<br />
LD Aheldatuse tasakaalustamatus (Linkage Disequilibrium)<br />
MAF Minoorse alleeli sagedus (Minor Allele Frequency)<br />
MMP Maatriksmetalloproteinaas (Matrix metalloproteinase)<br />
OR Šansside suhe (Odds Ratio)<br />
Q-Q plot Kvantiil-kvantiil joonis (Quantile-quantile plot)<br />
eQTL Ekspressiooni kvantitatiivse tunnuse lookused (Expression Quantitative Trait<br />
Loci)<br />
SNP Ühe nukleotiidne polümorfism (Single Nucleotide Polymorphism)<br />
WHO Maailma Terviseorganisatsioon (World Health Organization)<br />
λ Korrektsioonifaktor lambda (Correction Factor Lambda)<br />
4
2 Sissejuhatus<br />
Kubemesong on väga sage kirurgiline haigus mis mõjutab ligikaudu 12% elanikkonnast.<br />
Maailma Terviseorganisatsiooni (The world health report - Health systems financing: the<br />
path to universal coverage World Health Organization, WHO) 2010 aasta raporti andmetel<br />
ulatuvad kulud <strong>kubemesonga</strong>de likvideerimiseks ning dotatsioonide maksmiseks Ameerika<br />
Ühendriikides umbes 28 miljardi dollarini aastas.<br />
On näidatud, et <strong>kubemesonga</strong> patogenees on multifaktoriaalne ja mitmed teadusgrupid on<br />
proovinud leida geneetilisi tegureid, mis antud patoloogia kujunemises osaleks, kuid siiani<br />
edutult. Lisaks ei ole seni tehtud ka ühtegi ülegenoomset uuringut, mis võimaldaks hinnata<br />
haigusega seotud riske.<br />
Ülegenoomsed <strong>assotsiatsiooniuuring</strong>ud on osutuks edukaks haigusriski mõjutavate<br />
<strong>geneetiliste</strong> variantide leidmisel. Tänaseks päevaks on ülegenoomseid<br />
<strong>assotsiatsiooniuuring</strong>uid teostatud juba enam kui 600 haiguse korral ning tuvastanud enam<br />
kui 3000 tunnust mõjutavat geneetilist varianti. Seepärast valiti antud strateegia ka<br />
<strong>kubemesonga</strong> <strong>geneetiliste</strong> tegurite leidmiseks kasutades Eesti Geenivaramu<br />
(http://www.geenivaramu.ee/et/) andmeid. Eesti Geenivaramu biopank sisaldab hetkel<br />
ligikaudu 52 000 Eesti täiskasvanud elaniku DNA proove ja andmeid haiguste ning<br />
tervisekäitumise kohta.<br />
Kõike seda arvesse võttes on käesoleva magistriväitekirja eesmärk leida geneetilisi<br />
variatsioone, mis suurendavad <strong>kubemesonga</strong> haigestumise riski.<br />
5
3 Kirjanduse ülevaade<br />
3.1 Song<br />
Song on parietaalse peritoneumi ehk kõhukelme väljasopistus läbi kõhuseina olemasoleva<br />
või sekundaarselt tekkinud avause (Murruste et al., 2005). Tekke järgi on võimalik eristada<br />
kahte tüüpi songasid, kaasasündinud ehk kongenitaalseid songasid ja omandatud songasid.<br />
Sellisteks kohtadeks, millel on eeldused songa tekkimiseks, on näiteks kubemekanal,<br />
reiekanal ja nabavõru või kõhuseina laparotoomiajärgsed armid (Geissler ja Anthuber,<br />
2011). Song võib esineda vaevusteta, kuid põhjustab sageli ka ebamugavustunnet ja valu<br />
(Jenkins ja O’Dwyer, 2008; Geissler ja Anthuber, 2011).<br />
3.1.1 Songa klassifikatsioon<br />
Rahvusvaheline Haiguste Klassifikatsiooni ehk RHK-10 (International Statistical<br />
Classification of Disease, ICD10) järgi jaotatakse songad vastavalt nende asukohale<br />
järgnevalt:<br />
K40 – Kubemesong<br />
K41 – Reiesong<br />
K42 – Nabasong<br />
K43 – Kõhuseinasong<br />
K44 – Vahelihasesong<br />
K46 – Täpsustamata kõhuõõnesong<br />
M62.8 – Lihase (tupe) song (RHK-10 klassifikatsioon, Sotsiaalministeerium,<br />
http://www.sm.ee/index.php?id=771).<br />
3.1.2 Songa epidemioloogia<br />
Songad on üheks kõige sagedamaseks kirurgiliseks patoloogiaks, eriti Lääne-Euroopas ja<br />
Ameerika Ühendriikides. Sagedus ulatub keskmiselt 1,7 protsendist kõikides<br />
vanusgruppides kuni 4 protsendini 45 aastastel ja vanematel (Primatesta ja Goldacre, 1996).<br />
Tänapäeval hinnatakse songa operatsioonide arvu 20 miljonile aastas üle maailma;<br />
operatsioonide arv varieerub keskmiselt 100 ja 300 vahel 100 000 inimese kohta (Bay-<br />
Nielsen et al., 2011). Kubemesong moodustab 75% kõikidest kõhuseina songadest ning selle<br />
tekkerisk meestel on elu jooksul 27% ja naistel 3% (Kingsnorth ja LeBlanc, 2003).<br />
Eestis tehakse aastas ligikaudu 3500 songa operatsiooni ja neist umbes 2/3 <strong>kubemesonga</strong>de<br />
likvideerimiseks (Murruste et al., 2005). Eestis on kõikidest songadest umbes 95% välised<br />
6
songad, millest 65-75% on <strong>kubemesonga</strong>d (2/3 indirektsed ja 1/3 direktsed), 10% - 15% on<br />
armisongad, umbes 10% nabasongad, 1% - 3% reiesongad ja ca 3% haruldase<br />
lokalisatsiooniga songad. Meestel esineb kubemesong 80% - 90% juhtudest. Naistel esineb<br />
reiesong 75% juhtudest. Kubemesong naistel on võrreldes reiesongaga harv (Murruste et al.,<br />
2005). Lastel esineb <strong>kubemesonga</strong> 0,8% – 4,4% juhtudest, poistel aga esineb songa 3 – 10<br />
korda rohkem kui tüdrukutel (Grosfeld, 1989). Perekondlik anamnees songa esinemisel on<br />
11,5% (Murruste et al., 2005).<br />
3.1.3 Kubemesong<br />
Kubemesong on kõhukoopa elundi või selle osa väljasopistumine läbi kubemekanali naha-<br />
alustesse kudedesse. Väljasopistumine toimub läbi niinimetatud nõrkade kohtade ehk<br />
songavärati kaudu kõhuseina lihaste ja kubemesideme vahel (Murruste et al., 2005).<br />
RHK-10 (http://www.sm.ee/index.php?id=771) järgi jaotub kubemesong veel omakorda:<br />
K40.0 - Bilateraalne ehk kahepoolne kubemesong, sulgusega, ilma gangreenita<br />
K40.1 - Bilateraalne kubemesong gangreeniga<br />
K40.2 - Bilateraalne kubemesong ilma sulguse või gangreenita<br />
K40.3 - Unilateraalne ehk ühepoolne või täpsustamata kubemesong, sulgusega ja<br />
ilma gangreenita<br />
K40.4 - Unilateraalne või täpsustamata kubemesong, gangreeniga<br />
K40.9 - Unilateraalne või täpsustamata kubemesong ilma sulguse või gangreenita<br />
Kubeme- ja reiesongade puhul on kasutuses ka lihtne ja praktiline 2002. a. Magdeburgi<br />
klassifikatsioon, kus jaotatakse songad järgnevatesse rühmadesse:<br />
indirektne kubemesong<br />
direktne kubemesong<br />
kombineeritud kubemesong<br />
reiesong<br />
retsidiivsong (Geissler ja Anthuber, 2011).<br />
Kasutusel on ka Schumpelick Aachen klassifikatsioon, mis baseerub European Hernia<br />
Society klassifikatsioonil ning jaotab songad asukoha („L“ lateraalne/indirektne, „M“<br />
mediaalne/direktne, „F“ femoraalne/reie -, „ML“ kombineeritud) ja suuruse järgi (3 cm) (vt. Joonis 1) (Geissler ja Anthuber, 2011).<br />
7
Joonis 1. Kubemesonga klassifikatsioon, mis kirjeldab songasid tüübi ja suuruse järgi (Robert<br />
ja Zollinger, 2004).<br />
3.1.4 Kubemesonga riskitegurid<br />
Songade patogenees on multifaktoriaalne. Kaasasündinud songade puhul on anatoomiliseks<br />
riskiteguriks kõhuseinas olev avaus, mis tuleneb kõhuseina mittetäielikust sulgumisest.<br />
Omandatud songade korral on tegemist lihas-aponeurootilise kõhuseina struktuuride<br />
dehistentsiga, mis on tingitud kõhuseina toonuse vähenemisest (Murruste et al., 2005).<br />
Lisaks anatoomilistele teguritele mängivad <strong>kubemesonga</strong> formeerumisel rolli ka sellised<br />
faktorid nagu intra-abdominaalse rõhu tõus, krooniline obstruktiivne kopsuhaigus,<br />
rasvumine, kõhuvesitõbi, raskuste tõstmine, stress, suitsetamine, vanus, sugu, <strong>kubemesonga</strong><br />
esinemine perekonnas, traumad ja rasedus (Read, 1984; Murruste et al., 2005; Lau et al.,<br />
2007; Akbulut et al., 2010). Tänapäeval on teada ka, et kubemesong on sagedasem<br />
patsientidel, kel esineb kaasasündinud sidekoehaigusi, nagu näiteks ebatäiuslik luuteke,<br />
vanurite nahalõtvus, Ehlersi-Danlosi, Hurler – Hunter ja Marfan` sündroom (Liem et al.,<br />
1997; Hayakawa et al., 1982; Abrahamson 1998). Kubemesonga sagedasem esinemine<br />
8
perekonnas viitab <strong>geneetiliste</strong>le faktoritele haiguse kujunemises (Liem et al., 1997; Lau et<br />
al., 2007; Akbulut et al., 2010).<br />
3.1.5 Kubemesong kui sidekoehaigus<br />
Morfoloogilised muutused<br />
Morfoloogilised ja molekulaarsed uuringud <strong>kubemesonga</strong> patsientidel toetavad hüpoteesi, et<br />
<strong>geneetiliste</strong>l teguritel on songa tekkimisele oluline mõju (Lynen et al., 2004).<br />
Lihas–aponeurootilise kõhuseina vastupanu survele võib olla põhjustatud ka kõhuseina<br />
sidekoe patoloogilistest muutustest, mida seostatakse kollageeni metabolismi häirega<br />
(Peacock, 1982). Inimese keha transversaalfastsia (Fascia Transversalis) on tihesidekoest<br />
anatoomiline struktuur, mis katab kõhu sirglihast seespoolt ja on selle toeks ning lisaks<br />
eraldab kõhulihased sooltest. Transversaalfastsia struktuur sõltub elastsetest<br />
kollageenikiududest ja -komponentidest, mis on vajalikud koevõrgustikus pingejõu<br />
hoidmiseks. Ekstratsellulaarse maatriksi muutumine aga soodustab koe vastupidavuse ja<br />
transversaalfastsia elastsuse kadumist (Rodrigues Junior et al., 2002). Uuringud näitavad<br />
morfoloogilist seost transversaalfastsia elastsuse kaotuse ning vananemise vahel. See seos<br />
võimaldab seletada <strong>kubemesonga</strong> kõrgemat esinemissagedust patsientidel vanuses 50 aastat<br />
ja vanemad (Rodrigues Juniror ja Quintas, 2002).<br />
Transversaalfastsias esinevaid morfoloogilisi erinevusi näidati indirektse ja direktse<br />
<strong>kubemesonga</strong> vahel. Indirektse <strong>kubemesonga</strong> korral esines struktuurselt rohkem säilinud ja<br />
homogeenselt jaotunud küpseid elaunini ja oksütalaani elastseid kiude. Samas kui<br />
patsientidel, kellel esines direktne kubemesong, leiti transfersaalfastsias väiksem hulk<br />
küpseid elastseid kiude, mida iseloomustab nende paksenemine, keerdumine ja lühendamine<br />
(Rodrigues Junior et al., 2002).<br />
Transversaalfastsias esinevad vanusest sõltuvad muutused soodustavad küpsete elastsete<br />
kiudude lagundamist ning suure hulga oksütalaani kiudude redutseerimist. Näidatud on<br />
kollageeni sisalduse vähenemist milligrammi kohta transversaalfastsias direktse<br />
<strong>kubemesonga</strong> puhul (Rodrigues Junior et al., 2002). Biomehhaanilisi ja struktuurseid<br />
muutuseid transversaalfastsias arvesse võttes (Pans et al., 1997, Pans et al., 1999), on välja<br />
pakutud, et <strong>kubemesonga</strong> tekkimise eest vastutavad tõenäoliselt muutused nii kollageeni<br />
ekspressioonis kui ka elastsete kiudude metabolismis (Rodrigues Junior et al., 2002).<br />
9
Kollageeni regulatsiooni häired <strong>kubemesonga</strong> patsientidel<br />
Tänapäeval eksisteerib mitu teooriat, mis seostavad <strong>kubemesonga</strong> tekkimist <strong>geneetiliste</strong><br />
teguritega. Üheks versiooniks on muutused kollaageeni ekspressioonis. Kollageen on üks<br />
kõige levinum valk inimese organismis. Koe vigastuse korral viib kollageeniga seotud<br />
geenide koordineeritud ekspressiooni regulatsioon ajutise maatriksi moodustumiseni, mis<br />
edasi muutub küpseks armiks (Lynen et al., 2006). Heteromeerne kollageen koosneb<br />
vähemalt 9 kollageenimolekuli tüübist ning need ahelad on kodeeritud vähemalt 17 geeni<br />
poolt (Ninomiya ja Olsen, 1984). Välja on pakutud, et üheks <strong>kubemesonga</strong> põhjuseks võib<br />
olla kollageeni sünteesi kvantitatiivne aberratsioon, mida omakorda mõjutavad mutatsioonid<br />
kollageeniga seotud geenide regulatoorsetes elementides (Lynen et al., 2006). Regulatoorsed<br />
elemendid paiknevad promooterjärjestuses või geeni intronites ning on harilikult<br />
kodeerivatest järjestusest kuni 20 kb kaugusel (Mautner et al., 1996). Uuringute käigus on<br />
identifitseeritud interstitsiaalse tüüp I ja tüüp III kollageeni transkriptsiooni regulatsiooni<br />
oluliseimad piirkonnad ning on näidatud, et mutatsioonid regulatoorsetes elementides<br />
segavad transkriptsioonifaktorite seondumist või jällegi suurendavad nende seondumise<br />
affiinsust (vt. Joonis 2) (Lynen et al., 2006).<br />
Geneetilised variandid tüüp I kollageeni geenide promooterite piirkondades mõjutavad<br />
kollageeni sünteesi ka osteoporoosiprotsessis. Analoogiliselt võivad aberratsioonid<br />
kollageeni geenide promooteralades olla seotud ka songaga (Yamada et al., 2005).<br />
Transversaalfastsia kollageeni struktuuri ümberpaigutused suurendavad koe elastsust. Tüüp<br />
I: tüüp III kollageeni suhte vähenemine detekteeriti transversaalfastsia naha proovidest<br />
mRNA ja valkude tasemel. Sarnased morfoloogilised muutused esinevad ka songakotis ning<br />
armikoes (Junge et al., 2004). Muutused kollageeni ekspressioonis <strong>kubemesonga</strong><br />
patsientidel, viitavad transkriptsiooni düsregulatsioonile (Si et al., 2002).<br />
10
Joonis 2. Regulatoorse järjestuse <strong>geneetiliste</strong> variatsioonide mõju kollageeni geeni<br />
transkriptsioonile. A) normaalne transkriptsioonifaktorite seondumine; B) vähenenud<br />
transkriptsioonifaktorite seondumine viib geeni transkriptsiooni vaigistamiseni; C) vähenenud<br />
transkriptsioonifaktorite seondumine viib geeni transkriptsiooni tõusule. Mutatsioonid kodeerivates<br />
alades on märgitud punaste katkendlike joontega (Lynen et al., 2006).<br />
Kollageeni geenide transkriptsiooniline regulatsioon<br />
Lisaks regulatoorsete elementide geneetilisele varieeruvusele, on olemas ka teine võimalus<br />
kollageeni sünteesi eest vastutava geeniregulatsiooni muutusteks rakus. See on seotud raku<br />
signaalradade muutustega, mis hõlmab omakorda ekstratsellulaarseid tsütokiine. Signaalne<br />
transduktsioon ankurdatust valkudest on lokaliseeritud tsütoplasmas ja järgnevalt toimub<br />
transkriptsioonifaktorite seondumine DNA motiividega, võimaldades regulatoorset<br />
aktiivsust (vt. Joonis 2). Selline signaalraja muutus võib omada sarnast mõju nagu<br />
regulatoorsete elementide mutatsioon geeni kodeerivas alas. Transkriptsioonifaktorid AP1,<br />
Sp1, Sp3, YB-1 ja C/EBP on aktiveeritud peale rakulist kontakti selliste tsütokiinidega, nagu<br />
näiteks TNF- α, TGF-ß, IFN- α, mis omakorda mängivad olulist rolli kollageeniga seotud<br />
geenide regulatsioonis (Mertens et al., 1997; Mertens et al., 2002).<br />
Veel üks võimalik hüpotees <strong>kubemesonga</strong> haiguse korral hõlmab<br />
maatriksmetalloproteinaaside molekule (Matrix metalloproteinase, MMP). Kollageenid on<br />
11
ekstratsellulaarmaatriksi (Extracellular matrix, ECM) põhilised komponendid koos<br />
glükoproteiinide ja proteoglükaanidega (Lynen et al., 2004). ECM asub dünaamilises<br />
bilansis sünteesi ja degradatsiooni vahel, mida teostatakse maatriksmetalloproteinaaside<br />
poolt (Basson, 2003). Viimaste aastate jooksul pannakse suurt rõhku MMP-d uurimisele,<br />
seoses nende võimega kollageeni degradeerida ja remodelleerida. MMP-d on füsioloogiliselt<br />
seotud erinevate protsessidega, näiteks surnud kudede eemaldamine, angiogeneesi<br />
soodustamine ning äsja sünteesitud sidekoe remodelleerimine (Kähäri ja Saarialho-Kere,<br />
1997).<br />
MMP perekond koosneb vähemalt 23-st geenist, ning on tsink-sõltuvad substraat<br />
spetsiifilised proteaasid ning omavad olulist rolli protsessides, mis on seotud haava<br />
kinnikasvamisega. Nii näiteks on MMP-2, -7, -8, ja -9 ekspressioon alanenud terves nahas;<br />
MMP-1, -2,-3,-9,-11,-13,-14 on aga ülesekspresseeritud haava tekkimisel (Saarialho-Kere,<br />
1998).<br />
Songa geneetilisest regulatsioonist arusaamiseks on väga oluline meeles pidada, et geeni<br />
regulatsiooni programmid täidavad kindlaid eesmärke, näiteks fibroblastid organiseerivad<br />
kollageeni sünteesi teisel moel kui makrofaagid ning „teadmised“ ühest rakus võivad olla<br />
varjatud teiste rakkude jaoks (Lynen et al., 2006).<br />
Mitmed uuringud on analüüsinud kollageeni sünteesi muutuseid songa patsientidel (Lynen<br />
et al., 2006, Aren et al., 2011). Kirjeldatud on konstitutiivse tüüp III kollageeni sünteesi<br />
tõusu naha fibroblastides, mis assotsieerub songa formeerumisega (Friedman et al., 1993).<br />
Võrreldes <strong>kubemesonga</strong> patsientide ja tervete indiviidide fibroblaste, detekteeriti esimestel<br />
tüüp I ja tüüp III kollageeni suhte langus ning leiti, et <strong>kubemesonga</strong> patsientidel tõusis<br />
MMP- 1 ja MMP-13 valgu ja mRNA tase (Friedman et al., 1993). MMP-2 ülesekspressiooni<br />
fibroblastides on aga näidatud direktse <strong>kubemesonga</strong> patsientidel (Bellon et al., 2001).<br />
Lisaks detekteeriti MMP-13 ülesekspressioon inimestel, kellel esines kubemesong korduvalt<br />
(Zheng et al., 2002).<br />
Kokkuvõtteks võib öelda, et <strong>kubemesonga</strong> esinemine on tulemus kompleksete<br />
interaktsioonide, keskkonnategurite ja mitmete geeneetiliste faktorite vahel. Eelnevalt<br />
läbiviidud uuringud näitavad, et kollageeniga ja MMP-ga seotud geenid on kindlasti<br />
tõenäolised kandidaatgeenid, mida järgnevatel <strong>geneetiliste</strong>l uuringutel võiks arvesse võtta<br />
(Lynen et al., 2006, Aren et al., 2011).<br />
12
3.2 Ülegenoomsed <strong>assotsiatsiooniuuring</strong>ud<br />
Geneetilised variatsioonid DNA järjestuses mõjutavad suuremal või väiksemal määral<br />
haigestumise riski. Harvaesinevate Mendeliaalsete haiguste põhjuslike mutatsioonide<br />
tuvastamine on olnud väga edukas, kuna kindlale haigusele vastab kindel genotüüp. Paljud<br />
haigused aga kujunevad välja mitmete geenide ja keskkonnafaktorite koostoimel ning neid<br />
nimetatakse multifaktoriaalseteks ehk komplekshaigusteks. Komplekshaiguste geneetilise<br />
tausta uurimine on osutunud märksa keerukamaks, kuivõrd iga variatsioon on vaid üks<br />
paljudest mis haigestumise riski mõjutab (Zondervan ja Cardon, 2007). Edukaks strateegiaks<br />
komplekhaiguste <strong>geneetiliste</strong> variatsioonide tuvastamisel on osutunud ülegenoomsed<br />
<strong>assotsiatsiooniuuring</strong>ud (Genome-Wide Association Studies, GWAS) (Wang et al., 2005).<br />
Assotsiatsiooniuuringud põhinevad hüpoteesil, et geneetilise markeri ühe alleeli kõrgem<br />
esinemissagedus patsientidel näitab seost haigusfenotüübi ning antud variatsiooni vahel<br />
(Kruglyak, 1999).<br />
Paljude komplekshaiguste, nagu näiteks tüüp 1 ja tüüp 2 diabeet, põletikuline soolehaigus,<br />
rinna- ja eesnäärme vähk, suuremahulised GWAS-id, on viimasel ajal tuvastatud palju uusi<br />
geneetilisi lookuseid, mis on seotud nende haiguste eelsoodumusega (Sladek et al., 2007;<br />
Duerr et al., 2006; Gudmundsson et al., 2007; Easton et al., 2007). Lisaks on<br />
identifitseeritud ka hulk geene, mis on seotud pidevate tunnustega, nagu näiteks lipiidide<br />
tase, pikkus ja keha rasvaprotsent (Willer et al., 2008; Sanna et al., 2008; Scuteri et al.,<br />
2007, http://www.genome.gov/gwastudies/).<br />
3.2.1 SNP markerid<br />
Human Genome Project tulemused on näidanud, et inimese genoom koosneb ligikaudu<br />
22 000 geenist ning inimesed on identsed ligikaudu 99,5% DNA järjestusest. Ülejäänud osa<br />
genoomist on variatsioonid ning neid nimetatakse polümorfismideks (Lander et al., 2001).<br />
Kõige tavalisem polümorfismide klass on ühe nukleotiidi asendus, mida nimetatakse SNP-ks<br />
(Single Nucleotide Polymorphism) ning nad moodustuvad ligikaudu 90% inimese genoomi<br />
variatsioonidest (Petterson et al., 2009). SNP-d esinevad keskmiselt iga 1 000 aluspaari<br />
tagant ning neid saab detekteerida automaatselt, mis teeb nende analüüsi kiireks ja odavaks<br />
(Wang et al., 2005). Kromosoomil lähestikku asuvate markerite vahelist aheldatust ära<br />
kasutades on võimalik valida väiksem hulk SNP-e, mida nimetatakse tag-SNP-ideks, ning<br />
mis kirjeldavad omakorda nendega seostunud SNP-de gruppe ehk haploblokke (Gabriel et<br />
al., 2002). Selliselt valitud markerid võimaldavad hinnata enamikku sagedasematest SNP-<br />
13
dest. Näiteks Illumina HumanOmniExpress beadchip võimaldab kasutada üheaegselt<br />
rohkem kui 700 000 markerit genoomi katmiseks (Illumina Inc. http://www.illumina.com).<br />
Ülegenoomsete <strong>assotsiatsiooniuuring</strong>ute läbiviimisel kasutatakse SNP-de genotüpiseerimisel<br />
meetodeid, mis teostatakse standartiseeritud protokollide järgi kasutades kommertsiaalseid<br />
ülegenoomseid kiipe (näiteks Illumina Inc. http://www.illumina.com; Affymetrix Inc.<br />
http://www.affymetrix.com).<br />
3.2.2 Markerite imputatsioon<br />
Markerite imputatsiooni all mõistetakse genotüüpide ennustamist, mida ei ole indiviididel<br />
genotüpiseeritud. Need, in silico markerid, suurendavad SNP-de arvu, mida testitatakse<br />
GWAS-i käigus (Marchini ja Howie, 2010). Imputeerimiseks kasutatakse ülegenoomset<br />
genotüpiseeritud markereid. Need andmed haplotüpiseeritakse ning nende vahele jäävate<br />
puuduolevate markerite genotüübid ennustatakse kasutades olemasolevaid<br />
referentshaplotüüpe. Nii saavutatakse tihedam markerite katvus, kasutades nii<br />
genotüpiseeritud kui imputeeritud markereid ja see aitab assotsiatsioonianalüüsis parandada<br />
<strong>geneetiliste</strong> assotsiatsioonide leidmise tõenäosust (Marchini ja Howie, 2010).<br />
Üheks imputatsiooni teostamise programmiks on IMPUTE. See programm kasutab<br />
haplotüpiseerimiseks HM mudelit (Hidden Markov Model, HMM) ja võimaldab<br />
kombineerida referentspaneelidena erinevaid haplotüüpide referentse, näiteks 1000 Genome<br />
Project, HapMap2 ja HapMap3 (Marchini ja Howie, 2010).<br />
3.2.3 Populatsiooni geneetiline stratifikatsioon<br />
Populatsiooni stratifikatsioon on alleelisageduste erinevus juhtude ja kontrollide vahel, mis<br />
on põhjustatud nende erinevast päritolust (Freedman et al., 2004). Suurte valimite korral on<br />
vaja kontrollida populatsiooni geneetilist stratifikatsiooni, mida nimetatakse ka<br />
populatsiooni struktuuriks (Knowler et al., 1988). Juhul, kui juhud ja kontrollid on<br />
komplekteeritud sisemiselt struktueeritud populatsioonist, võib <strong>assotsiatsiooniuuring</strong> anda<br />
vale-positiivseid assotsiatsioone (Marchini et al ., 2004).<br />
Üheks meetodiks geneetilise stratifikatsiooni hindamiseks on genoomse kontrolli meetod<br />
(Genomic Control) (Devlin ja Roeder, 1999). Genoomse kontrolli meetod eeldab, et juhud ja<br />
kontrollid on võetud samast populatsioonist ning markerite alleelisagedused varieeruvad<br />
juhtude ja kontrollide vahel juhuslikult. See annab võimaluse eeldada, et korrektsioonifaktor<br />
λ väärtus jääb terve genoomi ulatuses muutumatuks. Korrektsioonifaktor λ arvutatakse kui<br />
mediaan χ2 statistiku väärtustest jagatuna eeldatava χ2 statistiku jaotuse mediaanväärtusega<br />
14
ühe vabadusastme korral, mis võrdub 0,456. Stratifikatsiooni korral on λ väärtus suurem kui<br />
üks ja leitud teststatistikuid korrigeeritakse λ väärtusega. Eespool kirjeldatud ümberarvutus<br />
võimaldab vähendada vale-positiivsete assotsiatsioonide hulka (Plenge et al., 2007).<br />
3.2.4 Uuringute võimsus ja valimi suurus<br />
Ülegenoomsete <strong>assotsiatsiooniuuring</strong>ute probleemiks see, et leitud geneetilised efektid on<br />
komplekstunnustele väikesed. Tihti ei piisa nende tuvastamiseks ühest populatsiooni<br />
kohordist, et saavutada GWAS-i puhul optimaalselt 80%-list statistilist võimsust (Reich ja<br />
Lander, 2001, Spencer et al., 2009). Seetõttu tuleb eksperimenti planeerides silmas pidada<br />
seda, et valim peab olema piisavalt suur väikeste efektide tuvastamiseks. Näiteks markerite<br />
korral, minoorse alleeli sagedusega > 1% (Minor Allele Frequency, MAF) peab minimaalne<br />
kohordi suurus olema ligikaudu 2 000 indiviidi, et saavutada olukorda, kui markeri alleeli<br />
šansside suhe (Odds Ratio, OR) on 1,3. Antud arvud näitavad 80% võimsuse olulisuse<br />
nivooks P-väärtus < 10 -6 (Wang et al., 2005).<br />
Samuti tuleb GWAS-i teostamisel arvesse võtta fenotüüpide maksimaalselt täpset<br />
kindlaksmääramist. Ülegenoomsete <strong>assotsiatsiooniuuring</strong>ute puhul võrreldatakse kahte tüüpi<br />
indiviide – kontrollid ehk terved indiviidid ning juhud ehk inimesed, kellel esineb vaadeldav<br />
haigus. Enamik publitseeritud GWAS analüüsidest põhinevad just sellisetel juht-kontroll<br />
tüüpi uuringutel. Selliste analüüside läbiviimisel tuleb panna suurt rõhku juhtude ja<br />
kontrollide valimise hoolikusele (McCarthy et al., 2008). Juhtude valimisel püüakse vältida<br />
fenotüübi heterogeensust või valida eriti ekstreemsete fenotüübiväärtustega indiviidid ja/või<br />
perekonnad (WTCCC, 2007). Ebakorrektselt defineeritud fenotüübi tagajärjeks on viga<br />
gruppidevahelise alleelisageduste määramisel ning seeläbi uuringu statistilise võimsuse<br />
mitmekordne vähenemine (Burton et al., 2009). Juhtude ja kontrollide suurem arv tagab<br />
GWAS-ide suurema statistilise võimsuse (Howson et al., 2005, WTCCC, 2007).<br />
Kuna GWAS-is testitakse korraga palju markereid, tuleb võtta arvesse ka mitmesel<br />
testimisel tekkiv valepositiivsete assotsiatsioonide hulk. Ülegenoomsete<br />
assotsiatsioonianalüüside standardiks on kujunenud P-väärtuse nivoo 5 x 10 -8 (Risch ja<br />
Merikangas, 1996; WTCCC, 2007).<br />
3.2.5 Tulemuste visualiseerimine<br />
Üheks kõige levinumaks meetodiks GWAS tulemuste visualiseerimiseks on kvantiilide<br />
joonis (quantile-quantile plot, Q-Q joonis). See visualiseerib vaadeldava teststatistiku jaotust<br />
saadud ülegenoomsest uuringust (Clayton et al., 2005) – võrreldakse omavahel oodatavaid<br />
15
ja leitud GWAS tulemuste z-skooride jaotusi, mis peaks vastama χ 2 jaotusele. Sellisel<br />
joonisel leitud erinevus oodatavast jaotusest võib tuleneda populatsiooni stratifikatsioonist<br />
või andmeanalüüsi vigadest. Teisel populaarsel joonisel, Manhattani joonisel,<br />
visualiseeritakse leitud assotsiatsioonid vastalt nende kromosomaalsetele asukohtadele<br />
(McCarthy et al., 2008). Leitud geenilookuste struktuuri paremaks mõistmiseks kasutatakse<br />
regionaalseid jooniseid, kus on esitatud vaid huvipakkuv kromosoomi lõik.<br />
16
4 Töö eesmärk<br />
Käesoleva magistriväitekirja eesmärgiks oli <strong>geneetiliste</strong> variatsioonide leidmine, mis<br />
suurendavad <strong>kubemesonga</strong> haigestumise riski.<br />
17
5 Materjalid ja metoodika<br />
5.1 Valimi kirjeldus<br />
Antud töö raames kasutati Tartu Ülikooli Eesti Geenivaramu proove, mis on kogutud<br />
geenidoonoritelt üle kogu Eesti. Uurimuse läbiviimiseks analüüsiti 3851 indiviidi ning viidi<br />
läbi juht-kontrolltüüpi uuring. Haigusjuhte oli kokku 500 indiviidi ning kontrollgrupp<br />
koosnes 3351 indiviidist. Haigusjuhtude ja kontrollindiviidide ealine ja sooline jaotuvus on<br />
toodud tabelites 1 ja 2.<br />
Tabel 1. Ealine jaotuvus töös käsitletud uuringurühmas.<br />
Mehed Naised Kokku<br />
Juhud 342 85 427<br />
Kontrollid 1449 1975 3424<br />
Tabel 2. Sooline jaotuvus töös käsitletud uuringurühmas.<br />
Juhud 58.5<br />
(13.7)<br />
Kontrollid 48.4<br />
5.2 Fenotüüp<br />
Keskmine vanus<br />
(standardhälve)<br />
Vanuse vahemik:<br />
Miinimum - maksimum<br />
Mehed Naised Mehed Naised<br />
(18.5)<br />
56.8<br />
(14.1)<br />
54.3<br />
(21.6)<br />
20 - 85 23 - 86<br />
18 - 100 18 - 103<br />
Haigusjuhtude valikul lähtuti järgnevatest kriteeriumitest:<br />
1. kubemesong (K40.0 ) oli diagnoositud täiskasvanueas (vanus alates 18 eluaastast)<br />
2. ei esine haigusi, mis võivad nõrgestada kõhuseina<br />
3. ei esine haigusi, mis võivad tõsta kõhusisest rõhku, näiteks krooniline kõhukinnisus<br />
(K59)<br />
4. ei esine kõhupiirkonna operatsioone<br />
5. naised ei ole sünnitanud<br />
6. song ei ole tekkinud raske füüsilise töö või pingutuse tõttu<br />
18
Haigusjuhtude valik teostati Tartu Ülikooli Eesti Geenivaramu teaduri dr. Taie Kaasiku<br />
poolt.<br />
Kontrollgruppi valiti indiviidid, kellel ei olnud järgnevaid diagnoose:<br />
1. song (K40-K46)<br />
2. seedeelundite ülaosa muud kaasasündinud väärarendid (Q40)<br />
3. lihasluukonna mujal klassifitseerimata kaasasündinuid väärarendid (Q79)<br />
4. muud osteokondrodüsplaasiaid (Q78)<br />
5. osteokondrodüsplaasia toruluude ja lülisamba kasvupuue (Q77)<br />
6. põletikulised polüartropaatiad (M05-M14)<br />
7. süsteemsed sidekoe haigusseisundid (M30-M36)<br />
8. Ehlersi-Danlosi sündroomi (Q79.6)<br />
9. mitut elundkonda hõlmavad muud täpsustatud kaasasündinud väärarendi sündroomid<br />
(Q87)<br />
10. astsiit ehk vesikõht (R18)<br />
11. alumiste hingamisteede kroonilised haigused (J40-J47)<br />
12. muud soole talitlushäired (K59)<br />
13. meessuguelundite haigused (N40-N51)<br />
14. muud täpsustatud luu haigusseisundid (M89.8)<br />
15. fibroblastilised haigusseisundid (M72)<br />
16. muud paiksed sidekoehaigused (L94)<br />
Käesoleva töö raames teostatavate uuringute läbiviimiseks on geenidoonorid andnud<br />
informeeritud nõusoleku ning on olemas Tartu Ülikooli inimuuringute eetika komitee luba.<br />
5.3 Genotüpiseerimine ja andmete kvaliteedikontroll<br />
<strong>Ülegenoomne</strong> genotüpiseerimine teostati kasutades Illumina Infinium II tehnoloogiat<br />
(www.illumina.com). Genotüpiseerimiseks kasutati Illumina HumanOmniExpress –<br />
BeadChip (Illumina Inc.), 733 202 markeriga kiipi. Genotüpiseerimine teostati Eesti<br />
Biokeskuse Tuumiklabori Genotüpiseerimiskeskuses.<br />
Genotüpiseeritud andmeid filtreeriti järgnevate parameetrite osas:<br />
1. eduka genotüpiseerimise protsentuaalne osakaal (Call Rate, CR) nii indiviidi kui iga SNP<br />
kohta.<br />
2. minoorse alleeli sagedus (MAF),<br />
19
3. Hardy – Weinbergi tasakaalustatus (Hardy-Weinbergi equilibrium, HWE),<br />
4. indiviidide vaheline sugulus<br />
5. genotüübi põhjal leitud soo mitte-kokkulangevus Eesti Geenivaramu proovi feotüübi<br />
informatsiooniga.<br />
Analüüsidest jäeti välja indiviidid kelle CR oli alla 95%. Samuti jäeti välja SNP-d mille CR<br />
oli alla 95%, MAF alla 1% ning HWE testi p-väärtus alla 10 -5 . Lähisugulaste tuvastamiseks<br />
hinnati ühiste alleelide osakaalu genoomis (Identity By State, IBS) ning selle põhjal<br />
ennustati iga paari jaoks päritolult identsete (Identical by Descent, IBD) osakaalu.<br />
Sugulaspaaridest, kus IBD osakaal oli suurem või võrdne 10% (PIHAT ≥ 0.1) genoomist,<br />
eemaldati üks sugulastest. Välja jäeti ka indiviidid kelle raporteeritud fenotüübi sugu ei<br />
vastanud <strong>geneetiliste</strong> andmete põhjal ennustatud soole. Genotüpiseeritud 3851 indiviidist<br />
läbis kvaliteedikontrolli 427 haigusjuhtu ja 3424 kontrollindiviidi ning kokku 733 202 SNP-<br />
d. Andmete kvaliteedi hindamine ning filtreerimine teostati programmiga PLINK (Purcell et<br />
al. 2007).<br />
5.4 Imputeerimine<br />
Kromosoomide imputeerimiseks konverteeriti LINKAGE formaadis<br />
genotüpiseerimisandmed IMPUTE formaati kasutades tööriista GTOOL<br />
(http://www.well.ox.ac.uk/~cfreeman/software/gwas/gtool.html). Imputeerimiseks kasutati<br />
IMPUTE v2 programmi (http://mathgen.stats.ox.ac.uk/impute/impute_v2.html) ning<br />
referentsgenoomi 1000 Genome projekti andmeid (http://www.1000genomes.org), et<br />
imputeerida SNP-d, mida polnud Illumina HumanOmniExpress kiibil. Peale imputeerimist<br />
filtreeriti markerid minoorse alleeli sageduse (MAF ≥ 5%) ja imputeerimise kvaliteeti<br />
hindava parameetri proper_info väärtus ≥ 0.8 alusel, mis andis kokku tulemuseks 8 178 592<br />
imputeeritud markerit. Genotüpiseeritud ja imputeeritud markerite kombineerimine andis<br />
ülegenoomseks markerite arvuks 8 911 794 SNP-d.<br />
Imputeerimise referentsina kasutati kõikidest kohortides koostatud 1000 Genoomi Projekti<br />
1094 indiviidi haplotüüpe (1000 Genome Project freeze from 23 nov 2010).<br />
5.5 Assotsiatsioonianalüüs<br />
Analüüsimaks <strong>geneetiliste</strong> variantide mõju <strong>kubemesonga</strong>le, kasutati logistilise regressiooni<br />
mudelit programmis SNPTEST v2<br />
(https://mathgen.stats.ox.ac.uk/genetics_software/snptest/snptest.html). Markereid analüüsiti<br />
kasutades alleeliefektide aditiivset mudelit. Analüüsis kasutati kovariaatidena vanust ja<br />
20
sugu, kuna haigus avaldub ennekõike vanemaealistel ning on oluliselt sagedasem meeste<br />
hulgas. Eraldi analüüsisime ka mehi, kus kovariaadina kasutati ainult vanust. Imputeeritud<br />
markerite puhul kasutati analüüsis genotüüpide asemel nende tõenäosusi.<br />
Assotsiatsioonitulemuste visualiseerimine<br />
Assotsiatsioonitulemuste visualiseerimiseks kasutati Manhattani joonist. Manhattani joonisel<br />
esitatakse markerite negatiivsed kümnendlogaritmid nende assotsiatsioonide P-väärtustest<br />
vastavalt nende genoomsetele asukohtadele.<br />
Assotsieerunud lookuste markeritevahelise LD struktuuri paremaks mõistmiseks<br />
visualiseeriti assotsiatsioone regionaalsetel joonistel, kasutades Locuszoom<br />
(https://statgen.sph.umich.edu/locuszoom/genform.php?type=yourdata) programmi.<br />
Kontrollimaks, et tulemused ei ole mõjutatud populatsiooni stratifikatsioonist, kasutati<br />
genoomse kontrolli meetodit (Devlin ja Roeder, 1999) ning arvutati populatsiooni<br />
stratifikatsiooni hindava parameetri λ väärtused mõlema analüüsi jaoks. Tulemused esitati<br />
ka kvantiilide joonisel (QQ joonis), mille telgedel võrreldakse leitud P-väärtuste jaotust<br />
eeldatavatega. Manhattan ja QQ joonised tehti kasutades R-i skripti (well.ox.ac.uk/gwama).<br />
5.6 Ekspressioonianalüüs<br />
Leidmaks, kas töös identifitseeritud SNP-d mõjutavad geeniekspressiooniga ehk on eQTL<br />
(Expression Quantitative Trait Loci), kasutati andmebaasi, mis on koostatud 5 300 indiviidi<br />
andmete meta-analüüsist (Westra et al. avaldamata andmed). Valim koosnes Eesti, Saksa,<br />
Hollandi, Itaalia ning kahest Ameerika Ühendriikide kohortist. RNA eraldati täisverest ning<br />
ekspressiooniprofiil määrati kasutades erinevate põlvkondade Illumina kiipe. HapMap2<br />
referentsile imputeeritud genotüüpide ja geeniekspressiooni väärtuste vahelised<br />
korrelatsioonid leiti kasutades eQTL-Mapperit (Westra et al., 2011).<br />
5.7 Bioloogiliste radade analüüs<br />
Leidmaks, millistesse bioloogilistesse radadesse kuuluvad antud töös leitud geenid, kasutati<br />
kõiki geene, mille lähedal või sees leidus markereid P-väärtusega alla 10 -5 . Bioloogiliste<br />
radade ennustamiseks kasutati GeneNetwork andmebaasi (Franke et al, avaldamata<br />
andmed), mis põhineb 80 000 proovi ekspressiooni võrgustikele.<br />
5.8 Haplotüübianalüüs<br />
Haplotüübianalüüsis võrreldi indiviide, kes kandsid sagedaseimat haplotüüpi (-ehk<br />
metsiktüüpi) alternatiivsete haplotüüpidega. Haplotüüpide ennustamine sooritati<br />
21
programmiga PLINK (http://pngu.mgh.harvard.edu/~purcell/plink/) ning analüüs sooritati<br />
statistikapaketis R (www.R-project.org), kasutades logistilist regressiooni.<br />
Kõik arvutused viidi läbi Tartu Ülikooli teadusarvutuste keskuses (http://www.hpc.ut.ee/).<br />
22
6 Tulemused<br />
Antud töö raames analüüsiti 427 indiviidi (342 meest ja 85 naist). Kvaliteedikontrolli läbis 8<br />
911 794 markerit autosomaalsetelt kromosoomidelt, sugukromosoomide andmeid ei<br />
kasutatud. Ülegenoomses assotsiatsioonianalüüsis kasutati kõiki indiviide koos ja lisaks<br />
analüüsiti mehi eraldi. Naisi eraldi ei analüüsitud kuna valim oli liiga väike. Kovariaatidena<br />
võeti arvesse vanus ja sugu (sugu ainult mehi ja naisi koos analüüsides).<br />
Assotsiatsiooniuuringus kasutati aditiivset alleelidoosi mudelit.<br />
Populatsiooni stratifikatsiooni hindava parameetri väärtused olid järgmised: λmehed+naised =<br />
1,029 ja λmehed = 1,034, näitavad, et teatav stratifikatsioon küll esines, aga ei olnud suur ja ei<br />
mõjuta saadud tulemusi (vt. Joonis 3)<br />
Joonis 3. Eeldatavate ja leitud assotsiatsioonide P-väärtuste kvantiilide joonised. Telgedel<br />
võrreldakse leitud P-väärtuste jaotust juhuslikult eeldatavatega. A) mehed ja naised; B) mehed.<br />
Mitte kummaski analüüsis – ei mehi ja naisi koos analüüsides ega ka mehi eraldi<br />
analüüsides ei saadud tulemust, mida võiks lugeda ülegenoomselt statistiliselt oluliseks (P-<br />
väärtusega alla 5 x 10 -8 ). Seetõttu kirjeldame tulemustes seoseid, mille P-väärtus jääb alla<br />
10 -5 ja seda markeritega, mille harvema alleeli sagedus on võrdne või üle 5%. Leitud<br />
olulisemad seosed on esitatud graafiliselt Manhattan jooniste abil (vt. Joonised 4 ja 5).<br />
23
Joonis 4. Kubemesonga assotsiatsioonianalüüsi Manhattan joonis. Esitatud on<br />
<strong>assotsiatsiooniuuring</strong>u andmed analüüsides nii mehi kui naisi. Y-teljel on negatiivne<br />
kümnendlogaritm assotsiatsiooni P-väärtusest. X-teljel on genoomsed asukohad.<br />
24
Joonis 5. Kubemesonga assotsiatsioonianalüüsi Manhattan joonis. Esitatud on<br />
<strong>assotsiatsiooniuuring</strong>u andmed analüüsides ainult mehi. Y-teljel on negatiivne kümnendlogaritm<br />
assotsiatsiooni P-väärtusest. X-teljel on genoomsed asukohad.<br />
Mehi ja naisi koos analüüsides ja kasutades P-väärtuse nivoona < 10 -5 leiti erinevaid seoseid,<br />
mis võivad olla potentsiaalselt seotud <strong>kubemesonga</strong> tekkimisega (vt. Joonis 4, Tabel 3).<br />
25
Tabel 3. Kubemesonga assotsiatsioonianalüüsi tulemused analüüsides mehi ja naisi koos.<br />
Lähim geen on määratud, kui selle kaugus assotsieerunud SNP-st on väiksem kui 100 kb.<br />
Kromosoom SNP-i ID Lähim geen Testitud<br />
alleel/<br />
teine alleel<br />
OR<br />
(95%<br />
usaldusintervall)<br />
P-väärtus<br />
1 rs10916394 1q42.13 A/G 0.54(0.42-0.69) 6.28 x 10 -06<br />
2 rs149633809 RMNDA5 A/G 0.43(0.29-0.63) 3.51 x 10 -06<br />
3 rs4539902 ZCWPW2 A/C 1.42(1.22-1.65) 4.24 x 10 -06<br />
3 rs12491076 PDZRN3 C/T 1.52(1.28-1.81) 4.22 x 10 -06<br />
3 rs74446186 ZNF717 G/T 1.59(1.32-1.93) 1.70 x 10 -06<br />
3 rs189287746 3p11.2 T/C 2.11(1.58-2.83) 1.36 x 10 -06<br />
5 rs4868436 MSX2 G/C 0.68(0.58-0.80) 1.33 x 10 -06<br />
6 rs2797301 IRF4,<br />
DUSP22<br />
C/G 1.53(1.27-1.85) 9.89 x 10 -06<br />
6 rs760659 JARID2 T/C 0.58(0.47-0.72) 3.36 x 10 -07<br />
7 rs10487581 AGR3 C/A 1.78(1.40-2.26) 5.42 x 10 -06<br />
8 rs28758285 NRG1 C/T 1.43(1.23-1.66) 2.30 x 10 -06<br />
9 rs1889103 PTPRD C/G 1.49(1.26-1.78) 7.16 x 10 -06<br />
9 rs7032609 EPB41L4 G/T 0.68(0.57-0.81) 9.73 x 10 -06<br />
15 rs4984172 15q11.2 C/T 2.02(1.50-2.73) 3.82 x 10 -06<br />
16 rs2966218 HS3ST4 T/C 0.57(0.45-0.73) 1.16 x 10 -06<br />
17 rs9891085 AIPL1 G/A 1.40(1.21-1.63) 9.50 x 10 -06<br />
21 rs13048013 KRTAP8-1 C/T 0.39(0.26-0.60) 1.86 x 10 -06<br />
22 rs145243392 22q12.3 C/T 0.31(0.18-0.55) 6.34 x 10 -06<br />
22 rs10212061 22q13.32 A/G 1.57(1.29-1.91) 9.74 x 10 -06<br />
Leitud tulemustest viis lookust asuvad geenidest kaugemal kui 100 kb: 1q42.13, 3p11.2,<br />
5q11.2, 22q12.3 ja 22q13.32. Ülejäänud lookuste jaoks määrasime lähima geeni.<br />
Kromosoomidest 3, 5, 6, 7, 8 ning 16 leidsime assotsiatsiooni, mis asuvad geenide lähedal<br />
(
Leitud tulemustest kolm lookust asuvad lähimast geenist kaugemal kui 100 kb: 1q43, 5q23.2<br />
ja 6q15. Ülejäänud lookuste jaoks määrasime lähima geeni. Kromosoomidest 2, 4, 5, 7, 8, 9<br />
ning 21 leidsime assotsiatsioone, mis asuvad geenide lähedal (
lookus. Lisaks on regionaalsel joonisel näidatud rekombinatsioonide määr ning antud<br />
regioonis olevate geenide nimed (vt. Lisa 1 ja 2). Enamikel regionaalsetel joonistel tundub<br />
olevat tegemist ühe signaaliga, kus kõik <strong>kubemesonga</strong>ga assotsieerunud markerid on ka<br />
omavahel tugevas seoses. Ainult lookuses 6q15 (rs72919729 ümbritsev regioon) leiti madala<br />
P-väärtusega markereid, mis samal ajal polnud omavahel tugevalt korreleerunud. Selliste<br />
markerite suhtes oli teostatud haplotüübi analüüs.<br />
6.2 Haplotüübianalüüs<br />
6q15 lookuse regionaalselt jooniselt on näha, et seal paikevad <strong>kubemesonga</strong>ga<br />
assotsieerunud markerid pole omavahel tugevalt aheldunud (vt. Joonis 6). Parim tulemus<br />
selles lookuses on rs72919729 (P-väärtus=7.4x10 -6 ), lisaks leidub seal marker rs4235842<br />
(P-väärtus=1.70x10 -5 ), mille LD parima markeriga on r 2 =0.268, D'=0.796. Selles lookuses<br />
kontrollisime võimalikku haplotüübiefekti, analüüsides nendel kahel markeril põhinevaid<br />
haplotüüpe. Siinkohal tuleb arvesse võtta seda, et tegemist on imputeeritud andmetega, ning<br />
haplotüübianalüüsis olid kasutatavad vaid genotüübid, mis on määratud vähemalt 90%<br />
tõenäosusega. Seepärast on haplotüübianalüüsis väiksem andmestik. Haplotüübianalüüsi<br />
tulemused geenipiirkonnas 6q15 on esitatud tabelis 5. Mõlemat markerit koos haplotüübina<br />
analüüsides saime assotsiatsiooni metsiktüüpi haplotüübi (rs72919729:G, rs4235842:C) ja<br />
haplotüübi rs72919729:C, rs4235842:C vahel P-väärtusega=1.15x10 -5 . Eraldi markerite<br />
assotsiatsioonide P-väärtused nimetatud väiksemalt andmestikult olid: rs72919729<br />
P=9.1x10 -5 ja rs4235842 P=0.000101. Testimaks, kas haplotüübianalüüsi kasutamine annab<br />
lisainformatsiooni, võrreldi dispersioonianalüüsi kasutades omavahel mudelit kus analüüsiti<br />
eraldi valitud markereid ja mudelit, kus kasutati lisaks ka haplotüüpi. Analüüsi tulemusel<br />
selgus, et kuigi haplotüübianalüüsi P-väärtus oli madalam, kui kahe üksiku markeri analüüsi<br />
P-väärtused, siis mudelite vahel erinevust ei leitud (P=0.359).<br />
28
Joonis 6. Regionaalne joonis meeste assotsiatsioonianalüüsi tulemustega lookuses 6q15.<br />
Parim leitud assotsieerunud marker rs72919729 on esitatud lilla ristkülikuna ja ülejäänud<br />
markerite assotsiatsioonid ringidena. Markerite värv näitab nende LD-d parima markeriga.<br />
Joonisel olev joon näitab rekombinatsiooni määra.<br />
Tabel 5. Haplotüübianalüüsi tulemus teostatud positsiooni 6q15 metsiktüüpi haplotüübi<br />
testimiseks alternatiivsetele haplotüüpidele. Uuritav haplotüüp koosnes markeritest<br />
rs72919729 ja rs4235842.<br />
Haplotüüp Sagedus (%) OR (95%<br />
usaldusintervall)<br />
P-väärtus<br />
CT 13.0 1.23(0.97-1.55) 0.0917<br />
GT 22.8 1.67(1.33-2.09) 8.95x10 -6<br />
CC 9.3 0.82(0.28-2.44) 0.7202<br />
5.3 Bioloogiliste radade analüüs<br />
Kasutades Westra et al. andmebaasi, kontrolliti, kas mõni assotsieerunud SNP-dest omab<br />
mõju geeniekspressiooni varieerumisele. Leiti, et ainult üks SNP (rs760659) on<br />
korreleerunud DTNBP1 geeni ekspressiooniga (P=2.99x10 -19 ). Leitud seos näitab, et<br />
29
tegemist võib olla kas DTNBP1 geeni splaisingu variantidega või tegemist on muude<br />
bioloogiliste replikaatidega.<br />
Geenide funktsioonide leidmiseks kasutati GeneNetwork andmebaasi. Antud andmestik<br />
võimaldab ennustada geenide molekulaarset funktsiooni, seotust erinevate bioloogiliste<br />
protsessidega ning ekspressiooni taset erinevates kudedes (vt. Tabel 6 ja Tabel 7). Tabelist<br />
on näha, et kandidaatgeenid ekspresseeruvad kudedes, mille funktsioon on tagatud<br />
kollageeni ja maatriksmetalloproteinaaside olemasoluga. Sama programmi kasutades<br />
analüüsiti, kas leitud kandidaatgeenid klasterduvad mõne bioloogilise raja või funktsiooni<br />
suhtes (vt Lisa 3-7). Bioloogiliste radade ja koeekspressiooni analüüsi statistiliselt oluliseks<br />
P-väärtuse nivooks on andmebaasi loojad seadnud P
Tabel 7. Viie geeni ennustatavad funktsioonid.<br />
Bioloogiliste radade ning molekulaarsete funktsioonide kasterdusanalüüs ennustas järgnevat:<br />
A) MFAP5 (microfibrillar associated protein 5) geeni poolt tagatud ennustatud<br />
bioloogilised protsessid; B) Ennustatud rakuline komponent MFAP5 geeni jaoks; C)<br />
MFAP5 ennustatavad molekulaarsed funktsioonid; D) NRG1 (neuregulin 1) ennustatud<br />
bioloogilised protsessid; E) NRG1 geeni ennustatud molekulaarsed funktsioonid; F) HTRA3<br />
(HtrA serine peptidase 3) geeni ennustatud bioloogilised protsessid; G) HTRA3 geeni<br />
rakuline komponent; H) PDZRN3 (PDZ domain containing ring finger 3) geeni ennustatud<br />
rakuline komponent. I) PDZRN3 geeni rakuline komponent; J) PDZRN3 geeni ennustatud<br />
molekulaarsed funktsioonid.<br />
31
7 Arutelu<br />
Mitmed eelnevad tööd on näidanud, et <strong>kubemesonga</strong> tekkimisel on geneetiline komponent<br />
(Rodrigues Jr et al., 2002, Lynen et al., 2006). Antud töö raames ei õnnestunud tuvastada<br />
ülegenoomselt statistiliselt olulisi assotsiatsioone, mis tõenäolisel tuleneb <strong>kubemesonga</strong><br />
põhjustavate <strong>geneetiliste</strong> lookuste väikesest relatiivsest riskist. Seetõttu polnud piisavalt<br />
statistilist võimsust ülegenoomselt statistiliste efektide leidmiseks. Probleemiks on ka see, et<br />
<strong>kubemesonga</strong> fenotüüp on raskesti klassifitseeritav. Antud uuringust jäeti välja indiviidid,<br />
kelle <strong>kubemesonga</strong> tekkimine oli seotud keskkonnafaktoritega (operatsioonijärgne tüsistus,<br />
raske füüsiline pingutus jne.) samuti kaasasündinud <strong>kubemesonga</strong>ga isikud. Samuti ei ole<br />
võimalik täielikult välistada diagnoosi ja anamneesi vigu. Töös keskendusime lookustele,<br />
mille P-väärtust oli alla 10 -5 . Selliseid nominaalselt olulisi P-väärtusi leidsime mehi ja naisi<br />
koos analüüsides 19, ning ainult mehi analüüsides 16 erinevast lookusest. Nende 34 lookuse<br />
(üks geenilookus oli oluline nii mehi kui ka kogu andmestiku analüüsides) puhul peab<br />
arvesse võtma, et osa neist võivad olla valepositiivsed tulemused, ning saadud tulemusi peab<br />
replitseerima sõltumatus kohordis. 34 leitud lookuse hulgast 5 olid seotud kollageeniga ja<br />
maatriksmetalloproteinaasidega.<br />
Kandidaatlookuste seos geeniekspressiooniga andis samuti huvipakkuvaid tulemusi. Kolm<br />
polümorfismi geenis DTNBP1 (dystrobrevin binding protein 1) mõjuvtavad<br />
geeniekspressiooni taset. Mitu uuringut on näidanud DTNBP1 seost skisofreeniaga (Straub<br />
et al., 2002). Lisaks on leitud, et DTNBP1 on düstrofiiniga seotud valgulise kompleksi osa<br />
(Fallgater et al., 2006). Antud kompleks on assotsieerunud lihasdüstroofiaga, mida<br />
iseloomustab lihaste nõrgenemine ja funktsioonide kadu (Motlagh et al., 2005).<br />
Leitud geenidest olid huvipakkuvamateks HTRA3 (HtrA serine peptidase 3), NRG1<br />
(neuregulin 1), MFAP5 (microfibrillar associated protein 5), PDZRN3 (PDZ domain<br />
containing ring finger 3) ja TBC1D19 (TBC1 domain family, member 19), kuna nende<br />
bioloogiliste radade analüüs näitas põhifunktsioonideks seost kollageeniga ja maatriks<br />
metalloproteinaasidega, mis võiks olla kõige tõenäolisemad kandidaatgeenid kumebesonga<br />
haiguse jaoks.<br />
Nii näiteks, bioloogiliste radade analüüs näitas, et HTRA3 geen ekspresseerub enamasti<br />
skeletilihastes. HTRA3 on ekstratsellulaarse maatriksi koostisosa ning tema<br />
põhifunktsiooniks on kollageeniga seondumine. Uuritud artiklid valdavalt toetavad andmeid<br />
saadud bioloogiliste radade analüüsist. Näidatud on, et HTRA3 on imetajate HTRA<br />
perekonda seriini peptidaas (High-Temperature Requerement Factor A), mis aktiveeritakse<br />
34
hiirtel platsenta moodustumise perioodil ning antud valk osaleb ka inimese platsenta<br />
moodustumisel. Hiire emaka endomeetriumis on Htra3 mRNA ekspressioon enne rasedust<br />
suhteliselt madal. Htra3 mRNA ekspressiooni tase suureneb postimplantatsiooni ja platsenta<br />
perioodi moodustumise jooksul. HTRA3 on konserveerunud inimese ja hiire vahel 87%<br />
mRNA tasemel ning 95% valgu tasemel (Nie et al., 2006).<br />
Samade bioloogiliste radade klasterdusanalüüs näitas, et NRG1 osaleb ekstratsellulaarse<br />
maatriksi düsassambleerumises ning ekspresseerub fibroblastides, müotsüütides ja<br />
skeletilihastes. Uuringud on näidanud, et NGR1 on üks neljast valgust, mis kuulub<br />
neureguliini perekonda. NRG1 on tihedalt seotud EFGR (Epidermal Growth Factor<br />
Receptor) perekonna retseptoritega. NGR1 moodustub arvukalt isoforme alternatiivse<br />
splaisingu kaudu, mis võimaldab tal omada mitut funktsiooni. Näiteks, üheks tema<br />
olulisemaks funktsiooniks on osalemine närvisüsteemi ja südame arengus (Britch, 2007;<br />
Talmade, 2008). EGFR ja tema ligandid on signaaliülekande molekulid, mis on seotud<br />
erinevate rakufunktsioonidega, nagu rakkude proliferatsioon, diferentseerumine ja kudede<br />
areng (Herbst, 2004).<br />
MFAP5 veel üks prioritiseeritud kandidaatgeen, vastutab bioloogiliste radade<br />
klasterdusanalüüsi põhjal kollageeni fibrillide- või ekstratselulaarse maatriksi<br />
organisatsiooni eest. Ekspresseerub peamiselt silelihastes ja müotsüütides.<br />
MFAP5 geen kodeerib 25 kDA mikrofibrillidega seotud glükoproteiine (Gibson et al.,<br />
1996). MFAP5 stabiliseerib tüüp I kollageeni ja seega mängib olulist rolli ekstratsellulaarse<br />
maatriksi homeostaasis (Lemaire et al., 2005).<br />
Sarnaselt MFAP5 geeniga, on PDZRN3 ekstratsellulaarse maatriksi ja fibrillaarse kollageeni<br />
komponent. Ekspressioon toimub lihastes ning mitmed artiklid viitavad sellele, et tegemist<br />
on geeniga, mis mängib olulist rolli osteoblastide differentseerumisel (Honda et al., 2010).<br />
Osteoblastid on mononukleaarsed rakud, mis osalevad luu moodustumisel. Põhimõtteliselt,<br />
on osteoblastid spetsialiseerunud fibroplastid, mis ekspresseerivad lisaks fibroplastilise<br />
produktidele luude sialoproteiine ja ostekaltsiumi (Salentijn, 2007). Osteoblastid tootvad ka<br />
osteoidide maatriksit, mis koosneb enamasti tüüp I kollageenist (D`ippolito et al., 1999).<br />
Näidatud on ka, et PDZRN3 mängib olulist rolli lihaste differentseerumisel ja arengus<br />
(Honda et al., 2010).<br />
Viimaseks leitud kandidaatgeeniks on TBC1D19. Bioloogiliste radade analüüs ei näidanud<br />
tema põhifunktsiooniks seoseid kollageeniga või ekstratsellulaarse maatriksiga, kuigi leiti, et<br />
ekspressioon toimub fibroblastides, müotsüütides ja silelihastes. Hetkel ei ole nimetatud<br />
35
geen piisavalt uuritud, kuigi on leitud, et tema ennustatavaks funktsiooniks on<br />
odontoblastide polarisatsioon. Näidatud on ka see, et TBC1D19 kolokaliseeritud<br />
ekspressioon omab põhifunktsiooni dentiini moodustumisel (Choi et al., 2011). Dentiin<br />
koosneb kahest komponendist, mineraalne ja fibrilaarne kollageeni/mitte-kollageeni<br />
maatriks (Dayan et al., 1983). Tuleb mainida, et dentiini moodustumisel osalevad sellised<br />
maatriksmetalloproteinaasid nagu MMP-2 ja MMP-3 (Boushell et al., 2009, Dumas et al.,<br />
1985).<br />
Kokkuvõtteks võib väita, et antud uuringus saadud tulemused viidavad sellele, et<br />
<strong>kubemesonga</strong> geeniriskid võivad olla seotud kollageenide geeniga, tema häiretega või<br />
polümorfismidega. Samas peab silmas pidama ka seda, et kollageen on levinuim valk<br />
inimese organismis, seepärast pakub ainult üks kandidaatgeen NRG1 hetkel kõige rohkem<br />
huvi, kuna ta osaleb ekstratsellulaarse maatriksi düsassambleerumise protsessil ning lisaks<br />
on see ainuke geen, mis leiti mõlemast ülegenoomsest analüüsist: mehed ja naised koos ning<br />
mehed eraldi. Uurides NRG1 seoseid teiste geenidega, leiti, et NRG1 asub tugevas<br />
koekspressioonis geenidega MMP-10 ja PTGS2 (Prostaglandin-Endoperoxide Synthase 2).<br />
PTGS2 geen on seotud tsütokiinide aktiivsusega. Need omavahelised seosed näitavad, et<br />
NRG1 on kõige tõenäolisem kandidaatgeen <strong>kubemesonga</strong> jaoks ning vajab kindlasti<br />
edasiseid uuringuid.<br />
36
8 Kokkuvõte<br />
Kubemesong on üheks sagedasemaks kirurgiliseks patoloogiaks üle terve maailma.<br />
Tänapäeval eksisteerib palju erinevaid meetodeid <strong>kubemesonga</strong> kirurgiliseks ravimiseks,<br />
kuid haiguse etioloogia ei ole siiamani lõplikult selgeks tehtud. Kubemesonga patogenees on<br />
multifaktoriaalne ning geneetilised tegurid omavad kindlasti nišši <strong>kubemesonga</strong> tekkimisel.<br />
Antud magistriväitekirja eesmärgiks oli <strong>geneetiliste</strong> variatsioonide leidmine, mis<br />
suurendavad <strong>kubemesonga</strong> haigestumise riski. Selleks analüüsiti 8 911 794 SNP markerit<br />
3851 indiviidil Eesti populatsioonist. Analüüsimaks <strong>geneetiliste</strong> variantide mõju<br />
<strong>kubemesonga</strong>le, kasutasime logistilise regressiooni mudelit. SNP markereid analüüsides<br />
kasutati aditiivset mudelit ning kovariaatidena kasutati sugu ja vanust.<br />
Antud uuringu põhjal ei tuvastatud ühtegi ülegenoomselt statistiliselt olulist assotsiatsiooni.<br />
Seetõttu võiks arvata, et <strong>kubemesonga</strong>ga pole seotud väike hulk tugeva mõjuga geene vaid<br />
pigem suurem hulk geene, mis kõik on väikese relatiivse riskiga. Lisateguriks on ka see, et<br />
<strong>kubemesonga</strong> fenotüüp on raskesti klassifitseeritav.<br />
Uurides assotsiatsioone, mille P-väärtuse nivoo jäi alla 10 -5 , identifitseeriti 35<br />
assotsiatsiooni, mille hulgast 5 on seotud <strong>kubemesonga</strong> fenotüüpidega ning on seetõttu<br />
potentsiaalsed kandidaatgeenid. Need on HTRA3, NRG1, MFAP5, PDZRN3 ning<br />
TBC1D19. Kõik need geenid on seotud kas kollageeniga või ekstratsellulaarse maatriksiga<br />
ning on varemteostatud uuringutes välja pakutud kui kandidaatgeenid. Mehi eraldi<br />
analüüsides ning võrreldes tulemusi kogu andmestiku analüüsi tulemusega, leidsime, et<br />
mõlemas analüüsis esines parimate tulemuste hulgas geen NRG1. See on ainuke geen antud<br />
nimekirjast, mis on seotud ekstratsellulaarse maatriksi düsassambleerumisega.<br />
Kuna antud uuringu käigus ei õnnestunud tuvastada ülegenoomselt statistiliselt olulisi<br />
assotsiatsioone, on tulevikuplaaniks analüüse korrata suurema valimiga ning uuringu<br />
replitseerimine sõltumatus kohordis.<br />
37
9 Summary<br />
Repair of inguinal hernia is one of the most common operations in general surgery. Thus<br />
there are many methods of inguinal hernia repair, etiology of hernia formation still poorly<br />
understood. The cause of inguinal hernia is multifactorial and previous studies provide<br />
evidence for a genetic component of the disease. The aim of the present study has been<br />
identifying genetic loci that can be associated with inguinal hernia in Estonian population.<br />
In the present study 8 911 794 markers for 3851 were analysed for individuals from Estonia<br />
population. The logistic regression method was used to analyse inguinal hernia data and<br />
covariates sex and age were used. Markers were tested using an additive model.<br />
In this study genome-wide statistical significant associations were not identified. Our results<br />
suggest, that there are no genes with large effects to hernia but rather many genes all having<br />
small relative risks. Additionally, the phenotype of disease is complex and the selection of<br />
cases and controls can be suboptimal.<br />
The associations with P-value less than 10 -5 revealed 35 loci containing 5 loci, which<br />
potentially are novel candidate loci for inguinal hernia. These loci were near or within<br />
HTRA3, NRG1, MFAP5, PDZRN3 and TBC1D19 gene regions. All this genes are<br />
associated with collagen or extracellular matrix, which have been mentioned in previous<br />
studies of inguinal hernia. In additional analysis, men were analysed separately. Both<br />
analysis – men separately and all individuals, revealed the same locus, NRG1. Interestingly,<br />
this gene is associated with collagen diassamble.<br />
Even through present genome-wide association study didn’t identify statistically significant<br />
results, several interesting novel loci were found for inguinal hernia. To validate the results,<br />
a replication study must be considered using independent cohort data.<br />
38
Tänuavaldused<br />
Autor tänab dr. Taie Kaasikut haigusjuhtude valiku eest.<br />
Aurot tänab Tõnu Eskot abi eest geeniekspressiooni analüüsil.<br />
Autor tänab juhendajat Reedik Mägi kvaliteedi-kontrolli ja imputeerimise teostamise eest.<br />
Autor tänab Viljo Sood proovide genotüpiseerimise teostamise abi eest.<br />
Samuti tänab autor kõiki laborikaaslasi meeldiva tööatmosfääri loomise eest.<br />
Autor tänab ka kõiki Eesti Geenivaramu doonoreid.<br />
Autori siiras tänu kuulub pereliikmetele ja sõpradele toetamise ja kaasaelamise<br />
eest.<br />
Eelkõige soovib autor tänada oma juhendajaid Evelin Mihailovit, Reedik Mägi ja professor<br />
Andres Metspalu suunamise, innustamise ning suurejooneliste visioonide eest.<br />
39
10 Kasutatud kirjandus<br />
Abrahamson J (1998) Etiology and pathophysiology of primary and reccurent groin hernia<br />
formation. Surg Clin North Am 78:953-72<br />
Aren A, Gökce AH, Gökce FS, Dursun N (2011) Roles on matrix metalloproteinases in the<br />
etiology of inguinal hernia. Hernia 15:667 - 671<br />
Bay-Nielson M, Kehlet H, Strand L, Malmstrom J, Andersen FH, Wara P, Juul P, Callesen<br />
T (2011) Quality assessment of 26 304 herniorrhaphies in Denmark: a prospective<br />
nationwide study. Lancet 358:1124-1128<br />
Bellon JM, Bajo A, Ga-Honduvilla N, Gimeno MJ, Pacual G, Guerrero A, Bujan J (2001)<br />
Fibroplasts from the transversalis fascia of young patients with direct inguinal hernias show<br />
constitutive MMP-2 overexpression. Ann Surg 233:287-91<br />
Britsch S (2007) The neuregulin-I/ErbB signaling system in development and disease. Adv<br />
Anat Embryol Cell Biol 190: 1–65<br />
Burton PR, Hansell AL, Fortier I, Manolio TA, Khoury MJ et al. (2009) Size matters: just<br />
how big is BIG?: Quantifying realistic sample size requirements for human genome<br />
epidemiology. Int J Epidemiol 38:263-73<br />
Choi SJ, Song IS, Feng JQ, Gao T, Haruyama N, Gautam P, Robey PG, Hart T (2010)<br />
Mutant DLX 3 disrupts odontoblast polarization and dentin formation. Devol Bio 344(2):<br />
682-692<br />
Clayton D, Walker NM, Smyth DJ, Pask R, Cooper JD et al., (2005) Population structure,<br />
differential bias and genomic control in a large scale, case-control association study. Nature<br />
Genet 37:1243-1246<br />
D’ippolito G, Schiller P, Ricordi C, Roos BA, Howard GA (1999) Age-Related Osteogenic<br />
Potential of Mesenchymal Stromal Stem Cells from Human Vertebral Bone Marrow.<br />
Journal of Bone and Mineral Research 14 (7): 1115–1122.<br />
Dayan D, Binderman I, Mechanic GL (1983) A Preliminary Study of Activation of<br />
Collagenase in Carious Human Dentin Matrix. Archives of Oral Biol 28(2):185–187.<br />
Devlin B, Roeder K (1999) Genomic control for association studies. Biometrics 55:997-<br />
1004<br />
Duerr RH, Taylor KD, Brant SR, Rioux JD, Silver MS et al., (2006) A genome-wide<br />
association study identifies IL23R as an inflammatory bowel disease gene. Science 314:<br />
1461-1463<br />
Dumas J, Hurion N, Weill R, Keil B (1985) Collagenase in mineralized tissues of human<br />
teeth. Fed of Eur Biochem Societies. 187(1):51–55.<br />
40
Easton DF, Pooley KA, Dunning AM, Pharoah PD, Thompson D et al., (2007) Genomewide<br />
association study identifies novel breast cancer susceptibility loci. Nature 447, 1087-<br />
1093<br />
Fallgatter AJ, Herrmann MJ, Hohoff C, Ehlis AC, Jarczok TA, Freitaf CM, Deckert J<br />
(2006) DTNBP1 (Dysbindin) Gene Variants Modulate Prefrontal Brain Function in Healthy<br />
Individuals. Neuropsychopharmacology 31(9): 2002-2010<br />
Freedman ML, Reich D, Penney KL, McDonald G, Mignault AA et al., (2004) Assessing<br />
the impact of population stratification on genetic association studies. Nature Genet 36:388-<br />
393<br />
Friedman DW, Boyd CD, Norton P, Greco RS, Boyarski AH, Mackenzie JW, Deak SB<br />
(1993) Increases in type III collagen gene expression and protein synthesis in patients with<br />
inguinal hernias. Ann Surg 218:754-60<br />
Gabriel SB, Schaffner SF, Nguyen H, Moore JM, Roy J et al. (2002) The structure of<br />
haplotype blocks in the human genome. Science 296:2225-2229<br />
Geissler B, Anthuber M (2011) Chirurgie der Leisten- und Schenkelhernien. Chirurg<br />
82:451-465<br />
Gibson MA, Hatzinikolas G, Kumaratilake JS, Sandberg LB, Nicholl JK, Sutherland GR,<br />
Cleary EG (1996) Further characterization of proteins associated with elastic fiber<br />
microfibrils including the molecular cloning of MAGP-2 (MP25). J Biol Chem 271 (2):<br />
1096–103<br />
Grosfeld JL (1989) Current concepts in inguinal hernia in infants and children. World J<br />
Surg 13:506<br />
Gudmundsson J, Sulem P, Manolescu A, Amundadottir LT, Gudbjartsson D et al., (2007)<br />
Genome-wide association study identifies a second prostate cancer susceptibility variant at<br />
8q24. Nature Genet 39:631-637<br />
Hayakawa A, Fujimoto K, Ibayashi H (1982) Two cases of Ehlers-Danlos syndrome with<br />
gastrointestinal complications. Gastroenterol Jpn 17:61-67<br />
Herbst RS (2004) Review of epidermal growth factor receptor biology. Int. J. Radiat.<br />
Oncol. Biol. Phys. 59 (2 Suppl): 21–6<br />
Hirschhorn JN, Lohmueller K, Byrne E and Hirschhorn K (2002) A comprehensive review<br />
of genetic association studies. Genet. Med. 4:45-61<br />
Honda T, Yamamoto H, Ishii A, Inui M (2010) PDZRN3 Negatively Regulates BMP-2induced<br />
Osteoblasr Differentation through Inhibition of Wnt Signaling. Mol Biol Cell 18:<br />
3269-3277<br />
Howson JM, Barrat BJ, Todd JA, Cordell HJ (2005) Comparison of population- and family<br />
– based methods for genetic association analysis in the presence of interacting loci. Genet<br />
Epidemiol 29:51-67<br />
41
Jenkins JT, O`Dwyer PJ (2008) Inguinal Hernias. BMJ 336: 269-272<br />
Junge K, Klinge U, Rosch R, Mertens PR, Kirch J, Klosterhalfen B, Lynen P, Schumpelick<br />
V (2004) Decrease collagen type I/III ration in parients with recurring hernia after<br />
implantation of alloplastic prostheses. Langenbecks Arch Surg 389:17-22<br />
Kingsnorth A, LeBlanc K (2003) Hernias: inguinal and incisional. Lancet 362:1561-71<br />
Knowler WC, Williams RC, Pettitt DJ, Steinberg AG (1988) Gm3;5,13,14 and type 2<br />
diabetes mellitus: an association in American Indians with genetic admixture. Am J Hum<br />
Genet 43:520-526<br />
Kähäri VM, Saarialho-Kere U (1997) Matrix metalloproteinases in skin. Exp Dermatol<br />
6:199-213<br />
Lander ES et al, (2001) Initial sequencing and analysis of the human genome. Nature<br />
409:860–921<br />
Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC (2001) Initial sequencing and<br />
analysis of the human genome. Nature 409:860-921<br />
Lau H, Fang C, Yuen WK, Patil NG (2007) Risk factors for inguinal hernia in adult males:<br />
a case-control study. Surgery 141:262-6<br />
Lemaire R, Korn JH, Shipley JM, Lafyatis R (2005)Increased expression of type I collagen<br />
induced by microfibril-associated glycoprotein 2: novel mechanistic insights into the<br />
molecular basis of dermal fibrosis in scleroderma. Arthritis and Rheumatism 52(6): 1812-<br />
1823<br />
Liem MS, van der GY, Breemer FA, van Vroohoven TJ (1997) Increased risk fot inguinal<br />
hernia in patients with Ehlers-Danlos syndrome. Surgery 122:114-115<br />
Lynen JP, Klinge U, Mertens PR (2006) Hernia disease and collagen gene regulation: are<br />
there clues for intervention. Hernia 10:486-491<br />
Lynen JP, Mertens P.R, Klinge U, Schumpelick V (2004) The biology of hernia formation.<br />
Surgery 136:1-4<br />
Marchini J, Cardon LR, Phillips MS and Donnelly P (2004) The effects of human<br />
population structure on large genetic association studies. Nature Genet 36:512-517<br />
Marchini J, Howie B (2010) Genotype imputation for genome-wide association studies.<br />
Nature Genet 11:499-511<br />
Mautner J, Behrends U, Hortnagel K, Briemeier M, Hammerschmidt W, Strobl L,<br />
Bornkamm G.W, Polack A (1996) c-myc expresiion is actyvated by the immunoglobulin<br />
kappa-enchancers from a distance of at least 30 kb but not by elements located within 50 kb<br />
of the unaltered c-myc locus in vivo. Oncogene 12:1299 – 1307<br />
42
Mertens PR, Harendza S, Pollock AS, Lovett DH (1997) Glomerular mesangial cellspecific<br />
transactivation of matrix metalloproteinase 2atranscription is mediated by YB-1. J<br />
Biol Chem 272:22905 – 22912<br />
Mertens PR, Steinmann K, Alfonso-Jaume MA, En-Nia A, Sun Y, Lovett DH (2002)<br />
Combinatorial interactions of p53, AP2 and YB-1 with a single enchancer element regulate<br />
gelatinase a expression in neoplastic cells. J Biol Chem 277:24875-24882<br />
Motlagh B, MacDonald JR, Tarnoplosky MA (2005) Nutritional inadequacy in adults with<br />
muscular dystrophy. Muscle Nerve. 31(6):713-8.<br />
Murruste M, Lepner U, Vaasna T, Varik K, Sõrmus A (2005) Kõhuseina songad. Eesti Arst<br />
84(11): 823-839<br />
Nie G, Li Y, Hale K, Okada H, Manuelpillai U, Wallace EM, Salamonsen LA (2006) Serine<br />
peptidase HTRA3 is closely associated with human placental development and is elevated in<br />
pregnancy serum . Biology of Reproduction 74: 2 366-374<br />
Ninomiya Y, Olsen BR (1984) Synthesis ans characterizatio of cDNA ecoding a cartilagespecific<br />
short collagen. Proc Natl Acad Sci USA 81:3014-3018<br />
Paajanen H, Scheinin T, Vironen J (2010) Commentary: Nationwide analysis of<br />
complications related to inguinal hernia surgery in Finland: a 5 year register study of 55,000<br />
operations. The American Journal of Surgery 199:746-751<br />
Pans A, Pierard GE, Albert A (1999) Immunohistochemical study of the rectus sheath and<br />
transversalis fascia in adult groin hernias. Hernia 3:45<br />
Pans A, Pierard GE, Albert A et al., (1997) Adult groin hernias: New insight into their<br />
biomechanical characteristics. Eur J Clin Invest 27:863<br />
Petterson FH, Anderson CA, Geraldine MC, Barrett JC, Cardon LR, Morris AP, Zondervan<br />
KT (2009) Marker selection for genetic case-control association studies. Nature Prot Genet<br />
4:743-750<br />
Plenge RM, Cotsapas C, Davies L, Price AL, de Bakker PW et al., (2007) Two independent<br />
alleles at 6q23 associated with risk of rheumatoid arthritis. Nature Genet 39:1477-1482<br />
Primatesta P, Goldacre MJ (1996) Inguinal hernia repair: incidence of elective and<br />
emergency surgery, readmission and mortality. Int J Epidemiol 25:835-839<br />
Quintas M, Rodrigues CJ, Yoo JH et al., (2000) Age related changes in the elastic fiber<br />
system of the interfoveolar ligament. Rev Hosp Clin Fac Med S Paulo 55:83-6<br />
Read RC (1984) The development of inguinal herniorrhaphy. Surg Clin North Am 64:185-<br />
196<br />
Reich DE, Lander ES (2001) On the allelic spectrum of human disease. Trends Genet<br />
17:502-510<br />
43
Risch N, Merikangas K (1996) The future of genetic studies of complex human disease.<br />
Science 273:1516-1517<br />
Robert M, Zollinger Jr (2004) An updated traditional classification of inguinal hernias.<br />
Hernia 8:318-322<br />
Rodrigues Jr A, Rodrigues CJ, Pereira da Chunha AN, Yoo J (2002) Quantitative analysis<br />
of collagen and elastic fibers in the transversalis fascia in direct and indirect inguinal hernia.<br />
Rev. Hosp. Clin. Fac. Med. S. Paulo 57(6):265-270<br />
Saarialho-Kere UK (1998) Patterns of matrix metalloproteinase and TIMP expression in<br />
chronic ulcers. Arch Dermatol Res 290:47-54<br />
Sanna S, Jackson AU, Nagaraja R, Willer CJ, Chen WM et al., (2007) Common variants in<br />
the CDF5-UQCC region are associated with variation in human height. Nature Genet<br />
40:198-203<br />
Scuteri A, Sanna S, Chen WM, Uda M, Albai G et al., (2007) Genome-wide association<br />
scans shows genetic variants in the FTO gene are associated with obesity-related traits. Plos<br />
Genet 3:e115<br />
Si Z, Bhardwaj R, Rosch R, Mertens PR, Klosterhalfen B, Klinge U, Rhanjit B, Rene P. M<br />
(2002) Impaired balance of type I and type III procollagen mRNA in cultured fibroplasts of<br />
patients with incisional hernia. Surgery 131:324 – 331<br />
Sladek R, Rocheleau G, Rung J, Dina C, Shen L et al., (2007) A genome–wide association<br />
study identifies novel risk loci for 2 type diabetes. Nature 445:881-885<br />
Spencer CC, Su Z, Donelly P, Marchini J (2009) Designing genome-wide association<br />
studies: sample size, power, imputation, and the choise of genotyping chip. PLos Genet 5(5):<br />
e1000477.<br />
Straub RE, Jiang Y, MacLean CJ, Ma Y, Webb BT, Myakishev MV et al (2002). Genetic<br />
variation in the 6p22.3 DTNBP1, the human ortholog of the mouse dysbindin gene, is<br />
associated with schizophrenia. Am J Hum Genet 71: 337–348.<br />
Zheng H, Si Z, Kasperk R, Bhardwaj R.S, Schumpelick V, Klinge U, Klosterhalfen B<br />
(2002) Reccurent inguinal hernia: disease of collagen matrix? World J Surg 26:401-8<br />
Zondervan KT, Cardon LR (2007) Designing candidate gene and genome-wide casecontrol<br />
association studies. Nature Protoc 2:2492-2501<br />
Talmage DA (2008) Mechanisms of neuregulin action. Novartis Found Symp 289: 74 - 84<br />
Wagh PV, Read RC (1971) Collagen deficency in rectus sheath of pathients with inguinal<br />
herniation Proc Soc Exp Bio Med 137:382<br />
Wang WY, Barratt BJ, Clayton DG, Todd JA (2005) Genome-wide association studies:<br />
theoretical and practical concerns. Nature Rev Genet 6:109-18<br />
44
Westra HJ, Jansen RC, Fehrmann RS, te Meerman GJ, van Heel D, Wijmenga C, Franke L<br />
(2011) MixupMapper: correcting sample mix-ups in genome-wide datasets increases power<br />
to detect small genetic effects. Bioinformatics 27(15):2104-11<br />
Willer CJ, Sanna S, Jackson AU, Scuteri A, Bonnycastle LL et al., (2008) Newly identified<br />
loci that influence lipid concentrations and risk of coronary artery disease. Nature Genet<br />
40:161-169<br />
WTCCC (2007) Genome-wide association study of 14,000 cases of seven common diseases<br />
and 3,000 shared controls. Nature 447:661-678<br />
Yamada Y, Ando F, Niino N, Shimokata H (2005) Association of a -1997G→T<br />
polymorphism of the collagen Ialpha1 gene with bone mineral density in postmenopausal<br />
Japanese woman. Hum Biol 77:27 – 36<br />
45
11 Kasutatud veebilehed<br />
1000 Genoomi Projekt http://www.1000genomes.org<br />
Eesti Geenivaramu http://www.geenivaramu.ee<br />
Illumina Inc. http://www.illumina.com<br />
R statistikapakett http://www.r-project.org/<br />
HapMap2 Projekt http://www.hapmap.com<br />
PLINK toolset http://pngu.mgh.harvard.edu/~purcell/plink/<br />
Affymetrix Inc. http://www.affymetrix.com<br />
Gene Network http://129.125.165.109:8080/GeneNetwork/<br />
LocusZoom https://statgen.sph.umich.edu/locuszoom/genform.php?type=yourdata<br />
GTOOL http://www.well.ox.ac.uk/~cfreeman/software/gwas/gtool.html<br />
IMPUTE v2 http://mathgen.stats.ox.ac.uk/impute/impute_v2.html<br />
SNPTEST v2 https://mathgen.stats.ox.ac.uk/genetics_software/snptest/snptest.html<br />
Catalog of Published Genome-Wide Association Studies<br />
http://www.genome.gov/gwastudies/<br />
RHK-10 http://www2.sm.ee/rhk/<br />
46
12 Lisad<br />
47
Lisa 1. Regionaalsed joonised kõikide indiviidide assotsiatsioonianalüüsi tulemustega.<br />
48
Lisa 1. (järg)<br />
49
Lisa 1. (järg)<br />
50
Lisa 1. (järg)<br />
51
Lisa 1. (järg)<br />
52
Lisa 1. (järg)<br />
53
Lisa 1. (järg)<br />
54
Lisa 1. (järg)<br />
55
Lisa 1.(järg)<br />
56
Lisa1. (järg)<br />
57
Lisa 2. Regionaalsed joonised meeste assotsiatsioonianalüüsi tulemustega.<br />
58
Lisa 2. (järg)<br />
59
Lisa 2. (järg)<br />
61
Lisa 2. (järg)<br />
62
Lisa 2. (järg)<br />
64
Lisa 2. (järg)<br />
65
Lisa 3. HTRA3 geenivõrgustik. Erinevate raku osadega seotud geenid on grupeeritud<br />
taustavärvi järgi.<br />
67
Lisa 4. MFAP5 geenivõrgustik. Erinevate raku osadega seotud geenid on grupeeritud<br />
taustavärvi järgi.<br />
68
Lisa 5. NRG1 geenivõrgustik. Erinevate raku osadega seotud geenid on grupeeritud<br />
taustavärvi järgi.<br />
69
Lisa 6. PDZRN3 geenivõrgustik. Erinevate raku osadega seotud geenid on grupeeritud<br />
taustavärvi järgi.<br />
70
Lisa 7. TBC1D19 geenivõrgustik. Erinevate raku osadega seotud geenid on grupeeritud<br />
taustavärvi järgi.<br />
71