Undersøgelse af ikke lineære sammenhænge mellem codon ...
Undersøgelse af ikke lineære sammenhænge mellem codon ... Undersøgelse af ikke lineære sammenhænge mellem codon ...
Den beregnede ”dicodon CAI” er blevet sammenlignet med ekspressionsværdierne ved Pearson korrelation, for at se om der er en sammenhæng mellem CAI-værdien og ekspressionen af genet. Korrelationsværdier for dicodon CAI: log\antal gener 24 100 250 5545(alle) log til Exp. 0.1817213 0.3170762 0.3081468 0.3201857 Ikke log 0.2399138 0.3900954 0.3730618 0.3823349 Som det ses af tabellen, er der en tendens til at korrelationen mellem ekspressionsværdierne og dicodon CAI stiger fra 24 til 100 udvalgte gener, hvorefter den falder for 250 udtagne gener. Det samme gjorde sig gældende for ”optimal CAI”. Det skal dog bemærkes, at korrelationen stiger for alle gener. Dette skyldes, at alle gener bidrager med dicodons, så korrelationen burde stige, da der er mange dicodons at beregne RSCU ud fra. Korrelationen er dog stadig så lav, at denne CAI-værdi ikke kan benyttes til forudsigelse af højtudtrykte gener. Grunden til de høje CAI-værdier skal igen findes i w, der nu er langt større end Li og Sharps (størrelsesmæssigt: 64 værdier før mod 3721 nu), men med mange høje værdier. Der er dog 0’er, men disse optræder kun fordi det aktuelle dicodon ikke er i de højtudtrykte gener. 18
Diskussion Den optimale CAI forudsiger langt flere højtudtrykte gener end Li og Sharps CAI. Dette skyldes w, vis værdier er højere for optimal CAI, end de er oprindeligt. Ses der på korrelationen mellem den optimale CAI og de faktiske ekspressionsværdier for gener, ses det, at der er lav korrelation, hvorimod der for den oprindelige CAI er høj korrelation med ekspressionen af generne. For at forklare dette, er der set på basesammensætningen i de udvalgte gener. Basesammensætningen er afgørende for hvilken temperatur organismen kan leve ved. Jo flere A’er og T’er, jo højere temperaturer kan den klare, uden at DNA’et smelter. Samtidig skal der ikke være for mange, så organismen ikke selv kan smelte sin DNA og derved udrykke gener. Basesammensætning for S. cerevisiae: Udtagne gener\base A C G T 24 31,56% 19,15% 20,94% 28,35% 100 32,40% 19,37% 20,59% 27,64% 250 32,73% 19,21% 20,38% 27,68% Hele organismen 32,79% 19,15% 20,43% 27,63% De høje CAI-værdier kan ikke forklares ud fra basesammensætningen i de udtagne gener, da den procentvise opdeling er relativ stabil. Der er ikke noget tidspunkt hvor rækkefølgen for den base der benyttes mest ændres. (Rækkefælgen er: A, T, G, C) For dicodon CAI blev CAI-værdierne også større end for den oprindelige CAI. Her skal grunden igen findes i w, der overordnet indeholder mange store værdier, i forhold til Li og Sharps w. S. cerevisiae er for ”lille” en organisme at beregne dicodon CAI på, da ikke alle dicodons optræder i de højtudtrykte gener. Dette medfører, at grundlaget for RSCU beregningen er ikke optimal, da der vil optræde 0’er. Disse overføres til w og giver sig dermed udtrykt i CAI, hvor en lavere CAI beregnes for gener med dicodons der ikke optræder i de højtudtrykte gener. Dette betyder igen, at korrelationen bliver lav, da nogle dicodons ikke vægtes, og der dermed opstår fejl i CAI. 19
- Page 1 and 2: Undersøgelse af ikke lineære samm
- Page 3 and 4: Indledning Protein kodes af RNA, de
- Page 5 and 6: Data For at lave CAI beregninger, s
- Page 7 and 8: Normalisering af data For at kunne
- Page 9 and 10: Geometrisk gennemsnit Herefter bere
- Page 11 and 12: Beregning af optimal CAI Der beregn
- Page 13 and 14: Resultater Li og Sharps CAI Herunde
- Page 15 and 16: Pearson korrelation for ikke logari
- Page 17: Dicodon CAI For at få et overblik
- Page 21 and 22: Konklusion Det er blevet undersøgt
- Page 23 and 24: [8] Cheng Li and Wing Hung Wong, Mo
- Page 25 and 26: Normalisering af data: Sc.data.qsp
- Page 27 and 28: Koble genudtryk med gennavne source
- Page 29 and 30: Til Optimal CAI beregning kun gener
- Page 31 and 32: Beregning af CAI wk=0 CAI.vector.10
- Page 33 and 34: Beregning af CAI wk=0 CAI.vector.24
- Page 35 and 36: Beregning af CAI wk=0 CAI.vector.25
- Page 37 and 38: For alle gener...De 100 højst udtr
- Page 39 and 40: For alle gener...For de 24 højst u
- Page 41 and 42: For alle gener...De 250 højst udtr
- Page 43 and 44: Sammenligning mellem Li og Sharps C
- Page 45 and 46: Sammensætning af gener i dicodons:
- Page 47: Sammenligning mellem dicodon CAI og
Den beregnede ”di<strong>codon</strong> CAI” er blevet sammenlignet med ekspressionsværdierne ved Pearson<br />
korrelation, for at se om der er en sammenhæng <strong>mellem</strong> CAI-værdien og ekspressionen <strong>af</strong> genet.<br />
Korrelationsværdier for di<strong>codon</strong> CAI:<br />
log\antal gener 24 100 250 5545(alle)<br />
log til Exp. 0.1817213 0.3170762 0.3081468 0.3201857<br />
Ikke log 0.2399138 0.3900954 0.3730618 0.3823349<br />
Som det ses <strong>af</strong> tabellen, er der en tendens til at korrelationen <strong>mellem</strong> ekspressionsværdierne og<br />
di<strong>codon</strong> CAI stiger fra 24 til 100 udvalgte gener, hvorefter den falder for 250 udtagne gener. Det<br />
samme gjorde sig gældende for ”optimal CAI”. Det skal dog bemærkes, at korrelationen stiger for<br />
alle gener. Dette skyldes, at alle gener bidrager med di<strong>codon</strong>s, så korrelationen burde stige, da der<br />
er mange di<strong>codon</strong>s at beregne RSCU ud fra. Korrelationen er dog stadig så lav, at denne CAI-værdi<br />
<strong>ikke</strong> kan benyttes til forudsigelse <strong>af</strong> højtudtrykte gener.<br />
Grunden til de høje CAI-værdier skal igen findes i w, der nu er langt større end Li og Sharps<br />
(størrelsesmæssigt: 64 værdier før mod 3721 nu), men med mange høje værdier. Der er dog 0’er,<br />
men disse optræder kun fordi det aktuelle di<strong>codon</strong> <strong>ikke</strong> er i de højtudtrykte gener.<br />
18