Undersøgelse af ikke lineære sammenhænge mellem codon ...

Undersøgelse af ikke lineære sammenhænge mellem codon ... Undersøgelse af ikke lineære sammenhænge mellem codon ...

17.09.2013 Views

Den beregnede ”dicodon CAI” er blevet sammenlignet med ekspressionsværdierne ved Pearson korrelation, for at se om der er en sammenhæng mellem CAI-værdien og ekspressionen af genet. Korrelationsværdier for dicodon CAI: log\antal gener 24 100 250 5545(alle) log til Exp. 0.1817213 0.3170762 0.3081468 0.3201857 Ikke log 0.2399138 0.3900954 0.3730618 0.3823349 Som det ses af tabellen, er der en tendens til at korrelationen mellem ekspressionsværdierne og dicodon CAI stiger fra 24 til 100 udvalgte gener, hvorefter den falder for 250 udtagne gener. Det samme gjorde sig gældende for ”optimal CAI”. Det skal dog bemærkes, at korrelationen stiger for alle gener. Dette skyldes, at alle gener bidrager med dicodons, så korrelationen burde stige, da der er mange dicodons at beregne RSCU ud fra. Korrelationen er dog stadig så lav, at denne CAI-værdi ikke kan benyttes til forudsigelse af højtudtrykte gener. Grunden til de høje CAI-værdier skal igen findes i w, der nu er langt større end Li og Sharps (størrelsesmæssigt: 64 værdier før mod 3721 nu), men med mange høje værdier. Der er dog 0’er, men disse optræder kun fordi det aktuelle dicodon ikke er i de højtudtrykte gener. 18

Diskussion Den optimale CAI forudsiger langt flere højtudtrykte gener end Li og Sharps CAI. Dette skyldes w, vis værdier er højere for optimal CAI, end de er oprindeligt. Ses der på korrelationen mellem den optimale CAI og de faktiske ekspressionsværdier for gener, ses det, at der er lav korrelation, hvorimod der for den oprindelige CAI er høj korrelation med ekspressionen af generne. For at forklare dette, er der set på basesammensætningen i de udvalgte gener. Basesammensætningen er afgørende for hvilken temperatur organismen kan leve ved. Jo flere A’er og T’er, jo højere temperaturer kan den klare, uden at DNA’et smelter. Samtidig skal der ikke være for mange, så organismen ikke selv kan smelte sin DNA og derved udrykke gener. Basesammensætning for S. cerevisiae: Udtagne gener\base A C G T 24 31,56% 19,15% 20,94% 28,35% 100 32,40% 19,37% 20,59% 27,64% 250 32,73% 19,21% 20,38% 27,68% Hele organismen 32,79% 19,15% 20,43% 27,63% De høje CAI-værdier kan ikke forklares ud fra basesammensætningen i de udtagne gener, da den procentvise opdeling er relativ stabil. Der er ikke noget tidspunkt hvor rækkefølgen for den base der benyttes mest ændres. (Rækkefælgen er: A, T, G, C) For dicodon CAI blev CAI-værdierne også større end for den oprindelige CAI. Her skal grunden igen findes i w, der overordnet indeholder mange store værdier, i forhold til Li og Sharps w. S. cerevisiae er for ”lille” en organisme at beregne dicodon CAI på, da ikke alle dicodons optræder i de højtudtrykte gener. Dette medfører, at grundlaget for RSCU beregningen er ikke optimal, da der vil optræde 0’er. Disse overføres til w og giver sig dermed udtrykt i CAI, hvor en lavere CAI beregnes for gener med dicodons der ikke optræder i de højtudtrykte gener. Dette betyder igen, at korrelationen bliver lav, da nogle dicodons ikke vægtes, og der dermed opstår fejl i CAI. 19

Den beregnede ”di<strong>codon</strong> CAI” er blevet sammenlignet med ekspressionsværdierne ved Pearson<br />

korrelation, for at se om der er en sammenhæng <strong>mellem</strong> CAI-værdien og ekspressionen <strong>af</strong> genet.<br />

Korrelationsværdier for di<strong>codon</strong> CAI:<br />

log\antal gener 24 100 250 5545(alle)<br />

log til Exp. 0.1817213 0.3170762 0.3081468 0.3201857<br />

Ikke log 0.2399138 0.3900954 0.3730618 0.3823349<br />

Som det ses <strong>af</strong> tabellen, er der en tendens til at korrelationen <strong>mellem</strong> ekspressionsværdierne og<br />

di<strong>codon</strong> CAI stiger fra 24 til 100 udvalgte gener, hvorefter den falder for 250 udtagne gener. Det<br />

samme gjorde sig gældende for ”optimal CAI”. Det skal dog bemærkes, at korrelationen stiger for<br />

alle gener. Dette skyldes, at alle gener bidrager med di<strong>codon</strong>s, så korrelationen burde stige, da der<br />

er mange di<strong>codon</strong>s at beregne RSCU ud fra. Korrelationen er dog stadig så lav, at denne CAI-værdi<br />

<strong>ikke</strong> kan benyttes til forudsigelse <strong>af</strong> højtudtrykte gener.<br />

Grunden til de høje CAI-værdier skal igen findes i w, der nu er langt større end Li og Sharps<br />

(størrelsesmæssigt: 64 værdier før mod 3721 nu), men med mange høje værdier. Der er dog 0’er,<br />

men disse optræder kun fordi det aktuelle di<strong>codon</strong> <strong>ikke</strong> er i de højtudtrykte gener.<br />

18

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!