01.06.2013 Views

versione fondo bianco - Bgbunict.it

versione fondo bianco - Bgbunict.it

versione fondo bianco - Bgbunict.it

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

STRUTTURA E FUNZIONE DEL GENE<br />

EVOLUZIONE DEI GENOMI


Lodish – Molecular Cell Biology<br />

GENOME: total genetic information carried by a cell or organism<br />

GENE: physical and functional un<strong>it</strong> of hered<strong>it</strong>y, which carries<br />

information from one generation to the next. In molecular terms,<br />

<strong>it</strong> is the entire DNA sequence (including exons, introns and<br />

noncoding transcriptional control regions) necessary for<br />

production of a functional protein or RNA


Struttura del GENE


GENE procariotico<br />

Genoma di E. coli


GENE procariotico<br />

OPERONE<br />

Sequenze regolatrici a monte<br />

Sequenze codificanti<br />

Sequenze terminatrici<br />

della sequenza codificante


GENE procariotico


GENE procariotico<br />

Promotori


GENE procariotico<br />

Sequenze codificanti<br />

ORF<br />

(Open Reading Frame)<br />

ATGGTATAT-------------------------------TAA<br />

MET VAL TYR STOP


GENE procariotico<br />

A B C<br />

Promotore Operone<br />

Sequenze codificanti<br />

Terminatore


GENE procariotico<br />

A B C<br />

Promotore Operone<br />

Sequenze codificanti<br />

mRNA mRNA mRNA<br />

Proteina Proteina Proteina<br />

Terminatore


Repressione<br />

GENE procariotico<br />

A B C<br />

Promotore Operone<br />

Sequenze codificanti<br />

Nessuna espressione<br />

Terminatore


GENI DELLA I CLASSE<br />

GENI DELLA II CLASSE<br />

GENI DELLA III CLASSE<br />

GENE EUCARIOTICO<br />

RNA RIBOSOMIALE – rRNA (28S-5,8S e 18s)<br />

RNA MESSAGGERO – mRNA<br />

Piccoli RNA nucleari – snRNA<br />

microRNA<br />

RNA TRANSFER – tRNA<br />

Piccoli rna nucleolari – snorna<br />

Piccoli rna c<strong>it</strong>oplasmatici - scrna


GENE EUCARIOTICO


GENE EUCARIOTICO


GENE EUCARIOTICO


GENE EUCARIOTICO


GENE EUCARIOTICO


Promotore<br />

GENE EUCARIOTICO


Promotore<br />

GENE EUCARIOTICO


Sequenza<br />

codificante<br />

modulare<br />

GENE EUCARIOTICO


GENE EUCARIOTICO<br />

Segnale di<br />

poliadenilazione


I geni eucariotici sono monocistronici<br />

Eccezioni: Un<strong>it</strong>à Un<strong>it</strong> di trascrizione policistroniche risolte in mRNA maturi<br />

monocistronici per trans-splicing<br />

trans splicing (es es in tripanosomi, nematodi,<br />

platelminti); uso di IRES, reinizio della traduzione o frameshift<br />

traduzionale<br />

I geni eucariotici non mostrano nessuna evidente<br />

relazione tra localizzazione e l’attiv<strong>it</strong> l attiv<strong>it</strong>à funzionale<br />

(functional functional clustering) clustering)<br />

o con l’espressione l espressione spazio-<br />

temporale<br />

Organizzazione genica negli eucarioti<br />

Eccezioni: Raggruppamento di geni con funzione correlata, quali geni<br />

Hox, Hox,<br />

geni per emoglobine e geni per immunoglobuline (duplicazioni in in<br />

tandem?)


Organizzazione genica negli eucarioti<br />

Alcuni geni eucariotici sono policistronici<br />

Taxon Ent<strong>it</strong>à Ent<strong>it</strong><br />

Tripanosomi (Euglenozoa<br />

( Euglenozoa) tutti gli RNA<br />

Cnidari alcuni RNA<br />

Platelminti (Metazoa ( Metazoa Acoelomata) Acoelomata pochi RNA<br />

Nematodi (Metazoa ( Metazoa Pseudocoelomata)<br />

Pseudocoelomata)<br />

molti RNA<br />

Ciona intestinalis/Oikopleura<br />

intestinalis Oikopleura dioica molti RNA<br />

Il processamento del precursore policistronico è associato al Trans<br />

Splicing delle estrem<strong>it</strong>à estrem<strong>it</strong> 5’ degli mRNA e alla poliadenilazione delle<br />

estrem<strong>it</strong>à estrem<strong>it</strong> 3’ per generare i trascr<strong>it</strong>ti monocistronici.<br />

monocistronici


Geni codificanti per proteine<br />

- geni presenti in unica copia (single ( single-copy copy genes) genes<br />

- geni omologhi presenti in copie multiple ed organizzati in famiglie geniche<br />

I membri di una stessa famiglia genica possono essere localizzati in<br />

unico cluster, dispersi, dispersi,<br />

o localizzati in più pi cluster:<br />

Geni in cluster:<br />

α-globin globin (7), growth hormone (5), Class I HLA heavy chain (20),…. (20),<br />

Geni dispersi: dispersi:<br />

Pyruvate dehydrogenase (2), Aldolase (5), PAX (>12),..<br />

Geni localizzati in più pi cluster:<br />

HOX (38 – 4), Histones (61 – 2), Olfactory receptors (>900 – 25),…<br />

25),<br />

25


La struttura dei geni eucariotici<br />

Nel genoma umano non si osserva una distribuzione omogenea dei<br />

geni. La più pi alta dens<strong>it</strong>à dens<strong>it</strong> genica si osserva nel chr 19, mentre il chr 13 e<br />

Y mostrano la più pi bassa dens<strong>it</strong>à.<br />

dens<strong>it</strong><br />

introne<br />

introne<br />

esone esone<br />

esone<br />

TSS<br />

Caratteristiche<br />

dei geni umani<br />

5’UTR UTR<br />

GENE<br />

mRNA<br />

TRASCRIZIONE<br />

CDS 3’UTR 3’UTR UTR<br />

Mediana Media<br />

Numero di esoni 7 8,8<br />

L introni (bp) 1023 3365<br />

L 5'UTR (bp) 240 300<br />

L CDS (bp) 1100 1340<br />

L 3'UTR (bp) 400 770<br />

L gene (bp) 14000 27000<br />

TRADUZIONE


I geni eucariotici presentano una grande varietà variet di strutture e dimensioni.<br />

Ad esempio nel genoma umano: umano<br />

Il più pi piccolo:<br />

tRNA GLU<br />

tRNA<br />

GLU (69<br />

La struttura dei geni eucariotici<br />

(69 bp) bp<br />

Il più pi grande:<br />

Distrofina (2.4 Mb, la sua<br />

trascrizione richiede circa 16h)<br />

Il numero di esoni può variare da 1 (geni privi di introni come molti geni per<br />

ncRNA, ncRNA,<br />

interferoni, istoni, ribonucleasi, HSP, GPCR, ecc.) sino a 363 (T<strong>it</strong>ina T<strong>it</strong>ina). ).<br />

Le dimensioni degli esoni e degli introni sono estremamente variabili. variabili.<br />

A fronte di esoni cost<strong>it</strong>u<strong>it</strong>i da pochi nucleotidi, l’esone l esone più pi grande è presente nel<br />

gene per ApoB (7.6 kbb). kbb).<br />

Anche le dimensioni degli introni possono variare da<br />

pochi nucleotidi fino a 800 kbp (gene WWOX). WWOX).<br />

Le proteine codificate possono variare nelle dimensioni da pochi residui (piccoli<br />

ormoni) sino a molte migliaia (T<strong>it</strong>ina ( T<strong>it</strong>ina, , 38.138 aa). aa).


La struttura dei geni eucariotici<br />

Gli introni dei geni altamente espressi sono circa 14 volte più pi corti<br />

dei geni scarsamente espressi.<br />

29


IHGSC, Nature 2001 409:860 409:860-921, 921, Tab. 35<br />

La struttura dei geni eucariotici: esoni<br />

La conservazione della dimensione degli esoni dall’uomo dall uomo<br />

al C. elegans suggerisce una sostanziale conservazione<br />

dei componenti dell’apparato dell apparato di splicing


IHGSC, Nature 2001 409:860 409:860-921, 921, Tab. 35<br />

La struttura dei geni eucariotici: introni<br />

I geni umani contengono introni mediamente più pi<br />

lunghi dei geni di C.elegans o Drosophila.<br />

Drosophila


GENE EUCARIOTICO<br />

Può un gene codificare per diverse proteine?


Uno stesso gene può codificare per proteine indirizzate a diversi<br />

compartimenti cellulari: cellulari:<br />

l’esempio esempio del gene NFS1<br />

La proteina codificata dal gene NFS1 rimuove lo zolfo dalla cisteina formando alanina. alanina.<br />

Questo gene utilizza<br />

s<strong>it</strong>i di inizio alternativi della trascrizione e quindi traduzione per generare una isoforma m<strong>it</strong>ocondriale ed<br />

una isoforma c<strong>it</strong>oplasmatica. c<strong>it</strong>oplasmatica.<br />

La selezione del s<strong>it</strong>o di inizio della traduzione è regolata dal pH c<strong>it</strong>osolico.<br />

c<strong>it</strong>osolico<br />

L’isoforma isoforma che codifica per la proteina m<strong>it</strong>ocondriale (457 aa) aa)<br />

contiene un peptide segnale e un<br />

dominio aminotrasnferasico.<br />

aminotrasnferasico.<br />

L’altra altra isoforma, isoforma,<br />

che deriva sa un s<strong>it</strong>o di inizio alternativo della trascrizione codifica per una proteina<br />

più pi corta (397 aa) aa)<br />

priva del peptide segnale ma contenente il dominio aminotransferasico.<br />

aminotransferasico.


GENE EUCARIOTICO<br />

Può un gene codificare per diverse proteine?<br />

X


Uno stesso gene può esprimere proteine con funzioni opposte: opposte:<br />

l’esempio esempio dell’attiv<strong>it</strong> dell attiv<strong>it</strong>à della Caspasi 9 (CASP9)<br />

La forma cost<strong>it</strong>utiva della proteina (CASP9, 9 esoni, esoni,<br />

416 aa) aa)<br />

induce<br />

apoptosi. apoptosi.<br />

Essa contiene un Caspase recru<strong>it</strong>ment domain (CARD) e un<br />

dominio caspasi Peptidase_C14.<br />

L’isoforma isoforma più pi corta della proteina (CASP9S, 5 esoni, esoni,<br />

266 aa) aa)<br />

contiene un dominio Caspase recru<strong>it</strong>ment domain (CARD) e un<br />

dominio tronco della Peptidase_C14. Questa isoforma è priva<br />

dell’attiv<strong>it</strong> dell attiv<strong>it</strong>à proteasica e agisce da inib<strong>it</strong>ore dell’apoptosi<br />

dell apoptosi. .


Splicing Alternativo<br />

Oltre il 90% dei geni umani è in grado di esprimere più pi di un<br />

trascr<strong>it</strong>to (ed è quindi soggetto a splicing alternativo). Le diverse<br />

isoforme di splicing possono avere specific<strong>it</strong>à specific<strong>it</strong> a livello di tessuto, di<br />

condizione fisiologica, o patologica.<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

17,635 Human genes<br />

1 2-5 6-10 11-20 21-30 31-50 >50<br />

Number of Transcripts/ Gene


Splicing alternativo e duplicazione genica sono inversamente correlati


GENE EUCARIOTICO<br />

Può un gene codificare per diverse proteine?


Definizione di GENE<br />

• La trascrizione di un gene si può arrestare in corrispondenza di di<br />

diversi<br />

terminatori<br />

Il gene per tp73L codifica per 10 trascr<strong>it</strong>ti alternativi, alternativi,<br />

e utilizza 2 promotori e 3 diversi<br />

terminatori della trascrizione


I geni possono essere sovrapposti<br />

I geni possono essere sovrapposti tra loro, nello stesso orientamento orientamento<br />

o in<br />

orientamento opposto, o anche essere completamente contenuti in altri<br />

geni.


Geni dentro i geni<br />

Geni all’interno di altri geni sono descr<strong>it</strong>ti per i genomi di<br />

organismi semplici e nei m<strong>it</strong>ocondri<br />

Nei mammiferi sono descr<strong>it</strong>ti geni contenuti nei grandi introni di alcuni geni.<br />

A differenza dei genomi piu’ semplici in questi casi spesso viene utilizzato il<br />

filamento opposto al gene “canonico”<br />

Esempio:<br />

GENE EUCARIOTICO<br />

NF1: introne 26 (40Kb) contiene tre piccoli geni (2 esoni)<br />

che vengono trascr<strong>it</strong>ti dal filamento opposto


Geni dentro i geni<br />

NF1<br />

Filamento di senso<br />

GENE EUCARIOTICO<br />

esone 26 Introne 26<br />

esone 27<br />

5’ 3’<br />

Filamento antisenso 3’ 5’<br />

OGMP<br />

2.2KB<br />

EVI2B<br />

10 KB<br />

EVI2A<br />

4 KB


GENE EUCARIOTICO


GENE EUCARIOTICO


Definizione di GENE<br />

Per cercare di giungere ad una definizione appropriata dobbiamo anche considerare la<br />

compless<strong>it</strong>à compless<strong>it</strong> dei trascr<strong>it</strong>ti espressi:<br />

• Alcuni trascr<strong>it</strong>ti vengono originati dalla ligazione di diverse molecole di RNA<br />

attraverso il meccanismo del transplicing<br />

• Si possono formare trascr<strong>it</strong>ti chimerici in segu<strong>it</strong>o alla cotrascrizione di geni disposti in<br />

tandem


Nuova definizione:<br />

Definizione di GENE<br />

Una specifica regione di DNA, la cui trascrizione è regolata da uno o più pi<br />

promotori e altri elementi di controllo trascrizionale che contiene<br />

l’informazione informazione per la sintesi di proteine e RNA non codificanti<br />

funzionali, tra loro correlati per la condivisione di informazione informazione<br />

genetica<br />

(con un tratto di sequenza genomica in comune) a livello dei prodotti prodotti<br />

finali (proteine o ncRNA). ncRNA).<br />

In questo modo è possibile associare al gene specifiche coordinate genomiche che<br />

coincidono con il s<strong>it</strong>o di inizio della trascrizione più pi a monte e il s<strong>it</strong>o di terminazione<br />

più pi a valle. Gene


Una nuova definizione operativa di gene<br />

A C<br />

A B C<br />

A C<br />

DNA<br />

Due trascr<strong>it</strong>ti, trascr<strong>it</strong>ti,<br />

un gene: i prodotti funzionali finali si sovrappongono a<br />

livello genomico. genomico.<br />

I due trascr<strong>it</strong>ti sono “geneticamente<br />

geneticamente correlati” correlati in n<br />

quanto una mutazione nella regione di sovrapposizione avrebbe<br />

effetti su entrambi. entrambi<br />

Al fine di valutare se due trascr<strong>it</strong>ti sono geneticamente correlati è<br />

necessario conoscere la localizzazione della regione codificante.<br />

codificante


Una nuova definizione operativa di gene<br />

A B C<br />

Due trascr<strong>it</strong>ti, trascr<strong>it</strong>ti,<br />

due geni: geni:<br />

i prodotti funzionali finali non si sovrappongono<br />

a livello genico, mentre si osserva sovrapposizione a livello delle delle<br />

regioni<br />

5’UTR. UTR. I due trascr<strong>it</strong>ti non sono “geneticamente geneticamente correlati” correlati in quanto<br />

nessuna mutazione può avere effetto su entrambi i prodotti finali. finali.<br />

Una<br />

mutazione localizzata nella regione 5’UTR 5 UTR può modulare il livello di<br />

espressione di un gene, gene,<br />

esattamente come una mutazione a livello di un<br />

promotore o di una regione enhancer.<br />

H<br />

DNA


1<br />

2<br />

2/3<br />

4<br />

Definizione di GENE<br />

X Y<br />

A B C<br />

A C<br />

1<br />

A B C<br />

A C<br />

H<br />

H<br />

D E<br />

F E<br />

A E<br />

chimeric transcript<br />

A E<br />

H<br />

X Y<br />

4<br />

2<br />

3<br />

D E<br />

F E<br />

F G<br />

3<br />

F G<br />

products<br />

DNA<br />

genes<br />

spliced<br />

transcripts


GENE nei virus


GENE nei virus<br />

VITA?<br />

Virus a DNA Virus a RNA


GENE nei virus


GENE nei virus<br />

Geni sovrapposti<br />

Met Val … proteina b<br />

Sequenza di DNA …GTTTATGGTA…<br />

Val Tyr Gly … proteina A


Modello delle Isocore<br />

Rispetto ai genomi procariotici, procariotici,<br />

negli eucarioti si osserva una più pi marcata variazione<br />

intra-genomica<br />

intra genomica della composizione in basi. Negli eucarioti superiori e nei vertebrati a<br />

sangue caldo, sono presenti regioni genomiche a composizione in basi omogenea.<br />

Secondo il modello delle isocore (Bernardi et al., 1985), il genoma dei vertebrati è un<br />

mosaico di segmenti di DNA, chiamati isocore (>>300 kbp), kbp),<br />

ciascuno caratterizzato<br />

da una propria ed omogenea composizione in basi.<br />

Nei vertebrati a sangue caldo (mammiferi, uccelli) si osservano 5 classi differenti:<br />

- L1 e L2: L2:<br />

isocore povere in GC (oltre il 60% del genoma)<br />

-H1, H1, H2, H3: H3:<br />

isocore ricche in GC<br />

La struttura del genoma ad isocore è correlata ad alcune proprietà propriet del genoma<br />

nucleare


Maria Costantini et al. Genome Res. 2006; 16: 536-541 536 541<br />

Modello delle Isocore<br />

Livelli di GC% dei cromosomi<br />

umani (calcolati su finestre di 100<br />

kbp)<br />

kbp<br />

55


Dimensioni (Mb)<br />

Size, M b<br />

450<br />

400<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

0<br />

L1<br />

Modello delle Isocore<br />

H1<br />

33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59<br />

GC, %<br />

GC, %<br />

Maria Costantini et al. Genome Res. 2006; 16: 536-541 536 541<br />

H2<br />

H3<br />

56


Correlazione tra isocore e proprietà propriet del genoma<br />

La maggior parte del genoma è cost<strong>it</strong>u<strong>it</strong>a da isocore<br />

leggere (L1, L2). Al contrario la maggior parte dei geni è<br />

localizzata nelle isocore pesanti (H1, H2 e H3).<br />

Quant<strong>it</strong> Quant<strong>it</strong>à di DNA, Mb<br />

1200<br />

1000<br />

800<br />

600<br />

400<br />

200<br />

0<br />

L1<br />

Famiglie di Isocore<br />

L2 H1 H2 H3<br />

Dens<strong>it</strong> Dens<strong>it</strong>à genica (genes genes/Mb /Mb)<br />

40<br />

30<br />

20<br />

10<br />

0<br />

Distribuzione dei geni<br />

L1 L2 H1 H2 H3<br />

Nel genome core cost<strong>it</strong>u<strong>it</strong>o dalle isocore H2 e H3 (12% del genoma) la dens<strong>it</strong>à dens<strong>it</strong> dei<br />

geni è molto alta (un gene per 5-15kb), 5 15kb), mentre nel cosiddetto empty space<br />

formato dalle isocore di tipo L e H1 (88% del genoma) la dens<strong>it</strong>à dens<strong>it</strong> genica è molto<br />

bassa (un gene per 50-150kb).<br />

50 150kb).


Correlazione tra isocore e proprietà propriet del genoma<br />

Isocore Leggere Isocore pesanti<br />

Struttura<br />

Lunghezza di introni e UTR maggiore minore<br />

Struttura della cromatina chiusa aperta<br />

eterogene<strong>it</strong>à GC% bassa alta<br />

Abbondanza di SINEs bassa alta<br />

Abbondanza di LINEs alta bassa<br />

Metilazione (CpG)<br />

Funzione<br />

maggiore minore<br />

espressione genica bassa alta<br />

Tempo di replicazione tardiva precoce<br />

Ricombinazione bassa alta<br />

La distribuzione degli elementi ripetuti del genoma umano sembra essere influenzata dalle proprietà propriet<br />

composizionali del genoma. Gli elementi ripetuti di tipo LINEs sono localizzati preferenzialmente nelle<br />

isocore L, , mentre gli elementi di tipo SINEs, SINEs,<br />

soprattutto gli elementi Alu, Alu,<br />

sono localizzati preferenzialmente<br />

nelle isocore H. .<br />

Circa il 54% dei geni umani sono localizzati nel genome core (H2, H3). La maggior parte di questi geni (che<br />

corrispondono a geni housekeeping) housekeeping)<br />

sono associati con isole CpG, CpG,<br />

sono attivi trascrizionalmente e<br />

corrispondono alla porzione “aperta aperta” della cromatina.


Corrispondenza tra il bandeggio<br />

dei cromosomi e le isocore<br />

Nei mammiferi, si osserva che le isocore<br />

povere in GC corrispondono alle bande<br />

G(Giemsa Giemsa), ), mentre le isocore ricche in GC<br />

(isocore H2 e H3) H3)<br />

corrispondono alle bande<br />

R(reverse). (reverse). Le estrem<strong>it</strong>à estrem<strong>it</strong> telomeriche sono<br />

cost<strong>it</strong>u<strong>it</strong>e da isocore di tipo H.<br />

La figura mostra la mappa GIEMSA del<br />

cromosoma 12 ottenuta a bassa (400 bande)<br />

ed alta (850 bande) risoluzione in<br />

corrispondenza con le isocore (bande G L1+ e<br />

L1- L1 in blu chiaro e scuro; bande R H3+ e H3-<br />

in giallo e rosso)<br />

Maria Costantini et al. Chromosoma, Chromosoma,<br />

2006


Il genoma è fatto solo di geni?


Il genoma è fatto solo di geni?<br />

Anatomia del Genoma Umano


Il genoma è fatto solo di geni?


Pseudogeni<br />

Talvolta la copia di un gene non è funzionale, ovvero non viene trascr<strong>it</strong>ta in RNA, o<br />

viene trascr<strong>it</strong>ta in un RNA non funzionale. Le copie inattive di un gene vengono dette<br />

pseudogeni. pseudogeni<br />

Gli pseudogeni possono essere classificati in: 1) non processati; 2) processati. processati.<br />

Nel primo caso il gene inattivo è originato dal gene funzionale e contiene la tipica<br />

struttura in esoni ed introni. La copia genica può essere completa completa<br />

o parziale. Gli<br />

pseudogeni di questo tipo si formano con maggiore probabil<strong>it</strong>à probabil<strong>it</strong> nelle regioni<br />

pericentromeriche.<br />

pericentromeriche<br />

Gli pseudogeni processati sono privi di introni in quanto derivano dalla<br />

retrotrasposizione di mRNA (retropseudogeni<br />

retropseudogeni). ). Il numero di copie di retropseudogeni<br />

è correlato al livello di espressione del gene da cui derivano.


Pseudogeni<br />

La Trascr<strong>it</strong>tasi Inversa codificata da elementi LINE può retrotrascrivere un mRNA in<br />

cDNA che successivamente può essere integrato a caso in un cromosoma. cromosoma.<br />

Se sul s<strong>it</strong>o di<br />

inserimento è casualmente presente un promotore il retrogene può essere<br />

eventualmente espresso e diventare funzionale. Normalmente, questo questo<br />

non accade e lo<br />

pseudogene comincia ad accumulare mutazioni casuali che distruggono la ORF<br />

funzionale (frameshifts ( frameshifts, , codoni di stop).<br />

64


Pseudogeni<br />

Nel genoma umano sono stati descr<strong>it</strong>ti ~8.000 pseudogeni (~5.000 nel genoma del<br />

topo). Il maggior numero di pseudogeni processati deriva da geni per proteine<br />

ribosomiali; ribosomiali;<br />

altri gruppi derivano da geni che codificano per proteine che legano il DNA<br />

e l’RNA, l RNA, per molecole strutturali ed enzimi metabolici. Molti pseudogeni derivano da<br />

geni a cui non è stata attribu<strong>it</strong>a una funzione.<br />

Oltre al livello di espressione dei geni, altri fattori gene-specifici gene specifici sono responsabili<br />

dell’origine dell origine degli pseudogeni, pseudogeni,<br />

quali la lunghezza o il loro contenuto in G+C.<br />

G+C


Il genoma è fatto solo di geni?<br />

Il DNA NON<br />

CODIFICANTE<br />

RIPETUTO IN TANDEM<br />

SATELLITE, tipico delle sequenze centromeriche (a-satell<strong>it</strong>e,<br />

monomero di 171 bp)<br />

MINISATELLITE, monomero 6-64bp, altamente polimorfico.<br />

Utilizzato per esami di fingerprint del DNA.<br />

Es.DNA telomerico (TTAGGG)<br />

MICROSATELLITE, 2-4 bp ripetuti in tandem. Espansioni<br />

di triplette sono responsabili di alcune patologie (Distrofia<br />

Miotonica)


Ripetizioni in tandem: Duplicazioni segmentali<br />

Le duplicazioni segmentali sono ripetizioni di segmenti genomici genomici<br />

comunemente<br />

osservate in genomi di animali e piante, non riconducibili a elementi elementi<br />

trasponibili, trasponibili,<br />

di<br />

lunghezza ≥10 10 kbp e ident<strong>it</strong>à ident<strong>it</strong> ≥90%. 90%. Queste possono essere anche molto estese come<br />

nel cromosoma Y umano che presenta un blocco ripetuto di 1.45 Mbp. Mbp.<br />

La porzione eucromatica del genoma umano contiene circa il 5,3% di duplicazioni<br />

segmentali che sono classificate in :<br />

-duplicazioni duplicazioni inter-cromosomiche, inter cromosomiche, segmenti che si sono duplicati tra cromosomi non<br />

omologhi;<br />

-duplicazioni<br />

duplicazioni intra-cromosomiche<br />

intra cromosomiche, , segmenti duplicati all’interno all interno di un particolare<br />

cromosoma.<br />

Duplicazione<br />

segmentali<br />

Gap


Ripetizioni in tandem: Duplicazioni segmentali<br />

Le duplicazioni segmentali sono localizzate in prevalenza nelle regioni adiacenti ai<br />

centromeri, mentre raramente coinvolgono le regioni più pi distali di ciascun braccio dei<br />

cromosomi.<br />

Sono di grande interesse in campo<br />

medico in quanto sono regioni che<br />

mostrano una particolare<br />

predisposizione a riarrangiamenti<br />

con conseguenti effetti fenotipici.<br />

Sono note varie malattie<br />

genetiche correlate a queste<br />

regioni (es. sindrome DiGeorge,<br />

DiGeorge,<br />

Charcot-Marie<br />

Charcot Marie-Tooth Tooth, , etc.).<br />

Possono essere originate da:<br />

1. Crossing over diseguale durante<br />

la meiosi<br />

2. Scambio diseguale tra cromatidi<br />

fratelli


Copy Number Variations (CNV)<br />

Le duplicazioni segmentali sono una importante fonte di variabil<strong>it</strong> variabil<strong>it</strong>à<br />

genetica tra<br />

individui nella popolazione umana. Dato che si estendono su più pi geni, portano alla<br />

variazione del numero di copie di determinati geni tra diversi individui. individui.<br />

E’ oggi possibile fare studi su larga<br />

scala di queste varianti strutturali<br />

del genoma mediante specifiche<br />

piattaforme di microarray.<br />

microarray<br />

Uno studio su 270 individui di 4<br />

popolazioni 1500 CNVs. CNVs<br />

ha identificato circa<br />

I CNV sono responsabili di variazioni<br />

del livello di espressione genica e<br />

possono essere associati a specifici<br />

tratti fenotipici e/o patologici (es.<br />

HIV, cancro della mammella,<br />

autismo, malattie auto-immuni).<br />

auto immuni).


Microsatell<strong>it</strong>i e Minisatell<strong>it</strong>i<br />

I microsatell<strong>it</strong>i sono cost<strong>it</strong>u<strong>it</strong>i da un<strong>it</strong>à un<strong>it</strong> di<br />

ripetizione lunghe da 1 a 10 pb, pb,<br />

ripetute<br />

in tandem 10-20 10 20 volte, che formano<br />

raggruppamenti molto corti,


Gli SSR possono formarsi attraverso un<br />

meccanismo di scivolamento della replicazione<br />

Gli SSR sono presenti con una frequenza di almeno uno ogni circa 2 kb del genoma.<br />

• Si originano da vari meccanismi tra cui il più pi importante è lo scivolamento della DNA polimerasi<br />

durante la replicazione.


Microsatell<strong>it</strong>i:<br />

Microsatell<strong>it</strong>i:<br />

Genetic Fingerprint<br />

Caratteristiche degli SSRs<br />

• Polimorfismo di lunghezza: DNA fingerprinting<br />

• Spesso adoperati come marcatori genetici per la mappatura di<br />

geni associati a patologie.


Microsatell<strong>it</strong>i e malattie genetiche<br />

I microsatell<strong>it</strong>i, microsatell<strong>it</strong>i,<br />

ed in particolare le ripetizioni di triplette sono associati a<br />

varie malattie genetiche


Il genoma è fatto solo di geni?<br />

INTERSPERSO<br />

SINE, brevi elementi nucleari ripetuti (pseudogene processato di RNA7SL)<br />

Alu (300bp, 1.000.000 copie nel genoma umano)<br />

MIR (130bp, 400.000 copie nel genoma umano)<br />

LINE, lunghi elementi nucleari ripetuti (retrotrasposoni)<br />

L1 (6,1Kb a lunghezza completa, 200.000-500.000 copie)<br />

Retrovirus endogeni, HERV<br />

Il DNA NON<br />

CODIFICANTE<br />

Elementi simili retroviral tronchi, RTLV e LTR<br />

Trasposoni a DNA, Mariner


Porzione non codificante:Ripetizioni codificante: Ripetizioni intersperse<br />

Cost<strong>it</strong>u<strong>it</strong>e da sequenze di DNA ripetute, disperse in tutto il genoma. genoma.<br />

Sono defin<strong>it</strong>e anche Elementi mobili del DNA, perché perch derivano da elementi<br />

trasponibili (sequenze di DNA che si muovono o sono duplicate da una posizione posizione<br />

ad<br />

un’altra un altra nel genoma)<br />

Classe I o Retrotrasposoni<br />

si originano per eventi di<br />

retrotrasposizione, retrotrasposizione,<br />

attraverso un<br />

intermedio ad RNA<br />

• elementi LTR<br />

• LINEs: LINEs:<br />

long interspersed nuclear<br />

elements<br />

• SINEs: SINEs:<br />

short interspersed nuclear<br />

elements<br />

Classe II o Trasposoni a DNA<br />

si originano attraverso un intermedio a<br />

DNA, secondo meccanismo di<br />

trasposizione conservativa o replicativa<br />

75


Retrotrasposoni<br />

La caratteristica di tutti i retrotrasposoni<br />

è la presenza di brevi ripetizioni dirette<br />

alle estrem<strong>it</strong>à estrem<strong>it</strong> 3’ e 5’ 5 , copia della<br />

sequenza del s<strong>it</strong>o d’integrazione.<br />

d integrazione.


Ripetizioni Intersperse nel Genoma Umano<br />

Gli elementi ripetuti interspersi cost<strong>it</strong>uiscono cirva il<br />

45% del genoma umano.<br />

umano<br />

• LINE (Long interspersed nuclear elements)<br />

– L1, L2, L3 LINE ( ~21% del genoma, ~100,000 copie)<br />

• SINE (Short interspersed nuclear elements)<br />

– Alu (~10,7% del genoma, ~1,200, 000 copie)<br />

– MIR, MIR3 (~3% del genoma, ~500,000 copie)<br />

• Elementi LTR (Long Terminal Repeats)<br />

– ERV, MalR (8% del genoma, ~500,000 copie)<br />

• Transposoni a DNA<br />

– MER1 (Charlie), MER2 (Tigger), others (2,8% del genoma, ~350, 000 copie)


Elementi LTR<br />

Gli elementi LTR o retrotrasposoni virali (6-7kb) (6 7kb) presentano analogie con i<br />

retrovirus.<br />

Caratteristici degli invertebrati (piante, funghi, insetti) dove sono presenti in gran<br />

numero di copie<br />

env e non<br />

Elementi Ty in S. cerevisiae mancano del gene env<br />

elementi copia in Drosophila possono formare particelle virali<br />

250-600pb 250 600pb


promotore<br />

Pol II<br />

LINEs:long<br />

LINEs:long<br />

interspersed nuclear elements<br />

RNA binding anche endonucleasi<br />

ripetizioni<br />

ripetizioni<br />

ripetizioni<br />

ripetizioni<br />

dirette<br />

dirette<br />

dirette<br />

dirette<br />

Gli elementi LINEs o trasposoni non-LTR non LTR hanno una lunghezza di circa 6-7kb, 6 7kb,<br />

contengono un promotore per l’RNA l RNA polimerasi II (derivano da trascr<strong>it</strong>ti della<br />

l’RNA RNA pol II), una o due ORF e un segnale di poliadenilazione all’estrem<strong>it</strong><br />

all estrem<strong>it</strong>à 3’.<br />

•ORF1 ORF1 codifica per una proteina a funzione ignota ( lega l’RNA?), l RNA?),<br />

•ORF2 ORF2 codifica per un’enzima<br />

un enzima che possiede sia un’attiv<strong>it</strong> un attiv<strong>it</strong>à di trascr<strong>it</strong>tasi inversa<br />

(RT), simile a quella dei retrovirus e dei retrotrasposoni virali, che un’attiv<strong>it</strong> un attiv<strong>it</strong>à di<br />

DNA endonucleasi (EN).<br />

Vi sono tre famiglie principali di elementi LINES: L1 (incluse 60-100 6 100 copie tuttora<br />

attive e moltissime copie inattive troncate all’estrem<strong>it</strong><br />

all estrem<strong>it</strong>à 5’); ); L2 e L3 (inattive). Le<br />

copie attive inserendosi in punti cr<strong>it</strong>ici del genoma possono inattivare inattivare<br />

dei geni con<br />

conseguente insorgenza di patologie.<br />

Le LINEs si inseriscono preferibilmente nelle regioni eucromatiche ricche in A+T.


Meccanismo di trasposizione degli elementi LINEs<br />

1. Generazione di un trascr<strong>it</strong>to LINE full-length<br />

full length a partire dal promotore.<br />

2. ORF1 e ORF2 vengono tradotte e legano il LINE mRNA. mRNA<br />

orf2<br />

5’ orf1<br />

3’<br />

3. Il complesso LINE mRNA/ORF1/ORF2 mRNA/ORF1/ORF2<br />

si sposta nel nucleo, dove l’attiv<strong>it</strong> l attiv<strong>it</strong>à<br />

endonucleasica di ORF2 taglia il dsDNA. dsDNA.<br />

L’estrem<strong>it</strong><br />

L estrem<strong>it</strong>à libera al 3’ 3 (sul DNA)<br />

funge da innesco per la retrotrascrizione a partire dal 3’UTR. 3 UTR.<br />

5’ orf1 3’<br />

orf2<br />

3’ 5’<br />

5’ 3’<br />

Il s<strong>it</strong>o di taglio di ORF1 è TTTT A, e questo spiega l’integrazione<br />

l integrazione<br />

preferenziale nelle regioni genomiche ricche in AT. Dato che la LINE RT ha<br />

una bassa processiv<strong>it</strong>à processiv<strong>it</strong> molte delle copie integrate sono tronche (solo<br />

1/100 è completa).


SINEs: SINEs:<br />

short interspersed nuclear elements<br />

A B AAAA SINE<br />

Gli elementi SINEs sono elementi non-autonomi, non autonomi, hanno una lunghezza<br />

compresa tra 0.1 e 0.4 kb. kb.<br />

Hanno un promotore (interno) per L’RNA L RNA polimerasi III (derivano da trascr<strong>it</strong>ti<br />

della l’RNA l RNA pol III), e una regione ricca in A all’estrem<strong>it</strong><br />

all estrem<strong>it</strong>à 3’ ma non contengono<br />

un segnale di poliadenilazione.<br />

poliadenilazione<br />

Gli elementi SINEs non contengono alcuna ORF codificante per una trascr<strong>it</strong>tasi<br />

inversa, ma sono in grado di trasporre utilizzando la trascr<strong>it</strong>tasi trascr<strong>it</strong>tasi<br />

inversa<br />

sintetizzata da altri retroelementi (trasposizione LINEs-dipendente<br />

LINEs dipendente). ).


SINEs: SINEs:<br />

short interspersed nuclear elements<br />

Gli elementi SINEs sono distribu<strong>it</strong>i ad alta dens<strong>it</strong>à dens<strong>it</strong> nelle regioni ricche in CG del<br />

genoma (isocore H), perché perch hanno un più pi<br />

agli elementi LINEs ( 40%).<br />

elevato contenuto C+G (~57%) rispetto<br />

Nel genoma dei primati sono presenti tre differenti famiglie di elementi SINEs: SINEs:<br />

l’elemento<br />

elemento Alu, Alu,<br />

ancora attivo, e gli elementi inattivi MIR e Ther2/MIR3.<br />

Ther2/MIR3<br />

L’elemento<br />

elemento Alu, Alu,<br />

il più pi comune nei primati, è lungo 0,3kb; è presente in circa<br />

1.200.000 di copie nel genoma umano e rappresenta quindi oltre il il<br />

10% di tutto il<br />

genoma. Presenta una regione ricca in A/T all’estrem<strong>it</strong><br />

all estrem<strong>it</strong>à<br />

meccanismo di retrotrasposizione.<br />

retrotrasposizione.<br />

3’, , coinvolta nel<br />

Le sequenze Alu sono localizzate a monte o a valle dei geni, negli introni, nelle nelle<br />

regioni 5’ 5 e 3’ 3 non tradotte dell’mRNA<br />

dell mRNA. . Non è noto il loro ruolo funzionale,<br />

nonostante siano molto diffuse nel genoma di tutti i primati.<br />

Le sequenze Alu presentano analogie con l’RNA l RNA 7SL, componente di una particella<br />

ribonucleoproteica coinvolta nel meccanismo di secrezione dei polipeptidi di nuova<br />

sintesi attraverso le membrane del reticolo endoplasmatico.<br />

Si r<strong>it</strong>iene che il primo elemento Alu si è originato per un evento di retrotrascrizione<br />

di una molecola di RNA 7SL e successiva integrazione della copia nel genoma.


Meccanismo di retroposizione dell’elemento<br />

dell elemento Alu<br />

Si pensa che il taglio al s<strong>it</strong>o di<br />

inserimento sia opera della L1<br />

endonucleasi<br />

Target-primed<br />

Target primed reverse<br />

transcription (TPRT) Il promotore pol III è necessario ma non<br />

sufficiente per la trascrizione che richiede<br />

anche sequenze fiancheggianti appropriate.<br />

La maggior parte degli elementi Alu<br />

integrati non è attiva in quanto non viene<br />

integrata in un contesto favorevole e muta<br />

rapidamente sia nelle sequenze CpG che<br />

nella regione ricca in A.


Evoluzione e classificazione degli elementi Alu<br />

Gli elementi Alu sono classificati in sottofamiglie che si differenziano per l’epoca l epoca della loro integrazione nel genoma, dalle<br />

più pi antiche (Sx ( Sx, , J) alle più pi recenti (Yc1, etc.).<br />

da: Batzer and Deininger, Deininger,<br />

Nature Rev. Gen. Gen.<br />

3:370380, 2002)


Danni genomici indotti da Alu<br />

Numerose patologie sono provocate dall'integrazione casuale di Alu<br />

(Neurofibromatosi, haemophilia, haemophilia,<br />

sindrome di Apert, Apert,<br />

ecc.) o da<br />

ricombinazione disuguale (diabete di tipo II, sindrome di Lesch–Nyhan<br />

Lesch Nyhan, ,<br />

malattia di Tay–Sachs Tay Sachs, , ipercolesterolemia familiare, α-thalassaemia<br />

thalassaemia, ,<br />

ecc.).


Trasposoni a DNA<br />

I Trasposoni a DNA sono elementi mobili distinti in due categorie:<br />

•Trasposoni<br />

Trasposoni a DNA che si spostano replicandosi: una copia rimane nel s<strong>it</strong>o<br />

originale, mentre la nuova copia si inserisce altrove nel genoma genom<br />

•Trasposoni<br />

Trasposoni a DNA che si spostano in maniera conservativa, da un s<strong>it</strong>o all’altro all altro<br />

del genoma senza aumentare il numero di copie<br />

Sono caratterizzati da una sequenza codificante la trasposasi contenente introni,<br />

fiancheggiata da ripetizioni terminali invert<strong>it</strong>e, simili a quelle quelle<br />

dei trasposoni batterici.<br />

Sono meno comuni negli eucarioti (3% nel genoma umano, raggruppati in 7 classi<br />

principali) rispetto ai retrotrasposoni.<br />

retrotrasposoni<br />

I più pi noti sono gli Elementi Ac e Ds del granturco, i primi elementi mobili identificati<br />

negli anni 50 da B. McClintock e gli elementi P di Drosophila. Drosophila.<br />

Traspongono mediante<br />

il meccanismo di trasposizione conservativa


Funzione degli elementi ripetuti<br />

• Punti caldi per ricombinazione (duplicazioni, inversioni, traslocazioni;<br />

traslocazioni;<br />

creazione di nuovi geni per shuffling esonici) esonici<br />

• Alterazione della espressione genica in quanto portatori di segnali segnali<br />

trascrizionali (es. promotori e enhancer di LTR; promotori di Alu; Alu;<br />

s<strong>it</strong>i di<br />

terminazione deboli della trascrizione di elementi L1; segnali di di<br />

poliadenilazione)<br />

poliadenilazione<br />

• Presenza in geni per proteine (Le Alu contengono s<strong>it</strong>i criptici di splicing; splicing;<br />

fonte di domini proteici; contributo a variabil<strong>it</strong>à variabil<strong>it</strong> delle proteine)<br />

• Reclutamento come elementi regolatori (es. BC200 di primati deriva deriva<br />

da Alu<br />

monomerica)<br />

monomerica<br />

• Fonte di pseudogeni processati (r<strong>it</strong>orno in v<strong>it</strong>a come lunghi esoni? Come<br />

nuovi geni? )<br />

• Fonte di plastic<strong>it</strong>à plastic<strong>it</strong> del genoma e quindi ruolo attivo nel rimodellamento<br />

genomico (riarrangiamenti<br />

( riarrangiamenti cromosomici, reshuffling di geni, etc)<br />

etc


Il genoma è fatto solo di geni?<br />

Paradosso del Valore C


Come misurare la Compless<strong>it</strong>à Compless<strong>it</strong> biologica ?<br />

La compless<strong>it</strong>à compless<strong>it</strong> biologica può essere “misurata misurata” in diversi modi, ad es. sulla base della<br />

divers<strong>it</strong>à divers<strong>it</strong> di tipi cellulari, della compless<strong>it</strong>à compless<strong>it</strong> dei circu<strong>it</strong>i del cervello,……<br />

cervello, ……o del n° teorico<br />

di stati dell’espressione dell espressione genica.<br />

Ipotizzando N geni umani e supponendo che ciascuno possa essere presente in due soli<br />

stati, ON o OFF, il numero di possibili stati sarebbe pari a 2 N . In questo modo si<br />

potrebbe anche calcolare quanto un organismo è più pi complesso di un altro.<br />

da: Claverie JM, Science 2001 291:1255<br />

22,000 geni nel genoma umano<br />

Compless<strong>it</strong>à Compless<strong>it</strong> = 2 22,000<br />

Se si calcola la compless<strong>it</strong>à compless<strong>it</strong> solo sul numero di geni, non vi sono differenze<br />

macroscopiche nella compless<strong>it</strong>à compless<strong>it</strong> negli eucarioti.<br />

eucarioti


Compless<strong>it</strong>à Compless<strong>it</strong> Fenotipica<br />

Il numero di tipi cellulari presenti in ciascun organismo può cost<strong>it</strong>uire cost<strong>it</strong>uire<br />

un indice<br />

affidabile del livello di compless<strong>it</strong>à compless<strong>it</strong> di un organismo. Nell’uomo Nell uomo si stima vi siano<br />

circa 400 tipi cellulari.<br />

Se si calcola la compless<strong>it</strong>à compless<strong>it</strong> solo sul numero di geni, non vi sono differenze<br />

macroscopiche nella compless<strong>it</strong>à compless<strong>it</strong> negli eucarioti. eucarioti<br />

da: Rokas A, Ann. Ann.<br />

Rev. Genet. Genet.<br />

2008 235:251


Compless<strong>it</strong>à Compless<strong>it</strong> genotipica vs fenotipica<br />

• Incremento del numero di cost<strong>it</strong>uenti (es. geni proteici)<br />

• Nuove arch<strong>it</strong>etture proteiche (arrangiamenti lineari di domini proteici) proteici)<br />

• Incremento della compless<strong>it</strong>à compless<strong>it</strong> del trascr<strong>it</strong>toma e del proteoma rispetto al<br />

genoma<br />

- uso di s<strong>it</strong>i di inizio della trascrizione multipli<br />

- splicing alternativi<br />

- s<strong>it</strong>i alternativi di poliadenilazione<br />

- modifiche post-traduzionali<br />

post traduzionali delle proteine<br />

• Incremento della compless<strong>it</strong>à compless<strong>it</strong> delle reti di regolazione genica (es. sviluppo<br />

di meccanismi fini di regolazione dell’espressione dell espressione genica nei metazoi grazie<br />

alla struttura modulare dei promotori)<br />

Le regioni non-codificanti non codificanti del genoma concorrono alla compless<strong>it</strong>à compless<strong>it</strong><br />

genotipica e fenotipica di un organismo.


I Genomi degli Eucarioti: Eucarioti:<br />

numero di cromosomi<br />

Come per il contenuto di DNA, anche il numero e le dimensioni<br />

dei cromosomi è molto variabile tra gli eucarioti. eucarioti<br />

(13 Mbp)<br />

Mbp<br />

(125 Mbp) Mbp<br />

(97 Mbp) Mbp<br />

(3000 Mbp) Mbp<br />

(180 Mbp) Mbp<br />

92


I Genomi degli Eucarioti: Eucarioti Mappe di sintenia<br />

Human<br />

chromosome<br />

Uno specifico cromosoma di un<br />

organismo normalmente risulta<br />

omologo a tratti genomici diversi<br />

su più pi cromosomi di un altro<br />

organismo. Ad esempio il<br />

cromosoma 1 umano presenta<br />

omologia con estese regioni<br />

genomiche Mouse genomiche Mouse (>100 kbp) kbp)<br />

di 8<br />

diversi cromosomi di topo.<br />

chromosome<br />

Mouse<br />

chromosome<br />

Immagine tratta da: http://www.ensembl.org/Homo_sapiens<br />

http://www.ensembl.org/ Homo_sapiens/syntenyview<br />

syntenyview?otherspecies=Mus_musculus;chr=1<br />

?otherspecies=Mus_musculus;chr=1<br />

In tali regioni, dette<br />

“regioni regioni sinteniche”, sinteniche , si<br />

osserva una sostanziale<br />

corservazione<br />

dell’ordine dell ordine genico.


I Genomi degli Eucarioti: Eucarioti:<br />

numero di cromosomi<br />

Non si osserva correlazione tra le dimensioni del genoma e il<br />

numero dei cromosomi, e tra il numero dei cromosomi e la<br />

compless<strong>it</strong>à compless<strong>it</strong> dell’organismo.<br />

dell organismo.<br />

Ad esempio, tra gli invertebrati, S. cerevisiae ha un genoma di<br />

13 Mbp organizzato in 16 cromosomi mentre D. melanogaster ha<br />

un genoma di 180 Mbp, Mbp,<br />

organizzato in 4 cromosomi; tra i<br />

vertebrati, lo zebrafish (Danio Danio rerio) rerio)<br />

ha un genoma di 1700<br />

Mbp, Mbp,<br />

organizzato in 25 cromosomi, 2 cromosomi più pi dell’uomo.<br />

dell uomo.<br />

94


Organism estimated size<br />

estimated<br />

gene number<br />

Homo sapiens(human) 3000 million bases ~22,000-<br />

Rattus norvegicus (rat)<br />

2,750 million<br />

bases<br />

~30,000<br />

Mus musculus (mouse) 2500 million bases ~30,000<br />

Drosophila melanogaster<br />

(fru<strong>it</strong> fly)<br />

average gene<br />

dens<strong>it</strong>y<br />

1 gene per 100,000<br />

bases<br />

1 gene per 100,000<br />

bases<br />

1 gene per 100,000<br />

bases<br />

chromosome<br />

number<br />

180 million bases 13,600 1 gene per 9,000 bases 8<br />

Arabidopsis thaliana (plant) 125 million bases 25,500 1 gene per 4000 bases 5<br />

Caenorhabd<strong>it</strong>is elegans<br />

(roundworm)<br />

Saccharomyces cerevisiae<br />

(yeast)<br />

97 million bases 19,100 1 gene per 5000 bases 6<br />

12 million bases 6300 1 gene per 2000 bases 16<br />

Escherichia coli (bacteria) 4.7 million bases 3200 1 gene per 1400 bases 1<br />

H. influenzae (bacteria) 1.8 million bases 1700 1 gene per 1000 bases 1<br />

Human immunodeficiency<br />

virus (HIV)<br />

EVOLUZIONE DEI GENI<br />

9700 9 1 gene per 1000 bases<br />

46<br />

42<br />

40


Qual è l’origine di tutto questo?<br />

Come si sono evoluti i genomi?


Origine ed evoluzione dei genomi


Origine ed evoluzione dei genomi<br />

Mondo a RNA<br />

Nasc<strong>it</strong>a di molecole autoreplicanti


Origine ed evoluzione dei genomi<br />

Mondo a RNA<br />

Protogenomi a RNA<br />

Compartimentalizzazione<br />

all’interno di membrane<br />

lipidiche<br />

Prime strutture di tipo cellulare


Origine ed evoluzione dei genomi<br />

Come si è evoluto il genoma a DNA?<br />

Nasc<strong>it</strong>a di enzimi proteici


Origine ed evoluzione dei genomi<br />

Come si è evoluto il genoma a DNA?<br />

Trasferimento della funzione codificante dall’RNA<br />

al DNA (chimicamente piu’ stabile)


Origine ed evoluzione dei genomi<br />

Primi Genomi a DNA (3,8 miliardi di anni fa)<br />

Ogni molecola di DNA rappresenta un singolo gene<br />

che codifica per una singola proteina<br />

singolo gene<br />

singola proteina


Origine ed evoluzione dei genomi<br />

Acquisizione di nuovi geni<br />

1. Duplicazione di alcuni o tutti i geni del genoma<br />

2. Acquisizione di geni da altre specie


Origine ed evoluzione dei genomi<br />

Acquisizione di nuovi geni<br />

Duplicazione di un intero genoma<br />

Genoma duplicato


Origine ed evoluzione dei genomi<br />

Acquisizione di nuovi geni<br />

Duplicazione di geni<br />

•Crossing-over disuguale<br />

•Scambio disuguale tra cromatidi fratelli


Origine ed evoluzione dei genomi<br />

Acquisizione di nuovi geni<br />

Duplicazione di geni<br />

Gene A1<br />

Gene A1<br />

Duplicazione<br />

Gene A2<br />

Pressione Nessuna<br />

selettiva pressione<br />

selettiva<br />

Gene A1 GeneB Divergenza<br />

Nuova funzione<br />

o<br />

Funzione simile


Origine ed evoluzione dei genomi<br />

Duplicazione di geni<br />

Acquisizione di nuovi geni<br />

Famiglie geniche


EVOLUZIONE DEI GENI


Origine ed evoluzione dei genomi<br />

Acquisizione di nuovi geni<br />

Riarrangiamento genico<br />

•Duplicazione<br />

dei domini<br />

•Rimescolamento<br />

di domini


Origine ed evoluzione dei genomi<br />

Acquisizione di nuovi geni<br />

ESONI = MOTIVI PROTEICI<br />

MOTIVI<br />

α β β α β β α β<br />

N C<br />

ESONI<br />

Proteina<br />

Gene


Origine ed evoluzione dei genomi<br />

Acquisizione di nuovi geni<br />

Acquisizione di geni da altre specie<br />

Il trasferimento di geni tra batteri è un fenomeno comune in natura<br />

che avviene ancora oggi<br />

I retrovirus sono capaci di spostare geni animali<br />

tra individui della stesse specie e tra specie diverse


EVOLUZIONE DEI GENI<br />

Maria C. Rivera & James A. Lake<br />

The ring of life provides evidence for a genome fusion<br />

origin of eukaryotes<br />

NATURE |VOL 431 | 9 SEPTEMBER 2004


Origine ed evoluzione dei genomi<br />

INTRONI? UN MISTERO<br />

1. IPOTESI INTRONI ANTICHI: gli introni sono molto antichi<br />

e si stanno gradualmente perdendo nei genomi degli eucarioti<br />

2. IPOTESI INTRONI RECENTI: gli introni si sono evoluti di recente<br />

e si stanno gradualmente accumulando nei genomi degli eucarioti


Origine ed evoluzione dei genomi<br />

INTRONI? UN MISTERO<br />

Teoria esonica dei geni


Origine ed evoluzione dei genomi<br />

INTRONI? UN MISTERO<br />

Le evidenze attuali non inficiano alcuna ipotesi


Origine ed evoluzione dei genomi<br />

IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI


Origine ed evoluzione dei genomi<br />

IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI<br />

Uomo – Scimpanzè= 98,5% di omologia


Origine ed evoluzione dei genomi<br />

IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI<br />

Che cosa ci rende diversi dalle scimmie?


Origine ed evoluzione dei genomi<br />

IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI<br />

Che cosa ci rende diversi dalle scimmie?<br />

Sottili cambiamenti nei profili di espressione dei geni<br />

coinvolti in<br />

processi di sviluppo e nella specificazione delle<br />

interconnessioni<br />

all’interno del sistema nervoso


Origine ed evoluzione dei genomi<br />

IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI<br />

Quello che ci rende umani probabilmente<br />

non è il genoma umano di per sé,<br />

ma il modo in cui il genoma funziona

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!