versione fondo bianco - Bgbunict.it
versione fondo bianco - Bgbunict.it
versione fondo bianco - Bgbunict.it
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
STRUTTURA E FUNZIONE DEL GENE<br />
EVOLUZIONE DEI GENOMI
Lodish – Molecular Cell Biology<br />
GENOME: total genetic information carried by a cell or organism<br />
GENE: physical and functional un<strong>it</strong> of hered<strong>it</strong>y, which carries<br />
information from one generation to the next. In molecular terms,<br />
<strong>it</strong> is the entire DNA sequence (including exons, introns and<br />
noncoding transcriptional control regions) necessary for<br />
production of a functional protein or RNA
Struttura del GENE
GENE procariotico<br />
Genoma di E. coli
GENE procariotico<br />
OPERONE<br />
Sequenze regolatrici a monte<br />
Sequenze codificanti<br />
Sequenze terminatrici<br />
della sequenza codificante
GENE procariotico
GENE procariotico<br />
Promotori
GENE procariotico<br />
Sequenze codificanti<br />
ORF<br />
(Open Reading Frame)<br />
ATGGTATAT-------------------------------TAA<br />
MET VAL TYR STOP
GENE procariotico<br />
A B C<br />
Promotore Operone<br />
Sequenze codificanti<br />
Terminatore
GENE procariotico<br />
A B C<br />
Promotore Operone<br />
Sequenze codificanti<br />
mRNA mRNA mRNA<br />
Proteina Proteina Proteina<br />
Terminatore
Repressione<br />
GENE procariotico<br />
A B C<br />
Promotore Operone<br />
Sequenze codificanti<br />
Nessuna espressione<br />
Terminatore
GENI DELLA I CLASSE<br />
GENI DELLA II CLASSE<br />
GENI DELLA III CLASSE<br />
GENE EUCARIOTICO<br />
RNA RIBOSOMIALE – rRNA (28S-5,8S e 18s)<br />
RNA MESSAGGERO – mRNA<br />
Piccoli RNA nucleari – snRNA<br />
microRNA<br />
RNA TRANSFER – tRNA<br />
Piccoli rna nucleolari – snorna<br />
Piccoli rna c<strong>it</strong>oplasmatici - scrna
GENE EUCARIOTICO
GENE EUCARIOTICO
GENE EUCARIOTICO
GENE EUCARIOTICO
GENE EUCARIOTICO
Promotore<br />
GENE EUCARIOTICO
Promotore<br />
GENE EUCARIOTICO
Sequenza<br />
codificante<br />
modulare<br />
GENE EUCARIOTICO
GENE EUCARIOTICO<br />
Segnale di<br />
poliadenilazione
I geni eucariotici sono monocistronici<br />
Eccezioni: Un<strong>it</strong>à Un<strong>it</strong> di trascrizione policistroniche risolte in mRNA maturi<br />
monocistronici per trans-splicing<br />
trans splicing (es es in tripanosomi, nematodi,<br />
platelminti); uso di IRES, reinizio della traduzione o frameshift<br />
traduzionale<br />
I geni eucariotici non mostrano nessuna evidente<br />
relazione tra localizzazione e l’attiv<strong>it</strong> l attiv<strong>it</strong>à funzionale<br />
(functional functional clustering) clustering)<br />
o con l’espressione l espressione spazio-<br />
temporale<br />
Organizzazione genica negli eucarioti<br />
Eccezioni: Raggruppamento di geni con funzione correlata, quali geni<br />
Hox, Hox,<br />
geni per emoglobine e geni per immunoglobuline (duplicazioni in in<br />
tandem?)
Organizzazione genica negli eucarioti<br />
Alcuni geni eucariotici sono policistronici<br />
Taxon Ent<strong>it</strong>à Ent<strong>it</strong><br />
Tripanosomi (Euglenozoa<br />
( Euglenozoa) tutti gli RNA<br />
Cnidari alcuni RNA<br />
Platelminti (Metazoa ( Metazoa Acoelomata) Acoelomata pochi RNA<br />
Nematodi (Metazoa ( Metazoa Pseudocoelomata)<br />
Pseudocoelomata)<br />
molti RNA<br />
Ciona intestinalis/Oikopleura<br />
intestinalis Oikopleura dioica molti RNA<br />
Il processamento del precursore policistronico è associato al Trans<br />
Splicing delle estrem<strong>it</strong>à estrem<strong>it</strong> 5’ degli mRNA e alla poliadenilazione delle<br />
estrem<strong>it</strong>à estrem<strong>it</strong> 3’ per generare i trascr<strong>it</strong>ti monocistronici.<br />
monocistronici
Geni codificanti per proteine<br />
- geni presenti in unica copia (single ( single-copy copy genes) genes<br />
- geni omologhi presenti in copie multiple ed organizzati in famiglie geniche<br />
I membri di una stessa famiglia genica possono essere localizzati in<br />
unico cluster, dispersi, dispersi,<br />
o localizzati in più pi cluster:<br />
Geni in cluster:<br />
α-globin globin (7), growth hormone (5), Class I HLA heavy chain (20),…. (20),<br />
Geni dispersi: dispersi:<br />
Pyruvate dehydrogenase (2), Aldolase (5), PAX (>12),..<br />
Geni localizzati in più pi cluster:<br />
HOX (38 – 4), Histones (61 – 2), Olfactory receptors (>900 – 25),…<br />
25),<br />
25
La struttura dei geni eucariotici<br />
Nel genoma umano non si osserva una distribuzione omogenea dei<br />
geni. La più pi alta dens<strong>it</strong>à dens<strong>it</strong> genica si osserva nel chr 19, mentre il chr 13 e<br />
Y mostrano la più pi bassa dens<strong>it</strong>à.<br />
dens<strong>it</strong><br />
introne<br />
introne<br />
esone esone<br />
esone<br />
TSS<br />
Caratteristiche<br />
dei geni umani<br />
5’UTR UTR<br />
GENE<br />
mRNA<br />
TRASCRIZIONE<br />
CDS 3’UTR 3’UTR UTR<br />
Mediana Media<br />
Numero di esoni 7 8,8<br />
L introni (bp) 1023 3365<br />
L 5'UTR (bp) 240 300<br />
L CDS (bp) 1100 1340<br />
L 3'UTR (bp) 400 770<br />
L gene (bp) 14000 27000<br />
TRADUZIONE
I geni eucariotici presentano una grande varietà variet di strutture e dimensioni.<br />
Ad esempio nel genoma umano: umano<br />
Il più pi piccolo:<br />
tRNA GLU<br />
tRNA<br />
GLU (69<br />
La struttura dei geni eucariotici<br />
(69 bp) bp<br />
Il più pi grande:<br />
Distrofina (2.4 Mb, la sua<br />
trascrizione richiede circa 16h)<br />
Il numero di esoni può variare da 1 (geni privi di introni come molti geni per<br />
ncRNA, ncRNA,<br />
interferoni, istoni, ribonucleasi, HSP, GPCR, ecc.) sino a 363 (T<strong>it</strong>ina T<strong>it</strong>ina). ).<br />
Le dimensioni degli esoni e degli introni sono estremamente variabili. variabili.<br />
A fronte di esoni cost<strong>it</strong>u<strong>it</strong>i da pochi nucleotidi, l’esone l esone più pi grande è presente nel<br />
gene per ApoB (7.6 kbb). kbb).<br />
Anche le dimensioni degli introni possono variare da<br />
pochi nucleotidi fino a 800 kbp (gene WWOX). WWOX).<br />
Le proteine codificate possono variare nelle dimensioni da pochi residui (piccoli<br />
ormoni) sino a molte migliaia (T<strong>it</strong>ina ( T<strong>it</strong>ina, , 38.138 aa). aa).
La struttura dei geni eucariotici<br />
Gli introni dei geni altamente espressi sono circa 14 volte più pi corti<br />
dei geni scarsamente espressi.<br />
29
IHGSC, Nature 2001 409:860 409:860-921, 921, Tab. 35<br />
La struttura dei geni eucariotici: esoni<br />
La conservazione della dimensione degli esoni dall’uomo dall uomo<br />
al C. elegans suggerisce una sostanziale conservazione<br />
dei componenti dell’apparato dell apparato di splicing
IHGSC, Nature 2001 409:860 409:860-921, 921, Tab. 35<br />
La struttura dei geni eucariotici: introni<br />
I geni umani contengono introni mediamente più pi<br />
lunghi dei geni di C.elegans o Drosophila.<br />
Drosophila
GENE EUCARIOTICO<br />
Può un gene codificare per diverse proteine?
Uno stesso gene può codificare per proteine indirizzate a diversi<br />
compartimenti cellulari: cellulari:<br />
l’esempio esempio del gene NFS1<br />
La proteina codificata dal gene NFS1 rimuove lo zolfo dalla cisteina formando alanina. alanina.<br />
Questo gene utilizza<br />
s<strong>it</strong>i di inizio alternativi della trascrizione e quindi traduzione per generare una isoforma m<strong>it</strong>ocondriale ed<br />
una isoforma c<strong>it</strong>oplasmatica. c<strong>it</strong>oplasmatica.<br />
La selezione del s<strong>it</strong>o di inizio della traduzione è regolata dal pH c<strong>it</strong>osolico.<br />
c<strong>it</strong>osolico<br />
L’isoforma isoforma che codifica per la proteina m<strong>it</strong>ocondriale (457 aa) aa)<br />
contiene un peptide segnale e un<br />
dominio aminotrasnferasico.<br />
aminotrasnferasico.<br />
L’altra altra isoforma, isoforma,<br />
che deriva sa un s<strong>it</strong>o di inizio alternativo della trascrizione codifica per una proteina<br />
più pi corta (397 aa) aa)<br />
priva del peptide segnale ma contenente il dominio aminotransferasico.<br />
aminotransferasico.
GENE EUCARIOTICO<br />
Può un gene codificare per diverse proteine?<br />
X
Uno stesso gene può esprimere proteine con funzioni opposte: opposte:<br />
l’esempio esempio dell’attiv<strong>it</strong> dell attiv<strong>it</strong>à della Caspasi 9 (CASP9)<br />
La forma cost<strong>it</strong>utiva della proteina (CASP9, 9 esoni, esoni,<br />
416 aa) aa)<br />
induce<br />
apoptosi. apoptosi.<br />
Essa contiene un Caspase recru<strong>it</strong>ment domain (CARD) e un<br />
dominio caspasi Peptidase_C14.<br />
L’isoforma isoforma più pi corta della proteina (CASP9S, 5 esoni, esoni,<br />
266 aa) aa)<br />
contiene un dominio Caspase recru<strong>it</strong>ment domain (CARD) e un<br />
dominio tronco della Peptidase_C14. Questa isoforma è priva<br />
dell’attiv<strong>it</strong> dell attiv<strong>it</strong>à proteasica e agisce da inib<strong>it</strong>ore dell’apoptosi<br />
dell apoptosi. .
Splicing Alternativo<br />
Oltre il 90% dei geni umani è in grado di esprimere più pi di un<br />
trascr<strong>it</strong>to (ed è quindi soggetto a splicing alternativo). Le diverse<br />
isoforme di splicing possono avere specific<strong>it</strong>à specific<strong>it</strong> a livello di tessuto, di<br />
condizione fisiologica, o patologica.<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
17,635 Human genes<br />
1 2-5 6-10 11-20 21-30 31-50 >50<br />
Number of Transcripts/ Gene
Splicing alternativo e duplicazione genica sono inversamente correlati
GENE EUCARIOTICO<br />
Può un gene codificare per diverse proteine?
Definizione di GENE<br />
• La trascrizione di un gene si può arrestare in corrispondenza di di<br />
diversi<br />
terminatori<br />
Il gene per tp73L codifica per 10 trascr<strong>it</strong>ti alternativi, alternativi,<br />
e utilizza 2 promotori e 3 diversi<br />
terminatori della trascrizione
I geni possono essere sovrapposti<br />
I geni possono essere sovrapposti tra loro, nello stesso orientamento orientamento<br />
o in<br />
orientamento opposto, o anche essere completamente contenuti in altri<br />
geni.
Geni dentro i geni<br />
Geni all’interno di altri geni sono descr<strong>it</strong>ti per i genomi di<br />
organismi semplici e nei m<strong>it</strong>ocondri<br />
Nei mammiferi sono descr<strong>it</strong>ti geni contenuti nei grandi introni di alcuni geni.<br />
A differenza dei genomi piu’ semplici in questi casi spesso viene utilizzato il<br />
filamento opposto al gene “canonico”<br />
Esempio:<br />
GENE EUCARIOTICO<br />
NF1: introne 26 (40Kb) contiene tre piccoli geni (2 esoni)<br />
che vengono trascr<strong>it</strong>ti dal filamento opposto
Geni dentro i geni<br />
NF1<br />
Filamento di senso<br />
GENE EUCARIOTICO<br />
esone 26 Introne 26<br />
esone 27<br />
5’ 3’<br />
Filamento antisenso 3’ 5’<br />
OGMP<br />
2.2KB<br />
EVI2B<br />
10 KB<br />
EVI2A<br />
4 KB
GENE EUCARIOTICO
GENE EUCARIOTICO
Definizione di GENE<br />
Per cercare di giungere ad una definizione appropriata dobbiamo anche considerare la<br />
compless<strong>it</strong>à compless<strong>it</strong> dei trascr<strong>it</strong>ti espressi:<br />
• Alcuni trascr<strong>it</strong>ti vengono originati dalla ligazione di diverse molecole di RNA<br />
attraverso il meccanismo del transplicing<br />
• Si possono formare trascr<strong>it</strong>ti chimerici in segu<strong>it</strong>o alla cotrascrizione di geni disposti in<br />
tandem
Nuova definizione:<br />
Definizione di GENE<br />
Una specifica regione di DNA, la cui trascrizione è regolata da uno o più pi<br />
promotori e altri elementi di controllo trascrizionale che contiene<br />
l’informazione informazione per la sintesi di proteine e RNA non codificanti<br />
funzionali, tra loro correlati per la condivisione di informazione informazione<br />
genetica<br />
(con un tratto di sequenza genomica in comune) a livello dei prodotti prodotti<br />
finali (proteine o ncRNA). ncRNA).<br />
In questo modo è possibile associare al gene specifiche coordinate genomiche che<br />
coincidono con il s<strong>it</strong>o di inizio della trascrizione più pi a monte e il s<strong>it</strong>o di terminazione<br />
più pi a valle. Gene
Una nuova definizione operativa di gene<br />
A C<br />
A B C<br />
A C<br />
DNA<br />
Due trascr<strong>it</strong>ti, trascr<strong>it</strong>ti,<br />
un gene: i prodotti funzionali finali si sovrappongono a<br />
livello genomico. genomico.<br />
I due trascr<strong>it</strong>ti sono “geneticamente<br />
geneticamente correlati” correlati in n<br />
quanto una mutazione nella regione di sovrapposizione avrebbe<br />
effetti su entrambi. entrambi<br />
Al fine di valutare se due trascr<strong>it</strong>ti sono geneticamente correlati è<br />
necessario conoscere la localizzazione della regione codificante.<br />
codificante
Una nuova definizione operativa di gene<br />
A B C<br />
Due trascr<strong>it</strong>ti, trascr<strong>it</strong>ti,<br />
due geni: geni:<br />
i prodotti funzionali finali non si sovrappongono<br />
a livello genico, mentre si osserva sovrapposizione a livello delle delle<br />
regioni<br />
5’UTR. UTR. I due trascr<strong>it</strong>ti non sono “geneticamente geneticamente correlati” correlati in quanto<br />
nessuna mutazione può avere effetto su entrambi i prodotti finali. finali.<br />
Una<br />
mutazione localizzata nella regione 5’UTR 5 UTR può modulare il livello di<br />
espressione di un gene, gene,<br />
esattamente come una mutazione a livello di un<br />
promotore o di una regione enhancer.<br />
H<br />
DNA
1<br />
2<br />
2/3<br />
4<br />
Definizione di GENE<br />
X Y<br />
A B C<br />
A C<br />
1<br />
A B C<br />
A C<br />
H<br />
H<br />
D E<br />
F E<br />
A E<br />
chimeric transcript<br />
A E<br />
H<br />
X Y<br />
4<br />
2<br />
3<br />
D E<br />
F E<br />
F G<br />
3<br />
F G<br />
products<br />
DNA<br />
genes<br />
spliced<br />
transcripts
GENE nei virus
GENE nei virus<br />
VITA?<br />
Virus a DNA Virus a RNA
GENE nei virus
GENE nei virus<br />
Geni sovrapposti<br />
Met Val … proteina b<br />
Sequenza di DNA …GTTTATGGTA…<br />
Val Tyr Gly … proteina A
Modello delle Isocore<br />
Rispetto ai genomi procariotici, procariotici,<br />
negli eucarioti si osserva una più pi marcata variazione<br />
intra-genomica<br />
intra genomica della composizione in basi. Negli eucarioti superiori e nei vertebrati a<br />
sangue caldo, sono presenti regioni genomiche a composizione in basi omogenea.<br />
Secondo il modello delle isocore (Bernardi et al., 1985), il genoma dei vertebrati è un<br />
mosaico di segmenti di DNA, chiamati isocore (>>300 kbp), kbp),<br />
ciascuno caratterizzato<br />
da una propria ed omogenea composizione in basi.<br />
Nei vertebrati a sangue caldo (mammiferi, uccelli) si osservano 5 classi differenti:<br />
- L1 e L2: L2:<br />
isocore povere in GC (oltre il 60% del genoma)<br />
-H1, H1, H2, H3: H3:<br />
isocore ricche in GC<br />
La struttura del genoma ad isocore è correlata ad alcune proprietà propriet del genoma<br />
nucleare
Maria Costantini et al. Genome Res. 2006; 16: 536-541 536 541<br />
Modello delle Isocore<br />
Livelli di GC% dei cromosomi<br />
umani (calcolati su finestre di 100<br />
kbp)<br />
kbp<br />
55
Dimensioni (Mb)<br />
Size, M b<br />
450<br />
400<br />
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
0<br />
L1<br />
Modello delle Isocore<br />
H1<br />
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59<br />
GC, %<br />
GC, %<br />
Maria Costantini et al. Genome Res. 2006; 16: 536-541 536 541<br />
H2<br />
H3<br />
56
Correlazione tra isocore e proprietà propriet del genoma<br />
La maggior parte del genoma è cost<strong>it</strong>u<strong>it</strong>a da isocore<br />
leggere (L1, L2). Al contrario la maggior parte dei geni è<br />
localizzata nelle isocore pesanti (H1, H2 e H3).<br />
Quant<strong>it</strong> Quant<strong>it</strong>à di DNA, Mb<br />
1200<br />
1000<br />
800<br />
600<br />
400<br />
200<br />
0<br />
L1<br />
Famiglie di Isocore<br />
L2 H1 H2 H3<br />
Dens<strong>it</strong> Dens<strong>it</strong>à genica (genes genes/Mb /Mb)<br />
40<br />
30<br />
20<br />
10<br />
0<br />
Distribuzione dei geni<br />
L1 L2 H1 H2 H3<br />
Nel genome core cost<strong>it</strong>u<strong>it</strong>o dalle isocore H2 e H3 (12% del genoma) la dens<strong>it</strong>à dens<strong>it</strong> dei<br />
geni è molto alta (un gene per 5-15kb), 5 15kb), mentre nel cosiddetto empty space<br />
formato dalle isocore di tipo L e H1 (88% del genoma) la dens<strong>it</strong>à dens<strong>it</strong> genica è molto<br />
bassa (un gene per 50-150kb).<br />
50 150kb).
Correlazione tra isocore e proprietà propriet del genoma<br />
Isocore Leggere Isocore pesanti<br />
Struttura<br />
Lunghezza di introni e UTR maggiore minore<br />
Struttura della cromatina chiusa aperta<br />
eterogene<strong>it</strong>à GC% bassa alta<br />
Abbondanza di SINEs bassa alta<br />
Abbondanza di LINEs alta bassa<br />
Metilazione (CpG)<br />
Funzione<br />
maggiore minore<br />
espressione genica bassa alta<br />
Tempo di replicazione tardiva precoce<br />
Ricombinazione bassa alta<br />
La distribuzione degli elementi ripetuti del genoma umano sembra essere influenzata dalle proprietà propriet<br />
composizionali del genoma. Gli elementi ripetuti di tipo LINEs sono localizzati preferenzialmente nelle<br />
isocore L, , mentre gli elementi di tipo SINEs, SINEs,<br />
soprattutto gli elementi Alu, Alu,<br />
sono localizzati preferenzialmente<br />
nelle isocore H. .<br />
Circa il 54% dei geni umani sono localizzati nel genome core (H2, H3). La maggior parte di questi geni (che<br />
corrispondono a geni housekeeping) housekeeping)<br />
sono associati con isole CpG, CpG,<br />
sono attivi trascrizionalmente e<br />
corrispondono alla porzione “aperta aperta” della cromatina.
Corrispondenza tra il bandeggio<br />
dei cromosomi e le isocore<br />
Nei mammiferi, si osserva che le isocore<br />
povere in GC corrispondono alle bande<br />
G(Giemsa Giemsa), ), mentre le isocore ricche in GC<br />
(isocore H2 e H3) H3)<br />
corrispondono alle bande<br />
R(reverse). (reverse). Le estrem<strong>it</strong>à estrem<strong>it</strong> telomeriche sono<br />
cost<strong>it</strong>u<strong>it</strong>e da isocore di tipo H.<br />
La figura mostra la mappa GIEMSA del<br />
cromosoma 12 ottenuta a bassa (400 bande)<br />
ed alta (850 bande) risoluzione in<br />
corrispondenza con le isocore (bande G L1+ e<br />
L1- L1 in blu chiaro e scuro; bande R H3+ e H3-<br />
in giallo e rosso)<br />
Maria Costantini et al. Chromosoma, Chromosoma,<br />
2006
Il genoma è fatto solo di geni?
Il genoma è fatto solo di geni?<br />
Anatomia del Genoma Umano
Il genoma è fatto solo di geni?
Pseudogeni<br />
Talvolta la copia di un gene non è funzionale, ovvero non viene trascr<strong>it</strong>ta in RNA, o<br />
viene trascr<strong>it</strong>ta in un RNA non funzionale. Le copie inattive di un gene vengono dette<br />
pseudogeni. pseudogeni<br />
Gli pseudogeni possono essere classificati in: 1) non processati; 2) processati. processati.<br />
Nel primo caso il gene inattivo è originato dal gene funzionale e contiene la tipica<br />
struttura in esoni ed introni. La copia genica può essere completa completa<br />
o parziale. Gli<br />
pseudogeni di questo tipo si formano con maggiore probabil<strong>it</strong>à probabil<strong>it</strong> nelle regioni<br />
pericentromeriche.<br />
pericentromeriche<br />
Gli pseudogeni processati sono privi di introni in quanto derivano dalla<br />
retrotrasposizione di mRNA (retropseudogeni<br />
retropseudogeni). ). Il numero di copie di retropseudogeni<br />
è correlato al livello di espressione del gene da cui derivano.
Pseudogeni<br />
La Trascr<strong>it</strong>tasi Inversa codificata da elementi LINE può retrotrascrivere un mRNA in<br />
cDNA che successivamente può essere integrato a caso in un cromosoma. cromosoma.<br />
Se sul s<strong>it</strong>o di<br />
inserimento è casualmente presente un promotore il retrogene può essere<br />
eventualmente espresso e diventare funzionale. Normalmente, questo questo<br />
non accade e lo<br />
pseudogene comincia ad accumulare mutazioni casuali che distruggono la ORF<br />
funzionale (frameshifts ( frameshifts, , codoni di stop).<br />
64
Pseudogeni<br />
Nel genoma umano sono stati descr<strong>it</strong>ti ~8.000 pseudogeni (~5.000 nel genoma del<br />
topo). Il maggior numero di pseudogeni processati deriva da geni per proteine<br />
ribosomiali; ribosomiali;<br />
altri gruppi derivano da geni che codificano per proteine che legano il DNA<br />
e l’RNA, l RNA, per molecole strutturali ed enzimi metabolici. Molti pseudogeni derivano da<br />
geni a cui non è stata attribu<strong>it</strong>a una funzione.<br />
Oltre al livello di espressione dei geni, altri fattori gene-specifici gene specifici sono responsabili<br />
dell’origine dell origine degli pseudogeni, pseudogeni,<br />
quali la lunghezza o il loro contenuto in G+C.<br />
G+C
Il genoma è fatto solo di geni?<br />
Il DNA NON<br />
CODIFICANTE<br />
RIPETUTO IN TANDEM<br />
SATELLITE, tipico delle sequenze centromeriche (a-satell<strong>it</strong>e,<br />
monomero di 171 bp)<br />
MINISATELLITE, monomero 6-64bp, altamente polimorfico.<br />
Utilizzato per esami di fingerprint del DNA.<br />
Es.DNA telomerico (TTAGGG)<br />
MICROSATELLITE, 2-4 bp ripetuti in tandem. Espansioni<br />
di triplette sono responsabili di alcune patologie (Distrofia<br />
Miotonica)
Ripetizioni in tandem: Duplicazioni segmentali<br />
Le duplicazioni segmentali sono ripetizioni di segmenti genomici genomici<br />
comunemente<br />
osservate in genomi di animali e piante, non riconducibili a elementi elementi<br />
trasponibili, trasponibili,<br />
di<br />
lunghezza ≥10 10 kbp e ident<strong>it</strong>à ident<strong>it</strong> ≥90%. 90%. Queste possono essere anche molto estese come<br />
nel cromosoma Y umano che presenta un blocco ripetuto di 1.45 Mbp. Mbp.<br />
La porzione eucromatica del genoma umano contiene circa il 5,3% di duplicazioni<br />
segmentali che sono classificate in :<br />
-duplicazioni duplicazioni inter-cromosomiche, inter cromosomiche, segmenti che si sono duplicati tra cromosomi non<br />
omologhi;<br />
-duplicazioni<br />
duplicazioni intra-cromosomiche<br />
intra cromosomiche, , segmenti duplicati all’interno all interno di un particolare<br />
cromosoma.<br />
Duplicazione<br />
segmentali<br />
Gap
Ripetizioni in tandem: Duplicazioni segmentali<br />
Le duplicazioni segmentali sono localizzate in prevalenza nelle regioni adiacenti ai<br />
centromeri, mentre raramente coinvolgono le regioni più pi distali di ciascun braccio dei<br />
cromosomi.<br />
Sono di grande interesse in campo<br />
medico in quanto sono regioni che<br />
mostrano una particolare<br />
predisposizione a riarrangiamenti<br />
con conseguenti effetti fenotipici.<br />
Sono note varie malattie<br />
genetiche correlate a queste<br />
regioni (es. sindrome DiGeorge,<br />
DiGeorge,<br />
Charcot-Marie<br />
Charcot Marie-Tooth Tooth, , etc.).<br />
Possono essere originate da:<br />
1. Crossing over diseguale durante<br />
la meiosi<br />
2. Scambio diseguale tra cromatidi<br />
fratelli
Copy Number Variations (CNV)<br />
Le duplicazioni segmentali sono una importante fonte di variabil<strong>it</strong> variabil<strong>it</strong>à<br />
genetica tra<br />
individui nella popolazione umana. Dato che si estendono su più pi geni, portano alla<br />
variazione del numero di copie di determinati geni tra diversi individui. individui.<br />
E’ oggi possibile fare studi su larga<br />
scala di queste varianti strutturali<br />
del genoma mediante specifiche<br />
piattaforme di microarray.<br />
microarray<br />
Uno studio su 270 individui di 4<br />
popolazioni 1500 CNVs. CNVs<br />
ha identificato circa<br />
I CNV sono responsabili di variazioni<br />
del livello di espressione genica e<br />
possono essere associati a specifici<br />
tratti fenotipici e/o patologici (es.<br />
HIV, cancro della mammella,<br />
autismo, malattie auto-immuni).<br />
auto immuni).
Microsatell<strong>it</strong>i e Minisatell<strong>it</strong>i<br />
I microsatell<strong>it</strong>i sono cost<strong>it</strong>u<strong>it</strong>i da un<strong>it</strong>à un<strong>it</strong> di<br />
ripetizione lunghe da 1 a 10 pb, pb,<br />
ripetute<br />
in tandem 10-20 10 20 volte, che formano<br />
raggruppamenti molto corti,
Gli SSR possono formarsi attraverso un<br />
meccanismo di scivolamento della replicazione<br />
Gli SSR sono presenti con una frequenza di almeno uno ogni circa 2 kb del genoma.<br />
• Si originano da vari meccanismi tra cui il più pi importante è lo scivolamento della DNA polimerasi<br />
durante la replicazione.
Microsatell<strong>it</strong>i:<br />
Microsatell<strong>it</strong>i:<br />
Genetic Fingerprint<br />
Caratteristiche degli SSRs<br />
• Polimorfismo di lunghezza: DNA fingerprinting<br />
• Spesso adoperati come marcatori genetici per la mappatura di<br />
geni associati a patologie.
Microsatell<strong>it</strong>i e malattie genetiche<br />
I microsatell<strong>it</strong>i, microsatell<strong>it</strong>i,<br />
ed in particolare le ripetizioni di triplette sono associati a<br />
varie malattie genetiche
Il genoma è fatto solo di geni?<br />
INTERSPERSO<br />
SINE, brevi elementi nucleari ripetuti (pseudogene processato di RNA7SL)<br />
Alu (300bp, 1.000.000 copie nel genoma umano)<br />
MIR (130bp, 400.000 copie nel genoma umano)<br />
LINE, lunghi elementi nucleari ripetuti (retrotrasposoni)<br />
L1 (6,1Kb a lunghezza completa, 200.000-500.000 copie)<br />
Retrovirus endogeni, HERV<br />
Il DNA NON<br />
CODIFICANTE<br />
Elementi simili retroviral tronchi, RTLV e LTR<br />
Trasposoni a DNA, Mariner
Porzione non codificante:Ripetizioni codificante: Ripetizioni intersperse<br />
Cost<strong>it</strong>u<strong>it</strong>e da sequenze di DNA ripetute, disperse in tutto il genoma. genoma.<br />
Sono defin<strong>it</strong>e anche Elementi mobili del DNA, perché perch derivano da elementi<br />
trasponibili (sequenze di DNA che si muovono o sono duplicate da una posizione posizione<br />
ad<br />
un’altra un altra nel genoma)<br />
Classe I o Retrotrasposoni<br />
si originano per eventi di<br />
retrotrasposizione, retrotrasposizione,<br />
attraverso un<br />
intermedio ad RNA<br />
• elementi LTR<br />
• LINEs: LINEs:<br />
long interspersed nuclear<br />
elements<br />
• SINEs: SINEs:<br />
short interspersed nuclear<br />
elements<br />
Classe II o Trasposoni a DNA<br />
si originano attraverso un intermedio a<br />
DNA, secondo meccanismo di<br />
trasposizione conservativa o replicativa<br />
75
Retrotrasposoni<br />
La caratteristica di tutti i retrotrasposoni<br />
è la presenza di brevi ripetizioni dirette<br />
alle estrem<strong>it</strong>à estrem<strong>it</strong> 3’ e 5’ 5 , copia della<br />
sequenza del s<strong>it</strong>o d’integrazione.<br />
d integrazione.
Ripetizioni Intersperse nel Genoma Umano<br />
Gli elementi ripetuti interspersi cost<strong>it</strong>uiscono cirva il<br />
45% del genoma umano.<br />
umano<br />
• LINE (Long interspersed nuclear elements)<br />
– L1, L2, L3 LINE ( ~21% del genoma, ~100,000 copie)<br />
• SINE (Short interspersed nuclear elements)<br />
– Alu (~10,7% del genoma, ~1,200, 000 copie)<br />
– MIR, MIR3 (~3% del genoma, ~500,000 copie)<br />
• Elementi LTR (Long Terminal Repeats)<br />
– ERV, MalR (8% del genoma, ~500,000 copie)<br />
• Transposoni a DNA<br />
– MER1 (Charlie), MER2 (Tigger), others (2,8% del genoma, ~350, 000 copie)
Elementi LTR<br />
Gli elementi LTR o retrotrasposoni virali (6-7kb) (6 7kb) presentano analogie con i<br />
retrovirus.<br />
Caratteristici degli invertebrati (piante, funghi, insetti) dove sono presenti in gran<br />
numero di copie<br />
env e non<br />
Elementi Ty in S. cerevisiae mancano del gene env<br />
elementi copia in Drosophila possono formare particelle virali<br />
250-600pb 250 600pb
promotore<br />
Pol II<br />
LINEs:long<br />
LINEs:long<br />
interspersed nuclear elements<br />
RNA binding anche endonucleasi<br />
ripetizioni<br />
ripetizioni<br />
ripetizioni<br />
ripetizioni<br />
dirette<br />
dirette<br />
dirette<br />
dirette<br />
Gli elementi LINEs o trasposoni non-LTR non LTR hanno una lunghezza di circa 6-7kb, 6 7kb,<br />
contengono un promotore per l’RNA l RNA polimerasi II (derivano da trascr<strong>it</strong>ti della<br />
l’RNA RNA pol II), una o due ORF e un segnale di poliadenilazione all’estrem<strong>it</strong><br />
all estrem<strong>it</strong>à 3’.<br />
•ORF1 ORF1 codifica per una proteina a funzione ignota ( lega l’RNA?), l RNA?),<br />
•ORF2 ORF2 codifica per un’enzima<br />
un enzima che possiede sia un’attiv<strong>it</strong> un attiv<strong>it</strong>à di trascr<strong>it</strong>tasi inversa<br />
(RT), simile a quella dei retrovirus e dei retrotrasposoni virali, che un’attiv<strong>it</strong> un attiv<strong>it</strong>à di<br />
DNA endonucleasi (EN).<br />
Vi sono tre famiglie principali di elementi LINES: L1 (incluse 60-100 6 100 copie tuttora<br />
attive e moltissime copie inattive troncate all’estrem<strong>it</strong><br />
all estrem<strong>it</strong>à 5’); ); L2 e L3 (inattive). Le<br />
copie attive inserendosi in punti cr<strong>it</strong>ici del genoma possono inattivare inattivare<br />
dei geni con<br />
conseguente insorgenza di patologie.<br />
Le LINEs si inseriscono preferibilmente nelle regioni eucromatiche ricche in A+T.
Meccanismo di trasposizione degli elementi LINEs<br />
1. Generazione di un trascr<strong>it</strong>to LINE full-length<br />
full length a partire dal promotore.<br />
2. ORF1 e ORF2 vengono tradotte e legano il LINE mRNA. mRNA<br />
orf2<br />
5’ orf1<br />
3’<br />
3. Il complesso LINE mRNA/ORF1/ORF2 mRNA/ORF1/ORF2<br />
si sposta nel nucleo, dove l’attiv<strong>it</strong> l attiv<strong>it</strong>à<br />
endonucleasica di ORF2 taglia il dsDNA. dsDNA.<br />
L’estrem<strong>it</strong><br />
L estrem<strong>it</strong>à libera al 3’ 3 (sul DNA)<br />
funge da innesco per la retrotrascrizione a partire dal 3’UTR. 3 UTR.<br />
5’ orf1 3’<br />
orf2<br />
3’ 5’<br />
5’ 3’<br />
Il s<strong>it</strong>o di taglio di ORF1 è TTTT A, e questo spiega l’integrazione<br />
l integrazione<br />
preferenziale nelle regioni genomiche ricche in AT. Dato che la LINE RT ha<br />
una bassa processiv<strong>it</strong>à processiv<strong>it</strong> molte delle copie integrate sono tronche (solo<br />
1/100 è completa).
SINEs: SINEs:<br />
short interspersed nuclear elements<br />
A B AAAA SINE<br />
Gli elementi SINEs sono elementi non-autonomi, non autonomi, hanno una lunghezza<br />
compresa tra 0.1 e 0.4 kb. kb.<br />
Hanno un promotore (interno) per L’RNA L RNA polimerasi III (derivano da trascr<strong>it</strong>ti<br />
della l’RNA l RNA pol III), e una regione ricca in A all’estrem<strong>it</strong><br />
all estrem<strong>it</strong>à 3’ ma non contengono<br />
un segnale di poliadenilazione.<br />
poliadenilazione<br />
Gli elementi SINEs non contengono alcuna ORF codificante per una trascr<strong>it</strong>tasi<br />
inversa, ma sono in grado di trasporre utilizzando la trascr<strong>it</strong>tasi trascr<strong>it</strong>tasi<br />
inversa<br />
sintetizzata da altri retroelementi (trasposizione LINEs-dipendente<br />
LINEs dipendente). ).
SINEs: SINEs:<br />
short interspersed nuclear elements<br />
Gli elementi SINEs sono distribu<strong>it</strong>i ad alta dens<strong>it</strong>à dens<strong>it</strong> nelle regioni ricche in CG del<br />
genoma (isocore H), perché perch hanno un più pi<br />
agli elementi LINEs ( 40%).<br />
elevato contenuto C+G (~57%) rispetto<br />
Nel genoma dei primati sono presenti tre differenti famiglie di elementi SINEs: SINEs:<br />
l’elemento<br />
elemento Alu, Alu,<br />
ancora attivo, e gli elementi inattivi MIR e Ther2/MIR3.<br />
Ther2/MIR3<br />
L’elemento<br />
elemento Alu, Alu,<br />
il più pi comune nei primati, è lungo 0,3kb; è presente in circa<br />
1.200.000 di copie nel genoma umano e rappresenta quindi oltre il il<br />
10% di tutto il<br />
genoma. Presenta una regione ricca in A/T all’estrem<strong>it</strong><br />
all estrem<strong>it</strong>à<br />
meccanismo di retrotrasposizione.<br />
retrotrasposizione.<br />
3’, , coinvolta nel<br />
Le sequenze Alu sono localizzate a monte o a valle dei geni, negli introni, nelle nelle<br />
regioni 5’ 5 e 3’ 3 non tradotte dell’mRNA<br />
dell mRNA. . Non è noto il loro ruolo funzionale,<br />
nonostante siano molto diffuse nel genoma di tutti i primati.<br />
Le sequenze Alu presentano analogie con l’RNA l RNA 7SL, componente di una particella<br />
ribonucleoproteica coinvolta nel meccanismo di secrezione dei polipeptidi di nuova<br />
sintesi attraverso le membrane del reticolo endoplasmatico.<br />
Si r<strong>it</strong>iene che il primo elemento Alu si è originato per un evento di retrotrascrizione<br />
di una molecola di RNA 7SL e successiva integrazione della copia nel genoma.
Meccanismo di retroposizione dell’elemento<br />
dell elemento Alu<br />
Si pensa che il taglio al s<strong>it</strong>o di<br />
inserimento sia opera della L1<br />
endonucleasi<br />
Target-primed<br />
Target primed reverse<br />
transcription (TPRT) Il promotore pol III è necessario ma non<br />
sufficiente per la trascrizione che richiede<br />
anche sequenze fiancheggianti appropriate.<br />
La maggior parte degli elementi Alu<br />
integrati non è attiva in quanto non viene<br />
integrata in un contesto favorevole e muta<br />
rapidamente sia nelle sequenze CpG che<br />
nella regione ricca in A.
Evoluzione e classificazione degli elementi Alu<br />
Gli elementi Alu sono classificati in sottofamiglie che si differenziano per l’epoca l epoca della loro integrazione nel genoma, dalle<br />
più pi antiche (Sx ( Sx, , J) alle più pi recenti (Yc1, etc.).<br />
da: Batzer and Deininger, Deininger,<br />
Nature Rev. Gen. Gen.<br />
3:370380, 2002)
Danni genomici indotti da Alu<br />
Numerose patologie sono provocate dall'integrazione casuale di Alu<br />
(Neurofibromatosi, haemophilia, haemophilia,<br />
sindrome di Apert, Apert,<br />
ecc.) o da<br />
ricombinazione disuguale (diabete di tipo II, sindrome di Lesch–Nyhan<br />
Lesch Nyhan, ,<br />
malattia di Tay–Sachs Tay Sachs, , ipercolesterolemia familiare, α-thalassaemia<br />
thalassaemia, ,<br />
ecc.).
Trasposoni a DNA<br />
I Trasposoni a DNA sono elementi mobili distinti in due categorie:<br />
•Trasposoni<br />
Trasposoni a DNA che si spostano replicandosi: una copia rimane nel s<strong>it</strong>o<br />
originale, mentre la nuova copia si inserisce altrove nel genoma genom<br />
•Trasposoni<br />
Trasposoni a DNA che si spostano in maniera conservativa, da un s<strong>it</strong>o all’altro all altro<br />
del genoma senza aumentare il numero di copie<br />
Sono caratterizzati da una sequenza codificante la trasposasi contenente introni,<br />
fiancheggiata da ripetizioni terminali invert<strong>it</strong>e, simili a quelle quelle<br />
dei trasposoni batterici.<br />
Sono meno comuni negli eucarioti (3% nel genoma umano, raggruppati in 7 classi<br />
principali) rispetto ai retrotrasposoni.<br />
retrotrasposoni<br />
I più pi noti sono gli Elementi Ac e Ds del granturco, i primi elementi mobili identificati<br />
negli anni 50 da B. McClintock e gli elementi P di Drosophila. Drosophila.<br />
Traspongono mediante<br />
il meccanismo di trasposizione conservativa
Funzione degli elementi ripetuti<br />
• Punti caldi per ricombinazione (duplicazioni, inversioni, traslocazioni;<br />
traslocazioni;<br />
creazione di nuovi geni per shuffling esonici) esonici<br />
• Alterazione della espressione genica in quanto portatori di segnali segnali<br />
trascrizionali (es. promotori e enhancer di LTR; promotori di Alu; Alu;<br />
s<strong>it</strong>i di<br />
terminazione deboli della trascrizione di elementi L1; segnali di di<br />
poliadenilazione)<br />
poliadenilazione<br />
• Presenza in geni per proteine (Le Alu contengono s<strong>it</strong>i criptici di splicing; splicing;<br />
fonte di domini proteici; contributo a variabil<strong>it</strong>à variabil<strong>it</strong> delle proteine)<br />
• Reclutamento come elementi regolatori (es. BC200 di primati deriva deriva<br />
da Alu<br />
monomerica)<br />
monomerica<br />
• Fonte di pseudogeni processati (r<strong>it</strong>orno in v<strong>it</strong>a come lunghi esoni? Come<br />
nuovi geni? )<br />
• Fonte di plastic<strong>it</strong>à plastic<strong>it</strong> del genoma e quindi ruolo attivo nel rimodellamento<br />
genomico (riarrangiamenti<br />
( riarrangiamenti cromosomici, reshuffling di geni, etc)<br />
etc
Il genoma è fatto solo di geni?<br />
Paradosso del Valore C
Come misurare la Compless<strong>it</strong>à Compless<strong>it</strong> biologica ?<br />
La compless<strong>it</strong>à compless<strong>it</strong> biologica può essere “misurata misurata” in diversi modi, ad es. sulla base della<br />
divers<strong>it</strong>à divers<strong>it</strong> di tipi cellulari, della compless<strong>it</strong>à compless<strong>it</strong> dei circu<strong>it</strong>i del cervello,……<br />
cervello, ……o del n° teorico<br />
di stati dell’espressione dell espressione genica.<br />
Ipotizzando N geni umani e supponendo che ciascuno possa essere presente in due soli<br />
stati, ON o OFF, il numero di possibili stati sarebbe pari a 2 N . In questo modo si<br />
potrebbe anche calcolare quanto un organismo è più pi complesso di un altro.<br />
da: Claverie JM, Science 2001 291:1255<br />
22,000 geni nel genoma umano<br />
Compless<strong>it</strong>à Compless<strong>it</strong> = 2 22,000<br />
Se si calcola la compless<strong>it</strong>à compless<strong>it</strong> solo sul numero di geni, non vi sono differenze<br />
macroscopiche nella compless<strong>it</strong>à compless<strong>it</strong> negli eucarioti.<br />
eucarioti
Compless<strong>it</strong>à Compless<strong>it</strong> Fenotipica<br />
Il numero di tipi cellulari presenti in ciascun organismo può cost<strong>it</strong>uire cost<strong>it</strong>uire<br />
un indice<br />
affidabile del livello di compless<strong>it</strong>à compless<strong>it</strong> di un organismo. Nell’uomo Nell uomo si stima vi siano<br />
circa 400 tipi cellulari.<br />
Se si calcola la compless<strong>it</strong>à compless<strong>it</strong> solo sul numero di geni, non vi sono differenze<br />
macroscopiche nella compless<strong>it</strong>à compless<strong>it</strong> negli eucarioti. eucarioti<br />
da: Rokas A, Ann. Ann.<br />
Rev. Genet. Genet.<br />
2008 235:251
Compless<strong>it</strong>à Compless<strong>it</strong> genotipica vs fenotipica<br />
• Incremento del numero di cost<strong>it</strong>uenti (es. geni proteici)<br />
• Nuove arch<strong>it</strong>etture proteiche (arrangiamenti lineari di domini proteici) proteici)<br />
• Incremento della compless<strong>it</strong>à compless<strong>it</strong> del trascr<strong>it</strong>toma e del proteoma rispetto al<br />
genoma<br />
- uso di s<strong>it</strong>i di inizio della trascrizione multipli<br />
- splicing alternativi<br />
- s<strong>it</strong>i alternativi di poliadenilazione<br />
- modifiche post-traduzionali<br />
post traduzionali delle proteine<br />
• Incremento della compless<strong>it</strong>à compless<strong>it</strong> delle reti di regolazione genica (es. sviluppo<br />
di meccanismi fini di regolazione dell’espressione dell espressione genica nei metazoi grazie<br />
alla struttura modulare dei promotori)<br />
Le regioni non-codificanti non codificanti del genoma concorrono alla compless<strong>it</strong>à compless<strong>it</strong><br />
genotipica e fenotipica di un organismo.
I Genomi degli Eucarioti: Eucarioti:<br />
numero di cromosomi<br />
Come per il contenuto di DNA, anche il numero e le dimensioni<br />
dei cromosomi è molto variabile tra gli eucarioti. eucarioti<br />
(13 Mbp)<br />
Mbp<br />
(125 Mbp) Mbp<br />
(97 Mbp) Mbp<br />
(3000 Mbp) Mbp<br />
(180 Mbp) Mbp<br />
92
I Genomi degli Eucarioti: Eucarioti Mappe di sintenia<br />
Human<br />
chromosome<br />
Uno specifico cromosoma di un<br />
organismo normalmente risulta<br />
omologo a tratti genomici diversi<br />
su più pi cromosomi di un altro<br />
organismo. Ad esempio il<br />
cromosoma 1 umano presenta<br />
omologia con estese regioni<br />
genomiche Mouse genomiche Mouse (>100 kbp) kbp)<br />
di 8<br />
diversi cromosomi di topo.<br />
chromosome<br />
Mouse<br />
chromosome<br />
Immagine tratta da: http://www.ensembl.org/Homo_sapiens<br />
http://www.ensembl.org/ Homo_sapiens/syntenyview<br />
syntenyview?otherspecies=Mus_musculus;chr=1<br />
?otherspecies=Mus_musculus;chr=1<br />
In tali regioni, dette<br />
“regioni regioni sinteniche”, sinteniche , si<br />
osserva una sostanziale<br />
corservazione<br />
dell’ordine dell ordine genico.
I Genomi degli Eucarioti: Eucarioti:<br />
numero di cromosomi<br />
Non si osserva correlazione tra le dimensioni del genoma e il<br />
numero dei cromosomi, e tra il numero dei cromosomi e la<br />
compless<strong>it</strong>à compless<strong>it</strong> dell’organismo.<br />
dell organismo.<br />
Ad esempio, tra gli invertebrati, S. cerevisiae ha un genoma di<br />
13 Mbp organizzato in 16 cromosomi mentre D. melanogaster ha<br />
un genoma di 180 Mbp, Mbp,<br />
organizzato in 4 cromosomi; tra i<br />
vertebrati, lo zebrafish (Danio Danio rerio) rerio)<br />
ha un genoma di 1700<br />
Mbp, Mbp,<br />
organizzato in 25 cromosomi, 2 cromosomi più pi dell’uomo.<br />
dell uomo.<br />
94
Organism estimated size<br />
estimated<br />
gene number<br />
Homo sapiens(human) 3000 million bases ~22,000-<br />
Rattus norvegicus (rat)<br />
2,750 million<br />
bases<br />
~30,000<br />
Mus musculus (mouse) 2500 million bases ~30,000<br />
Drosophila melanogaster<br />
(fru<strong>it</strong> fly)<br />
average gene<br />
dens<strong>it</strong>y<br />
1 gene per 100,000<br />
bases<br />
1 gene per 100,000<br />
bases<br />
1 gene per 100,000<br />
bases<br />
chromosome<br />
number<br />
180 million bases 13,600 1 gene per 9,000 bases 8<br />
Arabidopsis thaliana (plant) 125 million bases 25,500 1 gene per 4000 bases 5<br />
Caenorhabd<strong>it</strong>is elegans<br />
(roundworm)<br />
Saccharomyces cerevisiae<br />
(yeast)<br />
97 million bases 19,100 1 gene per 5000 bases 6<br />
12 million bases 6300 1 gene per 2000 bases 16<br />
Escherichia coli (bacteria) 4.7 million bases 3200 1 gene per 1400 bases 1<br />
H. influenzae (bacteria) 1.8 million bases 1700 1 gene per 1000 bases 1<br />
Human immunodeficiency<br />
virus (HIV)<br />
EVOLUZIONE DEI GENI<br />
9700 9 1 gene per 1000 bases<br />
46<br />
42<br />
40
Qual è l’origine di tutto questo?<br />
Come si sono evoluti i genomi?
Origine ed evoluzione dei genomi
Origine ed evoluzione dei genomi<br />
Mondo a RNA<br />
Nasc<strong>it</strong>a di molecole autoreplicanti
Origine ed evoluzione dei genomi<br />
Mondo a RNA<br />
Protogenomi a RNA<br />
Compartimentalizzazione<br />
all’interno di membrane<br />
lipidiche<br />
Prime strutture di tipo cellulare
Origine ed evoluzione dei genomi<br />
Come si è evoluto il genoma a DNA?<br />
Nasc<strong>it</strong>a di enzimi proteici
Origine ed evoluzione dei genomi<br />
Come si è evoluto il genoma a DNA?<br />
Trasferimento della funzione codificante dall’RNA<br />
al DNA (chimicamente piu’ stabile)
Origine ed evoluzione dei genomi<br />
Primi Genomi a DNA (3,8 miliardi di anni fa)<br />
Ogni molecola di DNA rappresenta un singolo gene<br />
che codifica per una singola proteina<br />
singolo gene<br />
singola proteina
Origine ed evoluzione dei genomi<br />
Acquisizione di nuovi geni<br />
1. Duplicazione di alcuni o tutti i geni del genoma<br />
2. Acquisizione di geni da altre specie
Origine ed evoluzione dei genomi<br />
Acquisizione di nuovi geni<br />
Duplicazione di un intero genoma<br />
Genoma duplicato
Origine ed evoluzione dei genomi<br />
Acquisizione di nuovi geni<br />
Duplicazione di geni<br />
•Crossing-over disuguale<br />
•Scambio disuguale tra cromatidi fratelli
Origine ed evoluzione dei genomi<br />
Acquisizione di nuovi geni<br />
Duplicazione di geni<br />
Gene A1<br />
Gene A1<br />
Duplicazione<br />
Gene A2<br />
Pressione Nessuna<br />
selettiva pressione<br />
selettiva<br />
Gene A1 GeneB Divergenza<br />
Nuova funzione<br />
o<br />
Funzione simile
Origine ed evoluzione dei genomi<br />
Duplicazione di geni<br />
Acquisizione di nuovi geni<br />
Famiglie geniche
EVOLUZIONE DEI GENI
Origine ed evoluzione dei genomi<br />
Acquisizione di nuovi geni<br />
Riarrangiamento genico<br />
•Duplicazione<br />
dei domini<br />
•Rimescolamento<br />
di domini
Origine ed evoluzione dei genomi<br />
Acquisizione di nuovi geni<br />
ESONI = MOTIVI PROTEICI<br />
MOTIVI<br />
α β β α β β α β<br />
N C<br />
ESONI<br />
Proteina<br />
Gene
Origine ed evoluzione dei genomi<br />
Acquisizione di nuovi geni<br />
Acquisizione di geni da altre specie<br />
Il trasferimento di geni tra batteri è un fenomeno comune in natura<br />
che avviene ancora oggi<br />
I retrovirus sono capaci di spostare geni animali<br />
tra individui della stesse specie e tra specie diverse
EVOLUZIONE DEI GENI<br />
Maria C. Rivera & James A. Lake<br />
The ring of life provides evidence for a genome fusion<br />
origin of eukaryotes<br />
NATURE |VOL 431 | 9 SEPTEMBER 2004
Origine ed evoluzione dei genomi<br />
INTRONI? UN MISTERO<br />
1. IPOTESI INTRONI ANTICHI: gli introni sono molto antichi<br />
e si stanno gradualmente perdendo nei genomi degli eucarioti<br />
2. IPOTESI INTRONI RECENTI: gli introni si sono evoluti di recente<br />
e si stanno gradualmente accumulando nei genomi degli eucarioti
Origine ed evoluzione dei genomi<br />
INTRONI? UN MISTERO<br />
Teoria esonica dei geni
Origine ed evoluzione dei genomi<br />
INTRONI? UN MISTERO<br />
Le evidenze attuali non inficiano alcuna ipotesi
Origine ed evoluzione dei genomi<br />
IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI
Origine ed evoluzione dei genomi<br />
IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI<br />
Uomo – Scimpanzè= 98,5% di omologia
Origine ed evoluzione dei genomi<br />
IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI<br />
Che cosa ci rende diversi dalle scimmie?
Origine ed evoluzione dei genomi<br />
IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI<br />
Che cosa ci rende diversi dalle scimmie?<br />
Sottili cambiamenti nei profili di espressione dei geni<br />
coinvolti in<br />
processi di sviluppo e nella specificazione delle<br />
interconnessioni<br />
all’interno del sistema nervoso
Origine ed evoluzione dei genomi<br />
IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI<br />
Quello che ci rende umani probabilmente<br />
non è il genoma umano di per sé,<br />
ma il modo in cui il genoma funziona