versione fondo bianco - Bgbunict.it

STRUTTURA E FUNZIONE DEL GENE 

EVOLUZIONE DEI GENOMI

Lodish – Molecular Cell Biology 

GENOME: total genetic information carried by a cell or organism 

GENE: physical and functional unit of heredity, which carries 

information from one generation to the next. In molecular terms, 

it is the entire DNA sequence (including exons, introns and 

noncoding transcriptional control regions) necessary for 

production of a functional protein or RNA

Struttura del GENE

GENE procariotico 

Genoma di E. coli


OPERONE 

Sequenze regolatrici a monte 

Sequenze codificanti 

Sequenze terminatrici 

della sequenza codificante

GENE procariotico


Promotori



ORF 

(Open Reading Frame) 

ATGGTATAT-------------------------------TAA 

MET VAL TYR STOP


A B C 

Promotore Operone 


Terminatore


A B C 



mRNA mRNA mRNA 

Proteina Proteina Proteina 

Terminatore

Repressione 


A B C 



Nessuna espressione 

Terminatore

GENI DELLA I CLASSE 

GENI DELLA II CLASSE 

GENI DELLA III CLASSE 

GENE EUCARIOTICO 

RNA RIBOSOMIALE – rRNA (28S-5,8S e 18s) 

RNA MESSAGGERO – mRNA 

Piccoli RNA nucleari – snRNA 

microRNA 

RNA TRANSFER – tRNA 

Piccoli rna nucleolari – snorna 

Piccoli rna citoplasmatici - scrna

GENE EUCARIOTICO

GENE EUCARIOTICO

GENE EUCARIOTICO

GENE EUCARIOTICO

GENE EUCARIOTICO

Promotore 

GENE EUCARIOTICO

Promotore 

GENE EUCARIOTICO

Sequenza 

codificante 

modulare 

GENE EUCARIOTICO


Segnale di 

poliadenilazione

I geni eucariotici sono monocistronici 

Eccezioni: Unità Unit di trascrizione policistroniche risolte in mRNA maturi 

monocistronici per trans-splicing 

trans splicing (es es in tripanosomi, nematodi, 

platelminti); uso di IRES, reinizio della traduzione o frameshift 

traduzionale 

I geni eucariotici non mostrano nessuna evidente 

relazione tra localizzazione e l’attivit l attività funzionale 

(functional functional clustering) clustering) 

o con l’espressione l espressione spazio- 

temporale 

Organizzazione genica negli eucarioti 

Eccezioni: Raggruppamento di geni con funzione correlata, quali geni 

Hox, Hox, 

geni per emoglobine e geni per immunoglobuline (duplicazioni in in 

tandem?)

Organizzazione genica negli eucarioti 

Alcuni geni eucariotici sono policistronici 

Taxon Entità Entit 

Tripanosomi (Euglenozoa 

( Euglenozoa) tutti gli RNA 

Cnidari alcuni RNA 

Platelminti (Metazoa ( Metazoa Acoelomata) Acoelomata pochi RNA 

Nematodi (Metazoa ( Metazoa Pseudocoelomata) 

Pseudocoelomata) 

molti RNA 

Ciona intestinalis/Oikopleura 

intestinalis Oikopleura dioica molti RNA 

Il processamento del precursore policistronico è associato al Trans 

Splicing delle estremità estremit 5’ degli mRNA e alla poliadenilazione delle 

estremità estremit 3’ per generare i trascritti monocistronici. 

monocistronici

Geni codificanti per proteine 

- geni presenti in unica copia (single ( single-copy copy genes) genes 

- geni omologhi presenti in copie multiple ed organizzati in famiglie geniche 

I membri di una stessa famiglia genica possono essere localizzati in 

unico cluster, dispersi, dispersi, 

o localizzati in più pi cluster: 

Geni in cluster: 

α-globin globin (7), growth hormone (5), Class I HLA heavy chain (20),…. (20), 

Geni dispersi: dispersi: 

Pyruvate dehydrogenase (2), Aldolase (5), PAX (>12),.. 

Geni localizzati in più pi cluster: 

HOX (38 – 4), Histones (61 – 2), Olfactory receptors (>900 – 25),… 

25), 

25

La struttura dei geni eucariotici 

Nel genoma umano non si osserva una distribuzione omogenea dei 

geni. La più pi alta densità densit genica si osserva nel chr 19, mentre il chr 13 e 

Y mostrano la più pi bassa densità. 

densit 

introne 

introne 

esone esone 

esone 

TSS 

Caratteristiche 

dei geni umani 

5’UTR UTR 

GENE 

mRNA 

TRASCRIZIONE 

CDS 3’UTR 3’UTR UTR 

Mediana Media 

Numero di esoni 7 8,8 

L introni (bp) 1023 3365 

L 5'UTR (bp) 240 300 

L CDS (bp) 1100 1340 

L 3'UTR (bp) 400 770 

L gene (bp) 14000 27000 

TRADUZIONE

I geni eucariotici presentano una grande varietà variet di strutture e dimensioni. 

Ad esempio nel genoma umano: umano 

Il più pi piccolo: 

tRNA GLU 

tRNA 

GLU (69 


(69 bp) bp 

Il più pi grande: 

Distrofina (2.4 Mb, la sua 

trascrizione richiede circa 16h) 

Il numero di esoni può variare da 1 (geni privi di introni come molti geni per 

ncRNA, ncRNA, 

interferoni, istoni, ribonucleasi, HSP, GPCR, ecc.) sino a 363 (Titina Titina). ). 

Le dimensioni degli esoni e degli introni sono estremamente variabili. variabili. 

A fronte di esoni costituiti da pochi nucleotidi, l’esone l esone più pi grande è presente nel 

gene per ApoB (7.6 kbb). kbb). 

Anche le dimensioni degli introni possono variare da 

pochi nucleotidi fino a 800 kbp (gene WWOX). WWOX). 

Le proteine codificate possono variare nelle dimensioni da pochi residui (piccoli 

ormoni) sino a molte migliaia (Titina ( Titina, , 38.138 aa). aa).


Gli introni dei geni altamente espressi sono circa 14 volte più pi corti 

dei geni scarsamente espressi. 

29

IHGSC, Nature 2001 409:860 409:860-921, 921, Tab. 35 

La struttura dei geni eucariotici: esoni 

La conservazione della dimensione degli esoni dall’uomo dall uomo 

al C. elegans suggerisce una sostanziale conservazione 

dei componenti dell’apparato dell apparato di splicing

IHGSC, Nature 2001 409:860 409:860-921, 921, Tab. 35 

La struttura dei geni eucariotici: introni 

I geni umani contengono introni mediamente più pi 

lunghi dei geni di C.elegans o Drosophila. 

Drosophila


Può un gene codificare per diverse proteine?

Uno stesso gene può codificare per proteine indirizzate a diversi 

compartimenti cellulari: cellulari: 

l’esempio esempio del gene NFS1 

La proteina codificata dal gene NFS1 rimuove lo zolfo dalla cisteina formando alanina. alanina. 

Questo gene utilizza 

siti di inizio alternativi della trascrizione e quindi traduzione per generare una isoforma mitocondriale ed 

una isoforma citoplasmatica. citoplasmatica. 

La selezione del sito di inizio della traduzione è regolata dal pH citosolico. 

citosolico 

L’isoforma isoforma che codifica per la proteina mitocondriale (457 aa) aa) 

contiene un peptide segnale e un 

dominio aminotrasnferasico. 

aminotrasnferasico. 

L’altra altra isoforma, isoforma, 

che deriva sa un sito di inizio alternativo della trascrizione codifica per una proteina 

più pi corta (397 aa) aa) 

priva del peptide segnale ma contenente il dominio aminotransferasico. 

aminotransferasico.


Può un gene codificare per diverse proteine? 

X

Uno stesso gene può esprimere proteine con funzioni opposte: opposte: 

l’esempio esempio dell’attivit dell attività della Caspasi 9 (CASP9) 

La forma costitutiva della proteina (CASP9, 9 esoni, esoni, 

416 aa) aa) 

induce 

apoptosi. apoptosi. 

Essa contiene un Caspase recruitment domain (CARD) e un 

dominio caspasi Peptidase_C14. 

L’isoforma isoforma più pi corta della proteina (CASP9S, 5 esoni, esoni, 

266 aa) aa) 

contiene un dominio Caspase recruitment domain (CARD) e un 

dominio tronco della Peptidase_C14. Questa isoforma è priva 

dell’attivit dell attività proteasica e agisce da inibitore dell’apoptosi 

dell apoptosi. .

Splicing Alternativo 

Oltre il 90% dei geni umani è in grado di esprimere più pi di un 

trascritto (ed è quindi soggetto a splicing alternativo). Le diverse 

isoforme di splicing possono avere specificità specificit a livello di tessuto, di 

condizione fisiologica, o patologica. 

35 

30 

25 

20 

15 

10 

5 

0 

17,635 Human genes 

1 2-5 6-10 11-20 21-30 31-50 >50 

Number of Transcripts/ Gene

Splicing alternativo e duplicazione genica sono inversamente correlati


Può un gene codificare per diverse proteine?

Definizione di GENE 

• La trascrizione di un gene si può arrestare in corrispondenza di di 

diversi 

terminatori 

Il gene per tp73L codifica per 10 trascritti alternativi, alternativi, 

e utilizza 2 promotori e 3 diversi 

terminatori della trascrizione

I geni possono essere sovrapposti 

I geni possono essere sovrapposti tra loro, nello stesso orientamento orientamento 

o in 

orientamento opposto, o anche essere completamente contenuti in altri 

geni.

Geni dentro i geni 

Geni all’interno di altri geni sono descritti per i genomi di 

organismi semplici e nei mitocondri 

Nei mammiferi sono descritti geni contenuti nei grandi introni di alcuni geni. 

A differenza dei genomi piu’ semplici in questi casi spesso viene utilizzato il 

filamento opposto al gene “canonico” 

Esempio: 


NF1: introne 26 (40Kb) contiene tre piccoli geni (2 esoni) 

che vengono trascritti dal filamento opposto

Geni dentro i geni 

NF1 

Filamento di senso 


esone 26 Introne 26 

esone 27 

5’ 3’ 

Filamento antisenso 3’ 5’ 

OGMP 

2.2KB 

EVI2B 

10 KB 

EVI2A 

4 KB

GENE EUCARIOTICO

GENE EUCARIOTICO


Per cercare di giungere ad una definizione appropriata dobbiamo anche considerare la 

complessità complessit dei trascritti espressi: 

• Alcuni trascritti vengono originati dalla ligazione di diverse molecole di RNA 

attraverso il meccanismo del transplicing 

• Si possono formare trascritti chimerici in seguito alla cotrascrizione di geni disposti in 

tandem

Nuova definizione: 


Una specifica regione di DNA, la cui trascrizione è regolata da uno o più pi 

promotori e altri elementi di controllo trascrizionale che contiene 

l’informazione informazione per la sintesi di proteine e RNA non codificanti 

funzionali, tra loro correlati per la condivisione di informazione informazione 

genetica 

(con un tratto di sequenza genomica in comune) a livello dei prodotti prodotti 

finali (proteine o ncRNA). ncRNA). 

In questo modo è possibile associare al gene specifiche coordinate genomiche che 

coincidono con il sito di inizio della trascrizione più pi a monte e il sito di terminazione 

più pi a valle. Gene

Una nuova definizione operativa di gene 

A C 

A B C 

A C 

DNA 

Due trascritti, trascritti, 

un gene: i prodotti funzionali finali si sovrappongono a 

livello genomico. genomico. 

I due trascritti sono “geneticamente 

geneticamente correlati” correlati in n 

quanto una mutazione nella regione di sovrapposizione avrebbe 

effetti su entrambi. entrambi 

Al fine di valutare se due trascritti sono geneticamente correlati è 

necessario conoscere la localizzazione della regione codificante. 

codificante

Una nuova definizione operativa di gene 

A B C 

Due trascritti, trascritti, 

due geni: geni: 

i prodotti funzionali finali non si sovrappongono 

a livello genico, mentre si osserva sovrapposizione a livello delle delle 

regioni 

5’UTR. UTR. I due trascritti non sono “geneticamente geneticamente correlati” correlati in quanto 

nessuna mutazione può avere effetto su entrambi i prodotti finali. finali. 

Una 

mutazione localizzata nella regione 5’UTR 5 UTR può modulare il livello di 

espressione di un gene, gene, 

esattamente come una mutazione a livello di un 

promotore o di una regione enhancer. 

H 

DNA

1 

2 

2/3 

4 


X Y 

A B C 

A C 

1 

A B C 

A C 

H 

H 

D E 

F E 

A E 

chimeric transcript 

A E 

H 

X Y 

4 

2 

3 

D E 

F E 

F G 

3 

F G 

products 

DNA 

genes 

spliced 

transcripts

GENE nei virus

GENE nei virus 

VITA? 

Virus a DNA Virus a RNA

GENE nei virus

GENE nei virus 

Geni sovrapposti 

Met Val … proteina b 

Sequenza di DNA …GTTTATGGTA… 

Val Tyr Gly … proteina A

Modello delle Isocore 

Rispetto ai genomi procariotici, procariotici, 

negli eucarioti si osserva una più pi marcata variazione 

intra-genomica 

intra genomica della composizione in basi. Negli eucarioti superiori e nei vertebrati a 

sangue caldo, sono presenti regioni genomiche a composizione in basi omogenea. 

Secondo il modello delle isocore (Bernardi et al., 1985), il genoma dei vertebrati è un 

mosaico di segmenti di DNA, chiamati isocore (>>300 kbp), kbp), 

ciascuno caratterizzato 

da una propria ed omogenea composizione in basi. 

Nei vertebrati a sangue caldo (mammiferi, uccelli) si osservano 5 classi differenti: 

- L1 e L2: L2: 

isocore povere in GC (oltre il 60% del genoma) 

-H1, H1, H2, H3: H3: 

isocore ricche in GC 

La struttura del genoma ad isocore è correlata ad alcune proprietà propriet del genoma 

nucleare

Maria Costantini et al. Genome Res. 2006; 16: 536-541 536 541 


Livelli di GC% dei cromosomi 

umani (calcolati su finestre di 100 

kbp) 

kbp 

55

Dimensioni (Mb) 

Size, M b 

450 

400 

350 

300 

250 

200 

150 

100 

50 

0 

L1 


H1 

33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 

GC, % 

GC, % 

Maria Costantini et al. Genome Res. 2006; 16: 536-541 536 541 

H2 

H3 

56

Correlazione tra isocore e proprietà propriet del genoma 

La maggior parte del genoma è costituita da isocore 

leggere (L1, L2). Al contrario la maggior parte dei geni è 

localizzata nelle isocore pesanti (H1, H2 e H3). 

Quantit Quantità di DNA, Mb 

1200 

1000 

800 

600 

400 

200 

0 

L1 

Famiglie di Isocore 

L2 H1 H2 H3 

Densit Densità genica (genes genes/Mb /Mb) 

40 

30 

20 

10 

0 

Distribuzione dei geni 

L1 L2 H1 H2 H3 

Nel genome core costituito dalle isocore H2 e H3 (12% del genoma) la densità densit dei 

geni è molto alta (un gene per 5-15kb), 5 15kb), mentre nel cosiddetto empty space 

formato dalle isocore di tipo L e H1 (88% del genoma) la densità densit genica è molto 

bassa (un gene per 50-150kb). 

50 150kb).

Correlazione tra isocore e proprietà propriet del genoma 

Isocore Leggere Isocore pesanti 

Struttura 

Lunghezza di introni e UTR maggiore minore 

Struttura della cromatina chiusa aperta 

eterogeneità GC% bassa alta 

Abbondanza di SINEs bassa alta 

Abbondanza di LINEs alta bassa 

Metilazione (CpG) 

Funzione 

maggiore minore 

espressione genica bassa alta 

Tempo di replicazione tardiva precoce 

Ricombinazione bassa alta 

La distribuzione degli elementi ripetuti del genoma umano sembra essere influenzata dalle proprietà propriet 

composizionali del genoma. Gli elementi ripetuti di tipo LINEs sono localizzati preferenzialmente nelle 

isocore L, , mentre gli elementi di tipo SINEs, SINEs, 

soprattutto gli elementi Alu, Alu, 

sono localizzati preferenzialmente 

nelle isocore H. . 

Circa il 54% dei geni umani sono localizzati nel genome core (H2, H3). La maggior parte di questi geni (che 

corrispondono a geni housekeeping) housekeeping) 

sono associati con isole CpG, CpG, 

sono attivi trascrizionalmente e 

corrispondono alla porzione “aperta aperta” della cromatina.

Corrispondenza tra il bandeggio 

dei cromosomi e le isocore 

Nei mammiferi, si osserva che le isocore 

povere in GC corrispondono alle bande 

G(Giemsa Giemsa), ), mentre le isocore ricche in GC 

(isocore H2 e H3) H3) 

corrispondono alle bande 

R(reverse). (reverse). Le estremità estremit telomeriche sono 

costituite da isocore di tipo H. 

La figura mostra la mappa GIEMSA del 

cromosoma 12 ottenuta a bassa (400 bande) 

ed alta (850 bande) risoluzione in 

corrispondenza con le isocore (bande G L1+ e 

L1- L1 in blu chiaro e scuro; bande R H3+ e H3- 

in giallo e rosso) 

Maria Costantini et al. Chromosoma, Chromosoma, 

2006

Il genoma è fatto solo di geni?

Il genoma è fatto solo di geni? 

Anatomia del Genoma Umano

Il genoma è fatto solo di geni?

Pseudogeni 

Talvolta la copia di un gene non è funzionale, ovvero non viene trascritta in RNA, o 

viene trascritta in un RNA non funzionale. Le copie inattive di un gene vengono dette 

pseudogeni. pseudogeni 

Gli pseudogeni possono essere classificati in: 1) non processati; 2) processati. processati. 

Nel primo caso il gene inattivo è originato dal gene funzionale e contiene la tipica 

struttura in esoni ed introni. La copia genica può essere completa completa 

o parziale. Gli 

pseudogeni di questo tipo si formano con maggiore probabilità probabilit nelle regioni 

pericentromeriche. 

pericentromeriche 

Gli pseudogeni processati sono privi di introni in quanto derivano dalla 

retrotrasposizione di mRNA (retropseudogeni 

retropseudogeni). ). Il numero di copie di retropseudogeni 

è correlato al livello di espressione del gene da cui derivano.

Pseudogeni 

La Trascrittasi Inversa codificata da elementi LINE può retrotrascrivere un mRNA in 

cDNA che successivamente può essere integrato a caso in un cromosoma. cromosoma. 

Se sul sito di 

inserimento è casualmente presente un promotore il retrogene può essere 

eventualmente espresso e diventare funzionale. Normalmente, questo questo 

non accade e lo 

pseudogene comincia ad accumulare mutazioni casuali che distruggono la ORF 

funzionale (frameshifts ( frameshifts, , codoni di stop). 

64

Pseudogeni 

Nel genoma umano sono stati descritti ~8.000 pseudogeni (~5.000 nel genoma del 

topo). Il maggior numero di pseudogeni processati deriva da geni per proteine 

ribosomiali; ribosomiali; 

altri gruppi derivano da geni che codificano per proteine che legano il DNA 

e l’RNA, l RNA, per molecole strutturali ed enzimi metabolici. Molti pseudogeni derivano da 

geni a cui non è stata attribuita una funzione. 

Oltre al livello di espressione dei geni, altri fattori gene-specifici gene specifici sono responsabili 

dell’origine dell origine degli pseudogeni, pseudogeni, 

quali la lunghezza o il loro contenuto in G+C. 

G+C


Il DNA NON 

CODIFICANTE 

RIPETUTO IN TANDEM 

SATELLITE, tipico delle sequenze centromeriche (a-satellite, 

monomero di 171 bp) 

MINISATELLITE, monomero 6-64bp, altamente polimorfico. 

Utilizzato per esami di fingerprint del DNA. 

Es.DNA telomerico (TTAGGG) 

MICROSATELLITE, 2-4 bp ripetuti in tandem. Espansioni 

di triplette sono responsabili di alcune patologie (Distrofia 

Miotonica)

Ripetizioni in tandem: Duplicazioni segmentali 

Le duplicazioni segmentali sono ripetizioni di segmenti genomici genomici 

comunemente 

osservate in genomi di animali e piante, non riconducibili a elementi elementi 

trasponibili, trasponibili, 

di 

lunghezza ≥10 10 kbp e identità identit ≥90%. 90%. Queste possono essere anche molto estese come 

nel cromosoma Y umano che presenta un blocco ripetuto di 1.45 Mbp. Mbp. 

La porzione eucromatica del genoma umano contiene circa il 5,3% di duplicazioni 

segmentali che sono classificate in : 

-duplicazioni duplicazioni inter-cromosomiche, inter cromosomiche, segmenti che si sono duplicati tra cromosomi non 

omologhi; 

-duplicazioni 

duplicazioni intra-cromosomiche 

intra cromosomiche, , segmenti duplicati all’interno all interno di un particolare 

cromosoma. 

Duplicazione 

segmentali 

Gap

Ripetizioni in tandem: Duplicazioni segmentali 

Le duplicazioni segmentali sono localizzate in prevalenza nelle regioni adiacenti ai 

centromeri, mentre raramente coinvolgono le regioni più pi distali di ciascun braccio dei 

cromosomi. 

Sono di grande interesse in campo 

medico in quanto sono regioni che 

mostrano una particolare 

predisposizione a riarrangiamenti 

con conseguenti effetti fenotipici. 

Sono note varie malattie 

genetiche correlate a queste 

regioni (es. sindrome DiGeorge, 

DiGeorge, 

Charcot-Marie 

Charcot Marie-Tooth Tooth, , etc.). 

Possono essere originate da: 

1. Crossing over diseguale durante 

la meiosi 

2. Scambio diseguale tra cromatidi 

fratelli

Copy Number Variations (CNV) 

Le duplicazioni segmentali sono una importante fonte di variabilit variabilità 

genetica tra 

individui nella popolazione umana. Dato che si estendono su più pi geni, portano alla 

variazione del numero di copie di determinati geni tra diversi individui. individui. 

E’ oggi possibile fare studi su larga 

scala di queste varianti strutturali 

del genoma mediante specifiche 

piattaforme di microarray. 

microarray 

Uno studio su 270 individui di 4 

popolazioni 1500 CNVs. CNVs 

ha identificato circa 

I CNV sono responsabili di variazioni 

del livello di espressione genica e 

possono essere associati a specifici 

tratti fenotipici e/o patologici (es. 

HIV, cancro della mammella, 

autismo, malattie auto-immuni). 

auto immuni).

Microsatelliti e Minisatelliti 

I microsatelliti sono costituiti da unità unit di 

ripetizione lunghe da 1 a 10 pb, pb, 

ripetute 

in tandem 10-20 10 20 volte, che formano 

raggruppamenti molto corti,

Gli SSR possono formarsi attraverso un 

meccanismo di scivolamento della replicazione 

Gli SSR sono presenti con una frequenza di almeno uno ogni circa 2 kb del genoma. 

• Si originano da vari meccanismi tra cui il più pi importante è lo scivolamento della DNA polimerasi 

durante la replicazione.

Microsatelliti: 

Microsatelliti: 

Genetic Fingerprint 

Caratteristiche degli SSRs 

• Polimorfismo di lunghezza: DNA fingerprinting 

• Spesso adoperati come marcatori genetici per la mappatura di 

geni associati a patologie.

Microsatelliti e malattie genetiche 

I microsatelliti, microsatelliti, 

ed in particolare le ripetizioni di triplette sono associati a 

varie malattie genetiche


INTERSPERSO 

SINE, brevi elementi nucleari ripetuti (pseudogene processato di RNA7SL) 

Alu (300bp, 1.000.000 copie nel genoma umano) 

MIR (130bp, 400.000 copie nel genoma umano) 

LINE, lunghi elementi nucleari ripetuti (retrotrasposoni) 

L1 (6,1Kb a lunghezza completa, 200.000-500.000 copie) 

Retrovirus endogeni, HERV 

Il DNA NON 

CODIFICANTE 

Elementi simili retroviral tronchi, RTLV e LTR 

Trasposoni a DNA, Mariner

Porzione non codificante:Ripetizioni codificante: Ripetizioni intersperse 

Costituite da sequenze di DNA ripetute, disperse in tutto il genoma. genoma. 

Sono definite anche Elementi mobili del DNA, perché perch derivano da elementi 

trasponibili (sequenze di DNA che si muovono o sono duplicate da una posizione posizione 

ad 

un’altra un altra nel genoma) 

Classe I o Retrotrasposoni 

si originano per eventi di 

retrotrasposizione, retrotrasposizione, 

attraverso un 

intermedio ad RNA 

• elementi LTR 

• LINEs: LINEs: 

long interspersed nuclear 

elements 

• SINEs: SINEs: 

short interspersed nuclear 

elements 

Classe II o Trasposoni a DNA 

si originano attraverso un intermedio a 

DNA, secondo meccanismo di 

trasposizione conservativa o replicativa 

75

Retrotrasposoni 

La caratteristica di tutti i retrotrasposoni 

è la presenza di brevi ripetizioni dirette 

alle estremità estremit 3’ e 5’ 5 , copia della 

sequenza del sito d’integrazione. 

d integrazione.

Ripetizioni Intersperse nel Genoma Umano 

Gli elementi ripetuti interspersi costituiscono cirva il 

45% del genoma umano. 

umano 

• LINE (Long interspersed nuclear elements) 

– L1, L2, L3 LINE ( ~21% del genoma, ~100,000 copie) 

• SINE (Short interspersed nuclear elements) 

– Alu (~10,7% del genoma, ~1,200, 000 copie) 

– MIR, MIR3 (~3% del genoma, ~500,000 copie) 

• Elementi LTR (Long Terminal Repeats) 

– ERV, MalR (8% del genoma, ~500,000 copie) 

• Transposoni a DNA 

– MER1 (Charlie), MER2 (Tigger), others (2,8% del genoma, ~350, 000 copie)

Elementi LTR 

Gli elementi LTR o retrotrasposoni virali (6-7kb) (6 7kb) presentano analogie con i 

retrovirus. 

Caratteristici degli invertebrati (piante, funghi, insetti) dove sono presenti in gran 

numero di copie 

env e non 

Elementi Ty in S. cerevisiae mancano del gene env 

elementi copia in Drosophila possono formare particelle virali 

250-600pb 250 600pb

promotore 

Pol II 

LINEs:long 

LINEs:long 

interspersed nuclear elements 

RNA binding anche endonucleasi 

ripetizioni 

ripetizioni 

ripetizioni 

ripetizioni 

dirette 

dirette 

dirette 

dirette 

Gli elementi LINEs o trasposoni non-LTR non LTR hanno una lunghezza di circa 6-7kb, 6 7kb, 

contengono un promotore per l’RNA l RNA polimerasi II (derivano da trascritti della 

l’RNA RNA pol II), una o due ORF e un segnale di poliadenilazione all’estremit 

all estremità 3’. 

•ORF1 ORF1 codifica per una proteina a funzione ignota ( lega l’RNA?), l RNA?), 

•ORF2 ORF2 codifica per un’enzima 

un enzima che possiede sia un’attivit un attività di trascrittasi inversa 

(RT), simile a quella dei retrovirus e dei retrotrasposoni virali, che un’attivit un attività di 

DNA endonucleasi (EN). 

Vi sono tre famiglie principali di elementi LINES: L1 (incluse 60-100 6 100 copie tuttora 

attive e moltissime copie inattive troncate all’estremit 

all estremità 5’); ); L2 e L3 (inattive). Le 

copie attive inserendosi in punti critici del genoma possono inattivare inattivare 

dei geni con 

conseguente insorgenza di patologie. 

Le LINEs si inseriscono preferibilmente nelle regioni eucromatiche ricche in A+T.

Meccanismo di trasposizione degli elementi LINEs 

1. Generazione di un trascritto LINE full-length 

full length a partire dal promotore. 

2. ORF1 e ORF2 vengono tradotte e legano il LINE mRNA. mRNA 

orf2 

5’ orf1 

3’ 

3. Il complesso LINE mRNA/ORF1/ORF2 mRNA/ORF1/ORF2 

si sposta nel nucleo, dove l’attivit l attività 

endonucleasica di ORF2 taglia il dsDNA. dsDNA. 

L’estremit 

L estremità libera al 3’ 3 (sul DNA) 

funge da innesco per la retrotrascrizione a partire dal 3’UTR. 3 UTR. 

5’ orf1 3’ 

orf2 

3’ 5’ 

5’ 3’ 

Il sito di taglio di ORF1 è TTTT A, e questo spiega l’integrazione 

l integrazione 

preferenziale nelle regioni genomiche ricche in AT. Dato che la LINE RT ha 

una bassa processività processivit molte delle copie integrate sono tronche (solo 

1/100 è completa).

SINEs: SINEs: 

short interspersed nuclear elements 

A B AAAA SINE 

Gli elementi SINEs sono elementi non-autonomi, non autonomi, hanno una lunghezza 

compresa tra 0.1 e 0.4 kb. kb. 

Hanno un promotore (interno) per L’RNA L RNA polimerasi III (derivano da trascritti 

della l’RNA l RNA pol III), e una regione ricca in A all’estremit 

all estremità 3’ ma non contengono 

un segnale di poliadenilazione. 

poliadenilazione 

Gli elementi SINEs non contengono alcuna ORF codificante per una trascrittasi 

inversa, ma sono in grado di trasporre utilizzando la trascrittasi trascrittasi 

inversa 

sintetizzata da altri retroelementi (trasposizione LINEs-dipendente 

LINEs dipendente). ).

SINEs: SINEs: 

short interspersed nuclear elements 

Gli elementi SINEs sono distribuiti ad alta densità densit nelle regioni ricche in CG del 

genoma (isocore H), perché perch hanno un più pi 

agli elementi LINEs ( 40%). 

elevato contenuto C+G (~57%) rispetto 

Nel genoma dei primati sono presenti tre differenti famiglie di elementi SINEs: SINEs: 

l’elemento 

elemento Alu, Alu, 

ancora attivo, e gli elementi inattivi MIR e Ther2/MIR3. 

Ther2/MIR3 

L’elemento 

elemento Alu, Alu, 

il più pi comune nei primati, è lungo 0,3kb; è presente in circa 

1.200.000 di copie nel genoma umano e rappresenta quindi oltre il il 

10% di tutto il 

genoma. Presenta una regione ricca in A/T all’estremit 

all estremità 

meccanismo di retrotrasposizione. 

retrotrasposizione. 

3’, , coinvolta nel 

Le sequenze Alu sono localizzate a monte o a valle dei geni, negli introni, nelle nelle 

regioni 5’ 5 e 3’ 3 non tradotte dell’mRNA 

dell mRNA. . Non è noto il loro ruolo funzionale, 

nonostante siano molto diffuse nel genoma di tutti i primati. 

Le sequenze Alu presentano analogie con l’RNA l RNA 7SL, componente di una particella 

ribonucleoproteica coinvolta nel meccanismo di secrezione dei polipeptidi di nuova 

sintesi attraverso le membrane del reticolo endoplasmatico. 

Si ritiene che il primo elemento Alu si è originato per un evento di retrotrascrizione 

di una molecola di RNA 7SL e successiva integrazione della copia nel genoma.

Meccanismo di retroposizione dell’elemento 

dell elemento Alu 

Si pensa che il taglio al sito di 

inserimento sia opera della L1 

endonucleasi 

Target-primed 

Target primed reverse 

transcription (TPRT) Il promotore pol III è necessario ma non 

sufficiente per la trascrizione che richiede 

anche sequenze fiancheggianti appropriate. 

La maggior parte degli elementi Alu 

integrati non è attiva in quanto non viene 

integrata in un contesto favorevole e muta 

rapidamente sia nelle sequenze CpG che 

nella regione ricca in A.

Evoluzione e classificazione degli elementi Alu 

Gli elementi Alu sono classificati in sottofamiglie che si differenziano per l’epoca l epoca della loro integrazione nel genoma, dalle 

più pi antiche (Sx ( Sx, , J) alle più pi recenti (Yc1, etc.). 

da: Batzer and Deininger, Deininger, 

Nature Rev. Gen. Gen. 

3:370380, 2002)

Danni genomici indotti da Alu 

Numerose patologie sono provocate dall'integrazione casuale di Alu 

(Neurofibromatosi, haemophilia, haemophilia, 

sindrome di Apert, Apert, 

ecc.) o da 

ricombinazione disuguale (diabete di tipo II, sindrome di Lesch–Nyhan 

Lesch Nyhan, , 

malattia di Tay–Sachs Tay Sachs, , ipercolesterolemia familiare, α-thalassaemia 

thalassaemia, , 

ecc.).

Trasposoni a DNA 

I Trasposoni a DNA sono elementi mobili distinti in due categorie: 

•Trasposoni 

Trasposoni a DNA che si spostano replicandosi: una copia rimane nel sito 

originale, mentre la nuova copia si inserisce altrove nel genoma genom 

•Trasposoni 

Trasposoni a DNA che si spostano in maniera conservativa, da un sito all’altro all altro 

del genoma senza aumentare il numero di copie 

Sono caratterizzati da una sequenza codificante la trasposasi contenente introni, 

fiancheggiata da ripetizioni terminali invertite, simili a quelle quelle 

dei trasposoni batterici. 

Sono meno comuni negli eucarioti (3% nel genoma umano, raggruppati in 7 classi 

principali) rispetto ai retrotrasposoni. 

retrotrasposoni 

I più pi noti sono gli Elementi Ac e Ds del granturco, i primi elementi mobili identificati 

negli anni 50 da B. McClintock e gli elementi P di Drosophila. Drosophila. 

Traspongono mediante 

il meccanismo di trasposizione conservativa

Funzione degli elementi ripetuti 

• Punti caldi per ricombinazione (duplicazioni, inversioni, traslocazioni; 

traslocazioni; 

creazione di nuovi geni per shuffling esonici) esonici 

• Alterazione della espressione genica in quanto portatori di segnali segnali 

trascrizionali (es. promotori e enhancer di LTR; promotori di Alu; Alu; 

siti di 

terminazione deboli della trascrizione di elementi L1; segnali di di 

poliadenilazione) 

poliadenilazione 

• Presenza in geni per proteine (Le Alu contengono siti criptici di splicing; splicing; 

fonte di domini proteici; contributo a variabilità variabilit delle proteine) 

• Reclutamento come elementi regolatori (es. BC200 di primati deriva deriva 

da Alu 

monomerica) 

monomerica 

• Fonte di pseudogeni processati (ritorno in vita come lunghi esoni? Come 

nuovi geni? ) 

• Fonte di plasticità plasticit del genoma e quindi ruolo attivo nel rimodellamento 

genomico (riarrangiamenti 

( riarrangiamenti cromosomici, reshuffling di geni, etc) 

etc


Paradosso del Valore C

Come misurare la Complessità Complessit biologica ? 

La complessità complessit biologica può essere “misurata misurata” in diversi modi, ad es. sulla base della 

diversità diversit di tipi cellulari, della complessità complessit dei circuiti del cervello,…… 

cervello, ……o del n° teorico 

di stati dell’espressione dell espressione genica. 

Ipotizzando N geni umani e supponendo che ciascuno possa essere presente in due soli 

stati, ON o OFF, il numero di possibili stati sarebbe pari a 2 N . In questo modo si 

potrebbe anche calcolare quanto un organismo è più pi complesso di un altro. 

da: Claverie JM, Science 2001 291:1255 

22,000 geni nel genoma umano 

Complessità Complessit = 2 22,000 

Se si calcola la complessità complessit solo sul numero di geni, non vi sono differenze 

macroscopiche nella complessità complessit negli eucarioti. 

eucarioti

Complessità Complessit Fenotipica 

Il numero di tipi cellulari presenti in ciascun organismo può costituire costituire 

un indice 

affidabile del livello di complessità complessit di un organismo. Nell’uomo Nell uomo si stima vi siano 

circa 400 tipi cellulari. 

Se si calcola la complessità complessit solo sul numero di geni, non vi sono differenze 

macroscopiche nella complessità complessit negli eucarioti. eucarioti 

da: Rokas A, Ann. Ann. 

Rev. Genet. Genet. 

2008 235:251

Complessità Complessit genotipica vs fenotipica 

• Incremento del numero di costituenti (es. geni proteici) 

• Nuove architetture proteiche (arrangiamenti lineari di domini proteici) proteici) 

• Incremento della complessità complessit del trascrittoma e del proteoma rispetto al 

genoma 

- uso di siti di inizio della trascrizione multipli 

- splicing alternativi 

- siti alternativi di poliadenilazione 

- modifiche post-traduzionali 

post traduzionali delle proteine 

• Incremento della complessità complessit delle reti di regolazione genica (es. sviluppo 

di meccanismi fini di regolazione dell’espressione dell espressione genica nei metazoi grazie 

alla struttura modulare dei promotori) 

Le regioni non-codificanti non codificanti del genoma concorrono alla complessità complessit 

genotipica e fenotipica di un organismo.

I Genomi degli Eucarioti: Eucarioti: 

numero di cromosomi 

Come per il contenuto di DNA, anche il numero e le dimensioni 

dei cromosomi è molto variabile tra gli eucarioti. eucarioti 

(13 Mbp) 

Mbp 

(125 Mbp) Mbp 

(97 Mbp) Mbp 

(3000 Mbp) Mbp 

(180 Mbp) Mbp 

92

I Genomi degli Eucarioti: Eucarioti Mappe di sintenia 

Human 

chromosome 

Uno specifico cromosoma di un 

organismo normalmente risulta 

omologo a tratti genomici diversi 

su più pi cromosomi di un altro 

organismo. Ad esempio il 

cromosoma 1 umano presenta 

omologia con estese regioni 

genomiche Mouse genomiche Mouse (>100 kbp) kbp) 

di 8 

diversi cromosomi di topo. 

chromosome 

Mouse 

chromosome 

Immagine tratta da: http://www.ensembl.org/Homo_sapiens 

http://www.ensembl.org/ Homo_sapiens/syntenyview 

syntenyview?otherspecies=Mus_musculus;chr=1 

?otherspecies=Mus_musculus;chr=1 

In tali regioni, dette 

“regioni regioni sinteniche”, sinteniche , si 

osserva una sostanziale 

corservazione 

dell’ordine dell ordine genico.

I Genomi degli Eucarioti: Eucarioti: 

numero di cromosomi 

Non si osserva correlazione tra le dimensioni del genoma e il 

numero dei cromosomi, e tra il numero dei cromosomi e la 

complessità complessit dell’organismo. 

dell organismo. 

Ad esempio, tra gli invertebrati, S. cerevisiae ha un genoma di 

13 Mbp organizzato in 16 cromosomi mentre D. melanogaster ha 

un genoma di 180 Mbp, Mbp, 

organizzato in 4 cromosomi; tra i 

vertebrati, lo zebrafish (Danio Danio rerio) rerio) 

ha un genoma di 1700 

Mbp, Mbp, 

organizzato in 25 cromosomi, 2 cromosomi più pi dell’uomo. 

dell uomo. 

94

Organism estimated size 

estimated 

gene number 

Homo sapiens(human) 3000 million bases ~22,000- 

Rattus norvegicus (rat) 

2,750 million 

bases 

~30,000 

Mus musculus (mouse) 2500 million bases ~30,000 

Drosophila melanogaster 

(fruit fly) 

average gene 

density 

1 gene per 100,000 

bases 

1 gene per 100,000 

bases 

1 gene per 100,000 

bases 

chromosome 

number 

180 million bases 13,600 1 gene per 9,000 bases 8 

Arabidopsis thaliana (plant) 125 million bases 25,500 1 gene per 4000 bases 5 

Caenorhabditis elegans 

(roundworm) 

Saccharomyces cerevisiae 

(yeast) 

97 million bases 19,100 1 gene per 5000 bases 6 

12 million bases 6300 1 gene per 2000 bases 16 

Escherichia coli (bacteria) 4.7 million bases 3200 1 gene per 1400 bases 1 

H. influenzae (bacteria) 1.8 million bases 1700 1 gene per 1000 bases 1 

Human immunodeficiency 

virus (HIV) 

EVOLUZIONE DEI GENI 

9700 9 1 gene per 1000 bases 

46 

42 

40

Qual è l’origine di tutto questo? 

Come si sono evoluti i genomi?

Origine ed evoluzione dei genomi

Origine ed evoluzione dei genomi 

Mondo a RNA 

Nascita di molecole autoreplicanti


Mondo a RNA 

Protogenomi a RNA 

Compartimentalizzazione 

all’interno di membrane 

lipidiche 

Prime strutture di tipo cellulare


Come si è evoluto il genoma a DNA? 

Nascita di enzimi proteici


Come si è evoluto il genoma a DNA? 

Trasferimento della funzione codificante dall’RNA 

al DNA (chimicamente piu’ stabile)


Primi Genomi a DNA (3,8 miliardi di anni fa) 

Ogni molecola di DNA rappresenta un singolo gene 

che codifica per una singola proteina 

singolo gene 

singola proteina


Acquisizione di nuovi geni 

1. Duplicazione di alcuni o tutti i geni del genoma 

2. Acquisizione di geni da altre specie



Duplicazione di un intero genoma 

Genoma duplicato



Duplicazione di geni 

•Crossing-over disuguale 

•Scambio disuguale tra cromatidi fratelli




Gene A1 

Gene A1 

Duplicazione 

Gene A2 

Pressione Nessuna 

selettiva pressione 

selettiva 

Gene A1 GeneB Divergenza 

Nuova funzione 

o 

Funzione simile




Famiglie geniche

EVOLUZIONE DEI GENI



Riarrangiamento genico 

•Duplicazione 

dei domini 

•Rimescolamento 

di domini



ESONI = MOTIVI PROTEICI 

MOTIVI 

α β β α β β α β 

N C 

ESONI 

Proteina 

Gene



Acquisizione di geni da altre specie 

Il trasferimento di geni tra batteri è un fenomeno comune in natura 

che avviene ancora oggi 

I retrovirus sono capaci di spostare geni animali 

tra individui della stesse specie e tra specie diverse

EVOLUZIONE DEI GENI 

Maria C. Rivera & James A. Lake 

The ring of life provides evidence for a genome fusion 

origin of eukaryotes 

NATURE |VOL 431 | 9 SEPTEMBER 2004


INTRONI? UN MISTERO 

1. IPOTESI INTRONI ANTICHI: gli introni sono molto antichi 

e si stanno gradualmente perdendo nei genomi degli eucarioti 

2. IPOTESI INTRONI RECENTI: gli introni si sono evoluti di recente 

e si stanno gradualmente accumulando nei genomi degli eucarioti



Teoria esonica dei geni



Le evidenze attuali non inficiano alcuna ipotesi


IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI


IL GENOMA UMANO: GLI ULTIMI 5 MILIONI DI ANNI 

Uomo – Scimpanzè= 98,5% di omologia



Che cosa ci rende diversi dalle scimmie?



Che cosa ci rende diversi dalle scimmie? 

Sottili cambiamenti nei profili di espressione dei geni 

coinvolti in 

processi di sviluppo e nella specificazione delle 

interconnessioni 

all’interno del sistema nervoso



Quello che ci rende umani probabilmente 

non è il genoma umano di per sé, 

ma il modo in cui il genoma funziona

versione fondo bianco - Bgbunict.it

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?