Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Lezione 8 “Progetto genoma e le sue ricadute”
Progetto genoma e diagnosi
molecolare
PERCHE’ SEQUENZIARE IL GENOMA UMANO?
● Mappare fisicamente i geni e le altre sequenze
● La sequenza completa di tutti i geni rende più semplice l’identificazione dei geni responsabili
delle malattie mendeliane
● Possibilità di determinare la struttura esoni-introni
● Rivelare le regioni di controllo non codificanti
● Rivelare i potenziali RNA non codificanti (miRNA, lncRNA e altri) e i loro potenziali bersagli
● Identificare polimorfismi (SNPs)
○ per identificare poliformismi devo identificare molti più genomi => i poliformismi non si
sono scoperti subito, ma mano a mano dopo il sequenziamento del primo genoma. E’
stato attivato infatti un progetto chiamato “One thousand genoes”, poi questo si è
accresciuto e ad oggi la Gran Bretagna sta effettuando il sequenziamento genomico
su metà dei suoi abitanti
● Scoprire l’inatteso
Progetto originale del Progetto Genoma
Il progetto originale risale al 1984, e si è diviso in più fasi di scoperta:
● 1987 → mappa genetica a bassa risoluzione creata con marcatori RFLP
○ si sono mappati molti poliformismi di restrizione, con distanze relative misurate con
Centimorgan
■ 1 cM= distanza tra due alleli che corrisponde ad una frequenza di
ricombinazione dell’1%
● 1994 → ottenuta una mappa genetica ad alta risoluzione (risoluzione= 1 cM) con microsatelliti
altamente poliformici
○ ricadute immediate come nel facilitare il clonaggio posizionale dei geni, e per la
medicina forense
● obiettivo di ottenere una mappa fisica e non più genetica, che contasse il numero di basi che
separassero una sequenza dall’alta con la maggiore accuratezza possibile
○ per avere una mappa fisica c’è stato bisogno di sequenziare i genomi
Il sequenziamento genomico è iniziato conl’approcciotop down.
APPROCCIO TOP DOWN
Quando è iniziato il sequenziamento del genoma non esistevano ancora i sequenziatori
automatici. Bisognava ricorrere al sequenziamento di Sanger, che aveva come svantaggio la
lunghezza.
Poiché sequenziare era estremamente laborioso e costoso, e perché richiedeva
tempo e personale, bisognava sequenziare meno possibile. Per fare il minor numero
possibile di sequenze bisognava prima selezionare i frammenti di genoma da sequenziare in
modo da essere sicuri di non sequenziare troppe volte lo stesso frammento, ma ovviamente
essere anche sicuri di sequenziare frammenti che si sovrapponessero per sapere in che
ordine erano posizionati i frammenti sul genoma.
È stato adottato un approccio top-down (dall’alto verso il basso) in cui si è partiti dal DNA genomico,
lo si è frammentato in grandi frammenti che sono stati clonati in vettori come cromosomi artificiali di
lieviti YAC e cromosomi artificiali di batteri BAC, in grado di contenere sequenze molto lunghe
144
Lezione 8 “Progetto genoma e le sue ricadute”
Il DNA genomico viene così frammentato in frammenti che si possono sovrapporre per poterli
ordinare sul cromosoma e capire chi viene prima e chi viene dopo.
● I frammenti utilizzati erano molto grossi (utilizzati principalmente YAC e BAC e non fagi
lambda - che avevano 25,000 basi , a differenza delle 300,000 utilizzate in questo caso)
● sub clonati in vettori da sequenziamento in quanto il metodo di Sanger non può sequenziare
300,000 basi. Un vettore buono per il sequenziamento è il vettore plasmidico e con l’uso delle
sequenze al lato del Multiple Cloning Site di come primer di innesco sia al 5’ che al 3’.
● I vettori da sequenziamento sono YAC, BAC, P1 o PAC, e il DNA genomico frammentato
viene assemblato in contings con minima ridondanza
○ contigs: si riferisce a cloni sovrapponentisi che formano una mappa fisica del genoma
usata per guidare il sequenziamento e assemblamento
● è avvenuto quindi il sub clonaggio in vettori da sequenziamento e il successivo
sequenziamento
per cui, nello specifico, ecco qual’è il procedimento:
Tutti questi frammenti che si sovrappongono relativamente l’uno all’altro rendono conto di una
sequenza piuttosto lunga e continua del
cromosoma, e vengono chiamaticontigs
(cloni sovrapponentisi che formano una mappa
fisica del genoma usata per guidare il
sequenziamento e assemblamento).
Si creano dei contigs che tra di loro hanno una
ridondanza minima, con l’ultimo frammento di
un contig si sovrapporrà parzialmente al primo
frammento del contig successivo. Si prendono
grandi frammenti, li si ordinano con mappatura
di restrizione e a questo punto si vanno a
sequenziare soltanto quelli che hanno la
sovrapposizione minima e quindi la maggior
lunghezza possibile di sequenza che possa
portare ad estendere la conoscenza del DNA
genomico.
A questo punto questi contigs di frammenti
contenuti nei cloni sono ulteriormente
frammentati e sub clonati in vettori che ne
permettono il sequenziamento bidirezionale.
Così facendo, dopo molto lavoro e tempo, si otteneva la sequenza di tutto il contig che può essere
unita con quella del contig successivo e così via.
vantaggi
localizzare correttamente le sequenze ripetute, purché una sequenza ripetuta si trovasse all’interno di
uno d questi frammenti e non lo coprisse totalmente
svantaggi
molto laborioso
Il progetto originale era fortemente condizionato dalla difficoltà di
sequenziare il DNA, e quindi dalla necessità di ridurre al minimo
il quantitativo di sequenze da effettuare.
Lo sviluppo di sequenziatori automatici capaci di produrre
400,000 basi/giorno ha largamente superato questo ostacolo,
permettendo di passare ad un approccio “whole genome
shotgun “ che rivedremo con Venter.
145
Lezione 8 “Progetto genoma e le sue ricadute”
WHOLE GENOME SHOTGUN
Nell’approccio whole genome shotgun il DNA genomico è sempre suddiviso in frammenti casuali più
o meno lunghi (5.000-20.000 basi) e anche in frammenti più corti derivati dalla rottura meccanica
dovuta per esempio da ultrasuoni. I frammenti sono poi clonati direttamente in vettori di
sequenziamento, inseriti nei sequenziatori automatici per ottenere un sequenziamento
automatico bidirezionale.
Tantissime sequenze sono identiche o molto simili tra loro, ma questo non influisce negativamente
sull’approccio. Questi automatismi hanno comportato lo sviluppo in parallelo di algoritmi bioinformatici
che fanno sì che il computer sia in grado di elaborare rapidamente questa mole di dati. I risultati
vengono inseriti nel computer per trovare le sovrapposizioni di sequenze e quindi da un numero
indistinto di milioni di frammenti si arriva alla ricostruzione computerizzata della sequenza genomica.
Il vantaggio è evidente, infatti si tratta di un processo molto veloce e automatizzabile; l’unico
svantaggio è dovuto alla difficoltà dell’organizzare le sequenze ripetute perché non si può ricostruire
la loro esatta posizione nel genoma.
Protagonisti del Progetto Genoma
Inizialmente si stimava che la sequenza
sarebbe stata completata nel 2005, poi dato
che il sequenziamento procedeva senza
complicanze si disse che si sarebbe finita
per il 2003. In realtà la combinazione degli
approcci di due consorzi diversi, ha portato
alla pubblicazione di sequenze più o meno
indipendenti nel 2001. I due istituti in
questione erano il consorzio pubblico e il
consorzio di Venter, una ditta privata, che
ha il merito di aver cominciato a sviluppare
il processo shotgun. Questo sforzo per il
sequenziamento del genoma umano e
successivamente degli altri genomi degli
organismi modello, è stato il primo sforzo
scientifico internazionale e corale. Il
progetto è stato iniziato e pilotato dall’NIH
(National Institutes of Health) americano, ma parallelamente si sono formati numerosi gruppi in tutti i
diversi paesi che contribuivano al sequenziamento del genoma, che contribuivano in modo
significativo riversando i dati in un unico database. Diverso è stato invece l’approccio di Venter.
Inizialmente Venter lavorava all’NIH, ma si è separato formando un’azienda privata per perseguire
l’idea che aveva avuto di sequenziare prima i cDNA per avere dei punti fermi nel genoma e poi di
implementare l’approccio shotgun.
Venter prima del Progetto Genoma e quindi di
sequenziare il genoma, ha intuito che andava
sequenziato il trascrittoma(poichè erano meno
sequenze; questo è stato principalmente un
lavoro quantitativo)
Ha preso tutti gli RNA e ha realizzato librerie di
cDNA. Ha clonato poi i frammenti da un lato e
dall’altro grazie a dei sequenziatori automatici =>
si sono ottenute le sequenze parziali di moltissimi
cDNA, soprannominati EST (expressed sequence
tags), utili in due modi
146
Lezione 8 “Progetto genoma e le sue ricadute”
1) hanno aiutato a mappare i geni perché la sequenza genomica dava tutta la sequenza di
introni ed esoni, mentre loro mappano principalmente l’esoma, e se ho la sequenza di un
esone intero è molto più facile decidere la suddivisione
2) utilizzati come surrogato di analisi del trascrittoma
a) più EST corrispondenti da un RNA ottenevo da una certa libreria, più potevo
comprendere i livelli di RNA in quella libreria e quindi in quel particolare organo o
tessuto
b) a lungo è stato possibile comprare gli EST, comprando il clone che veniva dal
consorzio e questo ha reso molto più rapidi gli studi
Venter ha quindi utilizzato ilsequenziamento shotguned è avvenuta molta competizione fino alla fine
tra Venter e Collins, anche se poi i due sequenziamenti sono arrivati bene o male insieme (tuttavia il
genoma sequenziato usato è stato quello di Venter).
Alla fine però entrambi gli approcci sono stati utili, uno per l’ordinamento più preciso delle sequenze
ripetute, l’altro per la rapidità di sequenziamento. Questo non può che confermare il fatto che la
collaborazione sia fondamentale nella ricerca scientifica, ma che anche la competizione sia utile; è
stato proprio sotto lo stimolo dell’approccio di Venter che i consorzi pubblici hanno iniziato ad adottare
i sequenziatori automatici, riducendo notevolmente i tempi che hanno portato al sequenziamento del
primo genoma umano molto prima della fine preventivata.
Questo primo sequenziamento del genoma umano era in realtà incompleto, infatti presentava dei tratti
mancanti.
Il primo sequenziamento completo del genoma umano chiamato T2T (telomere to telomere) è stato
finito a Maggio-Giugno del 2022, ci sono voluti più di 20 anni e un’evoluzione pazzesca delle
tecnologie di sequenziamento.
APPROFONDIMENTO
EST
Le Expressed Sequence Tag (EST) sono dei piccoli frammenti di 200-800 bp che si
ottengono dal sequenziamento del cDNA. Dunque una EST non e altro che una
read. Fin dal 1991 le EST (al plurale spesso identificate come ESTs) hanno avuto un
ruolo fondamentale nel sequenziamento della parte codificante del genoma umano.
Poiche i trascritti di RNA non possono essere clonati direttamente, essi vanno
convertiti in una molecola di DNA complementare a doppio filamento (il cDNA),
che e molto piu stabile, clonabile e dunque utilizzabile ai fini del sequenziamento. II
cDNA viene ottenuto grazie ad una reazione in cui viene impiegato l'enzima
trascrittasi inversa.
Poiché i geni vengono espressi in maniera diversa da un tipo cellulare all'altro (leggi
anche IL TRASCRITTOMA), per ogni tipo di tessuto vengono prodotte librerie di
cDNA diverse. Ogni libreria contiene cloni di cDNA che rappresentano nell'insieme il
trascrittoma di un determinato tipo cellulare. E tuttavia estremamente importante
sottolineare che il trascrittoma non e costituito soltanto da mRNA (cioe mRNA che
codifica per proteine), ma anche da numerose molecole di ncRNA (RNA non
codificante) che, secondo le ricerche più recenti, sembra essere assai più
rappresentato di quanto non si credesse in passato. Storicamente, tuttavia, il termine
EST viene riferito nella maggior parte dei casi all'mRNA solamente. Per questo
motivo si suol dire che le EST hanno permesso lo studio della parte codificante del
genoma e posto le basi per la comprensione del proteoma.
Come si ricostruisce la sequenza di un'intera molecola di RNA usando le EST?
La ricostruzione del trascritto di un intero gene (che può essere ben più lungo di
800bp), avviene "riagganciando" le varie EST in corrispondenza delle loro estremità
5' e 3', che sono in parte sovrapponibili. Tutte le EST che costituiscono il messaggero
di un unico gene costituiscono il cosiddetto contig (EST contig). Questa operazione
di riallineamento delle EST e di ricostruzione delle sequenze dei trascritti porta alla
147
Lezione 8 “Progetto genoma e le sue ricadute”
costituzione di un cosiddetto EST assembly, cioè di un assemblato che raccoglie tutti
i trascritti di un organismo. Assembly è in realtà un termine generico che indica la
raccolta di tutte le sequenze di un individuo, vuoi a livello genomico (di DNA) che a
livello di trascritti (di cDNA). Dunque un esoma
Premio Nobel su genoma Uomo di Neanderthal e Homo Sapiens che ha permesso di comprendere
che non si erano separati come ceppi.
Ad oggi alcuni studi hanno dimostrato che le persone che hanno più rischio di ammalarsi di Covid in
maniera grave hanno un genoma più simile a quello di Neanderthal che a quello di Sapiens, così
come chi ha i gruppi A e B ha più possibilità rispetto a chi ha gruppi 0.
I gruppi A e B sono più diffusi nelle zone della Lombardia, mentre quelli di gruppo 0 sono più diffusi in
Toscana - Lazio.
Gruppi A e B rendevano più resistenti alla peste; il gruppo 0 rendeva più resistente alla malaria e
quindi è più diffuso nelle zone malariche.
VANTAGGI DELLA CONOSCENZA DEL GENOMA
CONOSCERE LA SEQUENZA DEL GENOMA EQUIVALE A CONOSCERE L’ALFABETO DI
UNA LINGUA E DISPORRE I TESTI DA DECIFRARE
Le sequenze sono state pian pianoannotate.
Tutte queste annotazioni erano sottoposte a verifiche sperimentali, quindi da quello che si sapeva
sperimentalmente a quello che si poteva predire dalla sequenza, veniva ulteriormente verificato
sperimentalmente.
Le annotazioni hanno permesso di determinare:
148
Lezione 8 “Progetto genoma e le sue ricadute”
● Posizione dei geni
● Struttura esoni-introni
● Trascritti alternativi
● Inizio e termine della trascrizione
● Posizione regioni di controllo
● Sequenza delle proteine codificate
● Profili di espressione genica, sia quelli fisiologici che quelli correlati a malattia
● Funzioni biologiche (costruita una vera e propria ontologia genica,gene ontology: per ogni
gene è stata resa nota la funzione molecolare, il suo processo biologico, e il compartimento
cellulare della sua proteina- membrana, citoplasma, nucleo ecc.)
● Identificazione digeni ortologhi(geni presentiin specie diverse, derivanti da un gene
ancestrale comune - beta globina umana e beta globina di topo. Tutte e due derivano da una
globina ancestrale che si è poi divisa) e paraloghi (formatisi in seguito a duplicazione di un
gene nell’ambito di una stessa specie- alfa globina e beta globina sono paraloghi nell’uomo
perché derivano da un gene comune-)
● Sequenze ripetute
● Polimorfismi
↧
Immediate ricadute positive del progetto genoma
poiché le sequenze finali sono state ottenute sovrapponendo la sequenza di individui diversi, è stato
possibile individuare un numero (milioni) molto alto di polimorfismi di singoli nucleotidi (SNPs). Minimo
1 ogni 1000 basi.
IL PROGETTO GENOMA E I POLIFORMISMI
Al completamento del primo draft del genoma umano (2000) comincio’ uno sforzo volto a mappare
tutte le variazioni geniche piu’ comuni tra gli individui (The International Hap Map Project), che ha
prodotto una guida a centinaia di milioni di SNPs.
Il progetto “One thousand genomes” (=”1000 genomi”, ora completato ed esteso) si propone di
mappare anche gli SNPs piu’ rari. Non contiene informazioni geografiche o mediche in modo da
consentire la circolazione dei dati senza problemi di privacy.
In parallelo, il progetto “Personal Genome” si pone lo scopo di unire alle sequenze di 100,000
individui informazioni mediche e personali, per consentire di mappare direttamente combinazioni di
SNPs correlate a stati patologici.
Problema: la privacy → non tanto di risalire al nome, ma dà accesso alla connessione alla
connessione tra sequenza genoma e implicazioni mediche, infatti per accedere a questi dati è
necessaria una lunga trafila.
CONFRONTO CON ORGANISMI MODELLO
Oltre al genoma umano, sono stati sequenziati anche i genomi di organismi modello, proprio per il
concetto di geni ortologhi, infatti non si può capire come è fatto il genoma umano e come funzionano i
nostri geni se non li confrontiamo con quelli dei principali organismi modello dove le funzioni possono
essere testate sperimentalmente.
Gli organismi modello principalmente usati sono stati:
● mammiferi
○ Mus musculus
149
Lezione 8 “Progetto genoma e le sue ricadute”
○ Rattus Norvegicus
○ Primati non umani
● E. coli
● S. Cerevisiae
● Drosophila Melanogaster
● Caenorhabditis Elegans
● Fugu
● Danio Rerio (zebrafish)
Il confronto con gli organismi modello (genomica comparativa,genomica funzionale comparativa) ci
permette di conoscere cosa ci accomuna alle altre specie e le ragioni delle nostre peculiarità oltre ad
aiutarci ad individuare meccanismi biochimici conservati.
Inoltre i modelli sperimentali geneticamente trattabili sono fondamentali per lo studio della funzione
genica in condizioni normali e patologiche.
Si sta scoprendo come la maggior parte delle similitudini siano nella sequenza non codificante.
STUDIO DELLA FUNZIONE GENICA IN CONDIZIONI NORMALI E
PATOLOGICHE UTILIZZANDO MODELLI SPERIMENTALI
GENETICAMENTE TRATTABILI
●
●
●
●
Premio Nobel per la Medicina nel 2001 a Hartwell, Nurse e Hunt, che hanno definito le basi
molecolari dei meccanismi di divisione cellulare partendo dallo studio dei geni di lievito
coinvolti nella regolazione del ciclo cellulare
Ortologhi dei geni associati a malattie quali fibrosi cistica o distrofia miotonica in lievito:
studio funzionale del lievito mediante analisi genetiche e biochimiche
Uso di Drosophila e C. Elegans come sistemi modello per studiare disordini cognitivi,
depressione e relativi farmaci
Animali transgenici geneticamente modificabili come modelli di malattia
Uso di un verme come organismo modello per la ricerca biomedica
● formato da un unico tubo digerente
● nella parte della bocca ci sono dei neuroni multisensoriali
● Ciclo vitale di ~ 50 ore (da uovo a uovo; ermafrodita facoltativo), embrioni trasparenti→ è
possibile seguire lo sviluppo di questi che ovviamente si sviluppano fuori
● Facilità di crescita (cresce su capsule petri di E.coli a 20°C)
● Utilizzo della genetica (per identificare geni soppressori o complementari)
● formato da pochissime cellule: 959 cellule (di cui: 302 neuroni; ~7000 sinapsi)
● Genoma da 100 Mb, sequenziato >99,9% (6 cromosomi)
○ costituito da ~ 19.000 geni (~ 5.000 geni essenziali), circa il 70% dei geni umani
hanno un ortologo (omologo) inclusi molti geni “malattia” che portano a malattia
monogeniche
● I geni umani possono spesso complementare il gene ortologo mutante, provando che i geni e
quindi le proteine sono intercambiabili (anche se poi ovviamente la depressione umana e
quella di questo verme ematoide sarà molto diversa)
VIE DI SEGNALAZIONE CONSERVATE IN C. ELEGANS
1) La sinapsi serotoninergica
La depressione è dovuta a carenze di
serotonina, e i farmaci utilizzati
permettono di secernere serotonina nei
neuroni e farla interagire nella sinapsi.
150
Lezione 8 “Progetto genoma e le sue ricadute”
La quantità di serotonina presente nella sinapsi dipende dal riartake che secerne la serotonina e se
ne riassorbe un po’.
La serotonina è prodotta nei neuroni a partire dal triptofano, che grazie al 5-OH- triptamina produce
serotonina.
2) diabete
MODELLI VALIDATI CON IL C. ELEGANS
Il C. elegans è stato usato come modello di molte malattie:
1) sistema nervoso centrale
a) Depressione, Psicosi
b) Malattie neurodegenerative:
c) Parkinson, Alzheimer, Huntington, malattia del motoneurone
d) Polineuropatie (dolore)
2) malattie metaboliche
a) diabete di tipo II
b) obesità
3) malattie cardiovascolari
a) aritmie
4) oncologia
5) malattie del muscolo
alcuni casi visti in maniera più precisa
malattia di Alzheimer (AD)
Nel 1993, il primo presenilina è stato scoperto in C. elegans 6. Due anni dopo, mutazioni nel gene
umano presenilina-1 sono state associate con insorgenza precoce familiare AD 65,66. Una notevole
conservazione funzionale tra C. elegans e umano ha potuto essere dimostrato: l'espressione del
presenilin-1 umano in C. elegans ha potuto salvare
carenze neuronali di C. elegans sel-12 presenilin mutants 67,68. C. elegans ricerca ha
ulteriormente avanzata la comprensione dell'ANNUNCIO identificando i presenilins come componenti
del complesso y-secretasi, un obiettivo importante in AD.
Diabete di tipo 2
Nel 1997, studi genetici in C. elegans identificarono regolatori negativi della via di segnalazione
dell'insulina. Uno di questi geni, daf-16, codifica l'ortologo di C. elegans del fattore di trascrizione
forkhead FOXO 70. Cinque anni dopo, FOXO perdita di funzione fu trovato per salvare il fenotipo
diabetico del mice 71 insulino-resistente.
Depressione
151
Lezione 8 “Progetto genoma e le sue ricadute”
C. elegans non è solo un modello genetico stabilito, ma può anche essere utilizzato per
studiare i meccanismi di base della farmacologia animale intero. Per esempio,
la fluoxetina antidepressiva ha dimostrato di aumentare la segnalazione serotoninergica in
C. elegans inibendo l'ortologo C. elegans del trasportatore di ricaptazione della serotonina
SERT". Questo ha stimolato una serie di indagini per identificare modalità aggiuntive di
azioni della fluoxetina e per chiarire ulteriormente il meccanismo molecolare della depressione.
Uso della Drosophila Melanogaster come modello per lo studio di malattie
SOMIGLIANZE TRA IL SISTEMA NERVOSO DELLA MOSCA E QUELLO UMANO
●
Le somiglianze biologiche tra gli esseri umani e la Drosophila sono state sfruttate con grande
successo nel campo delle malattie neurodegenerative in generale, e nella ricerca sulla
malattia di Alzheimer in particolare.
●
●
●
●
La mosca ha un cervello, contenente circa 200.000 neuroni che, come il sistema nervoso
centrale dei vertebrati, è composto da una serie di sottostrutture funzionalmente
specializzate.
Le fonti primarie di input sensoriali sono visive e olfattive e queste vengono elaborate
rispettivamente nei lobi ottico e antennale. Un complesso centrale fornisce l'output motorio, e
i “mushroom bodies” si occupano della memoria. Tutte queste unzioni possono essere testate
e misurate
Anche i neuroni sono molto simili ai loro equivalenti umani in termini di forma,
intercomunicazioni sinaptiche e firme biochimiche. Queste somiglianze funzionali e strutturali
consentono ai modelli di mosche della malattia umana di integrare i paradigmi dei roditori a
livello biofisico, biologico molecolare, neurobiologico e comportamentale, con il vantaggio di
un sistema più flessibile e scalabile.
Ci sono attualmente modelli di Drosophila per molte malattie neurodegenerative: Parkinson,
Alzheimer, Huntington, malattia del motoneurone, Polineuropatie
Era post-genomica
●
●
●
●
genomica e post-genomica funzionale: ovverosia la comprensione su vasta scala del
trascrittoma, dei network biologici e delle interazioni funzionali tra prodotti genici
Sono stati usati:
○ Modelli cellulari e animali specifici
○ Modelli cellulari e animali su vasta scala
Un’altra ricaduta è che oggi è possibile lo studio dellaProteomicadi un gene
altre ricadute sono state:
○ La comparazione delle sequenze genomiche dei microorganismi rappresenta uno
strumento fondamentale per lo sviluppo razionale di nuovi antibiotici
○ analisi del trascrittoma e del genoma su vasta scala tramite analisi di microarray di
DNA
Domande di fine lezione
Il progetto genoma: differenze tra approccio top-down e approccio shotgun
DIFFERENZE:
- grandezza frammenti
- se frammenti sono + grandi => migliore posizionamento frammenti
152
Lezione 8 “Progetto genoma e le sue ricadute”
Approccio top-down
L'approccio top-down consiste nel frammentare un DNA genomico di partenza in grandi frammenti,
clonati poi in vettori come i cromosomi artificiali di lievito YAC o i cromosomi artificiali di batteri BAC,
poiché sono in grado di contenere sequenze molto lunghe.
I frammenti si sovrappongono relativamente l'uno all'altro e rendono conto di una sequenza lunga e
continua del cromosoma. Sono chiamati contigs.
I contigs tra di loro hanno una ridondanza minima e l'ultimo frammento di un contig si sovrapporrà
parzialmente al primo frammento del contig successivo.
Si prendono quindi grandi frammenti, li si ordinano con mappatura di restrizione e a questo punto si
vanno a sequenziare soltanto quelli che hanno la sovrapposizione minima e quindi la maggior
lunghezza possibile di sequenza che possa portare ad estendere la conoscenza del DNA genomico.
A questo punto questi contigs di frammenti contenuti nei cloni sono ulteriormente frammentati e sub
clonati in vettori che ne permettono il sequenziamento bidirezionale.
Così facendo, si otterrà la sequenza di tutto il contig che può essere unita con quella del contig
successivo e così via.
Whole genome shotgun
Il DNA genomico è suddiviso in frammenti lunghi (come nell'approccio top gun) e in frammenti più
corti, derivati dalla rottura meccanica dovuta, per esempio, agli ultrasuoni.
I frammenti sono poi clonati direttamente in vettori di sequenziamento, inseriti nei sequenziatori
automatici per ottenere un sequenziamento automatico bidirezionale.
E' stata poi attuata la ricostruzione computerizzata della sequenza genomica.
Che cosa si intende per “annotazione dei geni”?
Con annotazione di un gene si intende assegnare a ogni determinato gene uno specifico ruolo.
Le annotazioni (determinate via via che i geni vengono sequenziati) sono state poste a verifiche
sperimentali, e hanno permesso di determinare:
● Posizione dei geni
● Struttura esoni-introni
● Trascritti alternativi
● Inizio e termine della trascrizione
● Posizione regioni di controllo
● Sequenza delle proteine codificate
● Profili di espressione genica
● Funzioni biologiche
Sono state così costruite mappe “gene ontology" che caratterizzano i geni
Perché il progetto genoma ha permesso di mappare moltissimi SNPs?
Perché è riuscito a mappare tutte le variazioni geniche più comuni tra gli individui e non solo, e quindi
a osservare le differenze che vi sono tra le basi di ciascun individuo.
Per essere definito poliformismo, deve essere presente nell’1% della popolazione
Secondo che principio modelli animali quali C.Elegans e Drosofila sono usati con successo
come modelli di malattia?
I geni di questi organismi sono ortologhi e quindi hanno permesso alla genomica funzionale
comparativa di poterli studiare per conoscere cosa accomuna l'uomo a queste specie, e osservare le
somiglianze che ci sono con alcuni meccanismi biochimici conservati, nonché lo sviluppo di patologie.
Ovviamente, si studiano quei processi, quelle funzioni ecc, che sono rimaste simili all’uomo (altrimenti
non avrebbe senso, eg. depressione -vedi sopra
153
Lezione 9 “NGS in medicina”
DIAGNOSI MOLECOLARE E
MEDICINA DI PRECISIONE
PARTE “STORICA” INTRODUTTIVA
MICROARRAY
● Quando sono stati messi a punto, il sequenziamento del genoma era ancora indietro, lontano
dall’essere finito, ma erano presenti moltissimi EST (sequenze trascritte di cDNA).
○ Di questi EST ignoravamo la funzione e sapevamo solamente che erano espressi,
tuttavia venivano comunque utilizzati nel microarray e quindi si è iniziato a sviluppare
il trascrittoma, ma solo a scopo diagnostico.
■ sono stati quindi classificati gli individui (in questo caso pazienti) senza
conoscere le funzioni degli EST, tuttavia è il processo diagnostico è risultato
possibile perché si avevano tutte le sequenze trascritte
NGS
● la conoscenza del genoma è stata molto importante per tutti gli strumenti artificiali che hanno
sveltito l’analisi
● il NGS in medicina è servito per l’analisi degli individui, per capire i parametri strutturali, le
mutazioni puntiformi e le variazioni del numero di copie di applicazioni e delezione
● per il NGS si possono generare dei patterns di espressione genica. Vengono analizzati nelle
heat map, in cui ogni colonna rappresenta un paziente diverso e ogni riga un gene. Per ogni
gene abbiamo un colore che caratterizza il livello di espressione relativa. Il computer può
clusterizzare questi dati in modo da avere tutti insieme i campioni che hanno determinate
caratteristiche→ vedremo di nuovo a pag 159
RNA SEQUENCING
● hanno portato a scoprire una serie di DNA trascritti, ma non codificanti, non presenti negli
EST
○ nell’immagine è rappresentata la conta dei reads di ciascun gene. Sapendo che tutti i
reads, grazie al fatto che conosco le sequenze, allineate a ciascun gene, sono
mantenuti, avrò un certo numero di reads per gene (come visto alla fine della lezione
7). Dal numero di reads che corrispondono a ciascun RNA, quindi a ciascun gene,
derivo l’abbondanza di quell’RNA nel materiale originale da cui ho generato la library.
Lezione 9 “NGS in medicina”
COSA SI INTENDE PER DIAGNOSTICA MOLECOLARE
“diagnostica molecolare”= L’insieme delle tecniche di biologia molecolare che consentono di
analizzare acidi nucleici, proteine e metaboliti, grazie alle quali è possibile effettuare indagini di
interesse diagnostico in vari campi della biologia e della medicina.
La biologia molecolare infatti risulta profondamente importante per avvicinarsi sempre di più a
diagnosi molecolari precise e a cure specificamente rivolte verso un certo tipo di malattia,
riconoscendo che ciascun paziente con un certo tipo di malattia ha delle caratteristiche diverse che
possono, se sono rivelate, guidare una diagnosi e anche una terapia.
I tumori sono i casi in cui questi studi sono maggiormente avanzati.
La diagnostica molecolare è una nuova disciplina che cattura la genomica e la proteomica
modelli di espressione e utilizza le informazioni per distinguere tra normale, tessuti precancerosi e
cancerosi al livello molecolare.
Esempio “Diagnosi di un tumore mammario” → processo:
● biopsia
○ tessuto viene sezionato e colorato
● analisi istologica
○ vetrino viene letto da un anatomopatologo che saprà analizzare il vetrino (eg. indice
qualitativo, densità, tipo di cellule ecc), rimane comunque un’analisi limitata
● caratterizzazione formale
○ alti livelli di espressione di un recettore di membrana, detto Her-2/neu, che è un
recettore della famiglia degli epidermal growth factors (si sviluppa in duplicazione
genica). Questo è tuttora un recettoreorfano(ovveroè un recettore di cui non si è
trovato ancora un ligando fisiologico).
Il meccanismo molecolare di espressione è normalmente un’amplificazione genica e
la caratteristica è che le cellule di questi tumori sono dipendenti dalle cellule
Her-2/neu → I tumori positivi per il recettore Her-2/Neu, non solo esprimono
Her-2/Neu, ma ne esprimono alti livelli a causa dell’amplificazione del gene. Con
molti studi si è infatti scoperto che le cellule del tumore Her2 esprimono alti livelli del
recettore Her-2/Neu, quindi, poiché è presente il fattore di crescita che si lega ad
Her-2 e stimola l’attività, Her-2 è recettore del fattore di crescita e ne determinerà un
alto livello proliferico.
Lo studio è nato dai
microarray, in cui si è
scoperto che le cellule
derivate da questi pazienti
avevano bisogno dell’attività
di questo recettore per
proliferare e allora si è
trovato un modo che potesse
neutralizzare l’attività di
Her2/Neu, utilizzando degli
anticorpi monoclonali.
Lezione 9 “NGS in medicina”
RECAP ANTICORPI
Linfociti B si occupano di produrre anticorpi, prodotti nel midollo.
Quelli di tipo Naf (=che non hanno mai incontrato l’antigene) esibiscono delleimmunoglobuline M,o
di membrana, che rappresentano la potenzialità di ciascun linfocita B di riconoscere uno specifico
antigene.
I linfociti B hanno caratteristiche diverse e riconoscono per antigeni diversi (ciò è possibile grazie al
differenziamento cellulare che avviene in ogni cellula). Quando viene trovato l’antigene, comincia un
processo abbastanza rapido di differenziamento che porta il linfocita B a maturare l’anticorpo, quindi
comincia una ricombinazione mirata della regione variabile dell’anticorpo, per migliorare l’affinità
dell’anticorpo con l’antigene. Il riconoscimento,infatti, è ancora piuttosto primitivo, e per funzionare
davvero gli anticorpi hanno bisogno di migliorare l’affinità con l’antigene.
Si ha quindi la maturazione dell’attività e poi il linfocita B inizia a proliferare.
L’IGM (=immunoglobuline M) diventa un anticorpo secreto, definito a questo puntoIGG, e viene
prodotto tronco, senza immunoglobuline di membrana, cosicché l’anticorpo possa andare a
riconoscere l'antigene per riconoscere il microrganismo.
ANTICORPO MONOCLONALE
Un anticorpo monoclonale è un IGG, ed è definito monoclonale perché deriva da un unico linfocita B
di plasmacellule.
processo di costruzione
Gli anticorpi monoclonali vengono realizzati partendo dal topo: lo si immunizza, quindi ci si procura
una fonte infinita di anticorpo, perché vengono poi clonati.
Con un sistema di “taglia e cuci” della biologia molecolare si prendono le sequenze mutate del topo
(come anticorpi) e si attaccano alle sequenze dell’essere umano.
E’ stato così generato un anticorpo monoclonale chiamatoHerceptin.
HERCEPTIN
funzionamento erceptina o Herceptin
● riconosce il recettore Her-2/Neu
● blocca il recettore
● => impedisce l’interazione con il ligando
● => blocca la crescita, quindi la proliferazione
L’anticorpo monoclonale Herceptin viene utilizzato
principalmente cometerapia di mantenimento
vantaggi
● i pazienti con tumori Her-2 positive sono
candidati e vengono curati con l’ercettina o
con la radioterapia. Questo spesso permette
di non dover effettuare chemioterapia, proprio grazie all’utilizzo di questa terapia mirata.
● la resistenza a questa terapia si sviluppa meno rapidamente e meno frequentemente di molti
altri tipi di resistenze, per cui è possibile trovare persone che utilizzano l’ercettina da molto
tempo e riescono a tenere sotto controllo il tumore, che è presente.
○ il problema più grosso delle terapie mirate risulta infatti essere la resistenza, quindi la
perdita di capacità di risposta e che il tumore diventi insensibile alla malattia, perché
le cellule tumorali trovano un modo per crescere senza puntare sugli estrogeni
(vedremo dopo tumori mammari di estrogeni) oppure trovano un modo per crescere
senza puntare sui recettori Her-2
svantaggi
● ha una grande tossicità, in particolare cardiaca.
Lezione 9 “NGS in medicina”
I tumori che non esprimono Her2 sono meno aggressivi, per questo molti più pazienti hanno giovato
di un allungamento della loro vita.
Esempio di diagnosi molecolare: si effettua l’analisi istologica, ma anche un'analisi
immunoistochimica (con cui si evidenziano le proteine), con cui vado a verificare i livelli di
espressione di Her2/Neu.
DIVISIONI TUMORI MAMMARI
Non solo Her2: i tumori mammari si possono suddividere in diversi sottotipi, a seconda della loro
espressione di diversi recettori di membrana (HER2, recettori degli estrogeni e del progesterone).
● i tumori HER2 positivi, non esprimono i recettori per estrogeni e progesterone
● quelli a HER2 negativi, possono esprimere per estrogeni o progesterone
● i tripli negativi non esprimono per nessuno di questi tre
Di seguito sono riportate le 5 classificazioni:
spiegazione immagine
i tripli negativi non
esprimono né per
NH2, nè per
progesterone (pr), nè
per estrogeni (er)
Quelli + aggressivi
sono i tripli negativi,
ma una volta che non
danno metastasi per 5
anni, difficilmente vi
sarà la possibilità di
ammalarsi, mentre i
luminali sono meno
aggressivi, ma c’è più
probabilità di
ammalarsi nel tempo.
Lezione 9 “NGS in medicina”
La diagnostica molecolare, per poter essere effettuata su un paziente, deve necessariamente basarsi
su una mole di dati che deriva da moltissimi pazienti, e dà la possibilità di usare una diagnosi
molecolare, molto più particolareggiata, basata su gruppi di geni che cambiano.
Nel caso dei pazienti con tumore luminale, la terapia mirata è il blocco ormonale; in quelli positivi a
Her2/Neu, invece, è il blocco di Her2/Neu.
domande
1) Perché il triplo negativo, se non esprime per nessuno di questi tre, è il più pericoloso?
Ha trovato un modo di proliferare dipendente da altri meccanismi, ed è anche una delle ragioni che lo
rendono più pericoloso, infatti non ci sono delle terapie mirate per questo carcinoma, ed è molto
difficile trovare un bersaglio a cui possa legarsi il recettore di questo tipo di tumore che ne permette la
proliferazione.
Via via che sono aumentate le possibilità dicaratterizzazionemolecolaredei tumori, si ha avuto la
possibilità di caratterizzare l’espressione di tutto il trascrittoma e le proteine (queste ultime grazie al
proteoma). La caratterizzazione molecolare si effettua grazie abiopsie liquide.
Come funziona e a cosa serve una biopsia liquida nella caratterizzazione tumorale?
Si preleva un campione del sangue dal paziente in cui, in questo caso, visto che stiamo parlando di
caratterizzazione tumorale, sono presenti dei residui di cellule di tumore, e queste cellule sono
analizzabili a livello delle sequenze.
E’ ovvio che la biopsia liquida viene anche utilizzata per capire se è presente il tumore o meno,
perché, nella maggior parte dei tumori ma non in tutti, vengono riversate delle cellule tumorali in
circolo e, magari non sono presenti come cellule intere, ma è presente il loro DNA, quindi dall’analisi
del sangue tramite biopsia liquida si possono verificare:
● la presenza del tumore
● se il tumore sta aumentando o diminuendo
● caratteristiche molecolari del tumore
Lezione 9 “NGS in medicina”
vantaggi delle biopsie liquide
● non è invasiva
● ci permette di valutare anche la presenza di metastasi perché va a sviluppare una sequenza
genica
Gli schemi di espressione genica, vengono poi visualizzati inmappe di caloree si possono
suddividere i geni presenti in ogni riga per geni più espressi o meno espressi nelle cellule di tumori di
pazienti sani; dopodichè si hanno ulteriori sottoclassificazioni di frammenti più fini.
come determinare i geni differenzialmente espressi in una mappa di calore?
Un modo classico è rappresentare i livelli di espressione in scala semilogaritmica e rappresentare sia
l’espressione dei geni della cellula tumorale (linfoma), che dei geni della cellula normale sui due assi.
I geni poi sono rappresentati attraverso puntini.
Questi punti si disporranno lungo una diagonale perché la maggior parte della loro espressione sarà
simile. Quelli che sono espressi a livello più alto nei campioni tumorali compariranno sopra la
diagonale, e quelli che sono espressi a livello più basso al di sotto della diagonale.
Tutto questo va prima vagliato con validazioni statistiche, con ripetizioni (ogni campione deve essere
almeno analizzato tre volte) e quelli che si vedono nell’immagine hanno già subito questo processo.
Dopo la validazione si prendono, come gruppo, geni che sono espressi in alcuni genomi (tra quelli
che sto cercando) in modo diagnostico; oppure si possono prendere i geni e capire in che categoria di
gene ontology sono espressi. Quindi si selezionano quelli che sono più altamente disregolati e si va
a studiarli.
Si possono poi fare così validazioni funzionali.
Come si fa a usare l’espressione genica specifica per analisi e prognosi
Abbiamo già costruito un pannello che può essere diviso in più categorie:analizzando molti pazienti in
precedenza, e caratterizzato i trascrittomi in biopsia * ,si è capito che:
● un certo tipo di espressione è un tumore benigno
● un altro rappresentava una prognosi peggiore
● un altro -in questo caso C- si andava a caratterizzarsi nel gruppo “buona prognosi” o “cattiva
prognosi” con una predetta alta probabilità di metastasi o con un predetto basso livello di
metastasi.
Per fare queste classificazioni, è comunque necessario analizzare prima le espressioni geniche di
moltissimi pazienti, e poi andare a studiare a posteriori l’evoluzione clinica della loro patologia (in
questo caso si sottintende tumorale), in modo da comprendere quali schemi di espressione correlano
con un paziente che ha vissuto a lungo, uno che ha vissuto a lungo senza relapse (=senza che il
tumore si ripresentasse) ecc.
Lezione 9 “NGS in medicina”
È proprio un fingerprint molecolare che mi può permettere suddivisioni molto precise e molte più
suddivisioni rispetto a quelle che può fare un anatomo patologo, perché quello che è certo è che non
c’è tumore uguale ad altri così come le cellule tumorali dello stesso tumore dello stesso paziente sono
eterogenee perché hanno questo alto livello mutazionale; così come sono eterogenee quelle tra
pazienti diversi e quindi più riusciamo a caratterizzare il specifico tumore in quella fase particolare di
uno specifico paziente e più riusciamo a capire quanto il loro profilo molecolare possa correlare la
prognosi con la risposta alla terapia più riusciremo a tarare la terapia correttamente per ciascun
paziente, diminuendo la tossicità e aumentando il beneficio.
esempio
In questo esempio ci sono tre
pazienti a cui è stata fatta una
biopsia gastrica.
Il primo risulta non avere un
tumore, il secondo invece ha un
tumore con una cattiva
prognosi, e il terzo avere il
tumore con una buona
prognosi. Riusciamo a
comprendere questo perché
l’espressione di una serie di
geni, un pannello di geni, che è
stato identificato come
particolarmente rilevante della
presenza e delle caratteristiche
di un tumore allo stomaco,
presenterà diversi livelli di
espressione. In particolare è
espresso il gene PLA2G2A.
Se il gene non c’è => non è
espresso tumore; quando è
espresso a basso livello può
correlare una prognosi peggiore rispetto a quando è espresso ad alto livello, così non solo un gene,
ma tutto un pannello di geni.
esempio 2
Nel tumore mammario sono stati generati due
pannelli di microarrays mammaprint, e si è
osservato come gli schemi di espressione di
70 geni specifici permettono di determinare la
probabilità metastatica di un tumore, in questo
caso nei tumori del tipo luminale. A seconda
della probabilità relativa di questi geni si
possono assegnare i pazienti in:
● basso potenziale metastatico
● alto potenziale metastatico
Questi ci servono principalmente per
identificare il tipo di terapia, per uno a basso
potenziale metastatico, ad esempio, è
possibile non eseguire chemio, ma fare
direttamente radio e, in seguito, terapia
ormonale.
Lezione 9 “NGS in medicina”
vantaggi
● pazienti → terapia più adatta e spese minori
● sistema sanitario → spese minori
Altri tipi di questi schermi di espressione genica possono essere utilizzati per determinare i diversi tipi
di tumori, un esempio è dato dai tumori ai polmoni.
esempio 1 → tumori ai polmoni
Anche nel tumore polmonare sono state generate delle chip, che hanno permesso di caratterizzare i
vari tipi di tumore, per poter guidare al meglio la terapia.
In questo caso i tumori si dividono in:
● adenocarcinoma a cellule non piccole
● adenocarcinoma a grandi cellule
● adenocarcinoma semplice
● tumore a piccole cellule
Queste tipologie hanno delle
caratteristiche cliniche diverse
e quindi anche delle prognosi
diverse e approcci terapeutici
diversi.
Tutto ciò può essere
determinato estraendo l’RNA
e utilizzando un piccolo
pannello specifico di
microarray per analizzare
questo piccolo pannello
di geni.
La stessa informazione la
potremmo ottenere facendo
l’RNA sequencing, ma non ce
n’è bisogno e sarebbe solo un
esagerato dispendio di
energie, soldi e tempo
compiuto per l’analisi.
La presenza e l’utilizzo di questi pannelli velocizza molto la caratterizzazione molecolare.
*
Si possono avere heatmap con gene tumorale e paziente:in questo caso, nelle heatmap ogni
colonna rappresenta un paziente diverso e ogni riga un gene. Per ogni livello si ha un colore che
caratterizza il livello di espressione, ad esempio:
rosso= livello più alto rispetto ad un controllo
verde= livello più basso rispetto a un controllo
nero= non c’è espressione
Il computer può clusterizzare questi dati in modo da avere tutti insieme i campioni che hanno
determinate caratteristiche (ad esempio quelli che hanno una più alta espressione di questi geni).
La mappa di questi geni è stata messa a punto anche grazie alle annotazione del Progetto Genoma,
infatti ci sono gruppi di geni che corrispondono a porzioni simili, e quindi permettono di restringere il
campo di ricerca per comprendere, ad esempio, quali caratteristiche può dare a un tumore
l’espressione maggiore dei geni, e soprattutto verificare se qualcuno di questi geni può essere
necessario per la sopravvivenza del tumore e se possa rappresentare un efficace bersaglio
terapeutico.
Lezione 9 “NGS in medicina”
ALTRE POSSIBILITA’ DI PANNELLI (O PATTERNS) PER ESPRESSIONI
SPECIFICHE
Altre possibilità di pannelli per espressioni specifiche geniche, che possono predire la prognosi:
● un’alta espressione di determinati geni che un gruppo di geni correla, comporta una buona
prognosi in questo caso → visibile grazie a un chip specializzato per le cellule di linfoma
● una bassa espressione invece porta a una cattiva prognosi
I patterns inoltre vengono usati per decidere la specifica terapia, che può essere diversa anche nel
caso di pazienti con lo stesso tipo di tumore.
Avendo determinati patterns di espressione,
infatti, è correlata a questi la capacità di
rispondere a diversi trattamenti, questo
dipenderà da:
● tipo di tumore
● tipo di paziente → come in questo caso,
che nonostante lo stesso tumore, abbiamo due
approcci terapeutici differenti
Sarà la diagnosi molecolare a guidare il medico
verso la scelta del trattamentoche potrà essere
più efficace. Se ad esempio in questo esempio il
paziente B ricevesse lo stesso trattamento di A,
la cura non funzionerebbe e viceversa.
La diagnosi (o diagnostica) molecolare è resa possibile solo dall’analisi di moltissimi campioni dagli
schemi di espressione dai quali, correlati alle caratteristiche cliniche, possiamo derivare le “firme”
geniche, o firme molecolari, da usare per categorizzare i nuovi pazienti e prevedere le risposte ai
farmaci e le prognosi.
Le firme permettono di caratterizzare un singolo trascrittoma.
come ottenere firme molecolari?
Le firme molecolari sono set di geni identificati mediante tecniche molecolari che permettono di
ricavare specifiche informazioni su diversi tumori, indirizzandone il trattamento a seconda dei
differenti schemi di espressione. Per realizzare tali firme si procede con una biopsia e con una
Lezione 9 “NGS in medicina”
successiva analisi del campione concentrandosi sugli RNA circolanti nel sangue: si può realizzare un
grafico in cui poniamo l’espressione dei vari geni nelle cellule normali su un asse e l’espressione degli
stessi geni nelle cellule tumorali sull’altro asse. Mediante l’analisi di tale grafico e del livello di
espressione dei vari geni, possono comprendere quali di questi hanno lo stesso livello di espressione
nelle cellule normali e nelle cellule tumorali, mentre mi concentro su quei geni che risultano esprimersi
in maniera differente rispetto alle cellule normali (livelli di espressione più elevati o meno elevati). In
questo modo sono stati generati, analizzando diversi campioni, set specifici di geni che quando sono
più o meno espressi rispetto a condizioni standard possono rivelare la presenza di uno specifico tipo
di tumore e anche rivelarne anche la prognosi (buona o cattiva) e la probabilità di andare incontro a
metastasi-> Perché possono realizzare questi set? Perché vengono analizzati gli schemi di
espressione di diversi pazienti e si studia la loro evoluzione clinica nel tempo, per cui, a posteriori, si
può ricercare la presenza di tali schemi in vari pazienti e una volta individuati comprendere il decorso
della malattia.
BENEFICI DELLA DIAGNOSTICA MOLECOLARE
●
●
●
●
può generare nuovi sistemi di screening dei pazienti
può aiutare e guidare nel disegnare nuovi trattamenti
ci permette di monitorare nel tempo l’efficacia dei trattamenti
○ possiamo continuare a usare biopsie liquide per capire se effettivamente è radicato il
tumore
predire la risposta dei pazienti ai diversi trattamenti, guidando il trattamento
MEDICINA DI PRECISIONE
Quindi, in un futuro lontano, possiamo:
● eseguire la biopsia sul tessuto del paziente o anche solo una biopsia liquida
● effettuare un pattern proteico
● in base ai risultati vengono usati specifici farmaci
● il pattern proteico o le biopsie liquide servono a capire se la terapia stia funzionando
● remissione paziente
Quindi in un futuro, che in realtà è già presente in alcune realtà, possiamo immaginarci un
paziente in visita dal suo oncologo, gli viene fatto un prelievo, una biopsia e tramite
l’analisi di espressione, analisi genomica e l’analisi del proteoma, integrando tutto quello
che si conosce di questi dati sui pazienti con quel tipo di tumore viene determinato il
sottotipo di malattia, e il profilo genetico del paziente, che determina la capacità di rispondere
meglio a determinate combinazioni terapeutiche con forti o meno effetti collaterali. Durante
il trattamento parte dell’espressione proteica può essere usata per verificare che le
cellule del tumore siano in diminuzione e anche che il tumore rimanga in remissione e non
ci sia.
Tutto questo
presuppone grandi
investimenti e
sicuramente sono
diagnosi molto più
care
di una fettina
analizzata da un
anatomo patologo e
quindi è necessario
che i sistemi
sanitari affrontino
questo problema,
Lezione 9 “NGS in medicina”
considerando che un’attenta analisi dei costi potrebbe
anche determinare che un investimento nella cosiddetta terapia/medicina di precisione,
potrebbe costare molto ma potrebbe alla fine portare persino a dei risparmi rispetto alla
cura di una vita con terapie care, però è chiaro che non è un cambiamento immediato di
prospettiva e potrebbe anche coinvolgere l'assicurazione privata .
I tumori sono malattie estremamente eterogenee (anche se appartengono alle stesse categorie) e c’è
moltissima variabilità intratumorale. Questo è uno dei motivi maggiori per cui si sviluppa resistenza.
La possibilità di seguire e rispondere all’eterogeneità con specifici farmaci è una terapia.
Un’altra terapia usata è l’immunoterapia→ il sistemaimmunitario di per sè dovrebbe proteggersi,
sono state sviluppate allora delle terapie che agiscono risvegliando le cellule del sistema immunitario,
rendendole più attive contro il tumore.
Un’altra terapia è stata effettuata con le cellule CarT, in cui vengono espiantati i linfociti T dal
paziente, modificati geneticamente per rendere i linfociti T maggiormente adatti per rispondere a un
marcatore specifico del tumore.
L’applicazione di una o dell’altra di queste terapie permette un miglioramento delle condizioni, anche
se continua a rispondere circa il 40% dei pazienti.
Quando parliamo di medicina di precisione non parliamo soltanto della medicina dei tumori
ma soprattutto proprio di come i diversi tumori siano variegati e come appunto i tumori siano
estremamente eterogenei. L’eterogeneità è presente sia tra tumore e tumore ma anche intratumorale
e quindi presumibilmente si pensa che la medicina di precisione farà strada per arrivare ad una vera
guarigione e migliorare le possibilità di guarigione, quindi ci sono enormi programmi di ricerca in tutto
il mondo che vanno verso la sempre maggiore caratterizzazione molecolare dei pazienti e
correlazione con le caratteristiche cliniche, oltre che la ricerca di nuove terapie in correlazione con
l’efficacia delle terapie esistenti o con combinazioni con terapie esistenti.
La medicina di precisione si basa sul fatto che per fortuna siamo tutti diversi, medicina di precisione è
quando sono in grado di dare un farmaco giusto al paziente giusto, al momento giusto e anche nel
dosaggio corretto, alcuni pazienti avranno bisogno di dosaggi più alti ed altri di dosaggi più bassi;
alcuni pazienti saranno in grado di metabolizzare più rapidamente un farmaco, quindi le possibilità di
personalizzazione sono infinite.
Non mi piace parlare di medicina personalizzata perché, vero che ogni persona e ogni malattia di ogni
persona viene analizzata, ma non abbiamo lo sviluppo di una terapia per ogni persona ma
l’applicazione di un certo tipo di terapia a seconda di quello che la persona presenta. La vera terapia
personalizzata ( in realtà anche quella non esattamente) sarà per esempio la terapia genica o la
terapia genica delle malattie genetiche rare per cui per guarire molecolarmente bisogna agire in modo
preciso.
“E’ molto più importante sapere quale tipo di paziente ha una malattia
che quale malattia ha un paziente”
William Osler
1849-1919
Fondatore dell’ospedale americano Johns Hopkins e dei programmi
di specializzazione medica
Lezione 9 Domande di fine lezione
Che cosa permette di generare delle firme molecolari delle malattie quali x es il cancro?
La diagnosi molecolare è resa possibile solo dall'analisi di molti campioni dai patterns di espressione
genica dai quali, oltre alle caratteristiche cliniche, si possono derivare le firme molecolari, da usare
per caratterizzare trascrittomi e prevedere le risposte a farmaci e prognosi.
Se un gruppo di tot geni lo trovo sempre iper espresso in pazienti di breast cancer che sviluppano
tumore al cervello, allora quando trovo la stessa espressione in un altro paziente posso stabilire
quante sono le sue probabilità che sviluppi una metastasi al cervello.
Perché la storia clinica dell’erceptina dimostra la fattibilità della medicina di precisione e
l’utilità dei marker tumorali?
Tramite uno studio eseguito con microarray si è scoperto che le cellule tumorali nei pazienti con
carcinoma mammario avevano bisogno dell'attività del recettore Her-2/Neu per proliferare, così si
sono utilizzati specifici anticorpi monoclonali che potessero neutralizzare l'attività di Her-2/Neu,
ovvero l'herceptin.
L'herceptin quindi era in grado di riconoscere il recettore Her-2/Neu (nel caso di tumori Her-2 positive,
ma non ad esempio nel caso di tumori luminali come quelli che esprimono per estrogeni o
progesterone), bloccare il recettore e quindi impedire l'interazione con il ligando, bloccando così la
proliferazione.
L'utilizzo di herceptin ha portato numerosi vantaggi, ad esempio i pazienti con tumori Her-2 positive
sono candidati e vengono curati con l'herceptin (e la radioterapia). Questo permette di non dover
ricorrere alla chemioterapia (che, insieme alla radio, distrugge le cellule proliferanti) proprio grazie
all'utilizzo di questa terapia mirata, utilizzata soprattutto come terapia di mantenimento.
Quindi, dopo aver effettuato una biopsia (che può essere anche liquida), si effettua l'analisi istologica
(e immunoistochimica) con cui si vanno a verificare i livelli di espressione di Her2/Neu. In base al
pattern per l'espressione genica ottenuto, si può poi provvedere ad applicare una terapia con
Herceptin. I patterns inoltre vengono usati per decidere la specifica terapia, che può essere diversa
anche nel caso di pazienti con lo stesso tipo di tumore.
Cosa è possibile prevedere dal sequenziamento dell’RNA di un paziente?
E' possibile comprendere le caratteristiche cliniche della malattia, la prognosi, i conseguenti approcci
terapeutici, e anche i marcatori da eseguire in un follow up, senza dover di nuovo riutilizzare l’RNA
sequencing. In più permettono di non dover eseguire overterapia.
Perché nonostante i costi la medicina di precisione può anche consentire di risparmiare sui
costi della medicina?
Perché la medicina di precisione permette ai pazienti di ricevere una terapia più adatta e al sistema
sanitario di dover subire, conseguentemente, spese minori, evitando terapie inutili e tossicità inutili da
dover poi curare.
Lezione 10 “Controllo dell’espressione genica”
CONTROLLO DELL’ESPRESSIONE
GENICA
Quello che più accomuna le specie di una popolazione con un’altra non è il numero di geni e spesso
non la loro specifica funzione (nei geni ortologhi), ma come questi vengono espressi, quindi come si
viene a generare iltrascrittoma. → Il trascrittomaè l'insieme di trascritti codificanti e non.
Attraverso RNA non codificanti e generazione di proteine (proteoma) possiamo comprendere come
funziona e si svilupperà una cellula.
Il controllo dell’espressione genica (inteso come dal gene all’espressione finale è controllato a diversi
livelli: trascrizionale e post trascrizionale => ci sono eventi che possono controllare la stabilità di
mRNA, che possono farci comprendere che non necessariamente a un mRNA abbondante
corrisponde una proteina abbondante, anche se nella maggior parte dei casi è così).
La decisione se trascrivere o no un gene è il primo step della regolazione genica => il genoma di per
sè “parla” solo a livello di trascrizione e, in seguito, traduzione, e la decisione prima è quella di
trascrivere o no trascrivere.
Ciò deriva dal fatto che in tutte le nostre cellule il genoma è identico, tranne per le variazioni dovute a
trascrizione, e quello che differenzia una cellula da un’altra quindi sono i geni che vengono espressi e
quelli che invece non lo sono.
esempio
In questa immagine sono presenti due cellule
con lo stesso genoma, ma i geni sono espressi
Lezione 10 “Controllo dell’espressione genica”
in modo diverso rendendo le cellule rispettivamente un neurone e un linfocita.
Per comprendere questo processo John Gurdon ha eseguito questo esperimento:
● prelevato delle cellule di pelle di rana
● estratto il nucleo
● posizionato il nucleo in oocita di rana non fertilizzato, a cui era stato tolto in precedenza il
nucleo
● adesso si ha l’equivalente di uno zigote (nucleo diploide con metà patrimonio materno e metà
paterno, solo che uno è di pelle)
● conseguenze: una certa % cominciavano a dividersi come fossero embrioni, quindi avevano
uno sviluppo normale fino allo stato di girino, poi per problemi diversi non riuscivano a
diventare rane
● scoperta: i genomi sono uguali tra i vari organismi, ciò che cambia sono i geni espressi e
quelli non espressi.
○ Le cellule inoltre possono essere riprogrammate per poter diventare pluripotenti e poi
potersi differenziare. Il nucleo delle cellule della pelle non porta direttamente a un tipo
di organismo, ma prima deve dedifferenziarsi (si parla di riprogrammazione).
La produzione di tipi cellulari specializzati non dipende da cambiamenti nella sequenza del DNA: ecco
perche’ si possono clonare gli organismi, quindi le differenze fenotipiche tra tipi cellulari diversi sono
differenze NELL’ESPRESSIONE GENICA
In particolare TRASCRIZIONALI
Lezione 10 “Controllo dell’espressione genica”
CONTROLLO TRASCRIZIONALE
ORGANISMI UNICELLULARI
- duplicazione cellulare
-
ORGANISMI PLURICELLULARI
Lezione 10 “Controllo dell’espressione genica”
Una cellula epiteliale ha bisogno, per non morire, di diversi segnali, che se assenti, fanno morire la
cellula per apoptosi. Più geni quindi devono essere in grado di integrare la risposta a stimoli
complessi.
Le risposte cellulari richiedono l’attivazione e/o la repressione coordinata di molti geni.
In tutti gli organismi viventi le informazioni contenute nel genoma non si esprimono
contemporaneamente, sono finemente regolate.
●
●
●
I geni housekeeping sono espressi in tutte le cellule, in quanto specializzati per controllo ecc.
I geni ad espressione condizionale sono non espressi a livello basale, ma attivati da segnali o
repressi da segnali. A loro volta possono essere tessuto- specifici che fa sì che possano
essere attivati in determinati tessuti.
I geni specializzati sono i geni che si trovano in specifici tessuti o in uno specifico stadio della
cellula
Lezione 10 “Controllo dell’espressione genica”
ATTIVAZIONE E INATTIVAZIONE DELL’ESPRESSIONE GENICA
NEGLI EUCARIOTI
espressione genica= capacità delle cellule di rispondere a segnali che provengono dall’esterno
● Decisioni cellulari durante lo sviluppo -> differenziamento (geni accesi/spenti)
○ I neuroni della retina e le cellule dell’epitelio intestinale, del derma sono in grado di
rispondere in maniera globale all’espressione genica (?)
● Regolazione del ciclo cellulare (attivazione e inattivazione ciclica)
●
● Attivazione cellulare -> in risposta a mediatori esterni quali fattori di crescita, ormoni etc.
(reversibile, rapida)
○ Tipicamente i meccanismi di risposta e segnale hanno la caratteristica di rispondere
in maniera rapida e reversibile, quindi si accendono e si spengono per far tornare la
cellula allo stato basale
La regolazione dell’espressione genica può avvenire a numerosi livelli:
-
-
si hanno dei controlli a livello della stabilità dell’mRNA
ci sono molti step che alla fine determineranno la concentrazione di proteine attive e il
controllo post traduzionale
Lezione 10 “Controllo dell’espressione genica”
COME FUNZIONA LA TRASCRIZIONE
●
●
●
●
Disegno di un RNA
polimerasi che sta
trascrivendo:
● si chiude intorno al
RNA che deve trascrivere
assumendo una
conformazione chiamata “a
ganasce chiuse”
● la RNA polimerasi
(che è un complesso di
proteine) non è un
complesso simmetrico, ma
ha un orientamento avanti
e dietro
○ dietro: la
parte del complesso che
guarda verso il DNA già
trascritto
○ davanti: la
parte del complesso che
guarda verso il DNA da trascrivere
nella parte anteriore vi è un canale das cui entrano i ribonucleotidi trifosfati, mentre in centro
vi è il sito attivo che comprende un’attività elicasica, che separerà il doppio filamento per
esporre il filamento codificante
l’RNA di nuova sintesi fuoriesce dalal coda dell’RNA polimerasi da uno specifico canale ed
esce con il 5’ davanti (a testa prima)
RNA polimerasi 2 è quella che trascrivere tutti i geni codificanti + una serie di non codificanti
pinna in posizione chiusa (cdt) che ci permette di comprendere in che direzione sta
avvenendo la trascrizione
L’RNA polimerasi e ifattori sigma
costituiscono l’RNA polimerasiwhole
enzima che è in grado di riconoscere i
substrati, e di posizionarsi sul substrato
nella giusta direzione. Il posizionamento
della polimerasi dipende dall’interazione
delle sequenze a livello di genoma e
dalla proteina di fattore sigma. Quando
la polimerasi è stata posizionata sul
promotore, il fattore sigma aiuta, ma
quando la sintesi della trascrizione inizia,
diventa superfluo e si attacca a un
un’altra polimerasi.
Il controllo della trascrizione è basato sul
riconoscimento di corte sequenze di
DNA (sui promotori) da parte di diverse
classi di proteine.
Lezione 10 “Controllo dell’espressione genica”
Come il tutto succede anche nei procarioti, succede anche negli eucarioti.
COME FUNZIONA LA TRASCRIZIONE NEGLI EUCARIOTI
Si deve posizionare l’RNA polimerasi in modo corretto sui promotori.
I promotori e l’RNA polimerasi sono asimmetrici.
COSA SUCCEDE SE SI INVERTE IL PROMOTORE
La sequenza TATAAA regola la polimerasi con la parte anteriore verso la parte che deve trascrivere
(quindi verso le AAA), e in questo caso la polimerasi non può fare altro che copiare il segmento.
Quando il promotore invertito la polimerasi è sempre recluatata nella trascrizione delle AAA, ma lo fa
sull’altro filamento
Lezione 10 “Controllo dell’espressione genica”
CONTROLLO DELL’ESPRESSIONE GENICA NEI
PROCARIOTI
● Genoma estremamente compatto
● Organizzazione dei geni in operoni
● Regioni di controllo molto piccole (in genere <200 bp)
● Le RNA polimerasi possono riconoscere il promotore con il solo ausilio del fattore SIGMA
(sufficiente per la trascrizione dei geni non regolati)
● Per la trascrizione REGOLATA sono sufficienti:
○ RNA Pol./Fattore σ + Repressore → (operone del Triptofano)
○ RNA Pol + Repressore m+ Attivatore → (lac operon)
Non tutti i promotori sono riconosciuti dallo stesso fattore sigma:
Spesso i batteriofagi utilizzano dei fattori sigma virali per direzionare la RNA Pol. batterica a specifici
promotori del fago:
esempio
Batteriofago entra nella cellula e non ha ancora sintetizzato alcuno dei suoi geni, quindi non può
avere un fattore sigma virale.
I suoi geni sono trascritti grazie a una RNA polimerasi e a un sigma batterico.
Lezione 10 “Controllo dell’espressione genica”
Il sigma 28 è un sigma virale che andrà a complessarsi con l’RNA polimerasi batterica, per andare a
prescrivere i geni virali (e meno geni batterici saranno trascritti).
Il fattore sigma 34 è un middle gene e produrrà un altro fattore sigma che può trascrivere i geni lenti-
Quindi si hanno tre fattori di legami per i sigma.
CONTROLLO ADDIZIONALE MEDIANTE PROTEINE CAPACI DI LEGARE IL DNA
Promotore costitutivamente represso e il fattore sigma non può legare. Questo repressore sarà
regolato.
Nella regolazione negativa il ligando, interagendo con il repressore, farà in modo che il gene possa
venire attivato di default. Può anche funzionare al contrario:
il repressore per far funzionare il gene deve essere staccato, ma può trascrivere solo in presenza del
ligando, quindi in presenza del ligando si attiverà.
CONTROLLO NEGATIVO
L’attività del promotore è presente => il promotore sarà forte
Il batterio è in grado di sintetizzare
sul triptofano; la condizione più
probabile è che il triptofano non sia
presente.
A meno che non venga spento dal
repressore che lo lega.
Esiste un repressore che si lega
all’operatore, ma in assenza del
triptofano non può legare. Quando si
lega spegne la trascrizione di questi
geni.
Lezione 10 “Controllo dell’espressione genica”
Il repressore possiede due alfa eliche che interagiscono con due scanalature secondarie successive.
Quando il triptofano è assente, le due eliche si ritraggono leggermente e non sono più alla distanza
corretta per continuare la reazione.
INTEGRAZIONE DI DUE INFORMAZIONI: OPERONE LATTOSIO
Porta alla sintesi della Beta Galattosidasi.
In una condizione in cui sono presenti sia glucosio che lattosio, la beta galattosidasi non deve essere
trascritta, tanto c’è il glucosio.
In queste condizioni l’operone è spento => vuol dire che ilpromotore sarà debole, in cui il fattore
sigma non sarà in grado senza l'aiuto di un attivatore.
iN una condizione in cui è presente solo glucosio e non lattosio, allora anche produrre una molecola
di Beta Galattosidasi sarà uno spreco. Il repressore allora si lega
3) al batterio togliamo anche il glucosio =>
- rimane il repressore
- volendo massimizzare le sue possibilità di sopravvivenza, si lega l’attivatore (CAP), che in
presenza del repressore non può attivare, ma in questo modo è come se l’ attivatore sia
pronto ai segnali di partenza
4) c’è lattosio, ma non glucosio => attivatore CAP è già nelle condizioni di partenza per poter
sintetizzare
Lezione 10 “Controllo dell’espressione genica”
Nel caso dei geni del triptofano, abbiamo un promotore forte
Nel caso del lattosio, abbiamo un promotore debole → la regolazione più fine sarà in questo caso,
perché si ha la variazione tra spento, completamente spento ma pronto a essere trascritto, spento ma
impossibilitato a essere trascritto, acceso ecc
I promotori deboli non possono essere trascritti senza attivatori.
Il legame si può stabilizzare, tramite il ripiegamento del DNA.
Lezione 10 “Controllo dell’espressione genica”
CONTROLLO DELL’ESPRESSIONE GENICA NEGLI
EUCARIOTI
Per capire come combinazioni di proteine (?)diversi possono conferire la capacità ai promotori di
conferire stimoli diversi.
Il controllo dell'espressione genica negli eucarioti è molto più sofisticato che nei procarioti:
- strutturalmente parlando sappiamo che traduzione e trascrizione sono compartimentalizzati
- genomi via via che si va avanti sono sempre meno compatti
- sequenze geniche suddivise in esoni e introni
- Regioni di controllo dei geni molto grandi (anche > 50000 bp) e distanti
- RNA polimerasi incapaci di iniziare la trascrizione senza altri fattori
- RNA messaggeri codificanti per singole proteine, non ci sono operoni e quindi ogni
promotore deve essere controllato indipendentemente
Contribuiscono a posizionare la polimerasi nel punto giusto perché possa trascrivere correttamente.
Il promotore essenziale lo si ha con la tata box, a monte del quale si trova il sito di inizio di
trascrizione (TSS)
Il promotore prossimale è a monte del sito di trascrizione
I silencers reprimono la trascrizione, contrario degli enhancers.
Il DNA without proteina non può fare nulla, ma si è evoluto per due funzioni:
- memoria genetica → può essere duplicato, trasmettendo lo stesso patrimonio genetico da
cellula madre a cellula figlia
Sequenze che agiscono in cis e sequenxe che agiscono in trans (che vengono da fuori e agiscono sul
DNA).
L’hp più plausibile è che la prima molecola genetica sia stata l’RNA
Quindi abbiamo la regione con la TATA BOX
Le sequenze degli enhancers a monte e a valle, che hanno dei siti di legame per specifici fattori
trascrizionali.
Il ruolo degli attivatori trascrizionali che si legano
Proteine regolatrici → vanno sotto la definizione di cofattori trascrizionali che non legano direttamente
il DNA, ma verranno reclutati dal DNA su cui si sono posizionati fattori di trascrizione specifici.
Perché nei geni eucarioti è necessaria tutta questa complessività?
Perché la cromatina inibisce la trascrizione, i geni eucarioti sono tutti dotati di promotre debole, che è
debole o forte in realtà a seconda delle proteine che lega.
Lezione 10 “Controllo dell’espressione genica”
I geni hanno quindi bisogno di essere attivati.
Il DNA eucariotico è organizzato sotto forma di cromatina → approfondimento in verde su Alberts (cap
4)
a 11 → collana di perle
a 30 → solenoidi
Il DNA associato ai nucleosomi sarà protetto, lo speriamo dalle proteine, dissociamo le proteine e
troviamo due coppie degli istoni H2A, H3A, H3 e H4.
Sezione di un istone in cui sono rappresentati gli 8 diversi istoni in 8 colori diversi (slide 6). Questi
hanno una carica positiva.
Ciascuno di questi ha una coda flessibile che fuoriesce dal nucleosoma, ed è detta coda
amminoterminale perché sta all’inizio della proteina.
La porzione globulare che forma il corpo del cromosoma, forma soprattutto alfa eliche e beta shifts
che tiene insieme i polipeptidi da soli e li fa convergere in questa struttura globulare.
Le code amminoterminali sono flessibili e non strutturate, che “fluttuano” intorno al cromosoma, in
realtà non fluttuano perché sono ricche di amminoacidi di base, in particolare lisine, e quindi
compattano il dna sul cromosoma, e stabiliscono interazioni con il DNA di nucleosomi vicini (ad
esempio quello da 30 nanometri) e quindi contribuiscono a compattare la cromatina.
Anche la fibra da 30 nanometri costituisce una struttura di base su cui viene costituito l’ulteriore
addensamento della cromatina, che serve ad aumentare il cromosoma metafasico. Formano quindi
una fibra da 700 nanometri (partendo da due nanometri => la condensazione è molto forte).
La cromatina si correla con l’allungamento del genoma → più il genoma diventa lungo, più è
problematico dividerlo in parti uguali tra le due cellule figlie.
Lezione 10 “Controllo dell’espressione genica”
L'evoluzione della cromatina è andata insieme all'evoluzione dei genomi, che ha implicato
l’allungamento dei genomi.
Ha posto un grande blocco a tutte le attività del genoma, che oltre a trascrivere:
- si duplica
- può essere riparato
Tutte queste attività hanno bisogno di interazione con proteine che le mediano, e sono inibite dalla
cromatina.
Allo stesso tempo la cromatina è un ostacolo, ma rappresenta una possibile fonte di regolazione
differenziata, perché a questo punto la regolazione di trascrizione avverrà grazie alla trascrizione delle
corte sequenze, ma dipenderà anche dal fatto “ se queste sequenze sono accesibili ai fattori di
tarscrizone o meno”, quindi dalal cromatina si può controllare l’espressione dei geni => meccanismi di
regolazione, che agiscono tramite la struttura della cromatina, modifcandone la strutture, e ve ne sono
3 grandi categorie, di cui solo una ha a che fare con il dna direttamente:
- il dna a livello delle citosine può essere metilato solo quando è presente in un dinucleotdie
CG
- un alto livello di metilazione di dna tende a compattare la cromatina, rendendo il gene
inaccessibile per la trascrizione
- basso o assente livello di metilazione nelle sequenze regolatorie rende il dna più accessibile
alle varie sequenze trascrizionali
Poi ci sono altre modifiche modificazioni, correlate a modificazioni post traduzionali che compongono
gli istoni, che sono in grado di modificare (sia tramite interazioni con dna e che da punto di vistra
strutturale) la stabilità dei cromosomi
Una terza possibilità di regolare la struttura della cromatina sta nel posizionamento dei nucleosomi,
che non sono posizionati casualmente in molti punti del genoma, ma strategicamente per inibire la
trascrizione, per esempio posizionandosi sul sito di avvio della trascrizione, o possono essere tenute
attivamente assenti le regioni del promotore dove si devono legare i fattori trascrizionali.
Il fenomeno del posizionamento specifico dei nucleosomi va sotto il nome dirimodellamento della
cromatina.
riassumendo:
- La cromatina, anche quando sotto forma del cosiddetto “filo di perle”, e’ di per sé
SOPPRESSORIA della trascrizione, costituendo un impedimento fisico all’accesso dei fattori
di trascrizione e dell’apparato basale di trascrizione.
- Pero’ la forza dell’interazione tra il DNA e i nucleosomi puo’ cambiare in modo regolato,
allentando o rendendo piu’ stretto il contatto DNA-istoni
- Inoltre, come vedremo, la cromatina costituisce una formidabile piattaforma per gestire
l’informazione genetica, attraverso il cosiddetto codice istonico
La modificazione più abbondante della cromatina è l’acetilazione, in particolare l’acetilazione delle
lisine delle code amminoterminali flessibili degli istoni.
Lezione 10 “Controllo dell’espressione genica”
Le lisine hanno un OH che può essere modificato legando numerosi gruppi, in particolare in questo
caso, un gruppo acetile.
Le lisine possono essere modificate aggiungendo dei gruppi come acetile o metile.
L’acetilazione neutralizza la carica positiva della lisina, diminuendo l’interazione con il DNA.
slide 11→ alcune lisine vengono anche solo metilate e non acetilate
Le serine ad esempio possono essere metilate e le lisine che possono essere metilate o acetilate con
riscontro opposto sulla trascrizione, in cui la metilazione => attivazione e acetilazione => repressione
Possiamo dare un generico fattore attivatorio solo alla metilazione in virtù del fatto che la carica viene
o no neutralizzata.
Lezione 10 “Controllo dell’espressione genica”
La modificazione più abbondante è l’acetilazione e ha uneffetto generico, tutte le altre hanno un
effetto specifico.
Come tutti i codici, il codice istonico deve poter essere scritto, letto e cancellato (perché è molto
flessibile). Possono essere aggiunti o tolti attivamente da degli enzimi. Tra gli elementi che in qualche
modo contribuiscono alla scrittura e alla funzione del codice istonico vi sono gli enzimi:
- writers→ che scrivono il codice
- erasers→ che eliminano la modificazione da cancellare
e tutte le altre modificazioni hanno un segnale specifico per cui dovranno essere lette (grazie ai
writers) o interpretate. Una volta lette e interpretate possono attivarsi e funzionare.
Per arrivare sulla regione cromatina devono essere reclutati, nessuno di questi tre elementi può agire
singolarmente, ma devono essere reclutati.
I coattivatori saranno reclutati dai fattori di trascrizione stessa e writers & readers saranno reclutati
sulle regioni di cromatina da modificare dai fattori di trascrizione.
I coattivatori non sono solo enzimi che modificano la cromatina, ma agiscono anche daadattatori
molecolari.
La TATA BOX è riconosciuto da un GTF che si chiama TBP, o meglio TFIID, formato da TBP che si
lega alla tata box e TDB associated factors che funzionano come adattatori molecolari come TAF130
che interagisce con altri GTF associati alla polimerasi, contribuendo a reclutare la polimerasi e altri
GTF al promotore.
Lezione 10 “Controllo dell’espressione genica”
Altri TAF interagiscono con regioni più a valle del promotore.
TAF 250 stabilizza TFIID sul promotore, e contribuisce ad aprire la cromatina, perché ha un’attività
istone acetiltransferasica. Possiede contemporaneamente due regioni della proteina detti
bromodomini che interagiscono con gli istoni acetilati.
P53 e recettore per l’ormone
tiroideo che interagiscono con un complesso molecolare chiamatomediatore, un grosso complesso
molecolare formato da GTF e altri coattivatori e si trovano proteine che agiscono da adattatori
molecolari.
TRAP 80 e TRAP 220 fungono da adattatore molecolare.
COATTIVATORI
- Non legano direttamente il DNA e devono essere reclutati
- Possono fungere da adattatori molecolari
Lezione 10 “Controllo dell’espressione genica”
- Complessi che contengono componenti capaci di modificare (acetilare) gli istoni della
cromatina (HAT) come x es. le proteine CBP/p300
- Complessi che contengono attivita’ ATP-dipendenti capaci di rimodellare la cromatina
riarrangiando i nucleosomi (es. complesso Swi/Snf nel lievito)
Come è possibile che in una cromatina non attivata possa generarsi il fenomeno a cascata?
Esistono dei attivatori trascrizionali che legano la loro sequenza di riconoscimento anche quando si
torva su un cromosoma.
Sono sinergici: il rimodellamento della cromatina potrà poi permettere un nuovo rimodellamento e
così via.
CODICE ISTONICO
Quelle sottolineate sono da sapere
Lezione 10 “Controllo dell’espressione genica”
modificati tramite specifici domini proteici, come i bromo domini, o i cromo domini che riconoscono le
lisine metilate.
Lezione 10 “Controllo dell’espressione genica”
COME FUNZIONANO I READERS
Le diverse modificazioni interagiscono le une con le altre, sempre tramite le proteine che vi si legano
(cross-talk)
Metilano e ubiquitinano
l’istone perché scrivono
l’istone → writers
I readers possono
fungere da writers, da
adattatori molecolari, ma
si chiamano readers
perché vengono reclutati
dal codice e lo leggono.
Gli erasers cancellano parti del codice e verranno reclutati con meccanismi simili.
Lezione 10 “Controllo dell’espressione genica”
Generica acetilazione sugli istoni H3 e H4 ha un significato generalmente sempre attivatore.
Due lisine la cui metilazione è molto importante sono la K9 e la K3, che corrisponde a forte inibizione
della trascrizione.
La metilazione su H3 e K27 incentrata sull’inizio della trascrizione rappresenta un segnale
repressorio.
Il codice istonico è essenziale per rimodellare la cromatina e renderla essenziale con la trascrizione.
Parte integrante del codice istonico hanno levariantiistoniche.
Gli istoni devono per forza di cose essere molto abbondanti, e c’è bisogno di sintetizzare istoni nuovi
durante la fase S del ciclo cellulare, ma siccome gli istoni devono essere molte, ci sono molti geni per
gli istoni.
The major core histones contain a conserved histone-fold domain (HFD). → dominio responsabile del
ripiegamento degli istoni in forma globulare
In addition, they contain N- and C-terminal tails that harbour sites for various post-translational
modifications. For simplicity, only well-established sites for lysine methylation (red flags) and serine
phosphorylation (green circles) are shown (other types of modifications, such as ubiquitylation, are not
shown). In the histone H3.3 variant, the residues that differ from the major histone H3 (also known as
H3.1) are highlighted in yellow. Three of these residues are contained in the globular domain and one
resides in the N terminus. This N-terminal residue (Ser31) has been speculated to be a potential site
for phosphorylation on H3.3. The centromeric histone CENPA has a unique N terminus, which does
not resemble other core histones. Two sites of phosphorylation have been identified in this region, of
which Ser7 phosphorylation has been shown to be essential for completion of cytokinesis. The region
in the globular domain that is required for targeting CENPA to the centromere is highlighted in light
blue. Histone H2A variants differ significantly from the major core H2A in their C terminus. The C
terminus of H2AX harbours a conserved serine residue (Ser139), the phosphorylation of which is an
early event in response to DNA double-strand breaks. A short region in the C terminus of H2AZ is
Lezione 10 “Controllo dell’espressione genica”
essential for viability in Drosophila melanogaster. MacroH2A has an extended C-terminal macro
domain, the function of which is unknown. Finally, the H2ABBD is the smallest of the H2A variants
and contains a distinct N terminus, which lacks all of the conserved modification sites that are present
in H2A. The C terminus is also truncated and lacks the docking domain that is found in other H2A
species. The histones H4 and H2B are also shown, including their known methylation and
phosphorylation sites. The proposed functions of the variants are listed.
Devono essere trascritti lungo tutte le fasi del ciclo, ma vengono incorporati attivamente e
specificamente e la sequenza di queste varianti istoniche può essere:
- molto simile → H3 e H3.3 a cui manca solo una lisina in posizione 27e una in 36 e uno ha
una serina 28 e l’altro una serina 31 => H3.3 è sinonimo di una regione attivamente trascritta
- CENPA → La sequenza dei centromeri è la sequenza unica e serve per l’assemblaggio del
cinetocore
- ci sono varianti istoniche per gli istoni H3 e HH2A, ma non per H3 e H4
- le varianti di H2A sono molto simili per la regione iniziale, e differiscono per la regione
terminale → danno da rottura della doppia catena in cui H2AX può essere fosforilato
Macro H2A è incorporato nelle zone eterocromatiche del cromosoma X inattivo
FATTORI A CASCATA
Lezione 10 “Controllo dell’espressione genica”
Lezione 10 “Controllo dell’espressione genica”
Domande di fine lezione
Perché i promotori devono essere asimmetrici?
Perché altrimenti la polimerasi trascriverebbe la sequenza di nucleotidi sul filamento che funge da
stampo e quindi sarebbe sintetizzato il filamento opposto rispetto a quello che bisogna sintetizzare, in
quanto la polimerasi è sempre reclutata nella trascrizione.
E’ l’asimmetria del promotore che permette di reclutare la polimerasi nell’orientamento corretto in
direzione 3’-5’
Che tipi di regolazione permettono la presenza di un promotore forte o di un promotore debole nei
batteri?
L'operone forte, come il triptofano, permette una trascrizione in cui l'operatore è sempre attivo, a
meno che non venga spento da un repressore che lo lega; ad esempio se il triptofano è presente
inibisce la trascrizione.
L'operone debole, come nel caso del lattosio, permette una regolazione più fine perché si ha una
variazione tra ON e OFF in quanto, perché ci sia trascrizione, bisogna che l'attivatore o il repressore
sia legato. Anche quando mancano entrambi, comunque, il promotore può essere lo stesso espresso.
L’operone debole permette di agire dualmente con attivatore e promotore.
I promotori eucariotici sono l’equivalente dei promotori deboli
Cosa sostituisce il fattore sigma negli eucarioti?
Il fattore sigma permette alla RNA polimerasi procariotica di riconoscere il promotore, tuttavia non tutti
i promotori sono riconosciuti dallo stesso fattore sigma. Il fattore sigma 32, ad esempio, riconosce i
promotori che rispondono allo shock termico.
Negli eucarioti al posto del fattore sigma ci sono dei fattori di trascrizione specifici per iniziare la
trascrizione, definiti come fattori generali di trascrizione. L'inizio della trascrizione eucariotica infatti
deve tener conto del compattamento del DNA nei nucleosomi e in forme di ordine superiore di
struttura alla cromatina, caratteristiche invece assenti nei cromosomi batterici.
Ifattori generali di trascrizione(TFII):
- aiutano a posizionare la RNA polimerasi correttamente sul promotore
- aiutano a separare i due filamenti di DNA per permettere l’inizio della trascrizione
- rilasciano l’RNA polimerasi dal promotore nella modalità di allungamento una volta che la
trascrizione è cominciata
Fattori generali di trascrizione:
riconoscono la TATA box
legami tdp che posizionano la polimerasi con una direzionalità specifica (?)
La trascrizione è in assenza di cromatina, in cui per effettuare la trascrizione basale sono sufficienti
fattori generali di trascrizione (gtf) e polimerasi.
Perché la cromatina agisce da repressore della trascrizione?
Perché la cromatina può essere più o meno compatta, e quando è compattata in eterocromatina non
permette la trascrizione e infatti vi è legato a monte un complesso di rimodellamento della cromatina,
in cui si ha uno svolgimento dell'elica che la rende meno compatta permettendo all'eterocromatina di
diventare eucromatina e quindi portare avanti la trascrizione come se fosse un promotore debole.
Rende più difficle raggiungere le sequenze del DNA e legarle.
Che cosa comporta l’acetilazione degli istoni?
Comporta una modificazione della cromatina, promuovendo così la trascrizione.
Gli istoni nel nucleosoma contengono code amminoterminali flessibili che sporgono dalla loro
porzione globulare, ricche di lisine, ovvero amminoacidi con carica positiva. Sono proprio le cariche
che permettono a questi amminoacidi di interagire con i gruppi fosfato del DNA, che quando
interagisce con la lisina si compatta, inibendo così la trascrizione.
Lezione 10 “Controllo dell’espressione genica”
L'acetilazione permette di neutralizzare la carica positiva eliminando l'interazione con il DNA e
rendendo meno facile la compattazione dei nucleosomi.
Qual è il ruolo dei fattori di trascrizione generali (GTF) nell’attivazione trascrizionale?
I fattori generali di trascrizione sono utili alla trascrizione di tutti i geni, poiché fanno parte del
macchinario di trascrizione basale costituito da GTF e RNA polimerasi II.
I fattori generali di trascrizione:
- aiutano a posizionare la RNA polimerasi correttamente sul promotore
- aiutano a separare i due filamenti di DNA per permettere l’inizio della trascrizione
- rilasciano l’RNA polimerasi dal promotore nella modalità di allungamento una volta che la
trascrizione è cominciata
Vengono definite “generali” perché sono necessarie in quasi tutti i promotori usati dalla RNA
polimerasi II e consistono in proteine interagenti, indicate come:
- TFIIA
- TFIIB
- TFIIC
- TFIID
Questi fattori svolgono (in senso lato) una funzione equivalente a quella del fattore σ nei batteri (in
effetti hanno la stessa struttura tridimensionale).
Qual è il ruolo dei fattori di trascrizione specifici nell’attivazione trascrizionale?
I fattori trascrizionali specifici sono fattori che riconoscono specifici siti sul DNA, sono quindi attivatori
che hanno la caratteristica di legarsi al DNA. Interagiscono con sequenze specifiche sul promotore
enhancer e insieme ad altri fattori di trascrizione,reclutano co-attivatori che modificano la
cromatina.
Servono per reclutare e assemblare l'apparato trascrizionale di base e lo fanno legandosi ad alcuni
elementi di riconoscimento sulle sequenze regolatorie.
Qual è il principale meccanismo con cui lo espletano?
I fattori di trascrizione specifici interagiscono con sequenze specifiche sul promotore enhancer tramite
il dominio di legame a DNA e poi, mediante il dominio di attivazione, esplicano il loro ruolo principale,
ossia permettere il reclutamento e il corretto posizionamento dell'apparato di trascrizione basale e lo
fanno reclutando coattivatori come l'istone acetil transferasi, le proteine che rimodellano la cromatina
o altre proteine che funzionano da adattatori molecolari.
Per legare un fattore di trascrizione deve avere la sequenza non complessata con il nucleosoma, per
cui ci sarà una serie di eventi a cascata nell'attivazione di un gene in cui inizialmente verranno legati i
fattori che trovano la sequenza libera dal nucleosoma, poi verranno reclutati i rimodellatori e i
modificatori della cromatina, rendendo l'interazione meno fissa con il DNA e permettendo così ad altri
fattori di legare il DNA anche in presenza del nucleosoma. A questo punto si è creato il sito di legame
per un altro fattore trascrizionale
Mediatore?
Media interazione tra fattori legati a monte e il macchinario di trascrizione basale; fondamentalmente
è un complesso multi proteico formato da tante unità di cui ciascuna interagisce on diversi attori della
trascrizione come gli attivatori trascrizionali da un lato e i TF dall’altro.
Codice istonico
insieme delle modificazioni covalenti che possono essere riconosciute da molecole che legano i
gruppi laterali degli istoni e agiscono da “lettori del codice” (readers) che a loro volta possono essere
parti di complessi che modificano la cromatina.
Lezione 10 “Controllo dell’espressione genica”
Lezione 12 “I fattori di trascrizione”
FATTORI DI TRASCRIZIONE SPECIFICI
I fattori di trascrizione specifici sono gli attivatori che:
● si legano a specifiche sequenze di DNA (dominio di legame al DNA)
○ interagiscono quindi con sequenze specifiche sulpromotoreenhancertramite il
dominio di legame a DNA
● permettono l’assemblaggio del macchinario basale di trascrizione tramite reclutamento di
GTF (fattori generali di trascrizione), mediatori, coattivatori (come quelli che modificano la
cromatina), grazie al lorodominio di attivazione
Il legame non deve avvenire per forza con l’enhancer, ma può formarsi anche direttamente con il
promotore.
Il mediatore interagisce con GTF a valle e quando dei fattori di trascrizione sono legati a monte
riescono ad aiutare il reclutamento del macchinario di trascrizione basale. Il mediatore è quasi sempre
presente.
I FATTORI TRASCRIZIONALI SONO PROTEINE
MODULARI
I fattori trascrizionali hanno quindi due domini:
● dominio di legame al dna
● dominio di fattori trascrizionali
=> sono definibiliproteine modulari,quindi formateda moduli, ovvero domini proteici, diversi
Il dominio di legame al dna è sempre e solo 1, mentre quelli di trascrizione possono essere multipli,
permettendo quindi di interagire con più siti di trascrizione, questo è infatti il dominio tramite cui i
fattori replicano diversi componenti.Questi dominisono collegati da regioni flessibili e sono in grado
di funzionare indipendentemente gli uni dagli altri.
I domini sono altamente strutturati in soluzione, e ciò permette (come nel caso operone triptofano) di
essere compatti e formati da shift, alfa eliche e beta foglietti che danno delle strutture precise che poi
riescono a contattare il DNA.
Lezione 12 “I fattori di trascrizione”
I domini proteici possono funzionare anche in un contesto separato (molto vero per i fattori
trascrizionali), per cui sono in grado di funzionare indipendentemente gli uni dagli altri.
Ad esempio, prendendo il dominio di attivazione
di Gal4 e il dominio di trascrizione SP1,e
formando una nuova proteina, avrò che, in
quest’ultima, i geni legati da Gal4 verranno
attivati con un meccanismo che non è più quello
di Gal4, ma quello di SP1.
SI può quindi artificialmente con meccanismo
“taglia e cuci” mettere insieme fattori dimerici con
caratteristiche diverse.
C’è un corollario patologico di questa
possibilità di mix and match di diversi moduli
delle proteine → una proteina chimerica nelle
nostrecellulesipuòformare,nonartificialmente,
daalcunemutazionicometraslocazionicromosomiali(incuibisognaaverelarotturadelfilamentoe
una successiva traslocazione che può essere bilanciata o sbilanciata).
Conlatraslocazioneunaproteinasipuòunireaunaproteinadiversa→sequenzagenicachimerica
cheportaallatrascrizioneeproduzionediunaproteinachimericaformatadadominioadnaedominio
diattivazione.Ilgenechimerico,quindi,invecedifaredarepressore,puòattivarelatrascrizionedalla
stessa parte.
Una proteina chimerica è formata da due domini di proteine diverse, cioè composte da parti che
hanno origini differenti. Sono create unendo due o più geni che in origine codificano per proteine
separate; la trascrizione e la traduzione dei geni di fusione così creati originano un polipeptide /
proteina che possiede proprietà funzionali derivate da ciascuna componente originale. Itrasposoni
possono anche generare delle proteine chimeriche.
Quindi,seperesempiosiprendeildominiodilegameGal4,sipuògenerareunaproteinadifusione
con il dominio di attivazione di Gcn4, formando così un nuovo fattore dimerico che avrà le
caratteristichedilegamediDNAdiuno(Gal4)eequellediattivazionedell’altro(Gcn4).Questotipodi
struttura è riferito solo ai fattori specifici
DOMINIO DI LEGAME AL DNA
Come fa una proteina a riconoscere una molecola di DNA?
Tutta la capacità discriminatoria di una proteina deve basarsi sul fatto che sequenze diverse di
nucleotidi si esporranno verso l’esterno,
entrando in contatto con atomi diversi e
formando così interazioni differenti. La
doppietta nucleotidica avrà infatti un lato che
si affaccia sulla scanalatura principale della
doppia elica di DNA e l’altro che si affaccia
sulla scanalatura secondaria.
I fattori di trascrizione riconoscono il DNA
sulla scanalatura maggiore (o principale) per
questioni di ingombro sterico, ma non solo.
Osservando l’interazione tra basi in una
molecola di DNAvistadall’alto,sipuònotare
che abbiamo un legame G-C con un lato
Lezione 12 “I fattori di trascrizione”
rivolto verso la scanalatura principale e l’altro in direzione della scanalatura secondaria. Al contrario si
può avere C-G, sempre con le stesse scanalature ai lati opposti. Verso le scanalature si può
osservare la presenza di atomi di idrogeno non disponibili per formare interazioni elettrostatiche,
mentre possiamo dividere gli altrigruppiindonatori(inblu)eaccettori(inrosso)dilegamiaH.Nel
caso della Timina, invece, si ha un gruppo metilico, sfruttato per le interazioni di Van der Waals.
Ritornando in alto a sinistra a G-C, rivolta verso la scanalaturaprincipale,avremol’esposizionedi:
accettore-accettore- donatore, da sinistra a destra. Guardando invece verso la scanalatura
secondaria, abbiamo: accettore-donatore-accettore. Quindi sulla scanalatura principale ci sarà un
maggiorepoterediscriminatorioperchéabbiamounadisposizioneasimmetrica,eperquestosipotrà
distinguere se come riferimento viene preso G-C oppure C-G.Nellascanalaturasecondariainvece
entrambelecombinazionidannoaccettore-donatore-accettore,quindilaproteinasaràingradodidire
se c’è un doppietto C-G o G-C, ma non di capire la direzionalità e dunque in che parte della
scanalatura viene approcciato il DNA.
Invece A e T presentano lo schema: accettore-donatore-accettore + gruppo metilico verso la
scanalaturaprincipale,mentreversolasecondariatroveremosolodueaccettori.Anchequi,quindi,il
poterediscriminatorioèmoltomaggioreversolascanalaturaprincipalerispettoallasecondaria.Nonè
che le T e le A non venganocontattatedaidominidilegamealDNA,maconferisconounaminore
possibilità di potere discriminatorio.
Diconseguenza,sapendochecisonogruppidiversisuunacoppiadibasiinsitidiriconoscimentodel
fattoreditrascrizione,èchiarochecipossonoesserediversecombinazionichevengonoriconosciute
dalle proteine. Queste ultime a loro volta dovranno avere delle strutture secondarie che gli
permetteranno di interagire col DNA,andandosiperesempioadinfilarenellascanalaturaprincipale
del genoma.
Osservando l’immagine a destra si vede
come da una parte si ha il doppietto, come ad
esempio T-A, dall’altra una proteina che lega
il DNA, che in qualche modo riesce a
interagire con un’asparagina per contattare un
donatore e un accettore a idrogeno sul
doppietto.
In sintesi, la base per l’azione di
riconoscimento comprende il dispiegarsi di
diversi doppietti che esporranno
regolarmente differenti accettori e donatori
sulle due scanalature. Essi interagiscono
con specifici gruppi laterali e specifici AA
Le proteine che hanno una struttura primaria presentano dei gruppi
esposti lateralmente a partire dagli AA, che non sono tutti rivolti dallo
stesso lato, ma possono essere rivolti verso l’alto o verso il basso.
Questi poi possono ripiegarsi formando delle interazioni di Van der
Waals, andando a costituire strutture come le alpha-eliche o i
beta-shift. Quando le molecole interagiscono tra loro ci deve essere
una compatibilità a livello di forma, ma soprattutto a livello di gruppi
che possano portare il ligando a rapportarsi con il sito di legame. La
forma rigida sia per il sito di ligando che per la proteina, permette al
ligando di avere tutta una serie di interazioni con le catene laterali
della proteina, come avviene in interazioni:
● proteina proteina
● proteina dna
● antigene proteina
Lezione 12 “I fattori di trascrizione”
posizionati regolarmente nella struttura della proteina, e
quest’ultima sarà in grado formare un legame quando ci
saranno sufficienti gruppi laterali per riconoscere un
sufficiente numero di coppie di basi.
I domini di legame al DNA saranno configurati in modo da
esporre in modo ordinato i gruppi laterali perché possano
contattare (ognuno una specifica base) in modo specifico
delle basi messe in un determinato ordine e a una
specifica distanza.
CLASSIFICAZIONE DOMINI DI LEGAME AL DNA
DallepremesseprecedentisipuòintuirecheidominidilegamesulDNA,persvolgerequestefunzioni
direclutamentoaltamenteprecise,devonoalorovoltaavereunastrutturamoltospecifica.Lamaggior
parte dei domini di legame sul DNA è composta da una porzione della proteina che interagisce
direttamenteconilgenoma,formatasolodaalpha-eliche,perchéessesonoestremamentestrutturate
e si adattano perfettamente alla scanalatura principale della doppia elica, facilitando così il
reclutamento di coppie di basi successive, come i gruppi laterali degli istoni.
caratteristiche alpha eliche
● Le alpha eliche vengono orientate per giacere nella scanalatura principale della doppia elica,
dove gli atomi delle proteine stabiliscono specifici contatti con atomi del DNA.
○ il dominio di legame non è solo la regione che contatta l’alfa elica, ma contribuisce a
spaziare tutta la regione in modo che il legame possa avvenire.
○ La ragione per cui sono alfa eliche è in parte sterica, perché un’alfa elica è della
misura esatta per poter giacere nella scanalatura principale del dna, senza generare
distorsioni della doppia elica.
○ Altre possono generare un ripiegamento della doppia elica quando legano, questa
deformazione si crea perché non c’è abbastanza spazio nella scanalatura
secondaria.
● Possono avvenire interazioni successive, come quelle con atomi dell’ossatura di
zucchero-fosfato, e a volte anche con atomi della scanalatura secondaria, che possono
contribuire al riconoscimento e al legame, aumentando il grado di specificità e anche l’attività
del DNA
● Studi cristallografici X-ray di complessi DNA-proteine hanno portato a caratterizzare diversi
motivi strutturali che possono presentare una alfa elica alla scanalatura principale
○ Questi caratterizzano i fattori di trascrizione, in quanto la maggior parte di questi
motivi strutturali ha caratteristiche sequence consenso nei suoi AA
○ I fattori di trascrizione sono spesso classificati a seconda del loro tipo di dominio di
legame al DNA. Esistono molti domini di legame a DNA, ma i più diffusi sono:
l’omeodominio, il dominio a dita di zinco, il dominio basico a cerniera di leucine e il
dominio elica-ansa-elica
Lezione 12 “I fattori di trascrizione”
Omeodominio (o
homedodominio)
A dita di zinco
(Zinc-Finger)
●
●
●
●
caratteristico dei geni omeotici, scoperti nella Drosophila, ma
presenti anche nei mammiferi e necessari per lo sviluppo di parti
specifiche del corpo (gambe, braccia, dita, vertebre ecc)
costituito da una sequenza molto conservata di 60 AA, che forma
una struttura (o anche una sequenza) a elica-ansa-elica- giro-
elica, detta anchehomeobox
○
○
○
○
si hanno quindidue regioni flessibili e tre alfaeliche,dove
la prima e la seconda posizionano la terza
perpendicolarmente, quindi il legame posiziona l’elica 3 in
posizione trasversale rispetto alla 1 e alla 2, in modo che
possa appoggiarsi alla scanalatura principale
l’elica 3 è quella che contatta direttamente il DNA nel solco
maggiore, in quanto ha una sequenza consenso
abbastanza conservativa formata da ATTATTAAT. Essa
contatta il DNA nel solco maggiore dove si adagia,
riuscendo a contattare coppie di nucleotidi successivi con
gruppi laterali di amminoacidi.
L’elica 1 invece ha una regione flessibile amminoterminale
che fa il giro e si aggrappa con un’arginina a coppie di basi
sul solco minore, migliorando sia la specificità che l’affinità
della proteina.
La caratteristica del homeobox, inoltre, è che questo è un
dominio di legame a DNA che funziona come monomero.
proteine che si ripiegano attorno allo ione zinco, molto comuni
nelle proteine che legano gli acidi nucleici
ci sono 3 diversi motivi a dita di zinco, come il C2H2 (TFIIIA, WT1,
SP, ADR1)
○ il modello C 2 H 2 è costituito da almeno 3 dita chesi
ripetono. Le tre dita legano il DNA come monomeri, con
l’alfa elica di ciascuna unità che contatta la scanalatura
principale del DNA lungo gruppi di basi successive, mentre
la proteina si avvolge attorno alla doppia elica. Le tre dita
vengono posizionate correttamente dalla struttura della
sequenza proteica che le precede. La scanalatura
principale va tutto intorno alla doppia elica e le alfa eliche
seguono questa scanalatura. I gruppi laterali di ciascuna
alfa elica contattano i gruppi laterali esposti dalle coppie di
basi.
○ il dominio è formato da:
■ un foglietto beta all’estremità N terminale dalla
posizione 1 alla 10
■ due AA che formano una regione flessibile
■ alfa elica che rappresenta il dito, ovvero la parte
della proteina che contatta il DNA
○ L’alfa elica è tenuta in posizione da due foglietti beta
antiparalleli, e questo ripiegamento è determinato da due
coppie di AA conservati sull’ elica, ovvero due istidine in
posizione 19 e 23 e sul primo foglietto beta due cisteine in
posizione 3 e in posizione 6. Le istidine interagiscono con
ione zinco, quindi possono far ripiegare le catene che
formano la struttura, rendendola ben definita. Questo dito
può così contattare il DNA.
■ è per questo che il motivo di zinco si chiama
C2H2, perché è formato da due cisteine e due
istidine (tutti i siti di riconoscimento per C2H2 sono
formati da 9 basi)
Lezione 12 “I fattori di trascrizione”
Nell’immagine si ha un’alfa
elica che riconosce, tramite
due arginine, due doppiette
GC-GC (contigue o
intramezzate).
Si è così costruito un vero e
proprio codice di sequenze
che riconoscono specifiche
combinazioni di doppiette,
per cui i ricercatori sono stati in grado di costruire dei domini di legame al
DNA artificiali che possono legare qualsiasi sequenza.
Questo è stato utilizzato, per molto tempo, per veicolare degli enzimi a
delle sequenzediDNA:seavessimovolutogenerareuntagliodeldoppio
filamento in una certa regione, avremmo costruito un fattore chimerico
formato da una fusione tra un motivo a dita di zinco C2H2, ad hoc per
quella sequenza, + un enzima con attività endonucleasica che tagliava la
regionedovelaproteinaartificialesiandavaatagliare.Questoservivaper
generaredellericombinazionispecifiche.Oggitalemetodononèpiùusato
perchéèstatosostituitodall’editingdelgenomaconCRISPR-CAS9,cheè
molto più efficiente.
Basico- a cerniera di
leucine
(Basic-Leucine
Zipper)
Elica-ansa-elica
(Helix-Loop-Helix)
●
●
●
●
●
●
Gcn4, CREB/ATF, C/EBP, AP1 (Jun-Fos)
può legare il DNA sotto forma di dimero, questo perché la regione
ad alfa elica è costituita da:
○ dominio N terminale basico che “afferra il DNA” a 2
scanalature principali adiacenti
■ Il dominio di legame al DNA, proprio come
l’omeodominio (formato da tre alfa eliche di cui
solo una contatta il DNA) è formato da un’alfa elica
più lunga di quella che contatta il DNA perché a
valle si trova il dominio di dimerizzazione costituito
da almeno 5 ripetizioni di leucine ogni 7 AA
○ dominio C-terminale di dimerizzazione costituito da almeno
5 ripetizioni di Leucine (AA idrofobici) ogni 7 AA
■ la parte di leucine permette che un dimero possa
contattare una scanalatura e l’altro l’altra; quindi la
dimerizzazione avviene nella cerniera di leucine
tramite interazioni idrofobiche, formando una
struttura coiled coil (dominio di interazione molto
forte e altamente specifico)
■ la porzione di leucine determinerà la specificità di
interazione, infatti a seconda degli amminoacidi
intramezzati tra le diverse leucine, questi domini
formano solo omodimeri, solo eterodimeri, o
entrambi con Leucine Zipper compatibili (molto
importante nel determinare il fattore di
trascrizione). Sia che siano presenti come
omodimeri che come eterodimeri, è necessaria la
loro dimerizzazione per legare il DNA. Senza la
dimerizzazione nessuna alfa elica potrebbe essere
posizionata in maniera specifica nel DNA.
è undimero obbligato
MyoD, myogenin, Myf-5, Myc, Max
è simile alla cerniera di leucine perché è un dimero obbligato, ma
con le alfa eliche separate da un’ansa
L’elica N-terminale contiene residui basici che legano il DNA
Lezione 12 “I fattori di trascrizione”
●
●
L’elica C-terminale ha AA idrofobici spaziati ad intervalli
caratteristici di un’a elica => è acido
Anche le proteine H-L-H possono formare sia omo- che
etero-dimeri => il modo in cui elica ansa elica interagisce con dna
è uguale a quello con cui lo fa lo zipper e possono formare anche
loro omodimeri o eterodimeri
PARAGONE TRA ZIPPER E H-L-H LEGATE AL DNA
.
I fattori di trascrizione dimerici hanno
dei siti di legame sul DNA che sono
degli emi-siti: abbiamo infatti una parte
di sequenza che corrisponde alla prima
scanalatura principale, e una parte di
sequenza che corrisponde alla
successiva scanalatura.
Intercorrono infatti 6 basi tra i nucleotidi
contattati in una scanalatura e quelli
contattati nell’altra. Queste sequenze,
nel caso di un omodimero, sono
simmetriche (3’-CACAAA-5’); ma se si
tratta di eterodimeri la sequenza
contattata da un’elica è diversa da
quella contatta dall’altra elica; quindi
avremo sempre due emisiti che non
saranno uguali tra loro. Gli omo e gli
eterodimeri possono avere
caratteristiche diverse, sia come attivatori (a seconda di che tipo di co-attivatori reclutano), sia come
siti riconosciuti sul DNA.
In figura vediamo due proteine Leucine Zipper con
diversi siti di legame.
Ilsitodilegamedelfattoreverdescuroèilsitoblu,
quelloriconosciutodalfattoreverdechiaroèilsito
rosso. Verde scuro e chiaro riconoscono quindi
promotori diversi ed esplicano funzioni differenti.
L’eterodimero invece riconosce una terza
Lezione 12 “I fattori di trascrizione”
categoriadisitidilegamechesaràunmixdisequenzebluerosse,generandounulteriorefattorecon
funzionidiverse,perchéildominiodiattivazioneèformatoinpartedalpeptideverdescuro,einparte
da quello chiaro. Le sequenze riconosciute dall’eterodimero saranno fatte da due emisiti. il primo
emisito blu (contattato da verde scuro) e l’altro invece contattato da verde chiaro.
→CONTROLLO COMBINATORIALE
In questo modo aumentiamo in modo combinatoriale le possibili combinazioni: con due proteine
abbiamo tre dimeri funzionalmente diversi che riconoscono sequenze differenti.
Spesso riconoscono sequenze simili con caratteristiche diverse perchéisitidiriconoscimentoperi
fattori di trascrizione sono degenerati: il riconoscimento da parte di un fattoreditrascrizionenonè
stringente come ad esempio il riconoscimento di una sequenza di DNA da parte di un enzima di
restrizione.Cisonodellesequenzeconsensoincuipiùfrequentementeinunadeterminataposizione
troviamo una base piuttosto che un’altra. Queste sequenzeconsensoperòsonomoltopresentinel
genoma (n mila volte) e non possiamo realmente vedere dove un fattore lega nel DNA.
Adeterminareseunfattoresilegaomenoadunasequenzaconsenso,èlastrutturadellacromatina.
Allo stesso modo il fatto che le sequenzesianodegeneratecontribuiscealfattoche,cambiandola
struttura della cromatina, un fattore può essere captato per la regolazione di un gene.Lamaggior
parte delle differenze tra specie vicine e tra individui, sono date non tanto dallasequenza,madal
modo in cui i geni sono regolati.
Ilmodoincuiungenevieneregolato,puòesserevariatodallaliberazionedellastrutturacromatinica
permettendo il legame con un nuovo fattore di trascrizione che prima non legava.
DOMINIO DI ATTIVAZIONE
●
●
●
●
●
una sequenza polipeptidica che attiva la trascrizione quando fusa con un motivo di legame al
DNA
○ devereclutareuna proteina tramite interazione percui deve essere capace di
interagire con altre proteine => le caratteristiche necessarie non sono le stesse molto
rigide che servono per il riconoscimento del dna => non si hanno strutture specifiche,
anche perché la maggior parte di queste sono in grado di contattare più domini di
attivazione
i domini di attivazione non hanno una struttura ben definita e molte sequenze diverse
possono agire da domini attivatori
○ molto spesso molto flessibili e difficili da cristallizzare => molte sequenze diverse
possono agire da domini attivatori
Spesso sono destrutturati in soluzione, per assumere struttura definita in seguito
all’interazione con un coattivatore.
Spesso sono sequenze di natura “acida” ricche in glutammato e aspartato, residui aa carichi
negativamente (specialmente nel lievito)
Sono essenzialmente superfici di tipo adesivo, adatte a mediare interazioni proteina-proteina
attraverso le quali puo’ avvenire il reclutamento dei diversi componenti del macchinario
trascrizionale (altri fattori di trascrizione, co-attivatori, GTFs, HAT, SWI/SNF)
Si può definire dominio di attivazione qualunque sequenza polipeptidica in grado di attivare la
trascrizione quando viene espressa come parte di una proteina che contiene un motivo di legame al
DNA.Questo grazie al fatto di essere una superficiedi tipo adesivo con aminoacidi carichi che
possono facilmente stabilire interazioni proteina proteina.
Se la proteina ha una struttura fissa può interagire solo con determinate strutture; mentre se è
destrutturata, così come i domini di attivazione, può adattarsi più facilmente alla superficie di diverse
proteine.
Il dominio di attivazione è una sequenza polipeptidica che è in grado di mediare un'interazione
efficacie (ed è chiamata interattore), e questo ne rivela la principale funzione che è quella di reclutare,
tramite interazioni proteina-proteina, i co-attivatori.
Lezione 12 “I fattori di trascrizione”
Una volta la struttura delle proteine era determinata tramite cristallizzazione: essa consiste nel
codificareleproteineconcentrandoleinquantitàsempremaggiorifinoaformaredeicristalli.Icristalli
hanno la caratteristica di amplificare la struttura proteica, che può quindi essere studiata tramite
rifrazionearaggiX.Oggi,lacristallografianonèpiùusataperchésonosubentratedelletecnicheche
possonostudiaredirettamentelafunzionedellaproteinaconlacosiddetta“cryoelectronmicroscopy”
(microscopiaelettronica“asuperfreddo”).Il“superfreddo”infattibloccalastrutturadellamicroscopia
e per questo si usano dei microscopi elettronici estremamente sensibili e sofisticati che possono
andare a studiarne la struttura.
Lamaggiorpartedellestrutturedeidominidiattivazionesonostateottenutesoloquandoildominiodi
attivazione interagiva con la proteina da reclutare. Si può infatti cristallizzare una proteina solo se
questahaunastrutturabendefinita.Selastrutturaè“fluttuante”nonsipossonootteneredeicristalli
utili per la struttura in quanto questa è assente.
Quandoinvecelaproteinainteragisceconilsuointerattore,laproteinasaràbloccataesaràingrado
di formare dei cristalli.
COATTIVATORE CBP/p300
Nell'immagine è
presentata la struttura
dell’istone aciltransferasi
di due proteine molto
omologhe chiamate
CBP/p300. Le regioni
colorate sono domini che
agiscono con i domini di
attivazione di trascrizione
di altri fattori.
=> cbp/p300 è un
coattivatore promiscuo;è
molto abbondante nella
cellula.
Questa proteina quindi è
tra quelle meno specifiche,
in quanto tra le più
promiscue nella capacità
di acetilare i diversi residui
sulle code
amminoacidiche di diversi istoni (H3 e H4). E’ la proteina più abbondante perché è quella
principalmente responsabile dell’aumento generico dell'acetilazione, che favorisce la
decompattazione della cromatina, e quindi la trascrizione a livello generico (non mediato dai readers).
La CBP/p300 possiede numerosi siti di interazione con i domini di attivazione di diversi fattori di
trascrizione, tra questi si trovano:
● Il bromo dominio la rende facilmente reclutabile dove gli istoni sono già stati acetilati (una
specie di feedback positivo)
● dominio HAT che media la funzione enzimatica
● Domini sopra i quali sono riportati i fattori di trascrizione che interagiscono con il loro dominio
di attivazione su questa porzione di CBP/p300.
C’è una competizione fra le cellule per avere CBP/p300, nonostante ve ne sia già una buona quantità
nella cellula. Questo equilibrio contribuisce a regolare come i fattori di trascrizione attivano i loro
Lezione 12 “I fattori di trascrizione”
promotori e spiega perché è sempre necessario avere più di un fattore di trascrizione per attivare la
trascrizione.
Poniamo di avere due promotori, uno con un fattore di trascrizione che può reclutare CBP/p300, l’altro
con quattro fattori di trascrizione. Il promotore che recluta più efficacemente CBP/p300 è ovviamente
quello con 4, che siano quattro fattori di trascrizione diversi o che siano quattro copie dello stesso
fattore. Questo è uno degli elementi che può determinare la forza relativa di un promotore rispetto
ad un altro. Questo tipo di competizione può avere anche dei risvolti patologici:
Infezione da virus oncogeni (sp 40 ac) e adenovirus che esprimono sp40 large c e 1a che causano
trasformazione tumorale.
Queste proteine oncogeniche sono il contrario delle proteine oncosopprettrici come la p53 (ovvero
un oncosoppressore, la cui espressione è necessaria per non far trasformare le cellule. Media o il
riparo del danno o l’apoptosi della cellula quando il danno non è più riparabile). Tutte hanno in
comune il fatto che attivano la trascrizione dei geni grazie al fatto di reclutare CBP/p300.
La proteina p53 necessita di CBP/p300 per svolgere al meglio la sua attività di oncosoppressore,
Le due proteine SV40 Large T e E1A dell’adenovirus (entrambe oncoproteine: proteine che se
espresse causano la formazione di un tumore) necessitano di CBP/p300. Quando questi virus
infettano la cellula, producendo tante copie di se stessi, producono anche grandi quantità di queste
oncoproteine che si legano alle sequenze del virus reclutando p53. Essendoci quindi molte proteine
virali che sequestrano CBP/p300, si causerà una carenza di questa proteina e di conseguenza p53
non si può legare a questa e non può attivare i suoi geni bersaglio che mediano la soppressione
tumorale, dunque trasformazione in tumore
Se l’attività di p53 è inibita=> danno al dna non potrà essere efficientemente riparato => cellula
sopravvive con mutazioni che diventano cellule tumorali.
spazio domande
1) Domanda: il gene che codifica per la proteina p53, codifica anche per il numero di fattori di
trascrizione che poi andranno a competere?
Risposta: il gene codifica per p53, questa poi va a legare i promotori sui geni bersaglio; altri geni
bersaglio di altri fattori di trascrizione vanno poi a legare altri fattori di trascrizione. P53 e questi altri
geni recluteranno CBP/p300. A seconda di quanti fattori di trascrizione sono presenti per reclutare
CBP/p300, si potrà variare la capacità di attivazione dei loro promotori perché la quantità di
CBP/p300, per quanto alta, può diventare limitante.
2) Domanda: E’ quindi l’assenza di CBP/p300 per la p53 che causa il tumore?
Risposta: in questo caso sì. A seguito, ad esempio, dell’infezione da parte di SV40 il meccanismo per
cui questa causa dei tumori è il fatto che p53 nella cellula infettata è meno attivo perché riesce a
reclutare meno CBP/p300 perché è in parte sequestrato.
SINERGIA TRASCRIZIONALE
Il concetto di sinergia è diverso dal concetto di additività:
● Additività: una proteina attivatrice attiva una attività di trascrizione; quattro proteine ne
attivano quattro e così via.
● Sinergia: quattro proteine attivatrici non attivano quattro unità di trascrizione, ma ad esempio
ne attivano 500.
Ogni promotore è un mix per fattori trascrizionali diversi.
Un promotore è formato da tanti elementi che interagiscono con attivatori, repressori e così via e
capita che si abbiano più siti di riconoscimento per uno specifico fattore trascrizionale.
Lezione 12 “I fattori di trascrizione”
Se un promotore basale non può essere attivato, se esprimiamo una certa proteina attivatrice ci
aspettiamo che con questa proteina attivatrice si avranno 500 unità di trascrizione.
La sinergia trascrizionale è mediata dal fatto che più copie su un dominio di attivazione saranno in
grado di reclutare meglio l’attivatore.
Il fatto di avere più di una proteina attivatrice amplifica le individuali potenze delle diverse proteine. In
parte questo è dovuto al fatto che quattro copie dello stesso dominio di attivazione trascrizionale sono
in grado di reclutare molto efficientemente il co-attivatore, che sia CBP/p300 o altri, e questo aumenta
in modo sinergico, e non additivo, l’attivazione. Se non ci fosse una buona efficienza se ne
recluterebbero molte meno.
Lo stesso discorso vale per fattori di trascrizione diversi legati ad un promotore. Per spiegare
ciò bisogna però prima affrontare un ulteriore concetto: Fattori di trascrizione diversi legati in posizioni
specifiche sul DNA sono in grado di interagire tra loro mediante i loro domini di interazione, che sono
superfici di interazione proteina proteina.
Per interagire devono fare ripiegare il DNA e quindi si viene a creare una struttura di questo genere
(immagine sotto) in cui il DNA è fortemente ripiegato. Questo ripiegamento permettere ai diversi
domini di attivazione, legati in posizioni del promotore specifiche ma vicine, di entrare in contatto tra
loro. Un esempio è quellodell’enhanceosoma.
L’enhanceosomaè un complesso proteico
unico formato da domini di attivazione di una
serie unica che si compongono in modo
ordinato della sequenza regolatoria. I fattori
allora potranno legarsi e i domini di
attivazione potranno interagire tra loro nello
spazio.
Il complesso dell’anhanceosoma non esiste
all’infuori del DNA, infatti esso si forma
quando tutte le proteine si legano al DNA e
solamente se, oltre al fattore di trascrizione,
sono presenti delle proteine architetturali che
hanno la funzione di aiutare questo
ripiegamento del DNA. Queste proteine facilitano termodinamicamente il ripiegamento del DNA
permettendo ai domini di entrare in contatto, formando così l’enhanceosoma.
Questa interazione nello spazio tra i domini di interazione crea una struttura molecolare simile a un
meta attivatore (o un meta dominio di attivazione), che potrà avere attività molto più alta e anche
molto più regolata dei singoli fattori.
La struttura molecolare che si forma, rendendo l’enahnceosoma simile a un meta dominio, è una
struttura tridimensionale unica che si viene a formare solo su uno specifico promotore perché solo
Lezione 12 “I fattori di trascrizione”
questo possiede i siti di legame per questi esatti fattori di trascrizione, in questo esatto ordine e
distanza.
Questo dominio tridimensionale diventa una struttura unica, che acquisisce le caratteristiche di un
super attivatore reclutando in modo coordinato diversi co-attivatori per attivare il gene in modo molto
efficiente (il dominio trascrizionale nell’enhanceosoma diventa quindi polimerico).
Gli studi su cui è stato costruito questo modello dell’ enhanceosoma riguardano il promotore che
permette l’attivazione della trascrizione del gene per l’interferone beta.
INTERFERONE BETA
interferoni= citochine (ormoni
polipeptidici) che vengono
sintetizzati dalle cellule, e che
funzionano nel momento in cui
vengono recepiti dai recettori
specifici che agiscono in maniera
esocrina o paracrina. Mentre
molte citochine sono espresse
solo da alcuni tipi cellulari, gli
interferoni (classificati in tipo 1,
caratteristici solo dei mammiferi,
divisi in alfa e beta, e di cui fa
parte l’interferone beta, e tipo 2). In particolare, l’interferone beta rappresentail principale
meccanismo di difesa da infezione virale. L’interferonebeta è il primo livello di difesa delle nostre
cellule (non solo quelle del sistema immunitario) dai virus. Questa difesa non difende però la cellula
stessa (che andrà incontro ad apoptosi), ma tutte le cellule vicine poiché, dato che parliamo di un
organismo pluricellulare, l’interesse è quello di salvare l’intero organismo.
Si attiva così la trascrizione del gene dell’interferone beta, in particolare è attivato in modo
estremamente specifico dall’infezione virale e predice alle cellule la presenza di un virus.
Queste cellule attivano la risposta dell’interferone che comprende:
- la degradazione di tutti gli RNA
- inibizione della sintesi proteica
Per le cellule, attivare la risposta dell’interferone è deleterio per loro stesse, ma in questo modo il
virus che le ha infettate non può essere replicato ulteriormente e non può infettare ulteriori cellule.
Questo meccanismo, infatti, limita il più possibile la diffusione del virus una volta avvenuta l’infezione.
I virus, a loro volta, hanno sviluppato dei sistemi che permettono loro di superare la risposta
dell’interferone.
ES: il virus del SARS-COV 2 ha sviluppato una serie di proteine che inibiscono in modo specifico i
diversi mediatori della risposta all’interferone. Il virus sfugge alla risposta all’interferone, viene
ugualmente prodotto e stimola un’alta produzione di citochine infiammatorie. Si crea così, oltre che la
riproduzione continua del virus, una situazione di infiammazione sempre più alta. Quando gli individui
muoiono di Covid, muoiono non per il virus, ma per la risposta immunitaria incontrollata. Questa
situazione non riguarda tutte le persone infettate; il fatto che può presentarsi o meno dipende dalla
carica virale e dalla situazione generale di salute di ogni individuo e dalle caratteristiche genetiche
che determinano quanto facilmente produce risposta infiammatoria.
Domanda: Perché induce la risposta infiammatoria? Che vantaggio ne ha il virus?
Risposta: In realtà non è il virus che ne ha vantaggio. La risposta infiammatoria è funzionale al fatto
che si possa poi creare la risposta immunitaria. Il problema è che, poiché il virus supera la risposta
all’interferone, questo innesca una risposta immunitaria ancora più alta.
Lezione 12 “I fattori di trascrizione”
L’infiammazione è una reazione molto importante per risolvere le situazioni infettive; senza
infiammazione non si potrebbero reclutare le cellule del sistema immunitario che arrivano,
riconoscono l’antigene, producono gli anticorpi, i linfociti T… Però la risposta infiammatoria
deve poter essere controllata perché se esce dal controllo è pericolosa. Infatti il sistema immunitario
ha dei meccanismi a feedback negativo in cui elementi della stessa attivazioni vanno a ridurre la
risposta infiammatoria. Sono equilibri molto delicati e quando si interferisce con questi in modo
patologico possono creare questi problemi.
Stesso meccanismo avviene nel caso delle allergie: Il cortisone, infatti in caso di Covid, viene dato per
limitare la risposta infiammatoria, ma spesso l’errore è quello di somministrare il cortisone troppo
presto, inibendo la stessa risposta immunitaria.
Il gene è regolato da un fattore nella regione promotica.
L’enhanceosoma si forma in seguito al legame, spesso cooperativo (per cooperativo si intende che il
legame di un fattore favorisce a legare gli altri), tra tre fattori:
• F-kB
• IRFs
• ATF-2/c Jun)
Questi tre fattori vengono espressi ad alti livelli ed attivati tutti insieme nella stessa cellula, solo in
seguito a infezione virale. Il fatto che il promotore dell’interferone beta non possa essere attivato se
prima non si forma l’enhanceosoma (sono necessari tutti e tre i fattori), conferisce un’alta specificità
all’attivazione dell’interferone beta.
Innescare la risposta dell’interferone non è molto favorevole per le cellule perché, come già detto,
muoiono. Questo è ovviamente un danno, ma è un danno minore rispetto che lasciare correre il virus
in maniera incontrollata.
Il fatto che l’attivazione avvenga solo in presenza di tutti e tre i fattori, i quali sono presenti solo a
seguito di un’infezione virale, garantisce un’alta specificità e l’efficienza di attivazione.
Solo quando c’è un'infezione virale questi fattori sono tutti attivi nella cellula e si forma
l’enahencosoma, se ne manca anche solo uno non si può formare perché è come se ci fosse una
specie di buco.
Questo meta dominio di attivazione, che si crea dall’interazione dei domini di attivazione dei tre fattori
trascrizionali, è particolarmente efficiente nel reclutare l’oloenzima, la HAT e successivamente un
rimodellatore della cromatina.
1. Si posiziona l’intero apparato trascrizionale, ad eccezione di TBP;
2. quando viene reclutato il rimodellatore della cromatina viene rimosso un nucleosoma posizionato a
valle della TATA box che impedisce il legame di TBP
a. Le attività acetilatiche sono necessarie per rimodellare la cromatina, ovvero spostare i
nucleosomi che devono essere spostati perché impediscono l’avvio della TATA BOX
3. il nucleosoma viene rimosso;
4. viene legato il TBP;
5. la trascrizione comincia.
(Si posiziona l’intero apparato trascrizionale, ad eccezione di TBP; quando viene reclutato
il rimodellatore della cromatina viene rimosso un nucleosoma posizionato a valle della TATA
box che impedisce il legame di TBP. Il nucleosoma viene rimosso, viene legato il TBP e la
trascrizione comincia.)
Tutto ciò avviene in maniera molto efficiente e il fatto che sia richiesto l’enhanceosoma garantisce
delle caratteristiche uniche all’attivazione del promotore dell’interferone beta, mediante
l’enahnceosoma infatti si ottengono:
● alta specificità, necessaria perché la risposta dell’interferone comporta la degradazione
dell’RNA e quindi non si vuole che la risposta venga innescata a meno che non sia
necessaria, per cui l’alta specificità di attivazione avviene solo a valle dell’infezione virale
Lezione 12 “I fattori di trascrizione”
● alta efficienza di trascrizione, cioè la capacità di reclutare in modo coordinato diversi elementi
dell’apparato trascrizionale, quindi diversi coattivatori
Tutti questi livelli di regolazione possono essere anche oggetto di disregolazione o perché c’è un
difetto di espressione, o perché c’è un difetto nella funzione di un fattore che determina una malattia
specifica. È importante tutto ciò per capire le basi molecolari delle patologie e per farci un’idea di
come delle basi molecolari funzionino nell’organismo attivando o meno la trascrizione.
Riassumendo, il meccanismo di trascrizione partendo da un interferone Beta è:
● Enhancer inducibile da virus del gene per l’IFNß (~-100/-50)
● Legame cooperativo di 3 fattori attivati da infezione virale (NF-kB, IRFs e ATF-2/c Jun)
insieme alla proteina architetturale HMG1 (enhanceosoma)
● L’enhanceosoma recluta l’oloenzima/CBP e in seguito la HAT P/CAF
● le attivita’ acetilasiche sono essenziali per la trascrizione e portano al reclutamento di
complessi che rimodellano il nucleosoma posizionato a valle del sito di inizio della trascrizione
● l’ infezione virale porta a iperacetilazione localizzata sul promotore in vivo
MECCANISMI DI REPRESSIONE
TRASCRIZIONALE
Più elementi entrano nella regolazione di un gene, più ci sono segnali a cui il gene può corrispondere.
Anche negli eucarioti esistono i repressori, che funzionano attraverso diversi meccanismi.
E’ necessario a volte reprimere la trascrizione, sia per inibire un’attività di induzione del segnale, sia
per determinare quei geni che devono essere fortemente repressi e non facilmente riattivati.
Anche per la repressione trascrizionale ci sono diversi meccanismi a cui, nella maggior parte dei casi,
necessitano (così come per gli attivatori) oltre a un dominio di legame al DNA, anche un dominio di
repressione trascrizionale, che è l’equivalente del dominio di
attivazione.
Ci sono diversi meccanismi di repressione:
1) caso A
Il dominio di repressione non è necessario solo nel caso in cui il repressore avvia un legame
competitivo per l’attivatore. Questo avviene quando il sito di legame per il soppressore si posiziona
sul sito di legame per l’attivatore (sovrapponendosi o coincidendo) => repressione non attiva, ma si
evita che l’attivatore possa esercitare le sue funzioni di attivatore. In questo caso, una volta
aumentata la quantità di repressore piuttosto che dell’attivatore, il repressore scalza l’attivatore dal
promotore e il promotore non viene attivato.
Questo meccanismo è “passivo” in quanto non si tratta di repressione attiva, ma più che altro di
mancanza di attivazione. E’ possibile solo su promotori che possiedono una conformazione specifica
per entrambi i siti di legame e che, per essere attivati, richiedono il legame dell’attivatore.
Questo è l’unico caso in cui un repressore può fare a meno di un dominio di repressione trascrizionale
Gli attivatori possono essere posti sia sotto forma di attivatore che di repressore, infatti privata del
dominio di attivazione, una proteina, può agire da repressore.
Può anche succedere che un attivatore perda il suo dominio di attivazione e quindi venga prodotta
una proteina tronca, questo può essere:
- fisiologico → splicing alternativo
- patologico
Lezione 12 “I fattori di trascrizione”
Ci sono altre due situazioni in cui il repressore funziona su promotori che hanno delle geometrie
specifiche, ma il repressore ha bisogno del dominio di repressione.
2) caso B
Il sito di legame di attivatore e sito di legame di repressore sono vicini, ma separati. Possono quindi
legare tutti e due; quando però il repressore si lega al suo dominio di repressione, interagisce con il
dominio di attivazione e lo neutralizza, mascherando il dominio di attivazione dell’attivatore, e
impedendo di interagire con i coattivatori, quindi di funzionare. Anche in questo caso si tratta di una
mancanza di attivazione.
Sia nel primo caso (a) che nel secondo (b) la molecola rossa può agire da repressore solo nei
contesti genici in cui il gene ha bisogno di uno specifico attivatore per poter funzionare.
3) caso C
Il repressore impedisce all’attivatore di mediare l’attacco per l’attivatore. Il repressore maschera il sito
di interazione con il macchinario di trascrizione basale. Si tratta di inibizione dell’attivazione a seguito
di repressione attiva.
Negli altri casiun repressore trascrizionale puòagire sempre da repressore trascrizionale,
indipendentemente da quali fattori sono coinvolti nel gene, in quanto sarà in grado di reclutare delle
proteine che saranno co-repressori, l’analogo confunzioanle dei co-attivatori (eg istone-deacetilasi).
Possiamo immaginare che sia
fisiologicamente sia dietro mutazioni
patologiche che un attivatore possa
essere prodotto in una isoforma
alternativa priva del dominio di
attivazione [vedi caso A] (o perché
fisiologicamente lo stesso RNA può
essere maturato con lo splicing in
modo da includere o meno la regione
specifica dei siti di attivazione, o
perché c’è stata una mutazione
genetica che ha reso quel gene
tronco). In entrambi questi casi
l’attivatore si trasforma in repressore
e, ad esempio nel caso di una
mutazione eterozigote, andrà a
reprimere anche l’attivatore perché il
sito di legame è lo stesso.
Per analogia agli attivatori, i repressori
reclutano dei co-repressori per
permettere il funzionamento di un
dominio di repressore. Il reclutamento
di questi modificatori epigenetici
permette di modificare la cromatina e
rimodellarla in senso repressorio.
Un repressore, quindi, è in grado di
reclutare dei complessi di
rimodellamento della cromatina che
Lezione 12 “I fattori di trascrizione”
introducono nucleosomi in posizioni specifiche per inibire la trascrizione e/o modificatori degli istoni
come HAT o altri modificatori che vanno a effettuare funzioni di repressione.
Le HAT vanno a rimuovere le acetilazioni sulle code degli istoni e quindi ricompattano la cromatina;
altri modificatori vanno a introdurre delle metilazioni istoniche repressorie o togliere quelle attivatorie.
Paragone tra attivatore e repressore:
- attivatore: tramite il dominio di attivazione sarà in grado di reclutare un complesso e a
causare un’acetilazione diffusa.
- Analogamente un repressore, legandosi al sito di legame, andrà a reclutare dei complessi
che deacetilano gli istoni.
Coattivatori e
corepressori differiscono
perché non legano
specificamente il DNA e
devono essere reclutati
con dei meccanismi
epigenetici (=che
modificano la cromatina).
(“epigenetico” = sopra la
genetica, ovvero che
modifica l’attività
genetica).
Co-attivatori e co-repressori sono quindi:
● analoghi funzionali
● privi di un dominio di legame al DNA, hanno quindi la necessità di essere reclutati ai
promotori e alla cromatina;
● Sono necessari per la funzione dei fattori di trascrizione specifici in presenza di cromatina.
In figura vi sono due esempi:
a. Un repressore Ume6 legato ad una URS1 (upstream represive sequence) che con il suo dominio di
repressione, interagendo con un adattatore molecolare, recluta un complesso con attività istone
deacetilasica. L’effetto del legame del repressore è quello di deacetilare le code degli istoni; si causa
unaipo-acetilazione localizzata.
b. Attivatore Gcn4 che lega la UAS (upstream activation sequence) a monte della TATA box e che con
il suo dominio di attivazione recluta il complesso istone acetil trasferasico (in questo lievito il
complesso si chiama Gcn5) che causa una iperacetilazione le code degli istoni sui nucleosomi
adiacenti sia a monte che a valle.
Lezione 12 “I fattori di trascrizione”
Certi fattori possono agire da attivatori o repressori a seconda del contesto.
In figura abbiamo due fattori di trascrizione (verde e blu) che hanno dei domini di attivazione o
repressione, e dei domini di legame al DNA diversi tra loro. Il verde si lega al sito di riconoscimento
del DNA verde, il blu con il blu…
Sinergicamente i domini di attivazione formano una struttura tridimensionale reclutando il co-attivatore
e quindi si avrà l’attivazione trascrizionale di un gene che possiede il sito blu e verde esattamente in
quest’ordine; al contrario, si formerebbe una struttura tridimensionale diversa:
● esempio del fattore trascrizionale verde che si lega vicino a un altro cofattore e insieme
riescono a reclutare un coattivatore. Il verde allora agisce come un attivatore
● Il fattore verde nella stessa cellula, ma su un altro gene che ha per esempio anche un sito di
legame al fattore rosso, formerà una struttura tridimensionale diversa che recluterà invece un
co-repressore. L’attività trascrizionale infatti potrà reclutare un corepressore => il verde
agisce come un repressore.
○ nella stessa cellula ad esempio il fattore verde attiverà il gene X e reprimerà il fattore
Y
Allo stesso modo due attivatori diversi, viola e rosso, potranno attivare la trascrizione negli stessi geni
reclutando co-attivatori diversi. Non è detto che ci sia una corrispondenza biunivoca
attivatore-coattivatore o repressore-corepressore. Lo stesso attivatore o la stessa combinazione di
attivatori, sarà in grado di reclutare co-attivatori differenti.
Queste sono caratteristiche di regolazione combinatoriale: fanno sì che ad un certo numero di
proteine corrisponda un numero più elevato di giunzioni diverse a seconda di come queste proteine
vengono combinate.
trascrizione
La regolazione trascrizionale di un
gene è determinata da tanti
elementi diversi che possono
agire come:
- attivatori
- deboli attivatori
- repressori
e la loro presenza o assenza
correlata all’espressione o
all’attivazione, determinano la
probabilità dell’inizio della
[nel video il promotore viola è quello essenziale dove si lega TATA BOX
Lezione 12 “I fattori di trascrizione”
i general activator non sono i gtf, ma fattori presenti un po’ in molti tessuti]
L’attività di un gene può essere definita come un calcolo probabilistico:
• un gene molto attivo: alta probabilità di inizio della trascrizione
• un gene poco: bassa probabilità di inizio della trascrizione
Questo avviene perché sulle regioni regolatorie abbiamo diversi elementi regolatori CIS che regolano
ad esempio complessi di proteine debolmente attivatrici o fortemente attivatrici e complessi di
proteine fortemente inibitrici o debolmente inibitrici.
La presenza sul promotore di diverse combinazioni di tutti questi regolatori determinerà la
frequenza dell’inizio della trascrizione e quindi quanto un gene è attivo o meno.
Ciascuno dei nostri geni non ha solo conformazione OFF/ON ma possono avere tante gradazioni
diverse di espressione della propria attività (es. da 1 a 100).
Questo dipende dalla situazione sul promotore, che a sua volta dipende da tutti i segnali esterni che
arrivano alla cellula e che attivano, o meno, i diversi complessi di proteine regolatorie che si legano
alle regioni regolatorie del gene.
Come controllare gli attivatori e cosa regola la loro espressione o meno?
La regolazione dei geni dipende in parte dall’espressione o meno dei suoi attivatori, ma dipende
anche dal fatto che alcuni attivatori sono sempre presenti con la possibilità di essere attivati o meno
da segnali esterni alla cellula.
Controllo degli attivatori:
• Espressione tessuto-specifica o inducibile di fattori di trascrizione costitutivamente attivi: se il fattore
di trascrizione è presente agisce e viceversa.
• Attivazione o deattivazione di fattori di trascrizione attraverso diversi meccanismi che dipendono da
come funzionano i singoli fattori di trascrizione (es: che cosa determina la capacità di legare il DNA o
meno; che cosa determina la localizzazione cellulare nel nucleo). Abbiamo quindi una serie di
meccanismi di attivazione post-traduzionale di fattori inattivi tramite ad esempio fosforilazione.
• Diversi meccanismi che dipendono da come funzionano i singoli fattori di trascrizione.
• Regolazione della localizzazione cellulare di questi fattori tenendoli sequestrati nel citoplasma o
rilasciandoli nel nucleo.
• Attivazione mediata da ligando (es. ormoni steroidei). I recettori degli ormoni steroidei agiscono
interagendo con l’ormone (ligando) e dopo l’interazione con il ligando è in grado di attivare il fattore.
Lezione 13 “Controllo dei fattori di trascrizione”
CONTROLLO DEI FATTORI DI
TRASCRIZIONE
I fattori trascrizionali → attività non viene regolata a livello di espressione, ma in base alla loro
capacità di attivare
COME CONTROLLARE GLI ATTIVATORI
COME UNA CELLULA RISPONDE ALLA PRESENZA DI MEDIATORI
NELL’AMBIENTE ESTERNO
Abbiamo visto che l’attività dei fattori trascrizionali può essere controllata in base a dei segnali che
vengono dall’esterno della cellula.
Questi segnali devono essere captati dai recettori di membrana, che captano il segnale e lo
trasmettono all'interno della cellula tramite una serie di fosforilazioni.
Quando il dominio chinasico viene attivato dal
ligando, media la dimerizzazione del recettore
che si autofosforila su dei residui di tirosina che
fungono da siti di reclutamento per proteine che
contengono dei domini SH2 che poi innescano una
cascata di fosforilazioni, la cascata delle chinasi, che
culmina nella regolazione dell’attività dei fattori di
trascrizione.
Le risposte cellulari ai segnali sono alla fine delle
risposte trascrizionali.
Il segnale deve essere in grado di arrivare
dall’esterno della cellula al nucleo.
- polipeptidi idrofilici possono circolare nel
sangue senza problemi, ma non possono entrare
nella loro cellula, quindi non possono penetrare la
membrana plasmatica => la loro presenza deve
essere captata da recettori di superficie espresso
dalla cellula che sarà in grado di riconoscere la
molecola segnale. Il recettore ha una regione
transmembrana che sarà in grado di riconoscere il
segnale e interagire con il ligando; e una porzione
intracitoplasmatica che permette di trasferire il
segnale all’interno della cellula che si riverbera
sull’attività di fattori trascrizionali, e perciò sul
controllo dell’espressione genica. Questa quindi è
una funzione preposta per gli eventi di segnalazione
che potranno arrivare fino al nucleo
- se la molecola segnale è idrofobica (eg
ormoni steroidei) dovrà essere protetta per poter circolare nel sangue, ma a differenza del
peptide idrofilico sarà in grado di entrare nelle cellule senza recettore di membrana; tuttavia la
cellula avrà bisogno di un recettore che capta la presenza di questa cellula, che non sarà
Lezione 13 “Controllo dei fattori di trascrizione”
però transmembrana (perché l’ormone passa la membrana autonomamente), ma
intracellulare citoplasmatico (che capta l'ormone e ne regola l’attività trascrizionale).
ESEMPIO DI RECETTORI
Vengono illustrati quattroesempimoltoclassici.Questiesempisonointeressantiperchésonomolto
diffusi e regolano funzioni importanti nelle cellule e sono esemplificativi di come ogni fattore di
trascrizione viene regolato in modo diverso in base allastruttura,funzione,attivitàedaciòconcui
deve interagire.
FATTORE DI TRASCRIZIONE CREB: attivazione di un FT tramite fosforilazione del
suo dominio di attivazione
CREB (cyclic AMP response element-binding protein)
è un fattore trascrizionale che lega degli elementi sui
promotori che (prima di scoprire CREB) erano stati
identificati come essenziali per l’induzione dei geni a
valle dell’AMP ciclico.
Ci sono recettori a sette passi transmembrana che
agiscono stimolando la sintesi di AMP ciclico. Questi
recettori stimolati erano in grado di aumentare l’AMP
ciclico nella cellula e attivare una serie di geni a valle.
Studiando i promotori di questi geni a valle si è
scoperto che delle brevi sequenze su questi promotori
erano condivise dai diversi geni che venivano attivati
dall’AMP ciclico e si è andati in cerca di queste
sequenze che quando andavano eliminate o
mutagenizzate, il gene non rispondeva più all’AMP
ciclico. In cerca di quale fosse o fossero i fattori di
trascrizione che legavano questi elementi in grado di
attivare la trascrizione di questi geni si è scoperto
CREB, la cui capacità di attivare la trascrizione è
attivata da AMP ciclico.
Il fattore di trascrizione CREB viene attivato tramite
fosforilazione, in questo caso il segnale di attivazione
di CREB ha origine extracellulare; in particolare
ormoni come l’adrenalina interagiscono con recettori a 7 passi transmembrana che tipicamente
utilizzano le proteine G (recettore GPCR) e, in seguito, l’AMP ciclico come secondo messaggero.
Il legame dell’ormone con il suo recettore ne modifica la struttura citosolica in modo tale che dalla
proteina G si stacchi la subunità α, che si attiva legando GTP al posto del GDP; questa attiva
l’adenilato ciclasi transmembrana che una volta attivata enzimaticamente assume la capacità
di ciclizzare l’ATP trasformandolo in AMP ciclico.
L’ AMP ciclico andrà a regolare, non direttamente CREB, ma una chinasi, che poi sarà in grado di
fosforilare CREB, ovvero la PKA. La pKA è un tetramero, formato da 2 subunità enzimatiche
(chinasiche) e due subunità regolatorie, che complessandosi con le 2 subunità enzimatiche le rende
inattive. La PKA quindi è sempre presente nella cellula, ma è mantenuta inattiva dalle subunità
regolatorie. Nel nucleo uno dei target della PKA è CREB, infatti l’ AMP ciclico a questo punto si
complessa con le subunità regolatorie e ne cambia la conformazione e queste si staccano dalle
subunità catalitiche.
Lezione 13 “Controllo dei fattori di trascrizione”
Le subunità catalitiche potranno circolare e fosforilare i loro substrati e tra questi substrati nel nucleo
c’è CREB, che ha un dominio di attivazione della trascrizione destrutturato, e all’interno di questo
dominio è presente un aminoacido che può essere fosforilato.
(Scoperto perché quando si è iniziato a studiare signaling si è visto che si attivavano una serie di geni
con un sito di legame comune per una proteina).
In assenza di fosforilazione, il dominio di attivazione non è in grado di reclutare il suo coattivatore,
CBP, ma quando CREB viene fosforilato sul suo sito di attivazione diventa in grado di reclutare CBP,
che iperacetilerà gli istoni e permetterà alla trascrizione di cominciare.
La fosforilazione di Creb avviene a livello di una creolina, che è presente sul dominio di attivazione
che è in grado di reclutare coattivatore e quindi attivare la trascrizione.
La molecola segnale all’esterno, che può essere ad esempio un ormone, come l’adrenalina o altri tipi
di fattori, è in grado di attivare CREB grazie a questa catena di eventi che sono comunque sempre
basati sulla struttura proteica del recettore che cambia, lo rende in grado di attivare la proteina G, che
a sua volta attiva l’adenilato ciclasi cambiandone la struttura.
CREB può essere attivato in questo modo solo perché il suo dominio di attivazione è fatto in modo
tale da poter interagire con alta affinità con il CBP quando è fosforilato e non interagire con niente
quando non è fosforilato; e ovviamente grazie al fatto che sul sito di fosforilazione che è il bersaglio
della PKA, non sarà solo l’aminoacido fosforilabile, ma la sequenza a monte e a valle è un sito
bersaglio per la PKA.
LA VIA DI SEGNALAZIONE JAK/STAT: attivazione tramite modificazione post
traduzionale
Anche in questo caso si ha una fosforilazione del fattore di trascrizione che risulta nella sua
attivazione, ma questa fosforilazione non determina un cambiamento del dominio di
attivazione, come nel caso di CREB, bensì determina la capacità del fattore sia di formare un
dimero sia di migrare nel nucleo per espletare la sua funzione.
Questa via di segnalazione è la via principale delle citochine.
La via di segnalazione
JAK/STAT è una via della
segnalazione che viene
attivata da tutte le citochine,
in modo diverso a seconda
dei loro recettori. I recettori
non hanno attività chinasica,
ovvero enzimatica,
intrinseca (quindi quando
sono fosforilati non si
attivano); caratteristica
totalmente opposta rispetto
ai fattori di crescita (come i
recettori delle IGF).
Ma quando arriva la
citochina, questa media la
dimerizzazione del
recettore, avviando una
cascata di eventi di
fosforilazione su tirosina
molto simile a quella prodotta sui fattori di crescita, grazie alle Jak. I recettori infatti interagiscono in
modo costitutivo con delle Jak chinasi: 4 diverse chinasi (JAK1, JAK2, JAK3 e TYK2).
Quando non c’è la citochina, le chinasi sono inattive, e il recettore è fosforilato.
Lezione 13 “Controllo dei fattori di trascrizione”
La citochina media la dimerizzazione del recettore, la JAK chinasi in vicinanza si attiva ed è in grado
di fosforilare residui di tirosina specifici che portano il sito di riconoscimento per la JAK chinasi sulla
porzione citoplasmatica del recettore in modo analogo alla IGF receptor. Questi fattori, a cui le
fosfotirosine agiscono da siti di binding, sono i fattori di trascrizione STAT (signal transducer and
activator of transcription). Gli STAT hanno un dominio SH2 che renderà specifiche STAT in grado di
interagire con specifici recettori.
Gli STAT trasducono il segnale, lo raccolgono a livello della membrana e lo portano direttamente al
nucleo, attivando i suoi geni bersaglio. Non usano quindi un secondo messaggero, ma viene attivato
direttamente lo STAT che va nel nucleo per attivare la trascrizione.
Lo STAT reclutato dal recettore arriva in prossimità della JAK chinasi attivata e quindi viene a sua
volta fosforilato, perché i fattori STAT non hanno solo il dominio SH2, ma hanno anche una tirosina,
che può essere fosforilata dalle JAK chinasi.
La fosforilazione è in grado di mediare la dimerizzazione dei fattori STA fosforilati, per cui:
fattori stat fosforilati => si attivano => dimerizzano fra loro x interazione reciproca del dominio => si
allontanano dal recettore
Le fosfotirosine interagiscono con il dominio SH2: se un fattore ha sia un dominio SH2, sia una
fosfotirosina, potrà dimerizzare con un secondo fattore uguale o comunque con domini SH2
fosfotirosinici compatibili.
I fattori STAT fosforilati si staccano dal recettore per formare dei dimeri in cui il dominio SH2 di uno
interagisce con la fosfotirosina dell’altro e viceversa.
Questa dimerizzazione rende il fattore in grado di legarsi al DNA: infatti i fattori STAT sono dimeri
obbligati e quando non sono fosforilati sono monomerici e quindi inattivi.
C’è però il problema della localizzazione citoplasmatica o nucleare: i fattori STAT inattivi, per poter
cogliere il segnale a livello del recettore, devono stare nel citoplasma, perché nel nucleo non
andranno mai in contatto con il recettore; allo stesso tempo, per attirare la trascrizione, devono però
andare nel nucleo. Ma, grazie alla dimerizzazione, i fattori STAT hanno sia un dominio di
localizzazione nucleare, che un dominio di esporto nucleare (vedi nel trasporto attivo e passivo della
de Filippi).
Nelle cellule non stimolate, in assenza di citochine, i fattori STAT fanno continuamente avanti e
indietro citoplasma-nucleo e viceversa, perché nessuno dei due domini è più forte dell’altro.
Una volta avvenuta la segnalazione citochinica, avvengono la fosforilazione e la dimerizzazione e si
maschera il dominio di esporto nucleare; quindi, ci sarà solo più il dominio di importazione nucleare.
Gli STAT si concentreranno tutti nel nucleo in tempi molto brevi (30-60 s) e se da monomerici non
possono legare il dna, ora che sono chimerici sì. Quando vengono fosforilati infatti è stimolato il loro
accumulo nel nucleo e attivata la loro capacità di legare il DNA.
Una volta che si lega al DNA, STAT si comporta come i fattori di trascrizione; quindi, il dominio
di attivazione recluterà i co-attivatori e attiverà la trascrizione dei geni. Anche in questo caso si verifica
un evento di fosforilazione, ma diverso da CREB, perché non avviene una cascata di eventi, ma ci
sono due fosforilazioni mediate dalla stessa chinasi, che interagisce con il recettore. Questo
meccanismo di attivazione è possibile soltanto per la struttura e il modo di funzionamento degli STAT,
che devono essere dimerici sia per entrare nel nucleo, che per attivare la trascrizione.
FATTORI DI TRASCRIZIONE NF-kB: localizzazione cellulare
In questo esempio un evento di fosforilazione regola l’attività di un fattore trascrizionale dove,
a essere fosforilato non è il fattore stesso, ma è una proteinacheinteragisceconquestofattoree
funge da inibitore del fattore di trascrizione in questione: NF-kB.
NF-kB fa parte di una via di segnalazione molto importantechevieneattivatadanumerosisegnali
diversi, come l'infezione virale, diverse citochine infiammatorie, eventi infiammatori o anche raggi
ultravioletti.Èilfattoretipicodeglieventidell'infiammazioneedell'attivazionedelsistemaimmunitario,
inoltre controlla l’espressione dei geni che codificano per le citochine infiammatorie.
Hamoltissimigenibersaglioelasuaattivitàèregolatainmoltimodidiversieadiversipassaggi,tutti
regolabili, ma c'è un meccanismo centrale che lo rende attivo o meno.
Lezione 13 “Controllo dei fattori di trascrizione”
Regolazione della localizzazione nucleare del fattore di trascrizione NF-kB mediante
fosforilazione di un suo inibitore
- Via di segnalazione molto importante, attivata da numerosi segnali diversi
- Moltissimi geni bersaglio
- Regolatore centrale delle risposte cellulari a STRESS e INFIAMMATORIE
- Il controllo della sua attivita’ avviene con diversi passaggi, tutti regolabili
NF.KB (anche detto RelA) è un eterodimero; esistono diverse forme dei diversi monomeri, ma la
forma preponderante è formata da due proteine tra p65 e p50. L’eterodimero può essere formato
invece, ad esempio, da p50 con IKB. Infatti in assenza di citochina, NF-kB inattivo si trova
sotto forma di eterodimero e interagisce con un'altra proteina detta IkB (inibitore di NF-kB),
che lo mantiene ancorato nel citoplasma.
Questo complesso impedisce a NF-kB di attivare la trascrizione, perché farlo dovrebbe trovarsi nel
nucleo. Per permettere a NF-kB di andare nel nucleo, questa interazione con IkB deve essere
rilasciata in modo controllato. Questo avviene quando tutti i segnali che ne portano all'attivazione,
come stress, infezione e citochine, vanno ad attivare una famiglia di chinasi dette IKK (chinasi che
fosforilano IkB). Quindi, a essere fosforilato non sarà NF-kB, ma IkB, il suo l'inibitore.
IkB fosforilato viene ubiquitinato e degradato tramite l'attività del proteasoma. Questo lascia
libero NF-kB, che ha un forte segnale di localizzazione nucleare, prima mascherato e reso
inattivo dall'interazione con IkB.
A questo punto NF-kB si concentra tutto nel nucleo e si può legare ai promotori che portano i
siti di riconoscimento per questo fattore e attivarne la trascrizione.
Questo tipo di regolazione ha insito un meccanismo di freno, ovvero un meccanismo di feedback
negativo che consiste nel fatto che uno dei primi bersagli di NF-bB è IkB stesso.
Quando NF-kB è attivato, induce la trascrizione e l'espressione del suo inibitore; quando IkB viene
trascritto e poi tradotto, è in
grado di andare a legare nel
nucleo e caricarsi di NF-kB e
lo riporta fuori nel
citoplasma.
Ci sono poi anche altri
meccanismi che rendono
questo meccanismo
modulabile, non è sempre o
tutto o niente, ma questo
meccanismo di feedback
negativo è molto importante:
se non ci fosse questa
attività, NF-kB, una volta
attivato, continuerebbe ad
agire per diverso tempo.
Essendo la sua, un'attività
necessaria ma potenzialmente tossica per le cellule dell'organismo, deve essere tenuta a freno. In
questo esempio quindi, il fattore non cambia; quello che cambia è la presenza o meno del
suo inibitore, la cui sintesi è regolata da NF-kB stesso
Lezione 13 “Controllo dei fattori di trascrizione”
Controllo combinatoriale dell’espressione genica: si avvale anche del fatto che multipli segnali
possono attivare lo stesso fattore di trascrizione.
Diversi complessi IKK possono
essere attivati da molti fattori e tutti i segnali
possono convergere sull’attivazione di IKK
portando alla fosforilazione di IkB, che ne
determina l’ubiquitinazione e la degradazione
tramite proteasoma e permettendo a NF-kB di
migrare nel nucleo e attivare la trascrizione.
Questo controllo evita che l’attivazione diventi
cronica, ovvero una continua attivazione di
NF-kB che porta a conseguenze patologiche,
e che rimanga acuta.
In generale, come già citato per STAT, le
risposte ai mediatori portano a conseguenze
patologiche nel momento in cui il segnale non
viene spento e l’attivazione diventa cronica.
ATTIVAZIONE DIRETTAMENTE MEDIATA DA LIGANDO (ORMONI STEROIDEI) →
recettori nucleari
L'ultimo esempio mostrato è quello degli ormoni steroidei, i quali mediano direttamente l'attività dei
loro recettori, che sono intracellulari e sono direttamente dei fattori di trascrizione la cui struttura verrà
alterata dall'interazione con il ligando per renderli attivi. Alcuni di questi ormoni steroidei possono
essere colesterolo, estradiolo, testosterone, tiroxina (ormone tiroideo), vitamina D3…
●
molecolesegnale idrofobiche come l’ormone tiroideo,queste molecole hanno in comune il
fatto di:
○ essere piccole e idrofobiche
○ no recettore di membrana, sì recettore intracellulare
○ struttura comprende:
■ un dominio di legame a DNA centrale
■ dominio carbossi terminale → attacco del ligando (è quindi il dominio di
interazione con il ligando e ha la capacità di riconoscerlo e complessarlo)
■ varie lunghezze peptidiche alla porzione ammino terminale, che rappresenta
il dominio di attivazione della trascrizione
● Nel caso, ad esempio, del recettore della vitamina D, dell'ormone
tiroideo, o dell'acido retinoico sono presenti dei domini
ammino-terminali molto corti, privi della capacità di funzionare come
Lezione 13 “Controllo dei fattori di trascrizione”
domini di attivazione, quindi questi fattori funzioneranno come dei
repressori.
● Mentre per esempio il recettore del cortisolo, dell'estrogeno, del
progesterone o del testosterone hanno di domini amminoterminali
che contengono il dominio di attivazione della trascrizione
○ Quando non è presente il ligando, quest’ultimo dominio ha una conformazione aperta
in cui c'è una protrusione che sporge e che interagisce con una proteina inibitrice.
○ In queste condizioni il recettore è inattivo: sia perché non è in grado di attivare, sia
perché viene trattenuto nel citoplasma da un inibitore. Quindi quando è inattivo, il
recettore interagisce con una proteina inibitrice che lo mantiene inattivo nel
citoplasma.
Il ligando, quando arriva, viene complessato nel dominio di attacco, facendo richiudere la protrusione
che reagiva con l'inibitore e questo permette al recettore di migrare nel nucleo e di legare al DNA,
perché l'inibitore interferiva anche con il dominio di legame al DNA, e attivare la trascrizione.
A questo punto possono essere presenti addirittura due domini di attivazione, perché il dominio di
attacco del ligando complessato con il ligando funziona da dominio di attivazione, cooperando con il
dominio di attivazione all'ammino terminale e reclutando a sua volta proteine coattivatrici.
Sono illustrati il dominio di
legame al DNA e il dominio di
interazione con il ligando, che
è formato tre piccole eliche più
un'elica separata al carbossi
terminale. In assenza del
ligando, l'elica al carbossi
terminale non interagisce con
le altre tre piccole eliche e
quindi rimane sporgente e in
questo modo può interagire
con il repressore. Quando
arriva il ligando, questo entra
nell'ansa e viene coordinato
interagendo con l'estremità
carbossi terminale e facendola
richiudere, in questo modo
l'estremità non può più
interagire con l'inibitore e
quindi il fattore risulta attivato.
Modello dell’attivazione genica dipendente da ormone da parte del recettore per i glucocorticoidi →
attivazione e localizzazione nucleare mediata da ligando (es ormoni steroidei)
- p90 = chaperonina →
espressione indotta da heat shock
(esposizione sopra 37°C per uomo)
perché c’è più bisogno di chaperonine per
far ripiegare meglio le proteine quando la
T è alta
Mantengono represso il recettore per i
glucocorticoidi, che rilascia le p90,
permettendo di attivare il dna ecc
Lezione 13 “Controllo dei fattori di trascrizione”
Il dominio di interazione conilligandointeragisceconl'inibitore,cheinquestocasoèHsp90(heat
shockprotein90),cioèunaproteinachaperonchevieneattivataquandoc'èunoshockalcalore,per
aiutareamantenereleproteinenellaloroconformazione.LeHsphannoanchedellealtrefunzioni,tra
cui appunto quella di agire da inibitori dei recettori degli ormoni steroidei.
Il recettore dei glucocorticoidi interagisce con il dominio di interazioneperilligandoelaproteinaè
liberadiandarenelnucleo,legareconilDNAeattivarelatrascrizione,seèfornitadelsitodilegame
per il nucleo.
IdominidilegamealDNAequellidiattivazionepossonofunzionareindipendentementeunodall’altro
e questo è vero anche per i domini di interazione con il ligando.
Si può prendere il dominio di interazione con il ligando del recettore per i glucocorticoidi, per
gliestrogeni,periltestosterone,perilprogesterone…eattaccarloaun'altraproteinaequestoagirà
da inibitore dipendente dall'ormone, dipendente dal ligando anche su quest'altra proteina.
Questometodoèstatoutilizzatomoltofrequentementealivellosperimentaleperregolarel'attivitàdei
fattori di trascrizione espressi nelle cellule e studiati per la loro attività, ma anche per approcci di
terapia genica in cui il transgene viene regolato dal ligando.
MODIFICAZIONI CO-TRASCRIZIONALI E
POST-TRASCRIZIONALI DELL’RNA
gtp non è legato con legame fosfodiesterico, ma funziona grazie a proteine che formano il cap binding
proteins e proteggono il 5’ dalla degradazione.
coda di poliA serve a far avvenire una traduzione efficiente.La lunghezza del poliA determina l’emivita
dell’mRNA.
Tutti e tre processi (cappuccio, poliA e splicing) sono interconnessi e avvengono
co-trascrizionalmente
Lezione 13 “Controllo dei fattori di trascrizione”
L’ultimo GTF a essere reclutato x i fattori di inizio della trascrizione è TFIIH e ha un’attività chinasica
che fosforila una parte precisa del carbonio terminale della RNA pol II, formato da due serine: una in
posizione 5’ e una in posizione 2’
Il GTH fosforila sulla serina 5. → La TFIIH avviene in posizione 5
è il CTD non fosforilato che interagisce con il mediatore, che dopo un paio di trascrizioni poi si ferma.
La fosforilazione lo fa staccare.
La polimerasi è asimmetrica, l’RNA nascente si trova adiacente al dominio carbossi terminale che
quando è fosforilato su serina 5 recluta gli enzimi preposti ad aggiungere il cappuccio. L’aggiunta del
cappuccio avviene praticamente immediatamente.
L’aggiunta del cap avviene con-trascrizionalmente.
Lezione 13 “Controllo dei fattori di trascrizione”
Il CTD continua ad agire da forma per la maturazione coordinata dell’mRNA.
Si avrà un cap fosforilato sia su serina 5 che su serina 2 e crea un nuovo sito di interazione che
recluta le proteine dello splicing.
Il sito accettore che sta al 5’ e emerge dal sito attivo della polimerasi, le proteine che trovano il sito
donatore ci saltano sopra e può avvenire lo splicing.
Successivamente un secondo fattore di elongazione viene a defosforilare la serina 5.
La trascrizione termina quando viene tagliato a valle del sito di poliadenilazione. L’RNA polimerasi
continua a trascrivere, fino a che quando si accorge di non avere nulla dietro, si stacca.
Lezione 13 “Controllo dei fattori di trascrizione”
Lezione 13 “Controllo dei fattori di trascrizione”
Lezione 13 “Controllo dei fattori di trascrizione”
- durante lo splicing si accumulano dei complessi proteici nei siti dove è avvenuto lo splicing,
quindi la fusione tra i due esoni
- ALY è riconosciuto dalla proteina TAP che è un recettore x il poro nucleare, una volta che è
avvenuta l’interazione con ALY
- rna trasportato nel citoplasma, una serie di proteine che formano gli HNRNP cadono
dall’mRNA e rimangono nel nucleo.
- EIF4E reagisce con il cap, EIF4G interagisce con EIF4E e rimangono complessi di giunzione
esonica
- il loro compito di EIF4E e EIF4G è quello di circolarizzare l’RNA
Quindi:
Una volta nel citoplasma, il Cap Binding Complex viene sostituito dai fattori di inzio elF4G e elF4E
Questi, interagendo con le poli-A Binding Proteins, circolarizzano l’mRNA, necessario perche’ la
traduzione avvenga efficientemente.
Il complesso di giunzione esonica (EJC) rimane sull’mRNA fino a che non passa per la prima volta il
ribosoma, e infatti verra’ scalzato dal ribosoma
Lezione 13 “Controllo dei fattori di trascrizione”
-
le mutazioni che inseriscono un codone di stop sono “non senso”
-
può essere causato sia da mutazioni non senso che da eventi aberranti di splicing
motivazioni (???)
- quando un introne non viene exciso, nel giro di circa 60 basi si presenterà un codone
di stop che potrà scatenare il nonsense mediate ligate
- se lo splicing avviene normalmente i complessi verrano rimossi dal ribosoma e la
proteina sopravvive; se invece il primo introne non viene exciso, allora il complesso si
Lezione 13 “Controllo dei fattori di trascrizione”
ferma e non potrà essere rimosso dal ribosoma perché sarà rimosso dal codone di
stop
FATTORE CREB
Il fattore di trascrizione CREB viene attivato tramite fosforilazione, in questo caso il segnale di
attivazione di CREB ha origine extracellulare; in particolare ormoni come l’adrenalina interagiscono
con recettori a 7 passi transmembrana che tipicamente utilizzano le proteine G (recettore GPCR) e, in
seguito, l’AMP ciclico come secondo messaggero. Il legame dell’ormone con il suo recettore ne
modifica la struttura citosolica in modo tale che dalla proteina G si stacchi la subunità α, che si attiva
legando GTP al posto del GDP; questa attiva l’adenilato ciclasi transmembrana che una volta attivata
enzimaticamente assume la capacità di ciclizzare l’ATP trasformandolo in AMP ciclico. L’ AMP ciclico
andrà a regolare, non direttamente CREB, ma una chinasi, che poi sarà in grado di fosforilare CREB,
ovvero la PKA. a pKA è un tetramero, formato da 2 subunità enzimatiche (chinasiche) e due
subunità regolatorie, che complessandosi con le 2 subunità enzimatiche le rende inattive. L'AMP
ciclico a questo punto si complessa con le subunità regolatorie e ne cambia la conformazione e
queste si staccano dalle subunità catalitiche. Le subunità catalitiche potranno circolare e fosforilare i
loro substrati, tra cui CREB che quando viene fosforilato, sul suo sito di attivazione diventa in grado di
reclutare CBP, che iperacetilerà gli istoni e permetterà alla trascrizione di cominciare.
FATTORE STAT
La citochina media la dimerizzazione del recettore, la JAK chinasi in vicinanza si attiva ed è in grado
di fosforilare residui di tirosina specifici che portano il sito di riconoscimento per la JAK chinasi sulla
porzione citoplasmatica del recettore in modo analogo alla IGF receptor. Questi fattori, a cui le
fosfotirosine agiscono da siti di binding, sono i fattori di trascrizione STAT (signal transducer and
Lezione 13 “Controllo dei fattori di trascrizione”
activator of transcription). Gli STAT hanno un dominio SH2 che renderà specifiche STAT in grado di
interagire con specifici recettori.
Gli STAT trasducono il segnale, lo raccolgono a livello della membrana e lo portano direttamente al
nucleo, attivando i suoi geni bersaglio. Non usano quindi un secondo messaggero, ma viene attivato
direttamente lo STAT che va nel nucleo per attivare la trascrizione.
I fattori STAT fosforilati si staccano dal recettore per formare dei dimeri in cui il dominio SH2 di uno
interagisce con la fosfotirosina dell’altro e viceversa.
Questa dimerizzazione rende il fattore in grado di legarsi al DNA: infatti i fattori STAT sono dimeri
obbligati e quando non sono fosforilati sono monomerici e quindi inattivi. Una volta che si lega al
DNA, STAT si comporta come i fattori di trascrizione; quindi, il dominio di attivazione recluterà i
co-attivatori e attiverà la trascrizione dei geni
FATTORI NF-kB
Il complesso IKB impedisce a NF-kB di attivare la trascrizione, perché farlo dovrebbe trovarsi nel
nucleo. Per permettere a NF-kB di andare nel nucleo, questa interazione con IkB deve essere
rilasciata in modo controllato. Questo avviene quando tutti i segnali che ne portano all'attivazione,
come stress, infezione e citochine, vanno ad attivare una famiglia di chinasi dette IKK (chinasi che
fosforilano IkB). Quindi, a essere fosforilato sarà IkB.
IkB fosforilato viene ubiquitinato e degradato tramite l'attività del proteasoma. Questo lascia
libero NF-kB, che ha un forte segnale di localizzazione nucleare, prima mascherato e reso
inattivo dall'interazione con IkB.
A questo punto NF-kB si concentra tutto nel nucleo e si può legare ai promotori che portano i
siti di riconoscimento per questo fattore e attivarne la trascrizione.
RECETTORI NUCLEARI PER GLI ORMONI STEROIDEI
Si trovano nel citoplasma, sono intracellulari e interagiscono direttamente con il ligando. La sua
struttura comprende:
- un dominio di legame a DNA centrale
- varie lunghezze peptidiche alla porzione ammino terminale, che rappresenta il dominio di attivazione
della trascrizione
- dominio carbossi terminale → attacco del ligando (è quindi il dominio di interazione con il ligando e
ha la capacità di riconoscerlo e complessarlo)
Quando non è presente il ligando, quest’ultimo dominio ha una conformazione aperta in cui c'è una
protrusione che sporge e che interagisce con una proteina inibitrice. In queste condizioni il recettore è
inattivo: sia perché non è in grado di attivare, sia perché viene trattenuto nel citoplasma da un
inibitore. Quindi quando è inattivo, il recettore interagisce con una proteina inibitrice che lo mantiene
inattivo nel citoplasma.
Il ligando, quando arriva, viene complessato nel dominio di attacco, facendo richiudere la protrusione
che reagiva con l'inibitore e questo permette al recettore di migrare nel nucleo e di legare al DNA,
perché l'inibitore interferiva anche con il dominio di legame al DNA, e attivare la trascrizione.
A questo punto possono essere presenti addirittura due domini di attivazione, perché il dominio di
attacco del ligando complessato con il ligando funziona da dominio di attivazione, cooperando con il
dominio di attivazione all'ammino terminale e reclutando a sua volta proteine coattivatrici.
Lezione 13 “Controllo dei fattori di trascrizione”
IL CTD fa da piattaforma di coordinazione per l’inizio della trascrizione tramite l’interazione con altre
proteine, che cambiano a seconda dello stato di fosforilazione del CTD stesso.
Il CTD non fosforilato interagisce con il mediatore che media l’inizio della trascrizione; il CTD
fosforilato da TFIIH su serina 5 permette il distacco dal mediatore e il reclutamento degli enzimi del
capping, si viene a formare quindi il cappuccio e il cap binding complex (CBC).
Se la serina 5 serve a rilasciare i fattori del capping, una volta che questo si è formato la serina 2
recluta i fattori dello splicing, che verranno depositati sul sito accettore donatore di splicing, appena
questi usciranno dal sito attivo. Successivamente al capping infatti altri fattori di elongazione
fosforileranno la serina 2 reclutando i fattori dello splicing e defosforileranno la serina 5, rilasciando i
fattori dello splicing e reclutando i fattori della maturazione 3', che sono in grado di tagliare l'mRNA,
riconoscono una delle sequenze di poliadeninazione e tagliano in mezzo a queste sequenze dove poi
arriva la poli-A polimerasi.
La RNA polimerasi smette di agire perché si trova fuori dal sito attivo. Il 5’ dell’RNA nascente non ha il
cappuccio e non avendo il cappuccio viene degradato. Questa degradazione manda un segnale alla
polimerasi che smette di sintetizzare e si ha la terminazione del trascritto.
La ragione per cui tutto il processo è possibile è data dal fatto che il canale di uscita dell’RNA è
adiacente a dove si trova il CTD e quindi le proteine che sono state reclutate sul CTD possono
facilmente riconoscere il 5’, il sito accettore e donatore di splicing, il sito di poliadenilazione ed essere
così depositate al posto giusto e nel momento giusto.
è un meccanismo di sorveglianza di qualità degli mRNA, per cui gli mRNA che hanno avuto un
qualsiasi difetto durante il processo di splicing, essendo instabili, vengono degradati nel citoplasma,
evitando che vengano tradotti, e permettendo che vengano esportati solo gli RNA maturati in modo
corretto.
Il PoliA viene continuamente accorciato da quando l'mRNA si trova nel citoplasma, fino a quando il
fattore EIF4G non riesce più a mediare la circolarizzazione interagendo con le PoliA. Quando l'mRNA
non è più circolarizzato non può più essere tradotto e quindi viene degradato.