12.04.2015 Views

1 Il sequenziamento del DNA - Emidioalbertini.com

1 Il sequenziamento del DNA - Emidioalbertini.com

1 Il sequenziamento del DNA - Emidioalbertini.com

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Il</strong> <strong>sequenziamento</strong> <strong>del</strong> <strong>DNA</strong><br />

Si può ottenere la massima informazione sulla struttura di una<br />

molecola di <strong>DNA</strong> determinandone la sequenza nucleotidica <strong>com</strong>pleta<br />

<strong>Il</strong> <strong>sequenziamento</strong> <strong>del</strong> <strong>DNA</strong> è una <strong>com</strong>ponente irrinunciabile di<br />

praticamente qualunque tecnica di manipolazione genica<br />

Determinare la sequenza di una particolare regione di <strong>DNA</strong> può<br />

rappresentare un fine già di per sé (ad esempio se si voglia<br />

studiare una mutazione ereditaria)<br />

Ancora più importante è il fatto che le informazioni ottenute tramite<br />

il <strong>sequenziamento</strong> sono la base indispensabile per la messa in atto<br />

di qualsiasi procedura di manipolazione <strong>del</strong> <strong>DNA</strong><br />

La conoscenza <strong>del</strong>le proprietà chimico-fisiche degli acidi nucleici ha<br />

reso possibile la messa a punto di due tecniche per la determinazione<br />

<strong>del</strong>la sequenza <strong>del</strong> <strong>DNA</strong><br />

L’obiettivo principale <strong>del</strong>la maggior parte dei progetti <strong>del</strong> genoma èdi<br />

determinare la sequenza <strong>del</strong> <strong>DNA</strong> <strong>del</strong>l’intero genoma o quella di un<br />

numero elevato di trascritti<br />

Progetti di <strong>sequenziamento</strong> <strong>com</strong>pleto <strong>del</strong> genoma<br />

Microrganismi – organuli >600 virus, >10 archaea, >50 batteri e diversi<br />

viroidi, plasmidi, e 24 genomi di organuli (<strong>com</strong>pleti) – S. cerevisiae (<strong>com</strong>pleto)<br />

Animali<br />

Piante superiori<br />

Choenorhabditis elegans (in corso)<br />

Drosophyla melanogaster (in corso)<br />

Mus musculus (<strong>com</strong>pleto)<br />

Homo sapiens (<strong>com</strong>pleto)<br />

Arabidopsis thaliana (<strong>com</strong>pleto)<br />

Oryza sativa (<strong>com</strong>pleto)<br />

Medicago truncatula (in corso)<br />

1


Le prime procedura per il <strong>sequenziamento</strong> <strong>del</strong> <strong>DNA</strong> vennero messe a<br />

punto da Maxam e Gilbert nel 1977<br />

Basato sul trattamento con reagenti chimici capaci di degradare una<br />

molecola di <strong>DNA</strong> in corrispondenza di specifici nucelotidi<br />

Nel 1981 Sanger e collaboratori:<br />

Metodo Sanger o metodo dideossi<br />

Basato sulla sintesi enzimatica di molecole di <strong>DNA</strong> che terminano in<br />

corrispondenza di specifici nucelotidi<br />

Per entrambi i metodi la visualizzazione <strong>del</strong>la sequenza avviene per<br />

elettroforesi in gel ad altissima risoluzione (si devono separare<br />

frammenti che differiscono per un singolo nucleotide)<br />

L’idea che sta alla base <strong>del</strong> metodo Sanger è di<br />

produrre tutte le possibili molecole di <strong>DNA</strong> a filamento singolo,<br />

<strong>com</strong>plementari a una sequenza stampo, che inizia con una base e che<br />

si estende fino a una di stanza di 1 kb in direzione 3’.<br />

Reazione di polimerizzazione che si arresta specificamente dopo ogni G<br />

oppure dopo ogni A o T o C.<br />

L’arresto specifico si ottiene aggiungendo alla reazione di<br />

polimerizzazione dei dideossinucleotidi trifosfati (ddNTP)<br />

2


In pratica si parte da una popolazione numerosa di molecole di <strong>DNA</strong><br />

identiche ottenute per amplificazione enzimatica o batterica (E. coli)<br />

Prevede l’uso di un primer <strong>com</strong>plementare ad una sequenza terminale<br />

<strong>del</strong> frammento prodotto per PCR o ad una sequenza <strong>del</strong> <strong>DNA</strong><br />

plasmidico adiacente al frammento clonato da sequenziare<br />

La reazione è catalizzata dalla <strong>DNA</strong> polimersai in direzione 5’-3’ a<br />

partire dall’ossidrile contenuto nel primer e richiede i 4 nucleotidi<br />

(dATP, dTTP, dCTP, dGTP) <strong>com</strong>e precursori<br />

<strong>Il</strong> <strong>sequenziamento</strong> necessita anche di uno stampo di <strong>DNA</strong> e 4 differenti<br />

reazioni di sintesi in ciascuna <strong>del</strong>le quali c’è un diverso ddNTP<br />

Sic<strong>com</strong>e la <strong>DNA</strong> polimerasi non è in grado di discriminare tra il ddNTP<br />

e il corrispondente dNTP ognuno dei possibili nucleotidi può essere<br />

inserito nella catena di <strong>DNA</strong> in allungamento<br />

3


La separazione <strong>del</strong>le molecole in base alle loro<br />

dimensioni, ottenuta tramite elettroforesi, origina una<br />

serie di bande, ciascuna <strong>del</strong>le quali corrisponde a una<br />

classe di molecole che differisce per un nucleotide in<br />

più rispetto alla banda successiva<br />

Perché non ci sono due o più frammenti di una<br />

determinata lunghezza?<br />

Perchè il primer utilizzato è <strong>com</strong>plementare soltanto<br />

alla sequenza che ci interessa<br />

(è progettato in modo da essere specifico)<br />

Direzione elettroforesi<br />

Direzione lettura<br />

A T C G<br />

4


Risultato <strong>del</strong>la corsa elettroforetica di un <strong>sequenziamento</strong><br />

Evoluzione <strong>del</strong>la tecnica<br />

Primers marcati con fluorocromi differenti<br />

ddATP<br />

ddCTP<br />

ddGTP<br />

A<br />

AC<br />

ACG<br />

ddTTP<br />

ACGT<br />

Le 4 reazioni possono “correre” insieme<br />

5


Terminatori marcati<br />

ddATP<br />

ddCTP<br />

ddGTP<br />

A<br />

AC<br />

ACG<br />

ddTTP<br />

ACGT<br />

PCR<br />

Incorporazione dei terminatori marcati<br />

denaturazione<br />

appaiamento<br />

Miscela di reazione<br />

A C G T<br />

A C G T<br />

Prodotti marcati<br />

A<br />

C<br />

G<br />

T<br />

A<br />

estensione<br />

A C G T<br />

G<br />

A C G T<br />

6


CCD Camera<br />

Laser<br />

Scanner<br />

Plates with acrylamide gel<br />

Elettroforesi capillare<br />

capillare<br />

Laser<br />

Camera CCD<br />

Buffer<br />

+ _<br />

7


CCD (Chip Colour Detection) camera<br />

Lettura dei tracciati<br />

La lettura dei tracciati grezzi (non elaborati) viene anche detta<br />

identificazione <strong>del</strong>le basi (base-calling) è oggi effettuata tramite<br />

software che leggono automaticamente le basi, allinea le sequenze simili<br />

e fornisce una base intuitiva per la correzione di bozze (editing)<br />

8


Mentre leggono i tracciati, i software assegnano punteggi di probabilità<br />

all’accuratezza di identificazione di ciascuna base e<br />

le informazioni ottenute vengono usate nei passaggi successivi <strong>del</strong>la<br />

procedura di allineamento<br />

errori<br />

Gli errori di <strong>sequenziamento</strong> possono essere provocati da<br />

problemi molto frequenti:<br />

Le prime 50 basi di una lettura sono indistinguibili dal<br />

rumore di fondo<br />

a causa <strong>del</strong>la migrazione anomala di brevi frammenti di<br />

<strong>DNA</strong> che contengono agglomerati di coloranti<br />

9


errori<br />

Inoltre i tracciati diventano progressivamente meno<br />

uniformi con l’avanzare <strong>del</strong>la corsa: aumentano gli effetti<br />

<strong>del</strong>la diffusione molecolare e contemporaneamente<br />

diminuiscono le differenze relative di massa tra frammenti<br />

successivi<br />

Assemblaggio dei contig<br />

Lo stadio di rifinitura nel <strong>sequenziamento</strong> di un tratto di<br />

<strong>DNA</strong> più lungo di un singolo clone <strong>com</strong>prende<br />

l’allineamento, il controllo e la correzione degli errori<br />

Questi passaggi sono in genere eseguiti con software di<br />

controllo <strong>del</strong>le sequenze (esempio il pacchetto Vector NTI)<br />

Le caratteristiche fondamentali sono:<br />

1 - La capacità di visualizzare i tracciati di sequenze<br />

<strong>com</strong>parate tra di loro, di navigare tra di essi e segnalare<br />

con precisione le ambiguità<br />

(Conting express)<br />

10


2 – una visibilità facile e immediata <strong>del</strong> filamento<br />

<strong>com</strong>plementare<br />

3 – gli strumenti per correggere manualmente la<br />

sequenza, <strong>com</strong>e ad es. la possibilità di inserire o eliminare<br />

basi senza alterare in modo significativo i file dei tracciati<br />

originali<br />

4 – la capacità di individuare eventuali siti polimorfici<br />

11


<strong>Il</strong> software produce, quindi, un’interfaccia grafica che<br />

permette di richiamare e correggere in maniera interattiva<br />

le singole letture di contig<br />

<strong>Il</strong> <strong>com</strong>pito finale di un programma di controllo <strong>del</strong>le<br />

sequenze è di aiutare a risolvere le lacune e le ambiguità<br />

12


We sequenced 6 colonies for each RACE experiments<br />

We aligned the sequences by using the software VECTOR NTI<br />

The coding regions were mostly similar<br />

But…<br />

..the 5’ and 3’ UTRs of some colonies were different<br />

This let us believe that for some genes we obtained<br />

more alleles at the same time<br />

13


Also intriguing was the fact that the few differences<br />

were at the restriction sites of fragments...<br />

Mse-I<br />

Restriction site<br />

Sequenziamento <strong>del</strong> genoma<br />

Le sequenze dei cromosomi interi vengono ricostruite a<br />

partire dalle sequenze di centinaia di migliaia di frammenti di<br />

<strong>DNA</strong>, normalmente di lunghezza <strong>com</strong>presa fra 500 e 800 pb<br />

Si usano 2 strategie generali per la frammentazione e la<br />

ricostruzione:<br />

<strong>Il</strong> <strong>sequenziamento</strong> gerarchico<br />

<strong>Il</strong> <strong>sequenziamento</strong> a rosa di pallini (shotgun)<br />

Le due strategie sono reciprocamente <strong>com</strong>plementari<br />

14


Differenze:<br />

Nel <strong>sequenziamento</strong> gerarchico il prmo passaggio è quello di costruire<br />

un sentiero principale (tiling path) che serva ad assicurarsi che la<br />

sequenza sia ottenuta in grandi pezzi ordinati tra di loro<br />

Mentre nel metodo shotgun frammenta semplicemente il genoma in<br />

piccole unità sequenziabili e si affida ad algoritmi <strong>del</strong> <strong>com</strong>puter per<br />

ricostruire l’ordine dei frammenti<br />

Sequenziamento gerarchico (genoma umano)<br />

Le strategie gerarchiche conosciute anche <strong>com</strong>e dall’alto in basso (topdown),<br />

basate su mappe o clone per clone sono state ideate alla fine<br />

degli anni 80 quando i reagenti erano molto costosi e i <strong>com</strong>puter non<br />

erano ancora abbastanza potenti per elaborare sequenze intere ottenute<br />

con lo shotgun<br />

Metodologia: frammentare il genoma in unità sempre più piccole le cui<br />

posizioni relative sono conosciute prima di iniziare il <strong>sequenziamento</strong><br />

Vantaggi: favorisce la ricostruzione di mappe fisiche e genetiche ad alta<br />

risuluzione e permette a gruppi di lavoro di tutto il mondo di formare<br />

consorzi e lavorare insieme senza rischiare di ripetere le stesse ricerce<br />

(un gruppo = un cromosoma)<br />

15


<strong>Il</strong> primo passaggio è quello di ottenere cloni <strong>del</strong> genoma<br />

umano di dimensioni <strong>com</strong>prese tra 50 e 200 kb<br />

I vettori in cui è possibile inserire tratti genomici di grandi<br />

dimensioni sono i BAC i PAC (derivati dal fago P1)<br />

Si costruiscono librerie di <strong>DNA</strong> tramite digestione<br />

parziale o frammentazione <strong>del</strong> <strong>DNA</strong> genomico tramite<br />

sonicazione<br />

In genere si desidera un certo grado di ridondanza<br />

Questo perché i cloni in teoria dovrebbero avere estremità<br />

diverse e questo dovrebbe rendere possibile selezionare<br />

una impalcatura di cloni che formino una sequenza<br />

contigua <strong>com</strong>prendente l’intero cromosoma<br />

un tiling path<br />

16


È possibile ricostruire un tiling path mediante una <strong>com</strong>binazione di 3 metodi:<br />

Ibridazione: è possibile identificare rapidamente in una<br />

libraria tutti i cloni che contengono una particolare<br />

sequenza, ibridando una sonda di piccole dimensioni,<br />

marcata con isotopi radioattivi o molecole fluorescenti, e<br />

contenente la sequenza, a un filtro su cui è fissata una<br />

<strong>com</strong>binazione di decine di migliaia di cloni<br />

In seguito si può usare l’estremità di questi cloni <strong>com</strong>e<br />

sonda per individuare i cloni adiacenti in quello che viene<br />

denominato “chromosome walking”<br />

17


Fingerprinting: il modo meno costoso e più efficace per<br />

ricostruire l’ordine dei contig di grandi cloni inseriti nei<br />

vettori è quello di confrontarli tra loro e allinearli in base<br />

ai profili di digestione con enzimi di restrizione<br />

Se si usa un enzima esacutter, questo opererà un taglio<br />

ogni 4 kb: se sono usati per tagliare un BAC di 100 kb,<br />

producono a 20 a 30 frammenti.<br />

Questi possono essere separati tramite elettroforesi e,<br />

quindi, assegnati a gruppi dimensionali, dopo una<br />

adeguata normalizzazione statistica<br />

18


End-sequencing=sequenziare le estremità <strong>del</strong>la raccolta di<br />

cloni BAC. Modo <strong>com</strong>une per identificare i cloni che si<br />

sovrappongono alle lacune rimanenti dopo il fingerprinting<br />

Una volta raggiunta una soglia critica di ricostruzione <strong>del</strong>la<br />

sequenza, vi è una probabilità elevata che almeno un BAC<br />

si trovi all’interno di una regione già ricostruita: di<br />

conseguenza l’altra estremità <strong>del</strong> clone si estenderà nella<br />

lacuna o si collegherà ad un contig adiacente<br />

<strong>Il</strong> <strong>sequenziamento</strong> a una estremità è inoltre un <strong>com</strong>ponente<br />

importante <strong>del</strong>le tecniche usate per verificare la correttezza<br />

<strong>del</strong>la ricostruzione <strong>del</strong>le sequenze.<br />

Tornando al <strong>sequenziamento</strong> gerarchico….<br />

Una volta scelto il tiling path, i singoli cloni BAC sono<br />

suddivisi in piccoli frammenti, che sono clonati a loro volta<br />

per il <strong>sequenziamento</strong> automatico<br />

La frammentazione viene fatta con ultrasuoni e questo<br />

assicura che ogni frammento abbia estremità diverse dagli<br />

altri<br />

19


Sequenziamento shotgun<br />

Nel <strong>sequenziamento</strong> shotgun si usano algoritmi <strong>del</strong> <strong>com</strong>puter per<br />

ricostruire la sequenza dei contig derivati da migliaia di cloni sovrapposti.<br />

I contig sono prodotti da una libreria plasmidica costruita a partire da un<br />

unico genoma intero<br />

Come nel <strong>sequenziamento</strong> gerarchico lo scopo è quello di ottenere una<br />

ridondanza di ciascun frammento <strong>del</strong> genoma da 5 a 10 volte<br />

L’allineamento serve per ottenere l’assemblaggio <strong>del</strong>le sequenze contigue<br />

di cloni, ma anche per migliorare l’accuratezza <strong>del</strong>la sequenza, tramite la<br />

produzione di una sequenza consenso<br />

Ad esempio nel genoma umano la Celera ha utilizzato 5<br />

algoritmi con l’obiettivo di riunire insieme il più possibile<br />

le parti <strong>del</strong>l’unica sequenza sovrapponendo tra loro le<br />

sequenze parziali<br />

Così facendo le uniche lacune che restano sono quelle<br />

dovute a <strong>DNA</strong> ripetitivo o a sequenze non rappresentate<br />

nella libreria<br />

20


Sequenziamento di interi genomi<br />

Frammento cromosomico<br />

sequenziato<br />

<strong>DNA</strong><br />

genomico<br />

Frammentazione<br />

Assemblaggio dei<br />

frammenti sequenziati contigui<br />

(Software appositi)<br />

Clonaggio<br />

in vettori<br />

Sequenziamento<br />

21


Verifica <strong>del</strong>le sequenze<br />

La veridicità di qualunque sequenza di un intero genoma deve essere<br />

valutata a tre livelli: la <strong>com</strong>pletezza, l’accuratezza <strong>del</strong>la sequenza di basi e<br />

la validità <strong>del</strong>la ricostruzione.<br />

Completezza: in genere i microrganismi (così pure l’uomo, il riso,<br />

arabidopsis e il topo) sono stati sequenziati per intero<br />

Possono contenere <strong>com</strong>unque lacune difficili da colmare (di circa 1 kb).<br />

Questo può essere dovuto a sequenze ripetute difficili da colmare o al<br />

fatto che il <strong>sequenziamento</strong> è stato effettuato partendo da individui diversi<br />

per cui potrebbero esserci polimorfismo dovuti a in<strong>del</strong> o a duplicazioni<br />

Accuratezza: l’accuratezza è stabilita in punteggi di probabilità<br />

Validità <strong>del</strong>la ricostruzione: non è facilmente determinabile: è<br />

possibile averne un’idea approssimativa misurando al<br />

coerenza interna <strong>del</strong>la sequenza, oppure paragonando la<br />

ricostruzione con mappe genetiche o fisiche preesisteti o fatte<br />

all’uopo.<br />

22


Chromosome painting con cloni BAC<br />

12.7 Mb<br />

CEN<br />

14.4 Mb<br />

Condizioni di Painting<br />

1. Chromosoma 1 di<br />

Arabidopsis thaliana<br />

2. Un totale di 183 cloni BAC<br />

<strong>del</strong> chr-1<br />

3. BAC dal braccio superiore<br />

(12.7 MB) marcati con<br />

biotin-dUTP (rosso)<br />

4. BACs dal braccio inferiore<br />

(14.4 MB) marcati con<br />

digoxygenin-dUTP (verde)<br />

FISH painting <strong>del</strong> cromosoma 4 con 131 BAC<br />

23


WS (knob)<br />

?<br />

C24 (knobless)<br />

*<br />

F9H3<br />

F4C21<br />

24

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!