13.07.2015 Views

ALBERI FILOGENETICI

ALBERI FILOGENETICI

ALBERI FILOGENETICI

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Caratteristiche degli alberi filogeneticiUn albero filogeneticopropriamente detto deve avere leseguenti caratteristiche:1) deve avere una radice, cherappresenta l'antenato comune a tuttele specie presenti nell'albero2) le specie attualmente esistenti devonoessere collocate su un'unica linea, cherappresenta l'epoca attuale;3) l'albero deve avere avere una scalatemporale di riferimento;4) le ramificazioni devono essere esseredicotomiche e devono essere datate5) dovrebbero essere indicate, perquanto possibile, le specie estinte chehanno dato origine alle specie attualiGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Relazioni fra unità tassonomiche●●Se si violano l'una o l'altra delle condizioni precedenti non si ha piùun vero e proprio albero filogenetico, ma una rappresentazioneparziale, non necessariamente evoluzionistica, delle relazioniesistenti fra le specie (o altre categorie tassonomiche, popolazioni,gruppi sistematici, sequenze di DNA, ecc.) a seconda dei caratteriche si consideranoTali grafici sono utili come tappe intermedie per la costruzione diuna vera filogenesi, e anche come rappresentazioni fini a se stessedella “struttura” esistente in una determinata raccolta di dati (nonnecessariamente biologici)Genetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Atlante delle sorgenti dell'Altopiano dei Sette Comuni Vicentini“Il dendrogramma mette alla luce due unità idrologiche, separabili anchegeograficamente...”http://www.gruppospeleo7c.it/public/sorgenti/convegno1998/analisi.htmGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


●●DendrogrammiLa violazione condizione 1 (mancanza della radice), è la piùdistruttiva per l'idea dell'albero filogeneticoCome possono due specie non avere un antenato comune?●E tuttavia gli alberi senza radice, meglio detti dendrogrammi,vengono ampiamente utilizzati nella sistematica biologica●Il termine dendrogramma (letteralmente “grafico ad albero”) è nato e vienesoprattutto utilizzato nell'ambito dell'“analisi dei gruppi” (cluster analysis),una tecnica della statistica multivariata volta ad individuare, dato uninsieme di unità statistiche per le quali sono disponibili una o più serie diosservazioni, determinati sottoinsiemi (gruppi), le cui unità sonomediamente più simili fra loro di quanto non lo sia ciascuna di esse ad ogniunità degli altri gruppi.Genetica delle popolazionia.a. 11-12 prof. S. Presciuttini


●●●Somiglianze versus parenteleI dendrogrammi non sono “evoluzionistici” in linea di principio: se adesempio si vogliono confrontare fra loro gli stili di vita di un insieme dicittà, si può certamente arrivare ad un dendrogramma che raggruppa fraloro le città con stili di vita più simili e le separa dagli altri gruppi, manon ha senso pensare che le città che fanno parte di un dato gruppo sianoderivate da una città progenitriceÈ in effetti una pretesa della fenetica che un dendrogramma di unitàbiologiche rifletterà alla fine necessariamente le vere parentele esistentifra queste unità se si considera un numero di caratteri sufficientementegrandeCiò non ha a che fare, tuttavia, con la natura statistica deidendrogrammi, che registrano solamente le somiglianze per come esse simanifestano nei dati.Genetica delle popolazionia.a. 11-12 prof. S. Presciuttini


●●●Alberi filogenetici di sequenze nucleotidicheNella genetica delle popolazioni le “unità statistiche” diosservazione sono spesso le popolazioni biologiche, e lesomiglianze riguardano le frequenze geniche o altri dati genetici,ma l'approccio è generale, e può essere applicato a qualsiasi serie didati su qualsiasi insieme di oggettiCon l'esplosione dei dati di sequenze nucleotidiche la costruzionedei dendrogrammi è diventata quasi un obbligo per chi si occupa dibiologia molecolareI dendrogrammi prodotti a partire da sequenze nucleotidiche hannopreso il nome di alberi filogenetici molecolariGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Due aspetti “opzionali” dei dendrogrammi●●I dendrogrammi sono spesso rappresentati allineando le “specie” allabase del grafico●questa caratteristica dipende dall'algoritmo scelto per l'analisi dei dati:un'altra possibilità è che le “specie” non debbano necessariamente essereallineate, ma che si trovino a diversi livelli, come se fossero “appese” allapropria branca, ciascuna delle quali dotata della propria lunghezzaall'interno del proprio gruppoNei dendrogrammi le branche sono generalmente disegnate in direzioneparallela all'asse delle ordinate: questo genera l'impressione che una“radice” da cui discendono tutte le branche esista●Si tratta di un'impressione falsa in quanto la lunghezza delle branche èscalata in unità di distanza, e l'unica cosa che conta è la lunghezza dellebranche, non la loro direzione. Per praticità di lettura le branche sonoparallele all'asse delle ordinate, ma potrebbero essere orientate in qualsiasidirezione e il dendrogramma avrebbe lo stesso significato.Genetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Rappresentazioni equivalentiPuò essere difficile cogliere a prima vista l'identità di un dendrogrammadisegnato con branche parallelle e un dendrogramma disegnato con branchedivergenti (“dendrogramma radiale”)Il grafico a sinistra è stato disegnato a partire dal segmento che unisce da unaparte il nodo interno che separa A e B e dall'altra il nodo che separa C da tutte lealtre “specie”. Il dendrogramma radiale rende palese l'inesistenza della radiceGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Come mettere radici●●●Mettere la radice a un dendrogramma di specie biologiche significaavvicinarlo ad un albero filogeneticoUn modo elementare, valido solo se i tassi di variazione sonouguali fra le branche , è di cercare il “punto di mezzo”, quello cherisulta meglio equidistante da tutte le specie (sconsigliato)Il metodo di elezione è di includere nell'analisi il cosiddetto“outgroup”, una specie che si sa per altri motivi essersi separatafilogeneticamente prima di tutte le altre●L'ougroup consente di “spezzare” un dendrogramma, cioè porre laradice, nel segmento che lo collega al nodo da cui si diramano tutte lealtre specieGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


●●CladogrammiUn cladogramma è uno schema nonmetrico (la lunghezza delle branche nonha significato) che illustra solo le relazionidi parentela fra le specie di interesseSe un cladogramma è ben costruito, cioè èbasato sulle reali omologie esistenti fra lespecie, tutte e solo le specie che sono fraloro legate da una discendenza direttavengono a trovarsi in un dato clade; anchele specie eventualmente esistite nelpassato vengono a trovarsi collocate suinodi terminaliGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


●●●La filogenesi molecolareI metodi della cladistica hanno trovato negli ultimi 20 anniun'applicazione naturale nell'analisi delle sequenze dellemacromolecole (DNA e proteine)Una delle grandi rivelazioni della biologia molecolare è stata lascoperta che le sequenze nucleotidiche di molti geni sonosufficientemente conservate nel corso dell'evoluzione, tanto che igeni omologhi, cioè i geni che hanno sequenze simili perchè sonoderivati da un antenato comune, sono riconoscibili anche attraversodistanze filogenetiche estremamente elevateAd esempio molti geni umani sono indubitabilmente omologhi digeni che si trovano nei nematodi, negli insetti, nelle muffe e neibatteriGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


●●●●I vantaggi offerti dalle sequenze di DNALa filogenesi molecolare offre due vantaggi fondamentali rispettoagli studi tradizionali basati sulla morfologia:Nel comparare fra loro gruppi di organismi molto diversi gli unidagli altri (per esempio le alghe, i funghi, i vertebrati) è impossibiletrovare caratteri morfologici comparabili, mentre esistono sempresegmenti di DNA omologhiLa comparazione sulla base di somiglianze molecolari èquantitativa: è molto difficile esprimere numericamente quanto unriccio di mare è diverso da un lombrico, ma possiamo esprimerefacilmente quanto numericamente una sequenza di DNA omologadel genoma dell’uno è diversa da quella dell’altroOggi qualunque studio serio di filogenesi non può prescinderedall'analisi del DNAGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Algoritmi di calcolo dei dendrogrammi●●I metodi di costruzione dei dendrogrammi si possono classificare in duefamiglie: quelli basati su matrici di distanza e quelli basati sullacondivisione dei caratteri●●Nel primo caso si calcola separatamente la distanza fra tutte le possibilicoppie di specie (i metodi di calcolo della distanza sono molteplici:bisogna preliminarmente scegliere quello che si ritiene più adatto) e ilrisultato assume la forma di una matrice quadrata simmetrica con valoripositivi fuori dalla diagonale e pari a zero sulla diagonale (la distanza diuna specie da se stessa è nulla)Nel secondo caso i caratteri che sono condivisi da una o più specievengono inclusi nell'analisi uno alla volta, e danno luogo ad una gerarchiadi ramificazioni senza che si passi attraverso il calcolo di una distanzaI metodi basati sulle matrici di distanza sono più rapidi, ma trascuranol'informazione sulla condivisione di ciascun singolo carattereGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Metodi basati su matrici di distanza: 1) UPGMA●Il metodo più semplice per costruire un dendrogramma, tantosemplice che si può eseguire anche senza calcolatore, è quello dettounweighted pair group method with arithmetic mean (UPGMA)●●si inizia scegliendo nella matrice la coppia con distanza minima e sitraccia la prima dicotomia del dendrogramma unendo le due speciecon un segmento la cui lunghezza è pari alla metà della loro distanza;si prosegue ricalcolando la matrice, ridotta di una unità, in cui quellaprima coppia è rappresentata da un'unico gruppo e si individua lanuova coppia con la distanza minima; si prosegue iterando ilprocedimento fino a che la matrice scompare perchè sono rimastisolo gli ultimi due gruppiIl metodo UPGMA produce dendrogrammi in cui le specie sononecessariamente allineate sulla base.Genetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Metodi basati su matrici di distanza: 2) NJ●L'approccio dell'algoritmo Neighbor Joining è simile a quellodell'UPGMA, ma la ricerca del “neighbor” (il “vicino”) di ciascunaspecie viene effettuata non scegliendo la coppia con distanza minima,ma attraverso un processo di minimizzazione della somma di tutte ledistanze fra le specie considerando tutte le coppie possibili●●●Si inizia con un albero a stella in cui tutte le branche sono della stessalunghezza, e le diramazioni vengono poi risolte una alla volta. Il risultatofinale è un dendrogramma in cui la lunghezza di ciascuna branca èproporzionale alla distanza media di ciascuna specie da tutte le altreL'algoritmo NJ è considerato un buon compromesso fra velocità di calcoloe accuratezza del risultato, ed è molto utilizzato nella praticaNon è vincolato ad allineare le specie alla baseGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Metodi basati su matrici di distanza: 3) FM e ME●●Altri due metodi, quello di Fitch-Margoliash (FM) e quello dettoMinimum Evolution (ME) erano stati proposti prima del Neighbor-Joining, e sono ancora utilizzatiSono considerati più accurati di quest'ultimo, ma richiedono moltopiù tempo di calcolo e all'atto pratico non offrono evidentivantaggi.Genetica delle popolazionia.a. 11-12 prof. S. Presciuttini


Metodi basati sullo stato di caratteri●●Il calcolo della distanza fra due specie comprime tuttal'informazione disponibile, in genere basata su molti caratteri, in unsingolo valore, cosa che fa perdere parte dell'informazione: non èpossibile ricostruire i dati originali a partire dalla matrice didistanzaIl vantaggio principale dei metodi basati sulla condivisione deicaratteri consentono l'inferenza sullo stato dei caratteri delle specieancestrali presenti sui nodi e non perdono informazione, in quantoutilizzano direttamente la matrice originale costituita da m caratterix n specieGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


●Metodi basati sullo stato dei caratteri: 1) MPIl metodo della massima parsimonia (MP) si basasull'identificazione della topologia che richiede il numero minimodi cambiamenti di stato per tutti i caratteri.●●●Il metodo analizza tutte le possibili topologie e identifica quella cherichiede il numero minimo di sostituzioniDato che il numero delle topologie possibili cresce esponenzialmenteall'aumento del numero di specie, non è possibile analizzare conquesto metodo grandi insiemi di dati (>10-15 specie)Sono stati proposti metodi “euristici” per diminuire il numero delletopologie da calcolare, ma il metodo diventa approssimatoGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini


●●Metodi basati sullo stato dei caratteri: 2) MLIl metodo di Massima Verosimiglianza (ML) valuta tutte lepossibili topologie, e sceglie la migliore in base al calcolo dellaverosimiglianza, che è proporzionale alla probabilità di osservareciascuna topologia dato uno specifico modello di evoluzione(mutazione/sostituzione)È comparativamente il metodo più lento e computazionalmenteintensivo, ed è quindi limitato nel numero di specie che puòanalizzare, ma è considerato accurato e informativoGenetica delle popolazionia.a. 11-12 prof. S. Presciuttini

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!