29.05.2013 Views

Prati, pascoli e paesaggio alpino - SoZooAlp

Prati, pascoli e paesaggio alpino - SoZooAlp

Prati, pascoli e paesaggio alpino - SoZooAlp

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Fausto Gusmeroli<br />

verificare se variazioni casuali dei dati originali o la cancellazione o l’aggiunta di una<br />

variabile inducano mutamenti significativi della gerarchia. Oppure si possono suddividere<br />

a random gli oggetti in due gruppi, sottoponendo entrambi a clustering e comparando<br />

i risultati. Lo stesso raffronto tra diversi metodi di clustering può essere considerato una<br />

stima di stabilità, sebbene in tal caso non siano i dati a cambiare, bensì il metodo. È palese<br />

che laddove i risultati siano simili la classificazione vada considerata stabile.<br />

Altro punto essenziale nella classificazione è la definizione del numero ottimale di<br />

cluster. La questione è assolutamente cruciale in quei metodi non gerarchici che richiedono<br />

a priori la specifica del numero dei gruppi, al punto da circoscrive il loro impiego<br />

alle situazioni nelle quali la decisioni è supportata da precise informazioni derivate da<br />

indagini preliminari. Essa, tuttavia, non è estranea neppure al clustering gerarchico. Tecnicamente,<br />

il numero dei cluster è determinato tagliando il dendrogramma ad un certo<br />

livello, in modo tale da ottimizzare la ripartizione degli oggetti. Allo scopo sono state<br />

proposte varie formulazioni matematiche, in larga parte basate sul calcolo delle devianze<br />

e quindi riconducibili agli approcci classici dei test delle ipotesi. La classificazione migliore<br />

sarà quella che massimizza il rapporto devianza-tra/devianza-entro i cluster e una<br />

delle formule più efficaci è quella di Calinski e Harabasz:<br />

CALHARK = [Devtra/(k – 1)] / [Deventro (n – k)]<br />

dove: k = numero di cluster<br />

n = numero di oggetti<br />

All’aumentare di k, l’indice tende dapprima a crescere linearmente, quindi, se gli<br />

oggetti non sono distribuiti stocasticamente, a calare, definendo così un picco in corrispondenza<br />

del numero ottimale di cluster. Il metodo non è tuttavia applicabile alle<br />

classificazioni basate su misure di somiglianza/dissomiglianza non compatibili con la<br />

devianza. Una procedura più generale è proposta da Podani. Le ripartizioni sono valutate<br />

sul contributo di ogni variabile descrittiva, misurato con lo stesso indice di somiglianza/<br />

dissomiglianza del clustering, e la ripartizione ottimale sarà quella sostenuta dal maggior<br />

numero di variabili.<br />

5.7. Identificazione delle comunità<br />

Una volta stabilita la classificazione ottimale, l’analisi taxometrica si conclude con<br />

l’identificazione degli aggruppamenti. Negli approcci più informali della scuola anglofona<br />

e del metodo fitopastorale ci si limita a osservare e descrivere le comunità nelle loro<br />

prerogative floristiche, senza un completo o rigido riferimento ad una struttura sistematica<br />

data. Al contrario, nell’approccio fitosociologico i cluster sono inseriti in schemi<br />

sintassonomici attraverso l’assegnazione a delle associazioni o fitocenosi di altro rango<br />

gerarchico, già note o di nuova costituzione nel caso in cui emergessero tratti del tutto<br />

peculiari.<br />

L’organizzazione gerarchica della vegetazione è simile a quella tassonomica delle<br />

specie vegetali, salvo il fatto di non essere fondata su basi filogenetiche, bensì ecologiche.<br />

L’associazione è la categoria o rango di base, l’equivalente della specie nella<br />

102

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!