Prati, pascoli e paesaggio alpino - SoZooAlp
Prati, pascoli e paesaggio alpino - SoZooAlp
Prati, pascoli e paesaggio alpino - SoZooAlp
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Fausto Gusmeroli<br />
verificare se variazioni casuali dei dati originali o la cancellazione o l’aggiunta di una<br />
variabile inducano mutamenti significativi della gerarchia. Oppure si possono suddividere<br />
a random gli oggetti in due gruppi, sottoponendo entrambi a clustering e comparando<br />
i risultati. Lo stesso raffronto tra diversi metodi di clustering può essere considerato una<br />
stima di stabilità, sebbene in tal caso non siano i dati a cambiare, bensì il metodo. È palese<br />
che laddove i risultati siano simili la classificazione vada considerata stabile.<br />
Altro punto essenziale nella classificazione è la definizione del numero ottimale di<br />
cluster. La questione è assolutamente cruciale in quei metodi non gerarchici che richiedono<br />
a priori la specifica del numero dei gruppi, al punto da circoscrive il loro impiego<br />
alle situazioni nelle quali la decisioni è supportata da precise informazioni derivate da<br />
indagini preliminari. Essa, tuttavia, non è estranea neppure al clustering gerarchico. Tecnicamente,<br />
il numero dei cluster è determinato tagliando il dendrogramma ad un certo<br />
livello, in modo tale da ottimizzare la ripartizione degli oggetti. Allo scopo sono state<br />
proposte varie formulazioni matematiche, in larga parte basate sul calcolo delle devianze<br />
e quindi riconducibili agli approcci classici dei test delle ipotesi. La classificazione migliore<br />
sarà quella che massimizza il rapporto devianza-tra/devianza-entro i cluster e una<br />
delle formule più efficaci è quella di Calinski e Harabasz:<br />
CALHARK = [Devtra/(k – 1)] / [Deventro (n – k)]<br />
dove: k = numero di cluster<br />
n = numero di oggetti<br />
All’aumentare di k, l’indice tende dapprima a crescere linearmente, quindi, se gli<br />
oggetti non sono distribuiti stocasticamente, a calare, definendo così un picco in corrispondenza<br />
del numero ottimale di cluster. Il metodo non è tuttavia applicabile alle<br />
classificazioni basate su misure di somiglianza/dissomiglianza non compatibili con la<br />
devianza. Una procedura più generale è proposta da Podani. Le ripartizioni sono valutate<br />
sul contributo di ogni variabile descrittiva, misurato con lo stesso indice di somiglianza/<br />
dissomiglianza del clustering, e la ripartizione ottimale sarà quella sostenuta dal maggior<br />
numero di variabili.<br />
5.7. Identificazione delle comunità<br />
Una volta stabilita la classificazione ottimale, l’analisi taxometrica si conclude con<br />
l’identificazione degli aggruppamenti. Negli approcci più informali della scuola anglofona<br />
e del metodo fitopastorale ci si limita a osservare e descrivere le comunità nelle loro<br />
prerogative floristiche, senza un completo o rigido riferimento ad una struttura sistematica<br />
data. Al contrario, nell’approccio fitosociologico i cluster sono inseriti in schemi<br />
sintassonomici attraverso l’assegnazione a delle associazioni o fitocenosi di altro rango<br />
gerarchico, già note o di nuova costituzione nel caso in cui emergessero tratti del tutto<br />
peculiari.<br />
L’organizzazione gerarchica della vegetazione è simile a quella tassonomica delle<br />
specie vegetali, salvo il fatto di non essere fondata su basi filogenetiche, bensì ecologiche.<br />
L’associazione è la categoria o rango di base, l’equivalente della specie nella<br />
102