Prati, pascoli e paesaggio alpino - SoZooAlp
Prati, pascoli e paesaggio alpino - SoZooAlp
Prati, pascoli e paesaggio alpino - SoZooAlp
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
97<br />
PRATI, PASCOLI E PAESAGGIO ALPINO<br />
ragione, nota a priori, per eliminare le differenze di dimensione tra i raggruppamenti<br />
risultanti, come accade in alcune indagini tassonomiche.<br />
Metodo del centroide<br />
Noto con l’acronimo UPGMC (Unweighted pair groups method using centroids), è<br />
il metodo più obiettivo in termini geometrici, giacché confronta i cluster in base al loro<br />
centroide (media dei membri). Può portare a rovesciamenti nel dendrogramma (Fig. 5.6<br />
b), che si presentano allorché il centroide del nuovo cluster di fusione dista dal centroide<br />
di un terzo cluster meno di quanto questo disti dai due singoli cluster di fusione. In tale<br />
eventualità, il metodo è sconsigliabile.<br />
Metodo della mediana<br />
Siglato con WPGMC (Weighted pair groups method using centroids), sta al metodo<br />
del centroide (UPGMC) come la media semplice (WPGMA) sta alla media di gruppo<br />
(UPGMA). Il centroide del nuovo cluster è ottenuto come media aritmetica dei centroidi<br />
dei due cluster di fusione e andrebbe indicato, più correttamente, come pseudo-centroide.<br />
Non essendo considerata la dimensione dei gruppi, lo pseudo-centroide sarà spostato,<br />
rispetto al centroide vero e proprio, verso il cluster più piccolo, cui sarà così attribuito<br />
maggiore peso. Le proprietà applicative di questo metodo sono le medesime della media<br />
semplice.<br />
Strategie flessibili<br />
Le strategie flessibili comprendono una serie di metodi che forniscono dendrogrammi<br />
differenti in funzione di alcuni parametri di clustering, fatti variare appositamente<br />
allo scopo di rivelare meglio la struttura dei cluster. Una prima tecnica è la β-flessibile.<br />
Il parametro β può assumere valori da –1 a +1, esibendo agli estremi, rispettivamente,<br />
dendrogrammi con spiccata tendenza al raggruppamento, vicini all’analisi di legame<br />
completo, e dendrogrammi con forte effetto di concatenamento, comparabili al metodo<br />
del legame semplice. Il valore –0,25 è ritenuto essere quello che fornisce i risultati migliori.<br />
Sul parametro β si basa anche un secondo metodo, l’UPGMA flessibile, variante<br />
del metodo di legame medio. Per esso sembra che il valore ottimale di β si collochi<br />
nell’intervallo da –0,1 a 0. Metodi ancor più flessibili sono quelli che, oltre a β, fanno<br />
variare anche un altro parametro (γ), entrambi senza restrizioni. I potenziali risultati sono<br />
ovviamente più ampi, ma di difficile interpretazione, limitando l’interesse di queste<br />
procedure a solo aspetti teorici. In figura 5.7 è riportato un esempio di classificazione con<br />
il metodo β-flessibile.<br />
Il clustering basato sul criterio di coesione interna adotta sia algoritmi combinatoriali,<br />
sia non combinatoriali. La coesione può essere valutata per mezzo di qualsiasi tipo di<br />
parametro di somiglianza/dissomiglianza, fatte salve le metriche.<br />
Nei metodi combinatoriali si usano misure di similarità/dissimilarità, in particolare<br />
la devianza, la varianza e la dissimilarità media entro cluster. Il criterio di coesione può<br />
essere perseguito ottimizzando l’omogeneità dei nuovi cluster, o minimizzando il cambiamento<br />
dell’omogeneità nelle fusioni. Sono dunque possibili tanti procedimenti quante<br />
sono le combinazioni dei due criteri con i vari parametri di similarità/dissimilarità. I<br />
risultati possono anche divergere notevolmente e dimostrarsi poco coerenti o inefficaci.<br />
In linea di massima, tutte le tecniche che impiegano il criterio dell’ottimizzazione dell’o-