Prati, pascoli e paesaggio alpino - SoZooAlp
Prati, pascoli e paesaggio alpino - SoZooAlp
Prati, pascoli e paesaggio alpino - SoZooAlp
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Fig. 5.4<br />
Effetto ricercato nel riarrangiamento in una matrice di dati binari<br />
Fausto Gusmeroli<br />
Fig. 5.4<br />
Effetto ricercato nel riarrangiamento in una matrice di dati binari<br />
0 0 1 0 0 1 1 0 0<br />
0 1 0 0 1 0 0 0 1<br />
1 0 0 1 0 0 0 1 0<br />
0 1 0 0 1 0 0 0 1<br />
0 0 1 0 0 1 1 0 0<br />
1 0 0 1 0 0 0 1 0<br />
0 0 1 0 0 1 1 0 0<br />
0 1 0 0 1 0 0 0 1<br />
1 0 0 1 0 0 0 1 0<br />
campioni) sono ottenuti attraverso un processo iterativo di rilocazione basato su misure<br />
di distanza o dissimilarità. Il processo più semplice consiste nel doppio clustering, che<br />
però, classificando separatamente le righe e le colonne, non sempre si rivela incisivo.<br />
Migliori sono i procedimenti che tengono conto dell’interazione tra righe e colonne, come<br />
la seriazione, dove il riordino delle righe e delle colonne, ricercato anche qui solitamente<br />
con un processo iterativo simultaneo, è subordinato all’ottimizzazione della struttura<br />
diagonale della matrice. I valori più elevati sono posizionati il più vicino possibile<br />
alla diagonale, mettendo così in evidenza un gradiente unidimensionale dei campioni in<br />
funzione delle specie. Più che di una vera e propria classificazione si tratta, quindi, di una<br />
tecnica di ordinamento ad una dimensione, applicabile oltre che sulla matrice primaria,<br />
anche sulle matrici secondarie di somiglianza/dissomiglianza tra gli oggetti.<br />
5.3. La cluster analysis non gerarchica<br />
La cluster analysis non gerarchica è un metodo di classificazione concettualmente<br />
più semplice della corrispondente gerarchica, in quanto si limita ad assegnare gli oggetti<br />
ai cluster, senza fornire alcuna informazione circa le relazioni tra questi ultimi. Per tale<br />
ragione si presta soprattutto ad analizzare matrici molto grandi, come strumento preliminare<br />
di identificazione degli outlier e delle disgiunzioni, oltre che di raggruppamento<br />
degli oggetti mirato ad una prima mitigazione del rumore e riassunto della ridondanza.<br />
Eliminando gli outlier, disaggregando la matrice e sostituendo ai cluster i campioni<br />
composti viene agevolata la successiva classificazione gerarchica, indispensabile per lo<br />
studio dettagliato della struttura delle relazioni. Naturalmente è sempre possibile passare<br />
direttamente a quest’ultima. Tuttavia, se in matrici di dimensione ridotta la cosa è fattibile<br />
e consigliabile, in matrici grandi si potrebbe rivelare molto complicata e le informazioni<br />
ricavabili potrebbero in definitiva essere meno utili ed esplicative.<br />
Le tecniche di clustering non gerarchico tendono ad essere relativamente omogenee<br />
ed esigono quasi tutte di specificare a priori il numero dei cluster e, talvolta, anche altri<br />
90<br />
1 1 1 0 0 0 0 0 0<br />
1 1 1 0 0 0 0 0 0<br />
1 1 1 0 0 0 0 0 0<br />
0 0 0 1 1 1 0 0 0<br />
0 0 0 1 1 1 0 0 0<br />
0 0 0 1 1 1 0 0 0<br />
0 0 0 0 0 0 1 1 1<br />
0 0 0 0 0 0 1 1 1<br />
0 0 0 0 0 0 1 1 1