29.05.2013 Views

Prati, pascoli e paesaggio alpino - SoZooAlp

Prati, pascoli e paesaggio alpino - SoZooAlp

Prati, pascoli e paesaggio alpino - SoZooAlp

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Fig. 5.4<br />

Effetto ricercato nel riarrangiamento in una matrice di dati binari<br />

Fausto Gusmeroli<br />

Fig. 5.4<br />

Effetto ricercato nel riarrangiamento in una matrice di dati binari<br />

0 0 1 0 0 1 1 0 0<br />

0 1 0 0 1 0 0 0 1<br />

1 0 0 1 0 0 0 1 0<br />

0 1 0 0 1 0 0 0 1<br />

0 0 1 0 0 1 1 0 0<br />

1 0 0 1 0 0 0 1 0<br />

0 0 1 0 0 1 1 0 0<br />

0 1 0 0 1 0 0 0 1<br />

1 0 0 1 0 0 0 1 0<br />

campioni) sono ottenuti attraverso un processo iterativo di rilocazione basato su misure<br />

di distanza o dissimilarità. Il processo più semplice consiste nel doppio clustering, che<br />

però, classificando separatamente le righe e le colonne, non sempre si rivela incisivo.<br />

Migliori sono i procedimenti che tengono conto dell’interazione tra righe e colonne, come<br />

la seriazione, dove il riordino delle righe e delle colonne, ricercato anche qui solitamente<br />

con un processo iterativo simultaneo, è subordinato all’ottimizzazione della struttura<br />

diagonale della matrice. I valori più elevati sono posizionati il più vicino possibile<br />

alla diagonale, mettendo così in evidenza un gradiente unidimensionale dei campioni in<br />

funzione delle specie. Più che di una vera e propria classificazione si tratta, quindi, di una<br />

tecnica di ordinamento ad una dimensione, applicabile oltre che sulla matrice primaria,<br />

anche sulle matrici secondarie di somiglianza/dissomiglianza tra gli oggetti.<br />

5.3. La cluster analysis non gerarchica<br />

La cluster analysis non gerarchica è un metodo di classificazione concettualmente<br />

più semplice della corrispondente gerarchica, in quanto si limita ad assegnare gli oggetti<br />

ai cluster, senza fornire alcuna informazione circa le relazioni tra questi ultimi. Per tale<br />

ragione si presta soprattutto ad analizzare matrici molto grandi, come strumento preliminare<br />

di identificazione degli outlier e delle disgiunzioni, oltre che di raggruppamento<br />

degli oggetti mirato ad una prima mitigazione del rumore e riassunto della ridondanza.<br />

Eliminando gli outlier, disaggregando la matrice e sostituendo ai cluster i campioni<br />

composti viene agevolata la successiva classificazione gerarchica, indispensabile per lo<br />

studio dettagliato della struttura delle relazioni. Naturalmente è sempre possibile passare<br />

direttamente a quest’ultima. Tuttavia, se in matrici di dimensione ridotta la cosa è fattibile<br />

e consigliabile, in matrici grandi si potrebbe rivelare molto complicata e le informazioni<br />

ricavabili potrebbero in definitiva essere meno utili ed esplicative.<br />

Le tecniche di clustering non gerarchico tendono ad essere relativamente omogenee<br />

ed esigono quasi tutte di specificare a priori il numero dei cluster e, talvolta, anche altri<br />

90<br />

1 1 1 0 0 0 0 0 0<br />

1 1 1 0 0 0 0 0 0<br />

1 1 1 0 0 0 0 0 0<br />

0 0 0 1 1 1 0 0 0<br />

0 0 0 1 1 1 0 0 0<br />

0 0 0 1 1 1 0 0 0<br />

0 0 0 0 0 0 1 1 1<br />

0 0 0 0 0 0 1 1 1<br />

0 0 0 0 0 0 1 1 1

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!