Prati, pascoli e paesaggio alpino - SoZooAlp
Prati, pascoli e paesaggio alpino - SoZooAlp
Prati, pascoli e paesaggio alpino - SoZooAlp
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Fausto Gusmeroli<br />
ossia la loro distribuzione in gruppi in base alla loro somiglianza/dissomiglianza. Tale<br />
processo prende il nome di clustering (riunire in grappoli) 11 .<br />
L’attività di riconoscere e classificare delle entità è una delle espressioni tipiche<br />
dell’intelligenza umana e animale in generale. I viventi pensano agevolmente e comunicano<br />
in termini di classi, ciò a prescindere dal fatto che il sistema esplorato presenti o<br />
meno variazioni discrete. Ovviamente, se vi sono discontinuità la classificazione si pone<br />
come lo strumento naturale di concettualizzazione, mentre se la variazione è continua<br />
e meno immediata e assume per forza di cose degli aspetti di artificialità. In ogni caso,<br />
classi o cluster hanno sempre un significato relativo, poiché la loro definizione può basarsi<br />
su diversi criteri, che possono condurre a classificazioni affatto differenti. Come<br />
esemplificato in figura 5.1, quando le entità sono naturalmente raggruppate (caso a),<br />
il criterio più valido è quello di riprendere semplicemente i cluster naturali: qualsiasi<br />
procedura di clustering non può che condurre a questa classificazione. Diversamente, i<br />
cluster devono essere imposti dall’esterno, secondo criteri logici. Nel caso b, dove si ha<br />
una scarsa separazione tra gli aggregati, si potrà impiegare il criterio della coesione interna<br />
o omogeneità; nel caso c, caratterizzato invece da una spiccata eterogeneità interna,<br />
il criterio sarà quello della separazione. Coesione interna e separazione sono le logiche<br />
più seguite e laddove siano adottate simultaneamente definiscono un criterio detto di<br />
ottimizzazione globale. Altre logiche, meno frequenti, sono la densità dei cluster, la loro<br />
variabilità, la dimensione, il numero dei membri, la connettività e così via. Una situazione<br />
estrema, dove nessun criterio è logicamente proponibile, è quella del caso d, in cui la<br />
distribuzione degli oggetti è del tutto casuale e la classificazione è impossibile.<br />
In funzione degli obiettivi e della logica di clustering, i metodi di classificazione possono<br />
essere distinti in divisivi/agglomerativi/rilocativi, monotetici/politetici e gerarchici/<br />
non gerarchici. La prima distinzione considera se la formazione dei cluster avvenga per<br />
successive divisioni di un iniziale unico cluster comprensivo di tutti gli oggetti o, piuttosto,<br />
per progressiva aggregazione di iniziali cluster costituiti ognuno da un singolo oggetto.<br />
Né in un caso né nell’altro sono permesse correzioni: se due oggetti sono separati<br />
o aggregati all’inizio dell’analisi, tali rimangono. I metodi rilocativi o di scambio procedono<br />
invece per trasferimenti successivi delle entità da un cluster all’altro, ricercando ad<br />
ogni passo il posizionamento migliore.<br />
La seconda distinzione contrappone i metodi monotetici, nei quali ogni passaggio del<br />
clustering è basato su una singola variabile, così che i cluster saranno coerenti con essa<br />
(un esempio è la classificazione Linneana), ai metodi politetici, dove le decisioni sono<br />
sempre influenzate simultaneamente da molte o tutte le variabili. Alle tecniche politetiche<br />
appartengono i principali metodi agglomerativi, mentre i divisivi possono far parte<br />
anche della famiglia delle monotetiche. Se, dunque, le tecniche monotetiche possono<br />
essere solo o quasi divisive, le politetiche possono essere anche agglomerative. La logica<br />
classificatoria della mente umana sembra essere maggiormente in sintonia con gli approcci<br />
divisivi, mentre gli agglomerativi sono più confacenti alle procedure numeriche.<br />
11 Impropriamente, i termini classificazione e clustering sono talvolta usati come sinonimi. In realtà, il clustering<br />
è il processo di raggruppamento, mentre la classificazione è il risultato del clustering. Il concetto di clustering è<br />
poi spesso confuso con i concetti di dissezione (o sezionamento) e di classamento. La dissezione è anch’essa una<br />
ripartizione in gruppi, ma realizzata indipendentemente dalle relazioni di somiglianza tra gli oggetti. Il classamento<br />
è invece l’assegnazione di un o più oggetti ad un gruppo di una classificazione già esistente.<br />
86