02.02.2015 Views

Analisi cluster gerarchica delle imprese metalmecc... - ResearchGate

Analisi cluster gerarchica delle imprese metalmecc... - ResearchGate

Analisi cluster gerarchica delle imprese metalmecc... - ResearchGate

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

METODO DEL LEGAME MEDIO: tale algoritmo differisce dai precedenti per le modalità di<br />

calcolo della distanza fra il gruppo appena formato e ognuno dei rimanenti oggetti o gruppi.<br />

Tale distanza è calcolata come la distanza tra un oggetto fittizio, avente come caratteri ad esso<br />

associati una media dei caratteri degli oggetti contenuti nel gruppo, e i rimanenti oggetti.<br />

1<br />

d(<br />

r,<br />

s)<br />

=<br />

n n<br />

r<br />

n r n s<br />

∑∑<br />

s i= 1 j=<br />

1<br />

dist(<br />

X<br />

Altri metodi gerarchici sono quelli della mediana, della varianza minima, del legame<br />

flessibile e numerosi altri che differiscono fra loro per il meccanismo di determinazione della<br />

misura di similarità fra gli oggetti.<br />

ri<br />

, X<br />

3.3 La rappresentazione grafica del risultato: il dendrogramma<br />

Il raggruppamento determinato da un algoritmo gerarchico è solitamente visualizzato<br />

attraverso un dendrogramma, e quindi di un grafico a due dimensioni (n.oggetti vs misura di<br />

similarità) che schematizza i raggruppamenti identificati in corrispondenza di differenti livelli di<br />

similarità.<br />

Ipotizziamo che l’algoritmo gerarchic o abbia determinato la ripartizione di 5 oggetti secondo<br />

quanto riportato in figura 1, dove gli oggetti 1 e 3 e 5 e 4 hanno dissimilarità minima e sono<br />

raggruppati a costituire gli oggetti fittizi 6 e 7 i quali hanno similarità maggiore fra loro rispetto<br />

all’oggetto 2 e quindi costituiscono un nuovo oggetto fittizio 8.<br />

In un dendrogramma, l’asse orizzontale rappresenta gli indici degli oggetti nel dataset<br />

originale. I collegamenti fra gli oggetti sono ottenuti con linee a forma di U capovolta. L’altezza<br />

<strong>delle</strong> U indica la distanza fra gli oggetti. Ad esempio, il legame che rappresenta il <strong>cluster</strong> che<br />

contiene gli oggetti 1 e 3 ha altezza pari a 1.<br />

si<br />

)<br />

5<br />

Scatter plot<br />

3<br />

Dendogramma<br />

4<br />

2<br />

2.5<br />

2<br />

3<br />

X2<br />

2<br />

1<br />

1 3<br />

6<br />

8<br />

7<br />

5<br />

4<br />

Distanza<br />

1.5<br />

1<br />

0.5<br />

0<br />

0 1 2 3 4 5<br />

X1<br />

0<br />

1 3 4 5 2<br />

Oggetti<br />

Figura 1: Raggruppamento gerarchico di 5 oggetti. Sulla sinistra, scatterplot degli oggetti nello spazio <strong>delle</strong> variabili<br />

X 1 e X 2 caratterizzanti gli oggetti. Sulla destra, dendrogramma del raggruppamento gerarchico.<br />

11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!