Prati, pascoli e paesaggio alpino - SoZooAlp

Prati, pascoli e paesaggio alpino - SoZooAlp Prati, pascoli e paesaggio alpino - SoZooAlp

29.05.2013 Views

113 PRATI, PASCOLI E PAESAGGIO ALPINO riassumere una parte importante e utile dell’informazione complessiva, con una drastica riduzione della dimensionalità dei dati. Se, viceversa, le correlazioni sono blande, le analisi avranno scarsa efficacia. La principale differenza tra PCA e COA consiste, oltre che nel modello di risposta (lineare o unimodale), nelle matrici elaborate: per la PCA è la matrice secondarie di somiglianza/dissomiglianza, per la COA è la matrice primaria. Altra differenza significativa è che PCA non ordina congiuntamente gli oggetti e le variabili, mentre COA è un procedimento pensato proprio per un ordinamento simultaneo e coordinato. Anche le rappresentazioni grafiche dei risultati, come si vedrà, differiscono. L’analisi delle componenti principali La PCA può essere descritta tanto in termini geometrici quanto algebrici. L’interpretazione geometrica è più agevole. Come esemplificato in figura 6.3 per una matrice o spazio geometrico a due variabili descrittive, le componenti sono gli assi di un sistema di coordinate derivato da una duplice manipolazione del sistema multivariato originario. La prima manipolazione consiste nello spostamento dell’origine al centroide (centraggio), la seconda nella rotazione degli assi, eseguita in maniera tale che il primo asse attraversi la maggiore estensione della nuvola dei punti, ossia massimizzi la varianza delle coordinate dei punti su di esso (i punteggi di ordinamento). Poiché sono attuate solamente traslazioni e rotazioni rigide, le distanze tra gli oggetti non cambiano, come non cambia la varianza totale nei tre sistemi. Con il centraggio si ha soltanto una modificazione delle relazioni angolari tra gli oggetti e quindi dei coefficienti di correlazione (che sono i coseni degli angoli), mentre con la rotazione si ha uno spostamento di varianza, ossia di informazione, dalla seconda alla prima componente. Quando le variabili descrittive sono più di due, la rotazione avviene per iterazione 25 e al termine del processo risultano generate tante componenti quante sono le variabili originarie o gli oggetti meno uno, a seconda che le prime siano più o meno numerose dei secondi. Le componenti sono tutte ortogonali tra loro (perpendicolari), dunque linearmente incorrelate, e sono ordinate con varianza decrescente. Geometricamente rappresentano, in ordine di lunghezza, gli assi dell’ellissoide che racchiude la nuvola dei punti nello spazio multidimensionale e le posizioni degli oggetti su di esse sono ricavate come combinazioni lineari delle variabili originarie (le abbondanze delle specie nelle matrici di comunità) 26 . Nel caso di scarsa correlazione tra le variabili, l’ellissoide tende ad assumere forma sferica, con assi quindi circa della medesima lunghezza. L’analisi si limita in tal caso a spostare il sistema delle coordinate al centroide, poiché la rotazione non sortisce effetto alcuno. La descrizione algebrica della PCA rimanda al calcolo matriciale. Il procedimento (Fig. 6.4) consiste in un’autoanalisi eseguita sulla matrice secondaria delle variabili. Per ogni componente sono prodotti un autovalore, o radice caratteristica o latente della 25 Il metodo più antico, di Jacobi, effettua una prima rotazione nel piano delle due variabili più correlate. Sono quindi ricalcolate le correlazioni nel nuovo sistema, dove solo due assi sono stati variati, e si effettua una nuova rotazione nel piano delle due variabili ora più correlate. Queste operazioni sono ripetuta fino a quando tutti i coefficienti di correlazione sono minori di un valore prefissato molto piccolo. 26 La funzione ha la seguente forma: una costante volte il valore della variabile 1, più un’altra costante volte quello della variabile 2, più…della variabile n. Nell’esempio di figura 6.3, poiché la prima componente è inclinata dall’asse della variabile 1 di circa 19°, con un coseno di 0,946 e un seno di 0,326, i punteggi di ordinamento su di essa sono 0,946 volte il valore centrato della specie 1 (valore della variabile 1 meno 27), più 0,326 volte il valore centrato della variabile 2 (valore della variabile 2 meno 18). Il maggior peso della variabile 1 rispetto alla 2 riflette il fatto che la prima componente ha un orientamento più prossimo all’asse della specie 1 che non della specie 2.

Fausto Gusmeroli Fig. 6.3 Derivazione degli assi delle componenti principali da uno spazio originario a due dimensioni Variabile 2 CP2 Fig. 6.4 Schemi e tipi di analisi delle componenti principali C2 Fig. 6.4 Schemi e tipi di analisi delle componenti principali oggetti oggetti variabili oggetti correlazione varianze-covarianze prodotti incrociati Coordinate oggetti Coordinate variabili 114 variabili CP1 C1 Variabile 1 variabili

113<br />

PRATI, PASCOLI E PAESAGGIO ALPINO<br />

riassumere una parte importante e utile dell’informazione complessiva, con una drastica<br />

riduzione della dimensionalità dei dati. Se, viceversa, le correlazioni sono blande, le<br />

analisi avranno scarsa efficacia. La principale differenza tra PCA e COA consiste, oltre<br />

che nel modello di risposta (lineare o unimodale), nelle matrici elaborate: per la PCA è<br />

la matrice secondarie di somiglianza/dissomiglianza, per la COA è la matrice primaria.<br />

Altra differenza significativa è che PCA non ordina congiuntamente gli oggetti e le variabili,<br />

mentre COA è un procedimento pensato proprio per un ordinamento simultaneo e<br />

coordinato. Anche le rappresentazioni grafiche dei risultati, come si vedrà, differiscono.<br />

L’analisi delle componenti principali<br />

La PCA può essere descritta tanto in termini geometrici quanto algebrici. L’interpretazione<br />

geometrica è più agevole. Come esemplificato in figura 6.3 per una matrice o<br />

spazio geometrico a due variabili descrittive, le componenti sono gli assi di un sistema di<br />

coordinate derivato da una duplice manipolazione del sistema multivariato originario. La<br />

prima manipolazione consiste nello spostamento dell’origine al centroide (centraggio),<br />

la seconda nella rotazione degli assi, eseguita in maniera tale che il primo asse attraversi<br />

la maggiore estensione della nuvola dei punti, ossia massimizzi la varianza delle coordinate<br />

dei punti su di esso (i punteggi di ordinamento). Poiché sono attuate solamente<br />

traslazioni e rotazioni rigide, le distanze tra gli oggetti non cambiano, come non cambia<br />

la varianza totale nei tre sistemi. Con il centraggio si ha soltanto una modificazione<br />

delle relazioni angolari tra gli oggetti e quindi dei coefficienti di correlazione (che sono<br />

i coseni degli angoli), mentre con la rotazione si ha uno spostamento di varianza, ossia<br />

di informazione, dalla seconda alla prima componente. Quando le variabili descrittive<br />

sono più di due, la rotazione avviene per iterazione 25 e al termine del processo risultano<br />

generate tante componenti quante sono le variabili originarie o gli oggetti meno uno, a<br />

seconda che le prime siano più o meno numerose dei secondi. Le componenti sono tutte<br />

ortogonali tra loro (perpendicolari), dunque linearmente incorrelate, e sono ordinate con<br />

varianza decrescente. Geometricamente rappresentano, in ordine di lunghezza, gli assi<br />

dell’ellissoide che racchiude la nuvola dei punti nello spazio multidimensionale e le<br />

posizioni degli oggetti su di esse sono ricavate come combinazioni lineari delle variabili<br />

originarie (le abbondanze delle specie nelle matrici di comunità) 26 . Nel caso di scarsa<br />

correlazione tra le variabili, l’ellissoide tende ad assumere forma sferica, con assi quindi<br />

circa della medesima lunghezza. L’analisi si limita in tal caso a spostare il sistema delle<br />

coordinate al centroide, poiché la rotazione non sortisce effetto alcuno.<br />

La descrizione algebrica della PCA rimanda al calcolo matriciale. Il procedimento<br />

(Fig. 6.4) consiste in un’autoanalisi eseguita sulla matrice secondaria delle variabili.<br />

Per ogni componente sono prodotti un autovalore, o radice caratteristica o latente della<br />

25 Il metodo più antico, di Jacobi, effettua una prima rotazione nel piano delle due variabili più correlate.<br />

Sono quindi ricalcolate le correlazioni nel nuovo sistema, dove solo due assi sono stati variati, e si effettua una<br />

nuova rotazione nel piano delle due variabili ora più correlate. Queste operazioni sono ripetuta fino a quando tutti i<br />

coefficienti di correlazione sono minori di un valore prefissato molto piccolo.<br />

26 La funzione ha la seguente forma: una costante volte il valore della variabile 1, più un’altra costante volte<br />

quello della variabile 2, più…della variabile n. Nell’esempio di figura 6.3, poiché la prima componente è inclinata<br />

dall’asse della variabile 1 di circa 19°, con un coseno di 0,946 e un seno di 0,326, i punteggi di ordinamento su di<br />

essa sono 0,946 volte il valore centrato della specie 1 (valore della variabile 1 meno 27), più 0,326 volte il valore<br />

centrato della variabile 2 (valore della variabile 2 meno 18). Il maggior peso della variabile 1 rispetto alla 2 riflette<br />

il fatto che la prima componente ha un orientamento più prossimo all’asse della specie 1 che non della specie 2.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!