Prati, pascoli e paesaggio alpino - SoZooAlp

Prati, pascoli e paesaggio alpino - SoZooAlp Prati, pascoli e paesaggio alpino - SoZooAlp

29.05.2013 Views

Axis 2 Fig. 4.5 Fig. 4.5 81 PRATI, PASCOLI E PAESAGGIO ALPINO Effetto Effetto della rimozione della rimozione di un outlier di un outlier in un in diagramma un diagramma di ordinamento di ordinamento Fig. 4.5 Effetto della rimozione di un outlier in un diagramma di ordinamento 90 80 70 60 50 40 30 20 10 0 -10 -20 -30 Axis 2 -60 90 80 Outlier Outlier 70 60 50 40 30 20 10 0 -10 -20 -30 -40 -60 -20 -40 -20 0 Axis 1 20 0 Axis 1 40 20 60 40 60 Axis 2 dalla struttura solo attraverso la disponibilità di dati ridondanti, ossia di repliche (più popolamenti della medesima biocenosi). La ridondanza, come visto, è necessaria anche per la produzione delle mappe della vegetazione o per ottenere stime delle medie e delle varianze. I campioni isolati, le disgiunzioni e il rumore ostacolano l’estrazione dell’informazione utile dalle matrici e vanno pertanto controllati. Ciò si realizza eliminando gli outlier, analizzando separatamente le disgiunzioni come fossero singole matrici e riducendo il più possibile il rumore. Su quest’ultimo aspetto, che rappresenta uno degli obiettivi principali del trattamento statistico multivariato, possono esercitare un certo influsso le preventive operazioni di scaling e pesatura dei dati. Tali procedure possono essere suggerite dalla necessità di calibrare da un lato il livello di approfondimento dell’analisi, dall’altro di riequilibrare o modificare la quota di informazione portata dalle variabili descrittive (le specie nella matrice di comunità, le variabili ambientali nella matrice ecologica). Lo scaling contempla procedure di standardizzazione e di trasformazione. Le prime sono modificazione dei dati basata su statistiche calcolate a partire dai dati stessi (varianza, intervallo di variazione, media etc.); le seconde sono basate su funzioni matematiche i cui parametri, almeno alcuni, sono estranei ai dati. La standardizzazione agisce essenzialmente sul peso delle variabili, mentre la trasformazione modifica più spesso la loro forma di distribuzione. Nelle matrici di comunità, lo scaling ha principalmente lo scopo di ridurre l’incidenza delle specie dominanti, enfatizzata dai dati quantitativi, e aumentare quella delle meno abbondanti, enfatizzata dai dati binari. Tecnicamente ciò si ottiene comprimendo i dati quantitativi ed eventualmente i dati ordinali di scale troppo ampie. Ovviamente, per i dati alternativi nessuna trasformazione è possibile. Nelle matrici ambientali, lo scaling si prefigge fondamentalmente di bilanciare il peso di variabili che differiscono nelle scale e/o unità di misura, o anche solo nell’ordine di grandezza. 90 80 70 60 50 40 30 20 10 0 -10 -20 -30 Axis 2 -60 90 80 70 60 50 40 30 20 10 0 -10 -20 -30 -40 -60 -20 -40 -20 0 20 0 40 20 Axis 1 Axis 1 60 40 60

Fausto Gusmeroli Le principali standardizzazioni e trasformazioni sono sinteticamente illustrate in tabella 4.4 8 . In ecologia, lo scaling è spesso usato, oltre che sulle variabili, anche sugli oggetti, seppur nella sola forma di standardizzazione. L’operazione, il cui scopo è di ridurre forti differenze di valore tra le unità di rilevamento, è applicabile quando tutte le variabili descrittive hanno la stessa unità di misura, come nella matrice di comunità, e serve in tal caso ad uguagliare le abbondanze complessive dei campioni. Le standardizzazioni più abituali sono la normalizzazione, quelle sul valore massimo, sull’intervallo di variazione e sul totale. A volte, come ad esempio in dati di frequenza, può tornare utile lo scaling congiunto delle variabili e degli oggetti, realizzabile con il doppio centraggio e la doppia standardizzazione sul totale. In ordine alla pesatura, essa consiste nell’attribuzione di pesi alle variabili descrittive in funzione dell’importanza che si vuole loro riconoscere. Interessa di regola le sole matrici ambientali, sebbene non sia esclusa, almeno in linea teorica, l’applicazione anche alle matrici di comunità. I parametri ambientali, infatti, possono essere tra loro incommensurabili, causa le differenti unità di misura, o avere diversa incertezza nella misurazione, o ancora diversa importanza, mentre le specie sono tra loro in tutto omogenee e la loro importanza può dunque essere meglio calibrata attraverso lo scaling. Per altro, pesatura e scaling non sono reciprocamente escludenti. Si potrebbe senz’altro applicare dapprima lo scaling, ottenendo un bilanciamento generale tra le variabili descrittive, e successivamente la pesatura, che consente di fissarne in modo più puntuale l’importanza relativa. Ovviamente, scaling e pesatura hanno senso solo laddove i metodi di analisi multivariata applicati non contemplino processi di auto-standardizzazione dei dati, che annullerebbero ogni effetto. Nella pesatura occorre inoltre considerare che il trattamento multivariato esamina le variabili globalmente e può dunque succedere che variabili apparentemente di scarso valore informativo, cui si sarebbe tentati di attribuire pesi marginali, si rivelino in combinazione molto informative. L’operazione è dunque delicata e va introdotta a ragion veduta. Esistono infine altre due possibili modi di pre-trattamento dei dati destinate a ridurre il rumore delle matrici. Uno è la formazione di campioni composti, utile anche per semplificare matrici molto grandi. I campioni composti derivano dal raggruppamento di oggetti tra loro simili, che vengono sostituiti nella matrice dal loro campione medio. Per la loro costruzione possono essere di ausilio le informazioni di carattere ambientale e le stesse tecniche multivariate impiegate per l’identificazione degli outlier e delle disgiunzioni. Il secondo modo è la cancellazione delle specie rare. Queste specie, pur essendo talvolta importanti in chiave sintassonomica, come sarà chiarito più avanti, non sono di solito valide indicatrici ecologiche, riflettendo piuttosto fasi transitorie e instabili della vegetazione. Oltre a portare poca informazione, possono disturbare l’analisi multivariata, comportandosi da outlier. Il concetto di rarità non è tuttavia ben definito: rigorosa- 8 Usando le tecniche multivariate per analizzare le matrici, si deve tenere presente che pochi sono i coefficienti adimensionali, quelli cioè indipendenti dalla scala e dall’unità di misura delle variabili e che possono quindi essere applicati sui dati non trasformati. Tra questi si possono ricordare il coefficiente di correlazione, l’indice di somiglianza di Gower (specifico per l’analisi di dati misti, ossia qualitativi e quantitativi) e gli indici probabilistici. Negli altri casi occorrerà valutare opportunamente il rescaling dei dati. Con dati misti ciò può però non essere sufficiente ad uniformare la matrice. In tale evenienza è giocoforza ricorrere ad una trasformazione che riporti tutte le variabili alla scala inferiore (secondo la processione illustrata sopra) o utilizzare le specifiche tecniche per dati misti, come il citato indice di Gower. 82

Axis 2<br />

Fig. 4.5 Fig. 4.5<br />

81<br />

PRATI, PASCOLI E PAESAGGIO ALPINO<br />

Effetto Effetto della rimozione della rimozione di un outlier di un outlier in un in diagramma un diagramma di ordinamento di ordinamento<br />

Fig. 4.5<br />

Effetto della rimozione di un outlier in un diagramma di ordinamento<br />

90<br />

80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

-10<br />

-20<br />

-30<br />

Axis 2<br />

-60<br />

90<br />

80<br />

Outlier Outlier<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

-10<br />

-20<br />

-30<br />

-40 -60<br />

-20 -40<br />

-20 0<br />

Axis 1<br />

20 0<br />

Axis 1<br />

40 20<br />

60 40<br />

60<br />

Axis 2<br />

dalla struttura solo attraverso la disponibilità di dati ridondanti, ossia di repliche (più<br />

popolamenti della medesima biocenosi). La ridondanza, come visto, è necessaria anche<br />

per la produzione delle mappe della vegetazione o per ottenere stime delle medie<br />

e delle varianze.<br />

I campioni isolati, le disgiunzioni e il rumore ostacolano l’estrazione dell’informazione<br />

utile dalle matrici e vanno pertanto controllati. Ciò si realizza eliminando gli outlier,<br />

analizzando separatamente le disgiunzioni come fossero singole matrici e riducendo<br />

il più possibile il rumore. Su quest’ultimo aspetto, che rappresenta uno degli obiettivi<br />

principali del trattamento statistico multivariato, possono esercitare un certo influsso<br />

le preventive operazioni di scaling e pesatura dei dati. Tali procedure possono essere<br />

suggerite dalla necessità di calibrare da un lato il livello di approfondimento dell’analisi,<br />

dall’altro di riequilibrare o modificare la quota di informazione portata dalle variabili<br />

descrittive (le specie nella matrice di comunità, le variabili ambientali nella matrice ecologica).<br />

Lo scaling contempla procedure di standardizzazione e di trasformazione. Le<br />

prime sono modificazione dei dati basata su statistiche calcolate a partire dai dati stessi<br />

(varianza, intervallo di variazione, media etc.); le seconde sono basate su funzioni matematiche<br />

i cui parametri, almeno alcuni, sono estranei ai dati. La standardizzazione agisce<br />

essenzialmente sul peso delle variabili, mentre la trasformazione modifica più spesso la<br />

loro forma di distribuzione. Nelle matrici di comunità, lo scaling ha principalmente lo<br />

scopo di ridurre l’incidenza delle specie dominanti, enfatizzata dai dati quantitativi, e<br />

aumentare quella delle meno abbondanti, enfatizzata dai dati binari. Tecnicamente ciò si<br />

ottiene comprimendo i dati quantitativi ed eventualmente i dati ordinali di scale troppo<br />

ampie. Ovviamente, per i dati alternativi nessuna trasformazione è possibile. Nelle matrici<br />

ambientali, lo scaling si prefigge fondamentalmente di bilanciare il peso di variabili<br />

che differiscono nelle scale e/o unità di misura, o anche solo nell’ordine di grandezza.<br />

90<br />

80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

-10<br />

-20<br />

-30<br />

Axis 2<br />

-60<br />

90<br />

80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

-10<br />

-20<br />

-30<br />

-40 -60<br />

-20 -40<br />

-20 0 20 0 40 20<br />

Axis 1 Axis 1<br />

60 40<br />

60

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!