12.07.2015 Views

Classificatori Statistici e Reti Neurali nella segmentazione ... - Circe

Classificatori Statistici e Reti Neurali nella segmentazione ... - Circe

Classificatori Statistici e Reti Neurali nella segmentazione ... - Circe

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

DISCover, un prodotto globale ad 1-km, sotto il coordinamento dell’International Geosphereand Biosphere Programme’s Data and Information System (IGBP-DIS, Loveland e Belward1997).CORINE è il prodotto più importante, largamente utilizzato come informazione ausiliaria nelnostro lavoro. E’ ottenuto per interpretazione visuale di immagini ad alta risoluzione(LANDSAT-TM and SPOT-XS) alla scala 1:100.000, con l’utilizzo simultaneo diinformazione ancillare. La legenda di CORINE, sviluppato su base nazionale dagli esperti diciascun paese, include 44 classi gerarchicamente ordinate, orientate al paesaggio edall’ecologia. Si tratta del database esistente più dettagliato sulle coperture in una larga partedel continente europeo.CORINE presenta tuttavia parecchi inconvenienti. Iniziato nel 1986, non è ancora terminato,il che comporta notevoli differenze nelle date di acquisizione delle immagini utilizzate neidiversi paesi. Inoltre, la soggettività dell’interpretazione nel processo di costruzione deldatabase e la dipendenza di alcune classi da dati ancillari creeranno non pochi probleminell’aggiornamento, previsto nel periodo 2000-2003.Figura 1- Le Aree di Interesse (AoI) assegnate al gruppo operante presso l’IUAV. Le freccepuntano alle parti che mancavano di informazione CORINE.L’obiettivo principale di PELCOM era di valutare diverse metodologie per mappare lecoperture del suolo del Continente Europeo e le loro variazioni usando le immagini AVHRR,arrivando a formulare una metodologia consistente per la costruzione e l’aggiornamentoperiodico di un database delle coperture ad 1.1 km, da utilizzare come input per studi diimpatto ambientale e ricerche sul clima.


Gli obiettivi si possono così sintetizzare:• formulazione di una nomenclatura di coperture obiettivo sulle quali esista consenso;• definizione di una metodologia di classificazione basata su immagini AVHRR edinformazioni ancillari;• definizione di una metodologia volta a sorvegliare i cambiamenti nelle coperture;• applicazione della metodologia di classificazione a diverse aree vaste;• sperimentazione del database delle coperture quale input per alcuni modelli climatici edambientali.L’Europa è stata divisa in regioni, attenendosi per quanto possibile agli strati individuati dalprogetto europeo FIRS (Kennedy ed al., 1993). Ogni regione è stata presa in carico da unpartner di progetto.Vari insiemi di immagini NOAA-AVHRR, sia multi-spettrali (giornaliere) che multitemporali(serie storiche), provenienti da diverse fonti, sono state prese in considerazionequali possibili input per la classificazione. In particolare, immagini provenienti dall’archivioMARS (Monitoring Agriculture by Remote Sensing) del Joint Research Center comunitario diIspra, immagini pre-elaborate secondo il metodo SMART (Loudjani ed al., 1996); immaginiricevute dal Centro EROS dell’US Geological Survey, e già utilizzate per la classificazionecondotta a livello planetario dal progetto IGBP (International Geosphere and BiosphereProgramme); immagini elaborate e distribuite dal DLR (Deutsches Zentrum für Luft undRaumfahrt, Berlin). IGBP ha altresì fornito una trentina di immagini ad alta risoluzione(LANDSAT e SPOT) utilizzate <strong>nella</strong> fase di validazione della mappa classificata prodotta daPELCOM.Dopo una serie di prove preliminari ed un accurato confronto delle caratteristiche dei diversiarchivi, con particolare attenzione all’accuratezza geometrica ed alla percentuale di pixelcontaminati da nuvole, si è deciso di utilizzare per la classificazione finale una serie storica di20 immagini dell’Indice di Vegetazione (NDVI), relative all’anno 1997 e prodotte dal DLR.Dalle prime prove condotte è emerso con evidenza che la sola informazione satellitare nonbastava per costruire una classificazione soddisfacente. Infatti, pixel di 1.1 km. includonospesso molte coperture diverse, e le curve temporali dei loro valori NDVI risultano pertantopoco caratterizzate. Era dunque necessario ricorrere a qualche tipo di informazione ancillare,ma questo poneva l’interessante problema metodologico di come integrare <strong>nella</strong>classificazione l’informazione ancillare disponibile (la conoscenza a priori). Di solito,l’informazione ancillare serve a formulare un insieme di “regole” da applicare ai risultati dellaclassificazione per eliminarne incoerenze o assurdità. I processo viene così scisso in due fasi:una classificazione preliminare che opera a partire dalla sola informazione radiometrica,seguita da una fase di correzione in base a regole formulate dall’esperto.


Tra i molti database ancillari utilizzati il più interessante consisteva in una versione raster(purtroppo ancora incompleta) di CORINE, ricampionata a 275 m cosicché un pixelPELCOM (1.1 km) equivaleva esattamente a 4x4 pixel CORINE.2.2 La sequenza di operazioni utilizzate <strong>nella</strong> classificazioneSi è seguito un approccio supervisionato, con le seguenti due fasi per ciascuna Area diInteresse:a) selezione di un insieme opportuno di pixel puri (da CORINE) per ciascun tema PELCOMper cui ciò risultava possibile. Poiché i profili dei cosiddetti “pixel puri” relativi a temidiversi risultavano a volte simili in modo fuorviante, l’insieme di addestramento è statomigliorato iterativamente (cfr. sez. 2.4).b) assegnazione di ciascun pixel da classificare al tema PELCOM più appropriato sulla basedella sua distanza di Mahalanobis (sez. 2.3) dalla firma spettrale media del tema, calcolata<strong>nella</strong> fase a).Ogni operazione di classificazione, sia <strong>nella</strong> fase di apprendimento che in quella operativa diassegnazione, consiste sempre di un’Analisi in Componenti Principali (PCA) seguita daun’assegnazione in base alle sue distanze di Mahalanobis dai temi.Nella PCA soltanto i pixel di addestramento vengono trattati come attivi (contribuiscono cioèalla determinazione della struttura dello spazio fattoriale: assi ed autovalori associati). Loscopo è di ridurre la dimensionalità della rappresentazione: le 20 variabili in input si riduconoper lo più a 4-5 componenti principali, che riassumono oltre il 95% della varianza globaledella tavola dei dati. I valori delle componenti principali vengono calcolati anche per ognialtro pixel da classificare (considerato come supplementare) e registrati su file.La procedura di assegnazione opera sulle componenti principali calcolate <strong>nella</strong> faseprecedente. A partire dall’insieme dei pixel di training, si calcolano la firma spettrale media(profilo medio) e la matrice di varianza-covarianza per ciascun tema, assegnando poi ciascunpixel al tema dal quale la sua distanza di Mahalanobis risulta minima.Nella fase a) di selezione iterativa dei migliori pixel puri rappresentativi delle classi questasequenza opera sui soli pixel “puri” candidati. Nella fase b) di classificazione vera e propria lasequenza viene applicata a tutti i pixel da classificare.2.3 Perché la distanza di MahalanobisLa distanza di Mahalanobis di un generico pixel i, descritto da un vettore di variabili x i , da untema j, la cui firma media (rispetto allo stesso insieme di variabili) è µ j , è espressa dalladist(i,µ j ) = (x i - µ j ) -1 Σ-1 j (xi - µ j )La firma spettrale µ j del tema j è la media delle firme di tutti i pixel “puri” assunti comerappresentativi di quel tema; Σ j è la matrice di varianza-covarianza delle variabili descrittive(quelle iniziali, oppure le componenti principali costruite a partire da esse), ancora calcolatacalcolata sull’insieme dei pixel puri del tema j.


E’ importante rilevare che, se si opera sulle componenti principali, la matrice di varianzacovarianzaglobale (cioè calcolata a partire dall’insieme di tutti i pixel puri), è diagonale percostruzione, mentre la matrice Σ j calcolata sui pixel afferenti al tema j è in generale nondiagonale.La distanza di Mahalanobis tiene conto dell’anisotropia dello spazio di rappresentazione,dovuta al fatto che i pixel rappresentativi di un dato tema sono in genere distribuiti in modonon-sferico attorno alla firma spettrale media del tema (il centro di classe). Ciò fa sì che laprobabilità di assegnazione di un pixel ad una classe dipenda non solo dal valore della suadistanza euclidea dal centro di classe, ma anche dalla direzione.2.4 La selezione dei pixel di addestramentoPer determinare le firme spettrali medie dei diversi temi, si sono estratti tutti i pixel PELCOMche avevano almeno 14 sub-pixel CORINE (su 16) appartenenti al medesimo tema. In primaipotesi, tali pixel sono stati considerati come rappresentativi del tema (cioè puri), e sono statisuddivisi in due insiemi, da usare l’uno per l’addestramento e l’altro per la verifica.Purtroppo, le cose non erano così semplici per le ragioni seguenti:• era impossibile ottenere ovunque una sufficiente coerenza geometrica tra le immaginiNDVI usate come input per la classificazione e l’immagine CORINE, dalla quale sonostati estratti i pixel “puri”;• anche ammesso che la co-registrazione fosse perfetta, il carattere di alcuni pixelpotrebbero essere cambiato durante il lasso di tempo tutt’altro che trascurabile trascorsotra la produzione dei due tipi d’immagine (va comunque rimarcato che l’evidenziarequesti cambiamenti era uno degli obiettivi del lavoro);• il processo di montaggio (“compositing”) usato per creare il database NDVI usato comeinput opera su immagini giornaliere non perfettamente co-registrate. Ciò è dimostrato dalgrado di sfocamento “blurring” apprezzabile su elementi di piccola dimensione come certilaghi o centri urbani, o lineari come le linee di costa. Ne consegue un’appiattimento dellanitidezza spaziale dell’immagine dovuto al mediarsi dei caratteri di pixel contigui.Per far fronte a questi problemi di cattiva registrazione, appare necessario porre la massimacura <strong>nella</strong> scelta dei pixel da utilizzare per il calcolo delle firme spettrali dei temi. Per questo,i pixel puri candidati alla scelta sono stati sottoposti ad un processo iterativo volto adeliminare quelli i cui caratteri attesi non erano confermati dal confronto PELCOM-CORINE.In generale, il procedimento utilizzato può applicarsi ad ogni tipo di problema, quando siabbiano buone ragioni per credere che per ciascun tema il nocciolo centrale dei pixel diaddestramento lo rappresenti effettivamente, mentre quelli “inaffidabili” sono i più lontanidalla firma spettrale media calcolata. Si è ottenuto alla fine del processo un insieme di pixel ditraining numeroso per alcuni temi, quali arabile o foresta di latifoglie, meno numeroso peraltri temi più rari. Questi sono i pixel poi utilizzati per caratterizzare i temi.


Figure 2 – Italia del Nord (ITN): distribuzione dei candidati pixel puri sul primo pianofattoriale all’inizio della procedura di selezione.ArabileRisaieVignetiFruttetiOlivetiPascolicoltivatiForeste dilatifoglieForeste diconifereForestemistePascolinaturaliSuoli nuditotaleAffidabilitàArabile 14436 215 61 16 2 6 34 1 5 0 1 14777 97.7Riso 219 857 0 0 0 0 0 0 0 0 0 1076 79.6Vigneti 199 0 77 2 0 3 22 3 2 0 0 308 25.0Frutteti 30 0 9 41 0 6 134 40 43 4 0 307 13.4Oliveti 9 0 0 0 32 0 4 0 4 2 0 51 62.7Pascoli colt. 482 0 14 21 12 72 147 41 31 5 0 825 8.7Latifoglie 9 0 3 3 0 3 3949 18 167 7 0 4159 95.0Conifere 45 0 4 6 1 0 87 224 135 14 4 520 43.1Miste 28 0 1 10 0 6 494 97 183 33 2 854 21.4Pascoli nat. 18 1 0 2 0 1 509 85 131 98 6 851 11.5Suoli nudi 96 0 1 0 0 3 24 47 58 24 189 442 42.8Totale 15571 1073 170 101 47 100 5404 556 759 187 202 24170Accuratezza 92.7 79.9 45.3 40.6 68.1 72.0 73.1 40.3 24.1 52.4 93.6Tabella 1: Italia del Nord (ITN) : pixel candidati da CORINE, matrice di confusione primadella procedura iterativa di selezione. Le righe danno il tema al quale il pixel vieneassegnato dal classificatore dopo l’istruzione, le colonne danno il tema del pixel inCORINE. L’alta dispersione dei pixel appartenenti allo stesso tema in CORINE,ben visibile in figura 2, è responsabile dell’elevato grado di confusione.La situazione all’inizio della procedura di selezione è illustrata dalla tabella e dalla figura quisopra, relative all’area ITN (Nord Italia). La figura 2 mostra la dispersione, nel piano delle


prime due componenti principali, dei pixel puri considerati inizialmente. Insieme, le duecomponenti riassumono il 77.5% della varianza globale. Il grado di confusione è evidente, edè confermato dalla tabella 1.Figura 3- La nuvola dei pixel puri ritenuti dopo sei iterazioni, proiettata sul piano delle primedue CP. I temi appaiono definiti molto meglio che <strong>nella</strong> figura 2.ArabileRisaieVignetiFruttetiOlivetiPascolicoltivatiForeste dilatifoglieForeste diconifereForestemistePascolinaturali.Suoli nuditotaleAffidabilitàArabile 14414 98 4 0 1 0 1 1 0 0 0 14519 99.3Risaie 0 603 0 0 0 0 0 0 0 0 0 603 100.0Vigneti 0 0 47 0 0 0 0 0 0 0 0 47 100.0Frutteti 0 0 0 25 0 0 0 0 0 0 0 25 100.0Oliveti 1 0 0 0 29 0 0 0 0 0 0 30 96.7Pascoli coltiv. 0 0 0 1 0 66 0 1 0 0 0 68 97.1Latifoglie 0 0 0 0 0 0 3693 0 2 0 0 3695 99.9Conifere 1 0 0 0 0 0 3 194 2 1 0 201 96.5Miste 0 0 0 6 0 0 13 0 137 1 0 157 87.3Pascoli natur. 0 0 0 0 0 0 18 0 7 85 0 110 77.3Suoli nudi 4 0 0 0 0 0 1 1 5 2 189 202 93.6Totale 14420 701 51 32 30 66 3729 197 153 89 189 19657Accuratezza 100.0 86.0 92.2 78.1 96.7 100.0 99.0 98.5 89.5 95.5 100.0Tabella 2 – Matrice di confusione dei pixel puri, situazione dopo sei iterazioni. I valori moltosuperiori di affidabilità ed accuratezza confermano l’accresciuta compattezza,evidente <strong>nella</strong> figura 3, dei gruppi di pixel rappresentativi dei diversi temi.


Allo scopo di selezionare i pixel più affidabili, vengono eliminati ad ogni iterazione quelli chenon si trovano sulla diagonale principale della matrice di confusione (tabella 1). Si tratta dipixel i cui caratteri secondo CORINE non vengono confermati dall’assegnazione di controllooperata dopo aver calcolato le firme spettrali medie dei diversi temi. Per ciascun tema, si puòdunque pensare che i pixel che rimangono alla fine della procedura costituiscano un noccioloomogeneo ed affidabile, utilizzato per l’addestramento del classificatore nell’iterazioneseguente.Per l’area ITN sono state necessarie sei iterazioni per ottenere una matrice quasi diagonale. Lasituazione finale è mostrata dalla figura 3 e dalla tabella 2.2.5 Il metodo di classificazione “knowledge-based”Le classificazioni costruite sulla sola informazione radiometrica si dimostrarono prestoinsoddisfacenti. Il mix di temi in uno stesso pixel, insieme alle altre ragioni esposte all’iniziodella sezione 2.4, contribuisce, specialmente nelle regioni mediterranee, a rendere i profilimolto simili. Ne conseguiva una dispersione quasi casuale dei temi rari sopra l’immagineclassificata, il presentarsi di qualche tema a quote alle quali non poteva trovarsi, ecc. Perraddrizzare un po’ le cose, l’applicazione di opportune regole di decisione apparivaindispensabile.Le regole di decisione servono a cambiare la classe di assegnazione di alcuni pixel in modo daadattare i risultati all’informazione ausiliaria disponibile, assunta come vincolo. Va tuttaviaosservato che le regole andrebbero applicate simultaneamente e non sequenzialmente,altrimenti l’ordine in cui i temi vengono considerati <strong>nella</strong> riassegnazione risulta significativo.Le regole andrebbero dunque applicate iterativamente, mantenendo la possibilità di tornare suicambiamenti introdotti nei passi precedenti. La cosa non è facile.Si è allora cercato di integrare all’interno della procedura stessa di classificazionel’informazione ausiliaria più rilevante, cioè il modo in cui i diversi temi si distribuivanorispetto all’altitudine, calcolabile da CORINE e da un DTM (Digital Terrain Model),ottenendo una classificazione condizionata dall’informazione ausiliaria assunta (knowledgebasedclassification). Veniva così meno la necessità di formulare delle regole di decisioneesplicite. I risultati sono stati incoraggianti, e ci si propone di generalizzare il software cheimplementa il metodo, per ora fortemente dipendente dalla struttura dei dati utilizzati daPELCOM.L’assegnazione dei pixel viene operata in base alle loro distanze di Mahalanobis dai temi,corrette però in modo da tenere conto, anche se in forma non rigida, della distribuzione deitemi sull’altitudine.Nel nostro caso, la distribuzione dei temi sopra opportuni intervalli di altitudine, usata comeobiettivo da riprodurre (target) viene desunta da CORINE. Giova comunque sottolineare cheper l’applicazione del metodo è sufficiente una tabella che rappresenti una qualchedistribuzione statistica desunta da informazione ausiliaria, da assumere come vincolo. Essa


dipende ovviamente dalla natura della particolare classificazione da costruire: ad esempio,informazioni di fonte amministrativa come la distribuzione di vari tipi di coltivazioni perunità amministrativa; l’area costruita/non costruita per sezione censuaria, ecc. In generale,ogni tipo di informazione che la classificazione debba riprodurre, nota a priori, e che possaessere ricalcolata ad ogni iterazione in una procedura di classificazione che si migliora perapprossimazioni successive.Riportiamo una descrizione dettagliata dell’algoritmo, applicato per ciascuna AoI dopo averselezionati i pixel di training come descritto <strong>nella</strong> sezione 2.3.1. Per ciascun tema attivo PELCOM (cioè per ogni tema per cui si disponga di un numerosufficiente di pixel di addestramento) vengono calcolati la firma spettrale media, lamatrice di varianza-covarianza e la sua inversa. Questi elementi sono necessari per ilcalcolo delle distanze di Mahalanobis.2. L’altitudine viene suddivisa in un numero di intervalli scelti dall’analista (noi ne abbiamousati dodici, di ampiezza diversa) e da CORINE si calcola la frequenza di ciascun tema inogni intervallo. Se ne ottiene una tavola di contingenza T (Target), la cui generica entrataT ij (i=1..n_elev and j=1..n_themes) dà la frequenza del tema j nell’i-esimo intervallo diquota. Nel nostro caso, abbiamo assunto come unità contate i pixel CORINE di 275 m.3. Vengono calcolate le distanze di Mahalanobis di ogni pixel da classificare da ciascun temaattivo. Tali distanze vengono registrate in un file temporaneo, da rileggere ad ogniiterazione.4. La tabella obiettivo T calcolata al punto 2 viene corretta in modo da includere il contributodei temi CORINE non assunti come attivi <strong>nella</strong> prova. Si tratta di temi che non hanno unequivalente univoco <strong>nella</strong> legenda PELCOM, o per i quali i pixel di training erano troppopochi. Tutte le entrate di T vengono convertite in percentuali sul totale della tavola.5. Viene introdotta una tavola di fattori correttivi CF[n_elev, n_themes], da applicare alledistanze di Mahalanobis. Essi verranno aggiornati ad ogni iterazione. Tutte le entrate CF ijdella tavola, vengono inizializzate ad 1, oppure ad un valore convenzionale che significaimpossibile quando la corrispondente entrata T ij della tavola-obiettivo T è vuota (nonesiste cioè in CORINE, alla quota i, alcun pixel appartenente al tema j).Iniziano a questo punto le iterazioni il cui numero, insieme al valore iniziale alpha0 delcoefficiente di correzione, sono scelti dall’analista.6. Vengono rilette da file le distanze di Mahalanobis di ogni pixel PELCOM dai vari temi. Aciascuna distanza viene applicato il fattore di correzione CF ij proprio della sua elevazione ied del tema j cui la distanza si riferisce, ed il pixel viene assegnato al tema con distanzacorretta minima. Concluse le assegnazioni, viene calcolata una matrice C[n_elev,n_themes] che distribuisce i pixel secondo la loro elevazione ed il tema corrente diappartenenza. Le entrate della tavola corrente C vengono convertite in valori percentualisul totale della tavola.


7. T viene assunto come la distribuzione percentuale attesa obiettivo (target) dei pixel perelevazione e temi, mentre C rappresenta la distribuzione corrente ad ogni iterazione. Ifattori correttivi CF vengono ridefiniti in modo da forzare C verso T, ma con una certaflessibilità: anche T viene aggiornata, forzandola leggermente verso C. In breve, laclassificazione corrente viene forzata a riprodurre la tavola elevazione/temi dedotta daCORINE, ma al medesimo tempo anche la tavola derivata da CORINE viene corretta pertener conto in qualche modo dell’evidenza empirica espressa dai dati radiometrici.L’aggiornamento di CF e C ad ogni iterazione è condotto come segue:• Prima viene modificato il valore del coefficiente alpha, diminuendolo man mano chele iterazioni procedono( NIterations − current _ iteration)alpha = alpha0NIterationsdove NIterations è il numero di iterazioni, current_iteration è il numero d’ordinedell’iterazione corrente (la prima è 0) e alpha0 è un valore iniziale stabilitodall’analista. Nelle nostre prove abbiamo usato valori di alpha0 tra 0.1 e 0.3, mentreun numero di iterazioni tra 20 e 40 si sono dimostrate sufficienti a produrre unaconvergenza soddisfacente.• Poi, per ogni cella per la quale CF ij non è impossibile (vale a dire, per ogni tema jcompatibile con la quota i del pixel), il fattore di correzione viene modificato in mododa rendere l’assegnazione meno probabile se C ij > T ij , e viceversa:CFijCij−Tij= CFij∗(1+ alpha )( C + T ) / 2Anche T ij viene modificato avvicinandolo al suo omologo C ij :TijCij−Tij= Tij∗( 1+k ∗alpha)C + Tdove k è una costante compresa tra 0 e 0.5, stabilita dall’analista.8. Una volta aggiornate le matrici CF and C, si ritorna al punto 6 per un altro ciclo diassegnamento/correzione.Si può notare che quelli che abbiamo chiamato Fattori Correttivi CF ij possono essere visticome delle probabilità a priori aggiornate continuamente, desunte da una conoscenza a priorinon rigida. L’approccio si può dunque considerare di tipo bayesiano.Si noti che il tema cui appartiene il pixel in CORINE non viene mai preso in considerazionenel calcolo delle distanza o nell’assegnazione. Vengono considerate solo le matrici T e C, cheesprimono le distribuzioni aggregate, rispettivamente obiettivo e corrente, dei temi sugliintervalli di elevazione. La distribuzione spaziale dei temi prodotta dalla classificazione finalerisulta ben riconoscibile, ed in generale accordo con CORINE.ijijijij


2.6 ValidazioneSi sono condotte validazioni basata su CORINE sia sull’intera regione, che separatamente perciascuna Area di Interesse. Per la validazione si usano pixel PELCOM puri almeno per il 75%(cioè con almeno 12 sub-pixel CORINE su 16 appartenenti allo stesso tema), benintesoescludendo quelli già utilizzati per l’addestramento. La tabella 3 mostra la matrice diconfusione complessiva per l’Europa Meridionale. L’ordine dei temi e la loro aggregazionedifferiscono da quelli visti in precedenza per ragioni che non vale qui la pena di menzionare.Tabella 3 - Matrice di confusione per i pixel puri almeno al 75% in CORINE, usati per laverifica. Le colonne danno il tema dei pixel in CORINE, le righe il tema al quale ipixel vengono assegnati dal classificatore.Il riconoscimento è buono nel caso di temi frequenti, come l’arabile o le foreste, mentre lecose vanno diversamente per i temi meno frequenti, come le coltivazioni perenni, o i pascoli.La cattiva registrazione delle immagini compromette soprattutto il riconoscimento dei temirari, i cui pixel sono spesso isolati, mentre influenza meno temi che si presentino con blocchiestesi di pixel. Un esame area per area mostra anche che l’accuratezza migliora quando siadisponibile un numero elevato di pixel di apprendimento.Se invece di un confronto pixel a pixel, fortemente disturbato da problemi di registrazione, siopta per un calcolo della distribuzione spaziale dei temi che assuma una maglia più larga, sivede che le regioni dove i temi sono presenti vengono colte abbastanza bene.3. L’USO DELLE RETI NEURALI3.1 Considerazioni generaliIn altri lavori (ad es., Griguolo, 1998) abbiamo sperimentato l’uso di <strong>Reti</strong> <strong>Neurali</strong> nonsupervisionate(le Mappe auto-organizzanti di Kohonen) per la classificazione su insiemi diimmagini satellitari. Qui intendiamo occuparci dell’adattamento della metodologia descritta<strong>nella</strong> sezione 2 al caso di un classificatore neurale feed-forward, addestrato in modo


supervisionato con il metodo di RetroPropagazione dell’errore (BackPropagation). Si tratta diun tipo di rete descritto in numerosi lavori. Tra i più noti, si vedano McClelland e Rumelhart(1986, cap. 8) e Bishop (1995, cap.7).Il metodo descritto <strong>nella</strong> sezione precedente ha certamente almeno un inconveniente.L’Analisi in Componenti Principali lavora esclusivamente per trasformazioni lineari: èdunque in grado di cogliere bene le relazioni lineari esistenti tra le variabili descrittive, maignora eventuali relazioni non lineari. In tal senso, il classificatore statistico da noi utilizzatonel progetto PELCOM è limitato. Una Rete Neurale invece apprende in grande libertà dai datiche le vengono presentati, senza l’obbligo di doversi attenere ad un modello imposto a priori.Riesaminando molte volte l’insieme di addestramento (training set), costituito da coppie divettori che rappresentano rispettivamente un pattern di input e l’output desiderato incorrispondenza, la rete modifica i propri parametri interni (certamente i pesi, ma a volte anchela sua stessa struttura) in modo da fornire, a fronte di ciascun input, l’output richiesto.Ovviamente, ciò è possibile solo se l’insieme di apprendimento non è internamentecontraddittorio, non come ad esempio pixel con descrizioni identiche o molto simili, maassegnati a temi diversi.Dunque, anche con una rete neurale è importante ripulire l’insieme di apprendimentoeliminando i casi inaffidabili. Anche se i pixel vengono indicati uno per uno, per presuntaconoscenza diretta, spesso le cose non sono come sembrano. Inoltre, se vogliamo che venganocolte anche eventuali relazioni non lineari, sembra importante che sia la stessa rete adeffettuare la selezione dei pixel che entreranno a far parte dell’insieme di apprendimento,adattando il procedimento descritto <strong>nella</strong> sezione 2.4 per il classificatore statistico.3.2 I dati, la rete, il softwareLa prova empirica descritta nel seguito è stata svolta sui dati PELCOM per l’ItaliaMeridionale (ITS), escludendo la Puglia (classificata a parte) per ragioni di registrazionegeometrica.Ogni pixel è ancora descritto da un vettore di 20 valori dell’Indice di Vegetazione, distribuitisull’anno 1997. I possibili temi di assegnazione (la legenda PELCOM) sono in teoria 13; inpratica, alcuni risultano vuoti perché i pixel di training corrispondenti sono troppo pochi.Si è utilizzata una rete con 20 nodi di input (cui presentare i 20 valori di ciascun pattern) 13nodi di output (il numero delle possibili classi di assegnazione), 17 nodi in uno stratonascosto.Il software rinvenibile in Internet è in generale adatto a trattare un basso numero di casi,mentre nei problemi di classificazione su immagini satellitari i pixel sono molti, e dev’esserenumeroso l’insieme di addestramento. Pacchetti general-purpose, come SNNS o il RochesterSimulator, in grado di implementare molte architetture diverse, sono fortemente appesantiti inesecuzione da overheads consistenti. Abbiamo perciò preferito scrivere un softwareappositamente mirato, snello ed efficiente, che leggesse direttamente i dati delle immagini in


formato binario. Dopo le prime prove, vista la lentezza della fase di apprendimento, ilprogramma è stato suddiviso in due parti: la prima implementa la fase di istruzione e poi salvala rete; la seconda ricarica la rete ed assegna tutti i pixel ai temi, adattando il metodoknowledge-based descritto in precedenza.I pattern di input consistono di venti valori tra 0 ed 1, che ricodificano on-the-fly i valori deipixel nelle venti immagini. Il pattern di output (target) è un vettore di 13 componenti,corrispondenti ai temi. Per i pixel di addestramento la componente relativa al tema cui il pixelappartiene vale 1, le altre 0. Nella fase di assegnazione dei pixel il cui tema non è noto, la retegenera un pattern di attivazione consistente in un valore per ogni nodo (tema) di output, ed ilpixel viene assegnato al tema cui corrisponde l’attivazione massima.3.3 La fase di apprendimentoLa rete utilizza una procedura di BackPropagation con momento per correggere i propri pesidopo la presentazione di ciascun pixel. I coefficienti che controllano l’apprendimento ed ilmomento, così come le condizioni di arresto, sono stabiliti dall’analista. Come funzione ditrasferimento è stata usata una logistica.L’apprendimento avviene per cicli. L’analista stabilisce il numero di presentazioni dell’interoinsieme di training da realizzare in ciascun ciclo (50 presentazioni nelle prove empiriche danoi condotte). In realtà, ogni volta il pixel da presentare viene scelto casualmente, ma poichési è utilizzato un buon generatore di numeri casuali e 50 è un numero abbastanza elevato, lefluttuazioni <strong>nella</strong> frequenza di presentazione dei vari pixel non sono eccessive (comprese tra40 e 60 quasi per tutti).Terminato un ciclo, viene calcolato l’errore globale (somma estesa a tutti i pixel degli scartiquadratici tra i vettori di attivazione calcolati ed i vettori obiettivo). Se il suo valore è minoredi quello del ciclo precedente, la rete viene salvata e si continua. Se invece è aumentato, vienericaricata la rete salvata alla fine del ciclo precedente e l’apprendimento continua cercandoqualche altro percorso che porti ad una diminuzione dell’errore (la casualità nell’ordine dipresentazione dei pixel garantisce un’evoluzione diversa). L’addestramento si concludequando per un numero stabilito dall’analista di cicli consecutivi (tre nelle nostre prove) ilvalore dell’errore non decresce rispetto al minimo già raggiunto.Riportiamo qui sotto (tabella 4) la situazione dopo il primo apprendimento (concluso doposette cicli, ciascuno di 50 presentazioni di tutti i 13286 pixel inizialmente candidati). L’erroreglobale diminuisce solo da 2769 a 2346, segno che l’apprendimento è tutt’altro chesoddisfacente: la rete viene confusa dalla presenza tra i pixel di addestramento di numerosioutliers, i cui vettori descrittivi non sono coerenti con il tema cui dovrebbero appartenere.La tabella 4 mostra come la rete assegni ai temi gli stessi pixel utilizzati per l’addestramento:la riga riporta la classe (corrente) cui i pixel in ciascuna cella vengono assegnati dalla rete, lacolonna la classe cui essi appartengono in CORINE. Due temi (pascoli coltivati e foreste


miste), presenti ma poco numerosi tra i pixel di addestramento, non vedono alcun pixel loroassegnato dalla rete addestrata, e vengono pertanto rimossi.ArabileIrrigatoVignetiFruttetiOlivetiPascolicoltivatiForeste dilatifoglieForeste diconifereForestemistePascolinaturaliMacchiamedit.err.Suoli nuditotaleAffidabilitàArabile 5063 203 123 101 185 36 83 10 8 241 31 34 6118 82.8Irrigato 62 600 7 99 36 2 9 6 0 1 4 4 830 72.3Vigneti 26 10 264 15 35 0 1 0 1 9 0 1 362 72.9Frutteti 45 45 8 394 28 0 7 1 0 8 1 4 541 72.8Oliveti 151 34 26 67 769 16 84 65 23 49 22 9 1315 58.5Latifoglie 130 13 1 158 94 13 2646 121 145 188 42 5 3556 74.4Conifere 20 0 0 2 14 1 24 147 9 0 0 0 217 67.7Pascoli nat. 32 1 1 4 18 1 14 4 2 136 10 8 231 58.9Macchia med 3 0 0 0 6 0 1 0 0 7 15 0 32 46.9Suoli nudi 2 4 0 2 0 0 0 1 1 2 0 72 84 85.7Totale 5534 910 430 842 1185 69 2869 355 189 641 125 137 13286Accuratezza 91.5 65.9 61.4 46.8 64.9 = 92.2 41.4 = 21.2 12.0 52.6Tabella 4. Matrice di confusione dopo il primo addestramento. I 3180 pixel mal classificati(non appartenenti alle celle in grassetto), vengono esclusi prima di proseguirel’addestramento.ArabileIrrigatoVignetiFruttetiOlivetiForeste dilatifoglieForeste diconiferePascolinaturaliMacchiamedit.err.Suoli nuditotaleAffidabilitàArabile 5016 0 0 0 0 0 0 3 0 0 5019 99.9Irrigato 6 579 0 0 1 0 0 0 0 0 586 98.8Vigneti 0 0 240 0 0 0 0 0 0 0 240 100Frutteti 0 0 0 364 0 0 0 0 0 0 364 100Oliveti 0 0 0 1 736 0 1 0 0 0 738 99.7Latifoglie 0 0 0 0 0 2604 3 0 0 0 2607 99.9Conifere 0 0 0 0 0 0 133 0 0 0 133 100Pascoli nat. 0 0 0 0 1 0 0 114 0 0 115 99.1Macchia med 0 0 0 0 0 0 0 0 2 0 2 100Suoli nudi 0 0 0 0 0 0 0 0 0 70 70 100Totale 5022 579 240 365 738 2604 137 117 2 70 9874Accuratezza 99.9 100 100 99.7 99.7 100 97.1 97.4 100 100Tabella 5. Matrice di confusione al termine della selezione.L’addestramento prosegue automaticamente, ogni volta eliminando dall’insieme diapprendimento i pixel il cui tema non viene confermato. Si noti che non tutti gli errori sonoegualmente gravi: alcuni temi sono tra loro più simili di altri. Ad esempio, non appare grave la


assegnazione alla classe foresta di latifoglie di 145 pixel di foresta mista, mentre lo ècertamente l’assegnazione alla foresta di latifoglie di 5 pixel di suolo nudo. Probabilmentecolpa probabilmente della cattiva registrazione geometrica, rocce nude vicino ad un bosco…L’eliminazione dei primi 3180 pixel spuri fa diminuire l’errore globale da 2346 a ben 258. Inquesta prova l’addestramento procede per altre quattro fasi, rispettivamente di 4, 2, 6 e 4 cicli,che vedono l’errore globale diminuire da 2346 a 70. La tabella 5 mostra la situazione finale.Si noti che tra i 9874 pixel ritenuti alla fine della selezione solo due appartengono al temaarbusti (qui indicato come macchia mediterranea). E’ giocoforza escluderlo, mancando unnumero sufficiente di pixel affidabili che lo rappresentino.3.4 La fase di assegnazioneLa sperimentazione non è qui ancora completata: ci limitiamo dunque ad indicare come vengarealizzata l’integrazione dell’informazione ausiliaria (nel nostro esempio, la distribuzionedesunta da CORINE dei temi sulle elevazioni) <strong>nella</strong> procedura di assegnazione (cfr. sezione2.5).Terminato l’addestramento della rete descritto <strong>nella</strong> sezione precedente, i suoi parametrivengono salvati su file per venire ricaricati dal programma che gestisce la fase diassegnazione. Questa procede in modo iterativo, come descritto <strong>nella</strong> sezione 2.5, solo che inquesto caso la rete converte il vettore di input che descrive ciascun pixel in un vettore delleattivazioni, consistente nei 13 valori assunti dai nodi dello strato di output. Le attivazionigiocano qui il ruolo prima svolto dalle distanze di Mahalanobis. Alla prima presentazione diciascun pixel il patter di attivazione calcolato viene registrato su file, per essere ricaricato ecorretto durante le iterazioni successive.Ogni volta, il tema vincitore è quello cui corrisponde l’attivazione massima. Anche qui, adogni iterazione viene calcolata la tabella C che riporta la distribuzione corrente dei temi sulleelevazioni, ed i fattori di correzione CF vengono modificati in modo da avvicinare la matriceC alla matrice target T. I fattori correttivi appropriati per l’elevazione che caratterizza il pixelvengono applicati alle componenti del suo vettore di attivazione, ed il pixel viene assegnato altema con attivazione corretta massima. Come nel caso del classificatore statistico, ciò serve adincoraggiare l’assegnazione ai temi sotto-rappresentati.4. CONCLUSIONI PROVVISORIE E SVILUPPI FUTURIL’utilizzo dell’informazione ancillare durante il processo medesimo di costruzione dellaclassificazione, e non come fase di correzione separata, ha senza dubbio molto facilitato lacostruzione del database PELCOM, rimediando in modo elegante e poco faticosoall’inadeguatezza dell’informazione radiometrica. Il metodo appare promettente, ma è tuttoraimplementato in modo troppo dipendente dai caratteri particolari del problema affrontato dalprogetto PELCOM.


Un primo necessario passo consiste senza dubbio nel rendere più generale il software, così dapoterlo applicare a problemi di classificazione che utilizzino tipi diversi di informazioneancillare. Si è anche descritto un modo, ancora in via di sperimentazione, per estendere ilprocedimento ad un classificatore neurale feedforward.Gli sviluppi futuri prevedono di andare oltre la classificazione pixel a pixel, che appareinsufficiente per dare risposta ai problemi di conoscenza che riguardano le aree costruite. Inambiente urbano e peri-urbano resta la necessità di determinare in via preliminare, suimmagini satellitari ad alta risoluzione, quali pixel siano costruiti e quali no. Questo puòessere fatto con una classificazione automatica pixel a pixel, del tipo descritto in questolavoro, sia che venga usato un classificatore statistico che neurale. A partire da tale immagineclassificata sarà possibile un passo avanti <strong>nella</strong> determinazione automatica delle caratteristichedel territorio. L’idea è di costruire un classificatore neurale che operi su una finestra diconvoluzione di dimensioni opportune, fatta scorrere sull’immagine pre-classificata, e chericonosca nel gioco di contiguità tra pixel costruiti e no alcune tessiture aventi un particolareinteresse morfologico. L’idea è di addestrare inizialmente la rete, mediante esempi, alriconoscimento di un limitato numero di elementi morfologici importanti e semplici(blocchetti di pixel totalmente costruiti, discontinuità lineari, aree di risulta, ecc.) lasciandopoi alla rete stessa il compito di segnalare altre situazioni irriducibili alla casistica fornitale,che il ricercatore può esaminare per arricchire, quando sia il caso, l’insieme di istruzione.Sarà interessante confrontare, in questo tipo di problema, i risultati di un classificatore neuralecon quelli forniti da un automa cellulare.5. BIBLIOGRAFIABenediktsson A., Swain P.M., Ersoy O.K. (1990), Neural Networks versus Statistical Methodsin Classification of Multisource Remote Sensing Data, IEEE Transactions onGeoScience and Remote Sensing, vol. 28, n.4, 540-552.Bishop M.C. (1996), Neural Networks for Pattern Recognition, Clarendon Press, Oxford.CEC (1993) CORINE Land Cover technical guide, European Union, Directorate-GeneraleEnvironment, Nuclear Safety and Civil Protection. Luxembourg.Griguolo S. (1996) Classification on Sets of Remotely-Sensed Images: a VegetationMonitoring Model, in Binaghi E., Brivio P.A., Rampini A. (eds.), Soft Computing inRemote Sensing Data Analysis, World Scientific, Singapore, 235-244.Griguolo S. (1998) Land Cover from Satellite Imagery: which Classifier to use?, in T. K.Poiker, N. Chrisman (eds.), Proceedings of the 8 th International Symposium on SpatialData Handling, International Geographic Union, Vancouver, 55-64.Griguolo S. (1999) Land Cover Recognition: an Example of Knowledge-based Classification,in Cankut Ormeci (ed.), International Symposium on Remote Sensing & IntegratedTechnologies, Istanbul Technical University, Istanbul, 183-94.


van Katwijk V.F, Boersma W., Mucher C.A., Steinnocher K.T., Champeaux J.L., Wester K.,Griguolo S., Heunks C. (2000) Data Integration for Pan European Land CoverMonitoring"”, paper proposed for the EARSEL-2000 Conference.Kennedy P., Folving S., McCormick N. (1993) An introduction to the FIRS project,Proceedings of the International Conference on satellite Technology and GIS forMediterranean Forest Mapping and Fire Management, Thessaloniki, Greece, 294-304.Loveland T.R, Belward A.S. (1997) The IGBP-DIS global 1 km land cover data set,DISCover: first results. International Journal of Remote Sensing, 18, 3289-3295.Loudjani P., Pinty B., Verstraete M., The Smoothing Avhrr Reflectance Technique (SMART):a method for smoothing AVHRR reflectance time series, (in corso di pubblicazione)McClelland J.L., Rumelhart D.E. (1986), Parallel Distributed Processing, 2 voll., MIT Press,Cambridge, Ma.Mucher C.A., Steinnocher K.T., Champeaux J.L., Griguolo S., Wester K., Loudjani P. (1999)Land Cover Characterization for Environmental Monitoring of pan-Europe, inNieuwenhuis G.J.A., Vaughan R.A., Molenaar M. (eds.), Operational Remote Sensingfor Sustainable Debelopment, A.A. Balkema, Rotterdam, 107-12.Wang F. (1990) Fuzzy supervised Classification of Remote Sensing Images, IEEETransactions on GeoScience and Remote Sensing, vol. 28, n.2, 194-201.


ABSTRACTThis contribution describes the construction, via the automatic classification of remotelysensedimages, of a 1 km raster database of the land covers for pan-Europe. The database,produced in the framework of a research project funded by the European Commission, hasalready been used as input to some climatic and environmental dynamic models.The focus is mainly on the methodology. The project used a supervised statistic classifier,whose innovative features are described with some details, specially for what concerns theselection of the training set and the contextual use of available and relevant ancillaryinformation in the process of assignment of pixels to classes.Next, we refer shortly on the progress of a currently ongoing research, co-funded by the ItalianMinistry of Scientific Research (MURST), aimed at extending those innovations to differenttypes of ancillary information and to neural classifiers, to be used to process high-resolutionsatellite imagery in order to achieve an automatic recognition of the morphologic features ofbuilt-up areas.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!