Šablóna na písanie záverečných prác - Technická univerzita v ...

Technická univerzita v Kosˇiciach 

Fakulta elektrotechniky a informatiky 

Vyuzˇitie curiosity algoritmov pri klasifikácii 

satelitnyćh obrazov 

Michal Kapusta 

Diplomová práca 

Kosˇice 2007

Technická univerzita v Kosˇiciach 

Fakulta elektrotechniky a informatiky 

Katedra kybernetiky a umelej inteligencie 

Vyuzˇitie curiosity algoritmov pri klasifikácii 

satelitnyćh obrazov 

Diplomová práca 

Michal Kapusta 

Vedúci práce: Ing. Rudolf Jaksˇa, PhD. 

Konzultant práce: Ing. Rudolf Jaksˇa, PhD. 

Kosˇice 2007

Analyticky´ list 

Autor: Michal Kapusta 

Názov práce: Vyuzˇitie curiosity algoritmov pri klasifikácii satelitnyćh obrazov 

Jazyk práce: slovensky´ 

Typ práce: Diplomová práca 

Počet strán: 75 

Akademicky´ titul: Inzˇinier 

Univerzita: Technická univerzita v Kosˇiciach 

Fakulta: Fakulta elektrotechniky a informatiky (FEI) 

Katedra: Katedra kybernetiky a umelej inteligencie (KKUI) 

Sˇtudijny´ odbor: Umelá inteligencia 

Mesto: Kosˇice 

Vedúci práce: Ing. Rudolf Jaksˇa, PhD. 

Konzultant : Ing. Rudolf Jaksˇa, PhD. 

Dátum odovzdania: 2. 5. 2007 

Kl’účové slová: Klasifikácia, predikcia, neurónové siete, curiosity, LANDSAT, 

diplomová práca 

Citovanie práce: Michal Kapusta: Vyuzˇitie curiosity algoritmov pri klasifiká- 

cii satelitnyćh obrazov. Diplomová práca. Kosˇice: Technická 

univerzita v Kosˇiciach, Fakulta elektrotechniky a informatiky. 

2007. 75 s. 

Názov práce v AJ/NJ: Satellite Images Processing Using Curiosity Algorithms 

Kl’účové slová v AJ/NJ: Clasification, prediction, neural network, curiosity, LANDSAT, 

diploma

Abstrakt 

Táto diplomová práca sa zaoberá interaktívnym vy´berom trénovacích vzoriek pre učenie 

neurónovej siete s pouzˇitím metódy spätného sˇírenia chyby pomocou základnyćh princípov 

curiosity (zvedavosti). Práca obsahuje aj teoreticky´ úvod do problematiky klasifikácie 

satelitnyćh obrazov satelitu LANDSAT s vyuzˇitím neurónovyćh sietí. Popisuje návrh a 

implementáciu systému pre interaktívny vy´ber trénovacích vzoriek, ktory´ bol vytvoreny´ 

za účelom jeho vyuzˇitia pri viaceryćh experimentoch. 

Abstract 

This master thesis deals with interactive selection of training patterns for learning of neural 

network using backpropagation of error using the basic principles of curiosity. This work 

contains theoretical intruduction to classification of satellite images LANDSAT using 

neural networks. It also contains the implementation concept of system for interactive 

selection of training patterns, which was done for the intention of experiment’s utilization.

Na tomto mieste bude vlozˇené zadanie diplomovej práce

Čestné vyhlásenie 

Vyhlasujem, zˇe som diplomovú prácu vypracoval(a) samostatne s pouzˇitím uvedenej 

odbornej literatúry. 

Kosˇice 2. 5. 2007 . . . . . . . . . . . . . . . . . . . . . . . . . . 

Vlastnoručny´ podpis

Pod’akovanie 

Dˇ akujem vedúcemu a konzultantovi svojej diplomovej práce Ing. Rudolfovi Jaksˇovi, PhD., 

za mnozˇstvo odbornyćh pripomienok, rád a trpezlivosti pri tvorbe mojej diplomovej práce. 

Chcem vyjadrit’moju vel’kú vd’aku mojim rodičom a priatel’om za podporu počas celého 

môjho sˇtúdia.

Táto práca vznikla v Centre pre inteligentné technológie na TU Kosˇice ako súčast’ 

vy´skumnej úlohy „Metódy vy´počtovej inteligencie v Multiagentovyćh systémoch“ 

podporovanej agentúrou VEGA v rokoch 2005-2007. 

( www.ai-cit.sk )

Obsah 

Úvod 1 

1 Formulćia úlohy 3 

2 Princípy neurónovej siete 4 

2.1 Metóda spätného sˇírenia chyby . . . . . . . . . . . . . . . . . . . . . . . 4 

3 Adaptívna dôveryhodnost’a adaptívna curiosity 6 

3.1 Úvod do problematiky vy´počtovyćh algoritmov pracujúcich s dôveryhod- 

nost’ou a curiosity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

3.2 Adaptívna dôveryhodnost’. . . . . . . . . . . . . . . . . . . . . . . . . . 7 

3.2.1 Aproximátor dôveryhodnosti . . . . . . . . . . . . . . . . . . . . 9 

3.2.2 Pouzˇitie aproximátora dôveryhodnosti pre podporu učenia regulátora 11 

3.3 Adaptívna curiosity (zvedavost’) . . . . . . . . . . . . . . . . . . . . . . 12 

3.3.1 Základny´ princíp algoritmov curiosity . . . . . . . . . . . . . . . 12 

3.3.2 Predikcia priamej zmeny chyby . . . . . . . . . . . . . . . . . . 13 

3.3.3 Príklad agenta pohybujúceho sa v priestore podl’a J. Schmidhubera 14 

4 Neurónové siete pre klasifikáciu satelitnyćh dát 16 

4.1 Obrazové snímky satelitu LANDSAT . . . . . . . . . . . . . . . . . . . 16 

4.2 Príklady vyuzˇivajúce neurónové siete pre klasifikáciu satelitnyćh dát . . . 18 

5 Návrh a implementácia systému pre vy´ber 

trénovacích vzoriek 22 

5.1 Subsystém pre transformáciu snímkov LANDSAT do falosˇnyćh farieb, 

kvôli vizualizácii pre interaktívnu aplikáciu . . . . . . . . . . . . . . . . 22 

5.2 Subsystém pre vy´ber najlepsˇej trénovacej mnozˇiny . . . . . . . . . . . . 24 

5.3 Subsystém pre vizualizáciu a ohodnotenie trénovacích vzoriek . . . . . . 26 

5.4 Predikčny´ model a vytváranie trénovacích mnozˇín pre tento subsystém . . 28

5.5 Systém pre vy´ber trénovacích vzoriek pre klasifikáciu pomocou predikcie 

curiosity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 

5.6 Celkové pouzˇitie systému v interaktívnom rezˇime . . . . . . . . . . . . . 33 

6 Experimenty 34 

6.1 Vy´ber trénovacích vzoriek pre učenie . . . . . . . . . . . . . . . . . . . 34 

6.2 Porovnanie klasifikácie NS s pouzˇitím aproximátora dôveryhodnosti a 

konvečnej NS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 

6.3 Vizualizácia vzoriek aproximátora dôveryhodnosti z trénovacej mnozˇiny . 52 

6.4 Experimenty s predikčny´m modelom . . . . . . . . . . . . . . . . . . . . 58 

6.5 Celkové zhodnotenie experimentov . . . . . . . . . . . . . . . . . . . . 65 

7 Záver 66 

Zoznam pouzˇitej literatúry 68 

Zoznam príloh 70 

Zoznam obrázkov 71 

Zoznam tabuliek 75

FEI KKUI 

Úvod 

Zˇ ijeme v dobe, kedy satelitné technológie sú uzˇ pre nás samozrejmé. Vd’aka nim na nasˇej 

Zemi úplne padli komunikačné bariéry, ul’ahčil sa zˇivot a tvoria základny´ kameň nasˇej 

celosvetovej siete internetu. Ich pontenciál je vsˇak stále len na začiatku. jednou z oblastí 

ich vyuzˇitia je aj snímanie zemského povrchu. Jedny´m z takyćhto satelitov je LANDSAT. 

Práve jeho snímky poskytujú vel’mi dobry´ realizačy´ priestor pre implementáciu rôznych 

prostriedkov umelej inteligencie, ty´kajúcich sa problematiky klasifikácie. 

Pre potreby klasifikácie boli v práci pouzˇité satelitné obrázky satelitu LANDSAT. Tieto 

obrázky boli vybrané hlavne kvôli tomu, zˇe na Katedre kybernetiky a umelej inteligencie 

boli uzˇ rôzne projekty, práce a experimenty spojené s ty´mito satelitny´mi obrázkami. 

Naskytla sa mozˇnost’ aj prípadne porovnávat’ vy´sledky klasifikácie tejto práce s iny´mi 

prácami z katedry. 

Jurgen Schmidhuber ako jeden z prvyćh uvádza pojmy ako aproximátor dôveryhodnosti 1 

a curiosity (zvedavost’). V jeho prácach, ktoré sa zaoberajú touto problematikou, sa za- 

meriava hlavne vyuzˇitie tyćhto algoritmov pri neurónovyćh siet’ah typu reinforcement a 

im blízkym nástrojom umelej inteligencie. Táto práca, na rozdiel od Schmidhuberovyćh 

prác sa lísˇi v tom, zˇe sa snazˇí implementovat’základné princípy tyćhto curiosity algorit- 

mov a aproximátora dôveryhodnosti pre klasifikačné úlohy. Konkrétne pre klasifikáciu 

satelitnyćh obrázkov LANDSAT. Jeden z prvyćh vyćhodiskovyćh bodov tejto práce je 

záverečná práca J. Uhrina [8]. Uhrinová práca sa zaoberala podobnou problematikou 

vy´berom trénovacích vzoriek pre klasifikáciu satelitnyćh dát. Jej ciel’om bolo aplikovat’ 

support vector machines podporné vektory do vy´beru trénovacích vzoriek a vizualizá- 

cia podpornyćh vektorov. Práve redukcia trénovacích vzoriek je spoločny´ vztyčny´ bod 

Schmidhuberovyćh curiosity algoritmov a Uhrinovej práce. 

1 adaptive confidence 

1

FEI KKUI 

Ciel’om tejto práce je pokúsit’sa zaimplementovat’algoritmy zo Schmidhuberovej práce 

[4] do klasifikácie satelitnyćh obrázkov LANDSAT do jedného interaktívneho komplex- 

ného systému. Mala by poskytnút’odpovede na základné otázky ty´kajúce sa kombinácie 

práve spomínanyćh algoritmov pre problém klasifikácie. Hlavny´m nástrojom pri riesˇení 

klasifikačnej a predikčnej úlohy budú pouzˇité neurónové siete. 

2

FEI KKUI 

1 Formulćia úlohy 

1. Vypracovat’úvod do curiosity algoritmov podl’a J. Schmidhubera. 

2. Vypracovat’úvod do problematiky klasifikácie satelitnyćh obrazov pomocou neuró- 

novyćh sietí. 

3. Navrhnút’ systém na báze curiosity algoritmu pre vy´ber trénovacích vzoriek pre 

neurónovú siet’pre klasifikáciu satelitnyćh obrazov. 

4. Realizovat’experimenty s implementovany´m systémom a obrazmi LANDSAT. 

5. Vypracovat’dokumentáciu podl’a pokynov vedúceho diplomovej práce. 

- Úvod do curiosity algoritmov a základnyćh princípov curiosity sa nachádza v kapi- 

tole 3, kde sú podrobnejsˇie vysvetlené. 

- Stručny´ úvod do teórie fungovania neurónovej siete pomocou algoritmu spätného 

sˇírenia chyby je uvedeny´ v kapitole 2. Pouzˇitie neurónovyćh sietí pre klasifikáciu 

satelitnyćh obrázkov a stručny´ prehl’ad sa nachádza v kapitole 4. 

- Implementácia systému je vysvetlená v kapitole 5. 

- Experimantálna čast’pre overenie implementácie je uvedené v kapitole 6. 

3

FEI KKUI 

2 Princípy neurónovej siete 

Začiatky teórie neurónovyćh sietí siahajú azˇ do roku 1943, kedy McCulloch a Pitts zade- 

finovali tzv. binárny neurón. Od vtedy presˇli neurónové siete rôznymi obdobiami. No v 

súčasnosti je to uzˇ dost’známa problematika. Princíp fungovania vsˇetkyćh neurónovyćh 

sietí bol insˇpirovany´ princípom fungovania l’udského mozgu. Jej základnou vlastnost’ou 

je schopnost’abstrakcie pravidiel, resp. schopnost’poznania súvislostí medzi vstupny´mi a 

vy´stupny´mi dátami. Sila tohto nástroja spočíva v jeho paralelizme. Definícia podl’a [7]: 

”Neurónová siet’ je masívny paralelny´ procesor, ktory´ má sklon k uchovávaniu experi- 

mentálnych znalostí a ich d’alsˇieho vyuzˇívania.” V nasledujúcej podkapitole sú uvedené 

základné princípy sˇpecifickej neurónovej siete. 

2.1 Metóda spätného sˇírenia chyby 

Neurónová siet’s metódou spätného sˇírenia chyby (back-propagation of error) patrí medzi 

dopredné siete (signál sa sˇíri len jedny´m smerom) s kontrolovany´m učením (tzv. učenie s 

učitel’om - siet’porovnáva vstup s vy´stupom, pričom upravuje svoje nastavenia tak, aby 

bola chyba medzi skutočny´m a pozˇadovany´m vy´stupom čo najmensˇia). 

Popis algoritmu je prebraná z [7]. 

Delta pravidlo 

Toto pravidlo sa vyuzˇíva pri vy´počte zmeny synaptickyćh váh 2 ∆wi j. Pre jednoduchú 

jednovrstvovú siet’s M vstupny´mi neurónmi a jedny´m vy´stupny´m neurónom i dostaneme: 

xi = f (ini) = ini = 

M 

∑ x jwi j(t) + Θi 

j=1 

Chybová funkcia, ktorá má charakter metódy najmensˇích sˇtvorcov, je vyjadrená vzt’ahom: 

J(t) = 

N 

∑ 

i=1 

J i (t) = 0.5 

N 

∑ 

i=1 

2 medzineurónové spojenia, sú vyuzˇívané na ukladanie znalostí 

4 

(evi(t) − xi(t)) 2

FEI KKUI 

kde ev(t) je očakávaná a xi vypočítaná hodnota na i-tom vy´stupe. Metóda sa snazˇí mi- 

nimalizovat’ túto chybovú funkciu. Zmena závisí na od negatívnej parciálnej derivácie. 

Ak označíme δ(t) = −(evi(t) − xi(t)) tak vy´sledny´ vzorec pre vy´počet zmeny váhy pri 

l’ubovol’nom vstupe má tvar: ∆wi(t) = γδ(t)x j(t). Takto vypočítaná zmena synaptickyćh 

váh podl’a delta pravidla dala základ d’alsˇím modifikáciám tohto pravidla. 

Algoritmus metódy spätného sˇírenia chyby 

Delta pravidlo je základom učenia pre metódu spätného sˇírenia chyby. Umozˇňuje pouzˇi- 

tie akejkol’vek aktivačnej funkcie (aj nelineárneho typu), ktorá spl´ňa podmienku diferenco- 

vatel’nosti, teda platí: x = f (in) = in. Chybovy´ signál δi(t) pre kazˇdy´ neurón dostaneme z 

rekurzívneho vzt’ahu, ktory´ predstavuje spätné sˇírenie chyby smerom od vy´stupu siete. Kde 

platí 

δi(t) = − ∂J(t) 

∂ini(t) , potom δi(t) = − ∂J(t) ∂xi(t) 

∂xi(t) ∂ini(t) 

Vzhl’adom na vstup xi(t) = f ′ (ini(t)) môzˇeme zapísat’ druhy´ člen vzt’ahu ako ∂J(t) 

∂xi(t) = 

f ′ (ini(t)). Pre vy´počet prvého člena pravej strany je nutné brat’do úvahy dva prípady: 

1. neurón i je vy´stupny´m neurónom, hl’adaná parciálna derivácia má tvar: 

∂J(t) 

∂xi(t) = −(evi(t) − xi(t)) 

a ty´m pre chybovy´ signál δi(t) dostaneme 

δi(t) = (evi(t) − xi(t)) f ′ (ini(t)) 

2. neurón i nie je vy´stupny´m neurónom – vy´počet sa pozmení na: 

∂J(t) 

∂xi(t) = 

N 

∑ 

h=1 

∂J(t) ∂inh(t) 

∂inh(t) ∂xi(t) 

kde N je počet vy´stupnyćh neurónov, resp. počet neurónov vo vrstve napravo od vrstvy, v kto- 

rej je neurón i. Teda môzˇeme napísat’, zˇe pre chybovy´ signál δi(t) neurónu, ktory´ 

nie je na vy´stupe platí 

δi(t) = f ′ (ini(t)) 

5 

N 

∑ 

h=1 

δh(t)whi(t)

FEI KKUI 

kde δh(t) sú chybové signály od neurónov z vy´stupnej vrstvy, alebo vrstvy na- 

pravo od nej a whi sú synaptické váhy od neurónu i ku kazˇdému z neurónov v na- 

sledujúcej vrstve. 

3 Adaptívna dôveryhodnost’a adaptívna curiosity 

Táto kapitola vychádza z prác J. Schmidhubera [4] a [5], pretozˇe práve on patrí k prvy´m 

l’ud’om, ktory´ zaviedli tieto pojmy a väčsˇina inyćh prác vychádza práve z jeho sˇtúdií. 

3.1 Úvod do problematiky vy´počtovyćh algoritmov pracujúcich s dô- 

veryhodnost’ou a curiosity 

Vel’a vy´skumu v oblasti adaptívneho učenia v neurónovyćh siet’ach a reinforcement uče- 

nia sa v poslednej dobe sústredilo na pouzˇívanie adaptívneho modelu prostredia 3 . Ako 

napríklad adaptívny model vo forme neurónovej siete - backpropagation, ktorá prediko- 

vala nasledujúci vstup, na základe súčasného vstupu a vy´stupu adaptívnej kontrolovanej 

siete. Taktiezˇ aj iné architektúry, ktoré ponúkajú väčsˇiu vy´počtovú efektívnost’. No esˇte 

minimálne dva problémy, ktoré neboli doteraz vyriesˇené. 

1. Doterajsˇie modelovanie riadenyćh systémov nebolo celkom vhodné na premenlivé 

nedeterministické prostredie. Neodrázˇali dobre spol’ahlivost’ tejto predikcie adap- 

tívneho modelu prostredia. 

2. Doterajsˇie modelovanie riadenyćh systémov pouzˇívali na vytvorenie modelu pro- 

stredia nejakú sˇpecifickú metódu. Čo malo za dôsledok, zˇe tieto metódy fungovali 

dobre len na konkrétnych problémoch. No nedokázˇu zohl’adňovat’nepredvídatel’nost’ 

reálnych podmienok. 

3 Podl’a J. Schmidhubera [4]: ”adaptive world model” 

6

FEI KKUI 

Spolu s ty´mito problémami sa nám ukazujú minimálne dva zdroje efektivity, ktoré boli 

doteraz zanedbané a mohli by aspoň z časti riesˇit’tieto problémy: 

1. Nemalo by sa mrhat’navy´sˇením trénovacieho času pre skúmanie tyćh častí prostre- 

dia, ktoré uzˇ sú dobre modelované. 

2. Nemalo by sa mrhat’navy´sˇením trénovacieho času pre skúmanie tyćh častí prostre- 

dia, kde očakávanie budúceho zlepsˇenia modelu prostredia je nízka. 

3.2 Adaptívna dôveryhodnost’ 

Na začiatku tejto časti je opísaná jedna z mozˇností riesˇenia prvého, vysˇsˇie spomínaného 

problému 1. Podl’a [5] princíp redukcie minulyćh popisov: ”Pokial’ je prispôsobivy´ sek- 

venčne pracujúci dynamicky´ systém je schopny´ predikovat’ budúce vstupy prostredia z 

predosˇlyćh vstupov, zˇiadne dodatočné znalosti nemôzˇu byt’získané pozorovaním tyćhto 

vstupov v realite. Iba nepredikovatel’né vstupy si zasluhujú pozornost’.” 

Majme gramatiku G, ktorej úloha je pozorovat’ ret’azec symbolov, jeden po druhom v 

čase, nakoniec má rozhodnút’či tento ret’azec bol vygenerovany´ gramatikou G alebo nie. 

Pre natrénovanie systému sa pouzˇije pomocná gramatika T , ktorá bude generovat’ret’azce 

symbolov - znakov, ktoré budú v zahrnuté do procesu učenia. Vel’ké písmená ako A a 

B označujú ako ne–symboly 4 , ako symboly začiatkov. Malé písmená a,x,b1,··· ,b100 

označujú symboly 5 . Sˇtartovací symbol je vzˇdy A. Jednoduchá gramatika G1 je daná 

A → aB, B → b1b2b3 ...b100. 

Gramatika pre učenie T1 bude definovaná ako: 

4 podl’a J. Schmidhubera[5]: non–terminals 

5 podl’a J. Schmidhubera[5]: terminals 

A → aB, A → xB, B → b1b2b3 ...b100. 

7

FEI KKUI 

T1 vygeneruje iba dva príklady, a to ab1b2b3 ...b100 a xb1b2b3 ...b100. Bezˇny´mi algo- 

ritmami je prakticky nemozˇné naučit’ systém, aby prijal prvy´ (legálny) ret’azec a druhy´ 

(ilegálny) ret’azec odmietol. Problém je prenos chybovej informácie ”spätne v čase” pre 

pomerne vel’ky´ počet krokov v čase (v tomto príklade je ich 100). Môzˇeme zjednodusˇit’ 

tento problém ty´m, zˇe nahradíme gramatiku G1 gramatikou G2 

a taktiezˇ nahradíme T1 gramatikou T2 

A → aB, B → b1b2b3 ...b100, B → b100 

A → aB, A → xB, B → b1b2b3 ...b100, B → b100. 

Teraz aj bezˇny´ algoritmus sa dokázˇe naučit’z krátkych trénovacích vzoriek (ab100 a xb100), 

zˇe vy´skyt a alebo x je vy´znamny´ a mal by sa zapamätat’. Z tyćhto krátkych trénovacích 

sekvencií dokázˇe algoritmus ”zovsˇeobecňovaním” prejst’ na zlozˇitejsˇie sekvencie ako 

xb1b2b3 ...b100. Teda treba sa snazˇit’rozlozˇit’dlhé trénovacie časové sekvencie do men- 

sˇích blokov, ktoré budú patrit’spolu (ako vysˇsˇie uvedené b1b2b3 ...b100 ”patria spolu”). 

Odhadovany´ bezvy´znamny´ rad 6 je sekvencia prípadov, kde pre kazˇdy´ prípad platí, zˇe 

je predpovedatel’ny´ zo súčasného vnútorného stavu učiaceho sa systému, ktory´ uzˇ videl 

predosˇlé prípady. Najviac nás zaujíma maximálny odhadovany´ bezvy´znamny´ rad 7 je 

odhadovany´ bezvy´znamny´ rad, ktorého sekvencia prípadov sa nenachádza v dlhsˇom od- 

hadovanom bezvy´znamnom rade. 

Majme bezˇny´ predikčnú siet’ 8 P. V čase t, P dostáva vstup x(t) a vyprodukuje n– 

dimenzionálny vy´stup p(t) (ciel’om je, aby |p(t)| = |x(t + 1)|). Po vygenerovaní vy´stupu, 

vektor vsˇetkyćh aktivácií v P nazveme P(t). Chybová funkcia P je 

Ep = 1 2 · ∑i(pi(t) − xi(t + 1)) 2 . 

6 ”presumed casual chain” 

7 ”maximal presumed casual chain” 

8 akákol’vek neuorónová siet’, ktorá riesˇi úlohu predikcie 

8

FEI KKUI 

Dˇ alej majme druhy´ modul, modul dôveryhodnosti C, ktorej vstup je P(t) a vy´stup c(t). 

c(t) je interpetované ako miera dôveryhodnosti vo vlastnú predikciu. Uvazˇujeme o dvoch 

variácií: 

1. |c(t)| = 1. Chybová funkcia pre C by bola 

EC = 1 2 ∑t(d(t) − c(t)) 2 , 

kde d(t) je 1, ak p(t) sa zhoduje s x(t +1) (s istou toleranciou) a 0 v inyćh prípadoch. 

2. |c(t)| = |p(t)|. Chybová funkcia pre C 

EC = 1 2 ∑t ∑i(d(i) − ci(t)) 2 , 

kde di(t) je 1, ak pi(t) sa zhoduje s xi(t + 1) (s istou toleranciou) a 0 v inyćh 

prípadoch. 

3.2.1 Aproximátor dôveryhodnosti 

Tento princíp rozsˇíril a zovsˇeobecnil Schmidhuber v [4]. 

Teda uvazˇujme adaptívny model M, ktorého vstupny´ vektor v čase t je iM(t) a jeho vy´- 

stupny´ vektor je oM(t) = fM(iM(t),hM(t)). Kde hM(t) je vektor reprezentujúci vnútorné 

stavy M. V čase t je pozˇadovaná hodnota pre prediktor dM(t), pričom ciel’om prediktora 

je oM(t) = dM(t) pre vsˇetky t. Pre modelovanie spol’ahlivosti predikcií M pouzˇijeme ap- 

roximátor dôveryhodnosti 9 modelu M, ktorého vstupny´ vektor v čase t je iC(t) = iM(t) a 

vy´stupny´ vektor je oC(t) = fC(oC(t),hC(t)). Kde hC(t) je vektor reprezentujúci vnútorné 

stavy C. V čase t je pozˇadovaná hodnota pre aproximátor dôveryhodnosti dC(t). 

Dˇ alej nasledujú, v j je j-ty komponent vektora v, E je operátor očakávania, dim(x) ozna- 

čuje rozmernost’vektora x, P(A|B) je podmienená pravdepodobnost’A za predpokladu B 

a E(A|B) je podmienené očakávanie, A za predpokladu B. 

9 ”confidence modul” - konfidenčny´ modul 

9

FEI KKUI 

Uvazˇujme prípad pre vsˇetky t. To znamená, zˇe vy´stupy z C a M sú závislé iba na danyćh 

vstupoch. Existujú variácie jednoduchyćh ciest ako reprezentovat’spol’ahlivost’dC(t): 

1. Modelovat’pravdepodobnosti globálnych predikčnyćh zlyhaní. dC(t) bude jed- 

norozmerny´. Nech dC(t) = P(oM(t) = dM(t)|iM(t)). dC(t) môzˇe byt’ odhadnuty´ 

vzt’ahom n1 

n2 , kde n2 je počet prípadov k ≤ t, pre ktoré platí iM(k) = iM(t) a n1 je 

počet k prípadov, kde iM(k) = iM(t),oM(k) ≤ dM(k). 

2. Modelovat’ pravdepodobnosti lokálnych predikčnyćh zlyhaní. Nech dC(t) je 

dim(dM(t))-dimenzionálny (rozmerny´). Nech d j 

j j 

C (t) = P(oM (t) = dM (t)|iM(t)) platí 

pre vsˇetky j. d j 

n1 

C (t) môzˇe byt’odhadnuty´ vzt’ahom n2 , kde n2 je počet prípadov k ≤ t, 

pre ktoré platí iM(k) = iM(t) a n2 je počet k prípadov, kde iM(k) = iM(t),o j 

M (k) ≤ 

d j 

M (k). 

Variácie metód 1 a 2 by nemerali pravdepodobnosti presnej zhody medzi predikova- 

nou a skutočnou hodnotou, ale pravdepodobnost’blízkych zhôd s určitou toleranciou. 

3. Modelovat’globálnu predpokladanú chybu . Nech dC(t) je jednorozmerny´. Nech 

platí 

 

1 

dC(t) = E 

2 (dM(t) − oM(t)) T 

(dM(t) − oM(t))|iM(t) . 

Ak C je back-propagation siet’, aproximáciou dC(t) by sme získali pomocou gra- 

dientu (s maly´m učiacim stupňom) pre učenie C v čase t vyjadrenie chyby M 

1 

2 (dM(t) − oM(t)) T (dM(t) − oM(t))|iM(t). 

4. Modelovat’lokálnu predpokladanú chybu. Nech dC(t) je dim(dM(t))-dimenzionálny 

(rozmerny´). Nech 

d j 

 

C (t) = E (d j j 

M )(t) − oM (t))2 

|iM(t) 

platí pre vsˇetky j. Ak C je back-propagation siet’, aproximáciou dC(t) by sme získali 

pomocou gradientu (s maly´m učiacim stupňom) pre učenie C v čase t vyjadrenie 

10

FEI KKUI 

lokálnej predikcie chyby pre M 

kde m = dim(oM(t)). 

((d 1 M(t) − o 1 M(t)) 2 ,...,(d m M(t) − o m M(t)) 2 ) T , 

3.2.2 Pouzˇitie aproximátora dôveryhodnosti pre podporu učenia regulátora 

Schmidhuber v [4] tvrdí, zˇe aky´kol’vek adaptívny regulátor, ktorého proces priradenia 

dôvery je zalozˇeny´ na modely sveta by mal byt’modifikovany´ len vtedy, ak je predikcia 

prediktora spol’ahlivá. Niektoré z mozˇnyćh implementácií sú tieto: 

1. Ak je implementovaná metóda 1 alebo 3 z predchádzajúcej sekcie, pouzˇijeme model 

pre trénovanie regulátora v čase t iba ak dC(t) ≤ β = const. ≥ 0. 

2. Ak je implementovaná metóda 2 alebo 4 z predchádzajúcej sekcie, tak o j 

M pouzˇijeme 

pre trénovanie regulátora v čase t iba vtedy, ak d j 

C (t) ≤ β = const. ≥ 0. 

Predpokladajme, zˇe M aproximuje 

prostredníctvom 

∂ (x(t + 1) − y(t + 1)) T (x(t + 1) − y(t + 1)) 

∂oA(t) 

∂ (oM(t) − y(t + 1)) T (oM(t) − y(t + 1)) 

∂oA(t) 

kde y(t) je pozˇadovany´ stav prostredia v čase t. 

Ak je implementovaná metóda 2 alebo 4 počíta sa iba 

∑ 

j:(o j 

M (t)−x j (t+1)) 2 ≤β,d j 

C (t)≤β 

∂(o j 

M (t) − y j (t + 1)) 2 

, 

∂oA(t) 

a táto hodnota sa pouzˇije na trénovanie regulátora. Menej radikálna stratégia je vázˇit’ 

vysoko spol’ahlivé predikcie viac ako menej spol’ahlivé. 

11 

,

FEI KKUI 

3.3 Adaptívna curiosity (zvedavost’) 

Pojem curiosity sa tu dá chápat’ (prelozˇit’) ako zvedavost’. Zvedavost’ systému po zaují- 

mavyćh veciach, situáciach. Podl’a [4] môzˇeme definovat’curiosity ako túzˇbu po zlepsˇení 

reakcií prediktora voči prostrediu (modelu svet 10 ). Teda mali by sme pouzˇit’ aky´kol’vek 

citlivy´ učiaci sa algoritmus 11 na podnecovanie regulátora na to, aby robil také rozhodnutia 

(akcie), prípadne sekvencie rozhodnutí (akcií), ktoré vyprovokujú situácie, pri ktoryćh robí 

model sveta zlé predikcie. Ked’zˇe je model adaptívny, jeho predikcie sa budú zlepsˇovat’. 

Pre regulátor budú viac ”zaujímavé” situácie, kedy má model sveta spol’ahlivé predikcie 

a začne sa zameriavat’na nepredikovatel’né časti prostredia. 

3.3.1 Základny´ princíp algoritmov curiosity 

Táto sekcia je celá prebraná z [4] a hovorí o hlavnom princípe adaptívnej curiosity. 

Teraz nezálezˇí na tom či je adaptívny model sveta implementovany´ ako napríklad back– 

propagation neurónová siet’, alebo prehl’adávacia tabul’ka, alebo niečo iné. 

Predosˇlé mysˇlienky a úvahy môzˇeme formulovat’ako: ”Uč sa zapamätávat’si akcie (alebo 

sekvencie akcií) pre očakávanie budúceho vy´konnostného zlepsˇenia modelu sveta. Pod- 

necuj sekvencie akcií, kde je toto očakávanie vysoké.” 

Jedna z ciest pre uplatnenie tohto princípu je (podkapitola 3.3.2 hovorí o alternatívnej 

mozˇnosti): ”Modeluj spol’ahlivost’predikcií adaptívneho prediktora ako sa uvádzalo v ka- 

pitole 3.2.1. V čase t, posilňuj modelovanie kontrolného systému (regulátora) v úmere ku 

aktuálnej zmene spol’ahlivosti adaptívneho prediktora. Ciel’om curiosity regulátora (môzˇe 

mat’esˇte aj iné prepojené ciele) je maximalizovat’očakávania kumulatívnej sumy budúcich 

10 ”world model” 

11 podl’a [4] je to reinforcement učiaci sa algoritmus 

12

FEI KKUI 

pozitívnych alebo negatívnych zmien v spol’ahlivosti predikcie.” 

 

E ∑ −γ 

t≥t0 

t−t0 

 

∆oC(t + 1) . 

Pričom 0 ≤ γ < 1 je nominálny faktor zabraňujúci nekonečny´m sumám a ∆oC(t) je zmena 

(pozitívna negatívna) predpokladanej spol’ahlivosti spôsobeny´ pozorovaním iM(t),OM(t) 

a x(t + 1). 

Napríklad, ak je implemetovaná metóda 1 alebo 3 zo sekcie 3.2.1, potom ∆oc(t) = oC(t)− 

oC(t), ¯ kde oC(t) ¯ je odozva C na iM(t) po upravení C v čase t. 

3.3.2 Predikcia priamej zmeny chyby 

Alternatíva ku metóde uvedenej v kapitole 3.3.1 je predikcie zmeny chyby. Majme oM(t) ¯ 

ako odozva na iM(t) po nastavení M v čase t. Môzˇeme nahradit’ aproximátor dôvery- 

hodnosti siet’ou H, ktorá v kazˇdom časovom kroku dostane aktuálny vstup iM(t) a ktorej 

pozˇadovaná hodnota je aktuálna zmena vy´stupu M ∆oM(t) = oM(t) − oM(t) ¯ spôsobeny´ 

učiacim sa algoritmom implementovany´m v M (H by mala mat’malú ryćhlost’učenia). H 

sa bude učit’aproximovat’očakávania 

E {∆oM(t)|iM(t)} 

zmeny odozvy M na jemu dané vstupy. Absolútna hodnota |oH(t)| vy´stupu H sa povazˇuje 

ako reinforcement pre adaptívny učiaci sa algoritmus. Ciel’om curiosity regulátora je v 

čase t0 maximalizovat’ 

kde 0 ≤ γ < 1 je nominálny faktor. 

E 

 

∑ −γ 

t≥t0 

t−t0 

 

|oH(t) , 

13

FEI KKUI 

3.3.3 Príklad agenta pohybujúceho sa v priestore podl’a J. Schmidhubera 

V [4] je uvedeny´ aj príklad pre učenie s pouzˇitím metódy Q - leraningu 12 . Majme teda 

agenta, ktory´ sa bude pohybovat’ v deterministickom prostredí, ktoré pozostáva z 10 

stl´pcov a kazˇdy´ stl´pec obsahuje 10 pozícií. V danom čase môzˇe agent obsadzovat’ len 

jednu zo 100 pozícií. Môzˇe vykonat’jednu zo 4 akcií: 

1. Presuň sa na pozíciu nal’avo, ak taká pozícia existuje. Ak nie, tak sa presuň na pravú 

krajnú pozíciu v tom istom riadku. 

2. Presuň sa na pozíciu napravo, ak taká pozícia existuje. Ak nie, tak sa presuň na l’avú 

krajnú pozíciu v tom istom riadku. 

3. Presuň sa v danom stl´pci na pozíciu nahor, ak taká pozícia existuje. Ak nie, tak sa 

presuň na najspodnejsˇiu pozíciu v tom istom stl´pci. 

4. Presuň sa v danom stl´pci na pozíciu nadol, ak taká pozícia existuje. Ak nie, tak sa 

presuň na najvrchnejsˇiu pozíciu v tom istom stl´pci. 

Majme tri časti systému. A to predikčnú siet’ - prediktor M, konfidenčny´ modul - apro- 

ximátor dôveryhodnosti C a modul pre hodnotenie párov pozícií a príslusˇnyćh akcií Q. 

Vsˇetky sú implementované ako siete back-propagation, ale bez skrytej vrstvy, s vlastny´mi 

aktivačny´mi funkciami. V čase t dostane agent vstup vektor bitov i(t) ako reprezentáciu 

aktuálnej pozície, pričom dim(i(t)) = 100 a iba jeden bit je nenulovy´. Ak príde agent na 

novú pozíciu vyberie si jednu z dvoch reakcií s(t) ∈ 0,1. Sú tri triedy pozícií: pre triedu 

1. je s(t) vzˇdy 1. Pre triedu 2. je s(t) vzˇdy 0. Pre triedu 3. sa s(t) nahdone vygeneruje z 

reakcia 1 alebo 0. Medzi časom t −1 a t sa vykonávajú nasledujúce operácie: V čase t −1 

príjme Q 4 rôzne 400-dimenzionálne vektory bitov iba s jedny´m nenulovy´m bitom. Je tam 

jeden vstupny´ vektor pre kazˇdú kombináciu i(t − 1) a 4 mozˇnyćh akcií. Q vyprodukuje 

12 metóda sekvenčného reinforcement uečnia, ktorá v kazˇdom časovom kroku je vybraná akcia s najväčsˇou 

predikciou hodnotenia zohl’adnením určitej náhodnej odchy´lky, ktorá dáva systému mozˇnost’ skúmat’ aj 

neznáme akcie. 

14

FEI KKUI 

jeden jednorozmerny´ vy´stup pre kazˇdy´ zo 4 vstupovnyćh vektorov. Tieto vy´stupy sú in- 

terpretované ako hodnotenie koresˇpondujúcich párov vstup/akcia. Q je implementovany´ 

ako jednoduchy´ mechanizmus, ktory´ ”vyberie” vstup i(t) podl’a najvysˇsˇieho ohodnotenia 

sˇtyroch vstupov. Vstup pre Q označujeme ako iQ(t − 1) 

V čase t príjme M vstup i(t) a vyprodukuje jednorozmerny´ vy´stup oM(t). Ciel’om predik- 

tora M je ale naučit’sa predikovat’s(t) a nie i(t + 1). Systém bude robit’dobré predikcie 

len na pozíciach tried 1 a 2. No on nevie, zˇe ktoré pozície prislúchajú ktorej triede. V 

tom istom čase príjme C vstup i(t). Jeho vy´stup oC(t) je interpretovany´ ako predikcia 

E = |oM(t) − s(t)||i(t) (varianta 3 v sekcii 3.2.1). Pre vy´počet zmeny dôvaryhodnosti 

∆oC(t) sa implementovala procedúra: Po vypočítaní oC(t), |oM(t) − s(t)| slúzˇi C ako po- 

zˇadovany´ vy´stup. Potom sa vypočíta oC(t) ¯ je odozva C na vstup i(t) po modifikácií váh 

podl’a algoritmu v 3.3.1. 

Potom ∆oc(t) = oC(t) − oC(t) ¯ slúzˇi ako aktuálny reinforcement. Q je obnoveny´ a to tak, 

zˇe v čase t − 1 pozˇadovany´ vy´stup pre Q ako odozva na iQ(t − 1) je ∆oc(t) + γU(t), kde 

U(t) je ohodnotenie najlepsˇej akcie navrhnutej Q v čase. 

Systém s takto zaimplementovanou curiosity bol testovany´ voči bezˇnému náhodném u 

vy´beru. Pričom nastavenie siete prediktora M a náhodná pozícia agenta na začiatku boli 

v obidvoch prípadoch rovnaké. Ako kritérium kvality pre M bola suma E(t) rozdiel me- 

dzihodnotami reakcií deterministickej pozíciou a koresˇpondujúca hodnota predikcie M 

umocnená na druhú. ukázalo sa, zˇe 2700 trénovacích vzoriek bolo potrebnyćh pre nauče- 

nie M aby E(t) kleslo na 0.3. Pri curiosity systéme bolo potrebnyćh len 1000 trénovacích 

vzoriek na to, aby E(t) kleslo pod hodnotu 015. 

15

FEI KKUI 

4 Neurónové siete pre klasifikáciu satelitnyćh dát 

Satelity sa stali v dnesˇnej dobe neoddelitel’nou súčast’ou nasˇich zˇivotov. Vyuzˇívajú sa pre 

riadenie dopravy, telekomunikačné účely, vojenské účely, kartografické a mnohé iné. V 

súčasnej dobe nad zemsky´m povrchom operujú rôzne druzˇice, ktoryćh úlohou je snímanie 

povrchu a atmosféry. Pre pouzˇitie dát, ktoré nám poskytujú tieto satelity je potrebné vyuzˇit’ 

rôzne aplikačné prostriedky na spracovanie a analy´zu. 

Jedna z mozˇností ja aj vyuzˇitie neurónovyćh sietí. V tejto kapitole sú uvedené niektoré 

z uzˇ implementovanyćh riesˇení pre rozpoznávanie oblastí na zemskom povrchu a ich 

klasifikácie na základe jedno a viac-pixelovyćh vstupov. V tejto kapitole sú uvedené aj 

niektoré príklady implementácií analy´z a klasifikácií satelitnyćh obrazov. 

4.1 Obrazové snímky satelitu LANDSAT 

LANDSAT program je jedna z misií pre pozorovanie zemského povrchu NASA a Ame- 

rického geologického insˇtitútu. Nasledujúci popis vychádza z materiálov NASA [10]. Od 

roku 1972, kedy bol vypusteny´ na obezˇnú dráhu prvy´ satelit LANDSAT1, sa podarilo 

vypustit’celkovo sedem satelitov (od LANDSAT 1 azˇ po LANDSAT 7). Zemsky´ povrch 

bol snímany´ najprv multi - spektrálnym skenerom (Multispectral Scanner). Jeho senzory 

skenujú odrazené slnečné lúče odrazené zo zemskej plochy v 4 pásmach spektra počas 

obehu po orbitálnej dráhe. Taktiezˇ nesie na svojej palube aj senzory (Thematic Mapper), 

ktoré tiezˇ snímajú elektromagnetické vlny odrazené zo zeme, no s väčsˇou presnost’ou, 

jasom, rozlísˇením a to v 7 po sebe nasledujúcich spektrách. Sˇest’ z tyćhto spektier sú 

citlivé na infračervenú oblast’elektromagnetického zˇiarenia vid’tabul’ka 4 – 1. Pričom jeho 

rozlisˇovacia schopnost’je 15 m 2 pre pásma 1 - 5 a 7, pričom pre 6 pásmo 60 m 2 . 

V roku 1994 bol vypusteny´ na obezˇnú dráhu posledny´ satelit LANDSAT 7. Ten mal uzˇ 

mnohé iné vylepsˇenia. Základnú vy´hodu oproti svojim predchodcom mal v novyćh sen- 

zoroch. Thermic Mapper senzory boli nahradené citlivejsˇím ETM+ (Enhanced Thematic 

16

FEI KKUI 

Pásmo µm Rozlísˇenie (m 2 ) oblast’ 

1 0.45 - 0.52 30 tepelné infračervené 

2 0.52 - 0.60 30 krátkovlnné infračervené 

3 0.63 - 0.69 30 krátkovlnné infračervené 

4 0.76 - 0.90 30 blízke infračervené 

5 1.55 - 1.75 30 červená 

6 10.4 - 12.5 120 zelená 

7 2.08 - 2.35 30 modrá 

Tabul’ka 4 – 1 Spektrá elektromagnetického zˇiarenia z Thematic Mapper 

Obr. 4 – 1 Oblasti elektromagnetického spektra prebrané z [9] 

Mapper) senzormi. ETM+ sníma elektromagnetické zˇiarenie v 8 rozsahoch spektier. Pr- 

vyćh 7 senzorov je totozˇnyćh. V 8 spektre je dvojnásobná rozlisˇovacia schopnost’(15 m 2 

na pixel). 

Snímanie elektromagnetického zˇiarenia odrazeného zo zemského povrchu sa deje preto v 

rôznych spektrách, lebo rôzne oblasti zemského povrchu majú rozličné reflexné vlastnosti, 

a tie sa v rôznych vlnovyćh dl´zˇkach zvyčajne prejavia rozdielnym spôsobom. To znamená, 

zˇe pokial’ určitá oblast’zemského povrchu sa vy´razne prejavila v určitej oblasti spektra, 

tak v inej oblasti sa nemusí prejavovat’vôbec. Pre potreby klasifikácie vsˇak bolo potrebné 

nájst’určity´ vzt’ah medzi jednotlivy´mi oblast’ami spektra. Tento problém má riesˇit’aj moja 

17

FEI KKUI 

neurónová siet’. V d’alsˇej podkapitole sú uvedené niektoré aplikácie sˇpecializované pre 

riesˇenie klasifikačnyćh úloh na satelitnyćh dátach. 

4.2 Príklady vyuzˇivajúce neurónové siete pre klasifikáciu satelitnyćh dát 

Klasifikácia obrazov pomocou neurónovej siete znamená klasifikáciu jednotlivyćh pixe- 

lov 13 obrazu do príslusˇnyćh klasifikačnyćh tried. To znamená, zˇe cely´ obrázok je rozlozˇeny´ 

do pol’a (mapy) pixelov, ktorej kazˇdy´ prvok - pixel prichádza na vstup neurónovej siete, 

ktorá uzˇ vo fáze zˇivota, ho zaklasifikuje do triedy. Na obrázku 4 – 2 sú vstupné dáta pre 

klasifikáciu - satelitné snímky v 7 spektrách. 

Stručny´ popis nájdenyćh aplikácií vyuzˇívajúcich NS pre spracvanie satelitnyćh obrazov 

zo satelitu LANDSAT: 

1. V práci autorov P. Baruaha, M. Tumura Neural network modeling of lake surface 

chlorophyl and sediment from Landsat TM imagery [1] boli pouzˇité neurónové 

siete (back-propagation) pre zist’ovanie kvalitu vnútrozemnskyćh vôd, podl’a kon- 

centrácie chlorofylu a ulozˇenyćh sedimentov. Aplikovany´ systém zlepsˇil klasifikáciu 

vodnyćh plôch o 65% oproti regresnému modelu. 

2. Prvá práca, ktorá riesˇila problém klasifikácie satelitnyćh dát v rámci Technickej uni- 

verzity v Kosˇiciach, bola práca Extended Methods for Classification of Remotely 

Sensed Images Based on ARTMAP Neural Networks autorov P. Sinčák, N. Kopčo 

a H. Weregin. [3]. Snímky boli klasifikované pomocou ARTMAP neurónovej siete. 

3. V [2] pracovali autori na porovnávaní úsˇpesˇnosti klasifikácie obrázkov zo satelitu 

IRS-1D pomocou metódy MLC 14 a pomocou back-propagation neurónovej siete. 

Ky´m pri metode MLC bola presnost’klasifikácie 75.0%, tak pri back-propagation 

sieti bola na úrovni 85,2%. 

13 obrazovy´ prvok - najmensˇia jednotka digitálnej bitmapovej grafiky 

14 maximum likelihood classification 

18

FEI KKUI 

Obr. 4 – 2 Originálne obrázky satelitu LANDSAT v 7 rôznych spektrách elektromagnetického zˇiarenia 

19

FEI KKUI 

Obr. 4 – 3 Vy´sledok klasifikácie pomocou Gaussian ARTMAP siete. Prevzaté od [3] 

Obr. 4 – 4 Vy´sledok klasifikácie pomocou Support Vector Machines podl’a [8] 

20

FEI KKUI 

4. Práca Forest cover change detection in Siberia [6] od autora C. Schmullius, bola 

čast’ou projektu EU SIBERIA-II. a hovorí o vyuzˇívaní neurónovyćh sietí pre kla- 

sifikáciu zalesňovania a odlesňovania územia na Sibíri podl’a snímkov zo satelitu 

LANDSAT v rozsahu rokov 1989 azˇ 2000. Zaoberali sa hlavne zlepsˇením klasifi- 

kácie siete a to modifikáciami topológie siete, nastavovaním rôznych prídavnyćh 

parametrov a podobne. 

5. Jednou z d’alsˇích prác v tejto oblasti bola Interaktívny vy´ber trénovacej mno- 

zˇiny pre klasifikáciu obrazovyćh dát pomocou neurónovej siete [8]. V práci boli vy- 

uzˇité metódy učenia pomocou SVM a neurónovyćh sietí. Čast’tejto práce poslúzˇila aj 

tejto práci. Vy´sledky získany´mi v tejto diplomovej práci sú tiezˇ porovnané s vy´sled- 

kami práce Uhrina 4 – 4. Uhrinová práca sa zaoberala ako je uzˇ vysˇsˇie spomenuté 

interaktívnym vy´berom trénovacej mnozˇiny pre kontrolované učenie neurónovej 

siete s pouzˇitím metódy back-propagation a vyuzˇitím vizualizácie podpornyćh vek- 

torov 4 – 5. Práca tiezˇ obsahuje porovnania vy´sledkov pouzˇitím rôznych masiek. 

Obr. 4 – 5 Vizualizácia podpornyćh vektorov po 2000 učiacich cykloch prevzaté z [8] 

21

FEI KKUI 

5 Návrh a implementácia systému pre vy´ber 

trénovacích vzoriek 

Systém bol navrhnuty´ pre potreby experimentálnej časti. Je navrhnuty´ s prvkami interakcie 

pouzˇívatel’a, aby poskytoval podporu pri rozhodovaní o triedach, ktoré si sám zaklasifikuje 

v trénovacích dátach. Jadro systému je neurónová siet’(back-propagation), ktorá klasifikuje 

príslusˇné trénovacie dáta a jej podporná neurónová siet’(taktiezˇ back-propagation), ktorá 

slúzˇi na vy´ber trénovacích pre následnú klasifikáciu pomocou curiosity. A to vzorky, ktoré 

majú vel’ky´ informačny´ prínos pre proces učenia klasifikačnej neurónovej siete. 

Implementovany´ systém by mal umozˇňovat’ zobrazit’ aj tieto vzorky z trénovacích dát, 

pri ktoryćh bol informačny´ zisk pre danú triedu najväčsˇí. Tak isto aj predikciou vediet’ 

odseparovat’tieto trénovacie vzorky pre učenie podl’a ich informačnej hodnoty. 

Z dôvodu zlozˇitosti tohto komplexného systému je rozdeleny´ z funkčného hl’adiska na 

mensˇie podsystémy (subsystémy). Kazˇdy´ taky´to subsystém má svoje vlastné vstupy a 

vy´stupy. Navzájom sú prepojené vsˇetky tieto funkčné bloky do komplexného systému. 

Teda vy´stup jedného subsystému je vstupom druhého (ako napríklad obrázok, trénovacie 

vzorky, . . . ). Jeho presná implementácia je popísaná v tejto kapitole. Cely´ tento systém 

by sa zobrazil ako na obrázku. 

5.1 Subsystém pre transformáciu snímkov LANDSAT do falosˇnyćh fa- 

rieb, kvôli vizualizácii pre interaktívnu aplikáciu 

Je to podporny´ systém pre tvorbu trénovacích dát. Program skombinuje l’ubovol’né tri 

satelitné snímky zosnímané v rôznych spektrách - častiach infračerveného elektromag- 

netického zˇiarenia. Pri vsˇetkyćh experimentoch sú pouzˇité satelitné obrázky zo satelitu 

22

FEI KKUI 

LANDSAT 5. Vsˇetkyćh 7 obrázkov (súborov) je zosnímanyćh v jednom jasovom rozsahu, 

teda sú čiernobiele, je pre uzˇívatel’a t’azˇsˇie orientovat’sa v nich. Tento subsystém by mal 

vyriesˇit’tento problém jednoduchy´m vyfarbením obrázku. Na vy´stupe je zafarbená sate- 

litná snímka v nereálnych (falosˇnyćh farbách) farbách. Kazˇdá zo zlozˇiek R 15 , G 16 a B 17 

je vybraná z iného spektra, teda z iného obrázku. Napr.: Zlozˇka R je vybraná z piateho 

obrázku, zlozˇka G z tretieho obrázku a zlozˇka B je vybraná zo sˇiesteho obrázku. Vy´sledny´ 

obraz vyzerá ako na obrázku 5.1. 

Obr. 5 – 1 Satelitny´ obrázok vl’avo (1 zo 7 spektier) a príklad obrázku vo falosˇnyćh farbách (kompozícia 

spektier 5, 4 a 6). 

Schéma tohto Subsytému 1 je zobrazená na obrázku 5.1. 

Obr. 5 – 2 Schéma Subsystému 1 pre zafarbovanie obrázkov. 

15 hodnota jasovej úrovne červenej zlozˇky 

16 hodnota jasovej úrovne zelenej zlozˇky 

17 hodnota jasovej úrovne modrej zlozˇky 

23

FEI KKUI 

5.2 Subsystém pre vy´ber najlepsˇej trénovacej mnozˇiny 

Jedná sa len o pomocnú aplikáciu, ktorú tvorí neurónová siet’back-propagation. Schéma 

neurónovej sieti je na obrázku 5 – 3. Tá slúzˇi na jednoduchú klasifikáciu satelitnyćh 

obrazov podl’a vybranej trénovacej mnozˇiny, ktorú vyberá uzˇívatel’. Teda on si zvolí - 

zaklasifikuje ním vybrané oblasti do sˇtyroch rozličnyćh farebne odlísˇenyćh tried. 

Obr. 5 – 3 Bloková schéma neurónovej sieti pre klasifikáciu trénovacej mnozˇiny pre n cyklov učenia. 

Inicializácia: náhodná inicializácia váh neurónovej siete, načítavanie a následná normali- 

24

FEI KKUI 

zácia trénovacej a testovacej mnozˇiny. Tak isto sa normujú aj vy´stupné dáta. 

Vo vsˇetkyćh experimentoch boli pouzˇité vzˇdy len tieto 4 triedy: 

• trieda Mesto (farba R: 210 G: 0 B: 0) 

• trieda Voda (farba R: 26 G: 0 B: 255) 

• trieda Les (farba R: 49 G: 124 B: 47) 

• trieda Polia (farba R: 243 G: 255 B: 0) 

Zredukoval sa počet tried oproti práci, na ktorú z časti nadväzujem [8], zo siedmych na 

sˇtyri. Trieda mesto a voda ostali bez zmeny. Zlúčili sa triedy les a kroviny, ked’zˇe na sate- 

litnyćh obrázkoch nie je sú jasné rozdiely medzi ty´mito triedami. Tak isto sa zlúčili polia 

úrodné a polia neúrodne, pretozˇe neposkytovali z hl’adiska klasifikácie vy´znamny´ prínos. 

Presnost’klasifikácie neúrodnyćh polí bola vel’mi malá. Polia sa nakoniec zlúčili s lúkami. 

Tu uzˇ obidve triedy dokázal klasifikovat’ s väčsˇou presnost’ou, no chybná klasifikácia 

vznikala pri poliach, kde rástli zelené plodiny (boli zaklasifikované ako lúky). 

25

FEI KKUI 

5.3 Subsystém pre vizualizáciu a ohodnotenie trénovacích vzoriek 

V tomto subsystéme sa nachádza funkčne najdôlezˇitejsˇia čast’ celého systému. Tou je 

klasifikácia príslusˇnyćh vstupnyćh dát a vy´ber trénovacích vzoriek. Budeme ho nazy´vat’ 

klasifikačny´ model M. Pozostáva s jednotlivyćh čiastkovyćh dielov, pričom vy´stup prvého 

je vstupom druhého. Základné kroky systému sú nasledovné: 

Obr. 5 – 4 Bloková schéma s pouzˇitím regulátora na princípe aproximátora dôveryhodnosti pre 300 cyklov 

učenia. 

26

FEI KKUI 

• Inicializácia: Náhodne sa nastavujú váhy medzi jednotlivy´mi vrstvami z intervalu 

〈−1.0;1.0〉 a načítavajú sa vstupné dáta zo 7 satelitnyćh obrázkov, ktoré sú ná- 

sledne normované na interval 〈0.0;1.0〉. Tak isto sa načítava trénovacia a testovacia 

mnozˇina. 

• Prezentácia trénovacích vzoriek na vstup: V kazˇdom učiacom sa cykle prichá- 

dzajú na vstup vsˇetky vzorky z trénovacej mnozˇiny. 

• Aproximátor dôveryhodnosti (regulátor): Podl’a teórie z 3.2.1 tretia mozˇnost’re- 

prezentácie dc(t) je odvodeny´ vzt’ah ∆J(t) = J(t −1)−J(t). Čo znamená, zˇe rozdiel 

chyby predchádzajúcej vzorky a chyby aktuálnej trénovacej vzorky nám dáva údaj 

o vel’kosti zmeny chyby. Tento vzt’ah nám slúzˇil na reguláciu trénovacích vzoriek. 

Pre učenie klasifikačnej siete (zmena váh) sú zaujímavé len tie vzorky, ktoryćh 

informačny´ zisk bude najväčsˇí. Čizˇe ak ∆J(t) < 0 tj. chyba pri danej trénovacej 

vzorke má pre klasifikačnú siet’väčsˇiu informačnú hodnotu, a preto bude vybraná 

pre učenie. 

Obr. 5 – 5 Vy´stupny´ obrázok klasifikačného systému. 

Navrhnuty´ systém obsahuje kvôli jednoduchsˇiemu spracovaniu a vyhodnoteniu vy´sledkov 

klasifikácie aj pomocné vy´pisy a grafy. 

27

FEI KKUI 

5.4 Predikčny´ model a vytváranie trénovacích mnozˇín pre tento sub- 

systém 

Predikčny´ model C bude predikovat’rôzne predikcie, na základe modifikácie dát z tréno- 

vacej mnozˇiny, ktoré budú opísané nizˇsˇie. Pre potreby experimentálnej časti je navrhnuty´ 

tento pomocny´ subsystém T , ktory´ vytvára trénovacie mnozˇiny pre predikčny´ systém C. 

Funguje nasledovny´m spôsobom. Počas učenia sa klasifikačného modelu M sa v kazˇdom 

Obr. 5 – 6 Čast’ schémy klasifikačného modelu M zobrazujúci zápis informácií do pomocného súboru 

support. 

cykle učenia, pre kazˇdú trénovaciu vzorku zapisujú do pomocného súboru support tieto 

informácie: súradnice vzorky 18 , trieda príslusˇnosti (do akej klasifikačnej triedy ju zaradil 

uzˇívatel’pri vy´bere trénovacích vzoriek), vstupné pixely (z originálnych satelitnyćh obráz- 

kov, ktoré ideme klasifikovat’) s rovnaky´mi súradnicami ako pri trénovacej vzorke, chyba 

J (vyrátava sa pri doprednom sˇírení v neurónovej sieti ako rozdiel medzi očakávany´m 

a skutočny´m vy´stupom). Zápis do pomocného súboru support sa vykonáva simultánne s 

18 napr. pre [x,y]: x je súradnica sˇírky, y je súradnica vy´sˇky, príslusˇného pixelu v obrázku 

28

FEI KKUI 

vy´berom trénovacích vzoriek pre klasifikačny´ model M tj. zachováva si ty´m aj poradie - 

následnost’vybranyćh trénovacích vzoriek za sebou ako je to na obrázku5 – 6. Z tohto po- 

mocného súboru subsystém T vytvorí trénovací a testovací súbor pre potreby predikčného 

modelu C. Podl’a pozˇiadaviek a nastavení pre vstupnú vzorku a vy´stupnú (pozˇadovany´ 

vy´stup). Jedna vzorka teda obsahuje: 

- chyby v jednotlivyćh časovyćh krokoch (napr. chyba v čase J(t −2), J(t −1), J(t)), 

trieda príslusˇnosti pre danú vzorku (napr. trieda 3). 

- pozˇadovany´ vy´stup: zálezˇí od toho čo chceme predikovat’(napr. J(t +1) alebo ∆J(t)) 

Vstupné dáta zo satelitnyćh snímkov pre danú trénovaciu vzorku sa načítavajú priamo 

v predikčnom modely C podl’a indexov trénovacej vzorky (tie sú ulozˇené v pomocnom 

súbore support). Tie sú doplnením vstupnyćh dát z trénovacej mnozˇiny pre predikčny´ 

model C. Táto trénovacia mnozˇina vyzerá potom ako na obrázku 5 – 7 Predikčny´ model 

Obr. 5 – 7 Ukázˇka trénovacieho súboru predikčného modelu C v poradí: prvy´ riadok - vstup, druhy´ riadok 

- pozˇadovany´ vy´stup. 

C je neurónová siet’s algoritmom učenia back-propagation, ktorej úlohou je predikovat’ 

29

FEI KKUI 

z danyćh vstupov v nejakom časovom okne vy´stup v časovom okne + 1. Siet’ obsahuje 

vstupnú, jednu skrytú a vy´stupnú vrstvu. Jej logická schéma je rovnaká ako 5 – 3, zmena 

je len vo vstupnyćh dátach a iny´m nastaveniam siete. Na nasledujúcom obrázku 5 – 8 je 

ukázané ako cely´ predikčny´ model funguje. V časovom okne sú dáta, ktoré sa privádzajú 

na vstup a na vy´stupe sú dáta, ktoré sú predikované pomocou neurónovej siete. Trénovací 

súbor zo subsystému T vlastne určuje čo bude na vstupe, čizˇe časové okno a čo na vy´stupe, 

čizˇe čo sa ide predikovat’. 

Obr. 5 – 8 Príklad vizualizácie činnosti predikcie pomocou neurónovej siete. 

Treba poznamenat’, zˇe vstupné aj vy´stupné dáta boli normované na interval 〈0;1〉. To 

tak, zˇe kazˇdá hodnota vstupu - vy´stupu bola predelená jej maximálnou hodnotou, ktorú 

nadobudla počas vsˇetkyćh cyklov učenia. 

30

FEI KKUI 

5.5 Systém pre vy´ber trénovacích vzoriek pre klasifikáciu pomocou 

predikcie curiosity 

Tvorí jadro pri rozhodovaní o tom, či daná trénovacia vzorka bude zahrnutá do procesu 

učenia alebo nie. Tento subsystém - d’alej ho budeme uvádzat’ ako predikčny´ model C, 

prijíma vstupné dáta z dvoch zdrojov. Na vstup prichádza trénovacia vzorka v čase t iM(t) 

spolu s pozˇadovany´m vy´stupom pre trénovaciu vzorku oM(t) a chyby klasifikačného 

modelu M v časoch JM(t),JM(t − 1),JM(t − 2). Pozˇadovanou hodnotou pre predikčny´ 

model je kumulatívna suma podl’a princípu 3.3.1, ktorá je vyjadrená ako: 

E γ 0 ∆JM(t) + γ 1 ∆JM(t + 1) + γ 2 ∆JM(t + 2) 

Pričom platí, zˇe ∆JM(t) = JM(t + 1) − JM(t). Model má teda predikovat’vplyv aktuálnej 

vzorky a d’alsˇích nasledujúcich trénovacích vzoriek na proces učenia. Podl’a princípu 

curiosity má uprednostňovat’vzorky s vel’kou informačnou hodnotou. Pre rozhodovanie 

slúzˇi regulátor, ktory´ na základe vzt’ahu oC(t) < ε, kde oC(t) je vy´stup z predikčného 

modelu C v čase t a ε ≥ 0, privádza trénovaciu vzorku pre učenie klasifikačného modelu 

M. Tento regulátor začína svoju činnost’azˇ potom, ak predikcia predikčného modelu je uzˇ 

na istej spol’ahlivej úrovni (napríklad ak úspesˇnost’predikcie je nad 70%). Logická schéma 

celého systému je na obrázku 5 – 9. 

31

FEI KKUI 

Obr. 5 – 9 Bloková schéma systému s implementovany´m predikčny´m modelom a klasifikačny´m modelom 

pre n cyklov. 

32

FEI KKUI 

5.6 Celkové pouzˇitie systému v interaktívnom rezˇime 

V tejto kapitole je vysvetlená celková implementácia navrhnutého systému. Skladá sa 

so vsˇetkyćh subsystémov, systémov a pomocnyćh aplikácií, ktoré sú navzájom poprepá- 

jané do jedného komplexného interaktívneho systému. Na obrázku 5 – 10 je zobrazeny´ 

tento systém. Funguje nasledovny´m spôsobom: S1 - vstup siedmich satelitnyćh obrázkov 

Obr. 5 – 10 Bloková vsˇeobecná schéma celkového pouzˇitia vsˇetkyćh prepojenyćh subsystémov dohromady 

so znázornením interakcie medzi uzˇívatel’om a počítačom. 

LANDSAT. S2 - vytvorenie obrázku vo falosˇnyćh farbách pre pouzˇívatel’a opísany´ v kapi- 

tole 5.1. S3 - náhl’ad pre pouzˇívatel’a a vy´ber trénovacej mnozˇiny v akomkol’vek externom 

grafickom programe (napr. prostredie freeware GIMP). S4 - tu je zaimplementovany´ jeden 

zo systémov opísanyćh v kapitolách 5.3 a 5.5 schopny´ aj vizualizovat’trénovacie dáta. S5 - 

zobrazí vizualizované trénovacie dáta, pričom uzˇívatel’môzˇe upravit’trénovaciu mnozˇinu 

rovnaky´m spôsobom ako pri S3. 

33

FEI KKUI 

6 Experimenty 

V tejto kapitole sú popísané vy´sledky získané z praktickej časti tejto práce. Obsahuje 

čiastkové aj celkové vy´sledky postupne implementovanyćh systémov. Kazˇdy´ experiment 

obsahuje popis a stručné zhodnotenia vy´sledkov. Celkové zhodnotenie vsˇetkyćh vy´sledkov 

je azˇ v závere práce. 

6.1 Vy´ber trénovacích vzoriek pre učenie 

V tomto experimente bolo ciel’om vybrat’čo najlepsˇie trénovacie dáta z príslusˇnyćh uzˇíva- 

tel’om vybranyćh zaklasifikovanyćh vzoriek. Uzˇívatel’si teda zvolil z obrázku v nereálnych 

(falosˇnyćh) farbách svoje trénovacie vzorky podl’a príslusˇnyćh 4 tried. Pre vsˇetky experi- 

menty boli pouzˇité satelitné snímky LANDSAT oblasti Kosˇíc. Rozličné farby na obrázku 

6 – 1 reprezentujú rozličné triedy. Oproti práci [8] sme pouzˇili iba 4 triedy, kvôli jedno- 

duchsˇej interpretácii pre pouzˇívatel’a a presnejsˇej klasifikácií. Pre klasifikáciu bola pouzˇitá 

neurónová siet’back-propagation s nasledujúcou konfiguráciou: 

• počet neurónov na vstupnej vrstve: 7 

• počet neurónov na skrytej vrstve: 100 

• počet neurónov na vy´stupnej vrstve: 4 

• učiaci parameter γ : 0.3 

• počet cyklov: 3000 

• klasifikačny´ limit: 10% 

V kazˇdom cykle bolo pouzˇityćh 1000 náhodne vybranyćh trénovacích vzoriek. Sú tu 

vedené vy´sledky pri sˇiestich rôzne vybranyćh trénovacích vzorkách. 

34

FEI KKUI 

Obr. 6 – 1 Trénovacia mnozˇina 0. 

Obr. 6 – 2 Vy´sledok klasifikácie pri trénovacej mnozˇine 0. 

Obr. 6 – 3 Graf chy´b na trénovacej, testovacej mnozˇine a priemerná chyba. 

červená: je chyba na trénovacej mnozˇine, zelená: chyba na testovacej mnozˇine 

35

FEI KKUI 





36

FEI KKUI 





37

FEI KKUI 





38

FEI KKUI 





39

FEI KKUI 





40

FEI KKUI 

Zhodnotenie experimentu 

Najvy´znamnejsˇie kritérium pri posudzovaní vy´slednyćh obrázkov bola klasifikácia sate- 

litnyćh obrázkov odpovedajúca skutočnosti. Kazˇdy´ vy´sledny´ obrázok bol porovnany´ voči 

satelitny´m snímkam Kosˇíc z vol’ne dostupného programu Google Earth 4.0 (príklad je 

na obrázku 6 – 19). Trieda, ktorá bola klasifikovaná s najmensˇou úspesˇnost’ou pri vsˇet- 

kyćh trénovacích vzorkách bola voda (rieky). Vytváranie trénovacej mnozˇiny sa deje z 

Obr. 6 – 19 Ukázˇka zobrazovania satelitnyćh obrzov v programe Google Earth 4.0. Na obrázku je oblast’ 

Kosˇíc. 

dôvodu zlozˇitosti programovej implementácie v externom grafickom programe GIMP. 

Ten je vol’ne dostupny´ na internete. Ukázalo sa, zˇe vy´ber trénovacej mnozˇiny má vel’ky´ 

vplyv na vy´slednú klasifikáciu. Ked’zˇe obrázok vo falosˇnyćh farbách je len kvôli lepsˇej 

vizualizácii satelitného čiernobieleho obrázku, nie je mozˇné, aby sa pouzˇívatel’riadil pri 

klasifikovaní do tried podl’a farieb na vizualizovanom obrázku vo falosˇnyćh farbách. Preto 

ako referenčny´ obrázok bol pouzˇívany´ program Google Earth, ktory´ je obsahoval aj reálne 

farebné satelitné obrázky z tej istej oblasti Kosˇíc ako boli obrázky zo satelitu LANDSAT. 

41

FEI KKUI 

Vytvorenie jednej trénovacej mnozˇiny trvá pouzˇívatel’ovi od 10 minút aj do 1 hodiny. 

Trénovacia mnozˇina 0 6 – 1 bola vytvorená z úmyslom čo najjednoduchsˇieho vy´beru z 

hl’adiska pouzˇívatel’a. Ten vyberá triedy pomocou jednoduchyćh geometrickyćh útvarov. 

Pričom triedu 2 (vodu), riečisˇtie je treba vybrat’ po jednotlivyćh pixeloch (to sa ty´kalo 

vsˇetkyćh trénovacích mnozˇín). Trénovacia mnozˇina 1 6 – 4 bola vytvorená za účelom čo 

najväčsˇieho počtu trénovacích vzoriek vybranyćh pomocou subjektívneho ohodnotenia 

pouzˇívatel’a. Trénovacia mnozˇina 2 6 – 7 je vynechaním viaceryćh oblastí z trénovacej 

mnozˇiny 1 s ciel’om čo najmensˇieho počtu trénovacích vzoriek. Trénovacia mnozˇina 3 6 – 

10 bola vytvorená taktiezˇ s ciel’om čo najmensˇím počtom trénovacích vzoriek, ale z inyćh 

oblastí ako u trénovacej mnozˇine 2. Trénovacia mnozˇina 4 6 – 13 bola vytvorená podl’a 

predchádzajúcej ale pridaním d’alsˇích oblastí do mnozˇiny. Trénovacia mnozˇina 5 6 – 16 

obsahuje obmedzenie oblastí pre klasifikačné triedy 1 (mesto) a 4 (polia). Klasifikačná 

trieda 2 (voda) bola vytváraná u vsˇetkyćh mnozˇín po jednotlivyćh pixeloch, kvôli tomu, 

aby klasifikačná siet’ju dokázala rozoznat’napríklad rieku od cesty. Dˇ alsˇou komplikáciou 

bol fakt, zˇe satelitné snímky zachytili v určitej oblasti aj oblaky. Tie spôsobovali mensˇí 

sˇum. Napriek vsˇetky´m ty´mto ukazovatel’om sa podarilo na trénovačkách 0, 2 a 3 dosiahnut’ 

uspokojivé vy´sledky klasifikácie. 

Trieda č. 1 - mesto: bola najlepsˇie zaklasifikovaná pri pouzˇití trénovacích vzoriek 0, 1 

a 3. Najlepsˇie detaily dedín a ciest sú pri pouzˇití trénovacích vzoriek 3, ty´m sa vy´sledny´ 

obrázok stal vít’azom pre triedu č. 0. 

Trieda č. 2 - voda: táto trieda bola najväčsˇím problémom pre vsˇetky trénovacie vzorky. 

Iba v dvoch prípadoch dokázala klasifikačná siet’rozoznat’rieku od cesty, a to pri tréno- 

vacích vzorkách 2 a 3 (čiastocne aj 0). No ani pri jednej mnozˇine vzoriek sa nedokázala 

klasifikačná siet’vyhnút’zasˇumeniu v porovnaní s triedou č.0 - mestom. Vít’azom pre túto 

triedu č. 2 sa stali práve trénovacie mnozˇiny 2 a 3. 

Trieda č. 3 - les: v tejto triede boli zahrnuté aj oblasti lesov, krovín. U skoro vsˇetkyćh 

pouzˇityćh trénovacích mnozˇín od 0 - 5 bola vy´sledná klasifikácia na vel’mi dobrej úrovni. 

Vít’azom pre túto triedu sú trénovacie mnozˇiny 0, 1, 2 a 3. 

trieda č. 4 - polia: v tejto triede sú zahrnuté vsˇetky nezalesnené oblasti, polia a vel’ké 

42

FEI KKUI 

trávnaté plochy. Vít’azom tejto triedy sa stali trénovacie mnozˇiny 2 a 3. 

Klasifikačná siet’back-propagation sa nedokázala celkom vysporiadat’zo vsˇetky´mi klasifi- 

kačny´mi triedami na takej úrovni, aby odrázˇala reálny obraz prostredia. No aj jej vy´sledná 

klasifikácia nám pre experimentálne účely postačovala. Celkovou vít’azom sa stala klasi- 

fikácia pri pouzˇití trénovacej mnozˇiny 3. Táto mnozˇina bola pouzˇitá najčastejsˇie v d’alsˇích 

experimentoch. 

43

FEI KKUI 

6.2 Porovnanie klasifikácie NS s pouzˇitím aproximátora dôveryhod- 

nosti a konvečnej NS 

Ciel’om tohto experimentu je porovnat’klasifikačnú siet’implementovanou podl’a kapitoly 

5.3 a neurónovej siete back-propagation. Porovnat’ ryćhlost’ a kvalitu učenia. Ryćhlost’ 

znamená vel’kost’pomeru chyby klasifikácie ku počtu cyklov alebo aj po kol’kyćh cykloch 

klesla chyba klasifikácie pod istú úroveň. Pre vyhodnocovanie kvality klasifikácie slúzˇi 

vy´sledny´ zaklasifikovany´ obraz a kontingenčná tabul’ka - tabul’ka, ktorej hodnoty sú per- 

centuálne vyjadrenia pozˇadovaného a skutočného vy´stupu z neurónovej siete. Vyjadruje 

kol’ko vít’aznyćh neurónov klasifikovalo vstupnú vzorku (vzhl’adom na testovaciu mno- 

zˇinu) správne a kol’ko reakcií na vstup bolo klasifikovanyćh nesprávne. Takisto sa bude 

sledovat’počet vyhodenyćh vzoriek z trénovacej z pouzˇitej trénovacej mnozˇiny. V kazˇdom 

učiacom sa cykle bola pouzˇitá na vstupe celá trénovacia mnozˇina. Konfigurácia obidvoch 

sietí boli nasledovné: 






• klasifikačny´ limit (prah): 0.6 

Pre tento experiment boli vybrané trénovacie mnozˇiny 0 (6 – 1), 2 (6 – 7) a 3 (6 – 10). 

44

FEI KKUI 

Obr. 6 – 20 Vy´sledok klasifikácie pri pouzˇití NS back-propagation pri trénovacej mnozˇine 4. 

Obr. 6 – 21 Vy´sledok klasifikácie pri NS s aproximátorom dôveryhodnosti pri trénovacej mnozˇine 4. 

Obr. 6 – 22 Graf priebehu vy´beru trénovacích vzoriek (počet cyklov/počet pouzˇityćh trénovacích vzoriek). 

45

FEI KKUI 

Očakáv./skutoč. 1 2 3 4 

1’ 75,76% 2,59% 4,08% 0,00% 

2’ 0,00% 96,10% 0,00% 0,00% 

3’ 24,01% 1,29% 95,83% 0,00% 

4’ 0.00% 8,33% 0,00% 99,89% 

Tabul’ka 6 – 1 Kontingenčná tabul’ka pri pouzˇití NS back-propagation na trénovacej mnozˇine 0(pomer 

medzi očakávanou aktiváciou a skutočnou aktiváciou): 1-mesto, 2-voda, 3-les, 4-polia. 


1’ 87,83% 3,89% 22,19% 0,00% 

2’ 0,00% 94,80% 0,00% 0,00% 

3’ 12,56% 1,50% 75,42% 0,00% 

4’ 0.00% 0,00% 2,30% 99,49% 

Tabul’ka 6 – 2 Kontingenčná tabul’ka pri pouzˇití NS s aproximátorom dôveryhodnosti na trénovacej mnozˇine 

0(pomer medzi očakávanou aktiváciou a skutočnou aktiváciou): 1-mesto, 2-voda, 3-les, 4-polia. 

Obr. 6 – 23 Priebeh chyby pri pouzˇití trénovacej mnozˇiny 0 s pouzˇitím aproximátora dôveryhodnosti 

(červená) a bez neho (zelená). 

46

FEI KKUI 




47

FEI KKUI 


1’ 89,90% 40,00% 5,94% 2,60% 

2’ 2,51% 5,00% 0,00% 2,60% 

3’ 75,47% 55,00% 94,05% 94,79% 

4’ 0.00% 0.00% 0,00% 0.00% 

Tabul’ka 6 – 3 Kontingenčná tabul’ka pri pouzˇití NS back-propagation na trénovacej mnozˇine 2 (pomer 



1’ 93,71% 50,00% 13,51% 2,08% 

2’ 4,40% 7,50% 0,00% 5,72% 

3’ 1,86% 42,50% 86,48% 64,40% 

4’ 0.00% 0,00% 0.00% 30,74% 


2 (pomer medzi očakávanou aktiváciou a skutočnou aktiváciou): 1-mesto, 2-voda, 3-les, 4-polia. 



48

FEI KKUI 




49

FEI KKUI 


1’ 78,90% 11,66% 10,394% 0,00% 

2’ 0,00% 43,71% 0,00% 0,00% 

3’ 19,10% 8,33% 89,60% 0,0% 

4’ 0.00% 8.33% 0,00% 99.89% 

Tabul’ka 6 – 5 Kontingenčná tabul’ka pri pouzˇití NS back-propagation na trénovacej mnozˇine 3 (pomer 



1’ 80,08% 41,66% 11,18% 2,08% 

2’ 4,40% 41,66% 0,00% 0,0% 

3’ 21,01% 8,33% 88,17% 0,00% 

4’ 0.00% 14,58% 0.00% 98,41% 


3 (pomer medzi očakávanou aktiváciou a skutočnou aktiváciou): 1-mesto, 2-voda, 3-les, 4-polia. 



50

FEI KKUI 


Z vy´slednyćh obrázkov sú viditel’né malé rozdiely v klasifikáciách jednotlivyćh tried. U 

vsˇetkyćh vy´slednyćh obrázkov neurónovej siete s pouzˇitím aproximátora dôveryhodnosti 

sú častejsˇie vyskytujúce sa biele oblasti - teda oblasti, ktoré nespl´ňali stanoveny´ klasifi- 

kačny´ limit 60%. Najväčsˇie rozdiely sú pri klasifikácii triedy č. 1 - mesto. Triedy č. 3 - les 

a č. 4 - polia boli klasifikované obidvoma siet’ami na priblizˇne rovnakú mieru. Porovna- 

nie kontingenčnyćh tabuliek nám hovorí, zˇe klasifikácia obyčajnej neurónovej siete bola 

v priemere o 1,4% (vzhl’adom kol’ko vít’aznyćh neurónov klasifikovalo vstupnú vzorku 

podl’a očakávania) lepsˇia ako s pouzˇitím aproximátora dôveryhodnosti (okrem prípadu 

s pouzˇitím trénovacej mnozˇiny 2). Ten robil v priemere o 2,3% väčsˇí počet vít’aznyćh 

neurónov zle klasifikovalo dany´ vstup voči pozˇadovanému (Teda ak vstupná vzorka bola 

triedy 1, tak z tabul’ky 6 – 1 vyply´va: 75,76% vít’aznyćh neurónov klasikovalo vstup podl’a 

pozˇadovaného vy´stupu, 2,59% ako triedu 2, 4,08% ako triedu 3 a 0% ako triedu 4). Z toho 

vyply´va, zˇe s pouzˇitím aproximátora dôveryhodnosti systém počas učenia ponechával 

(ostatné nepouzˇíval v d’alsˇom cykle učenia) trénovacie vzorky, ktoré boli chybne zakla- 

sifikované. Ukázˇkou ako počas učenia separoval trénovaciu mnozˇinu sú grafy priebehov 

vy´beru trénovacích vzoriek. Pri poslednyćh cykloch učenia zredukoval celú trénovaciu 

mnozˇinu v priemere o 78,2%. Grafy priebehov chy´b sa od seba vel’mi nelísˇili, no pri ne- 

urónovej sieti bez aproximátora dôveryhodnosti sú chyby stále v priemere o 2,1% mensˇie 

ako pri jeho pouzˇití. No nie je esˇte poznamenané, zˇe s pouzˇitím aproximátora dôveryhod- 

nosti, je cely´ učiaci sa proces ryćhlejsˇí. Práve ty´m, zˇe počas učenia vyberá len niektoré 

trénovacie vzorky a neprechádza stále celú trénovaciu mnozˇinu je cyklus učenia ryćhlejsˇí 

ako bez jeho pouzˇitia. Takto bola porovnávaná ryćhlost’ aj u Schmidhubera pri vyhod- 

nocovaní jeho experimentov. V tomto experimente sa nemeral časovy´ rozdiel z dôvodu 

jednoduchosti problému v zrovnaní s vy´počtovy´m vy´konom pouzˇívaného počítača. No je 

predpoklad, zˇe s pribúdajúcou zlozˇitost’ou bude tento rozdiel markantny´. 

51

FEI KKUI 

6.3 Vizualizácia vzoriek aproximátora dôveryhodnosti z trénovacej 

mnozˇiny 

Ciel’om tohto experimentu je vizualizovat’vzorky z trénovacej mnozˇiny, ktoré aproximátor 

dôveryhodnosti pouzˇíval pri učení a následne ich analyzovat’. Pri experimente bude pouzˇitá 

trénovacia mnozˇina 0 (vid’. obrázok 6 – 2). Pre tento experiment bol pouzˇity´ systém z 

kapitoly 5.3. Konfigurácie siete: 






• klasifikačny´ limit (prah): 0.1 

Na obrázku Vykreslenie tyćhto bodov nám hovorí, zˇe pre danú triedu trénovacej mnozˇiny 

vykazujú spôsobujú počas procesu učenia najväčsˇiu chybu 

52

FEI KKUI 

Obr. 6 – 32 Trénovacia mnozˇina 0 pouzˇitá pre klasifikáciu a vizualizáciu delty J. 


1’ 85,96% 4,89% 22,28% 0,00% 

2’ 0,00% 94,80% 0,00% 0,00% 

3’ 13,03% 1,29% 77,72% 0,16% 

4’ 0.00% 0,00% 0.00% 99,78% 

Tabul’ka 6 – 7 Kontingenčná tabul’ka s pouzˇitím trénovacej mnozˇiny 0 (pomer medzi očakávanou aktiváciou 

a skutočnou aktiváciou): 1-mesto, 2-voda, 3-les, 4-polia. 

Obr. 6 – 33 Priebeh chyby na testovacích a trénovacích dátach pri pouzˇití trénovacej mnozˇiny 0. 

53

FEI KKUI 

Obr. 6 – 34 Vy´stup klasifikácie so zobrazenou deltou J (odtiene čiernej farby) na trénovacích vzorkách z 

trénovacej mnozˇiny 6 – 32. 

54

FEI KKUI 

Obr. 6 – 35 Upravená trénovacia mnozˇina 0, ktorá bola následne pouzˇitá pre klasifikáciu a vizuálizáciu 

delty J. 


1’ 86,46% 3,89% 16,88% 0,00% 

2’ 0,00% 94,80% 0,00% 0,00% 

3’ 12,11% 1,29% 83,11% 0,00% 

4’ 0.00% 0,00% 0.00% 99,89% 

Tabul’ka 6 – 8 Kontingenčná tabul’ka s pouzˇitím upravenej trénovacej mnozˇiny 0 (pomer medzi očakávanou 

aktiváciou a skutočnou aktiváciou): 1-mesto, 2-voda, 3-les, 4-polia. 

Obr. 6 – 36 Priebeh chyby na testovacích a trénovacích dátach pri pouzˇití upravenej trénovacej mnozˇiny 0. 

55

FEI KKUI 

Obr. 6 – 37 Vy´stup klasifikácie so zobrazenou deltou J po odstránení niektoryćh trénovacích vzoriek 

trénovacej mnozˇiny 6 – 35 z procesu učenia. 

56

FEI KKUI 


Ciel’om tohto experimentu bolo vizualizovat’vzorky z trénovacej mnozˇiny, ktoré aproxi- 

mátor dôveryhodnosti pouzˇíval pri učení. Na obrázkoch 6 – 34 a 6 – 37 sú vizualizované 

vzorky z trénovacej mnozˇiny 0. Farba resp. ich jasová hodnota sa vypočítala podl’a vzt’ahu 

vy´stupny´ pixel =∆J · f arba(RGB) príslusˇnej triedy. 

Teda čím bola ∆J väčsˇia, ty´m bola jasová hodnota RGB väčsˇia, dôsledkom toho má 

vy´sledny´ pixel tmavy´ odtieň (azˇ čiernej) farby príslusˇnej klasifikačnej triedy. Teda tmavy´ 

bod obrázku znamená, zˇe pre danú klasifikačnú triedu, z ktorej pochádza bod trénovacej 

mnozˇiny, klasifikačny´ modul M vykazoval väčsˇiu chybu ako pri predchádzajúcom bode 

obrázku. Vel’kost’ tejto zmeny chyby je priamo úmerná odtieňu farby tohto bodu. Na 

obrázku 6 – 35 je pouzˇívatel’om upravená trénovacia mnozˇina 0 s ciel’om odstránit’niektoré 

vzorky, ktoré spôsobujú väčsˇiu chybu klasifikácie pre danú klasifikačnú triedu (Boli 

odstránené niektoré vzorky z kazˇdej klasifikačnej triedy ako je to zrejme z obrázka 6 – 

35). Potom klasifikačná siet’ Ms aproximátorom dôveryhodnosti vykazovala zlepsˇenú 

klasifikáciu v priemere okolo 2% a zmensˇil sa počet zle klasifikovanyćh vzoriek. Z toho 

vyply´va, zˇe vizualizované vzorky z trénovacej mnozˇiny vply´vajú na presnost’klasifikácie 

klasifikačného modelu M. 

57

FEI KKUI 

6.4 Experimenty s predikčny´m modelom 

Hlavny´ model vyuzˇívajúci predikčny´ model C je opísany´ v kapitole 5.5. Tieto nasledujúce 

experimenty majú poukázat’na funkčnost’a predikčného modelu C na vstupnyćh dátach, 

ktoré tento model dostáva z predchádzajúceho subsystémy - klasifikačnej siete. Úlohou 

tohto modelu je ako uzˇ bolo spomenuté predikovat’budúci prínos z trénovacích vzoriek. 

Nasledujúce čiastkové experimenty postupne demonsˇtrujú spol’ahlivost’a presnost’pred- 

ikcie. Kritérium kvality je spol’ahlivost’- presnost’predikcie, ktorú môzˇeme vyčítat’z grafu 

priebehu chyby medzi očakávany´mi a skutočny´mi (predikovany´mi) dátami. 

Overenie predikčného modelu 

Tento experiment má preverit’ funkčnost’ predikčného modelu C. Bol pouzˇity´ model z 

kapitoly 5.4 Ciel’om je, aby daná predikčná siet’dokázala predikovat’s istou presnost’ou 

(napr. min 70%). Pre učenie bola pouzˇitá trénovacia mnozˇina, ktorá bola vytvorená z 

klasifikačného modulu M pri klasifikácií podl’a trénovacej mnozˇiny 3. Fungujúcom na 

princípe opísanom taktiezˇ v kapitole 5.4. Vstup pre predikčnú siet’back-propagation boli 

dáta v tvare iM(t), oM(t), JM(t), JM(t −1), JM(t −2) a pozˇadovany´ vy´stup bol JM(t +1). 

Ako kritétium kvality bude povazˇovany´ graf priebehu chyby učenia. 






58

FEI KKUI 

Obr. 6 – 38 Graf priebehu chyby na predikčného modelu C pri pouzˇití trénovacích dát z klasifikačného 

modelu M pre predikciu JM(t + 1). 

Obr. 6 – 39 Priebeh chyby predikčného modelu C pri aproximácii funkcie XOR. 

59

FEI KKUI 


Ciel’om tohto experimentu bolo overenie funkčnosti neurónovej siete na predikcii z jed- 

noduchyćh trénovacích dát. Z grafov 6 – 38 a 6 – 39 je vidno, zˇe predikčny´ model dokázal 

aproximovat’vzt’ahy medzi vstupny´mi a vy´stupny´mi dátami. Pri vstupnyćh dátach z kla- 

sifikačného modulu chyba klesla v priemere o 78%. 

Predikčny´ model aproximujúci jednoduchy´ prípad curiosity 

Je to kl’účovy´ experiment pre overenie presnosti predikcie predikčného modelu C (neuró- 

nová siet’back-propagation) pre potreby systému opísanom v kapitole 5.5. Jeho ciel’om je 

naučit’predikčny´ model C na dátach z klasifikačného modelu M pri klasifikácií podl’a tré- 

novacej mnozˇiny 3. Tie sú v tomto tvare: Na vstup prichádza rovnaká trénovacia mnozˇina 

ako v predchádzajúcom experimente iM(t), oM(t), JM(t), JM(t − 1), JM(t − 2) no pozˇa- 

dovaná hodnota pre vy´stup predikčného modulu C je podl’a kapitoly 5.5 v tvare ∆JM(t), 

čo je zjednodusˇeny´ prípad základného princípu curiosity. 







Ciel’om experimentu ukázat’ako úspesˇne dokázˇe predikčny´ model C predikovat’z danyćh 

vstupnyćh dát. Z grafu 6 – 40 môzˇeme vyčítat’, zˇe chyba klesla len o 2%. To znamená, 

zˇe predikčná siet’ sa nedokázˇe podl’a takto zadanej trénovacej mnozˇiny niečo naučit’. 

Hlavné príčiny prečo nedokázal aproximovat’budúce vzorky, boli v trénovacích dátach. 

60

FEI KKUI 

Obr. 6 – 40 Priebeh chyby predikčného modelu C predikujúci očakávanú jednoduchy´ prípad curiosity. 

Na obrázku 6 – 41 je zobrazené čast’ trénovacej mnozˇiny pre C (nenormované hodnoty 

Obr. 6 – 41 Ukázˇka časti trénovacieho súboru pre predikčny´ model C v tavre: nenornované chyby v časovom 

okne a trieda príslusˇnosti ako vstup; ako vy´stup normované očakávané curiosity. 

61

FEI KKUI 

chy´b sa normujú pred začiatkom učenia v predikčnom modely). Je z neho vidno, zˇe 

pozˇadovaná v niektoryćh prípadoch je hodnota curiosity vel’mi malá. Z toho vyply´va, zˇe 

predikčná siet’sa po čase (istom počte cyklov) némá čo učit’. Dˇ alej nastávajú prípady, kedy 

pre rovnaké vstupy sú rôzne pozˇadované vy´stupy. Tie sa vyskytujú pri skončení cyklu 

učenia v času t a začiatku cyklu učenia v čase t + 1. Ty´m sa vytvára v trénovacích dátach 

sˇum, ktory´ okrem inyćh faktorov tiezˇ ovplyvňuje presnost’predikcie. 

Predikčny´ model aproximujúci curiosity 

Je to doplňujúci experiment k predchádzajúcemu experimentu. Trénovacia mnozˇina mala 

tvar: Na vstup prichádzajú dáta iM(t), oM(t), JM(t), JM(t − 1), JM(t − 2). Pozˇadovaná 

hodnota pre vy´stup predikčného modulu C bola v tvare 

γ 0 ∆JM(t) + γ 1 ∆JM(t + 1) + γ 2 ∆JM(t + 2), 

podl’a základného princípu curiosity. Konfigurácia siete predikčného modulu bola nasle- 

dovná: 




• učiaci parameter: 0.35 


• parameter curiosity γ : 0.01 


Ciel’om experimentu bolo síce ukázat’ako úspesˇne dokázˇe predikčny´ model C predikovat’z 

danyćh vstupnyćh dát, no uzˇ po predchádzajúcom neúspesˇnom experimente sa uzˇ očakával 

62

FEI KKUI 

Obr. 6 – 42 Priebeh chyby predikčného modelu predikujúci očakávanú curiosity pre časové okno 〈0,3〉 

sekundy. 

záporny´ vy´sledok. Z grafu 6 – 42 je vidno, zˇe chyba klesla opät’len o málo (okolo 2%). 

To znamená, zˇe predikčná siet’sa nedokázˇe ani podl’a takto zadanej trénovacej mnozˇiny 

niečo naučit’. 

Vy´ber trénovacích vzoriek predikčny´m modelom C pre klasifikáciu 

Ciel’om tohto experimentu bolo overit’funkčnost’a ryćhlost’systému opísaného v kapitole 

5.5. Systém bol nastaveny´ tak, zˇe pri prvyćh n cyklov učenia vstupujú do klasifikačného 

modelu vzˇdy vsˇetky trénovacie vzorky, pričom sa predikčny´ model učí predikovat’podl’a 

pozˇadovaného vy´stupu (ten sa prepočítava ako aj vstupné dáta pre predikčny´ model 

C). Predikčny´ model C mal predikovat’ očakávanú curiosity rovnaky´m spôsobom ako 

v experimente - 6.4Predikčny´ model aproximujúci curiosity. Bola pouzˇitá trénovacia 

mnozˇina 4. Konfigurácia neurónovej siete predikčného modelu C: 


63

FEI KKUI 



• učiaci parameter: 0.4 

• parameter curiosity γ : 0.01 

Konfigurácie neurónovej siete klasifikačného modelu M: 






Z vy´sledkov predchádzajúcich dvoch experimentov vyply´va, zˇe predikčny´ model C doká- 

zal predikovat’na základe vstupnyćh dátach iba s vel’mi malou spol’ahlivost’ou (iba 2%). No 

kvôli demonsˇtrácií systému a s ciel’om overenia správnosti predchádzajúcich vy´sledkov 

bol vykonany´ tento experiment. Pri učení oboch modelov nastali dva prípady: 

1. Počas vsˇetkyćh cyklov učenia prichádzali na vstup klasifikačného modelu M vsˇetky 

trénovacie vzorky z trénovacej mnozˇiny. 

2. Po n počte cyklov učenia neprichádzali na vstup klasifikačného modelu M zˇiadne 

trénovacie vzorky z trénovacej mnozˇiny. 

Tento jav spôsoboval ”regulátor” oC(t) < ε, ktory´ rozhodoval o tom, či daná trénovacia 

vzorka bude vstupom pre učenie klasifikačného modelu M. Bolo obtiazˇné zvolit’ také 

0,0 < ε < 1,0, aby sme sa prispôsobili vy´stupu predikčného modelu C oC(t). oC sa 

nikdy nenachádzal v rovnakom intervale (napr. 〈0,42;0.52〉). Bolo to spôsobené ty´m, 

zˇe predikčny´ model C sa nedokázal naučit’predikovat’očakávanú curiosity. Jeho vy´stup 

64

FEI KKUI 

sa po určitom počte cyklov učenia ustálil v istom intervale. No pri opätovnom spustení 

predikčného modelu (pri inej inicializácii váh medzi jednotlivy´mi vrstvami) po tom istom 

počte učiacich sa cyklov tento inteeval bol úplne rozdielny. 

6.5 Celkové zhodnotenie experimentov 

Hlavny´m ciel’om experimentov bolo overenie vplyvu trénovacej mnozˇiny na vy´sledok 

klasifikácie a ryćhlost’učenia pomocou curiosity algoritmov a ich základnyćh princípov. 

Pre vsˇetky experimenty boli pouzˇité satelitné obrázky satelitu LANDSAT. 

Ukázalo sa, zˇe vy´ber trénovacej mnozˇiny, presnejsˇie kategorizácia oblastí do príslusˇnyćh 

klasifikačnyćh tried má vel’ky´ vplyv na vy´slednú klasifikáciu, teda na jej presnost’. Vizu- 

alizáciou bodov z trénovacej mnozˇiny, ktoré boli relevantné pre proces klasifikácie (teda 

zaujímavé z hl’adiska procesu učenia), bola poskytnutá uzˇívatel’ovi mozˇnost’interakcie so 

systémom. Teda ukázala mu oblasti trénovacej mnozˇiny, na ktoré je prospesˇné sa zamerat’. 

Dˇ alsˇie príklady len potvrdili závery o vplyve trénovacej mnozˇiny na presnost’klasifiká- 

cie. Bolo ukázané, zˇe selekcia trénovacích vzoriek počas učenia zryćhl’uje proces učenia 

a vply´va na presnost’ klasifikácie. S vyuzˇitím aproximátora dôveryhodnosti sa selekcia 

vykonávala s ciel’om ponechávat’trénovacie vzorky v procese učenia na základe ich in- 

formačného prínosu. 

Implementácia algoritmu curiosity v predikčnom modely sa pre problém klasifikácie ne- 

osvedčil. Experimentálne boli overené viaceré mozˇnosti predikcie curiosity, no vsˇetky 

mali nepostačujúce vy´sledky. Jedny´m z dôvodov boli trénovacie dáta. Tie boli zasˇumené 

a nepostačujúce pre učenie sa neurónovej siete (malé a vel’ké rozdiely medzi trénovacími 

vzorkami pozˇadovanyćh vy´stupov). 

Podrobnejsˇie zhodnotenia jednotlivyćh experimentov sa nachádzajú v závere kazˇdého 

experimentu. 

65

FEI KKUI 

7 Záver 

Ciel’om práce bolo zistit’mozˇnosti vyuzˇitia curiosity algortmov pri klasifikácii satelitnyćh 

obrazov. Pre splnenie tohto ciel’a bolo potrebné nasˇtudovat’celú problematiku klasifikácie, 

predikcie a základnyćh princípov curiosity. Navrhnút’ a implementovat’ vhodny´ systém 

pre riesˇenie vsˇetkyćh pozˇiadaviek. 

V prvyćh kapitolách bol vypracovany´ úvod do problematiky neurónovej siete so spätny´m 

sˇírením chyby a do problematiky curiosity algoritmov. Následne bol vypracovany´ prehl’ad 

do problematiky klasifikácie satelitnyćh obrazov pomocou neurónovyćh sietí. To boli prvé 

dve pozˇiadavky úloh zadania, ktoré sa podarilo splnit’v kapitolách 2, 3 a 4. 

Pre potreby experimentálnej časti práce bol navrhnuty´ interaktívny systém. Logické 

schémy a samotná implementácia je vysvetléná v kapitole 5. Kl’účovou čast’ou práce 

boli experimenty. Tie sú podrobne opísané v kapitole 6. 

V experimentálne časti tejto práce vyply´va prínos selekcie trénovacej mnozˇiny pre pro- 

ces učenia neurónovej siete a presnost’ klasifikácie. Dˇ alej prínos vizualizácie vzoriek 

trénovacej mnozˇiny pre pouzˇívatel’a, ktorá poskytuje mozˇnosti analy´zi a interakcie. nepo- 

darilosa vsˇak prepojit’problematiku klasifikácie - predikcie curiosity tak ako to prepojil 

J. Schmidhuber u reinforcement aplikáciach. Prečo je tomu tak je vysvetlené z časti pri 

experimentoch s predikčny´m modelom 6.4. Iná teória prečo sa to nepodaril implemento- 

vat’spolu je: V príklade, ktory´ uvádza Schmidhuber ako jednoduchy´ príklad, uvedenom v 

kapitole 3 (3.3.3), chyba J(t) súvisela s chybou J(t + 1), lebo vstup in(t) a vstup in(t + 1) 

v prípade agenta pohybujúceho sa v prietore sú si blízke (vstupy navzájom súvisia). Teda 

chyba J(t) sa oproti chybe v časte t + 1 vel’mi nelísˇi. Na rozdiel v nasˇom prípade vstup 

in(t) a vstup in(t +1) nemusia spolu vôbec súvisiet’(ak vstupom in(t) je trénovacia vzorka 

z klasifikačnej mnozˇiny 1 a in(t +1) je trénovacia vzorka z klasifikačnej mnozˇiny 3, alebo 

akákol’vek iná trieda). 

Do budúcna je potrebné vytvorit’prípadné d’alsˇie teórie prečo nefunguje prepojenie medzi 

predickciou curiosity a klasifikáciou a realizovat’experimenty na potvrdenie alebo vyvrá- 

tenie tyćhto teórií. Jedna z mozˇností je, aby sa na vstup pre klasifikačnú siet’privádzal pixel 

66

FEI KKUI 

po pixely z trénovacej mnozˇiny, aby bola zabezpečené väčsˇia časová súvislost’. Potom pri 

funkčnosti celého systému zlepsˇit’interakčny´ systém s pouzˇívatel’om. 

Aplikačny´ potenciál tejto práce má svoje uplatnenie práve pri klasifikácii stelitnyćh dát 

nielen satelitu LANDSAT. Softvér Google Earth Pro pracujúci so satelitny´mi obrazmi 

má v sebe funkciu, ktorá klasifikuje dany´ obraz do jednoduchyćh tried (oby´vaná oblast’, 

priemysel, obchody, ...). Implementácia interaktívneho modelu klasifikácie s vyuzˇitím 

curiosity algoritmu v takomto softvéri by znamenal vel’ky´ ryćhlostny´ a kvalitatívny skok 

oproti doterajsˇím vy´sledkom (uzˇ len z hl’adiska interakcie s pouzˇívatel’om). 

67

FEI KKUI 

Zoznam pouzˇitej literatúry 

[1] BARUAH, P. J., TUMURA, M., OKI, M. a NISHIMURA, H. 2001 Neural network 

modeling of lake surface chlorophyl and sediment from Landsat TM imagery Pro- 

ceedings of the 22nd Asian Conference on Remote Sensing, Singapore 2001., pp. 

911-916 

[2] HOSSEINI ARIA, E., J. AMINI, J., SARADJIAN, M.R. 2003. Back Propagation 

N eural Network for Classification of IRS-1D Satellite Images., Department of 

geomantics, Faculty of Engineering, Tehran University 

[3] KOPČO, N., SINČÁK, P., WEREGIN, H., 1999. Extended Methods for Classifi- 

cation of Remotely Sensed Images Based on ARTMAP Neural Networks. Techni- 

cal University Kosˇice 

[4] SCHMIDHUBER, J. 1991. Adaptive confidence and adaptive curiosity. In: Institut 

für Informatik, Technische Universität München, Technical Report FKI-149-91, 

April, 30, 1991 

[5] SCHMIDHUBER, J. 1991. Adaptive decomposition of time. To appear in O. Simula, 

editor, Proceedings of the International conference on Artificial Neural Networks 

ICANN’91. Elsevier Science Publisher B. V., Január, 1991, s. 1–5 

[6] SCHMULLIUS, C. 2003 Forest cover change detection in Siberia Institute for 

Geoinformatics and Remote Sensing, Friedrich-Schiller University Jena, 2003 

[7] SINČÁK, P. – ANDREJKOVÁ, G. 1996. Neurónové siete - Inzˇiniersky prístup 1. 

diel. ,Elfa-press, ISBN 80-8256-030-5, 1996 

[8] UHRIN, J. 2006. Interaktívny vy´ber trénovacej mnozˇiny pre klasifikáciu obrazo- 

vyćh dát pomocou neurónovej siete. Diplomová práca. Kosˇice: Katedra kyberne- 

tiky a umelej inteligencie, TU FEI Kosˇice., 2006 

68

FEI KKUI 

Internetové zdroje: 

[9] http://www.satelliteimpressions.com/landsat.html 

[10] http://landsat.gsfc.nasa.gov/ 

69

Zoznam príloh 

1. CD médium - diplomová práca v elektronickej podobe, prílohy v elektronickej 

podobe. 

2. Pouzˇívatel’ská príručka 

3. Systémová príručka

FEI KKUI 

Zoznam obrázkov 

4 – 1 Oblasti elektromagnetického spektra prebrané z [9] . . . . . . . . . . . . 17 

4 – 2 Originálne obrázky satelitu LANDSAT v 7 rôznych spektrách elektro- 

magnetického zˇiarenia . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 

4 – 3 Vy´sledok klasifikácie pomocou Gaussian ARTMAP siete. Prevzaté od [3] 20 

4 – 4 Vy´sledok klasifikácie pomocou Support Vector Machines podl’a [8] . . . 20 

4 – 5 Vizualizácia podpornyćh vektorov po 2000 učiacich cykloch prevzaté z [8] 21 

5 – 1 Satelitny´ obrázok vl’avo (1 zo 7 spektier) a príklad obrázku vo falosˇnyćh 

farbách (kompozícia spektier 5, 4 a 6). . . . . . . . . . . . . . . . . . . . 23 

5 – 2 Schéma Subsystému 1 pre zafarbovanie obrázkov. . . . . . . . . . . . . . 23 

5 – 3 Bloková schéma neurónovej sieti pre klasifikáciu trénovacej mnozˇiny pre 

n cyklov učenia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

5 – 4 Bloková schéma s pouzˇitím regulátora na princípe aproximátora dôvery- 

hodnosti pre 300 cyklov učenia. . . . . . . . . . . . . . . . . . . . . . . 26 

5 – 5 Vy´stupny´ obrázok klasifikačného systému. . . . . . . . . . . . . . . . . . 27 

5 – 6 Čast’ schémy klasifikačného modelu M zobrazujúci zápis informácií do 

pomocného súboru support. . . . . . . . . . . . . . . . . . . . . . . . . . 28 

5 – 7 Ukázˇka trénovacieho súboru predikčného modelu C v poradí: prvy´ riadok 

- vstup, druhy´ riadok - pozˇadovany´ vy´stup. . . . . . . . . . . . . . . . . 29 

5 – 8 Príklad vizualizácie činnosti predikcie pomocou neurónovej siete. . . . . 30 

5 – 9 Bloková schéma systému s implementovany´m predikčny´m modelom a 

klasifikačny´m modelom pre n cyklov. . . . . . . . . . . . . . . . . . . . 32 

5 – 10Bloková vsˇeobecná schéma celkového pouzˇitia vsˇetkyćh prepojenyćh sub- 

systémov dohromady so znázornením interakcie medzi uzˇívatel’om a po- 

čítačom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 

6 – 1 Trénovacia mnozˇina 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 

6 – 2 Vy´sledok klasifikácie pri trénovacej mnozˇine 0. . . . . . . . . . . . . . . 35 

6 – 3 Graf chy´b na trénovacej, testovacej mnozˇine a priemerná chyba. . . . . . 35 

71

FEI KKUI 







6 – 10Trénovacia mnozˇina 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

6 – 11Vy´sledok klasifikácie pri trénovacej mnozˇine 3. . . . . . . . . . . . . . . 38 

6 – 12Graf chy´b na trénovacej, testovacej mnozˇine a priemerná chyba. . . . . . 38 







6 – 19Ukázˇka zobrazovania satelitnyćh obrzov v programe Google Earth 4.0. 

Na obrázku je oblast’Kosˇíc. . . . . . . . . . . . . . . . . . . . . . . . . . 41 

6 – 20Vy´sledok klasifikácie pri pouzˇití NS back-propagation pri trénovacej mno- 

zˇine 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

6 – 21Vy´sledok klasifikácie pri NS s aproximátorom dôveryhodnosti pri tréno- 

vacej mnozˇine 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

6 – 22Graf priebehu vy´beru trénovacích vzoriek (počet cyklov/počet pouzˇityćh 

trénovacích vzoriek). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

6 – 23Priebeh chyby pri pouzˇití trénovacej mnozˇiny 0 s pouzˇitím aproximátora 

dôveryhodnosti (červená) a bez neho (zelená). . . . . . . . . . . . . . . . 46 


zˇine 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 



72

FEI KKUI 






zˇine 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 







6 – 32Trénovacia mnozˇina 0 pouzˇitá pre klasifikáciu a vizualizáciu delty J. . . . 53 

6 – 33Priebeh chyby na testovacích a trénovacích dátach pri pouzˇití trénovacej 

mnozˇiny 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

6 – 34Vy´stup klasifikácie so zobrazenou deltou J (odtiene čiernej farby) na 

trénovacích vzorkách z trénovacej mnozˇiny 6 – 32. . . . . . . . . . . . . 54 

6 – 35Upravená trénovacia mnozˇina 0, ktorá bola následne pouzˇitá pre klasifi- 

káciu a vizuálizáciu delty J. . . . . . . . . . . . . . . . . . . . . . . . . . 55 

6 – 36Priebeh chyby na testovacích a trénovacích dátach pri pouzˇití upravenej 

trénovacej mnozˇiny 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

6 – 37Vy´stup klasifikácie so zobrazenou deltou J po odstránení niektoryćh tré- 

novacích vzoriek trénovacej mnozˇiny 6 – 35 z procesu učenia. . . . . . . 56 

6 – 38Graf priebehu chyby na predikčného modelu C pri pouzˇití trénovacích dát 

z klasifikačného modelu M pre predikciu JM(t + 1). . . . . . . . . . . . . 59 

6 – 39Priebeh chyby predikčného modelu C pri aproximácii funkcie XOR. . . . 59 

6 – 40Priebeh chyby predikčného modelu C predikujúci očakávanú jednoduchy´ 

prípad curiosity. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 

73

FEI KKUI 

6 – 41Ukázˇka časti trénovacieho súboru pre predikčny´ model C v tavre: nenor- 

nované chyby v časovom okne a trieda príslusˇnosti ako vstup; ako vy´stup 

normované očakávané curiosity. . . . . . . . . . . . . . . . . . . . . . . 61 

6 – 42Priebeh chyby predikčného modelu predikujúci očakávanú curiosity pre 

časové okno 〈0,3〉 sekundy. . . . . . . . . . . . . . . . . . . . . . . . . . 63 

74

FEI KKUI 

Zoznam tabuliek 

4 – 1 Spektrá elektromagnetického zˇiarenia z Thematic Mapper . . . . . . . . . 17 

6 – 1 Kontingenčná tabul’ka pri pouzˇití NS back-propagation na trénovacej mno- 

zˇine 0(pomer medzi očakávanou aktiváciou a skutočnou aktiváciou): 1- 

mesto, 2-voda, 3-les, 4-polia. . . . . . . . . . . . . . . . . . . . . . . . . 46 

6 – 2 Kontingenčná tabul’ka pri pouzˇití NS s aproximátorom dôveryhodnosti na 

trénovacej mnozˇine 0(pomer medzi očakávanou aktiváciou a skutočnou 

aktiváciou): 1-mesto, 2-voda, 3-les, 4-polia. . . . . . . . . . . . . . . . . 46 


zˇine 2 (pomer medzi očakávanou aktiváciou a skutočnou aktiváciou): 

1-mesto, 2-voda, 3-les, 4-polia. . . . . . . . . . . . . . . . . . . . . . . . 48 


trénovacej mnozˇine 2 (pomer medzi očakávanou aktiváciou a skutočnou 



zˇine 3 (pomer medzi očakávanou aktiváciou a skutočnou aktiváciou): 

1-mesto, 2-voda, 3-les, 4-polia. . . . . . . . . . . . . . . . . . . . . . . . 50 


trénovacej mnozˇine 3 (pomer medzi očakávanou aktiváciou a skutočnou 


6 – 7 Kontingenčná tabul’ka s pouzˇitím trénovacej mnozˇiny 0 (pomer medzi 

očakávanou aktiváciou a skutočnou aktiváciou): 1-mesto, 2-voda, 3-les, 

4-polia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

6 – 8 Kontingenčná tabul’ka s pouzˇitím upravenej trénovacej mnozˇiny 0 (pomer 

medzi očakávanou aktiváciou a skutočnou aktiváciou): 1-mesto, 2-voda, 

3-les, 4-polia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

75

Šablóna na písanie záverečných prác - Technická univerzita v ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?