AutomatickÃ© rozpoznÃ¡vanie Å PZ motorovÃ½ch vozidiel v ... - Utc.sk

Automatické rozpoznávanie ŠPZ motorových vozidiel v 

obraze a vo videosekvenciách 

DIPLOMOVÁ PRÁCA 

ERIK MELICHER 

ŽILINSKÁ UNIVERZITA V ŽILINE 

Elektrotechnická fakulta 

Katedra telekomunikácií 

Študijný odbor: TELEKOMUNIKÁCIE 

Vedúci diplomovej práce: Ing. Miroslav Benčo 

Stupeň kvalifikácie: inžinier(Ing.) 

Dátum odovzdania diplomovej práce: 18.5.2007 

ŽILINA 2007 

I

Abstrakt 

V tejto práci je popísaná metóda na automatickú detekciu a znakové rozpoznaniue štátnej 

poznávacej značky motorových vozidiel. Úlohou je demonštrovať na tomto príklade 

z praxe možné využitia v oblastiach, ktoré slúžia na automatizáciu a zjednodušenie 

ľudskej činnosti. Pre tento fakt sa jadro práce sústredí nielen na vysvetlenie samostatných 

rozpoznávaní objektov v obraze ale, rozoberá aj množstvo teoretických vedomostí 

týkajúcich sa preprocesingu obrazu a videosekvencií. Sú vysvetlené mnohé postupy 

a metódy, akými sú napríklad hranové deskriptory, charakteristické extremálne regióny, 

neurónové siete atď. 

II

Žilinská univerzita v Žiline, Elektrotechnická fakulta, 

Katedra telekomunikácií 

________________________________________________________________________ 

ANOTAČNÝ ZÁZNAM – DIPLOMOVÁ PRÁCA 

Priezvisko, meno: Melicher Erik školský rok: 2006/2007 

Názov dipl. práce: Automatické rozpoznávanie ŠPZ motorových vozidiel v obraze a vo 

videosekvenciách 

Počet strán: 56 Počet obrázkov: 51 Počet tabuliek: 0 

Počet grafov: 0 Počet príloh: 1 Použitá lit.: 10 

Anotácia 

V tejto práci sa prezentuje metóda na automatickú detekciu a znakové 

rozpoznávanie štátnej poznávacej značky motorových vozidiel. Spolu s týmto 

problémom, práca teoreticky rozoberá metódy k spracovaniu snímkov a videosekvencií. 

Zároveň prezentuje množstvo postupov k učeniu a rozpoznaniu objektov v obraze. 

Napríklad hranové deskriptory, charakteristické extremálne regióny, neurónové siete atď. 

Anotácia v cudzom jazyku ( anglický jazyk ): 

This work, present a method to automatic detection and character recognition 

Vehicle Licence-Plate. Together with this problem, the work show theoretical method to 

processing the images and moves scenes. At the same time it present many advancements 

to learn and recognize object category in images. For example edge description, 

characteristic extremal regions, neural network etc. 

Kľúčové slová: Štátna poznávacia značka, selekcia, detekcia, verifikácia, transformácia, 

znakové rozpoznávanie, predspracovanie obrazu, separácia, neurónové siete. 

Vedúci práce: Ing. Miroslav Benčo 

Recenzent práce:......................................................... 

Dátum odovzdania práce:.......................................... 

III

Obsah 

Zoznam obrázkov .......................................................................................................VI 

Zoznam použitých skratiek ..................................................................................VIII 

Úvod...................................................................................................................................1 

1 Teoretické spracovanie problematiky rozpoznávania znakov 

a všeobecne objektov v obraze a vo videosekvenciách ....................................3 

1.1 Transformácie ..........................................................................................................4 

1.1.1 Fourierova transformácia-(používaná napríklad pri rozpoznávaní ŠPZ vo 

vieosekvenciách)..........................................................................................................4 

1.1.2 Diskrétna Fourierova transformácia ...................................................................5 

1.1.3 Radonova transformácia .....................................................................................6 

1.2 Predspracovanie obrazu..........................................................................................8 

1.2.1 Jasové transformácie (využité v programe).........................................................8 

1.2.2 Geometrické transformácie.................................................................................8 

1.2.3 Lokálne predspracovanie ....................................................................................9 

1.2.3.1 Vyhľadzovanie..............................................................................................9 

1.2.3.2 Ostrenie- Hranové detektory (Gradientné operátory).................................9 

1.3 Segmentácia obrazu (využité v programe).............................................................10 

1.3.1 Prahovanie (využité v programe) ......................................................................10 

1.3.2 Segmentácia založená na hranách (využité v programe) ..................................11 

1.3.2.1 Prahovanie obrazu hrán (využité v programe)..........................................11 

1.3.2.2 Určovanie hranice ako heuristické hľadanie.............................................11 

1.3.2.3 Dynamické programovanie........................................................................12 

1.3.2.4 Houghova transformácia (využité v programe).........................................12 

1.3.3 Segmentácia založená na oblastiach .................................................................14 

1.3.3.1 Spájanie oblastí..........................................................................................14 

1.3.3.2 Delenie oblastí ...........................................................................................15 

1.3.3.3 Delenie-a-spájanie oblastí.........................................................................15 

1.4 Porovnávanie so vzorom (matching)....................................................................16 

1.5 Rozpoznávacie techniky (využité v programe)......................................................16 

1.5.1 Štatistické rozpoznávanie obrazcov..................................................................16 

1.5.2 Neurónové siete (využité v programe) ..............................................................16 

1.5.2.1 Pracovná fáza umelej neurónovej siete .....................................................18 

1.5.2.2 Učenie (trénovanie) ...................................................................................18 

1.5.2.3 Vybavenie(testovanie) ................................................................................18 

1.5.3 Syntaktické rozpoznávanie obrazcov................................................................18 

1.5.4 Rozpoznávanie ako porovnávanie zhody dvoch grafov ...................................19 

2 Prehľad a porovnanie dostupných algoritmov automatického 

rozpoznávania ŠPZ.....................................................................................................20 

2.1 Metódy detekcie ŠPZ motorových vozidiel..........................................................20 

2.1.1 Metóda prahovania vstupného obrázka na binárny ..........................................20 

2.1.2 Metóda relatívne pravidelného prechodu hrán jasovej úrovne medzi písmenami 

a medzerami znakov ŠPZ (Metóda vertikálnych hrán)..............................................21 

IV

2.2 Metódy selekcie znakov ŠPZ motorových vozidiel .............................................22 

2.2.1 Metóda segmentácie pomocou vertikálnej a horizontálnej projekcie...............22 

2.2.2 Metóda CER (Characteristic Extremal Regions)..............................................23 

2.2.2.1 Extremálna oblasť......................................................................................23 

2.2.2.2 Algoritmus detekcie a selekcie CER ..........................................................24 

2.3 Selektor ...................................................................................................................25 

2.3.1 Neurónová sieť programovacieho jazyka Matlab.............................................26 

2.3.2 Sieťové architektúry ponúkajúce prostredie Matlab.........................................27 

2.3.3 Neurónová sieť na znakové rozpoznávanie(Matlab) ........................................29 

3 Praktická realizácia programu na automatické rozpoznanie ŠPZ .......31 

3.1 Vstupné dáta...........................................................................................................31 

3.1.1 Algoritmus na detekciu pohybu ........................................................................31 

3.2 Predspracovanie vstupných dát............................................................................32 

3.2.1 Prevod farebného RGB formátu do formátu 256 odtieňov sivej farby.............32 

3.2.2 Zaistenie dostatočného množstva jasových (kontrastových) úrov....................33 

3.2.3 Prevod obrázku 256 odtieňov sivej (grey) na binárny obrázok pozostávajúci 

z logických jednotiek a núl pomocou techniky prahovania.......................................34 

3.3 Výber kandidátov na ŠPZ značku........................................................................34 

3.3.1 Algoritmus číslo 1.............................................................................................34 

3.3.1.1 Prvá funkcia trasovania(trace) ..................................................................35 

3.3.1.2 Rozšírenie hrán rámiku ŠPZ ......................................................................36 

3.3.1.3 Úprava matice vhodnej na odpočet ...........................................................37 

3.3.1.4 Po odpočte odstránenie miniatúrnych oblastí ...........................................37 

3.3.1.5 Funkcia na zlúčenie čiastkových oblastí....................................................38 

3.3.1.6 Odstránenie malých oblastí .......................................................................39 

3.3.1.7 Druhá funkcia trasovania (trace) ..............................................................39 

3.3.2 Algoritmus číslo 2.............................................................................................40 

3.3.2.1 Prvá funkcia trasovania(trace) ..................................................................40 

3.3.2.2 Selekcia malých oblastí..............................................................................41 

3.3.2.3 Zlúčenie čiastkových oblastí ......................................................................41 

3.3.2.4 Druhá funkcia trasovania(trace) ...............................................................42 

3.4 Verifikácia a selekcia ŠPZ.....................................................................................43 

3.4.1 Spracovanie vstupného objektu ........................................................................44 

3.4.2 Verifikátor – podmienky...................................................................................44 

3.4.2.1 Prvá časť verifikátoru ................................................................................45 

3.4.2.2 Druhá časť verifikátoru .............................................................................48 

3.4.3 Preprocesing OCR (Separácia jednotlivých znakov)........................................51 

3.4.3.1 Preprocesing značky ŠPZ ..........................................................................51 

3.4.3.2 Horizontálna separácia znakov .................................................................51 

3.4.3.3 Vertikálne ohraničenie a konverzia znakov ...............................................52 

3.4.4 Neurónová sieť ako funkcia rozpoznania znaku...............................................52 

Záver................................................................................................................................53 

Použitá literatúra ........................................................................................................54 

Prílohová časť ..............................................................................................................55 

V

Zoznam obrázkov 

Obr. 1.1 Dvojrozmerná Fourierova transformácia v diskrétnej podobe...............................5 

Obr. 1.2 Fourierova transformácia, a) diskrétne vyjadrenie funkcie f(u,v), b) jej 

amplitúdové frekvenčné spektrum........................................................................6 

Obr. 1.3 Geometria Radonovej transformácie......................................................................7 

Obr. 1.4 Typické hranové profily, a) kroku, b)vrchu, c) priamky, d)šumu ....................10 

Obr. 1.5 Aplikácia na využitie Houghovej transformácie, a)určenie konvexného obalu, 

b)zistenie uhlu otočenia voči rovine....................................................................14 

Obr. 1.6 Stromová segmentácia delenia a spájania oblastí................................................15 

Obr. 1.7 Základný model jednoduchého neurónu..............................................................17 

Obr. 1.8 Rôzne druhy prenosovej funkcie Neurónovej siete, a)jemná limita, b)tvrdá limita 

c)logaritmus signálu ...........................................................................................17 

Obr. 2.1 Segmentácia znakov pomocou horizontálnej projekcie (určuje vo vertikálnej 

rovine vrch a spodok znakov v ŠPZ) ..................................................................22 

Obr. 2.2 Segmentácia znakov pomocou vertikálnej projekcie (určuje v horizontálnej 

rovine maximá pre oblasti medzi znakmi) .........................................................23 

Obr. 2.3 Rast prahu a spájanie extremálnych oblastí........................................................ 24 

Obr. 2.4 Algoritmus detekcie a selekcie CER....................................................................25 

Obr. 2.5 Neurón s vektorovým vstupom............................................................................26 

Obr. 2.6 Zovšeobecnený vektorový neurón.......................................................................27 

Obr. 2.7 Prenosové funkcie používajúce sa v NN..............................................................27 

Obr. 2.8 Zobrazenie vrstvy neurónov, a) vrstva neurónov, b) zovšeobecnená vrstva 

neurónov..............................................................................................................28 

Obr. 2.9 Viacvrstvová neurónová sieť...............................................................................28 

Obr. 2.10 Zovšeobecnená viacvrstvová neurónová sieť....................................................29 

Obr. 2.11 Príklad metrixu znakov, a) bez šumu, b)zo šumom...........................................29 

Obr. 2.12 Architektúra využívaná na znakové rozpoznávanie...........................................30 

Obr. 3.1 Funkčnosť algoritmu na detekciu pohybu............................................................31 

Obr. 3.2 Prevod RGB (farebného) obrázku na obrázok Gray (256 odtieňov sivej), 

a)trojdimenzionálny metrix RGB obrázku, b)RGB obrázok, 

c)jednodimenzionálny metrix Gray obrázku, d)obrázok gray............................32 

Obr. 3.3 Ilustruje zmeny jasových(kontrastových) úrovní Gray obrázku..........................33 

Obr. 3.4 Prevod obrázku 256 odtieňov sivej(gray) na binárny obrázok, a)pôvodný 

obrázok gray, b) binárny obrázok po prevode....................................................34 

Obr. 3.5 Demonštratívny obrázok auta, a) RGB, b) Gray.................................................35 

Obr. 3.6 Názornosť funkcie trasovania na základe hranových detektorov, 

a)pred trasovaním, b)po trasovaní.......................................................................35 

VI

Obr. 3.7 Zobrazuje jednotlivé kroky rozšírenia hrán, a)pôvodný binárny obrázok 

b)prevod obrázku na opačný 1-0, c)roztiahnutie hrán d)spätný prevod............36 

Obr. 3.8 Demonštruje kroky odpočtu, a)pôvodný binárny obrázok, b)obrázok na odpočet, 

c)výsledný obrázok po odpočte...........................................................................37 

Obr. 3.9 Odstránenie miniatúrnych oblastí, a)pred selekciou, b)po selekcií......................38 

Obr. 3.10 Zlúčenie čiastkových oblastí, a)pred zlúčením, b)po zlúčení............................38 

Obr. 3.11 Odstránenie malých oblastí, a)pred odstránením, b)po odstránení..................39 

Obr. 3.12 Druhá funkcia trasovania a zobrazenie oblasti vstupujúcich do verifikátora, 

a) jednotlivé oblasti, b)farebné odlíšenie pre lepšiu názornosť..........................40 

Obr. 3.13 Demonštratívny obrázok auta, a) RGB, b)Gray ...............................................40 

Obr. 3.14 Názornosť funkcie trasovania na základe hranových detektorov algoritmu č.2., 

a) pred trasovaním, b)po trasovaní.....................................................................41 

Obr. 3.15 Zobrazuje odstránenie malých oblastí algoritmu č.2., 

a)pred odstránením, b)po odstránení..................................................................41 

Obr. 3.16 Zobrazenia zlúčenie čiastkových oblastí algoritmu č.2., 

a)pred zlúčením, b)po zlúčení............................................................................42 

Obr. 3.17 Druhá funkcia trasovania a zobrazenie oblastí vstupujúcich do verifikátora 

algoritmu č.2., a) jednotlivé oblasti, b)farebné odlíšenie pre lepšiu názornosť42 

Obr. 3.18 Oblasti vstupujúce do verifikátoru a ich číslovanie...........................................43 

Obr. 3.19 Spracovanie oblastí vstupujúcich do verifikátora s podmienkami.....................44 

Obr. 3.20 Podmienka číslo jedna prvej časti verifikátoru..................................................45 

Obr. 3.21 Podmienka atribútov..........................................................................................46 

Obr. 3.22 Výrez stredného riadku, a) detekovaná oblasť, b)vyrezaná oblasť a jej stredný 

riadok...................................................................................................................47 

Obr. 3.23 Podmienka intervalu počtu svetlých miest v horizontálnom reze značky.........47 

Obr. 3.24 Vystrihnutie ŠPZ značky z pôvodného RGB obrázku, a) detekovaná oblasť, 

b)rovnaká oblasť vyrezaná z pôvodného RGB snímku.......................................48 

Obr. 3.25 Prevod RGB značky na základe priemerného prahu do BW podoby................49 

Obr. 3.26 Odstránenie miniatúrnych oblastí a zistenie uhla otočenia pomocou HT..........49 

Obr. 3.27 Rotácia, a)upravenej binárnej matice, b)pôvodnej binárnej matice, 

c) pôvodnej RGB matice.................................................................................... 49 

Obr. 3.28 Výsledok orezania..............................................................................................51 

Obr. 3.29 Preprocesing značky ŠPZ, a) pôvodný výrez značky, b) výrez značky upravený 

vyhľadením hrán.................................................................................................51 

Obr. 3.30 Horizontálna separácia znakov značky..............................................................52 

Obr. 3.31 Vertikálne ohraničenie a konverzia znakov.......................................................52 

VII

Zoznam použitých skratiek 

ŠPZ Vehicle Licence-Plate Štátna poznávacia značka 

WWW World Wide Web Celosvetová internetová sieť 

FT Fourier transform Fourierova transformácia 

HT Hough transform Houghova transformácia 

NN Neural network Neurónová sieť 

CER Characteristic Extremal Regions Charakteristické extremálne regióny 

RGB (Red-Green-Blue) image Farebné vyjadrenie snímku 

Gray (Gray) image Vyjadrenie obrázku v 256 odtieňov 

sivej 

OCR Optical character recognition Optické rozpoznávanie znakov 

VIII

Úvod 

Z dôvodu nových technologických možností súvisiacich s vývojom, ale nesporne 

aj s nárastom zložitosti a náročnosti riadenia v rôznych odvetviach je potrebné uskutočniť 

množstvo nevyhnutných krokov na optimalizáciu a automatizáciu riadiacich procesoch. 

Do tohto rámca samozrejme spadajú aj také oblasti, akými sú doprava a spoje. Jednou 

z priorít v doprave sa považuje cestná premávka jej riadenie, bezpečnosť a služby. 

Riešením rôznych problémov spojených s cestnou premávkou môže byť automatické 

spracovanie textu ŠPZ a iných informácií zistiteľných z prostého obrazového vyjadrenia 

dopravných prostriedkoch. Tieto metódy automatického spracovania databáz podľa 

obrazových informácií môžu byť neskôr využité na rôzne účely od bezpečnosti v cestnej 

premávke až po rôzne komerčné využitie napríklad na parkoviskách, alebo rôznych 

servisných centrách. 

Prostredníctvom rôznych vlastností z obrazového vyjadrenia je možné získať 

množstvo hodnotných informácií. Existuje mnoho metód, ktoré na základe týchto 

vlastností umožňujú riešiť problémy spojené s cestnou dopravou. 

V tejto práci sa prezentuje metóda na automatickú detekciu a znakové rozpoznanie 

štátnej poznávacej značky motorových vozidiel. Spolu s týmto problémom, práca 

rozoberá teoretické metódy k spracovaniu rôznych snímkoch a videosekvencií. Zároveň 

prezentuje množstvo postupov k učeniu a rozpoznaniu objektov v obraze. Napríklad 

hranové deskriptory, charakteristické extremálne regióny, neurónové siete atď. 

1

Štruktúra práce 

• Kapitola 1 obsahuje teoretické spracovanie problematiky rozpoznávania textu a 

objektov v obraze a uvádza rôzne využívané metódy a postupy pri spracovaní 

obrazu všeobecne. 

• Kapitola 2 obsahuje prehľad a porovnanie dostupných algoritmov automatického 

rozpoznávania ŠPZ. 

• Kapitola 3 popisuje praktickú realizáciu mnou vytvoreného programu na 

rozpoznávanie ŠPZ motorových vozidiel. 

• V kapitole Záver je zhrnutie. 

• Prílohová časť obsahuje zdrojový kód programu a jeho výsledky. 

2

1 Teoretické spracovanie problematiky rozpoznávania znakov 

a všeobecne objektov v obraze a vo videosekvenciách 

Pojem detekcia znakov respektíve textu v obraze a videosekvenciách, môžeme 

rozdeliť na niekoľko podúloh: 

Detekcia znakov v obraze 

• Detekcia za ideálnych podmienok – ide o zisťovanie textu pri jednoduchých 

podmienkach, text je na jednoduchom pozadí (zvyčajne sa jedná o tmavé 

zobrazenie textu na bielom podklade), text neobsahuje žiadne skreslenia, šumy, 

geometrické deformácie, ako afinita a otočenie voči rovine atď. 

• Detekcia za normálnych podmienok – zisťovanie textu sa uskutočňuje pri rôznych 

zhoršujúcich faktorov, medzi ktoré patria šumy, skreslenia, nedokonalá jasová 

úroveň, jemné geometrické deformácie a pod. 

• Detekcia za extrémnych podmienok – rozpoznávanie textu sa uskutočňuje za 

veľmi nepriaznivých podmienok, veľké šumové skreslenie, silné geometrické 

skreslenie, ako afinita a otočenie voči rovine, viacfarebnosť textu, splývanie 

s pozadím a pod. 

Detekcia znakov vo videosekvenciách 

• Detekcia statického textu na pohyblivom pozadí – ide napríklad o detekciu textu 

pri filme(titulky). 

• Detekcia pohyblivého textu na statickom pozadí – ide o detekciu textu, ktorá sa 

využíva na spravodajských kanáloch, alebo pohyblivý text na statických 

stránkach(WWW) 

• Detekcia pohyblivého textu na pohyblivom pozadí, avšak zo známej pozície – ide 

o rozpoznávanie napríklad ŠPZ Furierovou metódou 

• Detekcia pohyblivého textu na pohyblivom pozadí bez známej pozície textu 

Detekcia za ľubovoľných podmienok 

• Ide o detekciu, ktorá sa dokáže vysporiadať s ktoroukoľvek nepríjemnou 

situáciou. V reálnych podmienkach je typ takejto detekcie takmer 

nedosiahnuteľný. 

3

Napriek tomu, že práca je zameraná aj na detekciu ŠPZ motorových vozidiel vo 

videosekvenciách, bude sa zaoberať výhradne detekciou znakov v obraze. Ide o podstatu 

veci pretože je zrejmé, že každá videosekvencia sa skladá z určitého počtu statických 

obrázkov idúcich sériovo za sebou. Úkolom práce bude spracovať niekoľko takýchto 

statických snímkov a vytvoriť program na detekciu značky ŠPZ a jej textu. 

Z dôvodu, že prínosom tejto práce nieje len samostatné rozpoznanie znakov, je 

nutné si priblížiť jednotlivé metódy a postupy, ktoré slúžia už spomínanej problematike. 

Vo všeobecnom merítku sa dá povedať, že detekciou znakov (textu) nejde len o detekciu 

nejakej formy znakovej komunikácie, ale o zisťovanie ľubovolných objektov v obraze. 

Potrebným kritériom toho, aby problematika bola pochopená čo 

najzrozumiteľnejšie, je nutné rozobrať teoretický základ, ktorý nám dá aký taký rozhľad. 

V ďalšej časti textu uvediem metódy a postupy používajúce sa na spracovanie obrazu, 

a už spomínanú detekciu ľubovoľných objektov v obraze. Nieje možné sa venovať 

z dôvodu obšírnosti jednotlivým metódam veľmi podrobne, napriek tomu metódy a 

postupy, ktoré využíva program na detekciu ŠPZ rozoberiem trošku detailnejšie. 

1.1 Transformácie 

Do tejto kategórie spracovania patria frekvenčné a obrazové transformácie, ktoré 

slúžia na zlepšenie vlastnosti obrazu pre ďalšie spracovanie, ale zároveň poskytujú aj iné 

možnosti využitia. 

1.1.1 Fourierova transformácia-(používaná napríklad pri rozpoznávaní ŠPZ vo 

vieosekvenciách) 

Fourierova transformácia je zovšeobecnením komplexného Fourierovho radu. 

Fourierov rad je rozšírením periodickej funkcie f(x) na nekonečný súčet sínusov a 

kosínusov, využívajúc ortogonalitu týchto funkcií. Výpočet a štúdium Fourierovho radu 

je známy ako harmonická analýza funkcie, a je dobre použiteľná na rozklad ľubovolnej 

periodickej funkcie na jednoduché časti, ktoré sa dajú jednoducho riešiť, následne získať 

riešenie celkového problému, alebo jeho aproximáciu. 

Fourierova transformácia je definovaná: 

Nech f(x) je spojitá integrovatelná funkcia reálnej premennej x. Fourierovú transformáciu 

funkcie f(x) definujeme ako 

4

∞ 

∫ 

−∞ 

I( f ( x)) 

= F( 

u) 

= f ( x) exp[ −2π ux] 

dx , 

kde j = −1 

. (1.1) 

Nech F(u) je integrovatelná funkcia, potom pre inverznú Fourierovú transformáciu platí: 

I 

−1 

∞ 

∫ 

−∞ 

( F ( x)) 

= f ( u) 

= F( 

x) exp[ −2π ux] 

dx 

(1.2) 

Funkcia F(u) získaná Fourierovou transformáciou je komplexná funkcia. Môžeme ju 

zapísať v tvare 

F ( u) 

= R( 

u) 

+ jI ( u) 

, (1.3) 

kde R(u) je reálna a I(u) je imaginárna zložka funkcie F(u). 

Amplitúdové frekvenčné spektrum funkcie F(u) je 

2 

2 

| F ( u) 

| = R ( u) 

+ I ( u) 

, (1.4) 

frekvenčné spektrum je 

−1 

⎡ I( 

u) 

⎤ 

φ ( u) 

= tan ⎢ ⎥ , (1.5) 

⎣ R( 

u) 

⎦ 

a výkonové spektrum je 

2 2 

2 

P ( u) 

= | F( 

u) 

| = R ( u) 

+ I ( u) 

. (1.6) 

Fourierovú transformáciu môžeme rozšíriť na dvojrozmernú. Z toho dôvodu frekvenčné, 

fázové a výkonové spektrum je definované ako dvojrozmerná funkciu F(u,v). 

1.1.2 Diskrétna Fourierova transformácia 

Obr. 1.1 Dvojrozmerná Fourierova transformácia v diskrétnej podobe 

5

Ak sa aplikuje obrazová transformácia je nutné previesť Fourierovu transformáciu 

do diskrétnej podoby. Jednorozmerná diskrétna Fourierova transformácia je definovaná 

rovnicou: 

1 

ux 

F( 

u) 

= f ( x) exp[ −2 

jπ ] 

(1.7) 

N 

N 

N 

∑ − 1 

x= 

0 

pre u = 0, 1, ..., N-1. 

Diskrétna inverzná Fourierova transformácia je definovaná vzťahom: 

1 

ux 

f ( x) 

= F( 

u) exp[ j2π ] 

(1.8) 

N 

N 

N 

∑ − 1 

x= 

0 

pre x = 0, 1, ..., N-1. 

a) b) 

Obr. 1.2 Fourierova transformácia, a) diskrétne vyjadrenie funkcie f(u,v), b) jej 

amplitúdové frekvenčné spektrum 

1.1.3 Radonova transformácia 

Ide o integrálnu transformáciu, ktorá reálnej funkcii f definovanej na n-rozmernom 

reálnom priestore priradí inú funkciu nesúcu informáciu o integráloch funkcie f cez 

všetky afinné nadroviny priestoru na ktorom je definovaná. Tejto novej funkcii sa 

niekedy hovorí Radonov obraz funkcie f. Transformácia, ktorá Radonovmu obrazu priradí 

pôvodnú funkciu sa nazýva inverzná Radonova transformácia. 

Napríklad, ak je f funkcia dvoch premenných, teda ak n = 2, afinné nadroviny 

priestoru, na ktorom je definovaná, sú všetky priamky ležiace v rovine. Každá rovinná 

priamka je jednoznačne určená uhlom α ktorý zviera jej normála s x-ovou osou a jej 

6

vzdialenosťou r od počiatku v smere normály. Radonov obraz funkcie f sa dá potom 

definovať ako funkcia týchto dvoch parametrov takto: 

∞ 

R [ f ]( α , r) 

= ∫ f ( r sin( α) 

− t cos( α), 

r cos( α) 

+ t sin( α)) 

dt 

−∞ 

Definícia Radonovej tranformácie: 

(1.9) 

Afinné nadroviny n-rozmerného priestoru, sú všetky jeho (n − 1)-rozmerné afinné 

podpriestory. Tie sú úplne určené svojim jednotkovým normálovým vektorom d ∈ S n− 1 a 

vzdialenosťou od počiatku 

r ∈ R rátanou v smere vektora d. Radonov obraz funkcie n- 

premenných f sa preto najčastejšie definuje ako funkcia definovaná ako funkcia: 

R f ]: S 

n 

× R → R 

[ (1.10) 

−1 

daná vzťahom: 

∫ 

R[ f ]( d, 

r) 

= fds , (1.11) 

L d , r 

kde L d,r je afinná nadrovina určená dvojicou parametrov d a r v zmysle uvedenom vyššie 

a ds je (n − 1)-rozmerná Lebesgueova miera na tejto nadrovine. 

Obr. 1.3 Geometria Radonovej transformácie 

Ďalšie typy transformácií: 

Diskrétna kosínusová transformácia, Hadamardova transformácia, Wavelety (Vlnková 

transformácia), Trace transformácia. Ich teóriou sa z dôvodu limitovania tejto práce 

nebudeme zaoberať. 

7

1.2 Predspracovanie obrazu 

Sú to operácie s obrazmi na najnižšej úrovni abstrakcie – vstup a výstup sú 

ikonické dáta, ktoré obsahujú veľkosť jasu v každom obrazovom bode. 

Cieľom predspracovania je zlepšenie kvality obrazových dát, ktorá potlačí 

neželané deformácie a skreslenia, alebo zlepší niektoré črty obrazu, ktoré sú dôležité z 

hľadiska ďalšieho spracovania. 

Existujú tri základné typy metód predspracovania: 

• Jasové transformácie – transformácia závisí od vlastností pixela samotného 

• Geometrické transformácie 

• Lokálne predspracovanie – transformácie závisia od samotného pixela a jeho 

okolia 

1.2.1 Jasové transformácie (využité v programe) 

Existujú dve skupiny jasových transformácií: 

Jasové korekcie modifikujú jas pixela, berúc do úvahy jeho hodnotu a jeho polohu 

v obraze: 

• f (i, j) = e (i, j) g (i, j), kde e (i, j) je multiplikatívny koeficient chyby 

• obraz s konštantným jasom c, je potom 

c. 

f ( i, 

j) 

g( 

i, 

j) 

= (1.12) 

f ( i, 

j) 

c 

Šedotónové transformácie menia jasovú úroveň bez ohľadu na pozíciu v obraze.. 

q = T(p) (1.13) 

1.2.2 Geometrické transformácie 

Geometrické transformácie umožňujú eliminovať geometrické deformácie, ktoré 

sa môžu objaviť pri snímaní obrazu. 

x´ = T (x,y) y´ = T (x,y) (1.14) 

x y 

Geometrická transformácia typicky pozostáva z dvoch základných krokov: 

Transformácia pixelových súradníc - mapuje súradnice pixela vstupného obrazu na 

obrazový bod výstupného obrazu; často sa používajú afinné a bilineárne transformácie. 

x′ 

= 

m m 

∑ ∑ 

− r 

r = 0 k = 0 

a 

rk 

x 

r 

y 

k 

y′ 

= 

m m 

∑ ∑ 

− r 

r = 0 k = 0 

b 

rk 

x 

r 

y 

k 

(1.15) 

8

Používajú sa polynómy stupňa m = 2 alebo 3, potrebujú 6 až 10 zodpovedajúcich bodov. 

Jasová interpolácia – jas sa vypočíta ako interpolácia jasu v niekoľkých bodoch okolia 

Súradnice výstupného pixela obyčajne nezodpovedajú digitálnej mriežke a preto sa 

používa interpolácia na určenie jasu výstupného pixela; interpolácia najbližšieho suseda, 

lineárna interpolácia a bikubická interpolácia sa používajú najčastejšie. 

1.2.3 Lokálne predspracovanie 

Metódy lokálneho predspracovania používajú malé okolie obrazového bodu 

(obyčajne štvorcové) zo vstupného obrazu na vytvorenie novej jasovej hodnoty 

obrazového bodu vo výstupnom obraze. Také operácie sa nazývajú filtrácie. 

Predspracovaním sledujeme najmä tieto ciele: vyhladzovanie a ostrenie - (zvýraznenie 

hrán). 

1.2.3.1 Vyhladzovanie 

Cieľom vyhladzovania je potlačiť šum, alebo malé fluktuácie v obraze s využitím 

redundancie (nadbytočnosti) obrazových dát. Vyhladzovanie je založené na priemerovaní 

jasových hodnôt v nejakom okolí pixela. Jeho nevýhodou je rozmazávanie hrán. 

1.2.3.2 Ostrenie- Hranové detektory (Gradientné operátory) 

Ostrenie obrazu zvýrazňuje hrany – to sú miesta, kde sa obrazová funkcia rýchlo 

mení; má rovnaký efekt ako potlačenie nízkych frekvencií v obore Fourierovej 

transformácie, čiže zodpovedá použitiu vysokofrekvenčného filtra. Vysokofrekvenčnému 

filtru zodpovedá maska. 

Hrana je vlastnosť, ktorá je priradená k jednotlivému pixelu a počíta sa z priebehu 

obrazovej funkcie v okolí toho pixela. Hrana má dva komponenty, veľkosť, ktorá je 

totožná s veľkosťou gradientu a smer, ktorý je kolmý na smer gradientu. 

2 

2 

⎛ ∂g 

⎞ ⎛ ∂g 

⎞ 

| grad g ( x, 

y) 

| = ⎜ ⎟ + ⎜ ⎟ 

(1.16) 

⎝ ∂x 

⎠ ⎝ ∂y 

⎠ 

⎛ ∂g ∂g 

⎞ 

ϕ = arg ⎜ , ⎟ 

(1.17) 

⎝ ∂x 

∂y 

⎠ 

9

Obr. 1.4 Typické hranové profily, a) kroku, b)vrchu, c) priamky, d)šumu 

1.3 Segmentácia obrazu (využité v programe) 

Hlavným cieľom segmentácie je rozdeliť obraz na časti, ktoré majú silnú koreláciu 

s objektami, alebo oblasťami reálneho sveta zobrazenými v obraze. Pri čiastočnej 

segmentácii je cieľom rozdeliť obraz na časti, ktoré sú homogénne z hľadiska vybranej 

vlastnosti napr. jasu, farby, odrazivosti, textúry a pod. Pri segmentácii šedoúrovňových 

obrazov využívame dve základné vlastnosti týchto obrazov: diskontinuitu a podobnosť. 

Segmentačné metódy možno rozdeliť na tri skupiny: 

Prahovanie, segmentácia založená na hranách (diskontinuita), segmentácia založená na 

oblastiach (podobnosť). 

1.3.1 Prahovanie (využité v programe) 

Najjednoduchšia segmentačná technika, je výpočtovo nenáročná a rýchla. Na 

segmentovanie objektov od pozadia sa používa jasová konštanta, ktorá sa na nazýva prah. 

Prahovanie je transformácia, ktorá zobrazuje vstupný obraz f (i, j) na výstupný obraz g(i,j) 

následovne: 

g (i, j) = 1 ak f (i, j) ≥ T = 0 ak f (i, j) < T (1.18) 

10

Prahovanie s jedným prahom možno aplikovať na celý obraz (vtedy ide o globálne 

prahovanie), alebo sa prah môže meniť v jednotlivých častiach obrazu (lokálne 

prahovanie). Iba za veľmi špeciálnych okolností môže byť prahovanie úspešné s jedným 

prahom v celom obraze. 

• globálne prahovanie T = T (f ) 

• lokálne prahovanie T = T( f, f ), kde f je časť obrazu, v ktorej sa určuje prah. 

c c 

Metódy na určenie prahu sa snažia určiť prah automaticky. Na určenie prahu sa používajú 

metóda p-podielu, metóda analýzy tvaru histogramu a optimálne prahovanie. 

1.3.2 Segmentácia založená na hranách (využité v programe) 

Je založená na lokálnych hranách, ktoré boli detekované hranovými operátormi. 

Lokálne hrany zodpovedajú ostrému prechodu v úrovni šedej, vo farbe, v textúre apod. 

Najväčšími problémami segmentácie založenej na hranách, ktoré sú spôsobené 

obrazovým šumom ,alebo nevhodnou informáciou v obraze, je prítomnosť lokálnych hrán 

v miestach, kde neexistuje globálna hranica a naopak neprítomnosť lokálnej hrany tam, 

kde globálna hranica existuje. 

1.3.2.1 Prahovanie obrazu hrán (využité v programe) 

Je založené na vytvorení lokálnych hrán, ktoré sa prahujú vhodným prahom 

(predpokladá sa, že silnejšie lokálne hrany sú časťou globálnej hranice). 

Relaxácia (optimalizácia) hrán- vlastnosti hrany sa posudzujú v kontexte okolitých 

hrán. Ak existujú dostatočné príznaky existencie hranice, lokálna hrana sa posilňuje a 

naopak. Napr. slabá hrana medzi dvoma silnými hranami, je veľmi pravdepodobné, že 

táto slabá hrana bude súčasťou globálnej hranice. Ak sa použije globálna relaxácia 

(optimalizácia), vytvoria sa súvislé hrany. 

1.3.2.2 Určovanie hranice ako heuristické hľadanie 

Proces určovania hranice sa transformuje na hľadanie optimálnej cesty v 

ohodnotenom grafe. Ohodnotenia (ceny) sú spojené s každým vrcholom a vyjadrujú 

šancu, že hranica povedie cez tento vrchol (pixel). Cieľom je nájsť optimálnu hranicu 

(vzhľadom na určité optimalizačné kritérium), ktorá spája dva špecifikované obrazové 

body alebo množiny obrazových bodov, ktoré reprezentujú začiatok a koniec hranice. 

11

Definícia ohodnotenia - (ohodnocujúce funkcie) sú kľúčom k úspešnej detekcii 

hranice. Zložitosť výpočtu ceny vrcholu môže byť taká, že je to prevrátená hodnota 

veľkosti lokálnej hrany v danom bode až po apriórnu znalosť o hľadanej hranici, cieli 

segmentácie, obrazových dátach a pod. 

f(n) = g(n) + h(n) (1.19) 

kde g vyjadruje ohodnotenie cesty a h je heuristicka zložka, ktorá odhaduje ohodnotenie 

cesty. 

Algoritmus vyberá na ďalšie expandovanie taký vrchol, ktorý má minimálne f(n), pričom 

berie do úvahy všetky otvorené vrcholy, t.j. tie, ktoré ešte neboli expandované. 

1.3.2.3 Dynamické programovanie 

Je založené na princípe optimality a reprezentuje efektívnu cestu simultánneho 

hľadania optimálnych ciest z viacerých začiatočných a koncových bodov. Hľadá optimá 

funkcií, v ktorých nie všetky premenné sú navzájom závislé. Keď sa používa algoritmus 

A* na prehľadávanie grafu, je nutné vytvárať celý graf, čo je protikladom ku 

heuristickému hľadaniu. 

Myšlienka princípu optimality je: 

Ak existuje optimálna cesta z počiatočného do koncového vrcholu, ktorá ide cez E, tak 

obidve podcesty z počiatočného vrcholu do E a z E do koncového vrcholu musia byť tiež 

optimálne. 

1.3.2.4 Houghova transformácia (využité v programe) 

Je segmentačná technika použiteľná vtedy, keď treba detekovať objekty so 

známym tvarom hranice(ich analitické vyjadrenie). Ide o transformáciu, ktorá mapuje 

body, alebo množinu bodov vstupného vektorového priestoru V na parametrický priestor 

P parametrov krivky(alebo iného parametricky popísateľného formálneho objektu), ktorý 

je analiticky definovaný rovnicou. 

Houghova transformácia je definovaná: 

Ak máme analitickú rovnicu f (( aˆ 

1 

,...., aˆ 

m 

),( x, 

y)) 

= 0 , vyjadrujúcu tvar hľadaných 

elementov, v parametroch 

a ,...., aˆ 

ˆ1 

a premenných x,y. Spätná projekcia g sa získa 

m 

zámenou parametrov a premenných bodov [ x ˆ, yˆ 

] na všetky tvary s parametrami 

( a 1 

,...., a m 

) , ktoré tento bod obsahujú. 

g(( xˆ, 

yˆ), 

( a1,.., 

am )) = f (( a1,..., 

am 

), ( xˆ, 

yˆ)) 

(1.20) 

12

Spätná projekcia vstupných bodov F ∈ F = {( x , y ) | j 1,..., n} 

Houghovej 

transformácie (pre tvar f) sa definuje následovne: 

HT 

f 

n 

∑ 

j j j 

= 

( a1,..., 

am 

) = h(( 

x 

j 

, y 

j 

), ( a1,..., 

am 

) 

(1.21) 

j= 

1 

kde 

⎧1 

h (( xˆ, 

yˆ),( 

a1 ,..., am 

)) = ⎨ pro g(( xˆ, 

yˆ), 

( a1,..., 

am 

)) = 0 

(1.22) 

⎩0 

Interpretácia tejto definície je následovná. Pri predpoklade, že je daný vstupný obraz, 

ktorý sa skladá z bodov a na ňom sa hľadá analytická rovnica vyjadrujúcu objekt(tvar). 

Body, ktoré ležia na takomto objekte majú tú vlastnosť, že splňujú jeho analitickú 

rovnicu. Houghova transformácia prikazuje každej m-tici parametrov, tzn. každému tvaru 

počet bodov vstupného obrazu, ktoré na ňom ležia. Tento princíp sa chápe ako voľba 

kandidáta na objekt vstupného obrazu: každý vstupný bod F j tu hlasuje pre všetky 

kandidáty o parametroch a ,...., a ) , ktoré sú pre neho prípustné. Taká m-tica 

( 1 m 

parametrov, ktorá dosiahne medzného počtu hlasov, je považovaná za kandidáta na objekt 

vo vstupnom obraze. 

Výška tohto prahu je závislá na parametroch samotných, preto sa často hovorí 

o adaptívnom prahovaní, kde sa prahová hodnota spočíta so zreteľom na hodnoty 

parametrov. 

Možná aplikácia: 

Houghova transformácia je určená napríklad k detekcií priamok(hrán), alebo lineárnych 

oblastí, použitím parametrického vyjadrenia priamky 

φ = x*cos(θ) + y*sin(θ), (1.23) 

kde φ je vzdialenosť od tejto priamky, a θ je uhol medzi x-rovinou a rovinou vektoru tejto 

priamky. 

13

a) b) 

Obr. 1.5 Aplikácia na využitie Houghovej transformácie, a) určenie konvexného obalu , 

b) zistenie uhlu otočenia voči rovine 

1.3.3 Segmentácia založená na oblastiach 

Segmentácia založená na oblastiach musí spĺňať následovné kritérium úplnej 

segmentácie: 

U S 

R i 

i=1 

R = R 

iI R 

j 

i ≠ j 

(1.24) 

a podmienky maximálnej homogenity: 

H ( R i 

) = TRUE , pre i=1,2,...,S (1.25) 

H ( R I R ) FALSE , pre i ≠ j a R i je susedné s R j (1.26) 

i j 

= 

Kritérium homogenity môže byť priemerná šedá úroveň oblasti, farebné vlastnosti, 

textúrne vlastnosti, tvarové vlastnosti a pod. 

1.3.3.1 Spájanie oblastí 

Obraz sa najskôr rozdelí na malé oblasti s tým, že každá oblasť obrazu je 

homogénna. Následne na to sa oblasti spájajú tak, aby spĺňali druhú podmienku, že budú 

maximálne za podmienky, že homogenita každej oblasti sa zachová. 

14

Na spájanie oblastí sa používajú dve heuristiky: 

• dve susedné oblasti sa spoja, keď výrazná časť ich spoločnej hranice pozostáva zo 

slabých hrán (napr. počet slabých hrán ku celkovej dĺžke hranice), 

• dve susedné oblasti sa spoja, keď výrazná časť ich spoločnej hranice pozostáva zo 

slabých hrán, ale bez uvažovania o celkovej dĺžke hranice, táto metóda neberie do 

úvahy vplyv rozdielnej veľkosti oblastí. 

1.3.3.2 Delenie oblastí 

Ide o opačný proces ku spájaniu oblastí. Začína pri podsegmentovanom obraze, 

ktorý nespĺňa podmienku homogenity oblasti. Potom sa existujúce oblasti postupne delia 

tak, aby spĺňali základné podmienky. 

1.3.3.3 Delenie-a-spájanie oblastí 

Ide o metódu, ktorá má výhody oboch prístupov. Techniky delenia a spájania 

obyčajne požívajú pyramídové obrazové reprezentácie. Pretože je k dispozícii aj delenie 

aj spájanie, počiatočný obrázok nemusí spĺňať ani podmienku homogenity oblasti, ani 

maximálnosti homogénnej oblasti. 

Obr. 1.6 Stromová segmentácia delenia a spájania oblastí 

Algoritmus: 

Definuj homogenitu a následne na to zisti homogenitu v obraze. Ak niektoré oblasti 

nespĺňajú podmienku homogenity rozdeľ ich na 4 podoblasti. Ak niektoré podoblasti 

v tejto oblasti je možné na základe homogenity spojiť, dôjde k ich spojeniu. Následne na 

15

to zistí, či niektoré podoblasti v oblasti delenej štyrmi, niesu homogénne so susednou 

oblasťou nepatriacej danej množine. Ak tomu tak je, opätovne dôjde k spojeniu takýchto 

oblastí. V prípade, že treba vylúčiť malé oblasti, spoj ich s najbližšou homogénnou 

oblasťou. 

1.4 Porovnávanie so vzorom (matching) 

Porovnávanie so vzorom možno použiť na lokalizáciu objektov so známym 

vzhľadom v obraze, na hľadanie špecifických vzorov, a pod. Najlepšia zhoda je založená 

na nejakom kritériu optimality, ktoré záleží na vlastnostiach objektu a vzťahoch objektu. 

Algoritmus spočíva vo vyhodnotení kritéria zhody pre každú polohu a otočenie 

vzoru v obraze. Tie vyhodnotenia, ktoré presahujú stanovený prah, reprezentujú 

umiestnenie vzoru v obraze. 

Kritériá zhody možno definovať viacerými spôsobmi; špeciálne, korelácia medzi vzorom 

a skúmanými obrazovými dátami sa často používa ako všeobecné kritérium. 

1.5 Rozpoznávacie techniky (využité v programe) 

Slúžia na detekciu ľubovoľných objektov v obraze. Vyžadujú sa špecifické 

znalosti tak o objektoch, ktoré sa rozpoznávajú, ako aj všeobecnejšie znalosti o triedach 

objektov. 

1.5.1 Štatistické rozpoznávanie obrazcov 

Rozpoznanie objektu je založené na priradení triedy k neznámemu objektu a 

zariadenie, ktoré vykonáva toto priradenie sa nazýva klasifikátor. Počet tried sa obyčajne 

vie dopredu a obvykle sa dá odvodiť zo špecifikácie problému. Klasifikátor nerozhoduje 

o zaradení do triedy na základe objektu priamo, ale na základe vlastností objektu, ktoré sa 

nazývajú obrazce. 

1.5.2 Neurónové siete (využité v programe) 

Neurónová sieť vznikla na podklade výskumu mozgu. Vedci sa snažili 

matematicky modelovať procesy ktoré v ňom prebiehajú. Neskôr sa umelé neurónové 

siete rozšírili do všetkých oborov technickej praxe. Základom je neurónová jednotka, do 

ktorej vstupuje veľký počet vstupov a vystupuje iba jeden výstup, ktorý sa zadeľuje. Tie 

sa opätovne pripájajú na vstupy. Na základe tohto procesu bol definovaný prvok umelej 

neurónovej siete. 

16

N 

⎛ 

= S ⎜∑ 

⎝ 

w x i i 

i= 

y 1 

⎞ 

+ Θ⎟ 

(1.27) 

⎠ 

kde, 

• x i – vstupy neurónu celkom N 

• w i – synaptické váhy 

• S – nelineárna prenosová funkcia neurónu 

• – prah 

• y – výstup neurónu 

Výraz v zátvorke sa označuje ako vnútorný potenciál neurónu. Váhy w i predstavujú 

lokálnu pamäť a spojením ostatných neurónov dostávame celkovú pamäť siete . Učenie 

siete sa vytvára zmenou váh, ale aj tvarovaním prenosovej funkcie, počtom neurónov 

v sieti a ich topologickým rozložením. 

Obr. 1.7 Základný model jednoduchého neurónu 

Obr. 1.8 Rôzne druhy prenosovej funkcie neurónovej siete, a)jemná limita, b)tvrdá limita, 

c)logaritmus signálu 

17

1.5.2.1 Pracovná fáza umelej neurónovej siete 

Neurónová sieť pracuje v zásade vo dvoch fázach. Prvá je adaptívna a druhá 

aktívna. V tej prvej dochádza k učeniu (trénovaniu), a v druhej fáze vykonáva naučenú 

činnosť, vybavuje(testuje). Pamäť je reprezentovaná váhovými koeficientami 

jednotlivých vstupov neurónov. 

1.5.2.2 Učenie (trénovanie) 

Pri učení dochádza v neurónovej sieti ku zmenám. Sieť sa prispôsobuje na riešenie 

daného problému. Na počiatku sa váham prisúdia počiatočné hodnoty, ktoré sú náhodne 

zvolené. Následne nato sa privedie vytvorená trénovacia množina, ktorá bola získaná 

z potrebných dát. Sieť poskytne výstup, odozvu. 

Učenie s učiteľom – existuje vonkajšie kritérium, ktoré určuje, ktorý vstup je správny 

a v sieti sa nastavujú spätné väzby podľa toho, ako blízko je výstup kritériu. Veľakrát je 

kritérium definované, ako rozdiel medzi testovaným a žiadaným výstupom. Váhy sa 

nastavujú podľa daného algoritmu. Neskoršie sa sieti priloží nový výstup (učiteľ) a cyklus 

sa opakuje. 

Učenie bez učiteľa – algoritmus je navrhnutý tak, že hľadá vo vstupných vzorkách isté 

spoločné vlastnosti. 

1.5.2.3 Vybavenie(testovanie) 

Na základe vstupu dát vznikne vo vstupnej vrstve nerovnovážny stav. Výstupy 

neurónov vo všetkých vrstvách sa začnú pôsobením ostatných neurónov meniť podľa 

istého algoritmu a menia sa dovtedy, dokiaľ nenastane opäť nerovnovážny stav. Na ich 

výstupoch je požadovaná odozva siete na tento vstup. 

1.5.3 Syntaktické rozpoznávanie obrazcov 

Pre syntaktické rozpoznávanie obrazcov, je charakteristický kvalitatívny popis 

objektov. Syntaktický popis treba použiť vtedy, ak príznakový popis nie je schopný 

popísať zložitosť objektu, alebo keď sa dá objekt zapísať, ako hierarchická štruktúra 

pozostávajúca z jednoduchších častí, napríklad slovom, alebo grafom. Elementárnymi 

vlastnosťami syntakticky popísaných objektov sú primitíva. 

Množina všetkých primitív sa nazýva abeceda. Množina všetkých slov 

vytvorených z abecedy, ktoré opisujú objekt z jednej triedy, sa nazýva popisný jazyk. 

18

Gramatika predstavuje množinu pravidiel, podľa ktorých sa vytvárajú slová nejakého 

jazyka z prvkov abecedy. 

Algoritmus: 

Najskôr sa definuje primitíva a ich vzťahy. Neskôr sa zostrojí gramatika pre každú triedu 

objektov. Potom sa vykoná pre každý objekt rozpoznanie primitíva a zostrojenie jeho 

reprezentujúceho slova. Na základe analýzy sa zaradí objekt do triedy, ktorej gramatika 

ho generuje. 

1.5.4 Rozpoznávanie, ako porovnávanie zhody dvoch grafov 

Ide o metódu porovnávania zhody (matching) modelu a objektu popísaných 

grafom. Podobnosť sa nezakladá na úplnej zhode, ale približnosti grafového vyjadrenia. 

19

2 Prehľad a porovnanie dostupných algoritmov automatického 

rozpoznávania ŠPZ 

Táto práca, sa bude zaoberať rozpoznávaním textu na statických 

obrázkoch(framoch). Je dôležité poznamenať, že tieto obrázky by vzhľadom 

k dosiahnutiu lepších výsledkov, nemali byť brané kamerou s dvojriadkovým 

vykresľovaním. 

2.1 Metódy detekcie ŠPZ motorových vozidiel 

Z doterajších teoretických a praktických vedomostí sa vychádza, že existujú dve 

najznámejšie základné metódy detekovania ŠPZ v obraze. Prvá z nich, je metóda 

založená na prahovaní vstupného obrázka na binárny, a druhá na relatívne pravidelného 

prechodu hrán jasovej úrovne medzi písmenami a medzerami znakov ŠPZ. V princípe sú 

tieto metódy jednoznačne odlišné, ale napriek tomu je možné povedať, že podstata veci 

spočíva jak pri jednej, tak pri druhej v jasovej odlišnosti blízkych pixelov. V prvom 

prípade je metóda hľadania podstatne viac závislá na kvalite po jasovej a kontrastovej 

stránke ako druhá, napriek tomu sa nedá povedať ani o jednej z nich, že by bola naprosto 

dokonalá. V rozbore sa uvedú príklady nedokonalosti jednotlivých metód. 

2.1.1 Metóda prahovania vstupného obrázka na binárny 

Základom tohto procesu je uviesť pôvodný obrázok RGB poprípade Gray na 

binárny (BW – black and white) pomocou prahovacích techník. V takto 

pretransformovanom obrázku sa následne hľadajú oblasti pomocou hranových 

a trasových algoritmoch. Prvotnou oblasťou ktorú treba nájsť, je samostatná značka ŠPZ, 

ktorej pozadie je biele a znaky čierne. Pri kroku jedna sa nemusí zaoberať objektami, 

ktorými sú práve znaky ŠPZ, ktoré predstavujú v objekte ŠPZ takzvané diery (holes). 

Takto definovaná oblasť sa posunie do pravidla, ktoré určuje pomer strán dĺžky a šírky. 

Ak takto definovaná oblasť splňuje kritéria, postupuje na ďalšie spracovanie. Pri ďalšom 

spracovaní sa z oblasti vystrihne niektorý(spravidla stredný) riadok, zistí sa počet 

svetlých a tmavých miest. Ak daný počet spadá do určitého intervalu, dá sa s veľkou 

pravdepodobnosťou povedať, že ide o značku ŠPZ. 

Základné nevýhody tejto metódy 

20

• Pri prevode RGB poprípade Gray obrázku na binárny BW je nutné mať dobré 

jasové a kontrastové podmienky, aby bolo možné značku jednoznačne definovať. 

• Značka musí byť relatívne s vysokým rozlíšením, aby pri nízkom osvetlení 

nedošlo k spojeniu znaku s vrchom a so spodkom rámu, čo by narušilo atribúty 

daného objektu v tomto prípade značky. Podobne by nemal obsahovať 

nedokonalosti v podobe zašpinenia, čo je dôležité aj v samostatnom rozpoznávaní 

znakov. 

• Značka nesmie obsahovať cez tmavý rámik biele miesta, napríklad v podobe 

zasneženia. 

• Značka by mala byť v relatívnej rovine s rovinou obrázka. 

Pretože zdrojový kód je založený na tejto metóde, bolo snahou odstraniť už 

spomínané mnohé nedostatky. Nnohé riešenia sa v mnohých týchto aspektoch podarili, 

napriek tomu ostali oblasti, ktoré boli vyriešené čiastočne, alebo vôbec. Ďalšie priblíženie 

riešení zadaných problémov sa uvedú v kapitole [3]. 

2.1.2 Metóda relatívne pravidelného prechodu hrán jasovej úrovne medzi 

písmenami a medzerami znakov ŠPZ (Metóda vertikálnych hrán) 

Základom tejto metódy je vzhľad v horizontálnom reze ŠPZ. Priamo v značke 

dochádza k relatívne pravidelnému prechodu oblastí tmavých miest, čo predstavujú znaky 

a svetlých miest, čo predstavujú medzery ŠPZ. V praxi ide o vertikálne hrany 

vyznačujúce sa pravidelnými skokmi v jasovej úrovni. Jasová úroveň je odlíšená nejakou 

prahovou hodnotou. V prípade, že sú nájdené tieto skoky v určitých intervaloch daných 

parametrov, dokáže sa usúdiť, v ktorom riadku môže existovať ŠPZ značka. Ak je 

nájdený takýto riadok, postupuje sa po kroku o jeden horizontálny bod hore a dole. 

V prípade, že daný riadok spĺňa opätovne podmienky, krok sa opakuje až dovtedy, kým 

sa pravidelnosť jasových skokov neobmedzí, poprípade úplne nestratí. Riadky, v ktorých 

k tomuto dôjde, sa určia ako horizontálne maximá a minimá. 

Základné nevýhody tejto metódy 

• Je nutné vedieť, alebo mať aspoň predpoklad, aká je šírka značky, pretože je 

potrebné značku pretnúť v horizontálnom reze aspoň raz. Ak táto podmienka nieje 

splnená, môže nastať prípad, že riadok, kde existuje ŠPZ sa nemusí vôbec objaviť. 

21

• Nieje možné mať natočenie značky prevyšujúce relatívnu rovinu voči rovine 

obrázku. 

• Je nutné zvoliť prijateľnú prahovú hodnotu, aby nedochádzalo k tomu, že ak je 

značka pomerne zanesená, nebude skok spadať do daného intervalu, zároveň ,ak 

by prahová hodnota bola v moc úzkom pásme, môže dôjsť k tomu, že sa vyskytnú 

oblasti podobné oblastiam ako je ŠPZ aj v iných miestach obrázku. 

2.2 Metódy selekcie znakov ŠPZ motorových vozidiel 

V tomto prípade sa bude stručne zaoberať dvoma metódami na detekciu 

jednotlivých znakov v obraze. Prvá je založená na priemernej jasovej úrovni značky ŠPZ 

a vhodným ošetrením znakov do takej podoby, aby bola vhodná na selekciu pomocou 

neurónovej siete. Hovorí sa o tzv. metóde segmentácie pomocou vertikálnej 

a horizontálnej projekcie. Druhou náročnejšou je CER (Characteristic Extremal 

Regions), ktorá je založená na výpočte prahovo oddeliteľných extrémálnych oblastí a ich 

popisom. 

2.2.1 Metóda segmentácie pomocou vertikálnej a horizontálnej projekcie 

Začiatkom tejto metódy je zvoliť vhodnú jasovú úroveň. V praxi môže táto voľba 

podstatne ovplyvniť výsledky. Bez ohľadu na tento fakt vysvetlí sa podstata tejto metódy 

následovne. 

Vie sa že, značka ŠPZ obsahuje jak v horizontálnom, tak vo vertikálnom smere svetlé 

a tmavé miesta. Uvažuje sa, že znaky sú tmavé a plochy okolo písmen svetlé. Keďže sa 

pracuje so značkou v binárnej podobe, je možné jednoducho spočítať svetle, alebo tmavé 

miesta v riadku(šírky), alebo v stĺpci(výšky) značky. Takto získané hodnoty sa posunú do 

podmienok s intervalmi. Jednoduchým porovnaním týchto hodnôt sa zistia maximá, čo 

v horizontálnom smere predstavuje medzery medzi znakmi a vo vertikálnom smere 

predstavuje vrchnú a spodnú hranu znakov. 

Obr. 2.1 Segmentácia znakov pomocou horizontálnej projekcie (určuje vo vertikálnej 

rovine vrch a spodok znakov v ŠPZ) 

22

Obr. 2.2 Segmentácia znakov pomocou vertikálnej projekcie (určuje v horizontálnej 

rovine maximá pre oblasti medzi znakmi) 

Základné nevýhody tejto metódy: 

• Značka ŠPZ musí byť v relatívnej rovine voči rovine obrázka. 

• Značka nesmie obsahovať nedokonalosti v podobe zanesených, alebo rôzne 

poškrabaných, poprípade zhrdzavených plôch. 

Program pracoval pomocou tejto metódy, ale v mnohých ohľadoch bol zdokonalený na 

uroveň imunity voči rotácii a nedokonalostiam. Zdokonalenia sa uvedú v kapitole [3]. 

2.2.2 Metóda CER (Characteristic Extremal Regions) 

Ide o metódu, ktorá vyhľadáva extremálne oblasti, ktoré charakterizujú daný 

objekt. V prípade, že ide o oblasť ktorú hľadáme, hovoríme o Charakteristickej 

extremálnej oblasti. 

2.2.2.1 Extremálna oblasť 

Máme zobrazenie I a množinu bodov D v ňom ležiacom. Zároveň sa definuje 

pojem súsedstvo, čo v praxi znamená, že dva body p a q (pixely množiny D) sú od seba 

vzdialené menej ako jedna. 

n 

pAq ⇔ ∑| 

p i 

− qi 

| ≤ 1 

(2.1) 

i= 

1 

Ak sa označia bodovo súvislé množinové zobrazenia R(T), pre ktorého oblasť M = R(T) 

platí: 

• ∀ ∈ 

( q) 

≤ T 

q 

M 

I 

• ∀ ∈ 

( q) 

T 

I q δ M 

> 

Potom existuje rozklad R(T) na podmnožiny R p(i) (T). 

Každú oblasť R p(i) (T) sa nazýva extremálnou oblasťou v počiatku p(i). Extremálne oblasti 

sú najväčšie súvislé oblasti oddelené prahom T. Ak sa označí množina všetkých oblastí 

23

R T ) = { R ( )}, (2.2) 

( 

p( i) 

T 

rozkladu, kde R(T) je množina všetkých extremálnych oblastí, ktoré na I pre daný prah T 

existujú. Zjednotenie 

tot 

U 

T 

R = ( T ) R( 

T ) , (2.3) 

je množina všetkých prahovo oddeliteľných oblastí, ktoré v obraze vzniknú. 

2.2.2.2 Algoritmus detekcie a selekcie CER 

Pomocou dynamického prahovania a priebežnej klasifikácie vzniknutých R(T) 

oblastí sa zvolí jedna z tried (1.ponechaj, 2.zahoď). Oblasti v prvej triede sú posunuté na 

ďalšiu klasifikáciu. 

Je potrebné, aby množina extremálnych R(T) oblastí bola generovaná v reálnom čase. Pri 

tejto podmienke sa spolieha na to, že každý prah 

T ∈ S {0….255 odtieňov jasu}. 

∀ 

r ∈ R( T ) 

∃R 

∈R( 

T + 1) 

: r1 

⊆ 

2 . (2.4) 

! r 

1 2 

Tento fakt je zobrazený na nasledujúcom obrázku (obr. 2.3). Vidíme, že s rastúcim 

prahom dochádza k spojovaniu oblastí a pripojovaniu menších oblastí k väčším. Oblasť, 

ktorá vznikne pri nejakom prahu T 1 narastá, alebo sa pri nejakom T 2 pripojí k inej oblasti, 

ale jej body pre všetky T > T1 patria R(T). 

Obr. 2.3 Rast prahu a spájanie extremálnych oblastí 

Pre každý prvok 

r 

= φ( r( 

T )) 

F r 

r ∈ R(T) sa určí vektor náznakov. 

(2.5) 

Každý takýto vektor sa oklasifikuje na už vyššie zmienené dve triedy (ponechaj, zahoď). 

Tie ktoré spadnú z množiny C do množiny ponechaj pripojíme na 

R 

CER 

= R ∪ C . 

Tento druh klasifikátoru nazývame selektor. Tento algoritmus je popísaný na obr.(2.4). 

CER 

24

Ďalšími počítanými výrazmi použitými v tejto metóde sú moment otočenia, 

kompaktnosť objektov, počet dier v oblasti atď. Napriek tomu sa nebude hlbšie zaoberať 

ich definovaním a podstatou. Môže sa len stručne povedať, že využívajú metódy 

zmienené v kapitole[1]. Napríklad moment otočenia zvláda Houghova transformácia atď.. 

Obr. 2.4 Algoritmus detekcie a selekcie CER 

2.3 Selektor 

Ako selekčné metódy sa volia techniky porovnávania so vzorom (matching), alebo 

optimalizačne techniky rozpoznávania. Ich podstatou sa zaoberá iná kapitola, takže 

podrobne sa sústredíme na vysvetlenia mnou zvoleného selektoru neurónovej siete 

prostredia Matlab. 

Neurónová sieť sa využíva vo väčšine prípadov zadanej problematiky. Rozdielom 

môže byť len zvolený programovací jazyk. Jej základ tvorí trénovacia a testovaná 

množina . Pri popise neurónovej siete sa vychádza viac menej z typu, ktorý sa použil 

v zdrojovom kóde programu. 

25

2.3.1 Neurónová sieť programovacieho jazyka Matlab 

Z dôvodu, že program na detekciu znakov ŠPZ používa programovací jazyk 

Matlab je namieste, aby sa priblížili základy neurónovej siete práve v tomto jazyku. 

Matlab je známy tým, že pracuje v metrickom systéme. Z toho dôvodu neurónová sieť 

programu matlab využíva množiny vektorov, ktoré predstavujú vstupy do neurónu 

poprípade siete. 

Túto alternatívu demonštrujú nasledujúce obrázky: 

Obr. 2.5 Neurón s vektorovým vstupom, (p 1 ,p 2 ,p 3 .....p R predstavujú vstupy, 

w 1,1 ,w 1,2 a w 1,3 .....w 1,R predstavujú váhy a f je prenosová funkcia) 

Neurón predstavuje funkcia 

n = w p + w p + ... + w p b . (2.6) 

1,1 1 1,2 2 

1,R R 

+ 

Matematicky sa môže vyjadriť zápisom 

n = W * p + b . (2.7) 

26

Obr. 2.6 Zovšeobecnený vektorový neurón 

Obr. 2.7 Prenosové funkcie používajúce sa v NN 

2.3.2 Sieťové architektúry ponúkajúce prostredie Matlab 

Jednotlivé neuróny môžu byť kombinovane spájané do jednotlivých vrstiev 

a rozšírené siete pozostávajú z jednej alebo viacerých vrstiev. Jednotlivé príklady sa 

prezentujú na obrázkoch. 

27

Obr. 2.8 Zobrazenie vrstvy neurónov, a) vrstva neurónov, 

b) zovšeobecnená vrstva neurónov 

Vzorec pre vrstvu neurónov sa dá vyjadriť vzťahom: 

n{1} = net.IW{1,1}* p + net.b{1} 

(2.8) 

Obr. 2.9 Viacvrstvová neurónová sieť 

28

Obr. 2.10 Zovšeobecnená viacvrstvová neurónová sieť 

Vzorec pre sieť neurónov sa dá vyjadriť vzťahom: 

3 

a 

3,2 

2,1 1,1 1 2 3 

3 

2 

1 

= f (LW f (LW f (IW p + b ) + b ) + b = y 

(2.9) 

2.3.3 Neurónová sieť na znakové rozpoznávanie(Matlab) 

Trénovacia množina obsahuje N počet znakov. N je tvorená číslicami a abecedou 

bez diakritiky. Každý znak je reprezentovaný maticovými hodnotami. Je ľubovľné, akú 

dimenziu bude matica popisujúca znak obsahovať. Napriek tomu, v programe sa vyjadrilo 

matrixom 7*5 hodnôt. Z takto definovanej matice sa vytvorí vektor o veľkosti 35. 

Obr. 2.11 Príklad metrixu znakov a) bez šumu b) so šumom 

Neurónová sieť pozostáva z 35 vstupných bolean hodnôt na znak a podľa počtu znakov 

obsahuje aj poradový vektor, ktorý udáva celkový počet trénovaných číslic a znakov. 

29

Architektúra: 

Zdokonalená Neurónová sieť používajúca sa na znakové rozpoznávanie obsahuje 

dvojvrstvovú log-sig log-sig neurónovú sieť. Log-sig prenosová funkcia je výhodná 

vzhľadom na to, že výstup je v intervale (0,1) čo je výhodné na naučenie výstupných 

hodnôt. 

Obr. 2.12 Architektúra využívaná na znakové rozpoznávanie 

Skrytá vrstva obsahuje desať neurónov a využíva sa vtedy keď má sieť problémy 

s naučením. 

Inicializácia je uskutočnená nasledovným príkazom: 

net = newff(minmax(P) , [S1 S2] , {‘logsig’ ‘logsig’, ‘traingdx’); 

trénovanie: 

[netn, tr] = train(netn, P, T); 

30

3 Praktická realizácia programu na automatické rozpoznanie ŠPZ 

Táto časť diplomovej práce sa zaoberá samostatným popisom vytvoreného 

programu. Popisuje jednotlivé kroky uskutočnené v procese prechodu vstupných dát od 

vstupu, až po výstup programu. Zreteľ kladie jak na popisnú, tak na obrazovú ilustráciu. 

Vyhýba sa teoretickému vysvetleniu jednotlivých procedúr, pretože väčšina bola 

podrobne rozobratá. 

3.1 Vstupné dáta 

V tejto časti je stručne popísané štádium vstupných dát. Zároveň sa rozoberie 

úprava akej sa predchádzalo, kým sa vstupné dáta dostali do programu. Bodom, že 

jednotlivé obrázky sú buď snímky z fotoaparátu, alebo jednotlivé snímky videa sa nebude 

zaoberať. 

3.1.1 Algoritmus na detekciu pohybu 

Vzhľadom k tomu, že sa uvažuje o istých objektov na karosérii áut, je veľmi 

výhodné, keď pomocou dostupných algoritmov pohybu sa ošetria jednotlivé framy videa 

tak, aby výsledný obraz obsahoval výlučne, alebo z väčšej časti karosériu auta. Keďže sa 

nevie, na akom mieste sa získajú videa, alebo obrázky auta, je zrejmé, že týmto spôsobom 

sa predíde možným nepresnostiam v podobe objektov okolia, ktoré sa s veľkou 

pravdepodobnosťou môžu javiť ako možné ŠPZ motorových vozidiel. Pomocou 

algoritmu na detekciu pohybu sa dokázalo dostatočne upraviť jednotlivé obrázky na 

vyhovujúcu formu. Cieľom tohoto predspracovania, bolo dopomôcť nasledujúcemu 

algoritmu k výberu a verifikácie v podobe zníženia uvažovaných objektov. Tento 

algoritmu funguje na videosekvenciách. 

Obr. 3.1 Funkčnosť algoritmu na detekciu pohybu 

31

3.2 Predspracovanie vstupných dát 

Cieľom predspracovania, bolo upraviť a konkretizovať vstupné dáta do takej 

podoby, aby boli vhodné na ďalšie spracovanie s ohľadom na výber a verifikáciu 

kandidátov vhodných na separáciu ŠPZ motorového vozidla. 

Pri tomto spracovaní sa postupne zobral v úvahu sled náhodne vybratých ľubovoľne 

vzdialených za sebou idúcich frámov jednotlivých áut. 

3.2.1 Prevod farebného RGB formátu do formátu 256 odtieňov sivej farby 

Je jasne dané, že na vyjadrenie obrázku, ktorý obsahuje zlúčenie troch základných 

farieb červenej, zelenej a modrej potrebujeme trojvrstvový model. Dôsledkom toho sa 

v prípade programovacieho jazyka Matlab dostávame do trojrozmerného priestoru 

vyjadrenia troch matíc. Pomocou funkcie na prevod farebného RGB štandardu do 256 

odtieňov sivej sa docieli výraznejšie zjednodušenie práce. Týmto prevodom sa uskutoční 

prechod do dvojrozmerného priestoru matice, ktorý je výhodný na ďalšie spracovanie. 

Súčastne s týmto krokom sa implementovala funkciu zmenšenia na rozlíšenie 800*600. 

PREVOD 

Obr. 3.2 Prevod RGB (farebného) obrázku na obrázok Gray (256 odtieňov sivej), 

a)trojdimenzionálny matrix RGB obrázku, b)RGB obrázok, c)jednodimenzionálny matrix 

Gray obrázku, d)obrázok gray 

32

3.2.2 Zaistenie dostatočného množstva jasových (kontrastových) úrovní 

Vplyvom toho, že navrhnutá metóda je založená na prahovaní vstupného obrázku, 

bola snaha odstrániť nedostatok v podobe nevyrovnaných jasových a kontrastových 

podmienok v reálnom nasadení. Z tohto dôvodu je implementovaný cyklický algoritmus, 

ktorý zabezpečí zmenu jasových úrovní. Postupným testovaním sa dospelo k záveru, že 

bude dobré použiť približne deväť jasových úrovní, ktoré s veľkou pravdepodobnosťou 

zreteľne vyjadria jak značku s vysokým kontrastom tak aj s nízkym kontrastom. 

Obr. 3.3 Ilustruje zmeny jasových(kontrastových) úrovní Gray obrázku 

33

3.2.3 Prevod obrázku 256 odtieňov sivej (grey) na binárny obrázok pozostávajúci 

z logických jednotiek a núl pomocou techniky prahovania 

Po jasovom spracovaní sa obrázok konvertuje do podoby, ktorá bude 

najvhodnejšia a zároveň najjednoznačnejšia na hľadanie objektov v obraze. 

Najjednoduchší spôsob tohto vyjadrenia je práve binárny obrázok, ktorý vznikne 

prahovaním jasovej intenzity gray obrazku. Táto funkciu sa môže pomerne dobre 

menežovať, podobne ako jas v gray obrázku a to tým, že manuálne sa zvolí prah 

v intervale (0-255), od ktorého sa budú jednotlivé jednotky a nuly rozlišovať. Druhou 

možnosťou je využiť funkciu na spriemerovanie, ktorá automaticky zvolí vhodný prah na 

vyjadrenie binárneho obrázku. 

a) b) 

Obr. 3.4 Prevod obrázku 256 odtieňov sivej(grey) na binárny obrázok, a)pôvodný 

obrázok gray, b) binárny obrázok po prevode 

3.3 Výber kandidátov na ŠPZ značku 

Zohľadnením vlastností transformácií, bolo nútené vytvoriť cyklický skript, ktorý 

by zahŕňal a fungoval na veľkom množstve testovaných áut. Dlhodobým testovaním 

a zároveň skúmaním sa dospelo k záveru, že je lepšie kvôli funkčnosti použiť dva sériové 

skripty, ktoré jak z logického, tak funkčného hľadiska skvalitňujú výsledky programu. 

V tomto prípade sa použilo dvojcyklu. S tým, že druhý vykompenzoval nedostatky 

prvého. Dôvody viacerých možností budú popísané ďalej. 

3.3.1 Algoritmus číslo 1. 

Je efektívny vo väčšine prípadov a nemá nejaké výrazné obmedzenia. Algoritmus 

číslo jedna sa vyznačuje tým, že dokáže rozpoznávať značky vo väčšine prípadov, či už 

34

sa jedná o tmavé, alebo svetlé auta. Čiastočnú nedokonalosť kompenzuje algoritmus číslo 

dva, ktorý hľadá ešte s vyššou úspešnosťou na tmavších autách, avšak jeho obmedzením 

je nemožnosť hľadania na svetlých autách z dôvodu splývania pozadia ŠPZ s karosériou 

auta. 

a) b) 

Obr. 3.5 Demonštratívny obrázok auta, a) RGB, b) Gray 

3.3.1.1 Prvá funkcia trasovania(trace) 

Ide o funkciu ktorá umožní v binárnom obrázku rozlíšiť hrany alebo vnútro 

bielych jednotlivých objektov, nachádzajúcich sa na tmavom podklade a priradiť im isté 

poradové číslo, ktoré reprezentujú jednotlivé pixely daného objektu. Toto číslo môže byť 

priradené podľa zvolenej funkcie buď na okraj (hranu), alebo na celé vnútro daného 

objektu. Zároveň umožňuje identifikovať objekty nachádzajúce sa v už definovaných 

objektoch (diery) atď. Tato funkcia je založená na princípe vektorového rozdielu dvoch 

pixelov v ôsmich smeroch posunu a využíva hranových detektorov. 

a) b) 

Obr. 3.6 Názornosť funkcie trasovania na základe hranových detektorov, 

a)pred trasovaním, b)po trasovaní 

35

3.3.1.2 Rozšírenie hrán rámiku ŠPZ 

V dôsledku nedokonalostí značek ŠPZ, akými sú splývania znakov ŠPZ 

s orámovaním je potrebné spájať čiastkové elementy jednotlivých značiek. Nevýhodou 

tohoto kroku je, že ak je z pravej, alebo ľavej strany značky oblasť so svetlou intenzitou 

jasu dôjde k splynutiu tejto oblasti s oblasťou značky. Preto sa pristúpilo ku kroku, 

ktorým je rozšírenie hrán rámiku ŠPZ. 

Postup, ktorým sa docielilo tohoto účinku je nasledovný. Pôvodná binárna matica 

obrázku sa prevedie na opačnú. To znamená, binárna jednotka bude nulou a naopak. 

Následne pomocou funkcie, ktorá je založená na zmene nulových pixelov v okolí 

jednotkových na jednotkové s tým, že smer aj počet sa manuálne definuje, upravia sa 

všetky svetlé miesta tak, že sa pridá do všetkých strán niekoľko pixelov jednotkovej 

hodnoty. Takto upravená binárna matica sa opätovne prevedie naspať na opačnú ,avšak 

zdrojovú s rozšírenými hranami. 

Obr. 3.7 Zobrazuje jednotlivé kroky rozšírenia hrán, a)pôvodný binárny obrázok 

b)prevod obrázku na opačný 1-0, c)roztiahnutie hrán, d)spätný prevod 

36

3.3.1.3 Úprava matice vhodnej na odpočet 

Z takto získanej matice sa odstránia všetky malé objekty. Získaná matica sa odráta 

od pôvodnej matice obrázku. Na výslednej matici zostanú len objekty, ktoré sú veľké 

približne ako značka ŠPZ a menšie. 

Obr. 3.8 Demonštruje kroky odpočtu, a)pôvodný binárny obrázok, b)obrázok na odpočet, 

c)výsledný obrázok po odpočte 

3.3.1.4 Po odpočte odstránenie miniatúrnych oblastí 

Z dôvodu pokračujúceho procesu sa muselo pristúpiť na odseparovanie 

nepotrebných oblastí. Jedným zo spôsobov ako to dosiahnúť, je využitie funkcie na 

odstránenie oblastí, ktorých súčet pixelov je menší ako dopredu definovaná hodnota. 

Preto pred zlučovaním čiastkových objektov sa pristúpi k odstráneniu malých oblastí, 

ktorých súčet sa rovná menej ako tretina ŠPZ. 

37

a) b) 

Obr. 3.9 Odstránenie miniatúrnych oblastí, a) pred selekciou, b) po selekcií 

3.3.1.5 Funkcia na zlúčenie čiastkových oblastí 

Vplyvom toho, že vo väčšine prípadov je značka snímaná zvrchu, dochádza 

k tomu, že vrch jednotlivých znakov splynie s karosériou, alebo s tmavým tieňom, ktorý 

vrhá karoséria na danú značku. Ak sú značky fotené v zlej kvalite, pri veľmi zlom 

osvetlení, prahovaním môže dôjsť k prípadu, že niektorý znak, alebo viac znakov rozdelí 

značku na viac častí. Túto korekciu vykonáva už spomínaná funkcia, ktorá zlúči ŠPZ 

značku do opäť pôvodného tvaru respektíve veľkosti a tým zachová atribúty potrebné k 

selekcii. Jej funkcia je založená na zmene nulových pixelov na jednotkové s tým, že smer 

a počet je manuálne definovaný. Samozrejme, že táto funkcia má aj svoje úskalia, 

pretože umožňuje zlúčenie aj iných čiastkových objektov, alebo objektov značky s iným 

okolím. 

a) b) 

Obr. 3.10 Zlúčenie čiastkových oblastí, a)pred zlúčením, b)po zlúčení 

38

3.3.1.6 Odstránenie malých oblastí 

Z dôvodu výpočtovej náročnosti pokračujúceho procesu sa muselo pristúpiť na 

odseparovanie nepotrebných oblastí. Dosiahlo sa to funkciou na odstránenie oblastí, 

ktorých súčet pixelov je menší ako vopred definovaná hodnota. V tejto fáze sa využilo 

dynamicky počítanej hodnoty, ktorá bola zisťovaná už v predspracovaní vstupných dát. 

Vychádzalo sa z predpokladu, že oblasť bude mať určitú veľkosť vzhľadom na 

vzdialenosť snímaného objektu (karosérie áut). Táto hodnota (Pmin), je dynamicky sa 

meniaca s tým, že jej veľkosť je stopercentne menšia ako cca tretina ŠPZ (záleží od 

nastavenia parametrov). Jej hodnota súvisí so spracovaním detektora pohybu, keďže 

prostredníctvom výstupného obrázku je umožnené približné identifikovanie vzdialenosti, 

šírky a výšky karosérie. Týmto spôsobom sa odstránilo nespočetné množstvo oblastí, 

ktoré by následne vstupovali do verifikátora a spomalovali tak proces. 

a) b) 

Obr. 3.11 Odstránenie malých oblastí, a)pred odstránením, b)po odstránení 

3.3.1.7 Druhá funkcia trasovania (trace) 

Po predchádzajúcich úkonoch selekcie a zlúčenia sa pristúpi k tomu, že sa 

opätovne trasujú hrany oblastí už oblastí vyselektovaných predchádzajúcimi cyklami. 

Výsledkom tohto kroku je získanie malého množstva objektov, ktoré sú vhodné na 

spracovanie a testovanie verifikátorom. 

39

a) b) 

Obr. 3.12 Druhá funkcia trasovania a zobrazenie oblasti vstupujúcich do verifikátora, 

a) jednotlivé oblasti, b)farebné odlíšenie pre lepšiu názornosť 

3.3.2 Algoritmus číslo 2. 

Jeho obmedzením je hľadanie len na tmavých autách, zato však s väčšou 

pravdepodobnosťou ako v algoritme č.1. 

Hľadá sa ŠPZ áut, ktoré okolo jasnej značky nemajú vo veľkej vzdialenosti žiadny 

iný objekt rovnakej, alebo podobnej jasovej intenzity. 

a) b) 

Obr. 3.13 Demonštratívny obrázok auta, a) RGB, b)Gray 

3.3.2.1 Prvá funkcia trasovania(trace) 

Jedná sa o totožný postup ako algoritme číslo jedna. Ide o funkciu, ktorá ohraničí 

a priradí hodnotu jednotlivým svetlým objektom nachádzajúcim sa na obrázku. 

40

a) b) 

Obr. 3.14 Názornosť funkcie trasovania na základe hranových detektorov algoritmu č.2., 

a) pred trasovaním, b)po trasovaní 

3.3.2.2 Selekcia malých oblastí 

Ide o postup ktorý bol popisovaný už v predchádzajúcom algoritme. Podstata 

spočíva v odseparovaní objektov, ktorých hodnota súčtu pixelov nezodpovedá dopredu 

definovanej hodnote na základe predspracovania pomocou detekcie pohybu. 

a) b) 

Obr. 3.15 Zobrazuje odstránenie malých oblastí algoritmu č.2., 

a)pred odstránením, b)po odstránení 

3.3.2.3 Zlúčenie čiastkových oblastí 

Z dôvodu zlepšenia algoritmu je potrebné zlúčiť čiastkové oblasti ŠPZ a tým 

zachovať atribúty, ktoré sú potrebné pri daľšom spracovaní programom. 

41

a) b) 

Obr. 3.16 Zobrazenia zlúčenie čiastkových oblastí algoritmu č.2., 

a) pred zlúčením, b) po zlúčení 

3.3.2.4 Druhá funkcia trasovania(trace) 

Konečnou fázou algoritmu č.2. je ako v predchádzajúcom algoritme opätovne 

funkcia trasovania, ktorá trasuje hrany oblastí už vyselektovaných v predchádzajúcich 

úkonov. Malé množstvo objektov vstupuje do verifikátoru. 

a) b) 

Obr. 3.17 Druhá funkcia trasovania a zobrazenie oblasti vstupujúcich do verifikátora 

algoritmu č.2., a) jednotlivé oblasti, b)farebné odlíšenie pre lepšiu názornosť 

42

3.4 Verifikácia a selekcia ŠPZ 

Jednotlivé oblasti sú posunuté z predchádzajúceho cyklu a sú importované do 

verifikátoru. Jeho úlohou je jednoznačne určiť, s akou pravdepodobnosťou ide o značku 

ŠPZ. V prípade, že oblasť po prechode zlyhá, je automaticky preskočená a cyklus začne 

testovať oblasť, ktorej číslo je ďalšie v poradí. Takto sa cykluje dovtedy, kým sa nenarazí 

na správnu oblasť, poprípade k dispozícii niesu ďalšie vstupy na testovanie. 

Podmienky a pravidlá na selekciu sa môžu vhodne upravovať podľa typu kvality 

obrázku, rozlíšenia a iných vonkajších podmienok. Z dôvodu robustnosti je namieste, keď 

systém vyzistí čo najviac správnych výsledkov. Každopádne, závislosť na kvalite 

vstupných dát je nepopierateľná. V niektorých prípadoch, kedy ide o veľmi kvalitné 

snímky je lepšie nastaviť verifikátor prísnejšie, poprípade pridať podmienky, ktoré sa 

veľmi ľahko implementujú do systému. V opačnom prípade, kedy ide o veľmi nekvalitné 

snímky a hodnota vstupných dát je veľmi nízka, je nanajvýš rozumné podmienky 

zjemňovať, aby nedochádzalo k zlyhaniu systému. Najlepšou alternatívou vytvárania 

a práce s podmienkami je priamo na mieste, kde by bol daný systém umiestnený. 

V zásade platí, že prax je najlepší školiteľ a to samozrejme platí aj pre automatizované 

systémy. Pri vývoji programu bolo vytvorených viacero alternatív detekcie vzhľadom na 

kvalitu vstupných dát. Konkrétne tri. 

Obr. 3.18 Oblasti vstupujúce do verifikátoru a ich číslovanie 

43

3.4.1 Spracovanie vstupného objektu 

Cyklus bol navrhnutý, aby dopredu poznal množstvo testovaných objektov, ktoré 

budú prechádzať jeho telom. Demonštruje obrázok (obr. 3.18). 

Základom tohto systému je, že v úvode sa spracujú atribúty daného objektu. Zistia 

sa dva vektory, ktoré predstavujú jednotlivé pixely pre horizontálny a vertikálny smer. 

Z takto vytvorených vektorov sa určia jednotlivé maximá a minimá pre daný objekt. Platí, 

že pre minimum vertikálneho vektora ide o vrchnú hranu uvažovaného objektu a pre 

maximum o spodnú hranu objektu. Tento istý spôsob sa použije aj pre horizontálny 

vektor z ktorého minima sa zistí ľavá hranu objektu a z maxima pravá hranu objektu 

v celkovom obraze. Následne na to klasickým odčítaním vzdialeností maxím a miním, sa 

určí veľkosť jednotlivých strán objektu. V podstate výstupom spracovania je štvorsten, 

v ktorom je umiestnený uvažovaný objekt a ktorého hrany sa dotýkajú. 

Po tomto kroku sa vypočíta pomer strán tohto štvorstena. Výsledkom je reálne číslo 

delenia dĺžky (horizontálneho smeru), a šírky objektu(vertikálneho smeru). Toto číslo sa 

využije pri implementácií do podmienok. 

Ďalším krokom je zistenie veľkosti testovaného obrázku respektíve výšky a šírky 

rozlíšenia. 

Obr. 3.19 Spracovanie oblastí vstupujúcich do verifikátora s podmienkami 

Nasleduje vstup do podmienok (verifikácia), ktorý vykonáva testovanie rôznych 

parametrov objektu. 

3.4.2 Verifikátor – podmienky 

Bol vytvorený cyklus, ktorý uvažuje aj v rovine kvality obrazu. Preto sa vytvoril 

sériový verifikátor pozostávajúci z dvoch častí. Pri prechode prvou časťou je umožnené 

uložiť výrez ŠPZ, ale nieje umožnená detekcia znakov, keďže sa jedna o nekvalitné 

snímky. Detekciu znakov umožní až prechod aj druhou časťou verifikátora. 

44

3.4.2.1 Prvá časť verifikátoru 

Pozostáva z týchto častí: 

Maximálne prípustná hodnota šírky objektu 

Vstupným argumentom je už vyššie spomínaná šírka uvažovaného objektu 

a dynamicky meniaca sa hodnota maximálnej prístupnej šírky. Jej hodnota sa mení na 

základe predspracovania pomocou detektora pohybu. Táto dynamická hodnota je 

navrhnutá tak, aby šírka objektu bola menšia ako polovica šírky obrysu karosérie auta. To 

zabezpečí vyselektovanie objektov, ktoré sú zbytočne veľké, ale ich atribúty majú 

náznaky podobnosti s ŠPZ značkou. 

Ak 

šírka(objektu) < šírka(polovica šírky obrysu auta) pokračuj ďalej. 

Obr. 3.20 Podmienka číslo jedna prvej časti verifikátoru 

45

Pomer dĺžky a šírky objektu (uvažovanej ŠPZ) je v nejakom intervale 

Vstupným argumentom je reálne číslo, ktoré sa získalo delením šírky a výšky 

objektu. Keďže sa zaoberá Európskym štandardom ŠPZ značky, vie adekvátne 

odpovedať, koľko by mal pomer skutočnej ŠPZ značky obsahovať. Napriek tomu je šanca 

na rovnosť takýchto dvoch čísel nulová. V žiadnych reálnych podmienkach sa nedocieli, 

aby značka bola skutočne vodorovná a neobsahovala aj nejaké pridružené oblasti. 

Vzhľadom k týmto okolnostiam sa pristúpilo na možnosť intervalu, ktorý sa volí podľa 

vyhotovenia snímkov. 

V tomto prípade sa použil dostatočne otvorený interval , ktorý umožňuje 

detekovať aj ŠPZ s uhlom otočenia do 30 stupňov. 

Ak pomer (strán uvažovaného objektu) > reálne číslo(3) a súčastne pomer(strán 

uvažovaného objektu < reálne číslo(6) ide s veľkou pravdepodobnosťou o značku 

a pokračuj ďalej. 

Obr. 3.21 Podmienka atribútov 

Medzipodmienkové spracovanie 

Po tomto kroku sa postupuje tak, že daný objekt sa vystrihne z pôvodného 

binárneho obrázku, ktorý nieje postihnutý postupnými úpravami a transformáciami. Takto 

vyrezaný obdĺžnikový objekt sa uloží do pamäte. Následnými krokmi sa zistí ľubovolný 

riadok (spravidla stredný) daného objektu, ktorý sa využije na ďalšie spracovanie. 

V našom prípade stredný. Nieje problémom zistiť viacero takýchto riadkov. Cieľom 

tohoto kroku, je zistiť počet tmavých a svetlých miest v danom riadku. Na uskutočnenie 

tohto zistenia sa využije opätovne funkciu trasovania, ktorá spočíta počet svetlým miest 

v danom riadku. Následne na to táto hodnota vstupuje do ďalšieho pravidla. 

46

a) b) 

Obr. 3.22 Výrez stredného riadku, a) detekovaná oblasť, b) vyrezaná oblasť a jej stredný 

riadok 

Stredný, alebo niekoľko riadkov okolo stredu šírky objektov, má určitý počet 

svetlých a tmavých miest 

Vstupnou hodnotou tohoto pravidla je počet svetlých miest v horizontálnom reze 

objektu, ktorého zistenie bolo vysvetlené vyššie. 

Na základe vedomosti zo štandardu Európskej ŠPZ značky je možné povedať, že 

dochádza k striedaniu svetlých a tmavých miest. Tmavé miesta predstavujú znaky, 

značky a svetlé priestory medzi nimi, alebo vnútra znakov. Z tohoto dôvodu sa 

formuloval istý interval hodnôt, ktorý s veľkou pravdepodobnosťou hovorí, či sa skutočne 

jedná o ŠPZ značku. Nevýhodou je, že otočenie nemôže byť prílišne veľké. Čím 

vodorovnejšie značka je ,tým sa dosahuje lepších výsledkov. Napriek tomu systém 

funguje tak aby bolo možné značku do 30 a viac stupňov otočenia detekovať. Interval sa 

zvolil hodnôt. 

Ak počet (svetlých miest v reze značky) > reálne číslo(6) a súčastne počet(svetlých 

miest v reze značky) < reálne číslo(14). Pokračuj ďalej. 

Obr. 3.23 Podmienka intervalu počtu svetlých miest v horizontálnom reze značky 

47

Vystrihnutie ŠPZ značky z pôvodného RGB obrázku 

V prípade, že je obraz v tele programu konvertovaný na menší, je potrebné tento 

problém odstrániť. 

Spraví sa to tým, že sa zistí reálne číslo prevodu obrázku na menší. Takto získané 

číslo sa postupne násobí s okrajmi objektu. Takto sa zistí skutočné umiestnenie značky 

ŠPZ v pôvodnom nekonvertovanom farebnom obrázku. 

Pomocou atribútov umiestnenia sa uloží objekt vo forme matice. V prípade, že sa 

zvolí najhoršia kvalita, pri spracovaní dôjde k uloženiu takto vystrihnutej značky do 

obrázku *.png. Pri ukladaní dochádza aj k rozpoznaniu v akej jasovej úrovni bola 

detekovaná ŠPZ značka. Jasová úroveň je zaznamenaná v podobe čísla v názve súboru. 

a) b) 

Obr. 3.24 Vystrihnutie ŠPZ značky z pôvodného RGB obrázku, a) detekovaná oblasť, 

b)rovnaká oblasť vyrezaná z pôvodného RGB snímku 

3.4.2.2 Druhá časť verifikátoru 

Značka sa spracuje, upravia sa geometrické deformácie a v poslednom rade sa 

uskutoční prechod k znakovému rozpoznávaniu. 

Pozostáva z týchto častí: 

Otočenie 

Je založené na detekcií uhla pomocou Houghovej transformácie. 

Otočenie obsahuje kroky: 

• zistenie priemerného prahu vystrihnutej značky ŠPZ získanej v prvej časti 

verifikátoru a prevod na binárny obrázok (Obr. 3.25) 

• odstránenie miniatúrnych oblastí (Obr. 3.26) 

• na základe Houghovej transformácie zistenie uhla otočenia značky (Obr. 3.26) 

• otočenie binárnej, binárnej upravenej, a v poslednom rade RGB matice (Obr. 

3.27) 

48

Obr. 3.25 Prevod RGB značky na základe priemerného prahu do BW podoby 

Obr. 3.26 Odstránenie miniatúrnych oblastí a zistenie uhla otočenia pomocou HT 

a) 

b) 

c) 

Obr. 3.27 Rotácia, a) upravenej binárnej matice, b)pôvodnej binárnej matice, 

c) pôvodnej RGB matice 

49

Maticové vyjadrenie binárneho upraveného obrázku (obr. 3.27a) slúži na zistenie 

hrán ŠPZ, zároveň maticové vyjadrenie binárneho rotovaného obrázku (obr. 3.27b) je 

použité na výrez pre OCR spracovanie a maticové vyjadrenie rotovaného RGB obrázku 

(obr. 3.27c) je použité na orezanie a uloženie výslednej značky ŠPZ. 

Otočenie obsahuje jedno z pravidiel, ktoré umožňuje prechod ďalej. Jeho podstata 

spočíva v tom, že v ošetrenej binárnej matici (obr. 3.26) musí existovať určitý počet 

svetlých pixelov. Ich súčet musí byť väčší, ako počet pixelov štyroch riadkov v matici 

(môže sa ľubovolne voliť). Ak nesplňuje toto pravidlo oblasť je zahodená z dôvodu, že sa 

pravdepodobne nejedná o značku ŠPZ. 

Ak suma(svetlých pixelov značky) > suma (štvornásobku súčtu pixelov v riadku). 

Pokračuj ďalej. 

Orezanie 

Ide o zisťovaciu metódu, ktorá sa vytvorí na základe sumy svetlých pixelov 

v riadkoch a stĺpcoch. Ak je nájdená istá suma detekuje sa hrana ŠPZ. Zlepšenie sa 

vykonalo pri určovaní vrchnej a spodnej hrany, ktorá sa nezisťuje len na základne prvého 

pixelu od vrchu a spodku matice, ale aj na základe intervalového maxima v rozmedzí 

blízkeho okolia prvotne detekovanej hrany. Detekciu vykonáva v matici (obr. 3.27a), 

a samostatný výrez uskutoční na maticiach (obr. 3.27b, obr. 3.27c). 

V tejto časti obsahuje tri podmienky, ktoré musí značka ŠPZ splniť pokiaľ chce byť 

posunutá na uloženie a v poslednom rade detekciu samostatných znakov. 

• Výška vyrezaného objektu musí byť väčšia, ako jedna tretina výšky upravenej 

binárnej matice (obr. 3.27a). 

• Šírka vyrezaného objektu musí byť väčšia, ako jedna polovica šírky upravenej 

binárnej matice (obr. 3.27a). 

• Pomer počtu svetlých (plocha medzi znakmi) a tmavých (znaky) pixelov 

vyrezaného objektu musí byť väčší, ako tri pätiny. 

Pri splnení všetkých týchto podmienok postupuje na znakové spracovanie. 

Obr. 3.28 Výsledok orezania 

50

3.4.3 Preprocesing OCR (Separácia jednotlivých znakov) 

3.4.3.1 Preprocesing značky ŠPZ 

Obsahuje tri kroky: 

• V prvom kroku sa vykoná zväčšenie značky. 

• V druhom kroku sa odstránia nepotrebné objekty(zanesenia a pod.). 

• Pri treťom kroku sa vykonajú metódy na vyhladenie hrán jednotlivých znakov, 

výsledkom je zosílenie znakov a ich jednoduchšia separácia. 

Obr. 3.29 Preprocesing značky ŠPZ, a) pôvodný vyrez značky, 

b) výrez značky upravený vyhľadením hrán 

3.4.3.2 Horizontálna separácia znakov 

V prípade, že hodnota stĺpcového súčtu pixelov znaku je väčšia ako istá hodnota, 

vykoná sa hranovanie. Táto hodnota je v tomto prípade niekoľko pixelov, čo zaručí 

dostatočnú schopnosť imunity na rôzne zanesenia medzi znakmi. 

Obr. 3.30 Horizontálna separácia znakov značky 

51

3.4.3.3 Vertikálne ohraničenie a konverzia znakov 

Cieľom tohto kroku je vertikálne ohraničenie znaku a konverzia na metrix 30*20 

pixelov. 

Pri vertikálnom ohraničení je podobný postup ako pri horizontálnom členení. 

Program je upravený tak ,aby rozlišoval medzi úzkymi znakmi, ako sú I a 1 a ostatnými 

a prispôsobil veľkosť vhodnú na vstup do neurónovej siete. 

Obr. 3.31 Vertikálne ohraničenie a konverzia znakov 

Táto časť programu obsahuje separátor na základe vlastnosti výšky. To znamená, 

ak je nejaký znak v nevhodnej forme, alebo značka obsahuje nejaké zanesenie, je 

automaticky odstránené a nepostupuje ďalej na rozdpoznanie do neurónovej siete. 

Ak výška(znaku) > výška (päť osmín (5/8) výšky značky). Pokračuj ďalej. 

3.4.4 Neurónová sieť ako funkcia rozpoznania znaku 

Základom je vytvorenie vektorov jednotlivých znakov. Zvolil sa vektorový systém 

pozostávajúci z 7*5 bolean prvkov. Neurónová sieť bola natrénovaná na množine 

vektorov zo znakov získaných priamo na značkách ŠPZ. Ako testovaciu množinu sa 

privedie metrix vektorov písmen značky. Bližšie sa vytvorenej neurónovej sieti venuje 

kapitola[2]. 

52

Záver: 

Podstatou tejto práce bolo vytvorenie a zdokonalenie už existujúcich algoritmov 

na detekciu ŠPZ motorových vozidiel a ich znakov. Bola využitá známa metóda 

prahovania s tým, že prah sa prispôsoboval aktuálnym požiadavkám daného osvetlenia. Je 

zrejmé, že týmto spôsobom sa čiastočne kompenzovala nedokonalosť, ktorá je tomuto 

postupu vyčítaná. Napriek tomu je jasné, že za žiadnych podmienok sa nedá docieliť 

stopercentnej úspešnosti. Z tohto hľadiska je zaujímavé, že práve úspešnosť sa stala 

prvotným cieľom na zlepšenie. Snahou bolo program priviesť do takého stavu , aby bol 

robustný a schopný odpovedať na akékoľvek požiadavky. Boli využité rôzne metódy 

a postupy, ktoré zlepšujú jeho prácu. Po ich odtestovaní bol zostavený algoritmus 

(program), ktorý je imúnny voči miernemu natočeniu k rovine obrázku, ďalej dokáže 

pracovať aj v prípade, že jednotlivé znaky splývajú s okolím ŠPZ a taktiež nereaguje na 

drobné nečistoty. 

Je ťažké zhodnotiť, ktoré systémy sa lepšie hodia do reálnej prevádzky. V každom 

prípade je nanajvýš zrejmé, že jak v prahovacích metódach založených na hranových 

detektoroch, tak aj v metódach založených na vertikálnych hranách spolu s CER, je 

priestor na zlepšovanie. Je dobré, že existuje množstvo testov pre jednotlivé metódy, ale 

napriek tomu málokde je uvádzaná aj podmienka kvality, ktorá je v celej problematike 

veľmi dôležitá. Aj tento fakt nás nabuduzuje k tomu, aby sa zodpovedne pristúpilo 

k otázke rozpoznávania objektov v obraze. 

Absolútnym záverom tejto práce, by sa mala stať motivácia, ktorá prináša už 

samotný cieľ tejto práce. Jej úlohou je uľahčenie človeku vytvoriť si priestor na to, aby sa 

mohol spoľahnúť na prostriedky, ktoré má k dispozícii a tým si výrazne zjednodušil prácu 

a venoval sa veciam len nevyhnutelným, ktoré sa za žiadnych okolností nemôžu vytvárať 

automatizovanými systémami. 

53

Použitá literatúra: 

[1] Žára J., Beneš B., Felkel P.: Moderní počítačová grafika. Computer Press, Praha, 

1998. 

[2] MILAN FTACNIK-Department of Applied Informatics, Faculty of Mathematics, 

Physics and Informatics, Comenius University, - prednášky z teórie spracovania 

obrazu(dostupné na webe) 

[3] Karel Zimmermann, Diplomová práce -Detekce a rozpoznávání znakú v obraze a 

vidoesekvencích 

[4] Jun-Wei Hsieh, Shih-Hao Yu, Yung-Sheng Chen, “Morphologybased,License 

Plate Detection from Complex Scenes”, 16th International Conference on Pattern 

Recognition (ICPR'02) Vol 3,2002. 

[5] Intl. Conf. in Computer Science – RIVF’05 February 21-24, 2005, Can Tho, 

Vietnam-Building an Automatic Vehicle License-Plate Recognition Systém(Web) 

[6] A. Rahman, Ahmad Radmanesh, “A Real Time Vehicle’s Licence Plate 

Recognition”, Proceedings of the IEEE on Advanced Video and Signal Based 

Surveillance, AVSS’03, 2003. 

[7] Schlesinger M., Hlaváč V.: Deset přednášsek z teorie statistického a strukturního 

rozpoznávání. ČVUT, Praha, 1999. 

[8] Klapka P.: Diplomová práce – Rozpoznávání státních poznávacích značek. ČVUT 

v Praze,fakulta elektrotechnická, katedra kybernetiky, Praha, 2001. 

[9] Janošek V.: Diplomová práce – Detekce a rozpoznávání státních poznávacích 

značek. ČVUT v Praze, fakulta elektrotechnická, katedra kybernetiky, Praha, 

2001. 

[10] M.Rousson, T.Brox, R.Deriche Active Unsupervised Texture Segmentation on a 

Diffusion Based Feature Space. CVPR’03 v.2, pp.699, 2003. 

54

Prílohová časť 

Táto časť sa nachádza na priloženom médiu CD. Obsahuje samostatný zdrojový kód 

programu a jeho popis. Ďalej množstvo experimentálnych výsledkov a v neposlednom 

rade jeho samostatnú prezentáciu. 

Výpis obsahu CD: 

• Diplomová práca 

o Diplomová_práca.pdf 

• Zdrojové kódy(program) 

o Neurónová sieť 

edu_imgresize.m 

neural_pismena.m 

neuraln_komplet.m 

test.m 

uc_neuronky.m 

o area_min.m 

o edu_imgresize.m 

o finding_1.m 

o finding_2.m 

o finding_3.m 

o load_pic.m 

o orezanie.m 

o otocenie.m 

o preprocesing_OCR.m 

o program.m 

o program_komplet.m 

o rospoznanie.m 

o separator_znakov.m 

o ulozenie_k3.m 

o ulozenie_k12.m 

• Vstupné dáta 

• Programy 

o Matlab 7.0.1 with SP1 

55

Čestné prehlásenie 

Prehlasujem, že som zadanú diplomovú prácu vypracoval samostatne, pod 

odborným vedením vedúceho diplomovej práce Ing. Miroslava Benča a používal som len 

literatúru uvedenú v práci. 

Súhlasím so zapožičiavaním diplomovej práce. 

V Žiline, dňa 18.5.2007 

______________________ 

Podpis diplomanta 

56

Poďakovanie 

Moje poďakovanie patri panu inžinierovi Miroslavovi Benčovi, za jeho odborné vedenie, 

ale najmä za pomoc a morálnu podporu, ktorú mi prejavoval počas celého obdobia 

tvorby diplomovej práce. 

57

AutomatickÃ© rozpoznÃ¡vanie Å PZ motorovÃ½ch vozidiel v ... - Utc.sk

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?