Predspracovanie obrazu pre optické rozpoznávanie ... - TUKE
Predspracovanie obrazu pre optické rozpoznávanie ... - TUKE
Predspracovanie obrazu pre optické rozpoznávanie ... - TUKE
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
FEI TU v Košiciach Diplomová práca List č. 26<br />
V kroku programu s popisom ’Urči typ pozadia a po<strong>pre</strong>dia’ (viď obrázok<br />
13) je potrebný automatický rozhodovací prvok, ktorý by napríklad mohol<br />
byť realizovaný pomocou riadiacej neurónovej siete, ak by bolo jadro aplikácie<br />
realizované pomocou modulárnej neurónovej siete. Tento rozhodovací prvok<br />
by tiež určoval potrebu učiť <strong>pre</strong> aktuálny spracúvaný obraz novú neurónovú<br />
sieť (jedná sa o rozhodnutie v kroku ’Máme vhodnú naučenú NS?’ na obrázku<br />
13).<br />
Tiež je potrebné automaticky vytvoriť trénovaciu a testovaciu množinu.<br />
Problém však je, že aplikácia by sama musela zistiť polohu, typ písma (font)<br />
a samotný text, aby dokázala vytvoriť trénovaciu množinu so správne umiest-<br />
nenými tmavými bodmi na výstupe. Ak by toto aplikácia samostatne doká-<br />
zala, nebolo by potrebné realizovať celé <strong>pre</strong>dspracovanie, <strong>pre</strong>tože by táto časť<br />
takéto <strong>pre</strong>dspracovanie zahrňovala. Z tohoto dôvodu by užívateľ musel zadať<br />
aspoň časť textu ktorý na obrázku vidí a aplikácia by sa mala sama následne<br />
pokúsiť zistiť umiestnenie textu, typ a veľkosť písma na obrázku.<br />
Počas vypracúvania tejto diplomovej práce som skúšal algoritmus <strong>pre</strong><br />
automatické zistenie umiestnenia textu na vstupnom obraze, ktorý bol za-<br />
ložený na zistení minimálnej chyby učenia sa neurónovej siete vo vzťahu k<br />
umiestneniu textu na vstupnom obraze. Tento algoritmus sa neosvedčil ani<br />
efektivitou, ani použiteľnou rýchlosťou, <strong>pre</strong>to vytvorenie plne automatickej<br />
aplikácie nebolo realizované a boli zvažované ďalšie možnosti.<br />
Poloautomatická aplikácia<br />
Polo-automatická aplikácia čiastočne riadená užívateľom sa zhoduje v návrhu<br />
s plne automatickou aplikáciou v časti rozhodovania sa použitia neurónovej<br />
siete podľa kombinácie pozadia a po<strong>pre</strong>dia, líši sa však vo vytváraní tréno-<br />
vacej a testovacej množiny.<br />
Ako bolo naznačené v koncepte plne automatickej aplikácie, vytváranie<br />
trénovacej a testovacej množiny je problematické bez zásahu užívateľa. Pre<br />
zjednodušenie tohoto problému užívateľ musí okrem napísania časti textu,<br />
ktorý vidí, správne nastaviť aj jeho font, veľkosť a <strong>pre</strong>sné umiestnenie na