12.07.2015 Views

5.3 Rozhodovací pravidla - Sorry

5.3 Rozhodovací pravidla - Sorry

5.3 Rozhodovací pravidla - Sorry

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

hledá pravidlo, které pokrývá velký počet objektů třídy Class a malý počet objektů ostatních tříd.Tvorba pravidel končí když už se nepodaří nalézt vyhovující pravidlo. Specializace <strong>pravidla</strong> seprovádí přidáním kategorie ke kombinaci tvořící předpoklad <strong>pravidla</strong> 12 . Potenciální předpoklady seuchovávají v množině Star. Velikost této množiny určuje šířku paprsku pro paprskové prohledávání.Nejlepší pravidlo (krok 4.2.2 algoritmu) se hledá na základě negativní entropieTF(Ant) = ∑t=1nt (Ant)n(Ant) × log n t (Ant)2n(Ant),na základě Laplaceova odhadu očekávané spolehlivosti <strong>pravidla</strong> 13nebo na základě m-odhadu (m-prob)F(Ant) = n t(Ant) + 1n(Ant) + T ,F(Ant) = n t(Ant) + m∗f tn(Ant) + m ,kde T je počet tříd, n t (Ant) je počet příkladů třídy t pokrytých pravidlem, n(Ant) je počet všechpříkladů pokrytých pravidlem, f t = n t /n je relativní četnost třídy t a m je parametr.Ve všech těchto případech vyšší hodnota znamená lepší pravidlo.funkce Search(Ant,D TR )1. nechť Star je množina obsahující prázdnou kombinaci [ ]2. nechť Ant je prázdná kombinace3. nechť Sel je množina všech kategorií A(v) vyskytujících se v D TR4. dokud Star je prázdné nebo dokud nebyly testovány všechny kategorie A(v) v Sel4.1. nechť NewStar je prázdné4.2. pro každou kombinaci Comb ∈ Star4.2.1. proveď specializaci přidáním kategorie A(v) ze Sel4.2.2. vyhodnoť kvalitu kombinace CombA = Comb ∧ A(v) pomocí funkceF(CombA)4.2.3. zařaď kombinaci CombA do NewStar4.3. pro každou kombinaci Comb ∈ NewStar4.3.1. pokud Comb je (signifikantně) lepší než Ant, přiřaď Ant := Comb4.4. pokud počet kombinací v NewStar překročí zadaný práh, vyhoď nejhorší kombinaci4.5. přiřaď Star := NewStarObr. 4 Funkce “najdi jedno pravidlo” v algoritmu CN4Hlavní cyklus algoritmu se liší podle toho, jestli vytváříme uspořádaná nebo neuspořádaná <strong>pravidla</strong>. Vpřípadě neuspořádaných pravidel systém hledá <strong>pravidla</strong> pro jednotlivé třídy odděleně. Pro každoutřídu se projde celá trénovací množina D TR s tím, že pozitivní příklady tvoří vždy příklady jedné třídy12 V původním algoritmu se používá termín selektor (selector) pro kategorii a termín komplex (complex) pro kombinaci.13 Oproti běžně používané spolehlivosti (platnosti) <strong>pravidla</strong> bere Laplaceova korekce do úvahy počet tříd T.5

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!