12.07.2015 Views

5.3 Rozhodovací pravidla - Sorry

5.3 Rozhodovací pravidla - Sorry

5.3 Rozhodovací pravidla - Sorry

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>5.3</strong>.6 Numerické atributyVzhledem k tomu, že algoritmy pro tvorbu rozhodovacích pravidel pracují pouze s kategoriálními daty30 , je třeba numerické atributy diskretizovat. Opět se nabízejí dvě možnosti, diskretizace ve fázipředzpracování (tak je např. řešena diskretizace v systému KEX), nebo diskretizace během běhualgoritmu. Tento druhý způsob si přiblížíme na příkladu diskretizace v systému CN4 [Berka, Bruha,1998].Diskretizace je v systému CN4 prováděna při každém průchodu hlavním cyklem algoritmu pro tvorbupravidel. Každý atribut se diskretizuje samostatně. Cílem diskretizace je nalézt vhodné hodnoty x iatributu A, které tento atribut rozdělí na (polouzavřené) intervaly v i =(x i1 ,x i2 ]. To pak umožní vytvářetkategorie A(v i ). Vhodné horní (dolní) meze hledaných intervalů odpovídají nerostoucím (neklesajícím)lokálním maximům heuristické vyhodnocovací funkce F(x i ). Pro funkci F se používá buď negativníentropie, nebo Laplaceův odhad spolehlivosti (viz <strong>5.3</strong>.2). Roli antecedentu pro výpočet četnostífigurujících v příslušných vzorcích nyní hraje testovaný interval.Algoritmus SetBounds(a)1. nechť PoleMezí je prázdné2. pro každou hodnotu x i atributu A2.1. spočítej pro každou třídu Class t (t=1,..,T) četnosti n t (A(≤x i )) a n t (A(>x i ))2.2. spočítej hodnotu funkce F(A(≤x i )) (označ Flevá(x i )) pro případ, že x i jepotenciální horní mez, tedy že A(≤x i ) bude vytvořená kategorie2.3. spočítej hodnotu funkce F(A(>x i )) (označ Fpravá(x i )) pro případ, že x i jepotenciální dolní mez, tedy že A(>x i ) bude vytvořená kategorie3. pro každou hodnotu x i atributu A3.1. pokud Flevá(x i ) je nerostoucí lokální maximum, tedyFlevá(x i-1 ) ≤ Flevá(x i ) > Flevá(x i+1 )3.1.1. přidej kategorii A(≤ x i ) do PoleMezí v pořadí podle hodnoty Flevá(x i )3.2. pokud Fpravá(x i ) je neklesající lokální maximum, tedyFpravá(x i-1 ) < Fpravá(x i ) ≥ Fpravá(x i+1 )3.2.1 přidej kategorii A(>x i ) do PoleMezí v pořadí podle hodnoty < Fpravá(x i )4. pro každou dvojici hodnot x i1 , x i2 z PoleMezí4.1. spočítej pro každou třídu Class t (t=1,..,T) četnosti n t (A(v)), kde v=(x i1 ,x i2 ]4.2. spočítej hodnotu funkce F(A(v))4.3. přidej kategorii A(v), kde v=(x i1 ,x i2 ] do PoleMezí v pořadí podle hodnoty F(v)Obr. 12 Diskretizace v algoritmu CN4Algoritmus diskretizace je uveden na Obr. 12. Diskretizační procedura postupně bere do úvahyvšechny hodnoty v i jako potenciální meze a počítá pro ně hodnotu funkce F. Pak hledá lokální maxima(vhodné meze). V posledním kroku se z mezí vytvářejí intervaly.Vezměme si pro ilustraci tohoto algoritmu situaci, kdy máme 7 pozitivních příkladů (s hodnotaminumerického atributu 45, 46, 50, 50, 100, 100, 120) a 5 negativních příkladů (s hodnotami atributu 51,30 Při hodnocení pravidel nás zajímají četnosti.16

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!