12.07.2015 Views

5.3 Rozhodovací pravidla - Sorry

5.3 Rozhodovací pravidla - Sorry

5.3 Rozhodovací pravidla - Sorry

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>5.3</strong>.7 Numerické třídyNa rozdíl od rozhodovacích stromů, kde jsou algoritmy pro práci s numerickými třídami běžněpoužívány 31 , jsou algoritmy pro tvorbu rozhodovacích pravidel k numerickým třídám záležitostí spíševýzkumnou. K prvním takovým algoritmům patří R2 [Torgo,1995]. R2 hledá <strong>pravidla</strong>, která jsou„nejlepší“ vzhledem k střední absolutní odchylce mezi skutečnou hodnotou a hodnotou predikovanou.Algoritmus je omezen pouze na numerické atributy. Pravidla vytvářená systémem mají podobuIF Ant THEN avg Ant (y), neboIF Ant THEN ∑ i,Ant k i x i.kde předpoklad Ant je kombinace kategorií typu A(>x i ), resp. A(≤x i ) , závěr <strong>pravidla</strong> je v prvnímpřípadě konstanta (průměrná hodnota cílového atributu pro příklady splňující předpoklad), v druhémpřípadě lineární kombinace vstupních atributů (opět pro příklady splňující předpoklad).Podrobněji se opět podíváme na modifikaci systému CN4 [Bruha, Berka,1997]. V případěnumerických tříd hledá systém CN4 <strong>pravidla</strong> ve tvaruIF AntTHEN avg Ant (y), Mvar Ant (y).Předpoklad Ant je opět kombinace kategorií. Vzhledem k tomu, že C je nyní numerický atribut,objevuje se v závěru <strong>pravidla</strong> průměrná hodnota cíle počítaná pro příklady, které jsou pokrytypravidlem avg Ant (y) a rozptyl tohoto průměru Mvar Ant (y):kde var Ant2(y) =avg Ant (y) =1n(Ant)n(Ant)∑ yi , pro o i ∈ {Ant}i=1Mvar Ant (y) = var Ant 2 (y)n(Ant)1 n(Ant)n(Ant)-1 ∑ (yi - avg Ant (y)) 2 , pro o i ∈ {Ant}.i=1,Generování pravidel probíhá podobně jako ve verzi algoritmu pro diskrétní třídy; metodouspecializace komplexů (kombinací) přidáváním selektorů (hodnot atributů). Pravidla se vyhodnocujína základě porovnání směrodatné odchylky cílového atributu pro příklady pokryté pravidlem asměrodatné odchylky pro celá trénovací data.Při klasifikaci nových příkladů se hledá aplikovatelné pravidlo, průměrná hodnota cílového atribututohoto <strong>pravidla</strong> avg Ant (y) se pak považuje za hodnotu odvozenou pro uvažovaný příklad. Známe-lisprávnou hodnotu cíle pro tento příklad, můžeme posoudit přesnost provedené klasifikace tak, žezjistíme, zda tato správná hodnota leží v intervalu[avg Ant (y)-MvarAnt(y)3 , avg Ant (y)+MvarAnt(y)3 ].31 Jde v tomto případě o regresní stromy implementované např. v systému CART.18

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!