5.3 RozhodovacÃ pravidla - Sorry

More documents

Recommendations

Info

5.3.7 Numerické třídyNa rozdíl od rozhodovacích stromů, kde jsou algoritmy pro práci s numerickými třídami běžněpoužívány 31 , jsou algoritmy pro tvorbu rozhodovacích pravidel k numerickým třídám záležitostí spíševýzkumnou. K prvním takovým algoritmům patří R2 [Torgo,1995]. R2 hledá pravidla, která jsou„nejlepší“ vzhledem k střední absolutní odchylce mezi skutečnou hodnotou a hodnotou predikovanou.Algoritmus je omezen pouze na numerické atributy. Pravidla vytvářená systémem mají podobuIF Ant THEN avg Ant (y), neboIF Ant THEN ∑ i,Ant k i x i.kde předpoklad Ant je kombinace kategorií typu A(>x i ), resp. A(≤x i ) , závěr pravidla je v prvnímpřípadě konstanta (průměrná hodnota cílového atributu pro příklady splňující předpoklad), v druhémpřípadě lineární kombinace vstupních atributů (opět pro příklady splňující předpoklad).Podrobněji se opět podíváme na modifikaci systému CN4 [Bruha, Berka,1997]. V případěnumerických tříd hledá systém CN4 pravidla ve tvaruIF AntTHEN avg Ant (y), Mvar Ant (y).Předpoklad Ant je opět kombinace kategorií. Vzhledem k tomu, že C je nyní numerický atribut,objevuje se v závěru pravidla průměrná hodnota cíle počítaná pro příklady, které jsou pokrytypravidlem avg Ant (y) a rozptyl tohoto průměru Mvar Ant (y):kde var Ant2(y) =avg Ant (y) =1n(Ant)n(Ant)∑ yi , pro o i ∈ {Ant}i=1Mvar Ant (y) = var Ant 2 (y)n(Ant)1 n(Ant)n(Ant)-1 ∑ (yi - avg Ant (y)) 2 , pro o i ∈ {Ant}.i=1,Generování pravidel probíhá podobně jako ve verzi algoritmu pro diskrétní třídy; metodouspecializace komplexů (kombinací) přidáváním selektorů (hodnot atributů). Pravidla se vyhodnocujína základě porovnání směrodatné odchylky cílového atributu pro příklady pokryté pravidlem asměrodatné odchylky pro celá trénovací data.Při klasifikaci nových příkladů se hledá aplikovatelné pravidlo, průměrná hodnota cílového atribututohoto pravidla avg Ant (y) se pak považuje za hodnotu odvozenou pro uvažovaný příklad. Známe-lisprávnou hodnotu cíle pro tento příklad, můžeme posoudit přesnost provedené klasifikace tak, žezjistíme, zda tato správná hodnota leží v intervalu[avg Ant (y)-MvarAnt(y)3 , avg Ant (y)+MvarAnt(y)3 ].31 Jde v tomto případě o regresní stromy implementované např. v systému CART.18
5.3.8 Koncepty proměnlivé v časeVe většině úloh dobývání znalostí se předpokládá, že koncept (třída) jehož popis se máme naučit jestálý a s přibývajícím počtem trénovacích příkladů se nemění. Použité algoritmy pak obvykle pracujís celými daty naráz, v dávkovém režimu. Jsou ale úlohy, kdy se koncept v průběhu času dramatickyzmění. Příkladem může být předpovídání počasí, které silně závisí na roční době. Jasná obloha v létědává tušit vysoké teploty, jasná obloha v zimě znamená teploty nízké. Pak je užitečné se takovýmtozměnám konceptu přizpůsobit tak, že bereme do úvahy jen aktuální (čerstvá) data. V oblastistrojového učení se tento přístup nazývá inkrementální učení a zapomínání.Algoritmus takového typu byl implementován v systémech FLORA (např. [Widmer, Kubat, 1992]).Jádrem algoritmu je hledání hypotéz pokrývajících příklady dané třídy metodou generalizaceanalogicky jako u algoritmu AQ. Příklady jsou popsány hodnotami (kategoriálních) atributů ahypotézy mají podobu kombinací kategorií 32 . Kombinace jsou ukládány do tří množin: množina POSobsahuje hypotézy konzistentní s konceptem (kombinace pokrývá pouze pozitivní příklady), množinaNEG obsahuje hypotézy konzistentní s negací konceptu (kombinace pokrývá pouze negativnípříklady), a množina POT obsahuje potenciální hypotézy (kombinace které pokrývají pozitivní inegativní příklady). U každé hypotézy Comb se sleduje, kolik pozitivních resp. negativních příkladůpokrývá (n + (Comb), n - (Comb)). Inkrementalita algoritmu učení spočívá v tom, že množiny POS, NEG aPOT jsou aktualizovány po každém načtení nového příkladu. je-li např. nový pozitivní příklad pokrythypotézu z NEG, přesune se tato hypotéza do POT. Popis algoritmu je na Obr. 14.Algoritmus inkrementálního učení1. pro každý příklad o i z trénovací množiny1.1. je-li o i pozitivní potom1.1.1. pro každou Comb z POS pokud Comb pokrývá o i přiřaď n + (Comb) :=n + (Comb) + 11.1.2. pro každou Comb z POT pokud Comb pokrývá o i přiřaď n + (Comb) :=n + (Comb) + 11.1.3. pro každou Comb z NEG pokud Comb pokrývá o i přiřaď n + (Comb) := 1 apřesuň Comb do POT1.1.4. pokud v POS není žádná Comb která pokrývá o i , přidej do POS novoukombinaci CombN, která pokryje o i a nebude (kvůli sporu) v souladus hypotézami v POT a NEG, a přiřaď n + (CombN) := 11.2. je-li příklad o i negativní potom1.2.1. pro každou Comb z NEG pokud Comb pokrývá o i přiřaď n - (Comb) :=n(Comb) + 11.2.2. pro každou Comb z POT pokud Comb pokrývá o i přiřaď n - (Comb) :=nComb) + 11.2.3. pro každou Comb z POS pokud Comb pokrývá o i přiřaď n - (Comb):= 1 apřesuň Comb do POT1.2.4. pokud v NEG není žádná Comb která pokrývá o i , přidej do NEG novoukombinaci CombN, která pokryje o i a nebude (kvůli sporu) v souladus hypotézami v POT a POS, a přiřaď n - (CombN) := 1Obr. 14 Inkrementální učení v systému FLORA32 Každou kombinaci můžeme chápat jako předpoklad jednoho pravidla.19
Page 4 and 5: Pravidla nalezená algoritmem tedy
Page 6 and 7: a negativní příklady tvoří př
Page 9 and 10: 5.3.4 Algoritmus ESODÚlohy kombina
Page 11 and 12: T=∑t=1n t (Ant) × n t (Ant)n(Ant
Page 13 and 14: platnosti tak, aby při práci s pr
Page 15 and 16: Při klasifikaci nového příkladu
Page 17: 51, 51, 99, 99). Průběh funkce F
Page 21 and 22: Uvedený algoritmus byl schopen dob
Page 23 and 24: 39V případě hierarchie “na vst
Page 25: [Berka, 1997] Berka,P.: Towards kno

5.3 RozhodovacÃ­ pravidla - Sorry

Create successful ePaper yourself

Delete template?

Save as template?

5.3 RozhodovacÃ pravidla - Sorry