5.3 RozhodovacÃ pravidla - Sorry

More documents

Recommendations

Info

pseudobayesovské skládání vah známé z expertního systému PROSPECTOR 201979]. Jsou-li w 1 , w 2 váhy dvou pravidel, spočítá se jejich kombinace w ⊕ jako:[Duda, Gasching,w 1 ⊕ w 2 =w 1 × w 2w 1 × w 2 + (1 - w 1 ) × (1 - w 2 )Při tvorbě báze pravidel se vlastně provádí postupné zpřesňování a zjemňování již existujících znalostí(knowledge refinement). Bázi pravidel vytváříme „shora dolů“ postupným přidáváním nových(speciálnějších) pravidel ve chvíli, kdy báze přestane být konsistentní s trénovacími datyreprezentovanými souborem všech implikací k zadanému cíli. Na počátku obsahuje báze pravidel tzv.prázdný vztah, který odpovídá rozdělení tříd v trénovacích datech. Do báze pravidel se pak postupnězařazují jen ty implikace, které nejsou odvoditelné z již získaných kratších pravidel.Vztah implikace Ant ⇒ Class považujeme v daných datech za odvoditelný z nějaké množiny KBpravidel se závěrem Class, jestliže v datech nezamítneme (na zvolené hladině významnosti)hypotézu, že platnost 21 této implikaceP(Class|Ant) =n(Ant ∧ Class)n(Ant)odpovídá tzv. naskládané váze w ⊕ (Ant) získané složením vah těch pravidel z KB, jejichž levá strana jepodkombinací kombinace Ant.Pro testování této hypotézy se používá χ 2 test dobré shody. Tento test je již zmíněn v kapitolevěnované statistice jakožto test umožňující testovat nezávislost dvou veličin na základě porovnáníočekávaných a skutečných četností. V podobném duchu je χ 2 test použit i zde.V případě, že Class definuje pouze pozitivní příklady (tedy Class = C(+)) uvažujeme test pro dvě třídy(tedy T=2). Do testu vstupují implikace Ant ⇒ Class (označme Ant ⇒ Class 1 ), a Ant ⇒ ¬Class(označme Ant ⇒ Class 2 ) a naskládané váhy w ⊕ (Ant) (označme w 1 ⊕ (Ant)) a 1- w ⊕ (Ant) (označmew 2 ⊕ (Ant)). Testem porovnáváme hodnoty skutečných četností n t (Ant) nalezených pro implikace Ant ⇒Class t v trénovacích datech a četností očekávaných, spočítaných jako n(Ant) × w t ⊕ (Ant), kde w t ⊕ (Ant)jsou váhy tříd Class t odvozené při konzultaci pro příklad popsaný kombinací Ant. Pro T tříd tedyspočítáme hodnotuTχ 2 =∑t=1(n t (Ant) − n(Ant) × w ⊕ t (Ant)) 2n(Ant) × w ⊕ t (Ant)=T=∑t=1n t (Ant) × n t (Ant)n(Ant) × w t ⊕ (Ant) − 2 ∑t=1T Tnt (Ant) + n(Ant) ∑ w ⊕ t (Ant) =t=120 Tato operace se použije s ohledem na syntaktické závislosti mezi pravidly tak, jak to navrhl Hájek [Hájek, 1985].21 Abychom se při výpočtu vyhnuli problémům s extremálními hodnotami platnosti implikace, provádíme následujícíkorekce:• je-li P(Class|Ant)=0, položíme P(Class|Ant)=0.5/n(Ant),• je-li P(Class|Ant)=1, položíme P(Class|Ant)=(n(Ant)-0.5)/n(Ant),Tato korekce má podobný význam jako Laplaceova korekce použitá v případě systému CN4; zabránit tomu, abypodmíněná pravděpodobnost závěru při platnosti předpokladu nabývala hodnoty 0 nebo 1.10
T=∑t=1n t (Ant) × n t (Ant)n(Ant) × w t ⊕ (Ant) − n(Ant) .Pokud je tato hodnota větší než hodnota rozdělení χ 2 (T-1)(α) s (T-1) stupni volnosti na zvolené hladiněvýznamnosti α, zamítneme hypotézu o shodě platnosti a naskládané váhy a přidáme danou implikaciAnt ⇒ Class do báze znalostí, protože její platnost nelze ze stávající báze odvodit.Váhu nového pravidla zvolíme tak, „aby to vyšlo“, tedy tak, abychom po konzultaci s novou báziznalostí (tj. s bázi včetně přidaného pravidla) pro příklad popsaný vstupní kombinací Ant odvodiliprávě platnost implikace Ant ⇒ Class. Pro nové pravidlo Ant ⇒ Class (w) musí platitVáhu w tedy spočítáme jakow ⊕ w ⊕ (Ant) = P(Class|Ant).w =P(Class|Ant)u1 + u , kde 1- P(Class|Ant)u =.⊕w (Ant)⊕1- w (Ant)Uvedený postup zařazování pravidla do báze si přiblížíme na následujícím příkladu. Řekněme, žeprávě testovanou implikací je 22 7a ∧ 11a ⇒ 1+,která má v datech čtyřpolní tabulku:Class ¬ClassAnt 11 14¬Ant 74 26Tedy platnost této implikace jeaa + b = 1111+14= 0.44. Předpokládejme dále, že v bázi pravidelexistují tři pravidla, aplikovatelná na kombinaci Ant:∅ ⇒ 1+ (0.6800)11a ⇒ 1+ (0.2720)7a ⇒ 1+ (0.3052)Pokud složíme váhy těchto pravidel pomocí operace ⊕, získáme tzv. naskládanou váhu w ⊕ (Ant)w ⊕ (Ant) = 0.6800 ⊕ 0.2720 ⊕ 0.3052 = 0.2586.Tato váha se (na základě χ 2 testu) statisticky významně liší od platnosti implikace 0.44. Proto do bázepravidel přidáme pravidlo7a ∧ 11a ⇒ 1+ (w),kde váha w je taková , že w ⊕ 0.2586 = 0.44, tedy w = 0.6926.22 Opět používáme úsporný zápis kategorií.11
Page 4 and 5: Pravidla nalezená algoritmem tedy
Page 6 and 7: a negativní příklady tvoří př
Page 9: 5.3.4 Algoritmus ESODÚlohy kombina
Page 13 and 14: platnosti tak, aby při práci s pr
Page 15 and 16: Při klasifikaci nového příkladu
Page 17 and 18: 51, 51, 99, 99). Průběh funkce F
Page 19 and 20: 5.3.8 Koncepty proměnlivé v čase
Page 21 and 22: Uvedený algoritmus byl schopen dob
Page 23 and 24: 39V případě hierarchie “na vst
Page 25: [Berka, 1997] Berka,P.: Towards kno

5.3 RozhodovacÃ­ pravidla - Sorry

Create successful ePaper yourself

Delete template?

Save as template?

5.3 RozhodovacÃ pravidla - Sorry