12.07.2015 Views

5.3 Rozhodovací pravidla - Sorry

5.3 Rozhodovací pravidla - Sorry

5.3 Rozhodovací pravidla - Sorry

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

pseudobayesovské skládání vah známé z expertního systému PROSPECTOR 201979]. Jsou-li w 1 , w 2 váhy dvou pravidel, spočítá se jejich kombinace w ⊕ jako:[Duda, Gasching,w 1 ⊕ w 2 =w 1 × w 2w 1 × w 2 + (1 - w 1 ) × (1 - w 2 )Při tvorbě báze pravidel se vlastně provádí postupné zpřesňování a zjemňování již existujících znalostí(knowledge refinement). Bázi pravidel vytváříme „shora dolů“ postupným přidáváním nových(speciálnějších) pravidel ve chvíli, kdy báze přestane být konsistentní s trénovacími datyreprezentovanými souborem všech implikací k zadanému cíli. Na počátku obsahuje báze pravidel tzv.prázdný vztah, který odpovídá rozdělení tříd v trénovacích datech. Do báze pravidel se pak postupnězařazují jen ty implikace, které nejsou odvoditelné z již získaných kratších pravidel.Vztah implikace Ant ⇒ Class považujeme v daných datech za odvoditelný z nějaké množiny KBpravidel se závěrem Class, jestliže v datech nezamítneme (na zvolené hladině významnosti)hypotézu, že platnost 21 této implikaceP(Class|Ant) =n(Ant ∧ Class)n(Ant)odpovídá tzv. naskládané váze w ⊕ (Ant) získané složením vah těch pravidel z KB, jejichž levá strana jepodkombinací kombinace Ant.Pro testování této hypotézy se používá χ 2 test dobré shody. Tento test je již zmíněn v kapitolevěnované statistice jakožto test umožňující testovat nezávislost dvou veličin na základě porovnáníočekávaných a skutečných četností. V podobném duchu je χ 2 test použit i zde.V případě, že Class definuje pouze pozitivní příklady (tedy Class = C(+)) uvažujeme test pro dvě třídy(tedy T=2). Do testu vstupují implikace Ant ⇒ Class (označme Ant ⇒ Class 1 ), a Ant ⇒ ¬Class(označme Ant ⇒ Class 2 ) a naskládané váhy w ⊕ (Ant) (označme w 1 ⊕ (Ant)) a 1- w ⊕ (Ant) (označmew 2 ⊕ (Ant)). Testem porovnáváme hodnoty skutečných četností n t (Ant) nalezených pro implikace Ant ⇒Class t v trénovacích datech a četností očekávaných, spočítaných jako n(Ant) × w t ⊕ (Ant), kde w t ⊕ (Ant)jsou váhy tříd Class t odvozené při konzultaci pro příklad popsaný kombinací Ant. Pro T tříd tedyspočítáme hodnotuTχ 2 =∑t=1(n t (Ant) − n(Ant) × w ⊕ t (Ant)) 2n(Ant) × w ⊕ t (Ant)=T=∑t=1n t (Ant) × n t (Ant)n(Ant) × w t ⊕ (Ant) − 2 ∑t=1T Tnt (Ant) + n(Ant) ∑ w ⊕ t (Ant) =t=120 Tato operace se použije s ohledem na syntaktické závislosti mezi pravidly tak, jak to navrhl Hájek [Hájek, 1985].21 Abychom se při výpočtu vyhnuli problémům s extremálními hodnotami platnosti implikace, provádíme následujícíkorekce:• je-li P(Class|Ant)=0, položíme P(Class|Ant)=0.5/n(Ant),• je-li P(Class|Ant)=1, položíme P(Class|Ant)=(n(Ant)-0.5)/n(Ant),Tato korekce má podobný význam jako Laplaceova korekce použitá v případě systému CN4; zabránit tomu, abypodmíněná pravděpodobnost závěru při platnosti předpokladu nabývala hodnoty 0 nebo 1.10

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!