pseudobayesovské skládání vah známé z expertního systému PROSPECTOR 201979]. Jsou-li w 1 , w 2 váhy dvou pravidel, spočítá se jejich kombinace w ⊕ jako:[Duda, Gasching,w 1 ⊕ w 2 =w 1 × w 2w 1 × w 2 + (1 - w 1 ) × (1 - w 2 )Při tvorbě báze pravidel se vlastně provádí postupné zpřesňování a zjemňování již existujících znalostí(knowledge refinement). Bázi pravidel vytváříme „shora dolů“ postupným přidáváním nových(speciálnějších) pravidel ve chvíli, kdy báze přestane být konsistentní s trénovacími datyreprezentovanými souborem všech implikací k zadanému cíli. Na počátku obsahuje báze pravidel tzv.prázdný vztah, který odpovídá rozdělení tříd v trénovacích datech. Do báze pravidel se pak postupnězařazují jen ty implikace, které nejsou odvoditelné z již získaných kratších pravidel.Vztah implikace Ant ⇒ Class považujeme v daných datech za odvoditelný z nějaké množiny KBpravidel se závěrem Class, jestliže v datech nezamítneme (na zvolené hladině významnosti)hypotézu, že platnost 21 této implikaceP(Class|Ant) =n(Ant ∧ Class)n(Ant)odpovídá tzv. naskládané váze w ⊕ (Ant) získané složením vah těch pravidel z KB, jejichž levá strana jepodkombinací kombinace Ant.Pro testování této hypotézy se používá χ 2 test dobré shody. Tento test je již zmíněn v kapitolevěnované statistice jakožto test umožňující testovat nezávislost dvou veličin na základě porovnáníočekávaných a skutečných četností. V podobném duchu je χ 2 test použit i zde.V případě, že Class definuje pouze pozitivní příklady (tedy Class = C(+)) uvažujeme test pro dvě třídy(tedy T=2). Do testu vstupují implikace Ant ⇒ Class (označme Ant ⇒ Class 1 ), a Ant ⇒ ¬Class(označme Ant ⇒ Class 2 ) a naskládané váhy w ⊕ (Ant) (označme w 1 ⊕ (Ant)) a 1- w ⊕ (Ant) (označmew 2 ⊕ (Ant)). Testem porovnáváme hodnoty skutečných četností n t (Ant) nalezených pro implikace Ant ⇒Class t v trénovacích datech a četností očekávaných, spočítaných jako n(Ant) × w t ⊕ (Ant), kde w t ⊕ (Ant)jsou váhy tříd Class t odvozené při konzultaci pro příklad popsaný kombinací Ant. Pro T tříd tedyspočítáme hodnotuTχ 2 =∑t=1(n t (Ant) − n(Ant) × w ⊕ t (Ant)) 2n(Ant) × w ⊕ t (Ant)=T=∑t=1n t (Ant) × n t (Ant)n(Ant) × w t ⊕ (Ant) − 2 ∑t=1T Tnt (Ant) + n(Ant) ∑ w ⊕ t (Ant) =t=120 Tato operace se použije s ohledem na syntaktické závislosti mezi pravidly tak, jak to navrhl Hájek [Hájek, 1985].21 Abychom se při výpočtu vyhnuli problémům s extremálními hodnotami platnosti implikace, provádíme následujícíkorekce:• je-li P(Class|Ant)=0, položíme P(Class|Ant)=0.5/n(Ant),• je-li P(Class|Ant)=1, položíme P(Class|Ant)=(n(Ant)-0.5)/n(Ant),Tato korekce má podobný význam jako Laplaceova korekce použitá v případě systému CN4; zabránit tomu, abypodmíněná pravděpodobnost závěru při platnosti předpokladu nabývala hodnoty 0 nebo 1.10
T=∑t=1n t (Ant) × n t (Ant)n(Ant) × w t ⊕ (Ant) − n(Ant) .Pokud je tato hodnota větší než hodnota rozdělení χ 2 (T-1)(α) s (T-1) stupni volnosti na zvolené hladiněvýznamnosti α, zamítneme hypotézu o shodě platnosti a naskládané váhy a přidáme danou implikaciAnt ⇒ Class do báze znalostí, protože její platnost nelze ze stávající báze odvodit.Váhu nového <strong>pravidla</strong> zvolíme tak, „aby to vyšlo“, tedy tak, abychom po konzultaci s novou báziznalostí (tj. s bázi včetně přidaného <strong>pravidla</strong>) pro příklad popsaný vstupní kombinací Ant odvodiliprávě platnost implikace Ant ⇒ Class. Pro nové pravidlo Ant ⇒ Class (w) musí platitVáhu w tedy spočítáme jakow ⊕ w ⊕ (Ant) = P(Class|Ant).w =P(Class|Ant)u1 + u , kde 1- P(Class|Ant)u =.⊕w (Ant)⊕1- w (Ant)Uvedený postup zařazování <strong>pravidla</strong> do báze si přiblížíme na následujícím příkladu. Řekněme, žeprávě testovanou implikací je 22 7a ∧ 11a ⇒ 1+,která má v datech čtyřpolní tabulku:Class ¬ClassAnt 11 14¬Ant 74 26Tedy platnost této implikace jeaa + b = 1111+14= 0.44. Předpokládejme dále, že v bázi pravidelexistují tři <strong>pravidla</strong>, aplikovatelná na kombinaci Ant:∅ ⇒ 1+ (0.6800)11a ⇒ 1+ (0.2720)7a ⇒ 1+ (0.3052)Pokud složíme váhy těchto pravidel pomocí operace ⊕, získáme tzv. naskládanou váhu w ⊕ (Ant)w ⊕ (Ant) = 0.6800 ⊕ 0.2720 ⊕ 0.3052 = 0.2586.Tato váha se (na základě χ 2 testu) statisticky významně liší od platnosti implikace 0.44. Proto do bázepravidel přidáme pravidlo7a ∧ 11a ⇒ 1+ (w),kde váha w je taková , že w ⊕ 0.2586 = 0.44, tedy w = 0.6926.22 Opět používáme úsporný zápis kategorií.11