LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate
LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate
Vztahy mezi antecedentem a sukcedentem nemusí odpovídat pouze implikacím, tak jakje tomu u asociačních pravidel v Agrawalově pojetí, tedy vztahům, kdy základnícharakteristika počítaná ze čtyřpolní tabulky má podobuaa + b.Dalším typem vztahu jsou tzv. dvojité implikace, charakterizované hodnotoua,a + b + cnebo ekvivalence, charakterizované hodnotoua + da + b + c + d.Vztah mezi antecedentem a sukcedentem můžeme hodnotit i na základě chí-kvadrátnebo Fischerova testu (seznam všech typů vztahů je uveden v dodatku).Při generování pravidla se nejprve vytvoří nějaký antecedent, k němu se pak naleznouvšechny sukcedenty tak, aby pravidlo vyhovovalo zadaným parametrům. Při vytvářeníkombinací se postupuje do hloubky, literály jsou přitom uspořádány podle abecedy(podle názvů atributů resp. názvů hodnot). Parametry zadávané uživatelem jsou:• seznam literálů, které se mohou vyskytnout v antecedentu, sukcedentu apodmínce,• maximální délka konjunkce tvořící antecedent, sukcedent a podmínku• typ vztahu a prahové (dolní) hodnoty kritérií pro hledané hypotézyPodívejme se nyní na naše ilustrační data. Zadání parametrů vidíme na obrázku 3, částvýpisu nalezených pravidel ukazuje tabulka 3, detail jednoho pravidla (vizualizacepříslušné kontingenční tabulky) je pak na obrázku 4.Považujeme za nutné zdůraznit, že pouze tato procedura vychází z klasických pracíspojených s metodou GUHA (jde o nejnovější implementaci GUHA proceduryASSOC). Všechny dále uvedené procedury jsou výsledkem práce kolektivu autorůz VŠE (Berka – návrh procedury KEX, Rauch – návrh ostatních procedur, Šimůnek –implementace).
- Page 7 and 8: Tabulka 3. Hypotézy nalezené proc
- Page 9 and 10: 3.3 Procedura CF-MinerHypotézy gen
- Page 11 and 12: 3.5 Procedura SDKL-MinerHypotézy g
- Page 13 and 14: Báze znalostí je vytvářena v po
- Page 15 and 16: 4 PoděkováníSystém LISp-Miner j
- Page 17 and 18: Dodatek: seznam kvantifikátorů pr
Vztahy mezi antecedentem a sukcedentem nemusí odpovídat pouze implikacím, tak jakje tomu u asociačních pravidel v Agrawalově pojetí, tedy vztahům, kdy základnícharakteristika počítaná ze čtyřpolní tabulky má podobuaa + b.Dalším typem vztahu jsou tzv. dvojité implikace, charakterizované hodnotoua,a + b + cnebo ekvivalence, charakterizované hodnotoua + da + b + c + d.Vztah mezi antecedentem a sukcedentem můžeme hodnotit i na základě chí-kvadrátnebo Fischerova testu (seznam všech typů vztahů je uveden v dodatku).Při generování pravidla se nejprve vytvoří nějaký antecedent, k němu se pak naleznouvšechny sukcedenty tak, aby pravidlo vyhovovalo zadaným parametrům. Při vytvářeníkombinací se postupuje do hloubky, literály jsou přitom uspořádány podle abecedy(podle názvů atributů resp. názvů hodnot). Parametry zadávané uživatelem jsou:• seznam literálů, které se mohou vyskytnout v antecedentu, sukcedentu apodmínce,• maximální délka konjunkce tvořící antecedent, sukcedent a podmínku• typ vztahu a prahové (dolní) hodnoty kritérií <strong>pro</strong> hledané hypotézyPodívejme se nyní na naše ilustrační data. Zadání parametrů vidíme na obrázku 3, částvýpisu nalezených pravidel ukazuje tabulka 3, detail jednoho pravidla (vizualizacepříslušné kontingenční tabulky) je pak na obrázku 4.Považujeme za nutné zdůraznit, že pouze tato <strong>pro</strong>cedura vychází z klasických pracíspojených s metodou GUHA (jde o nejnovější implementaci GUHA <strong>pro</strong>ceduryASSOC). Všechny dále uvedené <strong>pro</strong>cedury jsou výsledkem práce kolektivu autorůz VŠE (Berka – návrh <strong>pro</strong>cedury KEX, Rauch – návrh ostatních <strong>pro</strong>cedur, Šimůnek –implementace).