LISp-Miner: systém pro získávání znalostí z dat1 - ResearchGate

LISp-Miner: systém pro získávání znalostí z dat1 - ResearchGate LISp-Miner: systém pro získávání znalostí z dat1 - ResearchGate

09.07.2015 Views

Vztahy mezi antecedentem a sukcedentem nemusí odpovídat pouze implikacím, tak jakje tomu u asociačních pravidel v Agrawalově pojetí, tedy vztahům, kdy základnícharakteristika počítaná ze čtyřpolní tabulky má podobuaa + b.Dalším typem vztahu jsou tzv. dvojité implikace, charakterizované hodnotoua,a + b + cnebo ekvivalence, charakterizované hodnotoua + da + b + c + d.Vztah mezi antecedentem a sukcedentem můžeme hodnotit i na základě chí-kvadrátnebo Fischerova testu (seznam všech typů vztahů je uveden v dodatku).Při generování pravidla se nejprve vytvoří nějaký antecedent, k němu se pak naleznouvšechny sukcedenty tak, aby pravidlo vyhovovalo zadaným parametrům. Při vytvářeníkombinací se postupuje do hloubky, literály jsou přitom uspořádány podle abecedy(podle názvů atributů resp. názvů hodnot). Parametry zadávané uživatelem jsou:• seznam literálů, které se mohou vyskytnout v antecedentu, sukcedentu apodmínce,• maximální délka konjunkce tvořící antecedent, sukcedent a podmínku• typ vztahu a prahové (dolní) hodnoty kritérií pro hledané hypotézyPodívejme se nyní na naše ilustrační data. Zadání parametrů vidíme na obrázku 3, částvýpisu nalezených pravidel ukazuje tabulka 3, detail jednoho pravidla (vizualizacepříslušné kontingenční tabulky) je pak na obrázku 4.Považujeme za nutné zdůraznit, že pouze tato procedura vychází z klasických pracíspojených s metodou GUHA (jde o nejnovější implementaci GUHA proceduryASSOC). Všechny dále uvedené procedury jsou výsledkem práce kolektivu autorůz VŠE (Berka – návrh procedury KEX, Rauch – návrh ostatních procedur, Šimůnek –implementace).

Vztahy mezi antecedentem a sukcedentem nemusí odpovídat pouze implikacím, tak jakje tomu u asociačních pravidel v Agrawalově pojetí, tedy vztahům, kdy základnícharakteristika počítaná ze čtyřpolní tabulky má podobuaa + b.Dalším typem vztahu jsou tzv. dvojité implikace, charakterizované hodnotoua,a + b + cnebo ekvivalence, charakterizované hodnotoua + da + b + c + d.Vztah mezi antecedentem a sukcedentem můžeme hodnotit i na základě chí-kvadrátnebo Fischerova testu (seznam všech typů vztahů je uveden v dodatku).Při generování pravidla se nejprve vytvoří nějaký antecedent, k němu se pak naleznouvšechny sukcedenty tak, aby pravidlo vyhovovalo zadaným parametrům. Při vytvářeníkombinací se postupuje do hloubky, literály jsou přitom uspořádány podle abecedy(podle názvů atributů resp. názvů hodnot). Parametry zadávané uživatelem jsou:• seznam literálů, které se mohou vyskytnout v antecedentu, sukcedentu apodmínce,• maximální délka konjunkce tvořící antecedent, sukcedent a podmínku• typ vztahu a prahové (dolní) hodnoty kritérií <strong>pro</strong> hledané hypotézyPodívejme se nyní na naše ilustrační data. Zadání parametrů vidíme na obrázku 3, částvýpisu nalezených pravidel ukazuje tabulka 3, detail jednoho pravidla (vizualizacepříslušné kontingenční tabulky) je pak na obrázku 4.Považujeme za nutné zdůraznit, že pouze tato <strong>pro</strong>cedura vychází z klasických pracíspojených s metodou GUHA (jde o nejnovější implementaci GUHA <strong>pro</strong>ceduryASSOC). Všechny dále uvedené <strong>pro</strong>cedury jsou výsledkem práce kolektivu autorůz VŠE (Berka – návrh <strong>pro</strong>cedury KEX, Rauch – návrh ostatních <strong>pro</strong>cedur, Šimůnek –implementace).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!