LISp-Miner: systém pro získávání znalostí z dat1 - ResearchGate

LISp-Miner: systém pro získávání znalostí z dat1 - ResearchGate LISp-Miner: systém pro získávání znalostí z dat1 - ResearchGate

09.07.2015 Views

3.2 Procedura KL-MinerHypotézy generované a testované procedurou KL-Miner mají podobuR ~ C / γ.Tato procedura tedy nabízí kontingenční analýzu dvou vícehodnotových kategoriálníchatributů. Počítané charakteristiky vzájemného vztahu mezi oběma atributy vychází zestatistických kritérií (např. Chí-kvadrát nebo Kendallův test), nebo z kritérií z oblastiteorie informace (např. entropie nebo vzájemná informace). Zpracovávají se přitompouze příklady vyhovující podmínce γ. Pokud není podmínka γ definována, analyzuje secelá datová matice.V našem příkladu můžeme analyzovat celkem 20 kontingenčních tabulek, lze tedyzískat až 20 KL hypotéz. Vizualizaci jedné z nich vidíme na obrázku 5.Obrázek 5. Vizualizace kontingenční tabulky jedné konkrétní hypotézy procedury KL-Miner

3.3 Procedura CF-MinerHypotézy generované a testované procedurou CF-Miner mají podobu~C / γAnalyzuje se zde tedy histogram frekvencí kategorií atributu C u příkladů splňujícíchpodmínku γ. Cílem procedury je hledání okolností, za kterých jsou zajímavýmzpůsobem rozloženy frekvence jednotlivých kategorií některého kategoriálního atributu.Zajímavost je zde chápána jako to, že frekvence splňují požadavek definovaný vztahem~ . Příkladem vztahu ~ může být požadavek, aby všechny kategorie dosahovaly alespoňzadané četnosti a, či aby rozptyl hodnot byl menší než zadaná hodnota.Obrázek 6. Vizualizace kontingenční tabulky jedné konkrétní hypotézy procedury CF-Miner

3.2 Procedura KL-<strong>Miner</strong>Hypotézy generované a testované <strong>pro</strong>cedurou KL-<strong>Miner</strong> mají podobuR ~ C / γ.Tato <strong>pro</strong>cedura tedy nabízí kontingenční analýzu dvou vícehodnotových kategoriálníchatributů. Počítané charakteristiky vzájemného vztahu mezi oběma atributy vychází zestatistických kritérií (např. Chí-kvadrát nebo Kendallův test), nebo z kritérií z oblastiteorie informace (např. entropie nebo vzájemná informace). Zpracovávají se přitompouze příklady vyhovující podmínce γ. Pokud není podmínka γ definována, analyzuje secelá datová matice.V našem příkladu můžeme analyzovat celkem 20 kontingenčních tabulek, lze tedyzískat až 20 KL hypotéz. Vizualizaci jedné z nich vidíme na obrázku 5.Obrázek 5. Vizualizace kontingenční tabulky jedné konkrétní hypotézy <strong>pro</strong>cedury KL-<strong>Miner</strong>

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!