LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate
LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate
3.2 Procedura KL-MinerHypotézy generované a testované procedurou KL-Miner mají podobuR ~ C / γ.Tato procedura tedy nabízí kontingenční analýzu dvou vícehodnotových kategoriálníchatributů. Počítané charakteristiky vzájemného vztahu mezi oběma atributy vychází zestatistických kritérií (např. Chí-kvadrát nebo Kendallův test), nebo z kritérií z oblastiteorie informace (např. entropie nebo vzájemná informace). Zpracovávají se přitompouze příklady vyhovující podmínce γ. Pokud není podmínka γ definována, analyzuje secelá datová matice.V našem příkladu můžeme analyzovat celkem 20 kontingenčních tabulek, lze tedyzískat až 20 KL hypotéz. Vizualizaci jedné z nich vidíme na obrázku 5.Obrázek 5. Vizualizace kontingenční tabulky jedné konkrétní hypotézy procedury KL-Miner
3.3 Procedura CF-MinerHypotézy generované a testované procedurou CF-Miner mají podobu~C / γAnalyzuje se zde tedy histogram frekvencí kategorií atributu C u příkladů splňujícíchpodmínku γ. Cílem procedury je hledání okolností, za kterých jsou zajímavýmzpůsobem rozloženy frekvence jednotlivých kategorií některého kategoriálního atributu.Zajímavost je zde chápána jako to, že frekvence splňují požadavek definovaný vztahem~ . Příkladem vztahu ~ může být požadavek, aby všechny kategorie dosahovaly alespoňzadané četnosti a, či aby rozptyl hodnot byl menší než zadaná hodnota.Obrázek 6. Vizualizace kontingenční tabulky jedné konkrétní hypotézy procedury CF-Miner
- Page 5: Vztahy mezi antecedentem a sukceden
- Page 10 and 11: 3.4 Procedura SD4FT-MinerProcedura
- Page 12 and 13: 3.6 Procedura SDCF-MinerHypotézy g
- Page 14 and 15: Při klasifikaci nového příkladu
- Page 16 and 17: Chapman, P. a kol.: CRISP-DM 1.0 St
- Page 18: název parametry podmínka platnost
3.2 Procedura KL-<strong>Miner</strong>Hypotézy generované a testované <strong>pro</strong>cedurou KL-<strong>Miner</strong> mají podobuR ~ C / γ.Tato <strong>pro</strong>cedura tedy nabízí kontingenční analýzu dvou vícehodnotových kategoriálníchatributů. Počítané charakteristiky vzájemného vztahu mezi oběma atributy vychází zestatistických kritérií (např. Chí-kvadrát nebo Kendallův test), nebo z kritérií z oblastiteorie informace (např. entropie nebo vzájemná informace). Zpracovávají se přitompouze příklady vyhovující podmínce γ. Pokud není podmínka γ definována, analyzuje secelá datová matice.V našem příkladu můžeme analyzovat celkem 20 kontingenčních tabulek, lze tedyzískat až 20 KL hypotéz. Vizualizaci jedné z nich vidíme na obrázku 5.Obrázek 5. Vizualizace kontingenční tabulky jedné konkrétní hypotézy <strong>pro</strong>cedury KL-<strong>Miner</strong>