LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate
LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate
LISp-Miner: systém pro zÃskávánà znalostà z dat1 - ResearchGate
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
3.4 Procedura SD4FT-<strong>Miner</strong>Procedura SD4FT-<strong>Miner</strong> je jednou ze tří tzv. „set differs from set“ <strong>pro</strong>cedur. Tyto<strong>pro</strong>cedury hledají hypotézy, jejichž numerické charakteristiky se liší na dvoupodmnožinách analyzovaných dat. Hypotézy generované a testované <strong>pro</strong>cedurouSD4FT-<strong>Miner</strong> mají podobuφ ≈ ψ / (α, β, γ)Hledáme tedy situace, kdy při splněné podmínce γ je vzájemný 4ft-vztah mezi φ a ψ namnožině α je jiný než na množině β. Tedy např. hledáme situace, kdy spolehlivostimplikace φ ⇒ ψ na množině příkladů splňujících α je jiná než spolehlivost implikaceφ ⇒ ψ na množině příkladů splňujících β:a1a2−a + b a + b1122≥ 0.2Příklad takovéto situace vidíme na obrázku 7. Ve skupině nezaměstnaných jespolehlivost implikace konto(střední) ⇒ příjem(nízký) rovna 1 zatímco ve skupinězaměstnaných je spolehlivost této implikace rovna 0.5.Obrázek 7. Vizualizace kontingenční tabulky jedné konkrétní hypotézy <strong>pro</strong>cedury SD4FT-<strong>Miner</strong>