Asociační pravidla - Sorry

Asociační pravidla - Sorry Asociační pravidla - Sorry

24.06.2015 Views

Dobývání znalostí z databází T6: asociační pravidla Hypotézy (pravidla) vyjadřují vztahy mezi cedenty, cedent je tvořen konjunkcí částečných cedentů a částečný cedent je konjunkce nebo disjunkce literálů. Literál je definován jako atribut(koeficient) v případě pozitivního literálu, resp. jako atribut(koeficient) v případě negativního literálu. Koeficient (seznam hodnot atributu) pak může být: podmnožina omezené délky např. literál město(Praha, Brno) obsahuje podmnožinu délky 2, interval omezené délky např. literály věk(nízký, střední), věk(střední), věk(střední, vysoký) obsahují interval délky 1 až 2, řez (interval, obsahující krajní hodnotu) omezené délky např. literály věk(nízký), věk(nízký, střední), věk(nízký, střední, vysoký) obsahují dolní řez délky 1 až 3. Z literálů jsou vytvářeny (generovány metodou „do hloubky“) konjunkce, které tvoří jednotlivé části nějakého pravidla (hypotézy). 16

Dobývání znalostí z databází T6: asociační pravidla Procedura 4FT generované a testované hypotézy mají podobu φ ≈ ψ / kde φ, ψ, (cedent) jsou cedenty, a ≈ je tzv. kvantifikátor vyjadřující typ vztahu mezi φ a ψ na množině příkladů, které splňují název Fundovaná implikace Dvojitá fundovaná implikace Fundovaná ekvivalence Fisherův kvantifikátor Chi-kvadrát kvantifikátor Značení parametry kdy platí p,Base 0 p 1 Base 0 p,Base 0 p 1 Base 0 p,Base 0 p 1 ,Base ,Base Base 0 0 0.5 Base 0 0 0.5 Base 0 a a + b p a Base a a + b + c p a Base a + d a + b + c + d p a Base min(r,k) r!s!k!l! n!i!(r-i)!(k-i)!(n-r-k-i)! i=a a Base ad bc a Base n(ad - bc) klrs např: konto(vysoké OR střední) AND NOT(nezaměstnaný(ano)) 0.9 úvěr(ano) / pohlaví(muž) 17

Dobývání znalostí z databází<br />

T6: asociační <strong>pravidla</strong><br />

Hypotézy (<strong>pravidla</strong>) vyjadřují vztahy mezi cedenty,<br />

cedent je tvořen konjunkcí částečných cedentů a<br />

částečný cedent je konjunkce nebo disjunkce literálů.<br />

Literál je definován jako<br />

atribut(koeficient) v případě pozitivního<br />

literálu, resp. jako<br />

atribut(koeficient) v případě negativního<br />

literálu.<br />

Koeficient (seznam hodnot atributu) pak může být:<br />

podmnožina omezené délky<br />

např. literál město(Praha, Brno) obsahuje<br />

podmnožinu délky 2,<br />

interval omezené délky<br />

např. literály věk(nízký, střední),<br />

věk(střední), věk(střední, vysoký) obsahují<br />

interval délky 1 až 2,<br />

řez (interval, obsahující krajní hodnotu) omezené<br />

délky<br />

např. literály věk(nízký), věk(nízký, střední),<br />

věk(nízký, střední, vysoký) obsahují dolní řez<br />

délky 1 až 3.<br />

Z literálů jsou vytvářeny (generovány metodou „do<br />

hloubky“) konjunkce, které tvoří jednotlivé části<br />

nějakého <strong>pravidla</strong> (hypotézy).<br />

16

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!