Untitled - Vitajte na stránkach www.einsty.hostujem.sk
Untitled - Vitajte na stránkach www.einsty.hostujem.sk
Untitled - Vitajte na stránkach www.einsty.hostujem.sk
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
I N F O W A R E<br />
Obr. 6 Výsledok jednoduchého dataminingu – závislos doby trvania hovoru od druhu hovoru<br />
Obr. 7 Grafické znázornenie väzieb<br />
desiatok tisíc údajov je už slušný balík <strong>na</strong> „vydolovanie“<br />
súvislostí a predpovedanie budúceho<br />
trendu. Prikroème pre ilustráciu k jednoduchému<br />
dataminingu. Pomocou nástroja A<strong>na</strong>lysis<br />
Ma<strong>na</strong>ger (súèas dodávky MS SQL Servera 2000)<br />
vytvorme <strong>na</strong>d údajmi v databáze „mining model“<br />
s názvom <strong>na</strong>príklad Odhad1 (obr. 5).<br />
Vyz<strong>na</strong>èíme vstupné a predikovate¾né ståpce<br />
a môžeme spusti výpoèet. Po nieko¾kých minútach<br />
máme výsledok dataminingu k dispozícii<br />
v preh¾adnej forme. Už základ stromu nám odha¾uje<br />
súvislosti, <strong>na</strong> aké <strong>sk</strong>upiny telefónnych<br />
èísel (pozri predchádzajúcu tabu¾ku) ¾udia <strong>na</strong>jdlhšie<br />
telefonujú (obr. 6).<br />
Hustotu dát máme udávanú farebne – èím<br />
tmavšia farba, tým je v <strong>na</strong>šom prípade väèšia<br />
doba trvania hovoru. V <strong>sk</strong>upine 1 (miestne hovory)<br />
¾udia telefonujú podstatne dlhšie ako v <strong>sk</strong>upine<br />
4 (audiotexové hovory) alebo v <strong>sk</strong>upine 5 (medzinárodné<br />
hovory). V hlavnom okne vidíme len<br />
èas stromu, v pravej hornej èasti máme <strong>na</strong>vigaèné<br />
okno, pomocou ktorého sa môžeme orientova<br />
v celom strome a zachádza do väèších podrobností.<br />
Môžeme si zobrazi aj diagram väzieb<br />
medzi <strong>sk</strong>úmanými velièi<strong>na</strong>mi (obr. 7).<br />
Je len logické a ¾ahko pochopite¾né, že medzi<br />
dåžkou trvania hovoru a poètom impulzov je<br />
vzájomná súvislos . Obidva spomí<strong>na</strong>né parametre<br />
však závisia od druhu hovoru, v <strong>na</strong>šom<br />
príklade vyjadreného parametrom Skupi<strong>na</strong>.<br />
Môžeme <strong>sk</strong>úma aj iné súvislosti, <strong>na</strong>príklad ako<br />
sú zastúpené jednotlivé kategórie telefónnych<br />
hovorov v urèitých intervaloch poètov impulzov<br />
a podobne (obr. 8).<br />
V „dolovaní“ by sme, samozrejme, mohli pokraèova<br />
. Keby sme špecifikovali dni v týždni<br />
a presnejšie špecifikovali jednotlivé <strong>sk</strong>upiny<br />
telefónnych èísel, <strong>na</strong> ktoré sa volá, zistili by sme,<br />
v ktoré dni alebo v ktorú dobu sa <strong>na</strong>jviac telefonuje<br />
<strong>na</strong> mobilné telefóny alebo do zahranièia,<br />
ako sa èinia audiotexové firmy, kedy sú telefonické<br />
sú aže v televízii alebo rozhlase, mohli by<br />
sme štatisticky <strong>sk</strong>ontrolova , èi sa nepodvádza<br />
v hlasovacích sú ažiach typu SITO, mohli by<br />
sme... Ale z dôvodu zachovania „telekomunikaèného<br />
tajomstva“ to necháme <strong>na</strong> operátorov pevných<br />
a mobilných sietí.<br />
PRÍKLAD DATAMININGU<br />
Z UKÁŽKOVEJ DATABÁZY<br />
FOODMART<br />
Predchádzajúci príklad bol ve¾mi vïaèný z dôvodu<br />
jednoduchosti a názornosti, takže sa pokúsime<br />
predsa len ukáza aj a<strong>na</strong>lýzu údajov z cviènej<br />
databázy (v <strong>na</strong>šom prípade databázy Foodmart,<br />
Obr. 8 Skúmanie<br />
iných závislostí<br />
Obr. 9 Príklad dataminingu<br />
12/2001 PC REVUE 125