07.06.2015 Views

Untitled - Vitajte na stránkach www.einsty.hostujem.sk

Untitled - Vitajte na stránkach www.einsty.hostujem.sk

Untitled - Vitajte na stránkach www.einsty.hostujem.sk

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

I N F O W A R E<br />

Obr. 6 Výsledok jednoduchého dataminingu – závislos doby trvania hovoru od druhu hovoru<br />

Obr. 7 Grafické znázornenie väzieb<br />

desiatok tisíc údajov je už slušný balík <strong>na</strong> „vydolovanie“<br />

súvislostí a predpovedanie budúceho<br />

trendu. Prikroème pre ilustráciu k jednoduchému<br />

dataminingu. Pomocou nástroja A<strong>na</strong>lysis<br />

Ma<strong>na</strong>ger (súèas dodávky MS SQL Servera 2000)<br />

vytvorme <strong>na</strong>d údajmi v databáze „mining model“<br />

s názvom <strong>na</strong>príklad Odhad1 (obr. 5).<br />

Vyz<strong>na</strong>èíme vstupné a predikovate¾né ståpce<br />

a môžeme spusti výpoèet. Po nieko¾kých minútach<br />

máme výsledok dataminingu k dispozícii<br />

v preh¾adnej forme. Už základ stromu nám odha¾uje<br />

súvislosti, <strong>na</strong> aké <strong>sk</strong>upiny telefónnych<br />

èísel (pozri predchádzajúcu tabu¾ku) ¾udia <strong>na</strong>jdlhšie<br />

telefonujú (obr. 6).<br />

Hustotu dát máme udávanú farebne – èím<br />

tmavšia farba, tým je v <strong>na</strong>šom prípade väèšia<br />

doba trvania hovoru. V <strong>sk</strong>upine 1 (miestne hovory)<br />

¾udia telefonujú podstatne dlhšie ako v <strong>sk</strong>upine<br />

4 (audiotexové hovory) alebo v <strong>sk</strong>upine 5 (medzinárodné<br />

hovory). V hlavnom okne vidíme len<br />

èas stromu, v pravej hornej èasti máme <strong>na</strong>vigaèné<br />

okno, pomocou ktorého sa môžeme orientova<br />

v celom strome a zachádza do väèších podrobností.<br />

Môžeme si zobrazi aj diagram väzieb<br />

medzi <strong>sk</strong>úmanými velièi<strong>na</strong>mi (obr. 7).<br />

Je len logické a ¾ahko pochopite¾né, že medzi<br />

dåžkou trvania hovoru a poètom impulzov je<br />

vzájomná súvislos . Obidva spomí<strong>na</strong>né parametre<br />

však závisia od druhu hovoru, v <strong>na</strong>šom<br />

príklade vyjadreného parametrom Skupi<strong>na</strong>.<br />

Môžeme <strong>sk</strong>úma aj iné súvislosti, <strong>na</strong>príklad ako<br />

sú zastúpené jednotlivé kategórie telefónnych<br />

hovorov v urèitých intervaloch poètov impulzov<br />

a podobne (obr. 8).<br />

V „dolovaní“ by sme, samozrejme, mohli pokraèova<br />

. Keby sme špecifikovali dni v týždni<br />

a presnejšie špecifikovali jednotlivé <strong>sk</strong>upiny<br />

telefónnych èísel, <strong>na</strong> ktoré sa volá, zistili by sme,<br />

v ktoré dni alebo v ktorú dobu sa <strong>na</strong>jviac telefonuje<br />

<strong>na</strong> mobilné telefóny alebo do zahranièia,<br />

ako sa èinia audiotexové firmy, kedy sú telefonické<br />

sú aže v televízii alebo rozhlase, mohli by<br />

sme štatisticky <strong>sk</strong>ontrolova , èi sa nepodvádza<br />

v hlasovacích sú ažiach typu SITO, mohli by<br />

sme... Ale z dôvodu zachovania „telekomunikaèného<br />

tajomstva“ to necháme <strong>na</strong> operátorov pevných<br />

a mobilných sietí.<br />

PRÍKLAD DATAMININGU<br />

Z UKÁŽKOVEJ DATABÁZY<br />

FOODMART<br />

Predchádzajúci príklad bol ve¾mi vïaèný z dôvodu<br />

jednoduchosti a názornosti, takže sa pokúsime<br />

predsa len ukáza aj a<strong>na</strong>lýzu údajov z cviènej<br />

databázy (v <strong>na</strong>šom prípade databázy Foodmart,<br />

Obr. 8 Skúmanie<br />

iných závislostí<br />

Obr. 9 Príklad dataminingu<br />

12/2001 PC REVUE 125

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!