Untitled - Vitajte na stránkach www.einsty.hostujem.sk
Untitled - Vitajte na stránkach www.einsty.hostujem.sk
Untitled - Vitajte na stránkach www.einsty.hostujem.sk
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Budovanie<br />
DÁTOVÝCH SKLADOV<br />
I N F O W A R E<br />
BUSINESS INTELLIGENCE, DATAMINING, DATA WAREHOUSE<br />
¼UBOSLAV LACKO<br />
Týmto èlánkom vo¾ne <strong>na</strong>dviažeme <strong>na</strong> problematiku<br />
a<strong>na</strong>lýzy údajov a princípy budovania dátových<br />
<strong>sk</strong>ladov, ktorej sme sa zaèali venova v predošlom<br />
èísle. Hlavnou myšlienkou úvodného èísla bola<br />
metodika. Medzi HW a SW špecialistami koluje<br />
(èiastoène správny) názor, že návody a metodiky sa<br />
èítajú až vtedy, keï projekt nefunguje. Pri budovaní<br />
dátového <strong>sk</strong>ladu je filozofia konkrétneho projektu,<br />
prípadne aplikovanie osvedèenej metodiky<br />
èasto dôležitejšie a èasovo nároènejšie než samotný<br />
proces realizácie. Takisto boli vysvetlené základné<br />
rozdiely medzi produkènou databázou a dátovým<br />
<strong>sk</strong>ladom a rozdiel medzi relaènou a multidimenzionálnou<br />
štruktúrou údajov.<br />
ETT (ETL)<br />
S <strong>na</strong>sadením technológie business intelligence<br />
a data warehouse (BI/DW) obyèajne nezaèí<strong>na</strong>me <strong>na</strong><br />
zelenej lúke. Zvyèajne sa pred zavedením týchto<br />
technológií pre procesy rozhodovania používajú<br />
údaje zí<strong>sk</strong>avané z primárneho operatívneho systému<br />
OLTP (On-Line Transaction Processing), spracované<br />
do zostáv. Tieto zostavy sú potom (spravidla<br />
ruène alebo pomocou softvéru typu office) spracúvané<br />
do ma<strong>na</strong>žér<strong>sk</strong>ych podkladov <strong>na</strong> úèely rozhodovania.<br />
Údaje pre proces business intelligence a<br />
data warehouse teda pochádzajú z rôznych nehomogénnych<br />
zdrojov. Môžu to by údaje zo súborových<br />
databáz (Access, dBase...), údaje z databáz<br />
spravovaných niektorým databázovým serverom<br />
(Oracle, Informix, Microsoft SQL Server, Sybase,<br />
Interbase, Ingres...). Môžu to by údaje vyexportované<br />
nejakou databázovou platformou do tzv. flat<br />
file. Pod týmto záhadným pojmom sa <strong>sk</strong>rýva textový<br />
súbor, kde sú údaje oddelené nejakým odde-<br />
¾ovaèom (èiarka, medzera, tabulátor), <strong>na</strong>príklad:<br />
E,003715,4,153,09061987,0140000.00,"IRENE,<br />
HIRSH"<br />
,1,085.00,2,066.00,3,088.00,4,125.00<br />
P,003715,01152000,01162000,00101,0005000.00<br />
,0007000.00,150.00,200.00,133.00,075.00,055<br />
.00,066.00,077.00<br />
P,003715,02152000,02162000,00102,0003000.00<br />
,0008000.00,120.00,180.00,120.00,065.00,044<br />
.00,075.00,055.00<br />
Odde¾ovaè nie je nevyhnutná podmienka, môžeme<br />
použi aj delimitované súbory, kde vychádzame<br />
z pevnej štruktúry údajov:<br />
E003715415309061987014000000IRENE HIRSH<br />
108500206600308800412500<br />
P003715011520000116200000101000500000000700<br />
00015000200001330007500055000660007700<br />
P003715021520000216200000102000300000000800<br />
00012000180001200006500044000750005500<br />
Nástroje a postupy ETT (Extraction, Transformation,<br />
Transport), prípadne vyjadrené inou terminológiou<br />
ETL (Extraction, Transformation & Loading), sú preto<br />
ve¾mi dôležitou súèas ou každého projektu dátového<br />
<strong>sk</strong>ladu. Ich hlavnou úlohou je <strong>na</strong>plnenie dáto-<br />
Obr. 1 Import údajov z Flat File pomocou nástroja Oracle Warehouse Builder<br />
12/2001 PC REVUE 123