07.06.2015 Views

Untitled - Vitajte na stránkach www.einsty.hostujem.sk

Untitled - Vitajte na stránkach www.einsty.hostujem.sk

Untitled - Vitajte na stránkach www.einsty.hostujem.sk

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Budovanie<br />

DÁTOVÝCH SKLADOV<br />

I N F O W A R E<br />

BUSINESS INTELLIGENCE, DATAMINING, DATA WAREHOUSE<br />

¼UBOSLAV LACKO<br />

Týmto èlánkom vo¾ne <strong>na</strong>dviažeme <strong>na</strong> problematiku<br />

a<strong>na</strong>lýzy údajov a princípy budovania dátových<br />

<strong>sk</strong>ladov, ktorej sme sa zaèali venova v predošlom<br />

èísle. Hlavnou myšlienkou úvodného èísla bola<br />

metodika. Medzi HW a SW špecialistami koluje<br />

(èiastoène správny) názor, že návody a metodiky sa<br />

èítajú až vtedy, keï projekt nefunguje. Pri budovaní<br />

dátového <strong>sk</strong>ladu je filozofia konkrétneho projektu,<br />

prípadne aplikovanie osvedèenej metodiky<br />

èasto dôležitejšie a èasovo nároènejšie než samotný<br />

proces realizácie. Takisto boli vysvetlené základné<br />

rozdiely medzi produkènou databázou a dátovým<br />

<strong>sk</strong>ladom a rozdiel medzi relaènou a multidimenzionálnou<br />

štruktúrou údajov.<br />

ETT (ETL)<br />

S <strong>na</strong>sadením technológie business intelligence<br />

a data warehouse (BI/DW) obyèajne nezaèí<strong>na</strong>me <strong>na</strong><br />

zelenej lúke. Zvyèajne sa pred zavedením týchto<br />

technológií pre procesy rozhodovania používajú<br />

údaje zí<strong>sk</strong>avané z primárneho operatívneho systému<br />

OLTP (On-Line Transaction Processing), spracované<br />

do zostáv. Tieto zostavy sú potom (spravidla<br />

ruène alebo pomocou softvéru typu office) spracúvané<br />

do ma<strong>na</strong>žér<strong>sk</strong>ych podkladov <strong>na</strong> úèely rozhodovania.<br />

Údaje pre proces business intelligence a<br />

data warehouse teda pochádzajú z rôznych nehomogénnych<br />

zdrojov. Môžu to by údaje zo súborových<br />

databáz (Access, dBase...), údaje z databáz<br />

spravovaných niektorým databázovým serverom<br />

(Oracle, Informix, Microsoft SQL Server, Sybase,<br />

Interbase, Ingres...). Môžu to by údaje vyexportované<br />

nejakou databázovou platformou do tzv. flat<br />

file. Pod týmto záhadným pojmom sa <strong>sk</strong>rýva textový<br />

súbor, kde sú údaje oddelené nejakým odde-<br />

¾ovaèom (èiarka, medzera, tabulátor), <strong>na</strong>príklad:<br />

E,003715,4,153,09061987,0140000.00,"IRENE,<br />

HIRSH"<br />

,1,085.00,2,066.00,3,088.00,4,125.00<br />

P,003715,01152000,01162000,00101,0005000.00<br />

,0007000.00,150.00,200.00,133.00,075.00,055<br />

.00,066.00,077.00<br />

P,003715,02152000,02162000,00102,0003000.00<br />

,0008000.00,120.00,180.00,120.00,065.00,044<br />

.00,075.00,055.00<br />

Odde¾ovaè nie je nevyhnutná podmienka, môžeme<br />

použi aj delimitované súbory, kde vychádzame<br />

z pevnej štruktúry údajov:<br />

E003715415309061987014000000IRENE HIRSH<br />

108500206600308800412500<br />

P003715011520000116200000101000500000000700<br />

00015000200001330007500055000660007700<br />

P003715021520000216200000102000300000000800<br />

00012000180001200006500044000750005500<br />

Nástroje a postupy ETT (Extraction, Transformation,<br />

Transport), prípadne vyjadrené inou terminológiou<br />

ETL (Extraction, Transformation & Loading), sú preto<br />

ve¾mi dôležitou súèas ou každého projektu dátového<br />

<strong>sk</strong>ladu. Ich hlavnou úlohou je <strong>na</strong>plnenie dáto-<br />

Obr. 1 Import údajov z Flat File pomocou nástroja Oracle Warehouse Builder<br />

12/2001 PC REVUE 123

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!