03.05.2013 Views

A független komponens analízis és empirikus vizsgálata*

A független komponens analízis és empirikus vizsgálata*

A független komponens analízis és empirikus vizsgálata*

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

A <strong>független</strong> <strong>komponens</strong> <strong>analízis</strong> <strong>és</strong> <strong>empirikus</strong> vizsgálata<br />

2. Empirikus vizsgálat<br />

A gyakorlati alkalmazások elemz<strong>és</strong>e során először azt mutatjuk be, hogy az előálló<br />

<strong>komponens</strong>ek valóban <strong>független</strong>ek. Ezt követően az ICA <strong>és</strong> a PCA összehasonlítására<br />

kerül sor, annak érdekében, hogy az elméleti megfontolások szemléltet<strong>és</strong>e mellett<br />

rávilágítsunk a két módszer közötti lényeges gyakorlati különbségekre is. Végezetül<br />

az ICA néhány gyakorlati sajátosságát elemezzük szimulált adatok segítségével<br />

három dimenzió – a minta elemszáma, a <strong>komponens</strong>szám <strong>és</strong> az adatok eloszlása –<br />

alapján.<br />

Az ICA egyik leggyakoribb implementálási módja a fixpont-megközelít<strong>és</strong>en alapuló<br />

FastICA-algoritmus (Hyvärinen–Oja [2000]). Az algoritmus fehérített adatokon<br />

T<br />

C = E f w x költségfügg-<br />

dolgozik, <strong>és</strong> feltételes optimalizációt végez. A FastICA ( )<br />

vény minimumát keresi<br />

Statisztikai Szemle, 91. évfolyam 3. szám<br />

( )<br />

269<br />

2 11<br />

w =1 feltétel mellett, ahol f kev<strong>és</strong> kivételtől eltekintve<br />

tetszőleges nemkvadratikus függvény lehet, deriváltját g-vel jelöljük. Az algoritmus<br />

alapváltozata külön-külön határozza meg a <strong>független</strong> <strong>komponens</strong>eket, lép<strong>és</strong>ei egy<br />

<strong>független</strong> <strong>komponens</strong> meghatározásához (a korábbi jelöl<strong>és</strong>eket használva):<br />

1. Kezdeti – véletlen – w 0 súlyvektor kiválasztása.<br />

2. + 1 ( )<br />

T T<br />

( g ) − ( g′<br />

)<br />

E E<br />

w = x w x ( w x) w .<br />

k k k k<br />

wk<br />

+ 1<br />

3. wk<br />

+ 1 = .<br />

wk<br />

+ 1<br />

4. Ismétl<strong>és</strong> 2-től a konvergencia elér<strong>és</strong>éig. A kiszámított <strong>független</strong><br />

T<br />

<strong>komponens</strong> ekkor w x .<br />

k<br />

A várható értékeket a számítások során az algoritmus mintaátlaggal becsli, így<br />

teljesítménye szempontjából az idősorok elemszáma fontos tényező. További fontos<br />

tulajdonsága a módszernek, hogy f megválasztása az algoritmus eredménye<br />

szempontjából nem közömbös, bizonyos függvények esetén a kurtózis jobb közelít<strong>és</strong>ét<br />

kaphatjuk. Az algoritmus láthatóan nem igényli a keres<strong>és</strong> lép<strong>és</strong>nagyságát befolyásoló<br />

ún. bátorsági tényezők hangolását, konvergenciatulajdonságai pedig kiválók.<br />

Ahogy azt említettük, ez az egyik legelterjedtebben használt ICA-algoritmus.<br />

Számos változatát dolgozták ki, <strong>és</strong> tulajdonságai, alkalmazási lehetőségei is széles<br />

körben ismertek. A r<strong>és</strong>zletekbe menő ismertet<strong>és</strong> ennél fogva meghaladná a dolgozat<br />

11 Megmutatható, hogy az így leírt algoritmus a kurtózison, mint a nemnormalitás mérőszámán alapul. Az<br />

algoritmusnak létezik negentrópiát használó változata is (Hyvärinen–Karhunen–Oja [2001]).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!