A független komponens analízis és empirikus vizsgálata*
A független komponens analízis és empirikus vizsgálata*
A független komponens analízis és empirikus vizsgálata*
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
A <strong>független</strong> <strong>komponens</strong> <strong>analízis</strong> <strong>és</strong> <strong>empirikus</strong> vizsgálata<br />
2. Empirikus vizsgálat<br />
A gyakorlati alkalmazások elemz<strong>és</strong>e során először azt mutatjuk be, hogy az előálló<br />
<strong>komponens</strong>ek valóban <strong>független</strong>ek. Ezt követően az ICA <strong>és</strong> a PCA összehasonlítására<br />
kerül sor, annak érdekében, hogy az elméleti megfontolások szemléltet<strong>és</strong>e mellett<br />
rávilágítsunk a két módszer közötti lényeges gyakorlati különbségekre is. Végezetül<br />
az ICA néhány gyakorlati sajátosságát elemezzük szimulált adatok segítségével<br />
három dimenzió – a minta elemszáma, a <strong>komponens</strong>szám <strong>és</strong> az adatok eloszlása –<br />
alapján.<br />
Az ICA egyik leggyakoribb implementálási módja a fixpont-megközelít<strong>és</strong>en alapuló<br />
FastICA-algoritmus (Hyvärinen–Oja [2000]). Az algoritmus fehérített adatokon<br />
T<br />
C = E f w x költségfügg-<br />
dolgozik, <strong>és</strong> feltételes optimalizációt végez. A FastICA ( )<br />
vény minimumát keresi<br />
Statisztikai Szemle, 91. évfolyam 3. szám<br />
( )<br />
269<br />
2 11<br />
w =1 feltétel mellett, ahol f kev<strong>és</strong> kivételtől eltekintve<br />
tetszőleges nemkvadratikus függvény lehet, deriváltját g-vel jelöljük. Az algoritmus<br />
alapváltozata külön-külön határozza meg a <strong>független</strong> <strong>komponens</strong>eket, lép<strong>és</strong>ei egy<br />
<strong>független</strong> <strong>komponens</strong> meghatározásához (a korábbi jelöl<strong>és</strong>eket használva):<br />
1. Kezdeti – véletlen – w 0 súlyvektor kiválasztása.<br />
2. + 1 ( )<br />
T T<br />
( g ) − ( g′<br />
)<br />
E E<br />
w = x w x ( w x) w .<br />
k k k k<br />
wk<br />
+ 1<br />
3. wk<br />
+ 1 = .<br />
wk<br />
+ 1<br />
4. Ismétl<strong>és</strong> 2-től a konvergencia elér<strong>és</strong>éig. A kiszámított <strong>független</strong><br />
T<br />
<strong>komponens</strong> ekkor w x .<br />
k<br />
A várható értékeket a számítások során az algoritmus mintaátlaggal becsli, így<br />
teljesítménye szempontjából az idősorok elemszáma fontos tényező. További fontos<br />
tulajdonsága a módszernek, hogy f megválasztása az algoritmus eredménye<br />
szempontjából nem közömbös, bizonyos függvények esetén a kurtózis jobb közelít<strong>és</strong>ét<br />
kaphatjuk. Az algoritmus láthatóan nem igényli a keres<strong>és</strong> lép<strong>és</strong>nagyságát befolyásoló<br />
ún. bátorsági tényezők hangolását, konvergenciatulajdonságai pedig kiválók.<br />
Ahogy azt említettük, ez az egyik legelterjedtebben használt ICA-algoritmus.<br />
Számos változatát dolgozták ki, <strong>és</strong> tulajdonságai, alkalmazási lehetőségei is széles<br />
körben ismertek. A r<strong>és</strong>zletekbe menő ismertet<strong>és</strong> ennél fogva meghaladná a dolgozat<br />
11 Megmutatható, hogy az így leírt algoritmus a kurtózison, mint a nemnormalitás mérőszámán alapul. Az<br />
algoritmusnak létezik negentrópiát használó változata is (Hyvärinen–Karhunen–Oja [2001]).