A független komponens analízis és empirikus vizsgálata*
A független komponens analízis és empirikus vizsgálata*
A független komponens analízis és empirikus vizsgálata*
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
A <strong>független</strong> <strong>komponens</strong> <strong>analízis</strong> <strong>és</strong> <strong>empirikus</strong> vizsgálata<br />
ós mátrixának sajátvektorainak irányaival fognak egyezni, <strong>és</strong> a megtalált <strong>komponens</strong>ek<br />
korrelálatlanok lesznek egymással (Jolliffe [2010]).<br />
Az ICA ezzel szemben nemcsak a korrelálatlanságot, de a <strong>független</strong>séget is előírja<br />
az egyes <strong>komponens</strong>ek számára. Amint az tehát sejthető, az ICA a PCA-val rokon<br />
módszer, hiszen ahhoz hasonlóan az adatok – ezek az ICA esetén jellemzően idősorok<br />
– egy speciális reprezentációját keresi. Ez viszont nem jelenti azt, hogy az ICA<br />
helyettesíthetné ezt a módszert, mert ahogy azt k<strong>és</strong>őbb is látni fogjuk: a két eszközt<br />
különböző problémák megoldására használhatjuk, <strong>és</strong> korlátaik is különbözők.<br />
A két módszer rokonságának megért<strong>és</strong>e érdekében érdemes a PCA formális matematikai<br />
leírásárán keresztülhaladnunk. Ehhez használjuk fel a következő definíció-<br />
T<br />
X = X , X , … , X egy n dimenziós valószínűségi vektorváltozó,<br />
kat: legyen [ ]<br />
[ 1 2<br />
T<br />
n ]<br />
[ ]<br />
1 2<br />
n<br />
Y = Y , Y , … , Y az X transzformációja után kapott valószínűségi vektorváltozó,<br />
T<br />
i = 1i, 2i,<br />
, ni<br />
w w w … w pedig a tér bázisvektorai közül egy, melyek együttesen a W<br />
transzformációs mátrix oszlopterét feszítik ki, 10 <strong>és</strong> melyeket ortonormáltra választunk<br />
meg. A PCA probléma alapjául szolgáló egyenlet pedig legyen:<br />
Statisztikai Szemle, 91. évfolyam 3. szám<br />
267<br />
T<br />
Y = W X.<br />
/23/<br />
Keressük azt a W n× n méretű ortonormált transzformációs mátrixot, melyre<br />
igaz, hogy X-et oszlopterének bármely m< ndimenziós alterére merőlegesen vetítve<br />
X legkisebb négyzetes hibájú becsl<strong>és</strong>ét kapjuk, azaz minimalizáljuk a következő<br />
költségfüggvényt minden m-re:<br />
PCA ( Wn× m )<br />
m<br />
T<br />
−∑( wi i=1<br />
) wi 2<br />
T<br />
−Wn×<br />
mWn× m<br />
E E /24/<br />
C = X X = X X .<br />
Felmerül a kérd<strong>és</strong>, hogy kiterjeszthető-e a PCA olyan esetekre, amikor a keresett<br />
fő<strong>komponens</strong>ek a bemeneti adatok valamilyen nemlineáris transzformációja által<br />
adottak (nemlineáris PCA – NLPCA). A /24/ lineáris kritériumot ilyen esetekben a<br />
fő<strong>komponens</strong>ekre alkalmazott g i nemlineáris függvényekkel kell módosítanunk a<br />
következőképpen:<br />
m<br />
T T<br />
( W × ) − ( w ) w −W<br />
× g( W × )<br />
∑<br />
C = X g X = X X ,<br />
NLPCA n m i i i n m n m<br />
i=1<br />
2<br />
E E /25/<br />
10<br />
A mátrix oszloptere az oszlopai által kifeszített altér, mely a mátrix által reprezentált transzformáció képtere.<br />
2<br />
2