A független komponens analízis és empirikus vizsgálata*
A független komponens analízis és empirikus vizsgálata*
A független komponens analízis és empirikus vizsgálata*
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
256<br />
Statisztikai Szemle, 91. évfolyam 3. szám<br />
Kapelner Tamás — Madarász László — Ferenci Tamás<br />
Tegyük fel, hogy egy olyan koktélpartin vagyunk, ahol minden r<strong>és</strong>ztvevőnek saját<br />
mikrofonja van, mely felvesz minden beszélget<strong>és</strong>t az este folyamán. Hogyan állítanánk<br />
elő a rögzített hangfelvételekből olyanokat, melyek mindegyikén csak egyegy<br />
r<strong>és</strong>ztvevő szavait hallani? A probléma megoldásának kulcsgondolata, hogy mivel<br />
a felvételeken hallható hangzavarhoz az egyes beszélők egymástól <strong>független</strong>ül járulnak<br />
hozzá, célunk elér<strong>és</strong>éhez egy olyan módszerre van szükség, mely képes egymástól<br />
<strong>független</strong> adatok lineárisan <strong>független</strong> keverékeiből visszaállítani az eredeti,<br />
<strong>független</strong> adatokat.<br />
A feladat megoldását szolgáltató egyik módszer a <strong>független</strong> <strong>komponens</strong> <strong>analízis</strong><br />
(independent component analysis – ICA). Az ICA alapvetően különböző adatok –<br />
legyenek azok valószínűségi változók, időfüggvények, de akár tetszőleges adatstruktúrák<br />
is – látens <strong>komponens</strong>ekre bontására képes statisztikai módszer. A felbontás az<br />
eredményül kapott <strong>komponens</strong>ek <strong>független</strong>ségét célozza, vagyis a módszer lényege a<br />
bemeneti adatok <strong>független</strong> <strong>komponens</strong>ekre való dekompozíciója.<br />
Célunk ennek a módszernek a r<strong>és</strong>zletes elméleti <strong>és</strong> gyakorlati bemutatása. Az első<br />
fejezetben a módszer elméleti hátterét, illetve a <strong>független</strong> <strong>komponens</strong>ek előállítását<br />
biztosító statisztikai megközelít<strong>és</strong>eket mutatjuk be. A második fejezetben néhány<br />
<strong>empirikus</strong> vizsgálat segítségével szemléltetjük, hogy valóban <strong>független</strong> <strong>komponens</strong>eket<br />
hoz létre az ICA, továbbá összehasonlítjuk egy másik, szintén elterjedt módszerrel,<br />
a fő<strong>komponens</strong> <strong>analízis</strong>sel (principal component analysis – PCA). Ezek után<br />
az ICA alkalmazhatóságának feltételeit, illetve azok nem teljesül<strong>és</strong>ének hatását vizsgáljuk<br />
szimulációs eszközökkel. A tanulmány lezárásaként a módszer főbb (mérnöki,<br />
pénzügyi) alkalmazási területeit mutatjuk be néhány példán keresztül.<br />
1. A <strong>független</strong> <strong>komponens</strong> <strong>analízis</strong> (ICA)<br />
Ebben a fejezetben bevezetjük a <strong>független</strong> <strong>komponens</strong> <strong>analízis</strong> módszerét <strong>és</strong> tárgyaljuk<br />
a legalapvetőbb módszertani kérd<strong>és</strong>eit. Látni fogjuk, hogy milyen kihívások<br />
merülnek fel a megoldandó probléma kapcsán, illetve, hogy ezekre milyen válaszok<br />
adhatók.<br />
1.1. A koktélparti-probléma<br />
Az ICA alkalmazásának leggyakoribb példája a vak forrásszétválasztás (blind<br />
source separation – BSS) problémája. A megoldandó feladat több, rendelkez<strong>és</strong>re álló