A független komponens analízis és empirikus vizsgálata*
A független komponens analízis és empirikus vizsgálata*
A független komponens analízis és empirikus vizsgálata*
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
A <strong>független</strong> <strong>komponens</strong> <strong>analízis</strong> <strong>és</strong> <strong>empirikus</strong> vizsgálata<br />
Statisztikai Szemle, 91. évfolyam 3. szám<br />
265<br />
T<br />
V = VX = VAS = W S,<br />
/22/<br />
T<br />
ahol a W ortogonális mátrix az adatokat fehérítő keverőmátrix, mely egyben a<br />
szétválasztómátrix inverze. Numerikus szempontból tehát mindenképpen kedvező a<br />
fehérített adatok használata az egyszerű inverzszámítás miatt, de a fehérített bemenet<br />
feltételez<strong>és</strong>e az elméleti megfontolásokat is egyszerűsíti.<br />
1.4. A módszer korlátai<br />
Az eddig elmondottak alapján tehát az ICA által használt modell két előfeltev<strong>és</strong>sel<br />
él: az egyik, hogy a szétválasztandó S i <strong>komponens</strong>ek <strong>független</strong>ek; a másik pedig,<br />
hogy a <strong>komponens</strong>ek közül csak legfeljebb egy lehet normális eloszlású. A két<br />
feltétel közül az utóbbi az erősebb; az ICA képes kismértékben korreláló <strong>komponens</strong>eket<br />
is szétválasztani két olyan összetevőre, melyek többitől való <strong>független</strong>sége – a<br />
korábbiakban leírt mérőszámok <strong>és</strong> módszerek alapján – maximális.<br />
Meg kell emellett említenünk a módszer 1.2. pontban már érintett néhány tulajdonságát,<br />
melyek nagyban befolyásolják az ICA alkalmazhatóságát: nem tudjuk<br />
meghatározni a <strong>független</strong> <strong>komponens</strong>ek számát, sorrendjét <strong>és</strong> varianciáját. Ezek a<br />
nehézségek abból adódnak, hogy mind S, mind A ismeretlenek, így a probléma aluldeterminált.<br />
Egyr<strong>és</strong>zt az 1.1. pontban ismertetett probléma feltételezi, hogy a <strong>független</strong> <strong>komponens</strong>ek<br />
<strong>és</strong> a keverékek száma azonos. Az nyilvánvaló, hogy a probléma aluldetermináltsága<br />
már nem kezelhető abban az esetben, ha több <strong>független</strong> <strong>komponens</strong>re van<br />
szükségünk, mint ahány kevert jel rendelkez<strong>és</strong>ünkre áll. Mi a helyzet azonban akkor,<br />
ha több kevert jel áll rendelkez<strong>és</strong>ünkre annál, mint ahány <strong>komponens</strong> keverékei ezek<br />
a jelek? Ekkor ugyan az alapfeltételez<strong>és</strong>ünk nem áll fenn, a probléma azonban kezelhető.<br />
A leggyakoribb megoldás az, ha a <strong>független</strong>ít<strong>és</strong> előtt fő<strong>komponens</strong> <strong>analízis</strong>t<br />
(PCA) használva adunk becsl<strong>és</strong>t a dimenzióra (erről a következő pontban r<strong>és</strong>zletesebben<br />
lesz szó). Emellett néhány algoritmus esetén arra is van lehetőség, hogy közvetlenül<br />
a kevert jelek számánál kevesebb <strong>komponens</strong>t állítsunk elő. Ezt a megközelít<strong>és</strong>t<br />
alkalmazhatjuk, ha a <strong>komponens</strong>ek száma valahonnan – például elméletileg –<br />
ismert, vagy ha félő, hogy a PCA segítségével végzett dimenzióredukció során értékes<br />
adatot veszítünk. 8<br />
Másr<strong>és</strong>zt probléma, hogy egy konstans szorzó bármely eredeti <strong>komponens</strong>ben<br />
eliminálható az A mátrix megfelelő ai oszlopának az adott konstanssal való osztásával.<br />
Ilyen módon változtatható bármely <strong>komponens</strong> varianciája anélkül, hogy a mo-<br />
8 Ebben az esetben viszont az ICA-algoritmusok nem adnak becsl<strong>és</strong>t a <strong>komponens</strong>ek számára vonatkozóan,<br />
így legtöbbször az egyetlen használható módszer a próbálgatás marad.