03.05.2013 Views

A független komponens analízis és empirikus vizsgálata*

A független komponens analízis és empirikus vizsgálata*

A független komponens analízis és empirikus vizsgálata*

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

270<br />

Statisztikai Szemle, 91. évfolyam 3. szám<br />

Kapelner Tamás — Madarász László — Ferenci Tamás<br />

kereteit, ehhez lásd például Horváth et al. [2006], Hyvärinen–Oja [2000],<br />

Hyvärinen–Karhunen–Oja [2001].<br />

2.1. Független <strong>komponens</strong>ek<br />

Tegyük tehát először próbára a <strong>független</strong> <strong>komponens</strong> <strong>analízis</strong>t. Példánkban előállítottunk<br />

egy kétváltozós adathalmazt két, egymástól <strong>független</strong> 1 szabadságfokú teloszlásból.<br />

Ezek után az adatokat egy véletlenszerűen megválasztott értékekkel rendelkező<br />

keverőmátrix által reprezentált lineáris transzformációval képeztük le. A kevert<br />

adatokon a FastICA algoritmust lefuttatva azt tapasztaltuk, hogy a visszaállított<br />

<strong>és</strong> az eredeti <strong>komponens</strong>ek majdnem teljesen megegyeztek.<br />

Az eltér<strong>és</strong> annak tulajdonítható, hogy míg az eredetileg generált jelek között volt<br />

alacsony szintű összefügg<strong>és</strong> – a korrelációs együttható értéke 0,012 – addig a kevert je-<br />

15<br />

lekből visszaállított adatok közötti korreláció mértéke 10 −<br />

nagyságrendű. Az 1. ábrán<br />

látható, hogy a generált <strong>és</strong> a visszaállított elemek közötti eltér<strong>és</strong> minimális, feltűnhet<br />

azonban, hogy a visszakapott adathalmaz a kiindulási mínusz egyszerese. Ez annak köszönhető,<br />

hogy a <strong>komponens</strong>ek skálázása tetszőleges lehet (lásd az 1.4. pontot).<br />

1. ábra. Generált, kevert <strong>és</strong> visszaállított adathalmazok<br />

Mivel azonban a korrelációs együtthatóval a <strong>független</strong>ség nem mérhető, így a következőkben<br />

az együttes eloszlás, valamint a peremeloszlások segítségével vizsgáljuk<br />

ezt a kérd<strong>és</strong>t. Az együttes- <strong>és</strong> perem-sűrűségfüggvényeket magfüggvényes sűrűségbecsl<strong>és</strong><br />

12 segítségével állítottuk elő, <strong>és</strong> a <strong>független</strong>ség vizsgálatához az együttes<br />

sűrűségfüggvény értékéből levontuk a perem-sűrűségfüggvények szorzatát, majd a<br />

különbség négyzetes integrálját vettük. Az így kapott mutatót, az integrált négyzetes<br />

hibát (integrated squared error – ISE) a következő egyenlet mutatja:<br />

12 Lásd Scott [1992] vagy Terrell–Scott [1992].

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!