04.11.2014 Views

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

206 Štúdie vybraných tém programových a informačných systémov<br />

Formálne je možné tento proces zapísat’ ako<br />

M =(1− d) E n<br />

+ dA (7.5)<br />

kde d ∈ 〈0, 1〉 je tlmiaci faktor,<br />

E<br />

n<br />

je matica pravdepodobností skoku na úplne náhodnú<br />

stránku a A je matica pravdepodobností skoku na susedné stránky. Takáto úprava matice A<br />

zaručuje, že výsledná matica M je ireducibilná a aperiodická.<br />

Mocninovou metódou je pre takto upravenú maticu možné nájst’ stacionárne rozdelenie<br />

r k , ktoré predstavuje ohodnotenie stránok (vrcholov) PageRank algoritmom.<br />

r k = r k−1 M (7.6)<br />

Zaujímavým rozšírením tohto algoritmu je výpočet tematického ohodnotenia stránky, pričom<br />

jedna stránka môže obsahovat’ viac tém [9, 22]. Ukazuje sa, že takéto tematické rozdelenie<br />

ohodnotenia stránky je možné využit’ na boj proti spamu a dosahuje lepšie výsledky pri<br />

vyhl’adávaní. Iným prístupom je rozdelenie ohodnotenia stránky na viaceré logické bloky,<br />

pre ktoré sa vypočíta čiastkové ohodnotenie [10].<br />

7.2.3 HITS<br />

HITS (angl. Hypertext Induced Topic Selection) taktiež patrí medzi najznámejšíe algoritmy a je<br />

pôvodne určený na zistovanie autority stránok na webe [11, 12]. Vychádza z predpokladu,<br />

že stránky je možné ohodnotit’ dvoma hodnotami. Prvá z nich označuje mieru autority<br />

(angl. authority) a druhá mieru rozcestnosti (angl. hubness). Tieto dve hodnoty sú zadefinované<br />

rekurzívnym vzt’ahom vychádzajúc z predpokladu, že na kvalitné autority odkazujú<br />

kvalitné rozcestníky a kvalitné rozcestníky odkazujú na kvalitné autority.<br />

Nech A je incidenčná matica grafu odkazov medzi stránkami, potom pre vektor ohodnotenia<br />

autorít a a vektor ohodnotenia rozcestnosti h musí platit’<br />

a = A T h (7.7)<br />

h = Aa (7.8)<br />

Výpočet týchto hodnôt je možný pomocou mocninovej metódy hl’adania vlastného vektora<br />

matice po úprave vzorcov 7.7 a 7.8 na<br />

pričom a 0 = h 0 =(1, 1,...,1).<br />

a k = a k−1 A T A (7.9)<br />

h k = h k−1 AA T (7.10)<br />

7.2.4 Šírenie aktivácie<br />

Šírenie aktivácie (angl. spreading activation) je jednoduchý rekurzívny algoritmus inšpirovaný<br />

teoretickým modelom správania sa sémantickej pamäte človeka [18].<br />

Na začiatku algoritmu šírenia aktivácie je aktivovaný jeden vrchol grafu energiou e.<br />

Táto energia sa šíri cez hrany vystupujúce z tohto vrchola do susedných vrcholov, pričom

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!