04.11.2014 Views

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Sprístupňovanie informácií pomocou grafov 211<br />

Odhalit’, ktorý odkaz je v kontexte danej stránky relevantný, je z algoritmického hl’adiska<br />

netriviálny problém. Prvým priblížením je zavedenie tematického ohodnotenia stránok<br />

[22], ktoré rozdel’uje výsledné ohodnotenie stránky na viaceré zložky – témy. Zdá sa,<br />

že takéto rozdelenie má navyše úplne racionálny základ, pretože autorita v jednej téme by<br />

nemala mat’ rovnako vel’ký vplyv v téme úplne inej. Pridanou hodnotou tohto tematického<br />

rozdelenia ohodnotenia je zvýšenie obrany voči odkazovému spamu. Umelo vkladané odkazy<br />

väčšinou nesúvisia priamo s témou stránky, na ktorej parazitujú, čím je váha odkazu<br />

znižovaná a následne aj tematické ohodnotenie irelevantnej stránky.<br />

7.3.4 Zneužitel’nost’ ako oslabenie predpokladu<br />

Vo všeobecnosti je možné útok na ohodnocovacie algoritmy chápat’ ako snahu o zneužitie<br />

predpokladu, z ktorého algoritmus vychádza.<br />

Napríklad HITS predpokladá, že na kvalitné autority odkazujú kvalitné rozcestníky<br />

a kvalitné rozcestníky odkazujú na kvalitné autority. Vytvorením umelého rozcestníka, ktorý<br />

odkazuje na nekvalitnú (irelevantnú) stránku, je umelo oslabovaný predpoklad algoritmu.<br />

Oslabenie predpokladu má za následok oslabenie dôsledku. V tomto prípade kvalitu ohodnotenia<br />

autoritatívnosti a rozcestnosti stránok.<br />

Podobne aj PageRank predpokladá, že čím viac stránok odkazuje na jednu stránku, tým<br />

je táto stránka populárnejšia. Odkazová farma umelo zvyšuje počet odkazov na stránky, čím<br />

oslabuje predpoklad, že viac odkazov znamená väčšiu popularitu. Dôsledkom je oslabenie<br />

kvality ohodnotenia popularity.<br />

Tematický PageRank obsahuje predpoklad, že tematická popularita stránky sa zvyšuje<br />

spočtom odkazov rovnako tematicky orientovaných stránok. Novou formou útoku by mohla<br />

byt’ snaha o oslabenie tohto predpokladu, napríklad vytvorením tematicky rovnakých stránok<br />

a odkazovaním na tematicky irelevantnú stránku.<br />

Použitá literatúra<br />

[1] Aswath, D., Ahmed, S.T., D’cunha, J., Davulcu, H.: Boosting Item Keyword Search with<br />

Spreading Activation. In: WI ’05: Proceedings of the 2005 IEEE/WIC/ACM International<br />

Conference on Web Intelligence, Washington, DC, USA, IEEE Computer Society, 2005, pp.<br />

704–707.<br />

[2] Becchetti, L., Castillo, C., Donato, D., Leonardi, S., Baeza-Yates, R.: Link-based characterization<br />

and detection of web spam, 2006.<br />

[3] Berger, H., Dittenbach, M., Merkl, D.: Activation on the Move: Querying Tourism Information<br />

via Spreading Activation. In: DEXA, 2003, pp. 474–483.<br />

[4] Crestani, F.: Application of Spreading Activation Techniques in Information Retrieval.<br />

Artif. Intell. Rev., 1997, vol. 11, no. 6, pp. 453–482.<br />

[5] Crestani, F., Lee, P.L.: WebSCSA: Web Search by Constrained Spreading Activation. In:<br />

ADL ’99: Proceedings of the IEEE Forum on Research and Technology Advances in Digital<br />

Libraries, IEEE Computer Society, 1999, p. 163.<br />

[6] Crestani, F., Lee, P.L.: Searching the Web by constrained spreading activation. Inf.<br />

Process. Manage., 2000, vol. 36, no. 4, pp. 585–605.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!