04.11.2014 Views

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

elektronická verzia publikácie - FIIT STU - Slovenská technická ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

318 Štúdie vybraných tém programových a informaných systémov<br />

Uvažujme použitie viel s mierne modifikovaným správaním. Ak vela priletí na<br />

zdroj E ( vrchol E ) zistí kvalitu zdroja, teda PageRank E , ale súasne by zistila, že na<br />

presnejšie urenie PageRanku E je potrebné uri PageRank vrcholov D , B,<br />

F,<br />

H .<br />

Ak by bol zdroj E } kvalitný vela pri návrate do úa by s vekou pravdepodobnos-<br />

ou išla do taniarne, kde by však netancovala za zdroj E , ale za jeden zo zdrojov odkazujúcich<br />

na E (zdroje D , B,<br />

F,<br />

H ). Výber jedného zo zdrojov je náhodný. Týmto sa vela<br />

v taniarni snaží zláka iné vely na zdroje, ktorých Page Rank je potrebný na presnejšie<br />

urenie Page Ranku vrcholu, ktorý navštívila. Po ukonení tancovania sa vráti vela na<br />

vrchol E a ak zlákala iné vely na odkazujúce vrcholy, môže presnejšie uri PageRank<br />

vrcholu E . V prípade, že po aktualizácii je kvalita zdroja vysoká, existuje vysoká pravdepodobnos,<br />

že vela bude propagova v taniarni jeden z odkazujúcich zdrojov. Celý cyklus<br />

sa teda opakuje a Page Rank vrcholu E sa postupne približuje k teoretickej hodnote.<br />

Podobné pravidlá platia pre všetky zdroje.<br />

Experimenty publikované v (Návrat, 2007B) ukázali, že použitie viel na výpoet Page<br />

Ranku môže by výhodné a v mnohých prípadoch rýchlejšie ako klasický iteraný prístup.<br />

Na rozdiel od klasického prístupu metóda výpotu PageRanku pomocou viel neposkytuje<br />

vždy presné výsledky, o je spôsobené povahou modelu – nie je zaruené, že<br />

vely navštívia všetky zdroje. Tento nedostatok môžeme odstráni zvýšením potu viel.<br />

Výhodou je možnos kontinuálneho výpotu PageRanku v prevádzke. Napríklad<br />

Google prepoítava vždy za uritý as PageRank celého ním indexovaného webu. Pri použití<br />

modelu viel by vely nepretržite lietali nad webovými stránkami (vrcholmi grafu)<br />

a aktualizovali by PageRank jednotlivých stránok (vrcholov grafu).<br />

11.4.5 Vyhadávanie webových stránok<br />

V súasnosti pracuje väšina vyhadávaov nad off-line databázou, ktorá obsahuje indexované<br />

stránky z asti Internetu. Obsah týchto stránok sa neustála aktualizuje a pribúdajú<br />

nové stránky.<br />

Rozsah Internetu je obrovský a nie je možné prehada všetky stránky, preto je nutné<br />

on-line vyhadávanie usmerni iba na najsubnejšie cesty. Každý používate má pri vyhadávaní<br />

svoje preferencie. Tie môže vyjadri vybratím skupiny stránok, ktoré sa venujú<br />

oblasti, ktorú preferuje. Z tejto skupiny stránok sa zaína vyhadávanie. Webová stránka<br />

teda predstavuje zdroj a dosiahnutenos iného zdroja predstavuje hypertextový odkaz na<br />

inú stránku (zdroj).<br />

Pôvodný model (Návrat, 2006) bol doplnený o správanie sa vely mimo úa. Vela si<br />

po vyletení z úa vyberie náhodný zdroj x , urí jeho kvalitu a s pravdepodobnosou q x sa<br />

vráti do úa, alebo s pravdepodobnosou 1 − q x si náhodne vyberie iný zdroj, dostupný zo<br />

zdroja x . Proces sa opakuje, pokia vela nenarazí na zdroj z , z ktorého už žiadny iný<br />

zdroj nie je dostupný. V tomto prípade sa vela s pravdepodobnosou q z vráti do úa<br />

s kvalitou zdroja q z , inak s kvalitou 0. Návrat viel s nulovou kvalitou je zavedený kvôli<br />

tomu, aby tento zdroj nebol zvýhodnený oproti ostatným, pretože z neho vely automaticky<br />

leteli do úa a mohli tento zdroj propagova viac oproti ostatným. Tým, že sa vely<br />

vrátia spä do úa a propagujú kvalitné stránky, alebo ak také stránky nenájdu môžu pozorova<br />

a nasledova iné vely vyhadávanie sa usmeruje na kvalitnejšie zdroje. Za strán-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!