01.12.2012 Views

Sabin-Corneliu Buraga - Profs.info.uaic.ro

Sabin-Corneliu Buraga - Profs.info.uaic.ro

Sabin-Corneliu Buraga - Profs.info.uaic.ro

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

O varianta extinsa e disponibila in cartea<br />

'Tehnologii Web', Matrix Rom, 2001:<br />

Web) de catre un <strong>ro</strong>bot de explorare, fisierul specificînd www.<st<strong>ro</strong>ng>info</st<strong>ro</strong>ng>iasi.<strong>ro</strong>/~busaco/books/web.html<br />

ce parti vor fi evitate de la<br />

parcurgerea automata (pentru evitarea gaurilor negre sau din alte ratiuni).<br />

Un exemplu de astfel de fisier este cel de mai jos:<br />

#/<strong>ro</strong>bots.txt pentru http://www.<st<strong>ro</strong>ng>info</st<strong>ro</strong>ng>iasi.<strong>ro</strong><br />

User-agent: * # toti <strong>ro</strong>botii<br />

Disallow: /tmp/ # date temporare<br />

Disallow: /busaco/work/ # spatiu privat<br />

În vederea evitarii indexarii continutului unei pagini Web se poate scrie în antetul ei:<br />

<br />

În activitatea de catalogare a <st<strong>ro</strong>ng>info</st<strong>ro</strong>ng>rmatiilor, de multe ori intervine ierarhizarea datelor<br />

în functie de subiectul pe care-l trateaza, aceasta clasificare ducînd la aparitia<br />

serviciilor director (de genul GENVL). Clasificarea dupa subiect este similara retelei<br />

lingvistice WordNet.<br />

Un <strong>ro</strong>bot de indexare a <st<strong>ro</strong>ng>info</st<strong>ro</strong>ng>rmatiilor poate sa se confrunte cu diverse p<strong>ro</strong>bleme<br />

precum mutarea URI-urilor, cautarea într-o oglindire si nu într-o locatie originala,<br />

duplicarea legaturilor si altele.<br />

Un utilizator poate apela la un serviciu de înregistrare automata la o suita de motoare<br />

de cautare, de obicei gratuit, ca de exemplu AddMe!.<br />

6. Sfaturi în conceperea unui <strong>ro</strong>bot Web<br />

Înainte de a purcede la conceperea unui <strong>ro</strong>bot, folosind sau nu metode de calcul al<br />

hiper<st<strong>ro</strong>ng>info</st<strong>ro</strong>ng>rmatiei, trebuiesc avute în vedere urmatoarele:<br />

Chiar avem nevoie de un alt <strong>ro</strong>bot sau adoptam nevoilor noastre unul deja<br />

existent?<br />

Robotul trebuie identificat usor de administratorul Web si autorul acelui <strong>ro</strong>bot<br />

trebuie sa fie contactat facil.<br />

Robotul va trebui sa fie mai întîi testat pe date locale, într-o retea p<strong>ro</strong>prie,<br />

înainte de a fi disponibil în Internet.<br />

Robotul va fi moderat în ceea ce priveste resursele: prevenirea focului rapid,<br />

eliminarea cautarilor redundante si inutile.<br />

Robotul se va conforma standardului de excludere a <strong>ro</strong>botilor.<br />

Autorul <strong>ro</strong>botului va analiza continuu activitatile <strong>ro</strong>botului p<strong>ro</strong>priu.<br />

Rezultatele furnizate de <strong>ro</strong>bot (diversele statistici sau alte date) vor putea fi<br />

facute disponibile spre consultare celor interesati.<br />

Majoritatea <strong>ro</strong>botilor Web actuali respecta recomandarile de mai sus.<br />

7. Exemple<br />

7.1 DataBots - un <strong>ro</strong>bot manipulînd <st<strong>ro</strong>ng>info</st<strong>ro</strong>ng>rmatii<br />

5

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!