05.05.2013 Views

Klik hier om die artikel in PDF-formaat - LitNet

Klik hier om die artikel in PDF-formaat - LitNet

Klik hier om die artikel in PDF-formaat - LitNet

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>LitNet</strong> Akademies Jaargang 9(2), Augustus 2012<br />

uitmaak van <strong>die</strong> VIS-pakket. Data Eng<strong>in</strong>eer kan onder andere op <strong>die</strong> volgende maniere<br />

opgestel word <strong>om</strong> <strong>in</strong>ligt<strong>in</strong>g b<strong>in</strong>ne <strong>die</strong> stelsel <strong>in</strong> te trek en te verwerk:<br />

• Die “Filesystem – Directory Monitor” ondersoek voortdurend een of meer<br />

geselekteerde lêers op <strong>die</strong> rekenaar en kopieer enige nuwe dokumente wat<br />

bygevoeg word na spesifieke lêers, byvoorbeeld rakende ’n spesifieke onderwerp.<br />

• Die “Internet – RSS Feed Harvester”-module ondersoek voortdurend<br />

gespesifiseerde plekke op <strong>die</strong> <strong>in</strong>ternet vir nuwe stories en skakel dan out<strong>om</strong>aties<br />

<strong>die</strong> nuwe stories <strong>in</strong> <strong>in</strong>dividuele XML-rekords <strong>om</strong> vir verdere ontled<strong>in</strong>g. Hier<strong>die</strong><br />

funksie kan gebruik word <strong>om</strong> <strong>die</strong> navorser op datum te hou met nuus en tendense<br />

met behulp van <strong>in</strong>ternet-<strong>in</strong>ligt<strong>in</strong>gsbronne, en kan onbepaald <strong>in</strong> <strong>die</strong> agtergrond<br />

loop.<br />

• Die “Internet – Web Crawler”-module deursoek <strong>die</strong> <strong>in</strong>ternet vanaf ’n gegewe<br />

beg<strong>in</strong>punt, en laai sowel <strong>die</strong> huidige webblad as al <strong>die</strong> skakels op <strong>die</strong> webblad af.<br />

Dan gaan dit deur elke skakel wat versamel is en laai ook daar<strong>die</strong> bladsye en<br />

skakels af. Dit gaan voort met <strong>hier</strong><strong>die</strong> proses totdat <strong>die</strong> gebruiker-gespesifiseerde<br />

<strong>die</strong>pte bereik is. ’n Voorbeeld: as ’n mens beg<strong>in</strong> by www.futurepo<strong>in</strong>tsystems.c<strong>om</strong><br />

en gaan tot ’n <strong>die</strong>pte van 3 (3 grade van <strong>die</strong> oorspronklike bladsy), sou jy nou<br />

honderde dokumente besit wat uit ’n verskeidenheid HTML-bladsye, beelde,<br />

teksdokumente, en <strong>PDF</strong>-dokumente bestaan.<br />

• Die “Internet – YouTube Search”-module stel ’n mens <strong>in</strong> staat <strong>om</strong> <strong>in</strong>ligt<strong>in</strong>g oor<br />

video's <strong>in</strong> te samel, soos <strong>die</strong> titel, beskryw<strong>in</strong>g, publikasiedatum, laaste bywerk<strong>in</strong>g,<br />

grader<strong>in</strong>g, <strong>die</strong> aantal k<strong>om</strong>mentar, sleutelwoorde, kategorieë, lengte van <strong>die</strong> video,<br />

<strong>in</strong>ligt<strong>in</strong>g oor <strong>die</strong> video-outeur, ouderd<strong>om</strong>, geslag, ligg<strong>in</strong>g, verwante skakels na <strong>die</strong><br />

video-outeur, <strong>die</strong> aantal kere wat <strong>die</strong> video gekyk is, k<strong>om</strong>mentaar oor <strong>die</strong> video,<br />

en <strong>in</strong>ligt<strong>in</strong>g oor <strong>die</strong> mense wat k<strong>om</strong>mentaar op <strong>die</strong> video gelewer het.<br />

Heelwat ander programme stel ook <strong>die</strong> gebruiker <strong>in</strong> staat <strong>om</strong> onder andere webblaaie<br />

out<strong>om</strong>aties te monitor vir bygewerkte <strong>in</strong>ligt<strong>in</strong>g, asook <strong>om</strong> ’n hele <strong>in</strong>ternet-soektog<br />

out<strong>om</strong>aties by te werk. Dit beteken dat <strong>die</strong> navorser out<strong>om</strong>aties <strong>in</strong> kennis gestel word<br />

wanneer nuwe <strong>in</strong>ligt<strong>in</strong>g oor ’n onderwerp beskikbaar is, byvoorbeeld oor ’n spesifieke<br />

skrywer. S<strong>om</strong>mige van sulke programme is gratis, terwyl ander ’n paar honderd rand kos:<br />

• Copernic Agent (http://www.copernic.c<strong>om</strong>/en/products/agent)<br />

• ChangeDetect (http://www.changedetect.c<strong>om</strong>)<br />

• MetaProducts Offl<strong>in</strong>e Explorer<br />

(http://www.metaproducts.c<strong>om</strong>/mp/offl<strong>in</strong>e_explorer.htm)<br />

• Check&Get (http://activeurls.c<strong>om</strong>)<br />

• HTTrack (http://www.httrack.c<strong>om</strong>).<br />

Vir <strong>hier</strong><strong>die</strong> <strong>artikel</strong> is Offl<strong>in</strong>e Explorer Pro gebruik <strong>om</strong> Vers<strong>in</strong>daba (http://vers<strong>in</strong>daba.co.za) se<br />

tuisblad en eerste twee stelle skakels (<strong>die</strong> skakels vanaf <strong>die</strong> tuisblad en <strong>die</strong> skakels vanaf <strong>die</strong><br />

skakels wat vanaf <strong>die</strong> tuisblad bereik is) af te laai en te <strong>in</strong>dekseer. Webblaaie kan dan op <strong>die</strong><br />

rekenaar gestoor word vir argiver<strong>in</strong>gsdoele<strong>in</strong>des en verdere navors<strong>in</strong>g, met <strong>die</strong> voordeel dat<br />

daar sonder ’n <strong>in</strong>ternetverb<strong>in</strong>d<strong>in</strong>g deur datastelle gesoek kan word.<br />

478

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!