Klik hier om die artikel in PDF-formaat - LitNet
Klik hier om die artikel in PDF-formaat - LitNet
Klik hier om die artikel in PDF-formaat - LitNet
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>LitNet</strong> Akademies Jaargang 9(2), Augustus 2012<br />
uitmaak van <strong>die</strong> VIS-pakket. Data Eng<strong>in</strong>eer kan onder andere op <strong>die</strong> volgende maniere<br />
opgestel word <strong>om</strong> <strong>in</strong>ligt<strong>in</strong>g b<strong>in</strong>ne <strong>die</strong> stelsel <strong>in</strong> te trek en te verwerk:<br />
• Die “Filesystem – Directory Monitor” ondersoek voortdurend een of meer<br />
geselekteerde lêers op <strong>die</strong> rekenaar en kopieer enige nuwe dokumente wat<br />
bygevoeg word na spesifieke lêers, byvoorbeeld rakende ’n spesifieke onderwerp.<br />
• Die “Internet – RSS Feed Harvester”-module ondersoek voortdurend<br />
gespesifiseerde plekke op <strong>die</strong> <strong>in</strong>ternet vir nuwe stories en skakel dan out<strong>om</strong>aties<br />
<strong>die</strong> nuwe stories <strong>in</strong> <strong>in</strong>dividuele XML-rekords <strong>om</strong> vir verdere ontled<strong>in</strong>g. Hier<strong>die</strong><br />
funksie kan gebruik word <strong>om</strong> <strong>die</strong> navorser op datum te hou met nuus en tendense<br />
met behulp van <strong>in</strong>ternet-<strong>in</strong>ligt<strong>in</strong>gsbronne, en kan onbepaald <strong>in</strong> <strong>die</strong> agtergrond<br />
loop.<br />
• Die “Internet – Web Crawler”-module deursoek <strong>die</strong> <strong>in</strong>ternet vanaf ’n gegewe<br />
beg<strong>in</strong>punt, en laai sowel <strong>die</strong> huidige webblad as al <strong>die</strong> skakels op <strong>die</strong> webblad af.<br />
Dan gaan dit deur elke skakel wat versamel is en laai ook daar<strong>die</strong> bladsye en<br />
skakels af. Dit gaan voort met <strong>hier</strong><strong>die</strong> proses totdat <strong>die</strong> gebruiker-gespesifiseerde<br />
<strong>die</strong>pte bereik is. ’n Voorbeeld: as ’n mens beg<strong>in</strong> by www.futurepo<strong>in</strong>tsystems.c<strong>om</strong><br />
en gaan tot ’n <strong>die</strong>pte van 3 (3 grade van <strong>die</strong> oorspronklike bladsy), sou jy nou<br />
honderde dokumente besit wat uit ’n verskeidenheid HTML-bladsye, beelde,<br />
teksdokumente, en <strong>PDF</strong>-dokumente bestaan.<br />
• Die “Internet – YouTube Search”-module stel ’n mens <strong>in</strong> staat <strong>om</strong> <strong>in</strong>ligt<strong>in</strong>g oor<br />
video's <strong>in</strong> te samel, soos <strong>die</strong> titel, beskryw<strong>in</strong>g, publikasiedatum, laaste bywerk<strong>in</strong>g,<br />
grader<strong>in</strong>g, <strong>die</strong> aantal k<strong>om</strong>mentar, sleutelwoorde, kategorieë, lengte van <strong>die</strong> video,<br />
<strong>in</strong>ligt<strong>in</strong>g oor <strong>die</strong> video-outeur, ouderd<strong>om</strong>, geslag, ligg<strong>in</strong>g, verwante skakels na <strong>die</strong><br />
video-outeur, <strong>die</strong> aantal kere wat <strong>die</strong> video gekyk is, k<strong>om</strong>mentaar oor <strong>die</strong> video,<br />
en <strong>in</strong>ligt<strong>in</strong>g oor <strong>die</strong> mense wat k<strong>om</strong>mentaar op <strong>die</strong> video gelewer het.<br />
Heelwat ander programme stel ook <strong>die</strong> gebruiker <strong>in</strong> staat <strong>om</strong> onder andere webblaaie<br />
out<strong>om</strong>aties te monitor vir bygewerkte <strong>in</strong>ligt<strong>in</strong>g, asook <strong>om</strong> ’n hele <strong>in</strong>ternet-soektog<br />
out<strong>om</strong>aties by te werk. Dit beteken dat <strong>die</strong> navorser out<strong>om</strong>aties <strong>in</strong> kennis gestel word<br />
wanneer nuwe <strong>in</strong>ligt<strong>in</strong>g oor ’n onderwerp beskikbaar is, byvoorbeeld oor ’n spesifieke<br />
skrywer. S<strong>om</strong>mige van sulke programme is gratis, terwyl ander ’n paar honderd rand kos:<br />
• Copernic Agent (http://www.copernic.c<strong>om</strong>/en/products/agent)<br />
• ChangeDetect (http://www.changedetect.c<strong>om</strong>)<br />
• MetaProducts Offl<strong>in</strong>e Explorer<br />
(http://www.metaproducts.c<strong>om</strong>/mp/offl<strong>in</strong>e_explorer.htm)<br />
• Check&Get (http://activeurls.c<strong>om</strong>)<br />
• HTTrack (http://www.httrack.c<strong>om</strong>).<br />
Vir <strong>hier</strong><strong>die</strong> <strong>artikel</strong> is Offl<strong>in</strong>e Explorer Pro gebruik <strong>om</strong> Vers<strong>in</strong>daba (http://vers<strong>in</strong>daba.co.za) se<br />
tuisblad en eerste twee stelle skakels (<strong>die</strong> skakels vanaf <strong>die</strong> tuisblad en <strong>die</strong> skakels vanaf <strong>die</strong><br />
skakels wat vanaf <strong>die</strong> tuisblad bereik is) af te laai en te <strong>in</strong>dekseer. Webblaaie kan dan op <strong>die</strong><br />
rekenaar gestoor word vir argiver<strong>in</strong>gsdoele<strong>in</strong>des en verdere navors<strong>in</strong>g, met <strong>die</strong> voordeel dat<br />
daar sonder ’n <strong>in</strong>ternetverb<strong>in</strong>d<strong>in</strong>g deur datastelle gesoek kan word.<br />
478