Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...
Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...
Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
mat. Cornelia-Flavia VEJA<br />
TEZA DE DOCTORAT<br />
<strong>Rezumat</strong><br />
MANAGEMENTUL COLABORATIV AL RESURSELOR DIGITALE<br />
PRIN SEMANTIC MEDIAWIKI<br />
COLLABORATIVE DIGITAL REPOSITORY MANAGEMENT<br />
THROUGH SEMANTIC MEDIAWIKI<br />
Comi<strong>si</strong>a <strong>de</strong> evaluare a tezei <strong>de</strong> doctorat:<br />
1<br />
Conduc@tor }tiin]ific<br />
Prof.dr.ing. Mircea-Florin VAIDA<br />
Pre}edinte: Prof.dr.ing. Virgil Dobrot@ - }ef al catedrei <strong>de</strong> Comunica]ii, <strong>Facultatea</strong><br />
<strong>de</strong> Electronic@, Telecomunica]ii }i Tehnologia Informa]iei, Univer<strong>si</strong>tatea<br />
Tehnic@ din Cluj-Napoca;<br />
Membri: Prof.dr.ing. Mircea-Florin Vaida - Conducător ştiinţific, Univer<strong>si</strong>tatea<br />
Tehnic@ din Cluj-Napoca;<br />
Prof.dr.mat. Florian-Mircea Boian - Referent, Univer<strong>si</strong>tatea „Babe}-Bolyai”<br />
din Cluj-Napoca;<br />
Prof.dr. ing. Ioan Naforniţa - Referent, Univer<strong>si</strong>tatea Politehnica –<br />
Timişoara;<br />
Prof.dr.ing. Liviu Miclea - Referent, Univer<strong>si</strong>tatea Tehnic@ din Cluj-<br />
Napoca.
CUPRINS<br />
Lista publicaţiilor în contextul tezei ........................................................................................................................ 4<br />
1. INTRODUCERE .................................................................................................................................... 5<br />
1.1. Conţinutul problemei ............................................................................................................................. 5<br />
1.2. Principalele mo<strong>de</strong>le <strong>de</strong> repo<strong>si</strong>tory şi biblioteci digitale ......................................................................... 6<br />
1.3. Caracteristicile managementului repo<strong>si</strong>tory-ului digital ........................................................................ 7<br />
1.4. Obiective generale şi specifice .............................................................................................................. 8<br />
1.5. Întrebările cercetarii ............................................................................................................................... 9<br />
1.6. Contribuţii............................................................................................................................................ 10<br />
2. DEFINIŢII ŞI FUNDAMENTE ...................................................................................................... 13<br />
2.1. Definitii legate <strong>de</strong> managementul repo<strong>si</strong>tory digital ............................................................................ 13<br />
2.2. Lucrări inrudite şi discutarea acestora în cadrul platformelor implementate ....................................... 15<br />
3. STUDIU PRIVIND MODELELE DE REPOSITORY, B IBIOTECI DIGITALE ŞI<br />
SISTEMELE DE MANAGEMENT AL CONŢINUTULUI ................................................................. 17<br />
3.1. Principalele mo<strong>de</strong>le <strong>de</strong> repo<strong>si</strong>tory şi biblioteci digitale ....................................................................... 17<br />
3.2. Sisteme <strong>de</strong> partajare a cunoştinţelor .................................................................................................... 18<br />
3.3. Repo<strong>si</strong>tory-uri multimedia interne şi partajate .................................................................................... 19<br />
4. UN MODEL CADRU CONCE PTUAL PENTRU MANAGEMENTUL COLABORATIV<br />
AL UNUI REPOSITORY DIGITAL ......................................................................................................... 20<br />
4.1. Scenarii <strong>de</strong> utilizare ............................................................................................................................. 20<br />
4.2. Descrierea mo<strong>de</strong>lelui <strong>de</strong> referinţă propus ............................................................................................ 23<br />
4.2.1. Metodologia .................................................................................................................................... 23<br />
4.3. Algoritmul <strong>de</strong> integrare in pseudocod ................................................................................................. 29<br />
4.4. Ontologia aplicaţiei.............................................................................................................................. 30<br />
4.5. Calitatea metadatelor ........................................................................................................................... 31<br />
4.6. Studiu comparative între mo<strong>de</strong>lul <strong>de</strong> referinţă OAIS şi mo<strong>de</strong>lul colaborativ propus <strong>de</strong> teză .............. 32<br />
5. ARHITECTURA DE REFERINŢĂ ŞI IMPEMENTĂRILE CONCRETE .......................... 34<br />
5.1. Descrierea tehnologiei şi <strong>de</strong>zvoltarea .................................................................................................. 34<br />
5.2. Prima arhitectură concretă ................................................................................................................... 35<br />
5.2.1. Obiect digital ....................................................................................................................................... 36<br />
5.2.2. Profilul utilizator şi specificarea colaborării ........................................................................................ 39<br />
5.2.3. Specificarea elementelor fluxului <strong>de</strong> lucru şi a relaţiilor dintre ele ..................................................... 40<br />
5.2.4. Alinierea mo<strong>de</strong>lelor şi specificarea interoperabilităţii ......................................................................... 42<br />
5.2.5. Prototip pentru realizarea interoperabilităţii cu biblioteca digitala Europeana DL .............................. 44<br />
5.3. A doua arhitectură concretă ................................................................................................................. 44<br />
2
5.4. A treia arhitectura concretă .................................................................................................................. 46<br />
5.4.1. Cerintele contextuale ale arhitecturii ................................................................................................... 46<br />
5.4.2. Metodologia ......................................................................................................................................... 46<br />
5.4.3. Descrierea tehnologiei şi <strong>de</strong>zvoltarea .................................................................................................. 47<br />
5.4.4. O ontologie <strong>si</strong>mplificată pentru mapare ............................................................................................... 49<br />
5.4.4.1. Maparea Metadatelor ................................................................................................................. 49<br />
5.4.4.2. I<strong>de</strong>ntificarea entităţilor relevante pentru interoperabilitate şi re-utilizare ................................ 50<br />
5.4.5. Realizarea interfeţei utilizator ......................................................................................................... 52<br />
5.4.6. Unealta <strong>de</strong> adnotare şi managentul drepturilor <strong>de</strong> proprietate intelectuală ...................................... 54<br />
6. PLATFORMA DE EVALUARE...................................................................................................... 56<br />
6.1. Validarea mo<strong>de</strong>lului ............................................................................................................................ 56<br />
6.2. Analiza performanţelor tehnice ale uneltelor ....................................................................................... 57<br />
6.3. Un cadru pentru evaluarea factorului <strong>de</strong> întrebuinţare ......................................................................... 57<br />
6.3.1. Extragerea datelor din Metadata Aggregation Reports ........................................................................ 57<br />
6.3.2. Sabilirea corpusului ............................................................................................................................. 58<br />
6.3.3. Stabilirea meto<strong>de</strong>i <strong>de</strong> evaluare ............................................................................................................. 58<br />
7. CONCLUZII ŞI DIRECŢII ULTERIOARE DE CERCETARE ............................................ 63<br />
7.1. Rezultatele ........................................................................................................................................... 63<br />
7.2. Rezultate tehnologice .......................................................................................................................... 64<br />
7.3. Contributii............................................................................................................................................ 64<br />
7.3.1. Contribuţii teoretice ............................................................................................................................. 64<br />
7.3.2. Contribuţii practice .............................................................................................................................. 65<br />
7.4. Direcţii viitoare <strong>de</strong> cercetare ................................................................................................................ 65<br />
Referinţe ............................................................................................................................................................ 67<br />
3
Revista BDI:<br />
Lista publicaţiilor în contextul tezei<br />
1. Veja Cornelia, Vaida Florin Mircea, Hagedorn Gregor, 2011, Sharing the knowledge:<br />
Semantic MediaWiki. Acta Technica Napocen<strong>si</strong>s, 2/2011, vol. 52, pp. 10-17, ISSN: 1221-<br />
6542.<br />
Conferinţe:<br />
2. Veja Cornelia, Weber Gisela, Hagedorn Gregor, Giurgiu Mircea,<br />
2010. MediaWiki Interoperability Framework for Multimedia<br />
Digital Resources. Proc. Of IEEE 6th Int. Conf. on Intelligent<br />
Computer Communication and Proces<strong>si</strong>ng, Cluj-Napoca, Romania.<br />
August 26-28, pp. 321-328. IEEE DOI=<br />
10.1109/ICCP.2010.5606419.<br />
3. Hagedorn, Gregor, Weber, Gisela, Plank, Aandreas Giurgiu, Mircea<br />
Homodi, Andrei, Veja Cornelia and others. 2010. An online<br />
authoring and publishing platform for field gui<strong>de</strong>s and i<strong>de</strong>ntification<br />
tools. Proc. of Conf. Tools for I<strong>de</strong>ntifying Biodiver<strong>si</strong>ty: Progress<br />
and Problems, Paris, pp. 13-18. ISBN 978-88-8303-295-0<br />
4. Mircea Giurgiu, Andrei Homodi, Cornelia Veja, Gregor Hagedorn,<br />
Pier Luigi Nimis, 2010. ‘A search tool for the digital biodiver<strong>si</strong>ty<br />
resources of KeyToNature’, Nimis P. L., Vignes Lebbe R. (eds.),<br />
Tools for I<strong>de</strong>ntifying Biodiver<strong>si</strong>ty: Progress and Problems, Paris<br />
September 2010 – pp. 19-24. ISBN 978-88-8303-295-0.<br />
5. Veja Cornelia, Hagedorn Gregor, Weber Gisela, Giurgiu Mircea.<br />
2010. Semantic MediaWiki Interoperability Framework from a<br />
Semantic Social Software Perspective. Proc. of Int. Symp. on<br />
Electronics and Telecommunications ETC 2010, Timisoara,<br />
November 2010, pp. 403-406, IEEE<br />
DOI=10.1109/ISETC.2010.5679307.<br />
6. Veja Cornelia, Hagedorn Gregor, Weber Gisela, Giurgiu Mircea.<br />
2010. Metadata Repo<strong>si</strong>tory Management u<strong>si</strong>ng the MediaWiki<br />
Interoperability Framework A Case Study:The KeyToNature<br />
Project. Proc. Of Int. Conf. eChallenges e-2010, 27-29 October.<br />
Warsaw, Poland, IEEE, pp. 1-9. ISBN: 978-1-4244-8390-7.<br />
7. Christoph Schindler, Cornelia Veja, Marc Rittberger, Denny<br />
Vran<strong>de</strong>cic, 2011. How to Teach Digital Library Data to Swim into<br />
Research. In Proceedings of i-Semantics conference, September 7 -<br />
9, 2011, Graz. Austria, pp. 142-149, ACM 978-1-4503-0621-8.<br />
8. Veja Cornelia, Hagedorn Gregor, Weber Gisela, Suta Loreta, Vaida<br />
Florin Mircea, 2011, Mo<strong>de</strong>ls for metadata repo<strong>si</strong>tory management<br />
u<strong>si</strong>ng Semantic Social Software, . Proc. Of Int. Conf. eChallenges e-<br />
2011, October 25-27. pp. 1-8, Florence, Italy. ISBN 978-1-905824-<br />
27-4.<br />
9. Christoph Schindler, Denny Vran<strong>de</strong>cic, Marc Rittberger, Rudi<br />
Stu<strong>de</strong>r, Cornelia Veja, 2011. Kollaborative Analyse von<br />
historischen Netzwerken: Virtuelle Forschungsumgebung für die<br />
Historische Bildungsforschung. In Proceeding of “Kooperationen<br />
und Netzwerke in bildungshistorischer Perspektive“ Jahrestagung<br />
<strong>de</strong>r Sektion Historische Bildungsforschung in <strong>de</strong>r DGfE, Basel,<br />
Swiss, pp. 1-8, 16-18.09.2011.<br />
4
1.1. Conţinutul problemei<br />
1. INTRODUCERE<br />
Noua generaţie <strong>de</strong> internet se va caracteriza prin convergenţa dintre comunicarea socială şi<br />
informaţia îmbogaţită semantic. Virtualizarea este prezentă inclu<strong>si</strong>v la nivelul organizaţiilor şi<br />
a comunităţilor <strong>de</strong> utilizatori. Sistemele <strong>de</strong> colaborare în masă (MC) <strong>si</strong>mulează lumea reală<br />
prin creearea unei reţele umane în jurul unul „obiectiv virtual”. Aceste <strong>si</strong>steme dau<br />
utilizatorilor po<strong>si</strong>biltatea creării unei reţele sociale evolutive în timp, exploatând totodata<br />
acestă reţea pentru a-i furniza servicii. Utilizatorii unora dintre aceste reţele sociale (wiki <strong>de</strong><br />
exemplu ) comasate în jurul obiectului virtual crează colaborativ valori intelectuale.<br />
Problemele apar când se <strong>de</strong>ci<strong>de</strong> plasarea valorile intelectuale al comunităţii, în special pentru<br />
comunităţile virtuale. Acestea sunt caracterizate printr-un înalt grad <strong>de</strong> eterogenitate la mai<br />
multe nivele. Resursele digitale pot fi uşor stocate în multe <strong>si</strong>steme acce<strong>si</strong>bile prin web:<br />
portaluri, <strong>si</strong>steme <strong>de</strong> management al conţinutului (CMS) sau <strong>de</strong>pozite digitale (repo<strong>si</strong>tory).<br />
Integrarea metadatelor este necesară pentru a stabili comunicarea între <strong>si</strong>steme multiple<br />
eterogene, unelte şi date. Creşterea rapidă a resurselor în internet şi a colecţiilor digitale a fost<br />
acompaniată <strong>de</strong> o prolifere a schemelor <strong>de</strong> metadate. Aceste scheme au fost construite în<br />
conformitate cu nevoile unei comunităţi particulare <strong>de</strong> utilizatori, utilizatori potenţiali, tipuri<br />
<strong>de</strong> materiale digitizate, domenii <strong>de</strong> aplicabilitate, nece<strong>si</strong>tăţile proiectelor, etc.<br />
Tehnologiile <strong>de</strong> management al repo<strong>si</strong>tory-ului au fost create iniţial pentru gestionarea<br />
metadatelor create cu scopul <strong>de</strong> a integra datele şi uneltele. [155].<br />
Pentru integrarea şi managementul datelor, repo<strong>si</strong>tory-ul digital agreghează diferite mo<strong>de</strong>le <strong>de</strong><br />
date, diferite scheme şi diferite unele software. Deşi publicarea datelor a fost con<strong>si</strong><strong>de</strong>rată o<br />
activitate adiţională, ea <strong>de</strong>vine din ce în ce mai mult o parte a ciclului <strong>de</strong> viaţă al obiectului<br />
digital, avînd în ve<strong>de</strong>re mai ales datele <strong>de</strong> natură dinamică (temporale, provenite <strong>de</strong> la senzori,<br />
etc).<br />
Managementul repo<strong>si</strong>tory-ului este parte intrinseca din contextul mai larg care se referă la<br />
integrarea informaţiei. El trebuie văzut ca o componentă a <strong>si</strong>stemului <strong>de</strong> management al<br />
conţinutului (CMS), în care managementul resurselor digitale nu poate fi separat <strong>de</strong><br />
managementului altor componente cum ar fi pagini web, diferitele înregistrări digitale,<br />
documente administrative, documentaţii tehnice, etc. Acest mediu lărgit în care repo<strong>si</strong>tory-ul<br />
digital coexistă şi cu care schimbă informaţii conţine date structurate şi nestructurate<br />
reprezintă baza <strong>de</strong> cunoştinţe explicite valoroase a unei organizaţiei [100].<br />
Prin excelenţă, managementului conţinutul (CM) se adresează unei comunităţi<br />
interdisciplinare dat fiind natura colaborativă a ciclului <strong>de</strong> viaţă al resurselor digitale [180].<br />
In timpul ciclul <strong>de</strong> viaţă al informaţiei aceasta îşi sporeşte valoarea trecand prin: creare,<br />
aducere la zi, publicare, traducere, arhivare şi regă<strong>si</strong>re. Setul <strong>de</strong> unelte cu care este înzestrat<br />
<strong>si</strong>stemul <strong>de</strong> management al continutului (CMS) are funcţionalităţi care gestionează acest ciclu<br />
<strong>de</strong> viaţă al obiectului digital: crearea conţinutului, întreţinere şi ver<strong>si</strong>onarea, şi diseminarea<br />
conţinutului prin portale şi diverse facilităţi <strong>de</strong> căutare [131]. Majoritatea CMS pun la<br />
dispoziţie şi unelte <strong>de</strong> adăugare a metadatelor la conţinut.<br />
Repo<strong>si</strong>tory-ul digital şi biblioteca digitală sunt astăzi printre cele mai comune medii şi unelte<br />
pentru managementul şi diseminarea colecţiilor <strong>de</strong> obiecte digitale din domeniile culturale,<br />
educaţionale, ştiinţifice şi a altor tipuri <strong>de</strong> conţinut web.<br />
Biblioteca digitală (DL) gestioneaza <strong>si</strong> furnizează accesul la colecţii largi <strong>de</strong> informaţii peste<br />
un repo<strong>si</strong>tory <strong>de</strong> cunoştinţe. În biblioteca digitală informaţia este bine organizată. De obicei<br />
DL este focalizeată pe categorizarea şi catalogarea resurselor digitale, furnizând informaţii <strong>de</strong><br />
calitate utilizatorilor. Aceste <strong>si</strong>steme <strong>de</strong> stocare şi diseminare a informaţiei au limitările lor<br />
5
printre care: ambiguităţii <strong>de</strong> limbaj natural, nu promovează <strong>de</strong>stul importanţa metadatelor şi<br />
nu angajează utilizatorii în procesul <strong>de</strong> transfer <strong>de</strong> cunoştinţe.<br />
Ca o clasă specială a CMS, repo<strong>si</strong>tory-ul digital este curent folo<strong>si</strong>t pentru gestionarea<br />
metadatelor utilizate cu scopul <strong>de</strong> a integra unelte şi datele. Repo<strong>si</strong>tory-ul este o colecţie <strong>de</strong><br />
obiecte digitale. Principalele caracteristici ale repo<strong>si</strong>tory-ului digital aşa cum au fost <strong>de</strong>scrise<br />
<strong>de</strong> (JISC) sunt:<br />
arhitectura flexibilă astfel încât sa poată gestiona atât conţinutul cât şi metadatele;<br />
conţinutul să fie acce<strong>si</strong>bil printr-un set <strong>de</strong> servicii <strong>de</strong> bază (put, search, get, etc);<br />
repo<strong>si</strong>tory-ul trebuie să fie disponibil şi <strong>de</strong> încre<strong>de</strong>re, bine susţinut şi bine gestionat.<br />
Funcţiile repo<strong>si</strong>tory-ului includ: achiziţia <strong>de</strong> documente, stocarea şi păstrarea documentelor<br />
<strong>de</strong> lungă durată, controlul ver<strong>si</strong>unilor, regă<strong>si</strong>rea documentelor şi prezentarea documentelor<br />
către utilizatorul final [104].<br />
Folo<strong>si</strong>nd terminologia specifică repo<strong>si</strong>tory-ului, mangementul acestuia constă dintr-un set <strong>de</strong><br />
activităţi referitoare la colectarea, combinarea, stocarea, şi gă<strong>si</strong>rea obiectelor digitale.<br />
Activităţile specifice sunt cele legate <strong>de</strong> curatoriat, raportarea şi păstrarea pe durată lungă.<br />
Cercetări recente în domeniul managementului bibliotecilor digitale sunt concentrate pe<br />
îmbunătăţirea infrastructurii <strong>si</strong>stemului <strong>de</strong> bibliotecă digitală (DLMS) care este <strong>de</strong> obicei un<br />
<strong>si</strong>stem repo<strong>si</strong>tory, pe <strong>de</strong> o parte, şi îmbunătăţirea mo<strong>de</strong>lului metadatelor folo<strong>si</strong>t pentru<br />
adnotarea colecţiilor <strong>de</strong> obiecte folo<strong>si</strong>nd tehnologiile semantice şi reţelele sociale pe <strong>de</strong> altă<br />
parte. Calitatea globală a informaţiei aflate în biblioteca digitală poate beneficia prin<br />
angajarea acestor tehnologii complementare, semantice şi sociale.<br />
Motivaţia <strong>de</strong> a stabili un repo<strong>si</strong>tory este condusă <strong>de</strong> interesul pragmatic comun al diferitelor<br />
comunităţi: biblioteci digitale, activitate <strong>de</strong> cercetare, învăţare, ştiinţă, publicare,<br />
managementul şi păstrare informatiei.<br />
Interdisciplinaritatea caracteristică managementului repo<strong>si</strong>tory-ului oferă po<strong>si</strong>bilitatea<br />
combinării <strong>de</strong> tehnologii diverse. Este <strong>de</strong> asemenea o oportunitate pentru a realiza transferuri<br />
<strong>de</strong> informaţie între unelte şi <strong>de</strong>zvoltarea muncii <strong>de</strong> colaborare.<br />
CMS vs. repo<strong>si</strong>tory.<br />
La prima ve<strong>de</strong>re, nu există diferenţe între CMS şi repo<strong>si</strong>tory. O mai clară abordare este aceea<br />
că CMS poate fi folo<strong>si</strong>t ca platformă pentru <strong>de</strong>zvoltarea resurselor, ori <strong>de</strong> câte ori<br />
funcţionalităţile acesteia sunt cerute. Mai mult, <strong>si</strong>stemele <strong>de</strong> repo<strong>si</strong>tory (DSpace, Fedora<br />
Commons) sunt folo<strong>si</strong>toare pentru păstrarea unei ver<strong>si</strong>uni <strong>de</strong> referinţă a resurselor digitale <strong>de</strong><br />
orice fel, şi poate fi a<strong>si</strong>milată cu funcţionalitatea unei arhive permanente în scopul păstrării <strong>de</strong><br />
lungă durată [131].<br />
Repo<strong>si</strong>tory vs. Biblioteca Digitală<br />
În repo<strong>si</strong>tory, utilizatorii sunt producătorii activi ai metadatelor prin interacţiunea comunităţii<br />
<strong>de</strong> bază, în timp ce biblioteca digitală furnizează rezultate mult mai concentrate şi mai exacte<br />
prin tehnicile <strong>de</strong> recomandare către utilizatorii finali [2]. Mo<strong>de</strong>lul <strong>de</strong> infrastructură al<br />
bibliotecii digitale – nivelul <strong>de</strong> management al <strong>si</strong>stemului bibliotecii (DLMS) este construit pe<br />
un <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory.<br />
1.2. Principalele mo<strong>de</strong>le <strong>de</strong> repo<strong>si</strong>tory şi biblioteci digitale<br />
Managementul repo<strong>si</strong>tory-ului cuprin<strong>de</strong> un set flexibil <strong>de</strong> procese şi practici, care <strong>de</strong>pind <strong>de</strong><br />
mo<strong>de</strong>lul <strong>si</strong>stemului <strong>de</strong> repo<strong>si</strong>tory, <strong>de</strong> conţinutul repo<strong>si</strong>tory-ului şi <strong>de</strong>stinaţia lui precum şi <strong>de</strong><br />
comunitatea care doreşte să îl utilizeze şi să beneficieze din exploatarea lui.<br />
Mo<strong>de</strong>lele principale pentru repo<strong>si</strong>tory şi biblioteci digitale sunt divizate în următoarele<br />
categorii:<br />
A. Mo<strong>de</strong>lul formal – 5S (secvenţe <strong>de</strong> date, spaţii, structuri, scenarii, societate) este cel mai<br />
cunoscut mo<strong>de</strong>l formal <strong>de</strong> repo<strong>si</strong>tory şi <strong>de</strong> bibliotecă digitală [70].<br />
6
B. Mo<strong>de</strong>lul <strong>de</strong> referinţă – Reference Mo<strong>de</strong>l for an Open Archival Information System<br />
(OAIS) [174]. Mo<strong>de</strong>lele <strong>de</strong>rivate din OAIS sunt:<br />
a. Three Tier Framework Reference Mo<strong>de</strong>l, cunoscut <strong>si</strong> sub numele <strong>de</strong> mo<strong>de</strong>lul Delos<br />
[29];<br />
b. CIDOC Conceptual Reference Mo<strong>de</strong>l [32].<br />
C. Mo<strong>de</strong>lul semantic <strong>de</strong> biblioteca digitală. Acest mo<strong>de</strong>l este bazat pe mo<strong>de</strong>lul OASIS dar<br />
permite o mai fină granularitate în structura şi serviciile furnizate utilizatorului final [115].<br />
Aceste mo<strong>de</strong>le se balansează între două extreme: prea multa formalizare a mo<strong>de</strong>lului 5S, dar<br />
<strong>de</strong>scrierea foarte bună la nivel structural; sau mo<strong>de</strong>lul Delos, care nu este foarte uşor adoptat<br />
<strong>de</strong> către o comunitate mică sau medie cu un nivel scăzut <strong>de</strong> expertiză tehnică.<br />
Aceste mo<strong>de</strong>le sunt <strong>de</strong> obicei numai ghiduri pentru implementatori, dar nu pot impune<br />
standar<strong>de</strong> pentru servicii şi protocoale. Implementatorii pot alege unul dintre mo<strong>de</strong>lele<br />
menţionate, dar <strong>de</strong> obicei ei adoptă un mo<strong>de</strong>l hibrid. Recent, cel mai comun mo<strong>de</strong>l <strong>de</strong> hibrid<br />
ales <strong>de</strong> implementatori, este mo<strong>de</strong>lul OAIS imbunatatit cu caracteristici semantice, aşa cum<br />
Cornell Univer<strong>si</strong>ty a adoptat pentru Fedora Commons.<br />
Principalul neajuns al implementării acestui mo<strong>de</strong>l hibrid este însuşi procesul <strong>de</strong> management<br />
al repo<strong>si</strong>tory-ului. Frecvent, aceasta este o <strong>de</strong>cizie administrativă şi nu o problemă <strong>de</strong><br />
software. Câteodată, este adoptată şi o implementare adiţională facuta <strong>de</strong> terţi, dar care numai<br />
parţial adresează problematica generală. De cele mai multe ori, aceste implementari nu sunt<br />
puse la dispoziţie întreagii comunităti care ar putea-o folo<strong>si</strong>.<br />
O soluţie po<strong>si</strong>bilă este să se adopte <strong>si</strong>stemul <strong>de</strong> repo<strong>si</strong>tory semantic ca tehnologie <strong>de</strong> stocare şi<br />
management al bibliotecii digitale.<br />
Sistemele <strong>de</strong> repo<strong>si</strong>tory semantice sunt încă la începuturile lor, chiar dacă există <strong>de</strong>ja câteva<br />
implementări disponibile. Sistemele pur semantice sunt însă soluţii „<strong>de</strong>-a gata”. Aceste<br />
<strong>si</strong>steme <strong>de</strong> management semantice complică în fapt şi mai mult managementul metadatelor<br />
<strong>de</strong>oarece se bazeaza pe evoluţia ontologiei [128].<br />
Asemenea soluţii nece<strong>si</strong>tă experţi <strong>de</strong> configurare şi mai apoi <strong>de</strong> întreţinere. Această soluţie se<br />
potriveşte mai bine in cazul <strong>de</strong>zvoltării unui <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory instituţional (aca<strong>de</strong>mic,<br />
guvernamental).<br />
Alegerea un mo<strong>de</strong>l complet <strong>de</strong> repo<strong>si</strong>tory semantic este în afara expertizei unor comunităţi<br />
mici sau medii, acestea neputând înţelege foarte bine ontologiile şi evoluţia lor. Aceste<br />
comunităţi care încearcă să creeze o DL pentru e-Learning (VLE) sau un mediu <strong>de</strong> cercetare<br />
virtual (VRE) sunt nevoite iniţial să angajeze câţiva experţi care să ajute la configurarea şi<br />
setarea <strong>si</strong>stemului <strong>de</strong> repo<strong>si</strong>tory, ceea ce duce la încarcarea costurilor <strong>de</strong> management, dar şi<br />
la <strong>de</strong>pen<strong>de</strong>nţa <strong>de</strong> personal tehnic calificat. O soluţie la în<strong>de</strong>mana acestor comunităţi în ceea ce<br />
priveşte activitatea <strong>de</strong> management al repo<strong>si</strong>tory-ului este adoptarea unui protocol automat<br />
pentru managementul acestuia, indiferent <strong>de</strong> <strong>si</strong>stemul <strong>de</strong> repo<strong>si</strong>tory ales.<br />
1.3. Caracteristicile managementului repo<strong>si</strong>tory-ului digital<br />
Pentru activitatea <strong>de</strong> management, nu există o reţetă pre<strong>de</strong>finită pentru publicarea fluxurilor<br />
<strong>de</strong> lucru, dar <strong>de</strong> obicei uneltele şi specialiştii sunt implicaţi în acest proces cu roluri şi<br />
responsabilităţi concrete. Una dintre cele mai importante activităţi în legătură cu<br />
managementul repo<strong>si</strong>tory-ului este stabilirea mo<strong>de</strong>lul <strong>de</strong> conţinut şi verificarea calitatăţii<br />
metadatelor.<br />
Calitatea metadatelor <strong>de</strong>pin<strong>de</strong> <strong>de</strong> un echilibru fragil: cât <strong>de</strong> multe metadate trebuie să<br />
înregistreze furnizorii <strong>de</strong> date sau să adauge uneltele inteligente? Fără calitate, substanţă şi<br />
standardizarea metadatelor, resurselor digitale stocate în repo<strong>si</strong>tory le lipseşte un ingredient<br />
vital care face ca acestea să fie utile pe web. Fără metadate <strong>de</strong> calitate, şansele ca o resursă să<br />
fie gă<strong>si</strong>tă sunt semnificativ diminuate. Mo<strong>de</strong>le, politicile, tratatele şi strategiile <strong>de</strong> colaborare<br />
sunt <strong>de</strong>zirabile aici împreună cu procesele automate pentru susţinerea efortului comunităţii şi<br />
scutirea utilizatorilor <strong>de</strong> munci împovărătoare, manuale.<br />
7
Conţinutul – documentele electronice, multimedia, conţinutul web şi în special conţinutul<br />
multimedia, sunt costi<strong>si</strong>toare <strong>de</strong> creat şi gestionat. Studii ca [172] au punctat faptul că<br />
majoritatea costurilor împovărătoare <strong>de</strong> gestionare a metadatelor sunt <strong>de</strong> obicei costuri umane.<br />
Paradigma Web 2.0 face mo<strong>de</strong>l tradiţionalul producător – consumator OAIS [173] un mo<strong>de</strong>l<br />
<strong>de</strong>păşit. Se promovează o nouă tehnologie care transformă granularitatea (<strong>de</strong>vine mai fină) şi<br />
conţinutul tipologiei (<strong>de</strong>vine mai larg). Mai mult <strong>de</strong>cât atât, facilitat <strong>de</strong> softul social creat <strong>de</strong><br />
comunitate, a apărut un nou <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory în interiorul unor comunităţi, aşa cum este<br />
<strong>si</strong>stemul wiki. În afară <strong>de</strong> implementarea mo<strong>de</strong>lului cla<strong>si</strong>c <strong>de</strong> stocare, aceste <strong>si</strong>steme utilizează<br />
protocoale şi servicii <strong>si</strong>mple pentru <strong>si</strong>mularea funcţionalităţii repo<strong>si</strong>tory-lui cla<strong>si</strong>c, dar nu şi<br />
gestionarea acestuia. Gestionarea repo<strong>si</strong>tory-ului poate fi o problemă software, dar cel mai<br />
a<strong>de</strong>sea este o <strong>de</strong>cizie administrativă intermediată <strong>de</strong> software.<br />
Trecerea, <strong>de</strong> la mo<strong>de</strong>lul producător – consumator (unul la mai mulţi) la mo<strong>de</strong>lul creeazăremixează-partajeaza<br />
(mai mulţi la mai mulţi), <strong>de</strong> asemenea a schimbat catacteristicile<br />
managementului conţinutului [128]. Aspectele referitoare la granularitatea conţinutului,<br />
tipologia conţinutului şi metadata trebuie să fie recon<strong>si</strong><strong>de</strong>rate pentru a fi create şi gestionate<br />
colaborativ.<br />
Pe <strong>de</strong> altă parte, <strong>si</strong>stemul <strong>de</strong> repo<strong>si</strong>tory cu facilităţi semantice are nevoie <strong>de</strong> exten<strong>si</strong>i pentru a<br />
achiziţiona funcţionalităţi îmbunătăţite.<br />
Critic, nivelul <strong>de</strong> expertiză tehnologică cerut <strong>de</strong> soluţiile mai sus menţionate este în afara<br />
înţelesului multor comunităţi mici şi medii [183].<br />
O soluţie pentru o comunitate închisa constă în folo<strong>si</strong>rea repo<strong>si</strong>tory-ul partajat furnizat <strong>de</strong> un<br />
<strong>si</strong>stem wiki. Exten<strong>si</strong>ile wiki pot folo<strong>si</strong> ca infrastructură pentru mangementul repo<strong>si</strong>tory-ului ca<br />
şi alte unelte create la comanda pentru procesul <strong>de</strong> management automat. Mai <strong>de</strong>parte, ele pot<br />
folo<strong>si</strong> serviciile semantic wiki <strong>si</strong>mplificate pentru a îmbunătăţi căutarea, interconectarea<br />
diferitelor <strong>si</strong>steme şi transferul <strong>de</strong> date [110]. Serviciile sociale furnizate <strong>de</strong> wiki lasă<br />
utilizatorii să beneficieze <strong>de</strong> nivelul <strong>de</strong> expertiză al fiecăruia dintre ei [146]; împreună ei îşi<br />
îmbunătăţesc cunoştinţele schimbând informaţii între ei şi gestionând repo<strong>si</strong>tory-ul.<br />
1.4. Obiective generale şi specifice<br />
Această teză prezintă, pornind <strong>de</strong> la mo<strong>de</strong>lele mai sus menţionate şi mo<strong>de</strong>lele <strong>de</strong> <strong>si</strong>stem <strong>de</strong><br />
colaborare în masă, un nou mo<strong>de</strong>l <strong>de</strong> gestionare a repo<strong>si</strong>tory, numit Mo<strong>de</strong>lul Colaborativ <strong>de</strong><br />
Management al Repo<strong>si</strong>tory Digital (CDRM). Noutatea acestei i<strong>de</strong>i reiese din implicarea<br />
comunităţii reţelei sociale formată în jurul repo<strong>si</strong>tory-ului în întregul proces <strong>de</strong> management<br />
al acestuia. Pentru a echilibra nevoia <strong>de</strong> funcţionalităţi avansate, nivelul scăzut <strong>de</strong> expertiză<br />
tehnologică cu costuri mici <strong>de</strong> gestionare, infrastructura trebuie să suporte protocoale, unelte,<br />
procese automate şi tehnologii semantice <strong>si</strong>mplificate.<br />
Obiectivul specific al tezei este focalizat pe managementul colaborativ al repo<strong>si</strong>tory-ului <strong>de</strong><br />
metadate, în interiorul unei comunităţi mici sau medii caracterizată printr-un nivel scazut <strong>de</strong><br />
expertiză tehnologică.<br />
Această teză explorează <strong>de</strong> asemenea impactul tehnologiilor <strong>de</strong> semantic web asupra evoluţiei<br />
bibliotecilor digitale <strong>si</strong> modul in care cercetatorii <strong>si</strong> bibliotecarii beneficiaza <strong>de</strong> aceste<br />
tehnologii folo<strong>si</strong>ndu-le pentru o mai bună aservire a furnizorului <strong>de</strong> date <strong>si</strong> a utilizatorului<br />
final. Avand suportul tehnologiilor semantice pe <strong>de</strong> o parte, şi abordarea specifică reţelelor<br />
sociale, pe <strong>de</strong> altă poarte, întregul proces <strong>de</strong> management al repo<strong>si</strong>tory-ului digital va fi<br />
translatat <strong>de</strong> la specialişti la utilizatori <strong>de</strong> zi cu zi cât mai mult po<strong>si</strong>bil. Utilizatorii sunt<br />
sprijiniţi – însă nu forţaţi - sa colaboreze la structurarea, organizarea, formarea şi validarea<br />
metadatelor lor şi a altor resurse, într-un mediu adaptabil, pentru o mai bună căutare şi<br />
refolo<strong>si</strong>re a resurselor.<br />
Mai specific, se intenţionează să:<br />
1. îmbunătăţească procesul <strong>de</strong> management al repo<strong>si</strong>tory-ului <strong>de</strong> metadate pentru a<br />
suporta automanagementul comunităţii şi automatizarea proceselor managementului<br />
repo<strong>si</strong>tory-ului. Automatizarea procesului este suportată <strong>de</strong> şabloane (templates),<br />
8
tehnologiile semantice şi unelte special create. Automanagementul trebuie să răspundă<br />
la provocarea principală în managementul repo<strong>si</strong>tory-ului: să construiască un<br />
repo<strong>si</strong>tory şi să expună serviciile repo<strong>si</strong>tory fără să împovareze creatorii <strong>de</strong> conţinut şi<br />
utilizatorii finali cu procese adiţionale [99].<br />
2. <strong>de</strong>zvoltarea soluţiilor orientate spre utilizatori finali cu scopul <strong>de</strong> a face conţinutul<br />
digital mult mai acce<strong>si</strong>bil, uşor <strong>de</strong> folo<strong>si</strong>t şi exploatat, folo<strong>si</strong>nd tehnologiile semantice.<br />
Managementul repo<strong>si</strong>tory-ului este o parte a integrării datelor care la randul său este<br />
principalul domeniu <strong>de</strong> aplicabilitate a ontologiilor.<br />
3. scă<strong>de</strong>rea semnificativă a <strong>de</strong>zorientării utilizatorilor, costurilor implicate şi a timpului<br />
<strong>de</strong> procesare. In consecinţă, furnizorii <strong>de</strong> date şi utilizatorii finali se pot focaliza pe<br />
schimbul <strong>de</strong> resurse şi crearea colaborative a cunoştinţelor, fiind scutiţi <strong>de</strong> sarcini<br />
împovaratoare adiţionale.<br />
4. creşterea semnificativă a implicării utilizatorilor în procesul <strong>de</strong> management al<br />
repo<strong>si</strong>tory-ului prin translatarea răspun<strong>de</strong>rii <strong>de</strong> la <strong>de</strong>zvoltatori la utilizatorii <strong>de</strong> zi cu zi.<br />
Această implicare are un rezultat concret : creşterea nivelul <strong>de</strong> calitate al metadatelor.<br />
Obiectivele menţionate mai sus sunt rezolvate folo<strong>si</strong>nd mo<strong>de</strong>le propuse, arhitecturi şi meto<strong>de</strong>:<br />
1. mo<strong>de</strong>lul <strong>de</strong> referinţă bidirecţional <strong>de</strong>zvoltat pentru managementul colaborativ al<br />
repo<strong>si</strong>tory. Noul mo<strong>de</strong>l creat recon<strong>si</strong><strong>de</strong>ră părţi din mo<strong>de</strong>lele principale din literatură<br />
cărora le măreşte flexibilitatea prin adăugarea <strong>de</strong> noi funcţionalităţi inspirate din<br />
principiile <strong>si</strong>stemelor <strong>de</strong> colaborare în masă. Acest mo<strong>de</strong>l încapsuleaza diferite aspecte<br />
ale logicii mo<strong>de</strong>lului <strong>de</strong> referinţă: ontologia aplicatiei (AO), ontologia fluxului <strong>de</strong><br />
lucru (WO), şi ontologia repo<strong>si</strong>tory digital (RO). Mo<strong>de</strong>lul <strong>de</strong> referinţă este <strong>de</strong>cuplat <strong>de</strong><br />
la mo<strong>de</strong>lul repo<strong>si</strong>tory-ului digital, trecând şi în sfera mai largă <strong>de</strong> acoperire a<br />
problemei integrării metadatelor indiferent <strong>de</strong> mediul <strong>de</strong> stocare specific.<br />
2. arhitectura <strong>de</strong> referinţă bazată pe mo<strong>de</strong>lul mediator, care reflectă proiectarea şi<br />
suplineşte cererile mo<strong>de</strong>lului <strong>de</strong> referinţă şi <strong>de</strong> asemenea capturează informaţiile<br />
colectate <strong>de</strong>-a lungul timpului în metadate.<br />
3. trei arhitecturi concrete <strong>de</strong>rivate şi implementările acestora, conforme cu mo<strong>de</strong>lul<br />
propus anterior.<br />
Aceste trei arhitecturi concrete ale mo<strong>de</strong>lului <strong>de</strong> referinţă corespund cu recoltarea<br />
(harvesting), agregarea şi căutarea metadatelor, sunt fiecare utilizate pentru scopuri<br />
specifice. Ele dau o soluţie pentru trei cazuri concrete <strong>de</strong> <strong>de</strong>zvoltare ale unor VLEs sau<br />
VREs în interiorul comunităţilor mici şi medii şi pentru care este nevoie <strong>de</strong> integrarea<br />
datelor. Prin aceste arhitecturi concrete este verificată validitatea conceptului bidirecţionl<br />
al mo<strong>de</strong>lului <strong>de</strong> referinţă.<br />
4. un nou mo<strong>de</strong>l <strong>de</strong> platformă pentru evaluarea nivelului <strong>de</strong> întrebuinţare a rezultatului<br />
primei implementări.<br />
Acest obiectiv este asociat cu realizari tehnologice, şi <strong>de</strong> asemenea cu beneficiile <strong>de</strong>rivate<br />
din utilizarea mai sus numitelor meto<strong>de</strong> şi unelte tehnologice.<br />
1.5. Întrebările cercetarii<br />
Această teză işi propune sa raspundă la următoarele întrebări <strong>de</strong> cercetare:<br />
Care sunt factorii care influenţează nece<strong>si</strong>tăţile şi beneficiile în managementul<br />
repo<strong>si</strong>tory-ului <strong>de</strong> metadate?<br />
Care este mo<strong>de</strong>lul cel mai potrivit pentru reprezentarea artefactelor aflate în diferite<br />
gra<strong>de</strong> <strong>de</strong> formalizare şi permite folo<strong>si</strong>rea lor în mod uniform?<br />
Care metodă este cea mai potrivita pentru încurajarea participarii utilizatorilor în<br />
întregul proces <strong>de</strong> management al conţinutului digital?<br />
9
Ce metodologie este curent acceptată pentru a contra-balansa nivelului scăzut <strong>de</strong><br />
expertiză tehnologică a utilizatorilor finali, cu nivelele ridicate ale nece<strong>si</strong>tăţilor<br />
funcţionale şi non-funcţionale pe care platforma finală ar trebui să le în<strong>de</strong>plinească?<br />
Care este cel mai potrivit mediu care poate să suporte tehnologiile webului semantic<br />
(ontologiile) pentru a unifica diferitele standar<strong>de</strong> <strong>de</strong> metadata? Poate acest mediu să<br />
ascundă complexitatea acestui proces pentru utilizatorii finali?<br />
Cum validam calitatea metadatelor şi cum lucrăm cu diferitele interpretări ale<br />
metadatelor furnizate <strong>de</strong> furnizorii date adoptând meto<strong>de</strong> neintruzive?<br />
Mo<strong>de</strong>lul conceptual este <strong>de</strong>stul <strong>de</strong> general pentru a suporta <strong>de</strong>rivaţiile şi constrângerile<br />
cerute pentru realizarea unui mediu virtual <strong>de</strong> cercetare un<strong>de</strong> furnizorii <strong>de</strong> metadate şi<br />
cercetătorii care adnotează resursele digitale sunt tehnologic agnostici?<br />
La sfârşitul tezei vom prezenta un răspuns pentru fiecare din aceste întrebări ca rezultat al<br />
cercetării noastre.<br />
1.6. Contribuţii<br />
Această teză se adresează managementului colaborativ al repo<strong>si</strong>tory digital la intersecţia<br />
<strong>si</strong>temului <strong>de</strong> calcul cu omul: o platformă pentru managementul colaborativ al repo<strong>si</strong>tory-ului<br />
şi managementul fluxurilor <strong>de</strong> lucru şi care permite adnotarea colaborativa a conţinutului<br />
digital utilizând Semantic MediaWiki. Principalul obiectiv este contribuţia la îmbunătăţirea<br />
tehnologiilor pentru transferul colaborativ <strong>de</strong> cunostinte, iar în mod specific integrarea<br />
datelor. În acest context, focalizarea este pe zonele <strong>de</strong> aplicaţii specifice îmbunătăţirii<br />
managementului repo<strong>si</strong>tory digital folo<strong>si</strong>nd tehnologia semantică şi construirea infrastructurii<br />
informaţiei.<br />
Principalele contribuţii ale acestei teze sunt:<br />
1. o analiză comprehen<strong>si</strong>vă a mo<strong>de</strong>lelor <strong>de</strong> repo<strong>si</strong>tory, a bibliotecilor digitale şi<br />
mo<strong>de</strong>lelor <strong>de</strong> management al repo<strong>si</strong>tory-ului digital; un studiu comparativ al<br />
<strong>si</strong>stemelor <strong>de</strong> semnatic wikis.<br />
2. propunerea unui nou mo<strong>de</strong>l <strong>de</strong> referinţă şi o arhitectură <strong>de</strong> referinţă pentru<br />
managementul unui repo<strong>si</strong>tory digital.<br />
3. propunerea unei ontologii <strong>de</strong> nivel înalt pentru managementul colaborativ al<br />
repo<strong>si</strong>tory-ului digital.<br />
4. propuneri pentru trei arhitecturi concrete, <strong>de</strong>zvoltate ca platforme separate pentru<br />
managementul colaborativ al unui repo<strong>si</strong>tory-ului digital.<br />
5. implementarea rezultatelor teoretice în platforme practice pentru a face rezultatele<br />
acestei teze acce<strong>si</strong>bil pentru utilizatori.<br />
6. realizarea practică a managementul conţinutului <strong>de</strong> repo<strong>si</strong>tory şi a adnotărilor<br />
semantice.<br />
7. o platformă pentru evaluarea rezultatelor implementarilor folo<strong>si</strong>nd mo<strong>de</strong>lul Semantic<br />
MediaWiki în comparaţie cu mo<strong>de</strong>lul <strong>de</strong> interoperabilitate Systems of Systems<br />
Interoperability (SoSI), şi un cadru pentru evaluarea gradului <strong>de</strong> întrebuinţare.<br />
1.7. Conţinutul tezei<br />
1. Primul capitol dă motivaţia pentru această teză şi <strong>de</strong>finiţia managementului<br />
repo<strong>si</strong>tory-ului digital (DRM), <strong>si</strong> prezinta legatura cu <strong>si</strong>stemele <strong>de</strong> management al<br />
10
conţinutului (CM). Se arată că principalul rol al DRM este <strong>de</strong> a furniza un ghid pentru<br />
utilizatori pentru a contrabalansa costurile <strong>si</strong> beneficiile în contextul unor comunităţi mici şi<br />
medii. Acest capitol introduce termeni cheie ca managementul colaborativ al repo<strong>si</strong>tory-ului<br />
digital şi explică cum aceste artefacte pot varia în mărime, funcţionalitate <strong>si</strong> structură.<br />
Capitolul concluzionează prin sumarizarea soluţiei şi precizează întrebările <strong>de</strong> cercetare.<br />
2. Definiţiile şi fundamentele acestei teze sunt prevăzute în capitolul 2. O secţiune<br />
complexa evi<strong>de</strong>ntiaza conceptele relevante pentru mo<strong>de</strong>le şi referinţele dintre ele. Ambele au<br />
avut o influenţă majoră conceptuală în această teză.<br />
Din punct <strong>de</strong> ve<strong>de</strong>re tehnic sunt <strong>de</strong>scrise: <strong>si</strong>stemul <strong>de</strong> repo<strong>si</strong>tory ca artefact software,<br />
hipertext, inginerie software, web-ul semantic, <strong>si</strong>stemele sociale <strong>de</strong> partajare a cunostintelor<br />
(wiki), managementul fluxului <strong>de</strong> lucru, şi adnotarile semantice. Aceste <strong>de</strong>talii tehnice sunt<br />
analizate în profunzime în capitolul trei.<br />
Abordări asociate sunt <strong>de</strong> asemenea introduse <strong>si</strong> discutate: adnotările digitale, webul social<br />
semantic, fluxul <strong>de</strong> lucru şi interoperabilitatea ca noţiune generalizatoare.<br />
3. Capitolul 3 startează cu prezentarea principalelor mo<strong>de</strong>le existente <strong>de</strong> management al<br />
repo<strong>si</strong>tory-ului şi introduce aici i<strong>de</strong>ea <strong>de</strong> management colaborativ al repo<strong>si</strong>tory-ului urmărind<br />
în<strong>de</strong>aproape ciclul natural <strong>de</strong> viaţă al informaţiei. O analiza profunda a literaturii relevă alte<br />
nece<strong>si</strong>tăţi semnalate <strong>de</strong> aceasta. Mo<strong>de</strong>lele existente sunt analizate cu intenţia <strong>de</strong> a gă<strong>si</strong> puncte<br />
comune între ele şi caută caracteristici structurale care ar putea fi prezente în viitoarele<br />
<strong>si</strong>steme colaborative <strong>de</strong> management al repo<strong>si</strong>tory-ului. O analiză <strong>si</strong>milară este adresata<br />
pentru evi<strong>de</strong>ntierea <strong>si</strong>stemelor sociale semantice colaborative cu partajare, <strong>de</strong> exemplu<br />
<strong>si</strong>stemele wiki.<br />
4. În capitolul 4 este prezentat mo<strong>de</strong>lul soluţiei. Capitolul începe cu o analiză profundă a<br />
factorului social în managementul repo<strong>si</strong>tory-ului <strong>de</strong> la care sunt <strong>de</strong>rivate primele nece<strong>si</strong>tati.<br />
Mo<strong>de</strong>lele <strong>de</strong> reprezentare managementul repo<strong>si</strong>tory-ului sunt utilizate la evi<strong>de</strong>ntierea<br />
nece<strong>si</strong>tatilor pentru managementul acestuia. Capitolul prezintă mai târziu un tabel concret <strong>de</strong><br />
nece<strong>si</strong>tăţi. Soluţia constă într-un mo<strong>de</strong>l <strong>si</strong>mplu <strong>de</strong> management colaborativ pentru repo<strong>si</strong>tory.<br />
Acest mo<strong>de</strong>l reprezintă mai bune variaţii în granularitate şi a relaţiilor dintre entităţi semantice<br />
şi este însotit <strong>de</strong> ontologia fluxului <strong>de</strong> lucru prin care se <strong>de</strong>scriu operaţiile comune utilizate<br />
pentru procesele <strong>de</strong> integrare a metadatelor. Acest capitol explică o ierarhie <strong>de</strong> relaţii <strong>de</strong>rivate,<br />
în măsură să <strong>de</strong>scrie mo<strong>de</strong>lele <strong>de</strong> management a repo<strong>si</strong>tory-ului.<br />
5. Capitolul 5 prezintă o arhitectură <strong>de</strong> referinţă, trei implementări concrete şi diferite<br />
unelte bazate pe mo<strong>de</strong>lul colaborativ <strong>de</strong> management al repo<strong>si</strong>tory-ului introdus in capitolul<br />
prece<strong>de</strong>nt. Serviciul colaborativ <strong>de</strong> Ingest al Fedora Common Repo<strong>si</strong>tory este un serviciu<br />
complex ce utilizează wiki pentru management. Uneltele <strong>de</strong> integrare colaborativă sunt<br />
utilizate mai <strong>de</strong>parte pentru integrea datelor intr-un <strong>si</strong>stem semantic wiki. Aceste unelte<br />
specifice <strong>de</strong>zvoltate ca exten<strong>si</strong>i wiki sunt <strong>de</strong> asemenea prezente. Acest capitol specifică<br />
cazurile <strong>de</strong> utilizare şi constrângerile <strong>de</strong> implementare pentru fiecare arhitectură completă.<br />
Uneltele adiţionale pentru adnotarea semantica a imaginilor este prezentată <strong>de</strong> asemenea în<br />
acest capitol.<br />
6. În continuare diferite tipuri <strong>de</strong> evaluare sunt prezentate în capitolul 6. O evaluare<br />
subiectiva foloseste mo<strong>de</strong>lul <strong>de</strong> interoperabilitate Systems of Systems interoperability ca<br />
mo<strong>de</strong>l matur <strong>de</strong> evaluare a interoperabilitatii. În continuare este prezentă o metodă <strong>de</strong><br />
evaluare utilizând semantic wiki ca suport şi datele din feedbackul furnizorilor <strong>de</strong> matadate.<br />
11
Rezultatele au fost comparate în diferite moduri cu abordarea cla<strong>si</strong>că pentru managementul<br />
<strong>de</strong>pozitului <strong>de</strong> metadate. Capitolul continuă cu prezentarea unui număr <strong>de</strong> abordari care au<br />
legătură cu diferite părţi ale soluţiei.<br />
7. În capitolul 7 sunt i<strong>de</strong>ntificate şi prezentate concluziile şi un număr <strong>de</strong> directii<br />
cercetări şi tematici viitoare <strong>de</strong> cercetare. În final sunt sumarizate contribuţiile principale ale<br />
acestei teze.<br />
12
2. DEFINIŢII ŞI FUNDAMENTE<br />
Acest capitol prezintă mai multe <strong>de</strong>finiţii, relevă anumite caracteristici <strong>de</strong> gestionare a<br />
resurselor digitale, acordându-le însă diferite pon<strong>de</strong>ri <strong>de</strong> importanţă. Pornind <strong>de</strong> la conţinutul<br />
digital şi terminând cu o <strong>de</strong>finiţie informală <strong>de</strong> repo<strong>si</strong>tory şi bibliotecă digitală, vom introduce<br />
treptat termenii relativi la managementul resurselor digitale, selectaţi în conformitate cu<br />
obiectivele generale ale tezei. Legat <strong>de</strong> managementul repo<strong>si</strong>tory digital, vom studia mo<strong>de</strong>lul<br />
<strong>de</strong> adnotare şi implementarile privind adnotarea imaginilor.<br />
Secţiuni ale acestui capitol sunt axate pe două probleme diferite, strâns legate <strong>de</strong> gestionarea<br />
repo<strong>si</strong>tory <strong>de</strong> metadate.<br />
În primul rând, <strong>de</strong>oarece managementul este o activitate orientată pe proces, vom rezuma din<br />
punct <strong>de</strong> ve<strong>de</strong>re conceptual fluxurile <strong>de</strong> lucru.<br />
În al doilea rând, având în ve<strong>de</strong>re problema integrării <strong>de</strong> metadate, vom analiza problemele<br />
eterogenităţii la mai multe niveluri. Vor fi relevate mai multe meto<strong>de</strong> şi practici pentru a<br />
abordarea problemele <strong>de</strong> interoperabilitate, rezumate din literatura <strong>de</strong> specialitate. În plus, vor<br />
fi prezentate pe scurt mo<strong>de</strong>lele mature <strong>de</strong> interoperabilitate, ca o metodă alternativă po<strong>si</strong>bilă<br />
pentru evaluarea interoperabilităţii la nivelul <strong>si</strong>stemelor.<br />
2.1. Definitii legate <strong>de</strong> managementul repo<strong>si</strong>tory digital<br />
Conţinutului digital, sau pur şi <strong>si</strong>mplu, conţinutul, este o informaţie digitală, care poate<br />
inclu<strong>de</strong> documente electronice, fişiere multimedia, conţinut Web sau alte tipuri <strong>de</strong> fişiere, cu<br />
un ciclu <strong>de</strong> viaţă care nece<strong>si</strong>tă management.<br />
O subclasă a conţinutului digital sunt <strong>de</strong> valorile digitale (digital asset), cum ar fi fotografii<br />
digitale, animaţii, clipuri vi<strong>de</strong>o şi muzică.<br />
Procesul <strong>de</strong> management al conţinutului, sau CM, este un set <strong>de</strong> procese şi tehnologii care<br />
sprijină ciclul <strong>de</strong> viaţă evolutiv al conţinutului digital.<br />
În funcţie <strong>de</strong> mi<strong>si</strong>unea şi obiectivele <strong>de</strong> bu<strong>si</strong>ness, managementul conţinutului poate varia în<br />
funcţie <strong>de</strong> etapele procesului, <strong>de</strong> terminologie şi <strong>de</strong> management. De obicei, ciclul <strong>de</strong> viaţă al<br />
conţinutului digital constă în 6 etape principale: crearea, actualizarea, publicarea, traducerea,<br />
arhivarea şi regă<strong>si</strong>rea, având ca o caracteristică comună colaborarea dintre creator, redactor,<br />
editor, administrator şi consumator.<br />
Sistemele <strong>de</strong> management al conţinutului (CMS) sunt programe <strong>de</strong> calculator şi / sau <strong>si</strong>steme<br />
hardware-ul utilizate pentru a sprijini şi <strong>de</strong> a gestiona fluxul <strong>de</strong> lucru tehnic necesar pentru a<br />
crea colaborativ, edita, revizui, in<strong>de</strong>xa şi căuta, publica şi arhivă conţinutul digital.<br />
CMS sunt frecvent utilizate pentru stocarea, controlul ver<strong>si</strong>unilor, publicarea şi documentarea<br />
specifică cum ar fi articole <strong>de</strong> ştiri, manuale <strong>de</strong> operatori, manuale tehnice, ghiduri <strong>de</strong> vânzări<br />
şi broşuri <strong>de</strong> marketing. Procesul <strong>de</strong> publicare este <strong>de</strong> obicei asumat <strong>de</strong> un CMS, având un<br />
instrument software integrat pentru authoring. Acest instrument trebuie să permită<br />
utilizatorilor non-tehnici să creeze şi să gestioneze cu relativă uşurinţă conţinutul.<br />
Sistemele <strong>de</strong> repo<strong>si</strong>tory utilizate <strong>de</strong> către CMS pot inclu<strong>de</strong> o bază <strong>de</strong> date. Conţinutul,<br />
cum ar fi metadatele şi / sau artefacte, sunt frecvent stocate ca fişiere XML.<br />
Indiferent <strong>de</strong> terminologia specifică utilizată, procesul <strong>de</strong> management (sau <strong>de</strong><br />
gestionare a resurselor digitale) constă în colectarea şi stocarea <strong>de</strong> valori în format<br />
digital. Valorile digitale sunt stocate împreună "metadatele" sale.<br />
Metadatele sunt piese primare <strong>de</strong> informaţie, care <strong>de</strong>scriu aspectele semnificative ale unei<br />
resurse şi ajută la gestionarea şi conservarea materialului digital <strong>de</strong>-a lungul timpului. Ele vor<br />
contribui la prezervarea informaţiilor esenţiale contextuale, istorice, tehnice şi sunt păstrate,<br />
împreună cu obiectele digitale şi au un rol crucial in <strong>de</strong>scoperirea acestora.<br />
13
Un repo<strong>si</strong>tory este o platformă <strong>de</strong> aplicaţie pentru gestionarea, stocarea şi a<strong>si</strong>gurarea accesului<br />
într-un mod convenabil la conţinutul digital.<br />
O altă <strong>de</strong>finiţie, publicat <strong>de</strong> către Joint Information Systems Committee (JISC) [83],<br />
subliniază funcţionalitatea unui repo<strong>si</strong>tory:<br />
"... Un repo<strong>si</strong>tory se <strong>de</strong>osebeşte <strong>de</strong> alte colecţii digitale prin următoarele caracteristici:<br />
• conţinutul este repo<strong>si</strong>toryat într-un repo<strong>si</strong>tory, fie <strong>de</strong> către creatorul conţinutului,<br />
proprietarul sau o terţă parte<br />
• arhitectura repo<strong>si</strong>tory gestionează conţinut precum şi metadatele<br />
• repo<strong>si</strong>tory-ul oferă un set minim <strong>de</strong> servicii <strong>de</strong> bază, <strong>de</strong> exemplu, stocare, primire,<br />
căutare, controlul accesului.<br />
• repo<strong>si</strong>tory-ul trebuie să fie durabil şi <strong>de</strong> încre<strong>de</strong>re, bine susţinut şi bine gestionat".<br />
În afară <strong>de</strong> atributele <strong>de</strong> mai sus, este <strong>de</strong> remarcat o caracteristică suplimentară, pentru că ea<br />
face diferenţierea faţă <strong>de</strong> alte <strong>si</strong>steme software <strong>si</strong>milare: repo<strong>si</strong>tory-ul digital a<strong>si</strong>gură "acces<br />
liber", cel puţin parţial [83]. Repo<strong>si</strong>tory-ul digital <strong>de</strong>schis se distinge prin următoarele<br />
caracteristici:<br />
• repo<strong>si</strong>tory-ul trebuie să ofere acces <strong>de</strong>schis la conţinutul acesteia (dacă nu există<br />
constrângeri legale), şi<br />
• repo<strong>si</strong>tory-ul trebuie să ofere acces <strong>de</strong>schis la metadate pentru harvesting.<br />
Scopul principal al unui repo<strong>si</strong>tory este <strong>de</strong> a menţine şi a <strong>de</strong>riva valoarea maximă din<br />
conţinutul acesteia. Un repo<strong>si</strong>tory poate sprijini activităţi umane cum ar fi cea <strong>de</strong> cercetare, <strong>de</strong><br />
învăţare, şi proceselor administrative. Repo<strong>si</strong>tory utilizează standar<strong>de</strong> internaţionale <strong>de</strong>schise,<br />
pentru a a<strong>si</strong>gura că conţinutul lor este acce<strong>si</strong>bil, astfel încât să poată fi cautat <strong>si</strong> preluat pentru<br />
o utilizare ulterioară. Utilizarea acestor standar<strong>de</strong> acceptate internaţional permite stabilirea <strong>de</strong><br />
strategii pentru importul, exportul, i<strong>de</strong>ntificarea, stocarea şi regă<strong>si</strong>rea conţinutului digital în<br />
repo<strong>si</strong>tory.<br />
Biblioteca Digitală (DL) este un <strong>si</strong>stem care oferă acces larg la o colecţie mare, gestionabilă<br />
<strong>de</strong> informaţii, organizată peste un repo<strong>si</strong>tory <strong>de</strong> cunoştinţe. Tema unificatoare a unei biblioteci<br />
digitale este aceea că informaţia este organizată pe calculatoare organizate în reţea, având<br />
proceduri pentru selectarea materialelor din colecţii, pe care le organizează, le pune apoi la<br />
dispoziţia utilizatorilor, şi le arhivează.<br />
Aici, utilizatorii nu au acces doar la conţinutul digital din repo<strong>si</strong>tory, mai mult, ei au<br />
instrumente pentru a re-organiza şi îmbogăţi conţinutul prin adnotari, construirea colecţiilor,<br />
şi bookmarking.<br />
O bibliotecă digitală trebuie să gestioneze documente compuse, ceea ce este o caracteristică<br />
DL. Documentele compuse poat fi <strong>de</strong>stul <strong>de</strong> complexe, şi <strong>de</strong> multe ori conţin mai multe<br />
documente multimedia, în cazul în care componentele sunt obiecte digitale la propriu, sau<br />
doar <strong>si</strong>mple adnotări. Un obiect compus ar putea fi o intreaga baza <strong>de</strong> date.<br />
Termenii "repo<strong>si</strong>tory" şi "biblioteci digitale" sunt confundaţi <strong>de</strong> multe ori. Pentru restul<br />
acestei teze, vom folo<strong>si</strong> fiecare termen în conformitate cu <strong>de</strong>finiţiile <strong>de</strong> mai sus.<br />
Soergel în [164] <strong>de</strong>fineşte repo<strong>si</strong>tory-ul digital în termenii funcţionalităţii (servicii oferite<br />
bibliotecii digitale):<br />
Un repo<strong>si</strong>tory este o bibliotecă digitală care oferă acces doar la o colecţie <strong>de</strong> elemente<br />
cunoscute.<br />
Funcţiile repo<strong>si</strong>tory-ul includ <strong>si</strong> achizitionarea <strong>de</strong> documente, stocarea în condiţii <strong>de</strong> <strong>si</strong>guranţă,<br />
<strong>de</strong> conservare, <strong>de</strong> control al ver<strong>si</strong>unii, căutarea documentelor şi prezentarea lor.<br />
Un repo<strong>si</strong>tory, <strong>de</strong> asemenea, are nevoie <strong>de</strong> un mo<strong>de</strong>l <strong>de</strong> document care <strong>de</strong>fineşte structura<br />
logică a documentului şi modul în care un document este accesat şi manipulat în scopul<br />
gestionării, cum ar fi mo<strong>de</strong>lul bazat pe XML Document Object (DOM) [90] (a se ve<strong>de</strong>a<br />
Wikipedia), sau Fedora Digital Object Mo<strong>de</strong>l [62].<br />
14
Obiectul digital<br />
Obiectele digitale (sau materiale digitale) se referă la orice element care este disponibil<br />
digital. Termenul cuprin<strong>de</strong> atât surogate digitale create ca rezultat al convertirii materialelor<br />
analoge în formă digitală (digitizare), cât şi cele "născute digital", pentru care nu a existat<br />
niciodată şi nu există nici o intenţie <strong>de</strong> creere a unui echivalent analogic.<br />
Agregările (Colecţii)<br />
Colecţia este o agregare <strong>de</strong> obiecte digitale împreună cu relaţiile dintre ele. Colecţiile, în<br />
general, suportă următoarele funcţii:<br />
• selectarea <strong>de</strong> conţinut: selectarea unui subset <strong>de</strong> obiecte disponibile;<br />
• organizarea: aplicarea unor principii coerente <strong>de</strong> ordonare;<br />
• documentaţie: metadatele contextuale, moştenite şi administrative; şi<br />
• arhivare: administrare pe termen lung.<br />
Figure 2. 1. Relaţiile dintre repo<strong>si</strong>tory-ul digital, CMS şi biblioteci digitale<br />
2.2. Lucrări inrudite şi discutarea acestora în cadrul platformelor<br />
implementate<br />
Abordări <strong>si</strong>milare se găsesc în cadrul proiectului APOSDLE 1 care are ca scop un proces <strong>de</strong><br />
mo<strong>de</strong>lare integrată a ontologiilor şi fluxurile <strong>de</strong> lucru. APOSDLE utilizează Semantic<br />
MediaWiki (SMW) pentru <strong>de</strong>zvoltarea colaborativă <strong>de</strong> mo<strong>de</strong>le informale create printr-o<br />
strânsă integrare, în mare parte automata, cu Semantic MediaWiki şi cu instrumente pentru<br />
mo<strong>de</strong>larea formală, în scopul <strong>de</strong> a reutiliza mo<strong>de</strong>le informale pentru crearea <strong>de</strong> mo<strong>de</strong>le<br />
formale.<br />
O altă abordare, folo<strong>si</strong>nd şabloane pentru extragerea <strong>de</strong> informaţii structurate din MediaWiki<br />
este prezentată în [7], dar această abordare nu a formalizat fluxul <strong>de</strong> lucru. Un studiu <strong>de</strong> caz a<br />
unei creări <strong>de</strong> biblioteci digitale folo<strong>si</strong>nd MediaWiki pe partea <strong>de</strong> interfaţă cu repo<strong>si</strong>tory-ul<br />
este prezentată în [175].<br />
Comparativ, cazurile <strong>de</strong> integrare a datelor în MediaWiki şi SMW ca platformă pentru VREs<br />
nu are realizari concrete comparabile cu abordarea noastră, medii virtuale <strong>de</strong> învăţare (VLEs)<br />
[133] sunt mai interesate <strong>de</strong> probleme <strong>si</strong>milare şi punctează aceleaşi neajunsuri în domeniul<br />
<strong>de</strong> integrării datelor. Aceasta oferă po<strong>si</strong>bilitatea <strong>de</strong> recon<strong>si</strong><strong>de</strong>ra experienţa acumulată în<br />
această directive, adaptand-o şi extinzând-o să fie compatibilă abordării nevoilor specifice ale<br />
mediilor <strong>de</strong> cercetare.<br />
Un alt mod <strong>de</strong> trata fluxurile <strong>de</strong> lucru pot fi gă<strong>si</strong>te în myExperiment. De Roure con<strong>si</strong><strong>de</strong>ră că<br />
fluxurile <strong>de</strong> lucru sunt obiecte ştiinţifice în <strong>si</strong>ne şi, prin urmare, acestea ar putea fi schimbate<br />
1 Advanced Process-Oriented Self-Directed Learning Environment http://www.aposdle.org<br />
15
şi reutilizate. myExperiment este o nouă iniţiativă pentru a crea un mediu <strong>de</strong> reţea socială a<br />
lucrătorilor în domeniul fluxurilor <strong>de</strong> lucru [43]. Luând exemplu paradigma reţelelor sociale,<br />
obiectul partajat în acest caz este fluxul <strong>de</strong> lucru în <strong>si</strong>ne.<br />
Un alt proiect VLE folo<strong>si</strong>nd ca suport pentru tehnologiile semantice SMW este OceanTeacher<br />
UNESCO. Aceasta este o bibliotecă digitală <strong>de</strong> cunoştinţe referitoare la date oceanografice şi<br />
<strong>de</strong> asemenea, permite gestionarea informaţiilor dinamice. Acesta inclu<strong>de</strong> texte, imagini,<br />
obiecte (PDF şi documente Word, pachetele <strong>de</strong> instalare <strong>de</strong> software, fişiere audio şi vi<strong>de</strong>o) şi<br />
legături către pagini web şi obiecte din alte <strong>si</strong>te-uri. Proiectul construieşte o platforma <strong>de</strong> e-<br />
Learning în domeniu. Metadatele marine sunt colectate automat <strong>de</strong> la senzori <strong>si</strong> traduse în<br />
proprietăţi SMW. Ulterior, metadatele sunt verificate şi validate manual. Deşi proiectul<br />
importă diferite documente, el nu integrează metadate eterogene, care sunt <strong>de</strong> interes în<br />
abordarea noastră.<br />
Un punct <strong>de</strong> plecare comun cu abordarea noastră este [38], care îşi propune sa construiască o<br />
platformă <strong>de</strong> integrare a datelor. Structura <strong>de</strong> interoperabilitate este stratificată şi urmăreşte<br />
în<strong>de</strong>aproape mo<strong>de</strong>lul ISO / OSI pentru crearea <strong>de</strong> reţele. Ei folosesc ontologia mediator<br />
pentru mapare, cu toate acestea nu utilizează în mod explicit un flux <strong>de</strong> lucru pentru aceasta.<br />
Dimpotrivă, fluxul <strong>de</strong> lucru este susţinut <strong>de</strong> mediul BiomedGT [18]. Acest mediu extin<strong>de</strong><br />
Semantic MediaWiki pentru a sprijini roluri specifice în BiomedGT (<strong>de</strong> exemplu, IMM-uri,<br />
Alpha IMM-uri, curator, etc), procesele create fiind utilizate pentru susţinerea <strong>de</strong> propuneri <strong>de</strong><br />
proiecte şi pentru sugerarea modificărilor. În mod <strong>si</strong>milar, coefficientMakna [161] -, <strong>de</strong><br />
asemenea, bazat pe o platformă wiki - este conceput în mod explicit să sprijine platforma <strong>de</strong><br />
argumentare DILIGENT pentru ingineria ontologiei.<br />
În [126] autorii a propus o <strong>de</strong>scriere directă pentru protocolul <strong>de</strong> laborator biologic, <strong>de</strong>finind<br />
fără ajutorul codării menţinerea şi reutilizarea specificaţiilor protocolului laboratorului, având<br />
astfel rezultate clare, uşor <strong>de</strong> citit şi <strong>de</strong> menţinut.<br />
Apropiat şi mai mult cu munca noastră este [70]. Gill şi alţii utilizează Wings şi Pegasus<br />
pentru crearea <strong>de</strong> fluxuri <strong>de</strong> lucru pentru calculul in grid folo<strong>si</strong>nd reprezentari semantice. Ei<br />
folosesc şabloane <strong>de</strong> flux <strong>de</strong> lucru şi ontologii <strong>de</strong> flux <strong>de</strong> lucru exprimate în RDF. Principala<br />
diferenţă este contextul în care sunt utilizate fluxurile <strong>de</strong> lucru: calculul în grid şi nu<br />
gestionarea repo<strong>si</strong>tory.<br />
Deşi aceste lucrari au abordări <strong>si</strong>milare cu abordarea tezei, acestea acoperă doar parţial soluţia<br />
noastră. Aşa cum se va arăta pe parcursul tezei, am preluat, mixat şi flexibilizat părţi ale<br />
<strong>si</strong>stemului OAIS pe care l-am îmbogăţit cu facilitaţi semantice şi fluxuri <strong>de</strong> lucru automate.<br />
Am introdus suportului software-ului social pentru partajarea rezultatelor, a documentaţiei, a<br />
tratatelor şi politicilor dar şi ca suport pentru tehnologii semantice <strong>si</strong>mplificate: <strong>de</strong>scrierea<br />
fluxurilor <strong>de</strong> lucru, configurarea <strong>si</strong>stemelor, dispecerizarea proceselor <strong>de</strong> management,<br />
validarea metadatelor.<br />
16
3. STUDIU PRIVIND MODELELE<br />
DE REPOSITORY, BIBIOTECI<br />
DIGITALE ŞI SISTEMELE DE<br />
MANAGEMENT AL<br />
CONŢINUTULUI<br />
Acest capitol prezintă mai multe <strong>si</strong>steme care facilitează stocarea producţiei intelectuale -mai<br />
mult sau mai puţin structurate- a unei organizaţii sau comunităţi.<br />
Capitolul conţine un studiu al literaturii <strong>de</strong> specialitate pentru consolidarea terminologiei<br />
utilizate. Am efectuat două studii pe această temă, care duc la elucidarea managementului<br />
repo<strong>si</strong>tory digital, atingând şi problematica bibliotecilor digitale, şi (Semantic) Social<br />
Software-ul din două puncte <strong>de</strong> ve<strong>de</strong>re diferite.<br />
În primul rând, vom prezenta mo<strong>de</strong>lele <strong>de</strong> repo<strong>si</strong>tory digital şi vom i<strong>de</strong>ntifica principalele<br />
mo<strong>de</strong>le <strong>de</strong> referinţă care stau la baza implementările pentru bibliotecile digitale,<br />
constrângerile şi limitele acestora. În al doilea rând, am efectuat un studiu privind (Semantic)<br />
MediaWiki. În cele din urmă, vom analiza repo<strong>si</strong>tory-le digitale partajate şi beneficiile aduse<br />
<strong>de</strong> acestea.<br />
În mediile <strong>de</strong> informare mo<strong>de</strong>rne, există mai multe <strong>si</strong>steme pentru stocarea şi / sau extragerea<br />
materialelor. Având în ve<strong>de</strong>re funcţionalităţile <strong>si</strong>milare a diverselor <strong>si</strong>steme, <strong>de</strong>cizia <strong>de</strong> a plasa<br />
producţia intelectuală a instituţiei este a<strong>de</strong>sea una dificilă.<br />
CMS sau wiki-urilor nu oferă instrumente <strong>de</strong>dicate pentru a a<strong>si</strong>gura accesul continuu pentru<br />
<strong>de</strong>scoperire <strong>de</strong> noi resurse digitale caracteristic software-ul repo<strong>si</strong>tory-ului digital. De obicei,<br />
ele nu le oferă interfeţe OAIs. Facilităţile <strong>de</strong> import / export a metadatelor bibliografice sunt<br />
slabe sau inexistente.<br />
3.1. Principalele mo<strong>de</strong>le <strong>de</strong> repo<strong>si</strong>tory şi biblioteci digitale<br />
În afară <strong>de</strong> convergenţa <strong>de</strong> interese, gestionarea repo<strong>si</strong>tory digital constă dintr-un set puternic<br />
personalizabil <strong>de</strong> procese şi practici, în conformitate cu mo<strong>de</strong>lul <strong>si</strong>stemului <strong>de</strong> repo<strong>si</strong>tory,<br />
conţinutul repo<strong>si</strong>tory-lui şi <strong>de</strong> <strong>de</strong>stinaţia pe care comunitatea care îl utilizează şi doreşte să<br />
beneficieze din el a stabilit-o iniţial.<br />
Mo<strong>de</strong>le principale pentru repo<strong>si</strong>tory-le şi bibliotecile digitale sunt în general împărţite în<br />
următoarele categorii:<br />
A. Mo<strong>de</strong>le formale - 5S (Streams, Spaces, Structures, Scenarios, Society) este cel mai<br />
cunoscut mo<strong>de</strong>l formal <strong>de</strong> bibliotecă digitală [71]. Principalele caracteristici ale acestui<br />
mo<strong>de</strong>l sunt:<br />
o construcţii foarte generale<br />
o granularitatea prea fină la nivelul spaţiului<br />
o este concentrat asupra unei DL minime<br />
o calitatea metadatelor este abordată în alt strat<br />
o abordare comportamentală pentru serviciile oferite prin scenarii<br />
o doar o implementare cunoscută - Marian-framework.<br />
B. Mo<strong>de</strong>le <strong>de</strong> referinţă - Reference Mo<strong>de</strong>l for an Open Archival Information System (OAIS)<br />
[173]. Mo<strong>de</strong>le <strong>de</strong>rivate din OAIS sunt:<br />
a. Three Tier Framework Reference Mo<strong>de</strong>l - cunoscut şi sub numele <strong>de</strong> mo<strong>de</strong>lul Delos [29]; şi<br />
17
. CIDOC Conceptual Reference Mo<strong>de</strong>l [32].<br />
Acest mo<strong>de</strong>l este folo<strong>si</strong>t în principal pentru managementul repo<strong>si</strong>tory-ului în conformitate cu<br />
mo<strong>de</strong>lul producător-consumator, aşa cum este promovat <strong>de</strong> OAIS [173]. Principalele<br />
caracteristici sunt după cum urmează:<br />
• abordare mai pragmatică, privind funcţionalitatea la acelaşi nivel cu <strong>de</strong>scrierea<br />
entităţilor;<br />
• granularitatea este menţinută la nivel entitate<br />
• <strong>de</strong>scriere conceptelor principale şi relaţiilor care caracterizează întregul univers al unei<br />
DL<br />
• calitatea (metadate şi servicii), abordată în mod explicit pe acelaşi strat<br />
• servicii numite explicit<br />
• a<strong>si</strong>gurarea integrării documentaţiei<br />
• există mai multe implementari conforme cu mo<strong>de</strong>lul: Delos, DSpace [61], METS, etc<br />
C. Mo<strong>de</strong>l semantic <strong>de</strong> bibliotecă digitală. Acest mo<strong>de</strong>l se bazează pe mo<strong>de</strong>lul OAIS, dar<br />
permite granularităţi mai fine privind structura şi serviciile oferite utlizatorilor finali.<br />
• concentrat asupra adaptabilităţii şi serviciilor avansate folo<strong>si</strong>nd tehnologii semantice la<br />
mai multe niveluri.<br />
• perspective utilizator diferite şi foarte bine adresate<br />
• soluţie <strong>de</strong>-a gata, nu foarte uşor adaptabilă şi nu foarte uşor <strong>de</strong> utilizat pentru<br />
comunităţile mici.<br />
• o <strong>si</strong>ngură implementare "curată semantic" - JeromeDL [112].<br />
Aceste mo<strong>de</strong>le ating două extreme: formalizarea prea multă la mo<strong>de</strong>lul 5S, dar <strong>de</strong>scriere<br />
foarte bună la nivel structural, şi mo<strong>de</strong>lul Delos, nu foarte uşor adoptabil <strong>de</strong> către o<br />
comunitate mică şi mijlocie, având un nivel scăzut <strong>de</strong> expertiză tehnică.<br />
Este <strong>de</strong> subliniat faptul că gestionarea repo<strong>si</strong>tory-ului este cea mai mare parte o <strong>de</strong>cizie<br />
administrativă mediată <strong>de</strong> software. Mo<strong>de</strong>lul conţinutului repo<strong>si</strong>tory digital, a obiectelor<br />
digitale, producţia <strong>de</strong> fluxuri <strong>de</strong> lucru, mo<strong>de</strong>lul <strong>de</strong> rapoartare se stabilesc într-o abordare <strong>de</strong><br />
sus în jos.<br />
3.2. Sisteme <strong>de</strong> partajare a cunoştinţelor<br />
MediaWiki şi Semantic MediaWiki, ca exemple <strong>de</strong> <strong>si</strong>steme <strong>de</strong> explicite <strong>de</strong> colaborare în<br />
masă, (Mass Collaboration) sunt menite să partajeze cunoştinţele. Sociabilitatea centrată pe<br />
obiect (object-centred sociality) se referă la utilizarea în viaţa reală a <strong>si</strong>te-uri sociale:<br />
• utilizarea semanticii pentru a <strong>de</strong>scrie această utilizare, prin reprezentarea obiectelor<br />
centrat pe conectare puternică şi reutilizare;<br />
• <strong>de</strong>scrie oameni, reţele, conţinut, prezenţa, cunoştinţe, tag-uri, etc şi semantica acestora<br />
• interconectare <strong>si</strong>turilor disconecte şi a profilelor utilizator: beneficiază <strong>de</strong> o<br />
"vocabulary onion", a ontologiilor prin furnizarea <strong>de</strong> soluţii permiţând noi utilizări în<br />
cadrul organizaţiilor, nu doar pentru Web-ul social, dar chiar pentru Enterprise 2.0.<br />
Deşi cunoştinţele încorporate în interiorul unui wiki sunt uşor <strong>de</strong> accesat <strong>de</strong> către om, acest<br />
lucru însă <strong>de</strong>vine dificil pantru agenţii automaţi care trebuie să re-utilizeze şi să preia<br />
informaţii din wiki. Soluţiile cunoscute sunt după cum urmează:<br />
• utilizarea <strong>de</strong> template-uri;<br />
• structurarea informaţiilor wiki prin adoptarea tehnologii semantice <strong>si</strong>mplificate.<br />
Acest capitol mai prezintă un studiu actualizat pentru wiki-uri semantice, cu accent pe<br />
Semantic MediaWiki. Am ales SMW, <strong>de</strong>oarece prezintă o soluţie echilibrată care să permită<br />
adoptarea semanticii <strong>si</strong>mplificate. Am prezentat, <strong>de</strong> asemenea, o metodă hibridă <strong>de</strong> structurare<br />
a informaţiei wiki, care combină şabloane semantic, împreună cu metadatele pentru a permite<br />
fluxul <strong>de</strong> lucru automat pentru gestionarea repo<strong>si</strong>tory.<br />
18
Din punct <strong>de</strong> ve<strong>de</strong>re tehnologic, wiki-urile sunt profiluri <strong>de</strong> aplicaţie pentru un mo<strong>de</strong>l comun,<br />
mo<strong>de</strong>lul MediaWiki. Similar, wiki-urile semantice sunt profiluri <strong>de</strong> aplicaţie pentru un mo<strong>de</strong>l<br />
comun Semantic MediaWiki.<br />
Câteva caracteristici ale wiki-urilor semantice sunt amintit <strong>de</strong> mai jos:<br />
• semantica este introdusă ca informaţie suplimentară prin marcaje semantice adaugate<br />
manual <strong>de</strong> către utilizatori.<br />
• un utilizator poate marca atât link-uri cât şi text pe o pagină wiki.<br />
• informaţii speciale aşa cum sunt Categoriile şi Proprietatile sunt utilizate pentru a<br />
marca paginile wiki. Un utilizator nu este necesar să înţeleagă ontologii sau RDF<br />
pentru a putea adăuga marcaje semantice.<br />
• Utilizatorii pot adăuga noi categorii şi să creeze noi proprietăţi semantice, dar este<br />
intot<strong>de</strong>auna recomandata reutilizarea categoriile şi a proprietăţilor <strong>de</strong>ja existente.<br />
Informaţiile <strong>de</strong> marcare adăugate sunt utilizate <strong>de</strong> motorul wiki semantic pentru a facilita<br />
căutarea semantică. Există un limbaj special <strong>de</strong> căutare, facil <strong>de</strong> utilizat <strong>de</strong> către utilizatorul<br />
obişnuit.<br />
Capacitatea <strong>de</strong> căutare impre<strong>si</strong>onantă oferit <strong>de</strong> motorul wiki semantic poate fi cu greu egalată<br />
<strong>de</strong> orice alt <strong>si</strong>te wiki traditional, şi totul este rezultatul marcajului <strong>si</strong>mplu pe care utilizatorii<br />
doresc să îl adauge.<br />
3.3. Repo<strong>si</strong>tory-uri multimedia interne şi partajate<br />
Intens utilizate în achiziţia <strong>de</strong> cunoştinţe bazată pe inteligenţă calculatoarelor, repo<strong>si</strong>tory-ul<br />
partajat este cea mai bună completare a comunicării umane, educaţiei şi formării, care<br />
transce<strong>de</strong> constrângerile <strong>de</strong> timp şi spaţiu, oferind un răspuns în timp real şi o modalitate <strong>de</strong><br />
lucru în paralel. Este una din componentele <strong>de</strong> bază a spaţiilor colaborative, reducând foarte<br />
mult pier<strong>de</strong>rile cauzate <strong>de</strong> interacţiunea directă a personalului.<br />
Un wiki poate folo<strong>si</strong> imagini din propriul său repo<strong>si</strong>tory mass-media (intern) sau din alte<br />
repo<strong>si</strong>torye externe partajate <strong>de</strong> către mai mulţi consumatori. Pentru aceşti membrii ai familiei<br />
wiki, comunitatea poate crea, <strong>de</strong> asemenea, o a doua locaţie pentru fişierele provenite dintr-o<br />
sursă externă; cunoscută sub numele “shared uploads” sau arhivă comună. De exemplu, o<br />
companie poate avea mai multe <strong>si</strong>t-uri MediaWiki şi are nevoie <strong>de</strong> un repo<strong>si</strong>tory <strong>de</strong> imagini<br />
comune [183].<br />
Aceste repo<strong>si</strong>tory-uri pot a<strong>si</strong>gura <strong>de</strong> asemenea acces comun la baza <strong>de</strong> date<br />
Accesul la arhivele partajate este a<strong>si</strong>gurat printr-un acces la baze <strong>de</strong> date pentru repo<strong>si</strong>tory-ul<br />
local sau printr-un serviciu xml, bazate pe API-uri web pentru un repo<strong>si</strong>tory la distanţă. Multe<br />
<strong>si</strong>te-uri wiki, numite “ferme wiki”, pot să partajeze un repo<strong>si</strong>tory local. Un unoscut repo<strong>si</strong>tory<br />
media acce<strong>si</strong>bil prin intermediul API este Wikimedia Commons 2 .<br />
La sfârşitul acestui capitol, sunt menţionate mai multe cazuri <strong>de</strong> utilizare şi aplicabilitate care<br />
folosesc SMW. Următorul capitol va prezenta un mo<strong>de</strong>l nou pentru gestionarea colaborativă a<br />
repo<strong>si</strong>tory digital, arhitectura <strong>si</strong> meto<strong>de</strong> rezumate aici ca profilurile <strong>de</strong> aplicaţii:<br />
• O platformă <strong>de</strong> authoring şi publicare on-line [78]<br />
• Utilizarea <strong>de</strong> şabloane MediaWiki ca formular invariant pentru implicarea<br />
utilizatorilor non-tehnici în întregul proces <strong>de</strong> gestionare a conţinutului digital [183]<br />
• Utilizarea mo<strong>de</strong>lului Semantic MediaWiki pentru gestionarea metadatelor în interiorul<br />
wiki [184].<br />
2 http://commons.wikimedia.org/<br />
19
4. UN MODEL CADRU<br />
CONCEPTUAL PENTRU<br />
MANAGEMENTUL<br />
COLABORATIV AL UNUI<br />
REPOSITORY DIGITAL<br />
Acest capitol prezintă un nou mo<strong>de</strong>l al ciclului <strong>de</strong> viaţă al obiectului digital gestionabil prin<br />
noul concept <strong>de</strong> management colaborativ al unui repo<strong>si</strong>tory digital.<br />
În acest capitol vom colecta şi analiza cerinţele pentru mo<strong>de</strong>lul <strong>de</strong> management al repo<strong>si</strong>toryului<br />
digital (DRMM). În scopul <strong>de</strong> a sprijin diferitele cazuri <strong>de</strong> utilizare al noului concept <strong>de</strong><br />
management colaborativ al repo<strong>si</strong>tory-ului <strong>de</strong> metadate, vor fi introduse meto<strong>de</strong> care permit<br />
individualizarea în arhitecturi şi implementări concrete.<br />
Diagrama <strong>de</strong> mai jos <strong>de</strong>scrie procesul incremental şi crescător <strong>de</strong> dobândirea a cunoştinţelor şi<br />
<strong>de</strong> partajare a acestora în epoca Web 2.0. Acest proces presupune implicarea în egală măsură<br />
a indivizilor şi a comunităţii din care aceştia fac parte. Ei vor transfera cunoştinţe la mai multe<br />
niveluri. Fiecare participant este atât producător cât şi consumator, dar nu numai atât. Acest<br />
pas, <strong>de</strong> la mo<strong>de</strong>lul <strong>de</strong> producător-consumator (unu-la-mai-mulţi) la mo<strong>de</strong>lul crează–<br />
remixează–partajează (mai-multe-la-mai-mulţi), modifică, <strong>de</strong> asemenea, toate aspectele legate<br />
<strong>de</strong> gestionarea conţinutului [128]. Aspecte legate <strong>de</strong> granularitatea conţinutului, tipologia<br />
conţinutului şi a metadatelor, trebuie să fie reexaminate şi gestionate colaborativ. Următoarea<br />
diagramă ilustrează dobândirea <strong>de</strong> cunoştinţe prin mo<strong>de</strong>lul cu partajare care este bidirecţional.<br />
Aceste observaţii stau la baza abordării noastre pentru mo<strong>de</strong>lul <strong>de</strong> management<br />
colaborativ al unui repo<strong>si</strong>tory digital.<br />
Figure 4. 1. Dobândirea <strong>de</strong> cunoştinţe prin mo<strong>de</strong>lul crescător cu partajare<br />
4.1. Scenarii <strong>de</strong> utilizare<br />
Să con<strong>si</strong><strong>de</strong>răm următoarele două scenarii ca şi cazuri <strong>de</strong> utilizare:<br />
20
Primul scenariu vizează un proiect în domeniul biodiver<strong>si</strong>tăţii menit să ducă la îmbunătăţirea<br />
<strong>de</strong>scoperirii instrumentelor <strong>de</strong> i<strong>de</strong>ntificare a biodiver<strong>si</strong>tăţii şi a resurselor digitale disponibile.<br />
Metoda <strong>de</strong> cercetare nece<strong>si</strong>tă construirea unui repo<strong>si</strong>tory digital central <strong>de</strong> metadate pentru a<br />
facilita accesul, utilizarea şi re-utilizare a resurselor digitale. În plus, partenerii îşi propun să<br />
atragă alte surse <strong>de</strong> metadate, din colecţii private şi publice sau din Wikimedia Commons,<br />
Flicr sau alte surse multimedia partajate în web. Scopul final este <strong>de</strong> a construi un repo<strong>si</strong>tory<br />
<strong>de</strong> eLearning în biologie.<br />
Consorţiul intenţionează să menţină repo<strong>si</strong>tory-ul <strong>de</strong> metadate după finalizarea proiectului şi<br />
după ce sprijinul financiar va scă<strong>de</strong>a în mod substanţial. Prin urmare, pentru a sprijini<br />
infrastructura proiectului a fost con<strong>si</strong><strong>de</strong>rată obligatorie construirea unei platforme <strong>de</strong><br />
documentare comune pentru publicarea problemelor tehnice şi pentru managementul<br />
proiectului.<br />
Resursele digitale sunt distribuite într-un număr <strong>de</strong> surse – la furnizorii <strong>de</strong> date, şi au un grad<br />
ridicat <strong>de</strong> eterogenitate tehnică, în format, structura şi semantică. Decizia finală a fost <strong>de</strong> a<br />
stoca centralizat doar metadatele, iar resursele multimedia să rămână în continuare pe<br />
<strong>si</strong>stemele locale ale furnizorilor <strong>de</strong> metadate.<br />
Furnizorii <strong>de</strong> date sunt muzee, instituţii <strong>de</strong> cercetare în biologie şi univer<strong>si</strong>tăţi. Ei sunt, <strong>de</strong><br />
asemenea, utilizatorii finali, împreună cu profesori <strong>de</strong> biologie pentru liceu, elevi şi stu<strong>de</strong>nţi.<br />
Cerinţele menţionate anterior au fost acompaniate şi <strong>de</strong> probleme tehnice şi organizatorice:<br />
nivelul <strong>de</strong> expertiză tehnică a variat <strong>de</strong> la inginer IT la biolog <strong>si</strong> fotograf.<br />
Figure 4. 2. Procesul <strong>de</strong> integrare a metadatelor în repo<strong>si</strong>tory-ul digital central.<br />
In al doilea scenariu, Chris, un istoric, doreşte să construiască un mediu virtual <strong>de</strong> cercetare<br />
(VRE), având ca subiect istoria educaţiei. Este necesar să se preconizeze o solutie web pentru<br />
cercetători, care să faciliteze adnotarea colaborarativă a corpusului cu o infrastructură care să<br />
permită integrarea instrumentelor externe, analizarea datelor şi publicarea rezultatelor<br />
cercetării.<br />
În primul rând, se intenţionează să se creeze infrastructura <strong>de</strong> VRE pentru integrarea surselor<br />
externe într-o platformă web colaborativă. Principalii furnizori ai viitorului VRE sunt<br />
bibliotecile digitale, proprietarii legali ai corpusurilor - lexicoane în istoria învăţământului –<br />
sub format digital. Paginile lexicoanelor (lemma) sunt reprezentate <strong>de</strong> imagini; capitole<br />
lexicoanelor sunt înregistrări <strong>de</strong> metadata iar înregistrările sunt agregate în volume. Fiecare<br />
lexicon este reprezentat în bibliotecă digitală <strong>de</strong> o colecţie digitală.<br />
Construcţia arhitecturii mo<strong>de</strong>lului DRM este, prin urmare, o combinaţie <strong>de</strong> părţi a diferitelor<br />
mo<strong>de</strong>le: (1) cerinţele şi obiectivele DRM prin viziunea mo<strong>de</strong>lului <strong>de</strong> bu<strong>si</strong>ness (mo<strong>de</strong>l <strong>de</strong> flux<br />
<strong>de</strong> lucru), (2) din studierea ghidului <strong>de</strong> funcţionalităţile (forward engineering), şi (3)<br />
specificaţiile <strong>de</strong> servicii ale implementărilor existente (reverse engineering), (4) extrase din<br />
abordările <strong>si</strong>milare din literatură, (5) feedback-ul utilizatorilor. Soluţia este combinarea<br />
primele trei surse într-un mo<strong>de</strong>l <strong>de</strong> referinţă complet şi o arhitectură concretă. Părţile comune<br />
între mo<strong>de</strong>le ne dau încre<strong>de</strong>re în convergenţa abordării noastre. Astfel, arhitectura reprezintă o<br />
abordare comună a tuturor părţilor implicate şi poate fi văzută ca o “foaie <strong>de</strong> parcurs” în<br />
ve<strong>de</strong>rea realizării DRM. În următoarele secţiuni vom prezenta câteva dintre cerinţele pe care<br />
21
am con<strong>si</strong><strong>de</strong>rat ca fiind <strong>de</strong>osebit <strong>de</strong> reprezentative pentru stabilirea mo<strong>de</strong>lului <strong>de</strong> DRM, şi<br />
astfel vom releva o listă <strong>de</strong> functionalitaţi noi extrase din aceste scenarii.<br />
Table 4.1. Centralizarea cerinţelor şi alinierea acestora<br />
Cod Nume Cerinţele<br />
utilizatorilor<br />
W01. Interfaţă utilizator<br />
intuitivă<br />
W02. Suport pentru<br />
feedback.<br />
W03. Funcţionalitate <strong>de</strong><br />
punere la zi facilă<br />
W04. Granularitate fină a<br />
informaţiei.<br />
W05. Suport pentru<br />
documentaţie şi<br />
ghiduri online<br />
22<br />
Cerinţele<br />
repo<strong>si</strong>tory digital<br />
U05 R01 C08<br />
U07<br />
W06. Multilingualism U06<br />
W07. Conţinut admiţând<br />
linkuri incrucişate<br />
W08. Integrarea cu alte<br />
CMS sau aplicatii<br />
Semantic Web<br />
W09. I<strong>de</strong>ntificatori<br />
per<strong>si</strong>stenţi<br />
W10. Funcţionalitate <strong>de</strong><br />
căutare intuitivă<br />
U03, U05, U09<br />
U01, U04 C01<br />
U09 C08<br />
U03 C02<br />
U09 R04, R05, R08,<br />
R09<br />
Cerinţele unui<br />
<strong>si</strong>stem <strong>de</strong><br />
semantic content<br />
management<br />
C03<br />
R07 C04<br />
U03 R02 C05<br />
W11. Navigare facilă U03 C06<br />
W12. Gra<strong>de</strong> diferite <strong>de</strong><br />
formalizare a<br />
informaţiei<br />
W13. Urmărirea<br />
modificărilor şi<br />
controlul ver<strong>si</strong>unii<br />
W14. Managementul<br />
drepturilor <strong>de</strong><br />
acces.<br />
W15. Acces <strong>de</strong>schis la<br />
obiecte.<br />
W16. Separarea datelor<br />
<strong>de</strong> metadate.<br />
U01, U02 C06<br />
U07, U08 R07 C10<br />
U05 R01 C09<br />
U05, U07 R01 C05<br />
U02 R03, R10 C06
4.2. Descrierea mo<strong>de</strong>lelui <strong>de</strong> referinţă propus<br />
4.2.1. Metodologia<br />
Obiectivul este <strong>de</strong> a gestiona colaborativ un repo<strong>si</strong>tory cu facilităţi semantice. Repo<strong>si</strong>tory-ul<br />
semantic va fi folo<strong>si</strong>t pentru a gestiona, integra şi <strong>de</strong> a crea arhitecturi din mai multe surse şi<br />
pentru utilizarea instrumentelor bazate pe diferite limbaje şi tehnologii. Ipo<strong>teza</strong> <strong>de</strong> cercetare<br />
nu susţine că mo<strong>de</strong>lul semantic <strong>de</strong> repo<strong>si</strong>tory şi <strong>de</strong> infrastructură vor fi necesare sau potrivite<br />
pentru toate cazurile <strong>de</strong> utilizare. În acest scop, repo<strong>si</strong>tory-ul semantic trebuie să fie capabil <strong>de</strong><br />
a trata cu arhitecturi exprimate în diferit limbaje <strong>de</strong> mo<strong>de</strong>lare şi expre<strong>si</strong>i idiomatice. Limbajele<br />
pentru proiectarea arhitecturilor sunt: UML, OWL, BPMN, RDFS şi XML, precum şi alte<br />
unelte în format propriu.<br />
Repo<strong>si</strong>tory-ul digital cu comportament semantic este necesar pentru a înţelege semantica<br />
încorporată în diverse arhitecturi exprimate folo<strong>si</strong>nd aceste formalisme şi a facilita o viziune<br />
comună coerentă a mo<strong>de</strong>lului <strong>de</strong> bu<strong>si</strong>ness.<br />
Pentru atingerea interoperabilităţii semantice este necesară o infrastructură <strong>de</strong> legatură care<br />
nece<strong>si</strong>tă o abordare MDA sau RDFS, sau ambele. Datorită intenţiei <strong>de</strong> mediere a acestor<br />
infrastructuri (cerinţa <strong>de</strong> bi-directionalitate a interfeţei cu <strong>si</strong>stemele din ambele medii pe care<br />
le leagă) şi în ambele sensuri (arhitectura ar trebui să admită inversă), mo<strong>de</strong>lul <strong>de</strong> referinţă<br />
poate fi folo<strong>si</strong>t din oricare punct <strong>de</strong> ve<strong>de</strong>re. RDFS este selectat ca fiind "limbaj <strong>de</strong> bază" şi iar<br />
MDA ca limbaj <strong>de</strong> mapare.<br />
Această nouă abordare prezentată în cele ce urmează îşi propune să combine ontologii şi<br />
fluxuri <strong>de</strong> lucru pentru protocoalele formalizate utilizate în managementul repo<strong>si</strong>tory.<br />
Fluxurile <strong>de</strong> lucru permit o reprezentare intuitivă a protocoalelor şi a resurselor. Specificaţiile<br />
fluxul <strong>de</strong> lucru pot fi stocate ca pagini wiki şi partajate în mod dual:<br />
1. reprezentare RDF şi mecanismul <strong>de</strong> şabloane SMW, şi<br />
2. limbajul standard XPDL prin exten<strong>si</strong>a Wikiing Pro Exten<strong>si</strong>on [47] (reprezentare<br />
grafică în BPMN).<br />
Prin intermediul ontologiilor, cunoştinţele referitoare la managementul repo<strong>si</strong>tory-ului digital<br />
pot fi direct integrate în mo<strong>de</strong>lul fluxului <strong>de</strong> lucru şi partajate utilizând mo<strong>de</strong>lul standard<br />
OWL, Web Ontology Language. În acest mod, constrângerile precis <strong>de</strong>finite în ontologii sunt<br />
transferate către blocurile <strong>de</strong> protocol (tasks sau actions). Protocoale pentru diferitele scenarii<br />
şi cazuri <strong>de</strong> utilizare sunt lip<strong>si</strong>te <strong>de</strong> ambiguitate folo<strong>si</strong>nd vocabularului comunităţii, şi astfel<br />
acţiunile importante sunt i<strong>de</strong>ntificate cu precizie.<br />
Ontologiile formale prezintă limitări atunci când <strong>de</strong>scriu protocoale. Structura modulară a<br />
proceselor <strong>de</strong> gestionare a repo<strong>si</strong>tory-ului nu este bine i<strong>de</strong>ntificată, iar acest lucru nu poate<br />
facilita refolo<strong>si</strong>rea <strong>de</strong> "blocuri <strong>de</strong> construcţie".<br />
Metoda <strong>de</strong> bază în managementul colaborativ al repo<strong>si</strong>tory-ului digital extin<strong>de</strong> mo<strong>de</strong>lul <strong>de</strong><br />
flux <strong>de</strong> lucru flexibil expus în [189] şi se bazează pe două mecanisme: şabloane wiki <strong>si</strong><br />
ontologia fluxului <strong>de</strong> lucru.<br />
În primul rând, mai multe tipuri şablon “recoltabil” au fost <strong>de</strong>zvoltate, având funcţionalităţi<br />
diferite, dar care vizează acelaşi obiectiv general: integrarea metadatelor. Fiecare tip <strong>de</strong> şablon<br />
recoltabil a fost <strong>de</strong>zvoltat ca o resursă şi are ataşat un şablon <strong>de</strong> flux <strong>de</strong> lucru. Ambele obiecte<br />
se stochează în stratul Mediator [183].<br />
În contrast cu structura binară utilizată pentru concepte şi indivizi, şabloanele sunt<br />
caracterizate printr-un triplet format în care elementul central este un predicat, şi anume, un<br />
nume <strong>de</strong> relaţie, care există între unul sau mai multe argumente introduse prin intermediul<br />
rolurilor. Formatul general al şablonului abstract este următorul:<br />
(Pi (R1 a1) (R2 a2)... (Rn an))<br />
În expre<strong>si</strong>a anterioară, Pi <strong>de</strong>notă o etichetă care <strong>de</strong>fineşte un şablon predicativ, Rk, k = 1,...,n,<br />
<strong>de</strong>fineşte <strong>si</strong>mbolic rolurile, iar ak, k = 1,...,n, <strong>de</strong>finesc <strong>si</strong>mbolic argumentele.<br />
23
Instanţele (ca evenimente predicative) din şabloanele predicative reprezintă evenimente unice,<br />
specifice, şi sunt în domeniul componentei factuale.<br />
Această abordare recon<strong>si</strong><strong>de</strong>ră rezultatul din [147], care stipulează faptul că clasele<br />
restricţionate <strong>de</strong> şabloane corespund cu tipul <strong>de</strong> gramatici Chomsky 1-3: senzitive la context,<br />
libere <strong>de</strong> context, şi regulate. O teoremă <strong>de</strong>mnonstrată <strong>de</strong> Parr afirmă că: şabloanele regulate<br />
generează limbaje regulate.<br />
De obicei, şabloanele operează cu un set <strong>de</strong> atribute. Atributele sunt văzute ca terminale<br />
(vocabulare) ale unei gramatici generative iar şabloanele sunt regulile <strong>de</strong> producţie. De<br />
exemplu, pentru XML <strong>de</strong>finiţiile tipului <strong>de</strong> document (DTD-uri) sunt, în esenţă gramatici<br />
libere <strong>de</strong> context, şi prin urmare, un şablon cu caracteristicile unei gramatici libere <strong>de</strong> context<br />
poate genera orice document XML <strong>de</strong>finibile printr-un DTD. Un motor <strong>si</strong>mplu pentru<br />
randarea unui şablon care emulează un automat “push-down” poate genera automat<br />
documente XML, şi astfel impune separarea strictă a mo<strong>de</strong>lului şi interfaţă [147].<br />
A doua componentă este o ontologie, numită ontologia fluxului <strong>de</strong> lucru [183], care reprezintă<br />
relaţiile între fluxurile <strong>de</strong> lucru, resurse şi utilizatori. Metoda combină mo<strong>de</strong>lul pentru<br />
managementul fluxului <strong>de</strong> lucru cu mo<strong>de</strong>lul <strong>de</strong> şablon pentru interoperabilitate. Utilizatorii,<br />
mesajele, şabloanele, metadatele sunt resurse.<br />
Un mo<strong>de</strong>l <strong>de</strong> flux <strong>de</strong> lucru poate fi privit din patru perspective, şi anume, controlul fluxului,<br />
fluxul <strong>de</strong> date, mo<strong>de</strong>lul organizaţional, şi constrângerile fluxului <strong>de</strong> lucru.<br />
Fluxul <strong>de</strong> control captează perspectiva structurală a fluxului <strong>de</strong> lucru şi se referă la ordinea <strong>de</strong><br />
executare a sarcinilor.<br />
Fluxul datelor <strong>de</strong>scrie elementele <strong>de</strong> date care sunt consumate, produse şi transferate <strong>de</strong> către<br />
activităţi şi construcţiile <strong>de</strong> direcţionare şi <strong>de</strong>pen<strong>de</strong>nţele lor. Ele sunt resurse <strong>de</strong> intrare-ieşire.<br />
Mo<strong>de</strong>lul organizaţional <strong>de</strong>fineşte fluxul <strong>de</strong> lucru asociat resurselor, cum ar fi utilizatorii,<br />
rolurile, unităţile organizatorice şi aplicaţii, precum şi relaţiile dintre ele.<br />
Figure 4. 3. Reprezentarea fluxului <strong>de</strong> lucru ca graf.<br />
Diagrama <strong>de</strong> mai sus prezintă o schemă <strong>si</strong>mplă a flux <strong>de</strong> lucru reprezentat sub forma unui<br />
graf. Fluxul <strong>de</strong> lucru este con<strong>si</strong><strong>de</strong>rat valid dacă şi numai dacă poate fi stabilită o relaţie <strong>de</strong><br />
mapare (din punct <strong>de</strong> ve<strong>de</strong>re <strong>si</strong>ntactic şi semantic) între fluxului <strong>de</strong> control <strong>de</strong> intrare şi <strong>de</strong><br />
ieşire a componentelor aferente. În mod <strong>si</strong>milar, aceleaşi tipuri <strong>de</strong> relaţii <strong>de</strong> mapare se vor<br />
stabili şi pentru fluxurile <strong>de</strong> date.<br />
24
Constrângerile fluxul <strong>de</strong> lucru servesc ca hub care conectează cele trei perspective menţionate<br />
mai sus prin specificarea <strong>de</strong> norme pentru executarea fluxului <strong>de</strong> lucru, cum ar fi normele <strong>de</strong><br />
rutare pentru nodurile <strong>de</strong> ramificare, atribuirea <strong>de</strong> resurse (şabloanele, fişiere <strong>de</strong> intrareieşire),<br />
şi alocarea elementele <strong>de</strong> date către activităţi.<br />
În continuare prezentăm mo<strong>de</strong>lul metadatelor pentru fluxul <strong>de</strong> lucru după cum urmează:<br />
Message = {Msg#, Msg, replyMsg}<br />
Document = {Doc#, Abstract, DocType, Doc}<br />
MetadataTemplate = {MetTemp#, Rules}<br />
Task = {Task#, User, Msg#, Doc#, ClientApps, InvokedApps, DispatchingRules,<br />
InputParameters, OutputParameters}<br />
TaskInstance = {TaskIns#, Task#}<br />
WorkflowTemplate = {WfTemp#, Task#, Tran<strong>si</strong>tion-Rules, MetTemp#}<br />
WorkflowInstance = {WfIns#, User, WfTemp#, OutputReport#}<br />
Figure 4. 4. Ontologia fluxului <strong>de</strong> lucru<br />
Ontologia aplicaţiei <strong>de</strong>fineşte precis semantica pentru activităţile referitoare la managementul<br />
repo<strong>si</strong>tory, în timp ce fluxurile <strong>de</strong> lucru sunt, în principal concepute pentru a le orchestra.<br />
I<strong>de</strong>ea a pornit <strong>de</strong> la mo<strong>de</strong>lul general care foloseşte ontologia fluxului <strong>de</strong> lucru şi care poate fi<br />
formalizat ca în figura [4. 5.].<br />
Mo<strong>de</strong>lul rafinează nivelurile <strong>de</strong> abstracţie în care fluxurile <strong>de</strong> lucru pot fi <strong>de</strong>finite, [173]<br />
introducând un strat <strong>de</strong> mediator <strong>de</strong> mapare, având mo<strong>de</strong>lul <strong>de</strong> software social ca suport.<br />
Acesta este nivelul <strong>de</strong> abstractizare care susţine managementul fluxului <strong>de</strong> lucru, monitorizare<br />
şi control. Deşi pare mai <strong>de</strong>grabă un mo<strong>de</strong>l tipic <strong>de</strong> flux <strong>de</strong> date, mo<strong>de</strong>lul este o <strong>si</strong>mplă<br />
adoptarea a unui mo<strong>de</strong>l hibrid adaptând limbjul folo<strong>si</strong>t <strong>de</strong> fluxul <strong>de</strong> date cu construcţii limitate<br />
tranzacţionale <strong>de</strong> control. Această abordare are cele mai bune şanse <strong>de</strong> a fi interoperabilă cu<br />
cele mai multe unelte şi platforme pentru ducerea la bun sfârşit a scopului tezei.<br />
Multe din elementele ontologiei aplicaţiei sunt adoptate din ontologia repo<strong>si</strong>tory digital, aşa<br />
cum sunt <strong>de</strong>finite în mo<strong>de</strong>lul 5Ss. Aceste elemente sunt transferate către clasa "Process" ca<br />
blocuri <strong>de</strong> component (taskuri) ale <strong>de</strong> fluxuri <strong>de</strong> lucru, şi folo<strong>si</strong>rea vocabularului repo<strong>si</strong>toryului<br />
ca parametri pentru procese (<strong>de</strong> exemplu obiecte digitale, colecţii). Procesele sunt<br />
executate folo<strong>si</strong>nd un set <strong>de</strong> instrumente specifice (variind <strong>de</strong> la wiki editor la aplicaţii<br />
personalizate <strong>de</strong>zvoltate special), pentru execuţia intregului protocol.<br />
25
Se foloseşte indirect un standard disponibil în cadrul comunităţii fluxului <strong>de</strong> lucru: notarea<br />
BPMN şi serializarea sa XPDL prin exten<strong>si</strong>a Semantic MediaWiki Process Exten<strong>si</strong>on Editor<br />
[47], care, la rândul său, pune în aplicare un plugin către editorul Oryx 3. Această exten<strong>si</strong>e se<br />
bazează pe capacitatea <strong>de</strong> interogare a proprietăţilor semantice care este furnizată <strong>de</strong> Semantic<br />
MediaWiki, şi afişează aceste rezultatele interogării ca un proces grafic. Interogarea adaugă o<br />
po<strong>si</strong>bilitate <strong>de</strong> formatare a rezultatului special SMW care transformă rezultatul interogării<br />
unui proces în limbaj GraphViz DOT şi returnează graficul procesului corespunzător creat cu<br />
DOT.<br />
O altă abordare semantică pentru formalizarea fluxului <strong>de</strong> lucru, complementar cu acesta este<br />
folo<strong>si</strong>rea conceptului <strong>de</strong> mo<strong>de</strong>lare a procesului şi este <strong>de</strong>rivat din reţele Petri. În această<br />
abordare, luăm procesele formalizate în RDF, le transforma în reţele <strong>si</strong>mple Petri şi le<br />
utilizăm într-un motor <strong>de</strong> execuţie <strong>de</strong> proces. Utilizatorii le pot apoi modifica fie prin paginile<br />
Wiki care conţin şabloanele sau direct modificând mo<strong>de</strong>lul procesului.<br />
Pentru <strong>de</strong>scrierea fluxlui <strong>de</strong> lucru, ne bazăm pe caracteristica SMW <strong>de</strong> a forma o ontologie<br />
<strong>si</strong>mplificată dat fiind crearea paginilor în semantic wiki. Am combinat această caracteristică<br />
cu şabloanele wiki semantice pentru a reprezenta <strong>de</strong>scrierea fluxului <strong>de</strong> lucru. Fiecare<br />
activitate poate fi reprezentată <strong>de</strong> o pagină wiki semantică. În acest fel, întreaga ontologie<br />
poate fi împărţită în componente (a se ve<strong>de</strong>a figura 4. 4).<br />
Apoi am urmat i<strong>de</strong>ea <strong>de</strong> a lega cele două meta-mo<strong>de</strong>le, XPDL şi ontologia SMW, pentru a<br />
stabili corespon<strong>de</strong>nţe semantice între elemente respective. Decizia <strong>de</strong> a folo<strong>si</strong> serializarea<br />
XPDL nu este obligatorie. În loc <strong>de</strong> XPDL (care este un standard), un şablon wiki şi<br />
serializarea XML pentru şablon poat juca acelaşi rol. Construcţii ca Action şi Application pot<br />
fi emulate prin şabloane wiki şi proprietăţi semantice.<br />
XPDL poate fi con<strong>si</strong><strong>de</strong>rat ca făcând parte din meta-mo<strong>de</strong>lul <strong>de</strong>finit în XSD, care este metameta-mo<strong>de</strong>lelul<br />
său. Prin urmare, construcţiile limbajului XPDL inclu<strong>si</strong>v Application şi<br />
Activity, aparţin nivelului M2. În M1 am plasat <strong>de</strong>finiţiile <strong>de</strong> Application şi invocarea şi<br />
instanţe <strong>de</strong> Activity. O activitate reprezintă o acţiune care se va realiza printr-o combinaţie <strong>de</strong><br />
resurse şi / sau a aplicaţiilor informatice. Definiţia <strong>de</strong> aplicare reflectă interfaţa care trebuie să<br />
fie utilizate pentru a apela serviciile specifice executate <strong>de</strong> respective activitate, inclu<strong>si</strong>v<br />
parametrii <strong>de</strong> apelare.<br />
Al doilea meta-mo<strong>de</strong>l este SMW care are OWL ca meta-meta-mo<strong>de</strong>l.<br />
Prin urmare, în SMW categoriile şi subcategoriile <strong>de</strong> proces sunt abstractii ale Action <strong>de</strong><br />
asemenea. Ca urmare a acestei interpretări, Categoriile şi instanţele din Subcategorii, aparţin<br />
nivelului M1. Deoarece SMW şi XPDL sunt ambele plasate la nivelul M2, am aplicat o<br />
transformare mo<strong>de</strong>l la mo<strong>de</strong>l din meta-mo<strong>de</strong>lul SMW la meta-mo<strong>de</strong>lul XPDL care permite<br />
integrarea lor.<br />
Meto<strong>de</strong>le OOP, <strong>de</strong>finiţia şi invocarea lor, aparţin nivelului M1, întrucât regulile gramaticale<br />
aplicate pentru a scrie meto<strong>de</strong>le sunt plasate la nivelul M2. Instanţe ale clasei Process pot fi<br />
con<strong>si</strong><strong>de</strong>rate ca meto<strong>de</strong> şi clasa Process ca meta-metodă, <strong>de</strong>oarece acesta <strong>de</strong>scrie ceea ce este o<br />
metodă. Stabilirea unei relaţii între clase SMW şi aplicaţiile XPDL permit integrarea<br />
semantică a ontologiei în fluxurile <strong>de</strong> lucru.<br />
Datorită naturii versatile a SMW, fiecare categorie corespun<strong>de</strong> unei clase <strong>de</strong> ontologie, dar în<br />
acelaşi timp, reprezintă şi o instanţă a ontologiei, fiind, <strong>de</strong> asemenea, o pagină wiki.<br />
Proprietăţile semantice (aparţin owl: DatatypeProperty), specifica tipurile disponibile <strong>de</strong><br />
parametri. Ierarhiile <strong>de</strong> categorii pot să conţină direct obiecte care pot fi manipulate prin<br />
acţiuni; şi valorile scalare, care pot fi apelate <strong>de</strong> acţiuni. Procesele pot fi <strong>de</strong>scrise prin<br />
utilizarea unei combinaţii <strong>de</strong> şabloane semantice, proprietăţi, paginile wiki şi vocabulare<br />
controlate.<br />
Prin urmare, mo<strong>de</strong>lul SMW suportă ambele nivelule <strong>de</strong> abstractizare în care fluxurile <strong>de</strong> lucru<br />
pot fi <strong>de</strong>finite: şablonul <strong>de</strong> flux <strong>de</strong> lucru şi instanţă fluxului <strong>de</strong> lucru. Exten<strong>si</strong>ile SMW RDF<br />
3 Oryx web-based Bu<strong>si</strong>ness Process Editor http://co<strong>de</strong>.google.com/p/oryx-editor/<br />
26
import / export, adaugă un nivel intermediar <strong>de</strong> mapare între ontologia SMW, ontologia<br />
fluxului <strong>de</strong> lucru şi motorul <strong>de</strong> execuţie. O relaţie poate fi stabilită între instanţele <strong>de</strong> Action<br />
(pagini wiki) şi Application.<br />
În cazul <strong>de</strong> utilizare a serializării XPDL, un mecanism <strong>de</strong> translaţie oferă un set <strong>de</strong> construcţii<br />
Application XPDL apelabile prin activităţi blocurilor <strong>de</strong> flux <strong>de</strong> lucru. Aplicaţiile invocate<br />
impun specificarea completă a parametrilor formali ai acestora. Fişierele <strong>de</strong> date, ca resurse<br />
pot fi reprezentate grafic în fluxul <strong>de</strong> lucru (compatibilitate BPMN) şi / sau reprezentarea pe<br />
baza şabloanelor.<br />
Figure 4. 5. Exemplu <strong>de</strong> sablon <strong>de</strong> flux <strong>de</strong> lucru reprezentat prin MediaWiki Process Exten<strong>si</strong>on<br />
Editor<br />
În exemplul <strong>de</strong> mai sus este prezentată o <strong>de</strong>scriere a şablonului <strong>de</strong> flux <strong>de</strong> lucru utilizând<br />
reprezentarea grafică în paginile wiki. Uneltele sunt reprezentate ca Roluri (adică Ingest Tool,<br />
Wiki Editor). Resursele sunt <strong>de</strong>scrise prin folo<strong>si</strong>rea icoanei "fol<strong>de</strong>r". Procesul este <strong>de</strong>scries în<br />
etape cu ajutorul sub-proceselor ca pagini wiki. Unul dintre aceste procese este reprezentat,<br />
după cum urmează:<br />
{{Process Step<br />
|Belongs to process=Workflow Template<br />
|has Role= Harvesting Tool<br />
|has Successor = Process Metadata<br />
|uses Resource = Configuration File.xml<br />
}}<br />
The process starts with Input Collection into Wiki.<br />
27
Tool support:<br />
* wiki<br />
* wiki template syntax<br />
* Metadata Exchange Agreement<br />
Un mechanism <strong>de</strong> translaţie permite reprezentarea şablonului <strong>de</strong> flux <strong>de</strong> lucru direct în<br />
paginile SMW prin exten<strong>si</strong>a RDF import/export. Pentru reprezentarea grafică ca în figura <strong>de</strong><br />
mai sus, se utilizează <strong>de</strong> asemenea şabloane wiki combinate cu interogări semantice.<br />
Infrastructura <strong>de</strong> metadate este hub-ul în care capacităţile diferite ale repo<strong>si</strong>tory-ului semantic<br />
se integrează. Aceasta inclu<strong>de</strong> <strong>si</strong>ncronizare în ambele sensuri, cu sursele externe <strong>de</strong> informaţii<br />
- mo<strong>de</strong>le, arhitecturi, ontologii, cerinţe, procese, etc - <strong>de</strong>finirea entităţilor şi modul în care<br />
aceasta funcţionează, ca şi în următoarea diagramă.<br />
Figure 4. 6. Mo<strong>de</strong>lul <strong>de</strong> referinţă şi arhitecturile concrete<br />
28
Metadatele joacă rol dublu în abordarea noastră: ele au rol <strong>de</strong> resurse (repo<strong>si</strong>tory este în<br />
primul rând cel care conţine metadate), şi rol comportamental - acestea fiind utilizate şi <strong>de</strong><br />
care instrumente pentru a-şi în<strong>de</strong>plini mi<strong>si</strong>unea <strong>de</strong> bu<strong>si</strong>ness.<br />
Sursele <strong>de</strong> resurse utilizează limbaje sursă. Acestea au fost analizate pentru a releva semantica<br />
şi a le <strong>de</strong>fini ca componente semantice, ori <strong>de</strong> câte ori este po<strong>si</strong>bil interpretarea lor neambiguă.<br />
Setul <strong>de</strong> componente semantice reprezintă nucleul semantic. O <strong>si</strong>ntaxă specifică sau un format<br />
<strong>de</strong> fişier este mapat la reprezentarea sa <strong>de</strong> bază semantică din nucleu atunci când este importat<br />
în sau exportate din repo<strong>si</strong>tory-ul digital.<br />
Sursele <strong>de</strong> metadate noi, achiziţionate printr-un şablon nou vor implica un nou şablon flux <strong>de</strong><br />
lucru şi va genera un şablon <strong>de</strong> ieşire nou, pentru integrarea in repo<strong>si</strong>tory.<br />
4.3. Algoritmul <strong>de</strong> integrare in pseudocod<br />
Start thread:<br />
if exists more then n threads then exit;<br />
else {<br />
if(exists on thread which process thumbnails) call processMetadata;<br />
else if exists image_jobs call processImages;<br />
else call processMetadata;<br />
}<br />
exit;<br />
procedure processMetadata<br />
{<br />
read metadata templates from resource;<br />
read the workflow template attached to every metadata templates;<br />
if exists waiting jobs<br />
{<br />
process jobs in conformity with metadata template;<br />
exit;<br />
}<br />
else<br />
{<br />
read medatata from template-parameter-in<strong>de</strong>xer service;<br />
if(metadata_set not null) then<br />
{<br />
create_task_instance_for_proces<strong>si</strong>ng;<br />
write the result in user interface;<br />
exit;<br />
}<br />
else exit;<br />
}<br />
}<br />
29
4.4. Ontologia aplicaţiei<br />
Figure 4. 7. Ontologia aplicației prezentată la nivel înalt<br />
30
Am creat trei mo<strong>de</strong>le diferite, care inglobează aspecte diferite ale logicii mo<strong>de</strong>lului <strong>de</strong><br />
referinţă: mo<strong>de</strong>l <strong>de</strong> ontologiei aplicţiei (AO), mo<strong>de</strong>lul ontologiei fluxului <strong>de</strong> lucru (WO), şi<br />
mo<strong>de</strong>lul ontologiei repo<strong>si</strong>tory digital (RO). Aceste mo<strong>de</strong>le nu reflectă numai proiectarea ci şi<br />
acoperă parţial arhitectura <strong>de</strong> referinţă, dar şi captează, <strong>de</strong> asemenea, informaţiile <strong>de</strong>spre<br />
metadate adunate în timp (<strong>de</strong> exemplu, pe parcursul întregului ciclu <strong>de</strong> viaţă al obiectului<br />
digital). Metadatele includ informaţii <strong>de</strong>spre ver<strong>si</strong>uni, şabloane şi colecţii. Am conectat<br />
ontologia aplicaţiei la alte ontologii <strong>de</strong>ja existente din alte domenii. Un ingest in repo<strong>si</strong>tory,<br />
<strong>de</strong> exemplu, poate fi văzut ca o reprezentare a unui flux <strong>de</strong> lucru. Prin urmare, am folo<strong>si</strong>t<br />
conceptele <strong>de</strong>finite <strong>de</strong> ontologia fluxului <strong>de</strong> lucru a lui Tim Berners-Lee pe care am extins-o<br />
cu concepte specifice. Descriem în continuare pe scurt ontologiile externe şi abrevierile<br />
(prefix) utilizate.<br />
doap: Description of a Project <strong>de</strong>fineşte concept <strong>de</strong>spre <strong>de</strong>pizitul digital ca şi diferitele<br />
ver<strong>si</strong>uni <strong>de</strong> <strong>de</strong>pizit utilizate în abordarea <strong>de</strong> faţă (<strong>de</strong> ex., CVS Repo<strong>si</strong>tory, metadata<br />
repo<strong>si</strong>tory)<br />
dcterms: Dublin Core este folo<strong>si</strong>tă ca ontologie generală pentru creatori. În această<br />
ontologie, conceptele mo<strong>de</strong>lează activităţile creatorilor (autori, lucrări).<br />
foaf: The Friend Of A Friend Ontology este o abordare care mo<strong>de</strong>lează reţele sociale<br />
persoane şi conexiunile dintre ele.<br />
wf: ontologia <strong>de</strong> flux <strong>de</strong> lucru a şui Tim Berners-Lee. În abordarea noastră, <strong>de</strong> exmplu,<br />
procesul <strong>de</strong> ingest este con<strong>si</strong><strong>de</strong>rat un flux <strong>de</strong> lucru. Atfel, un transfer in wiki este<br />
wf:Instance care este compus din wf:Tasks care la randul său poate avea o stare<br />
neterminală wf:NonTerminalState (procesare în etape) sau o stare terminală<br />
wf:Terminal-State (process închis).<br />
Metadate exprimate ca metadate structurate reprezintă resurse. Artefactele aplicaţiei sunt<br />
resurse şi sunt cuprind parametrii <strong>de</strong> intrare-ie<strong>si</strong>re, template-uri <strong>si</strong> altele. Unitatea principală<br />
logică <strong>de</strong> procesare este colecţia şi pe această resursă este bazată logica aplicaţiei.<br />
Relaţiile între conceptele sunt, în general, bidirecţionale, fiecare relaţie dispune <strong>de</strong> o relaţie<br />
inversă. De exemplu, între o colecţie şi obiectelor sale digitale există o relaţie moştenită <strong>de</strong> la<br />
ontologia <strong>de</strong> <strong>de</strong>po<strong>si</strong>t digital: Colecţia hasMember un DigitalObject şi DigitalObject<br />
isMemberOf a unei colecţii date.<br />
O parte din aceste ontologii sunt reprezentate în Semantic MediaWiki folo<strong>si</strong>nd concepte şi<br />
proprietăţi semantice. Pentru moment, ele sunt folo<strong>si</strong>te doar pentru o <strong>de</strong>scriere lizibilă atât<br />
pentru factorul uman cat şi pentru maşină, dar mai târziu, odată cu creşterea capacităţii <strong>de</strong><br />
raţionare a SMW peste reprezentarea RDF, sperăm în creerea <strong>de</strong> cunoştinţe suplimentare şi<br />
funcţionalităţi îmbunătăţite prin <strong>de</strong>ducerea <strong>de</strong> triplete noi.<br />
4.5. Calitatea metadatelor<br />
De obicei, mai multi specialiști colaborează pentru a gestiona metadatele şi conţinutul:<br />
creatori <strong>de</strong> date, managerii <strong>de</strong> date şi curatori, cei care caută date, transformatorii <strong>de</strong> date <strong>si</strong><br />
inginerii software. Sarcina utilă se balansează între două extreme: metadatele complete<br />
încarcă costurile pe creatori, manageri, curatori şi, pe <strong>de</strong> altă parte, metadatele minimale,<br />
încarcă costurile pe <strong>de</strong>scoperitorii <strong>de</strong> date.<br />
Calitatea metadatelor <strong>de</strong>pin<strong>de</strong> <strong>de</strong> doi factori. Unul dintre factori este acest fragil compromis:<br />
cat <strong>de</strong> multe <strong>de</strong> metadate trebuie să fie prezentate <strong>de</strong> către furnizorii <strong>de</strong> date sau adăugate cu<br />
ajutorul instrumentelor inteligente? Fără metadatate <strong>de</strong> calitate, semnificative şi standardizate,<br />
lipseşte ingredientul esenţial care le va face eficiente pe Web. Fără metadate <strong>de</strong> calitate,<br />
şansele <strong>de</strong> a fi gă<strong>si</strong>t conţinutul sunt în mod semnificativ diminuate.<br />
Pe <strong>de</strong> altă parte, un manager <strong>de</strong> metadate, <strong>de</strong> obicei, are sarcina <strong>de</strong> a verifica metadatele<br />
folo<strong>si</strong>nd instrumente mai mult sau mai puţin automate. Această procedură este costi<strong>si</strong>toare ca<br />
timp, predispuse la erori şi încarcă gestionarea repo<strong>si</strong>tory cu costuri umane suplimentare.<br />
Rezultatul acestui proces se rezumă la acceptarea sau respingerea metadatelor la nivel global.<br />
Feedback-ul către furnizorii <strong>de</strong> date este în cele mai multe cazuri contradictoriu şi făcut<br />
înainte <strong>de</strong> intrare (mediat <strong>de</strong> software).<br />
31
Verificarea calităţii metadatelelor este explicit făcută în cadrul abordării tezei. Prin adoptarea<br />
protocoalelor din wiki, politicile şi tratatelor, soluţiile software suportive pot ajuta la uşurarea<br />
controlului calităţii şi revizuirea metadatelor.<br />
Furnizorii <strong>de</strong> date pot fi conştientizaţi <strong>de</strong> existenţa unui set minim <strong>de</strong> metadate folo<strong>si</strong>nd<br />
protocoale în wiki şi mecanismul <strong>de</strong> şabloane din MediaWiki, împreună cu software-ul care<br />
doar susţine controlul calităţii metadatelor (după intrarea). Ei vor fi notificați, dar nu forţaţi, să<br />
transfere din nou, un set complet <strong>de</strong> metadate. Există doar un caz <strong>si</strong>ngular în care metadatele<br />
vor fi respinse complet: nici un URI valabil nu a fost <strong>de</strong>tectat şi resursele media nu pot fi<br />
i<strong>de</strong>ntificate in <strong>si</strong>stemul furnizorului.<br />
4.6. Studiu comparative între mo<strong>de</strong>lul <strong>de</strong> referinţă OAIS şi mo<strong>de</strong>lul<br />
colaborativ propus <strong>de</strong> teză<br />
Tabelul care urmează compară mo<strong>de</strong>lul <strong>de</strong> referinţă OAIS, aşa cum este el prezentat în<br />
Capitolul 3.1 cu mo<strong>de</strong>lul colaborativ pentru managemnetul repo<strong>si</strong>tory-ului. Vom sublinia<br />
nejunsurile şi limitările acestui mo<strong>de</strong>l pe componente şi sub-componente. Mo<strong>de</strong>lul nostru<br />
colaborativ nu este un mo<strong>de</strong>l generic, din contră, el este puternic ancorat în comunitatea şi<br />
mediul social format în jurul acestui obiectiv virtual care este repo<strong>si</strong>tory-ul.<br />
Table 4.2. Comparaţia dintre mo<strong>de</strong>lul <strong>de</strong> referinţă OAIS şi mo<strong>de</strong>lul colaborativ<br />
pentru managementul repo<strong>si</strong>tory-ului<br />
Componente Sub-componente Mo<strong>de</strong>lul OAIS Mo<strong>de</strong>lul Colaborativ<br />
Mediul Nivelul strategic Interacţiunea cu <strong>si</strong>stemele externe<br />
nu este bine stabilită. În fapt, dacă<br />
<strong>si</strong>stemele externe nu pot fi<br />
cla<strong>si</strong>ficate conform rolurilor<br />
prestabilite <strong>de</strong> OAIS (Producer,<br />
Consumer sau Management)<br />
mo<strong>de</strong>lul nu poate lua în<br />
con<strong>si</strong><strong>de</strong>rare interacţiunea cu<br />
Mo<strong>de</strong>l<br />
Informaţional<br />
Mo<strong>de</strong>l<br />
Functional<br />
Comunitatea<br />
<strong>de</strong>stinatară<br />
aceste <strong>si</strong>steme.<br />
Este necesară o mai fină<br />
granularitate pe un nivel<br />
intermediar astfel încât să se poată<br />
distinge comunitatea primară <strong>de</strong><br />
alte comunităţi din acelaşi mediu.<br />
Partenerii Partenerii sunt împărţiţi în 3<br />
categorii: Producer, Consumer şi<br />
Management. Nu există nici o<br />
ipoteză asupra relaţiilor dintre<br />
aceste categorii sau alte categorii<br />
<strong>de</strong> parteneri care nu se încadrează<br />
aici.<br />
Definirea fluxului<br />
<strong>de</strong> lucru<br />
Ingest<br />
(operaţiunea<br />
abstractă put())<br />
OAIS sugerează existenţa unui<br />
flux <strong>de</strong> lucru rigid între SIP, AIP<br />
şi DIP. Mo<strong>de</strong>lul nu reflectă astfel<br />
practicile curente ale repo<strong>si</strong>tory-<br />
urilor.<br />
Funţia <strong>de</strong> pre-ingest este<br />
con<strong>si</strong><strong>de</strong>rată într-un alt mo<strong>de</strong>l.<br />
32<br />
Nivelul strategic este bine-<strong>de</strong>finit<br />
datorită contextului colaborativ şi<br />
social în care se presupune ca<br />
mo<strong>de</strong>lul va fi aplicat. Strategia este<br />
bazată pe politici, tratate şi consens.<br />
Nivelul strategic este reprezentat pe<br />
acelaşi nivel ca şi nivelul <strong>de</strong><br />
management al repo<strong>si</strong>tory-ului.<br />
Comunitatea ptimară este foarte bine<br />
<strong>de</strong>finită în abordarea noastră. Este<br />
comunitatea comasată în jurul<br />
repo<strong>si</strong>tory-ului. Restul comunităţilor<br />
nu sunt explicit numite, dar coexistă<br />
implicit şi schimbă date şi mesaje<br />
prin functinalităţi <strong>de</strong> import/ export<br />
către CMS, biblioteci digitale şi alte<br />
grupuri <strong>de</strong> utilizatori.<br />
În abordarea noastră, există un <strong>si</strong>ngur<br />
tip <strong>de</strong> actor: membrii comunităţii<br />
având roluri <strong>si</strong> prerogative uşor<br />
diferenţiate. Această impărţire<br />
arbitrară în 3 categorii făcută <strong>de</strong><br />
OAIS se reflectă nenatural în ciclul<br />
<strong>de</strong> viaţă al obiectului informaţional:<br />
achiziţionarea informaţiei fără<br />
partajare („shared-ness”) .<br />
Colecţia este <strong>si</strong>ngura entitate logică<br />
gestionată <strong>de</strong> fluxul <strong>de</strong> lucru. Această<br />
abordare care utilizează ontologia<br />
fluxului <strong>de</strong> lucru este mai flexibilă şi<br />
cuprin<strong>de</strong> şi nivelul strategic.<br />
Funcţia <strong>de</strong> pre-ingest este inclusă în<br />
ontologia fluxului <strong>de</strong> lucru şi în<br />
fiecare şablon <strong>de</strong> flux <strong>de</strong> lucru. Faza
Managementul<br />
datelor<br />
Managementul datelor nu reflect<br />
munca laborioasă care va fi făcută<br />
la acest nivel.<br />
Arhivarea Urmărirea adiţională şi<br />
înregistrarea fluxului poate fi<br />
necesară.<br />
Administrativ OAIS preve<strong>de</strong> feedback către<br />
Producători, dar acest <strong>de</strong>zi<strong>de</strong>rat<br />
este unul administrativ şi nu este<br />
obligatoriu.<br />
Managementul colecţiilor, politici<br />
legate <strong>de</strong> colecţii, protecţia datelor<br />
şi controlul accesului nu sunt<br />
acoperite suficient <strong>de</strong> mo<strong>de</strong>lul<br />
OAIS.<br />
33<br />
<strong>de</strong> validare se face după intrarea în<br />
<strong>si</strong>stem (software supported):<br />
i. faza preliminară – inclu<strong>de</strong><br />
contracte şi negicieri;<br />
ii. faza formalizării –<br />
proiectarea colecţiei şi stabilirea<br />
tratatelor;<br />
iii. faza <strong>de</strong> transfer – transferul<br />
colecţiei pe platforma <strong>de</strong><br />
management;<br />
iv. faza <strong>de</strong> validare –<br />
procesarea validării;<br />
v. faza <strong>de</strong> feedback – validarea<br />
rezultatelor şi feedback.<br />
Parţial, managementul datelor este<br />
inclus în ontologia fluxului <strong>de</strong> lucru.<br />
Această funţonalitate este prevăzută<br />
într-o component specială a fluxului<br />
<strong>de</strong> lucru: Workflow Dispatcher.<br />
In abordarea noastră, acest feedback<br />
către producători este inclus in fluxul<br />
<strong>de</strong> lucru. Feedback-ul este un process<br />
iterativ: primul feedback este dat<br />
imediat după încarcarea datelor, iar<br />
celalălalt inclu<strong>de</strong> rezultatul<br />
procesului <strong>de</strong> ingest.<br />
Managementul colecţiilor este<br />
punctual central în abordarea noastră;<br />
colecţia fiind <strong>si</strong>ngura entitate<br />
manageabilă <strong>de</strong> către repo<strong>si</strong>tory.<br />
Politicile legate <strong>de</strong> colecţii sunt<br />
incluse în stratul strategic. Protejarea<br />
datelor şi controlul accesului rămân<br />
la nivelul administrativ.
5. ARHITECTURA DE<br />
REFERINŢĂ ŞI<br />
IMPEMENTĂRILE CONCRETE<br />
In acest capitol este prezentata arhitectura <strong>de</strong> referinţă precum trei arhitecturi concrete şi<br />
implementarile aferente lor.<br />
Arhitectura <strong>de</strong> referinţă urmeaza paradigma Mediator. Arhitectura <strong>de</strong> referinţă utilizează<br />
ontologia aplicaţiei pentru a comunica cu şabloanele <strong>de</strong> date şi repo<strong>si</strong>tory-ul digital care nu<br />
vor comunica direct una cu alta. Anumite constrangeri <strong>de</strong> comunicare pot fi impuse la acest<br />
nivel. Stratul Mediator <strong>de</strong>fineste regulile <strong>de</strong> control care dictează modul în care<br />
interacţioneaza nivelele <strong>de</strong> jos şi <strong>de</strong> sus. Straturile sunt slab cuplate, caracteristică care este<br />
menţinută prin comunicarea cu stratul Mediator. Aceasta comunicare este po<strong>si</strong>bila urmand<br />
cativa pa<strong>si</strong>:<br />
Mai intai, s-au <strong>de</strong>zvoltat cateva tipuri <strong>de</strong> şabloane, avand diferite functionalităţi – e.g.,<br />
colectarea metadatelor, chei <strong>de</strong> i<strong>de</strong>ntificare wiki, integrarea metadatelor dintr-un repo<strong>si</strong>tory<br />
extern. Fiecare tip <strong>de</strong> şablon MediaWiki poate fi folo<strong>si</strong>t la colectarea metadatelor are ataşat un<br />
şablon <strong>de</strong> flux <strong>de</strong> lucru; ambele şabloane sunt stocate în MediaWiki ca “pagini” într-un spaţiu<br />
<strong>de</strong> nume special [182].<br />
Componenta urmatoare este o ontologie, numită şi ontologia fluxului <strong>de</strong> lucru [182] şi ea<br />
reprezintă relaţiile dintre fluxurile <strong>de</strong> lucru, resurse şi utilizatori. În acest fel se combină<br />
mo<strong>de</strong>lul <strong>de</strong> management al fluxului <strong>de</strong> lucru cu mo<strong>de</strong>lul <strong>de</strong> şabloane MediaWiki pentru<br />
interoperabilitate. Utilizatorii, mesajele, şabloanele şi metadatele sunt con<strong>si</strong><strong>de</strong>rate resurse.<br />
O component importanta este dispecerul fluxului <strong>de</strong> lucru [41] care este responsabil pentru<br />
intregul proces: <strong>de</strong>finirea elementelor, crearea şabloanelor şi generarea instantelor (automatic<br />
şi <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> context). Monitorizarea fluxului <strong>de</strong> lucru şi controlul uneltelor implicate este<br />
trasat în mod real prin interogarea instanţelor fluxului <strong>de</strong> lucru.<br />
5.1. Descrierea tehnologiei şi <strong>de</strong>zvoltarea<br />
Mo<strong>de</strong>lul <strong>de</strong> referinţă este construit pe tehnologiile MediaWiki şi Semantic MediaWiki [115].<br />
Alegerea acestor tehnologii MediaWiki ca tehnologii suport se bazeaza pe caracteristici ca:<br />
unealtă colaborativă, crearea facilă a paginilor şi linkajul lor, unealtă care tratează în mod<br />
uniform şi formal specificaţiile informale ale diferitelor componente ale mo<strong>de</strong>lului unei<br />
intreprin<strong>de</strong>ri.<br />
Scopul general este integrarea media şi/sau a metadatelor aferente într-un repo<strong>si</strong>tory<br />
centralizat, în conformitate cu standard structurale şi <strong>de</strong> conţinut, şi cu un protocol <strong>de</strong> transfer<br />
al metadatelor. O asemenea integrare constă în urmatorii paşi:<br />
A. Stabilirea furnizorilor datelor şi/sau metadatelor, acorduri asupra protocolului <strong>de</strong> transfer<br />
al metadatelor şi strategia <strong>de</strong> integrare. Acest pas stabileşte sub<strong>si</strong>stemul <strong>de</strong> intrare în<br />
<strong>si</strong>stemul <strong>de</strong> integrare.<br />
B. Stabilirea repo<strong>si</strong>tory final şi arhitectura sa. Pentru aceasta, este nevoie <strong>de</strong> urmatorii paşi:<br />
Arhitectura Obiectului Digital. Arhitectura obiectului digital reprezintă structura atomică a<br />
repo<strong>si</strong>tory digital şi trebuie <strong>de</strong> asemenea să exprime relaţiile dintre obiectele digitale.<br />
Formatul acestei reprezentari este strâns legat cu tehnologia <strong>de</strong> <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory.<br />
Arhitectura Obiectului la nivel <strong>de</strong> repo<strong>si</strong>tory. Acest obiect reprezintă un mo<strong>de</strong>l compozit<br />
structura lui constă din agregarea mai multor obiecte digitale. Acesta agregare <strong>de</strong> obiecte<br />
34
digitale reprezintă mo<strong>de</strong>lul structural al repo<strong>si</strong>tory şi unitatea logică care va fi menţinută la<br />
nivelul acestuia.<br />
C. Dezvoltarea conţinutului şi productia fluxurilor <strong>de</strong> lucru. Urmand protocolul şi ciclul <strong>de</strong><br />
viaţă al resurselor digitale, şabloanele pentru managementul metadatelor şi uneltele<br />
<strong>de</strong>zvoltate pentru realizarea acestora sunt:<br />
Colectarea metadatelor <strong>de</strong> la furnizorii <strong>de</strong> metadate<br />
Agregarea metadatelor în repo<strong>si</strong>tory<br />
Feedback-ul catre furnizorii <strong>de</strong> metadata şi rapoartele privind<br />
managementul repo<strong>si</strong>tory-ului.<br />
D. Servicii <strong>de</strong> intreţinere şi unelte <strong>de</strong> cautare.<br />
Pentru a îmbunatăţi cooperarea şi coordonarea dintre unelte, am creat ontologia fluxului <strong>de</strong><br />
lucru [182] şi am implementat un flux standard <strong>de</strong> management al repo<strong>si</strong>tory digital înauntrul<br />
unui <strong>si</strong>stem wiki.<br />
Figure 5. 1. Mo<strong>de</strong>lul pe nivele suportat <strong>de</strong> MediaWiki<br />
Prima şi a doua arhitectură concretă utilizeaza atributele MediaWiki şi SMW pentru<br />
colectarea, agregarea şi stocarea metadatelor. Aceste arhitecturi concrete au fost prezentate în<br />
articolele [36][37][38][39].<br />
Cea <strong>de</strong>-a treia arhitectură adresează problema integrării metadatelor. Metadatele şi conţinutul<br />
media sunt furnizate <strong>de</strong> o biblioteca digitală şi integrate în SMW. Aceasta arhitectură concretă<br />
a fost prezentată în articole [184][156].<br />
5.2. Prima arhitectură concretă<br />
Constrângerile <strong>de</strong> implementare şi cerintele contextuale:<br />
1. Iniţial, conţinutul media şi metadatele se aflau în <strong>si</strong>stemelor proprii ale furnizorilor <strong>de</strong><br />
date;<br />
2. Integrarea se face într-un <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory extern. Opţiunea cea mai potrivită este<br />
<strong>si</strong>stemul Fedora Commons, fiind un <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory cu facilităţi semantice şi<br />
permitând o arhitectură flexibilă. Fedora Commons este prezentat în capitolul 3 al<br />
35
tezei ca <strong>si</strong> caz concret <strong>de</strong> implementare al mo<strong>de</strong>lului OAIS <strong>de</strong> management al<br />
repo<strong>si</strong>tory-ului digital. Am ales aceasta variantă pentru că este un <strong>si</strong>stem open source<br />
cu instanţe funcţionale multiple iar proiectul este în continuare menţinut <strong>de</strong><br />
Univer<strong>si</strong>tatea Cornell.<br />
3. în repo<strong>si</strong>tory se vor integra numai metadatele în conformitate cu standardul structural<br />
şi <strong>de</strong> conţinut stabilite anterior în protocolul <strong>de</strong> transfer al metadatelor [186].<br />
Cele trei nivele ale primei arhitecturi concrete sunt dupa cum urmează:<br />
1. Nivelul <strong>de</strong> colectare a metadatelor. Acest nivel este susţinut <strong>de</strong> <strong>si</strong>stemul MediaWiki.<br />
Acest nivel este <strong>de</strong> fapt confundat în stratul utilizator – <strong>de</strong> cautare şi consultare. În<br />
acestă abordare aceste doua straturi partajează aceeaşi infrastructură.<br />
2. Nivelul <strong>de</strong> agregare – un set <strong>de</strong> unelte Java.<br />
3. Nivelul <strong>de</strong> date –reprezentat <strong>de</strong> 3 baze <strong>de</strong> date: o baza <strong>de</strong> date este utilizată <strong>de</strong> Fedora<br />
Commons pentru stocarea metadatelor, iar celelelte doua baze <strong>de</strong> date sunt utilizate <strong>de</strong><br />
unelte.<br />
5.2.1. Obiect digital<br />
Integrarea numai a metadatelor este o modalitate obişnuită <strong>de</strong> a construi o bibliotecă digitală<br />
şi constă în cativa pa<strong>si</strong>:<br />
1. Arhitectura obiectului digital. Mai întâi se stabileşte un mo<strong>de</strong>l <strong>de</strong> obiect digital<br />
compatibil cu mo<strong>de</strong>lul <strong>de</strong> conţinut al Fedora Commons Repo<strong>si</strong>tory [178]. Structura<br />
metadatelor va fi compatibila cu entităţile <strong>de</strong>finite în protocolul Resource Metadata<br />
Exchange Agreement [152].<br />
Dintre tipurile <strong>de</strong> metadata (<strong>de</strong>scriptive, administrative, <strong>de</strong> prezervare, <strong>de</strong> <strong>de</strong>scrierea<br />
drepturilor intelectuale, etc) metadata sunt cel mai <strong>de</strong>s folo<strong>si</strong>te în cautarea obiectului digital,<br />
acţionând ca un un proxy pentru obiect, chiar daca in<strong>de</strong>xarea directă nu este disponibilă.<br />
S-au stabilit urmatoarele tipuri <strong>de</strong> obiecte:<br />
Obiecte Media care corespund obiectelor din lumea reală (i.e. imagini, vi<strong>de</strong>o,<br />
translatări şi transcieri, fişiere audio).<br />
Obiecte Provi<strong>de</strong>r – un obiect strcturat logic care <strong>de</strong>scrie un furnizor <strong>de</strong> metadate;<br />
Obiecte Collection ( agregări):<br />
Colectie reală sau virtuală (agregare).<br />
Colecţii <strong>de</strong> colecţii.<br />
Secvenţe <strong>de</strong> date (datastreams) utilizate pentru a regă<strong>si</strong> toate submulţimile<br />
membrilor:<br />
o metadate pentru agregare<br />
o reguli specifice după care se compun colecţiile.<br />
A fost aleasă o arhitectură <strong>si</strong>mplă şi flexibilă pentru obiectul digital integrat în repo<strong>si</strong>tory-ul<br />
Fedora Commons: toate metadatele sunt exprimate ca relaţii RDF şi înglobate în fluxul <strong>de</strong><br />
date RELS-EXT. Aceste relaţii şi proprietăţi sunt exprimate via RDF şi <strong>de</strong>scrise prin:<br />
Inclu<strong>de</strong>rea relaţiilor moştenite din ontologia <strong>de</strong> bază Fedora Commons:<br />
colecţie/membru; întreg/parte; etc.<br />
Inclu<strong>de</strong>rea relaţiilor proprii ontologiei comunităţii care foloseşte repo<strong>si</strong>tory-ul digital.<br />
Toate metadatele fac parte din fluxul <strong>de</strong> date RELS-EXT. în acest mod există şansa <strong>de</strong> a<br />
utiliza SPARQL, limbajul Web <strong>de</strong> interogare semantic.<br />
Obiectul Media “isMemberOf” în mai multe colecţii.<br />
Obiectul Media este în relaţia “serviceProvi<strong>de</strong>dBy” Obiectul Provi<strong>de</strong>r.<br />
36
Figure 5. 2. Architectura obiectului digital<br />
2. Arhitectura Obiectului Digital la nivel <strong>de</strong> repo<strong>si</strong>tory digital. Colecţia este mo<strong>de</strong>lul <strong>de</strong><br />
obiect digital agregat aleasă pentru Fedora Commons Repo<strong>si</strong>tory. S-a <strong>de</strong>cis ca toate obiectele<br />
digitale să aprţină unei colecţii. Acesta va fi obiectul digital care este menţinut la nivel logic.<br />
3. Mo<strong>de</strong>lul <strong>de</strong> <strong>de</strong>zvoltare al conţinutului şi producţia <strong>de</strong> fluxuri <strong>de</strong> lucru. Principalii paşi<br />
pentru producţia <strong>de</strong> fluxuri <strong>de</strong> lucru sunt:<br />
a. Furnizorii <strong>de</strong> metadata transmit metadatele care <strong>de</strong>scriu fişierele media sau uneltele <strong>de</strong><br />
i<strong>de</strong>ntificare utilizand o formă speciala (metadata harvesting).<br />
b. Metadatele sunt stocate intr-un repo<strong>si</strong>tory extern (metadata ingest).<br />
c. O interfaţă a unei unealte <strong>de</strong> căutare permite utilizatorilor să lanseze interogări asupra<br />
metadatelor din repo<strong>si</strong>tory-ul digital.<br />
Urmând protocolul <strong>de</strong> management al resurselor digitale, şablonul <strong>de</strong> flux <strong>de</strong> lucru care<br />
<strong>de</strong>scrie protocolul <strong>de</strong> management al metadatelor şi uneltele <strong>de</strong>zvoltate pentru în<strong>de</strong>plinirea<br />
obiectivelor sunt:<br />
A. Colectarea metadatelor <strong>de</strong> la furnizorii <strong>de</strong> metadate.<br />
Structura metadatelor va fi conformă cu Resource Metadata Exchange Agreement [78].<br />
Acestă convenţie <strong>de</strong>fineşte o shemă proprie pentru interoperabilitatea metadatelor. Această<br />
schemă conţine elemente care extend schema Dublin Core cu elemente <strong>de</strong>rivate din<br />
aceasta.<br />
Transferul utilizează <strong>si</strong>ntaxa şablonelor MediaWiki ca <strong>si</strong>ntaxă specifică pentru sub<strong>si</strong>stemul<br />
<strong>de</strong> intrare. Deoarece şabloanele sunt direct transformate pe platforma <strong>de</strong> repo<strong>si</strong>tory şi<br />
afişate în browser, aceasta conferă beneficiul implementării unui feedback şi o validare<br />
parţială imediat dupa ce metadatele au fost încarcate pe server, permitând furnizorilor să<br />
<strong>de</strong>tecteze şi să corecteze imediat erorile.<br />
Acest mecanism <strong>de</strong> recoltare a metadatelor (obiecte wiki în structură XML) este<br />
implemetat în PHP ca exten<strong>si</strong>e MediaWiki.<br />
B. Agregarea meta<strong>de</strong>lor în repo<strong>si</strong>tory-ul digital. S-au <strong>de</strong>zvoltat un set <strong>de</strong> unelte în Java,<br />
pentru managementul obiectelor digitale în Fedora Commons Repo<strong>si</strong>tory, compus din şapte<br />
unelte [183]. Am utilizat componente in<strong>de</strong>pen<strong>de</strong>nte şi re-utilizabile şi tehnologii <strong>de</strong>schise<br />
(Eclipse Public License - v 1.0 4 , şi Apache License Ver<strong>si</strong>on 2.0 [5] ). Declanşate <strong>de</strong> un fişier<br />
general <strong>de</strong> configurare XML stocat ca pagina normală wiki, aceste unelte pot lucra fie în<br />
combinaţie fie separate indiferent <strong>de</strong> platformă. Datele transferate între unelte folosesc<br />
formatul XML. Orchestrarea acestor unelte <strong>de</strong>pin<strong>de</strong> <strong>de</strong> şablonul <strong>de</strong> flux <strong>de</strong> lucru ataşat care la<br />
rândul sau <strong>de</strong>pin<strong>de</strong> <strong>de</strong> şablonul wiki care va fi folo<strong>si</strong>t <strong>de</strong> sub<strong>si</strong>stemul <strong>de</strong> intrare. Orice instanţa<br />
<strong>de</strong> flux <strong>de</strong> lucru este mapată la colecţie, ca element logic, astfel:<br />
4 http://www.eclipse.org/legal/epl-v10.html<br />
37
Datele în format XML sunt interogate <strong>de</strong> o unealta Java:<br />
Transformările XML şi XSLT, a<strong>si</strong>state <strong>de</strong> Metadata Exchange Agreement, vali<strong>de</strong>ază<br />
metadatele şi crează obiectul digital în format FOXML propriu Fedora Commons;<br />
Unealta <strong>de</strong> interogare internă, Internal Search tool, interoghează repo<strong>si</strong>tory-ul digital<br />
cautând colecţii <strong>de</strong>ja existente în repo<strong>si</strong>tory. Pentru aceasta se utilizează două motoare <strong>de</strong><br />
cautare: un motor bazat pe text - Lucene – şi un motor bazat pe interogări semantice cum ar<br />
fi SPARQL [178]. Această unealtă <strong>de</strong>ci<strong>de</strong> automat, dacă colecţia curentă <strong>de</strong> prelucrat este<br />
aceeaşi cu o colecţie <strong>de</strong>ja existentă în repo<strong>si</strong>tory-ul digital. Daca există aceasta egalitate,<br />
colecţia veche este ştearsă din repo<strong>si</strong>tory şi se va înlocui cu colecţia nouă şi din nou <strong>de</strong>pusă<br />
în repo<strong>si</strong>tory.<br />
C. Rapoarte şi statistici <strong>de</strong>spre repo<strong>si</strong>tory afişate în MediaWiki. O unealtă pentru editare<br />
crează pagini wiki care conţin rezultatele ingestului, statistici şi starea fluxului <strong>de</strong> lucru.<br />
Această unealtă <strong>de</strong> raportare, statistici şi managementul fluxului <strong>de</strong> lucru utilizeaza mecanisme<br />
MediaWiki şi sunt implementate ca exten<strong>si</strong>i ale motorului Bliki, un API scris în Java pentru<br />
MediaWiki [178].<br />
Prin mecanismul MediaWiki al categoriilor, furnizorii <strong>de</strong> date sunt informaţi asupra<br />
rezultatelor stocării în repo<strong>si</strong>tory-ul digital.<br />
Generarea <strong>de</strong> statistici este <strong>de</strong>clanşată <strong>de</strong> un proces programabil. Utilizarea şabloanelor<br />
MediaWiki reflectă tot timpul starea nivelului <strong>de</strong> agregare al obiectelor digitale în<br />
repo<strong>si</strong>tory-ul digital.<br />
D. Cautarea în repo<strong>si</strong>tory. O unealtă bazată pe tehnologii web Adobe Flex implementează o<br />
interfaţă orientată spre utilizatorul final şi a fost <strong>de</strong>zvoltată pentru a realiza interogarea<br />
serviciului expus <strong>de</strong> Fedora Commons Generic Search Service (gSearch) [70]. Acestă interfaţă<br />
este integrată în MediaWiki şi a fost implementată <strong>de</strong> o terţa parte.<br />
Pentru a imbunataţi cooperarea şi coordonarea dinte unelte, a fost creată ontologia fluxului <strong>de</strong><br />
lucru [183]. Ea a fost implementată ca un mo<strong>de</strong>l <strong>de</strong> flux <strong>de</strong> lucru standardizat şi reprezentat în<br />
MediaWiki.<br />
Figure 5. 3. Interfaţa MediaWiki care permite urmărirea în timp real a stării fluxului <strong>de</strong> lucru<br />
38
O component vizuală este integrată în interfaţa MediaWiki, şi are rolul <strong>de</strong> a afişa starea curentă<br />
aferentă instanţelor fluxului <strong>de</strong> lucru online. Această componentă este implementată ca<br />
exten<strong>si</strong>e MediaWiki şi foloseşte PHP şi tehnologii Ajax [174]. Componentele responsabile cu<br />
resetarea stării fluxului <strong>de</strong> lucru prin fluxul <strong>de</strong> control nu au fost implementate dinadins.<br />
Explicaţia pentru alegerea acestei opţiuni constă în natura absolut transparentă pentru utilizator<br />
a interfeţei suport şi a po<strong>si</strong>bilităţii ca fluxul <strong>de</strong> control să fie acci<strong>de</strong>ntal intrerupt <strong>de</strong> aceştia.<br />
5.2.2. Profilul utilizator şi specificarea colaborării<br />
Pentru standardizarea metadatelor colectate <strong>de</strong> la diverşi furnizori, a fost sabilit Resource<br />
Metadata Exchange Agreement. El <strong>de</strong>fineşte tipul resurselor şi <strong>de</strong> asemenea câmpurile <strong>de</strong><br />
metadate pentru fiecare tip <strong>de</strong> resursa: title, keywords, subject category, scientific names,<br />
copyright, license, format şi URIs. Sunt suportate diferite nivele <strong>de</strong> calitate ale resurselor<br />
digitale (<strong>de</strong> exemplu, high-resolution, web-optimized, sau diferite mărimi <strong>de</strong> miniaturi) şi în<br />
limbi diferite (<strong>de</strong> exemplu, titlul în engleza şi slovena) sub diferite URI-uri. De asemenea s-au<br />
stabilit şi nivelele <strong>de</strong> nece<strong>si</strong>tate ale entităţilor <strong>de</strong> metadate pe fiecare tip <strong>de</strong> resursa: necesare,<br />
urgent necesare sau opţionale.<br />
Utilizarea şabloanelor MediaWiki în paginile wiki permite citirea usoara a textului şi<br />
raportarea la timp a erorilor, astfel încat transferal <strong>de</strong> la furnizorii <strong>de</strong> metadate către <strong>si</strong>stem este<br />
mult uşurat, ei fiind <strong>si</strong>ngurii responsabili pentru aducerea la zi a datelor pe propriile<br />
calculatoare şi nivelul calitativ al acestora. Sintaxa unul apel <strong>de</strong> şablon este <strong>si</strong>milara<br />
exemplului următor:<br />
{{Metadata<br />
| Type = StillImage<br />
| Collection Page = Drawings from G. Viennot-Bourgin 1956 (entire plates)<br />
| Provi<strong>de</strong>r Page = Julius Kühn Institute – Fe<strong>de</strong>ral Research Institute for<br />
Cultivated Plants<br />
| Title = Planche 1<br />
| Resource ID = 1851242627<br />
| Copyright Statement = © G. Viennot-Bourgin<br />
| License Statement = Licenses must be individually negotiated.<br />
| Creators = by G. Viennot-Bourgin; edited by G. Hagedorn & W. Bran<strong>de</strong>nburger<br />
| Metadata Creator = G. Hagedorn<br />
| Language = zxx<br />
| Metadata Language = en<br />
| Original Creation Date = 20.11.2002<br />
| Country Co<strong>de</strong>s = global<br />
| Subject Category = Fungi-sensu-lato<br />
| Taxonomic Coverage = Fungi (sensu lato, including Oomycota)<br />
| Taxon Count = 1<br />
|Best Quality URI =<br />
http://160.45.63.55/storage/Fungi/Mixed/VBourg56/Plates/edt/Pl_01.png<br />
| Best Quality Availability = online (free)<br />
}}<br />
39
Figure 5. 4. Şablon metadata<br />
In acest mod, utilizarea şabloanelor pentru transferal metdatelor în wiki poate a<strong>si</strong>gura rapoarte<br />
atractive şi clare, facilitând raportarea erorilor (câmpuri absolut necesare, valori incorecte, etc).<br />
Tot în scopul uşurarii colectarii datelor <strong>de</strong> la furnizorii <strong>de</strong> date care îşi vor pune datele în<br />
formularele create prin şablonare şi <strong>de</strong> asemenea pentru a automatiza procesul <strong>de</strong> transfer, <strong>de</strong><br />
exemplu din tablele MS Access, s-au creat pagini ajutatoare în wiki în acest scop (dupa<br />
principiul : ‘help user snap to grid’).<br />
La acest nivel, utilizatorul va avea la dispoziţie şi facilităţile MediaWiki: pagini favorite,<br />
pagini supravegheate, şabloane adiţionale, pagini <strong>de</strong> discuţie, etc. Toţi furnizorii <strong>de</strong> date fac<br />
parte din aceelaşi grup <strong>de</strong> utilizatori wiki având aceleaşi drepturi <strong>de</strong> utilizare. Caţiva furnizori<br />
<strong>de</strong> date utilizează unelte automate pentru a transfera resurse sau metadata în wiki (bots în<br />
limbaj wiki).<br />
5.2.3. Specificarea elementelor fluxului <strong>de</strong> lucru şi a relaţiilor dintre ele<br />
Am utilizat şabloane MediaWiki ca formulare <strong>de</strong> structuri <strong>de</strong> date utilizand <strong>si</strong>ntaxa wiki pentru<br />
a permite furnizorilor <strong>de</strong> date sa publice metadatele <strong>de</strong>spre conţinutul media intr-o operație <strong>de</strong><br />
“împingere” (push) în repo<strong>si</strong>tory-ul digital.<br />
Fluxul <strong>de</strong> lucru implică apoi o procedură <strong>de</strong> colectare automată a metadatelor în repo<strong>si</strong>tory-ul<br />
digital Fedora Commons, combinată cu crearea automată <strong>de</strong> rapoarte în paginile wiki. Aceste<br />
rapoarte a<strong>si</strong>gură feedback-ul către furnizorii <strong>de</strong> date şi utilizatorul final.<br />
Metoda mai sus menţionată extin<strong>de</strong> mo<strong>de</strong>lul flexibil <strong>de</strong> flux <strong>de</strong> lucru expus în [187] şi se<br />
bazează pe două mecanisme, după cum urmează:<br />
In primul rând, au fost create câteva tipuri <strong>de</strong> şabloane pentru recoltarea datelor, având<br />
funcţiuni diverse – colectarea metdatelor, metadate asociate cu cheile <strong>de</strong> i<strong>de</strong>ntificare, etc.<br />
Fiecare tip <strong>de</strong> şablon <strong>de</strong>zvoltat în MediaWiki are un flux <strong>de</strong> lucru ataşat; ambele obiecte sunt<br />
stocate în MediaWiki ca “pagini” într-un spaţiu <strong>de</strong> nume special.<br />
A doua componentă este o ontologie, numită ontologia fluxului <strong>de</strong> lucru [174], care reprezintă<br />
relaţile dintre fluxuri <strong>de</strong> lucru, resurse şi utilizatori finali. Metoda combină metoda <strong>de</strong><br />
management al fluxului <strong>de</strong> lucru cu mo<strong>de</strong>lul <strong>de</strong> şabloanele MediaWiki pentru<br />
interoperabilitate.<br />
Un manager <strong>de</strong> flux <strong>de</strong> lucru [182][183] este responsabil cu ciclul <strong>de</strong> viata al fluxului <strong>de</strong> lucru<br />
care consta în 3 faze principale:<br />
40
Definirea elementelor fluxului <strong>de</strong> lucru: aceste <strong>de</strong>fineşte contextual taskului şi ataşează<br />
mesajele sau informaţia din elementele documentului [183].<br />
Crearea şablonului fluxului <strong>de</strong> lucru: managerul fluxului <strong>de</strong> lucru <strong>de</strong>fineşte informaţiile<br />
<strong>de</strong>spre fluxul <strong>de</strong> lucru şi combină teaskurile şi regulile <strong>de</strong> tranziţie pentru a forma un şablon<br />
<strong>de</strong> flux <strong>de</strong> lucru.<br />
Generarea instanţelor <strong>de</strong> flux <strong>de</strong> lucru (automatic şi <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> context): se selectează<br />
în mod dinamic un şablon <strong>de</strong> flux <strong>de</strong> lucru din lista <strong>de</strong> şabloane disponibile şi se crează o<br />
instanţă executabilă <strong>de</strong> flux <strong>de</strong> lucru.<br />
Monitorizarea şi controlul stării reale a fluxului <strong>de</strong> lucru este realizat <strong>de</strong> o unealtă care<br />
interoghează instanţele active ale fluxului <strong>de</strong> lucru. Această unealta are două faze <strong>de</strong><br />
activitate:<br />
Monitorizarea fluxului <strong>de</strong> lucru: verifică starea fluxurilor <strong>de</strong> lucru cu starea neterminală<br />
din lista <strong>de</strong> fluxuri <strong>de</strong> lucru şi supraveghează progresul fluxurilor selecţionate;<br />
Controlul fluxului <strong>de</strong> lucre: seteaza şi reseteaza starea fluxului <strong>de</strong> lucru ca Suspend,<br />
Resume, şi Abort.<br />
In urmatoarea imagine se observă progresul fluxurilor <strong>de</strong> lucru pentru activitatea <strong>de</strong> ingest în<br />
repo<strong>si</strong>tory-ul digital:<br />
Figure 5. 5. Fluxul <strong>de</strong> lucru MediaWiki – privire <strong>de</strong> ansamblu.<br />
Arhitectura corespunzatoare, pe straturi, este prezentată în figura următoare:<br />
41
Figure 5. 6. Arhitectura cadrului <strong>de</strong> lucru în MediaWiki pentru obţinerea interoperabiliăţii<br />
5.2.4. Alinierea mo<strong>de</strong>lelor şi specificarea interoperabilităţii<br />
Alinierea între şabloane şi fluxurile <strong>de</strong> lucru se realizează prin două mecanisme: <strong>de</strong>scrierea<br />
şabloanelor MediaWiki şi handlerul <strong>de</strong> şabloane.<br />
Şabloanele sunt pagini Wiki care pot fi 'transcluse' (incluse cu procesare) în alte pagini.<br />
Sintaxa <strong>de</strong> baza este:<br />
{{Templatename<br />
| parametername1 = parametervalue1<br />
| parametername2 = parametervalue2<br />
|… }}<br />
Metadatele unui obiect media într-o pagina wiki sunt transmise sub forma:<br />
{{meta-data<br />
| meta-datafield1 = meta-datavalue1<br />
| meta-datafield2 = meta-datavalue2<br />
|… }}<br />
Acest format este relativ uşor <strong>de</strong> recoltat şi stocat în tabele create special pentru asta în baza<br />
<strong>de</strong> date native MediaWiki. Astfel are loc o validare parţială la acest prim nivel, bazată pe<br />
capabilităţile programatice şi <strong>de</strong> raportare native ale şabloanelor MediaWiki. Aceastea sunt<br />
prevăzute cu un mecanism instant <strong>de</strong> raportare al erorilor.<br />
Fiecare şablon are un handler ataşat. Unealta <strong>de</strong> ingest mapează sablonul <strong>de</strong> lucru potrivit cu<br />
șablonul wiki corespon<strong>de</strong>nt. Aceasta mapare se face printr-o pagină wiki <strong>si</strong>mpla. Pentru un<br />
nou şablon <strong>de</strong> metadate, este necesar un nou flux <strong>de</strong> lucru şi un nou şablon wiki.<br />
Fluxul <strong>de</strong> lucru mapează mo<strong>de</strong>lul <strong>de</strong> şablon pe mo<strong>de</strong>lul <strong>de</strong> repo<strong>si</strong>tory utilizând transformări<br />
XSLT. Paşii care se parcurg în cadrul acestui process sunt <strong>de</strong>finiţi ca în pictograma<br />
următoare:<br />
42
Metadata.xml<br />
Figure 5. 7. Descrierea transformărilor XSLT şi validarea procesului<br />
O pagină <strong>de</strong> mapare wiki conţine un <strong>si</strong>mplu document XML care reprezintă configuraţia:<br />
<br />
<br />
<br />
<br />
<br />
<br />
Preprocess<br />
metadata_preprocess.xslt<br />
Metadata_preprocess.x<br />
ml<br />
Split files<br />
metadata_split.xslt<br />
Legatură dintre repo<strong>si</strong>tory-ul digital şi furnizorii <strong>de</strong> date este realizată prin mecanismul <strong>de</strong><br />
<strong>de</strong>scris în Metadata Aggregation Report. Unealta <strong>de</strong> ingest colectează toate erorile şi<br />
atenţionările care au loc în timpul procesului şi le rapoarteaza în wiki. Fiecare colecţia va avea<br />
un raport ataşat asupra bunul curs al operaţiunii <strong>de</strong> ingest. Toate rapoartele sunt colectate apoi<br />
şi raportate într-o pagina ataşată paginii furnizorului <strong>de</strong> metadate. Aceste rapoarte se vor<br />
folo<strong>si</strong> mai apoi pentru a obţine datele pentru evaluare.<br />
43<br />
000001.xml<br />
000002.xml<br />
Split_files.xml<br />
Validate files<br />
metadata_validate.xslt<br />
Split elements containing<br />
multiple values<br />
metadata_multiple_tags.xslt<br />
Validation_<br />
results.xml<br />
000001.xml.tmp<br />
000002.xml.tmp<br />
Splitted_files.x<br />
ml<br />
Vocabulary_type.xml<br />
Generate FOXML files<br />
metadata_foxml_2.xslt<br />
Create error/warning files<br />
metadata_filter_files.xslt<br />
metadata_filter_warnings.xslt<br />
metadata_filter_errors.xslt<br />
foxml/000001.xml<br />
forml/000002.xml<br />
Foxml/valid.<br />
xml<br />
Valid_files.xml<br />
../errors.xml<br />
../warnings.xml
Figure 5. 8. Metadata Aggregation Report<br />
Această implementare lucrează <strong>de</strong>ja automat <strong>de</strong> peste un an (septembrie 2010).<br />
5.2.5. Prototip pentru realizarea interoperabilităţii cu biblioteca digitala<br />
Europeana DL<br />
La sfârşitul acestei secţiuni este <strong>de</strong>mn <strong>de</strong> menţionat prototipul <strong>de</strong> interoperabilitate <strong>de</strong>zvoltat<br />
pentru a realiza colaborarea cu biblioteca Europeana DL. S-a instalat exten<strong>si</strong>a furnizorul<br />
Fedora’Commons OAI şi s-au <strong>de</strong>zvoltat cateva transformări XSLT pentru a translata mo<strong>de</strong>lul<br />
<strong>de</strong> conţinut actual al repo<strong>si</strong>tory digital în conformitate cu mo<strong>de</strong>lul <strong>de</strong> conţinut digital al<br />
Europeana DL [40]. Am utilizat “crosswalking” pentru alinierea schemei cu schema <strong>de</strong>finită<br />
<strong>de</strong> Europeana DL. Documentaţia şi rezultele testelor sunt disponibile pe platforma <strong>de</strong><br />
documentare <strong>de</strong> la adresa [180]. Procesul poate fi oricând repetat iar unelata este disponibilă<br />
şi executabilă în interfaţa modificată a furnizorului OAI.<br />
5.3. A doua arhitectură concretă<br />
A doua arhitectură utilizează tehnologiile <strong>de</strong> repo<strong>si</strong>tory partajat proprie Semantic MediaWiki:<br />
şabloane wiki, proprietăţi semantice, export RDF şi interogări semantice în timp real în<br />
paginile wiki. Acest mo<strong>de</strong>l reprezintă conceptual o arhitectură <strong>de</strong> trecere între primul mo<strong>de</strong>l şi<br />
cel care foloseşte pe <strong>de</strong>plin tehnologiile semantice.<br />
Metodologia<br />
A doua arhitectură pentru managementul repo<strong>si</strong>tory digital este bazată pe Semantic<br />
MediaWiki, este construită şi face uz <strong>de</strong> proprietăti semnatice, ca şi <strong>de</strong> şabloane semantice.<br />
Interogările în timp real şi constructorul <strong>de</strong> interogări in-line ajuta utilizatorii finali non tehnici<br />
sa regăseasca uşor resursele digitale.<br />
44
Mo<strong>de</strong>lul implică meto<strong>de</strong> care colectează automat metadatele generate <strong>de</strong> o unealtă web<br />
utilizată <strong>de</strong> biologi, un editor <strong>de</strong> chei <strong>de</strong> i<strong>de</strong>ntificare. (editor jKey). Cheile <strong>de</strong> i<strong>de</strong>ntificare cu o<br />
<strong>si</strong>ngură intrare pot fi stocate direct în obiecte wiki [186].<br />
Structura <strong>de</strong> baza este un şablon Key Start care conţine metadate cum sunt titlul, <strong>de</strong>scrierea,<br />
autorul cheii, sablonul pentru secvenţa <strong>de</strong> indrumare (sau Lead Question plus Lead) care<br />
conţine cheia propriu-zisă, şi un şablon Key End [78]. Cheile <strong>de</strong> i<strong>de</strong>ntificare sunt afişate în<br />
wiki utilizând funcţionalitatea standard a şabloanelor MediaWiki şi nu este necesară o exten<strong>si</strong>e<br />
anumită [184].<br />
La inceput, metadatele ataşate şabloanelor cheilor <strong>de</strong> i<strong>de</strong>ntificare au fost colectate ca şi oricare<br />
alte metadate. Apoi urmând scopul introducerii tehnologiilor semantice am <strong>de</strong>cis să abordam<br />
acestă problemă altfel.<br />
a) Arhitectura<br />
Am transformat fluxul <strong>de</strong> lucru astfel:<br />
Şabloanele Metadata <strong>de</strong>vin şabloane Metadata semantice prin adăugarea <strong>de</strong> proprietăţi<br />
semantice;<br />
Obiectele digitale pentru colecţie şi furnizor nu mai sunt necesare;<br />
Fluxul <strong>de</strong> lucru KeyStart ramane acelaşi în fapt, excepţie făcând repo<strong>si</strong>tory-ul Fedora<br />
Commons care a fost înlaturat şi el;<br />
In loc <strong>de</strong> ingest în repo<strong>si</strong>tory-ul extern, am folo<strong>si</strong>t unealta <strong>de</strong> Raportare MediaWiki .<br />
Această unealtă crează o nouă pagină într-un wiki un<strong>de</strong> este instalată exten<strong>si</strong>a Semantic<br />
Wiki, facand uz <strong>de</strong> elementele sablonul Metadata.<br />
In acest moment, metadatele ataşate cheilor <strong>de</strong> i<strong>de</strong>ntificare sunt disponibile pentru<br />
uneltele <strong>de</strong> căutare semantice.<br />
b) Imbunătăţirea fluxului <strong>de</strong> lucru<br />
Noul şablon <strong>de</strong> flux <strong>de</strong> lucru scurtează timpul <strong>de</strong> lucru necesar pentru execuţia instanţelor <strong>de</strong><br />
flux <strong>de</strong> lucru. Operaţiile care sunt mari consumatoare <strong>de</strong> timp ca – cautarea colecţiilor vechi<br />
în repo<strong>si</strong>tory sau ingestul în repo<strong>si</strong>tory-ul extern în Fedora Commons nu mai sunt acum<br />
necesare.<br />
c) Inglobarea interogărilor semantice<br />
Prin înglobarea interogărilor semantice în textul wiki, uilizatorii pot crea pagini dinamice care<br />
încorporeaza interogările cele mai utilizate [115].<br />
Utilizând exportul RDF al SMW, uneltele externe pot beneficia <strong>de</strong> pagini wiki îmbogăţite<br />
semantic.<br />
Figure 5. 9. Fluxul <strong>de</strong> lucru Key Start<br />
45
5.3.1. Descrierea tehnologiei şi <strong>de</strong>zvoltarea<br />
A. Stabilirea furnizorilor <strong>de</strong> date şi/sau metadate şi strategiile <strong>de</strong> integrare. Metadatele sunt<br />
furnizate <strong>de</strong> o unealtă automată şi este nevoie <strong>de</strong> o schemă <strong>de</strong> interoperabilitate a<br />
metadatelor. Aceasta schema conţine elemente care extind schema Dublin Core prin<br />
elemente <strong>de</strong>rivate din ea. Transferul utilizează <strong>si</strong>ntaxa şabloanelor Semantic MediaWiki ca<br />
mediu pentru un formular <strong>de</strong> intrare.<br />
B. Stabilirea repo<strong>si</strong>tory-ului <strong>de</strong>stinatar şi a arhitecturii sale concrete.<br />
Arhitectura Obiectului Digital. Repo<strong>si</strong>tory-ul digital <strong>de</strong>stinaţie este Semantic MediaWiki.<br />
Arhitectura obiectului digital la nivelul repo<strong>si</strong>tory. La nivelul repo<strong>si</strong>tory digital, structura<br />
logica manageabilă este colecţia.<br />
C. Mo<strong>de</strong>lul ales opentru conţinut şi producţia <strong>de</strong> fluxuri <strong>de</strong> lucru. Un set <strong>de</strong> unelte Java<br />
realizează maparea dintre mo<strong>de</strong>lul utilizator şi mo<strong>de</strong>lul repo<strong>si</strong>tory intern din semantic wiki.<br />
Aceste unelte transformă şabloanele (surse wiki) în şabloane SMW şi scriu automat<br />
rezultatul ca pagini intr-un wiki semantic (wiki <strong>de</strong>stinaţie).<br />
D. Servicii <strong>de</strong> maintenanţa şi uneltele aferente. Rapoartele automate nu mai sunt necesare<br />
<strong>de</strong>oarece rezultatele integrarii şi statisticile se bazează pe mecanismele interne SMW care<br />
fac rapoartele automat disponibile în browser.<br />
5.4. A treia arhitectura concretă<br />
Urmatoarea secţiune prezintă rezultatul participarii autorului tezei la un proiect 5 german care<br />
nazuia să construiască un VRE în domeniul istoriei educatiei [157].<br />
5.4.1. Cerintele contextuale ale arhitecturii<br />
Ţelul general este construirea unui mediu <strong>de</strong> cercetare în domeniul educaţiei cu scopul <strong>de</strong> a<br />
analiza lexicoanelor care au o vechime <strong>de</strong> 200 ani. Datele bibliografice sunt utilizate pentru o<br />
analiză bibliometrică; ele vor fi îmbogăţite şi adnotate colaborativ <strong>de</strong> către cercetatori în<br />
scopul facilitării analizei cantitative [156].<br />
Colectia <strong>de</strong> lexicoane în discuţie este original disponibilă într-o biblioteca digitală numită<br />
Scripta Paedagogica Online (SPO) 6 . Este gazduită <strong>de</strong> Biblioteca pentru Istoria Educatiei la<br />
DIPF care a in<strong>de</strong>xat-o şi o poate furniza către terţi. Corpusul conţine un total <strong>de</strong> 22,000<br />
articole şi mai mult <strong>de</strong> 20 lexicoane. Fiecare lexicon este <strong>de</strong>scris bibliografic ca o ediţie<br />
colecţie şi stocată în baza <strong>de</strong> date a bibliotecii sub un <strong>si</strong>stem allegro-C 7 .<br />
Protocolul <strong>de</strong> interoperabilitate Z39.50 implemntat conţine restricţii pentru transferal datelor<br />
în timp real, astfel metadatele necesare în procesul <strong>de</strong> integrare sunt transferate prin fişiere<br />
Allegro-XML [157].<br />
5.4.2. Metodologia<br />
A treia arhitectură este menită să uşureze integrarea datelor structurate externe. Acest mo<strong>de</strong>l<br />
este construit pe mo<strong>de</strong>lul Semantic MediaWiki şi serveşte un Virtual Research Environment.<br />
Principala provocare pentru integrarea datelor este importarea informaţiei structurate eterogen<br />
(date şi metadata) din repo<strong>si</strong>torye digitale externe şi prezentarea lor în wiki utilizând<br />
ontologii. Fluxul <strong>de</strong> procesare a metadatelor este <strong>de</strong>scries în wiki cu ajutorul proprietăţilor<br />
semantice, a şabloanelor semantice şi a interogărilor în timp real [182].<br />
Mecanismul <strong>de</strong> aliniere al procesului <strong>de</strong> integrare între biblioteca digitală, SMW şi<br />
MediaWiki este iterativ şi bidirecţional. Următorii trei paşi au fost <strong>de</strong>terminanţi:<br />
5 Proiectul Virtual Research Environment "Semantic MediaWiki for Collaborative Corpora Analy<strong>si</strong>s” (SMW-<br />
CorA) este finanţat <strong>de</strong> German Research Foundation (DFG), iniţiat <strong>de</strong> DIPF în cooperare cu KIT, BBF şi<br />
cercetători care activeaza în domeniul istoriei educaţiei.<br />
6 Lexicoanele sunt disponibile la http://bbf.dipf.<strong>de</strong>/digitale-bbf/scripta-paedagogica-online/digitali<strong>si</strong>erte-<br />
nachschlagewerke.<br />
7 Vezi http://www.allegro-c.<strong>de</strong>/<br />
46
1. I<strong>de</strong>ntificarea entităţilor relevante la nivelul bibliotecii digitale (colecţii, obiecte<br />
digitale, cataloage <strong>de</strong> metadate şi structura metadatelor) şi mo<strong>de</strong>lul <strong>de</strong> utilizarea pentru<br />
efectuarea cercetării în VRE.<br />
2. Construirea unei ontologii facile pentru ca obiectele din biblioteca să se alinieze cu<br />
MediaWiki şi SMW <strong>si</strong> să ofere o interfaţă a<strong>de</strong>cvată pentru cercetatori.<br />
3. Configurarea unui manager pentru fluxul <strong>de</strong> lucru al procesului <strong>de</strong> integrare care să<br />
satisfacă elementele ontologiei, să creze şabloane şi să genereze instanţe.<br />
Fluxul <strong>de</strong> lucru semi-automat utilizat pentru integrarea metadatelor este <strong>de</strong>scris mai jos şi este<br />
construit având ca suport două tehnologii: şabloanele MediaWiki şi un mo<strong>de</strong>l flexibil al<br />
ontologiei fluxului <strong>de</strong> lucru. Acest flux <strong>de</strong> lucru este teoretic bazat pe [188] şi pe mo<strong>de</strong>lul<br />
flexibil <strong>de</strong> flux <strong>de</strong> lucru expus în [182]. Mo<strong>de</strong>lul <strong>de</strong> referinţă introdus în capitolul 4 este extins<br />
şi adaptat în acest nou context şi utilizează şabloane semantice.<br />
Figure 5. 10. Procesul <strong>de</strong> integrare al metadatelor<br />
5.4.3. Descrierea tehnologiei şi <strong>de</strong>zvoltarea<br />
A. Stabilirea furnizorilor <strong>de</strong> date/metadate, a protocolului <strong>de</strong> transfer şi a strategiei <strong>de</strong><br />
integrare. Structura metadatelor trebuie să urmeze un protocol care să <strong>de</strong>finească schema<br />
pentru interoperabilitatea metadatelor. Aceasta schemă conţine elemente care extend<br />
schema Dublin Core, şi vocabularele controlate Foaf şi Prism. Transferul utilizează<br />
şabloanele Semantic MediaWiki şi un protocol cu furnizorii <strong>de</strong> metadate (biblioteca<br />
digitală) pentru livrarea metadatelor în format XML.<br />
B. Stabilirea repo<strong>si</strong>tory <strong>de</strong>stinaţie şi arhitectura sa.<br />
Arhitectura obiectului digital. Repo<strong>si</strong>tory-ul digital <strong>de</strong>stinatar este repo<strong>si</strong>tory-ul local al<br />
MediaWiki şi arhitectura obiectului digital este <strong>si</strong>milară cu cea a unei paginini wiki<br />
semantice.<br />
Arhitectura Repo<strong>si</strong>tory Digital. Unitatea logică la nivelul repo<strong>si</strong>tory digital şi cu<br />
corespon<strong>de</strong>nt direct la nivelul VRE este colecţia. Structura colecţiei conţine agregări ale<br />
altor obiecte.<br />
C. Dezvoltarea mo<strong>de</strong>lului <strong>de</strong> conţinut şi producţia <strong>de</strong> fluxuri <strong>de</strong> lucru. Un set <strong>de</strong> unelte Java şi<br />
exten<strong>si</strong>i MediaWiki a<strong>si</strong>gură maparea dintre mo<strong>de</strong>lul bibliotecii digitale şi mo<strong>de</strong>lul<br />
repo<strong>si</strong>tory digital semantic wiki. Aceste unelte transformă fişierele XML încarcate în wiki<br />
în şabloane SMW şi scriu automatic rezultatul în pagini wiki semantice.<br />
Componentele principale ale procesului <strong>de</strong> integrare sunt a<strong>si</strong>gurate <strong>de</strong> setul <strong>de</strong> unelte Java<br />
care transformă fişierele XML şi încarcă resursele digitale in wiki [181]. Aceste<br />
componente in<strong>de</strong>pen<strong>de</strong>nte şi re-utilizabile sunt bazate pe tehnologii <strong>de</strong>schise [186][183].<br />
Declanşate <strong>de</strong> un fişier <strong>de</strong> configurare general XML intr-o pagină wiki, aceste unelte pot<br />
47
funcţiona împreună sau in<strong>de</strong>pen<strong>de</strong>nt. Datele transferate între unelte utilizează formatul<br />
XML. Orchestrarea uneltelor <strong>de</strong>pin<strong>de</strong> <strong>de</strong> şablonul fluxului <strong>de</strong> lucru care la randul său este<br />
mapat la şabloanele <strong>de</strong> metadate pentru colectare. Această mapare este specificată prin<br />
intermediul unei pagini <strong>de</strong> configurare wiki în spaţiul <strong>de</strong> nume special “MediaWiki”.<br />
Această pagină wiki conţine parametrii şi comentarii <strong>de</strong>spre modul <strong>de</strong> funcţionare şi<br />
utilizare a şabloanelor wiki.<br />
Unealta <strong>de</strong> integrare recoltează numai paginile wiki care un lexicon în format XML ca<br />
ataşament. De exemplu, parametrul următor specifică numele proprietăţii semantice<br />
prevăzute ca fişier ataşat XML:<br />
attachParam = Wikitext Metadata Attachment<br />
(Configuration parameter as semantic property referring to the lexicon în XML<br />
format)<br />
În exemplul <strong>de</strong> mai sus se specifică că pagina wiki conţinând proprietatea semantică<br />
Wikitext Metadata Attachment conţine ultimul fişier XML pentru recoltarea metadatelor.<br />
Pagina <strong>de</strong> configurare poate fi diferită pentru un alt wiki. Singura constrângere cerută este<br />
ca ambele wiki să aiba exten<strong>si</strong>a SMW activată.<br />
Şabloanele <strong>de</strong> flux <strong>de</strong> lucru care se referă la managementul metadatelor <strong>si</strong> uneltele<br />
prevăzute pentru aceasta sunt: IntegrationLexiconTemplate, AchiveImageResouce şi<br />
UploadImageToWiki. Ultimele două şabloane sunt constrânse după cum urmează: orice<br />
instanţă UploadImageToWiki va funcţiona numai după ce instanţa AchiveImageResouce sa<br />
terminat cu succes [156] [157].<br />
Orice instanţă a fluxului <strong>de</strong> lucru este efectiv mapată pe un lexicon ca unitate logică <strong>de</strong><br />
prelucrare. O instanţă <strong>de</strong> flux <strong>de</strong> lucru poate executa următoarele acţiuni:<br />
a. Furnizorii <strong>de</strong> metadata (Biblioteca Digitală) încarcă metadatele în wiki (metadata<br />
harvesting).<br />
b. Datele în format XML format sunt interogate <strong>de</strong> o unealtă automată Java.<br />
c. Transformările XML şi XSLT sunt bazate pe un protocol <strong>de</strong> transfer (Metadata<br />
Exchange Agreement) şi apoi validate şi crează obiecte digitale ca pagini în wiki.<br />
d. Resursele digitale (imagini) sunt <strong>de</strong>scărcate din biblioteca digitală şi încarcate în<br />
repo<strong>si</strong>tory-ul media wiki. Concomitent se creaza automat noi metadate <strong>de</strong>spre licenţă,<br />
copyright şi proprietarul drepturilor <strong>de</strong> publicare.<br />
e. Metadatele şi resursele media sunt stocate în repo<strong>si</strong>tory-ul digital wiki ca pagini wiki.<br />
D. Servicii <strong>de</strong> întreţinere şi unelte <strong>de</strong>dicate. Rapoartele automate nu sunt necesare pentru că<br />
rezultatele integrării şi statisticile se bazează pe mecanismul intern SMW care le face apoi<br />
disponibile în browser. Prin înglobarea interogărilor în textul wiki, utilizatorii pot crea<br />
pagini dinamice care încorporează cele mai frecvente <strong>si</strong> utilizate interogări.<br />
Utilizarea XML a<strong>si</strong>gură o interfaţă uniformă pentru date şi facilitează integrarea automata<br />
pentru resurse <strong>si</strong>milare aflate în biblioteci digitale. În loc <strong>de</strong> a crea diverse unelte <strong>de</strong><br />
transformare a datelor, se aplică transformări XSLT. Pentru un alt furnizor <strong>de</strong> metadate se<br />
ajustează numai transformările XSLT.<br />
Pentru metoda <strong>de</strong> integrare s-a aplicat o strategie hibridă: Global and Local as View (GLAV)<br />
care poate crea o ve<strong>de</strong>re a surselor <strong>de</strong> date prin generarea unei ve<strong>de</strong>ri <strong>de</strong> ansamblu peste<br />
schema globală <strong>de</strong>scrisă <strong>de</strong> <strong>de</strong>scriptorii surselor. Deoarece această strategie nu este<br />
con<strong>si</strong><strong>de</strong>rată <strong>de</strong>stul <strong>de</strong> flexibilă, este necesară combinarea ei cu meto<strong>de</strong> specific<br />
interoperabilităţii metadatelor, cum este ”crosswalk”. Mai mult, maparea dinamică dintre<br />
<strong>de</strong>scriptori complecşi <strong>de</strong> metadate care mixează elemente din diverse domenii, este a<strong>si</strong>gurată<br />
<strong>de</strong> un profil <strong>de</strong> aplicaţie având suportul versatil al SMW (proprietăţi echivalente, importarea<br />
<strong>de</strong> vocabulare controlate, export RDF) [121].<br />
48
5.4.4. O ontologie <strong>si</strong>mplificată pentru mapare<br />
5.4.4.1. Maparea Metadatelor<br />
Pentru a alinia entităţile bibliografice şi metadatele bibliotecii digitale <strong>si</strong> integrarea acestora in<br />
spaţiul <strong>de</strong> nume MediaWiki este utilizată o schemă <strong>de</strong> mapare (XML/XSLT). Astfel,<br />
principalele entităţi din biblioteca digitală reprezintă pagini wiki utilizând hierarhia <strong>de</strong> pagini<br />
MW. Următioarele relaţii <strong>de</strong> mapare sunt utilizate şi exemplificate în [Figure 5. 11]:<br />
lexicon isEquivalent cu pagina wiki Lexicon.<br />
volumul isEquivalent cu o subpagină wiki<br />
articolul isEquivalent cu o sub-sub-pagină<br />
ficare imagine a unui articol isEquivalent cu o pagină wiki în spatial <strong>de</strong> nume “File”<br />
special pentru media.<br />
Figure 5. 11. Obiectele bibliotecii digitale integrate în Wiki<br />
Imaginile din articole sunt stocate în spatiul <strong>de</strong> nume File al MediaWiki, păstrând metadatele<br />
<strong>de</strong>spre lexicon şi imaginile scanate separate. Se crează o proprietate care conectează articolul<br />
(lemma) cu imaginea, oferind astfel acces direct utilizatorilor. Astfel fiecare proprietate<br />
semantică reprezintă o pagină wiki în spatial <strong>de</strong> nume “Property” al SMW.<br />
Spaţiul <strong>de</strong> nume MediaWiki “File” a<strong>si</strong>gură po<strong>si</strong>bilitatea <strong>de</strong> a vizualiza fişierele media<br />
împreună cu metadatele.<br />
Utilizatorii pot ataşa metadate special create fiecarui fişier media. De obicei, aici este locul<br />
metadatelor relative la dreptul proprietăţii intelectuale. În cazul <strong>de</strong> faţă, se specifică ca<br />
imaginile aparţin <strong>de</strong> drept Bibliotecii Digitale.<br />
Adiţional, ontologia <strong>de</strong> mapare aliniază metadatele obiectelor din biblioteca digital, crează<br />
entităţi şi adaugă aceste metadata sub forma proprietăţilor semantice. Aceasta permite<br />
cercetătorilor să creeze noi entităţi şi să insereze <strong>de</strong>scrieri mai mult sau mai puţin formalizate<br />
acestor pagini wiki. [Figure 5. 12] reprezintă principele aspecte ale mecanismului <strong>de</strong> aliniere.<br />
Schema <strong>de</strong> mapare adresează nece<strong>si</strong>tăţi viitoare şi adaugă proprietăţi SMW obţinute prin<br />
procesare metadatelor. Pentru interacţiunea cu obiectele <strong>de</strong> cercetare şi pentru expunerea<br />
<strong>de</strong>taliată a metadatelor au fost create cateva proprietăţi semantice adiţionale:<br />
• firstPage, lastPage al unui articol, firstName şi lastName al unui autor sau editor<br />
• isPartOf (volum); hasPart (articol), hasImage<br />
• Type (volum, articol, referinţă)<br />
S-a adăugat <strong>de</strong> asemenea un i<strong>de</strong>ntificator pentru manevrarea şi monitorizarea schimbărilor.<br />
49
Figure 5. 12. Mapare dintre schema bibliotecii digitale şi SMW<br />
5.4.4.2. I<strong>de</strong>ntificarea entităţilor relevante pentru interoperabilitate şi re-utilizare<br />
Scopul final al integrării este <strong>de</strong> a oferi datele bibliografice într-un format uniform aşa cum<br />
este RDF, <strong>de</strong> a crea instrumente <strong>de</strong> analiză a acestor capabilităţi şi pentru re-utilizarea parţială<br />
a lanţurilor <strong>de</strong> valori ştiinţifice nou create în aceste comunităţi.<br />
S-au folo<strong>si</strong>t tehnologiile semantice ca platformă principală pentru a<strong>si</strong>gurarea interoperabilităţii<br />
cu analiza şi instrumentele externe bibliografice şi <strong>de</strong> re-utilizarea inter-wiki a metadatelor. În<br />
prima etapă, am folo<strong>si</strong>t vocabulare controlate <strong>de</strong> granularitate fină relative la standar<strong>de</strong>le<br />
Semantic Web (PRISM, SKOS, foaf, DC) pentru a <strong>si</strong>mplifica exportul RDF către terţi.<br />
Elementele acestor vocabularelor au fost integrate în wiki folo<strong>si</strong>nd mecanismul SMW <strong>de</strong><br />
import <strong>de</strong> vocabulare şi ontologii. Astfel proprietăţile <strong>de</strong> mapare între bibliotecă şi metadate<br />
SMW sunt, <strong>de</strong> asemenea, aliniate (<strong>de</strong> exemplu prism:startingPage). Pentru a conferi<br />
bibliotecii digitale po<strong>si</strong>bilitatea <strong>de</strong> a urmări metadatele, este utilizat vocabularul DCterms<br />
pentru specifica aspectele dreptului <strong>de</strong> autor. Următoarea [Figura 5. 13] prezintă o parte din<br />
exportul Semantic MediaWiki RDF catre biblioteca digitală.<br />
Pentru a crea o interfaţă <strong>de</strong> utilizator, schema <strong>de</strong> mapare utilizează <strong>si</strong>stemul MW, <strong>si</strong>ntaxa wiki<br />
şi şabloanelor MW. Au fost generate articole pentru po<strong>si</strong>bilităţile <strong>de</strong> navigare pentru imagini,<br />
şi tabele <strong>de</strong> conţinut aşa cum s-a solicitat <strong>de</strong> către cercetătorii în domeniul educaţiei. În plus,<br />
formele semantice combinate cu şabloane permit cercetătorului modificarea valorilor<br />
proprietăţilor, cum ar fi numele autorilor, fără a utiliza <strong>si</strong>ntaxa wiki. În plus, exten<strong>si</strong>a semantic<br />
form furnizează po<strong>si</strong>bilitatea utilizării <strong>de</strong> vocabulare controlate şi cla<strong>si</strong>ficatorilor pentru a<br />
reduce erorile <strong>de</strong> tastare şi <strong>de</strong> a reglementa adnotarea semantică.<br />
50
Figure 5. 13. Maparea cu vocabulare controlate<br />
În loc <strong>de</strong> a proiecta un VRE în mod izolat, platforma foloseşte o abordare participativă la<br />
<strong>de</strong><strong>si</strong>gn care are drept scop împuternicirea comunităţii <strong>de</strong> cercetare pentru a obţine o implicare<br />
activă în procesul <strong>de</strong> proiectare al VRE. SMW permite o <strong>de</strong>zvoltare agilă a platformei. Acesta<br />
permite acumularea <strong>de</strong> cunoştinţe în domeniul respectiv, şi <strong>de</strong> asemenea, o curbă <strong>de</strong> învăţare<br />
scăzută pentru utilizarea noii platforme multimedia.<br />
Dezvoltarea <strong>si</strong>stemului şi utilizarea lui sunt <strong>si</strong>ncronizate. Acest fenomen este <strong>de</strong>scris în<br />
[Figura 5. 16]. Cercetătorii utilizează <strong>si</strong>stemul, în acelaşi timp cu <strong>de</strong>zvoltarea prototipului. Ei<br />
au cla<strong>si</strong>ficat articolele folo<strong>si</strong>nd "Cuprinsul" [a se ve<strong>de</strong>a Figura 5. 16, la stânga]. Între timp,<br />
cercetatorii au semnalat câteva neconcordanţe între lexiconul real şi datele XML importate<br />
din Biblioteca digitală.<br />
51
Figure 5. 14. Dezoltarea platformei şi provenienţa metadatelor<br />
5.4.5. Realizarea interfeţei utilizator<br />
Interfaţa utilizator profită <strong>de</strong> caracteristicile MediaWiki şi Semantic MediaWiki. Paginile wiki<br />
create automat sunt iniţial “însămanţate” <strong>de</strong> o unealtă automată (bot). Această formatare are<br />
mai multe scopuri:<br />
Utilizarea şabloanelor pentru interfaţă, astfel permiţând separarea metadatelor <strong>de</strong><br />
modul <strong>de</strong> vizualizare;<br />
Utilizarea exten<strong>si</strong>ei semantic forms pentru a permite cercetătorilor categorizarea<br />
articolelor;<br />
Example:<br />
1.<br />
== Nächstes Lemma ==<br />
{{<br />
#ask: [[Category:Lexikon <strong>de</strong>r Pädagogik <strong>de</strong>r Gegenwart]]<br />
[[FirstPage::>{{#show: {{PAGENAME}} | ?LastPage}}]] | ?Titel= | format =<br />
tabel | limit = 1<br />
}}<br />
2.<br />
== Vorheriges Lemma ==<br />
{{<br />
#ask: [[Category:Lexikon <strong>de</strong>r Pädagogik <strong>de</strong>r Gegenwart]]<br />
[[LastPage::
Primul exemplu interoghează wiki pentru a obţine următoarea lemmă, in timp ce al doilea<br />
exemplu interoghează wiki pentru a obţine lemma anterioară. Rezultatul acestori interogări se<br />
observă în următoarea imagine.<br />
Interogări #ask care a<strong>si</strong>gură navigarea între paginile wiki<br />
Utilizarea mecanismului <strong>de</strong> transclu<strong>de</strong>re MW pentru a inclu<strong>de</strong> tabelele <strong>de</strong> conţinut în<br />
paginile lexiconului [See Figure 5. 15, left];<br />
Interogările semantice pentru navigarea în paginile wiki.<br />
Example:<br />
1.<br />
2.<br />
== hat verfasst ==<br />
{{<br />
PAGENAME}} hat insgesamt {{#ask: [[Verfasser::{{PAGENAME}}]]|<br />
| ?Verfasser= | format = count<br />
}} Lemmata verfast.<br />
{{<br />
#ask: [[Verfasser::{{PAGENAME}}]]|<br />
| ?Verfasser= | format = table<br />
}}<br />
În exemplul anterior, prima interogare returnează numărul <strong>de</strong> articole care aparţin unui autor<br />
iar a doua interogare returnează lista lucrărilor autorului respectiv.<br />
53
Figure 5. 15. Tabela <strong>de</strong> conţinut (stânga) şi pagina principal al ediţiei Spieler Lexikon(dreapta)<br />
aşa cum apar ele în SMW<br />
5.4.6. Unealta <strong>de</strong> adnotare şi managentul drepturilor <strong>de</strong> proprietate intelectuală<br />
O abordare separată se ocupă cu conţinutul digital, în special cu imaginile din lexicon. În<br />
cazurile menţionate anterior, imaginile sunt “cetăţeni cu drepturi <strong>de</strong>pline”. MediaWiki impune<br />
constrângeri în utilizarea conţinutului media, din cauza cerinţelor drepturilor <strong>de</strong> proprietate<br />
intelectuală (IPR).<br />
În mod regulat în <strong>si</strong>te-uri bazate pe HTML, orice imagini <strong>de</strong> pe net poate fi încorporată, fără<br />
prea mult grijă pentru drepturile intelectuale <strong>de</strong> management al datelor. Mecanismele<br />
MediaWiki pot preveni această încălcare, cerând explicitarea unei "surse <strong>de</strong> date prietenoasă<br />
la distanţă", un repo<strong>si</strong>tory comun local serverului sau un repo<strong>si</strong>tory intern al wiki-ului curent.<br />
O cerinţă specială pentru această arhitectură concretă a fost crearea unui instrument <strong>de</strong><br />
adnotare. În momentul în care s-a scris <strong>teza</strong>, este disponibil numai un instrument <strong>de</strong> adnotare<br />
<strong>si</strong>mplă.<br />
Prin urmare, am conceput un instrument care <strong>de</strong>scărca imagini din repo<strong>si</strong>tory-ul furnizor <strong>de</strong><br />
date şi îl încărcă în MediaWiki. Imaginile trebuie să fie încărcate în repo<strong>si</strong>tory-ul intern<br />
MediaWiki şi să creeze şi imagini în format redus (thumbnails). Concomitent, crearea<br />
metadatelor IPR este obligatorie, astfel se crează metadatele: <strong>de</strong> licenţă, <strong>de</strong>claraţia <strong>de</strong> licenţă,<br />
<strong>de</strong> proprietate, etc<br />
În a doua etapă se poate folo<strong>si</strong> instrumentul adnotator. Adnotările pot cuprin<strong>de</strong> o gamă largă<br />
<strong>de</strong> informaţii, având gra<strong>de</strong> diferite <strong>de</strong> formalizare. Adnotarea poate fi informală – numai<br />
wikitext - sau wikitext complet formalizat cu proprietăţi semantice.<br />
Diagrama <strong>de</strong> mai jos prezintă instrumentul modificat numit MediaWiki Image-Annotator care<br />
realizează adnotarea <strong>de</strong> bază aşa cum funcţionează <strong>de</strong>ocamdată.<br />
54
Figure 5. 16. Adnotarea imaginilor prin utilizarea <strong>de</strong> propertăţi semantice<br />
Figure 5. 17. Metadatele IPR ataşate automat <strong>de</strong> unealtă.<br />
Diagrama <strong>de</strong> mai sus arată explicit metadatele Data Right Management care au fost ataşate<br />
automatic <strong>de</strong> către unealtă imaginii. Acestea, împreună cu metadatele ataşate manual <strong>de</strong> către<br />
cercetători, formează o bază <strong>de</strong> cunoştinţe care va putea fi interogată mai tarziu <strong>de</strong> către<br />
uneltele <strong>de</strong> analiză.<br />
55
6. PLATFORMA DE EVALUARE<br />
6.1. Validarea mo<strong>de</strong>lului<br />
Mo<strong>de</strong>lul Mediator este menit să a<strong>si</strong>gure interoperabilitatea semantică, după cum am văzut<br />
<strong>de</strong>ja în capitolul 2 al tezei. Mo<strong>de</strong>lul propus funcţionează bi-directional, şi poate să gestioneze<br />
doua repo<strong>si</strong>tory în acelaşi timp. El este aliniat cu mo<strong>de</strong>lul <strong>de</strong> referinţă DELOS şi la mo<strong>de</strong>lul<br />
<strong>de</strong> conţinut al Fedora Commons. Este compatibil cu mo<strong>de</strong>lele prezentate în [131] şi [38].<br />
A<strong>si</strong>gurarea interoperabilităţii în domeniul tehnologiei informaţiei şi <strong>de</strong> cercetare este o sarcină<br />
dificilă.<br />
Parteneri implicaţi sunt entităţi complexe care au <strong>de</strong>zvoltat instrumente pentru i<strong>de</strong>ntificare sau<br />
e-Learning şi/sau furnizori <strong>de</strong> date sau cercetători. Aceşti participanţi sunt con<strong>si</strong><strong>de</strong>raţi <strong>si</strong>steme<br />
separate, care ar trebui să interoperează la mai multe niveluri.<br />
Procesul va fi analizat având ca indicatori aspectele promulgate <strong>de</strong> Systems of Systems<br />
Interoperability Mo<strong>de</strong>l (SoSI) [136]. Pentru a realiza acest lucru, ne propunem să folo<strong>si</strong>m<br />
mo<strong>de</strong>lul MediaWiki, subliniind "cele mai bune practici", procesele şi meto<strong>de</strong>le care ar putea fi<br />
adoptate cu uşurinţă şi <strong>de</strong> către alte proiecte sau comunităţi restrânse. În conformitate cu<br />
mo<strong>de</strong>lul SoSI, implicarea utilizatorului în întreagul proces a<strong>si</strong>gură cel mai înalt nivel <strong>de</strong><br />
interoperabilitate.<br />
Prin urmare, soluţiile <strong>de</strong> interoperabilitate sunt limitate în mod necesar [174], <strong>de</strong>oarece<br />
nazuinţa <strong>de</strong> a captura semantica comună a datelor între diferitele <strong>si</strong>steme duce la nece<strong>si</strong>tatea<br />
<strong>de</strong>finirii <strong>de</strong> exten<strong>si</strong>i <strong>de</strong> <strong>si</strong>stem specifice care să reflecte intenţia şi cazurile specifice <strong>de</strong><br />
utilizare a <strong>si</strong>stemului pentru fiecare furnizor <strong>de</strong> date în parte.<br />
La nivel <strong>si</strong>ntactic efortul <strong>de</strong> standardizare adoptat a<strong>si</strong>gură suficientă interoperabilitate. Un<br />
profil standard <strong>de</strong> aplicaţie bazat pe standar<strong>de</strong>le existente, este o soluţie <strong>de</strong> dorit, dar o sarcină<br />
dificilă.<br />
La nivelul aplicaţiei (constructiv), mai multe tehnologii actuale prevăd elementele <strong>de</strong><br />
interoperabilitate.<br />
Dar, la cel mai înalt nivel <strong>de</strong> interoperabilitate la nivelul <strong>si</strong>stemului, care implică<br />
interoperabilitate programatică şi operaţională, toate soluţiile actuale pot adresa doar o parte a<br />
realităţii complexe a unei organizaţii. Critic, nivelul <strong>de</strong> expertiza tehnologica impus <strong>de</strong> unele<br />
soluţii este dincolo <strong>de</strong> po<strong>si</strong>bilităţile multor comunităţi mici sau medii.<br />
Evi<strong>de</strong>nt, formatul <strong>de</strong> date XML şi validare pe baza schemei adresează parţial unele dintre<br />
aceste probleme tehnice. Cu toate acestea, o restricţie la schema XML a transferului <strong>de</strong> date ar<br />
putea fi dincolo <strong>de</strong> capacităţile tehnologice ale multor utilizatori. În consecinţă, această nouă<br />
metodă <strong>de</strong> transfer bazată pe <strong>si</strong>ntaxa <strong>si</strong>mplă MediaWiki s-a dovedit a fi o soluţie viabilă.<br />
În ceea ce priveşte mo<strong>de</strong>lul <strong>de</strong> interoperabilitate SoSI, am putea sublinia următoarele [187]:<br />
A. Paşi pentru a realiza interoperabilităţii programatice:<br />
tratatele și politicile pentru transferul metadatelor<br />
utilizarea <strong>de</strong> şabloane MediaWiki<br />
protocoale <strong>de</strong> nivelul tehnologic scăzut între MediaWiki şi furnizorii <strong>de</strong> date.<br />
B. Paşi pentru realizarea interoperabilitaţii constructive:<br />
procese inginereşti: MediaWiki API, exten<strong>si</strong>i MediaWiki, formate <strong>de</strong> date<br />
standar<strong>de</strong> <strong>de</strong> date: XML, Resource Description Framework (RDF), Dublin Core<br />
acordurile tehnice între participanţi.<br />
Utilizarea ontologiilor prin angajarea infrastructurii Semantic MediaWiki la nivel <strong>de</strong><br />
tehnologie semantică (RDF, RDFS), permite o abordare axată pe utilizator şi o <strong>de</strong>zvoltare <strong>de</strong><br />
schemă <strong>si</strong>mplificată.<br />
56
C. Prin intermediul mecanismului Category al MediaWiki, furnizorii <strong>de</strong> date sunt informaţi cu<br />
privire la rezultatele stocării <strong>de</strong> metadate. Acest feedback pentru furnizorii <strong>de</strong> date realizează<br />
interoperabilitatea operaţională <strong>de</strong> bază.<br />
Con<strong>si</strong><strong>de</strong>rând cele <strong>de</strong> mai sus, susţinem că platforma bazată pe MediaWiki a<strong>si</strong>gură un nivel <strong>de</strong><br />
bază operaţional în conformitate cu mo<strong>de</strong>lul SoSI <strong>de</strong> interoperabilitate.<br />
6.2. Analiza performanţelor tehnice ale uneltelor<br />
Rezultatele evaluării metodologiei <strong>de</strong> ingest folo<strong>si</strong>nd MediaWiki şi managementul automat al<br />
fluxului <strong>de</strong> lucru <strong>de</strong>monstrează că metoda noastră este <strong>de</strong> încre<strong>de</strong>re. Instanţe multiple ale<br />
şablonului fluxului <strong>de</strong> lucru conlucrat împreună şi în timpul acestui test am arătat gradul <strong>de</strong><br />
utilizare a resurselor, performanţele şi calitatea procesului <strong>de</strong> ingest. Condiţii extreme (<strong>de</strong><br />
exemplu refuzul <strong>de</strong> serviciu (<strong>de</strong>nial of service), colecţii foarte mari procesate concomitent,<br />
număr maxim <strong>de</strong> instanţe ale fluxului <strong>de</strong> lucru executate concomitent), au fost <strong>si</strong>mulate cu<br />
scopul <strong>de</strong> a <strong>de</strong>monstra valabilitatea abordării noastră. În timpul testelor, am extras mai mulţi<br />
indicatori <strong>de</strong> performanţă:<br />
1. memoria folo<strong>si</strong>tă <strong>de</strong> către serviciul <strong>de</strong> ingest al aplicaţie:<br />
Serviciul Ingest utilizează 320MB <strong>de</strong> memorie la încărcare maxima şi 50% din puterea<br />
unui procesor <strong>de</strong> 1,8 GB, din cauza utilizării motorului XSLT Xalan-Java 2.7.1.<br />
Pregătirea <strong>de</strong> ingest a metadatelor utilizează cea mai multă memorie, ingestul efectiv<br />
foloseşte doar 60MB <strong>de</strong> memorie.<br />
2. rezultatele testelor<br />
• După testarea serviciului <strong>de</strong> ingest pe cea mai mare colecţie (Vascular Plants), se raportează,<br />
după cum urmează:<br />
• pregătirea <strong>de</strong> ingest: 52 minute. Validarea fişierelor <strong>si</strong> împărţirea lor în mai multe elemente<br />
<strong>de</strong> acelaşi nivel a luat 35 <strong>de</strong> minute timp total calculat pentru 49851 obiecte.<br />
Ingestul ca atare a durat 12:50:00 - 17:45:00 PM, aproximativ 10.000 <strong>de</strong> obiecte digitale / oră.<br />
Rezultatele tesării pentru colecţia Vascular Plants<br />
Criteriul Un <strong>si</strong>ngur flux activ Trei fluxuri active<br />
Timp <strong>de</strong> recoltare 7 min 10 min<br />
Timp <strong>de</strong> preprocesare 10 min 17 min<br />
Timp <strong>de</strong> validare 21 min 36 min<br />
Tmp <strong>de</strong> generare al fişierelor<br />
FOXML<br />
11 min 20 min<br />
Timp <strong>de</strong> eliminare a colecţiilor<br />
vechi<br />
80 min 98 min<br />
Timp <strong>de</strong> ingest efectiv 345 min 420 min<br />
6.3. Un cadru pentru evaluarea factorului <strong>de</strong> întrebuinţare<br />
6.3.1. Extragerea datelor din Metadata Aggregation Reports<br />
Într-o primă abordare a recoltării metadatelor în care furnizorii trimiteau metadatele utilizând<br />
meto<strong>de</strong> tradiţionale (email, transfer direct pe server, etc) şi rezultatele ingestului au urmat<br />
aceaşi politică, adică ele au fost exportate în format document şi fişierul rezultat trimis prin email<br />
furnizorilor. Au fost întâmpinate problem diverse atât cu metoda <strong>de</strong> recoltarea<br />
metadatelor cat şi cu acest fişier <strong>de</strong> feedback (<strong>de</strong> exemplu, probleme <strong>de</strong> codare, dificultăţi <strong>de</strong><br />
control al calităţii). Instrumentul <strong>de</strong> ingest folosea o bază <strong>de</strong> date MySQL pentru stocarea<br />
erorilor şi mesajelor <strong>de</strong> avertizare.<br />
57
Având în ve<strong>de</strong>re nivelul scăzut <strong>de</strong> expertiză tehnologică a părţilor interesate, s-a <strong>de</strong>cis să se<br />
pună în aplicare o soluţie acce<strong>si</strong>bilă pentru furnizorii <strong>de</strong> date non-experţi. Mo<strong>de</strong>lul MediaWiki<br />
odata ales s-a extins şi la raportarea rezultatelor ingestului catre furnizori, după cum s-a<br />
dovedit a fi o solutie scalabilă. Utilizarea <strong>de</strong> template-uri în paginile MediaWiki permite<br />
prezentarea şi citirea mai uşoră a datelor şi raportare a erorilor furnizorii pot actualiza datele<br />
lor în orice moment <strong>de</strong> la propriile computere.<br />
Pentru a standardiza diferitele metadate eşantion colectate <strong>de</strong> la furnizori, a fost proiectat un<br />
acord <strong>de</strong> schimb <strong>de</strong> metadate. El <strong>de</strong>fineşte tipurile <strong>de</strong> resurse implicate în proiect şi, <strong>de</strong><br />
asemenea, câmpurile <strong>de</strong> metadate pentru fiecare tip <strong>de</strong> resursă, <strong>de</strong> exemplu, titlul, cuvinte<br />
cheie, categoria subiectului, <strong>de</strong>numiri ştiinţifice, licenţă şi drepturi <strong>de</strong> autor, formatul şi URIuri.<br />
Acestea oferă suport pentru resursele disponibile la nivele <strong>de</strong> calitate diferite (<strong>de</strong> exemplu,<br />
<strong>de</strong> înaltă rezoluţie, optimizate pentru web, sau <strong>de</strong> diferite marimi, miniatură), sub diferite<br />
URI-uri, şi pentru mai multe limbi (titlul <strong>de</strong> exemplu, în limba engleză, precum şi limba<br />
slovenă). Se specifică, <strong>de</strong> asemenea elementele <strong>de</strong> metadate care sunt obligatorii, solicitate<br />
urgent, sau opţionale, pentru fiecare tip <strong>de</strong> resursă.<br />
6.3.2. Sabilirea corpusului<br />
În această secţiune, vom utiliza datele reale on-line obţinute prin procesul <strong>de</strong> bootstrapping al<br />
Metadata Aggregation Report. Vrem să <strong>de</strong>monstrăm faptul că rata <strong>de</strong> eroare este mai mică<br />
<strong>de</strong>cât prin metoda batch din prima abordare pentru recoltarea <strong>de</strong> metadate. Am comparat<br />
calitatea metadatelor care rezultă din ambele studii.<br />
În prezent, există 2.067.224 <strong>de</strong> metadate disponibile în repo<strong>si</strong>tory-ul Fedora Commons,<br />
agregate în 132 colecţii. Aceste colecţii, transmise <strong>de</strong> furnizori <strong>de</strong> date sunt în continuare<br />
disponibile on-line. Raportul <strong>de</strong> Agregarea al Metadatelor este o pagina wiki, care conţin<br />
feedback-ul după fiecare activitate <strong>de</strong> ingest. Raportul <strong>de</strong> Agregare al Metadatelor este legat<br />
cu datele din pagina wiki a colectiei la care raportul face referinţă.<br />
În timp, metadatele au fost transmise <strong>de</strong> mai multe ori şi astfel ele sunt mapate pe ver<strong>si</strong>uni<br />
diferite ale aceleiaşi pagina wiki <strong>de</strong> Raport <strong>de</strong> agregare al metadatelor<br />
Rezultatul acestor rapoarte MediaWiki este analizate automat <strong>de</strong> către un agent care<br />
realizează analiza statistică.<br />
Am construit un instrument pentru captarea semanticii informaţiilor conţinute acolo.<br />
Coroborând acest lucru cu informaţiile obţinute <strong>de</strong> la prima abordare, pretin<strong>de</strong>m acum că a<br />
doua abordare este benefică pentru utilizator. Aceasta este "veriga lipsă" pentru atingerea<br />
interoperabilităţii operaţionale.<br />
6.3.3. Stabilirea meto<strong>de</strong>i <strong>de</strong> evaluare<br />
Am adoptat o metodă data-driven <strong>de</strong> evaluare a rezultatului.<br />
În primul rând, am transformat fiecare revizie a paginii wiki într-o pagină separată semantic<br />
wiki, pentru oferi datele pentru analiză şi interogare semantică.<br />
Pentru a compara rezultatele, instrumentul a căutat <strong>de</strong> asemenea colecţia corespunzătoare care<br />
a fost stocata cu prilejul primei abordări.<br />
Algoritmul <strong>de</strong> mapare este bazat pe algoritmul <strong>de</strong> <strong>si</strong>militudine folo<strong>si</strong>nd patru variabile:<br />
numele furnizorului, ID-ul <strong>de</strong> colectare, nume <strong>de</strong> colecţie şi URI-ul relevant <strong>de</strong> metadate<br />
(Best_Quality_URI). Acest algoritm reprezintă un mo<strong>de</strong>l real, <strong>de</strong> asemenea, utilizat pentru a<br />
oferi măsura a ceea ce este con<strong>si</strong><strong>de</strong>rat o aproximare rezonabilă pentru o anumită utilizare, şi<br />
anume numele colecţiei se putea schimba între recoltarea metadatelor primul şi al doilea<br />
sondaj. Algoritmul funcţionează după cum urmează:<br />
58
1. Gaseşte toţi furnizorii ale colectii <strong>de</strong> metadata <strong>de</strong> la prima<br />
abordare;<br />
2. Gaseste toate colecţiile <strong>de</strong> la al doilea abordare.<br />
3. I<strong>de</strong>ntificaţi colecţiile ambelor abordări utilizând Resource_ID. Dacă<br />
ID-ul lipseşte sau nu este prezent în ambele sondaje, atunci:<br />
4. Aplică algoritmi <strong>de</strong> căutare bazat pe Distanţa fuzzy Levenshtein<br />
pentru aproximarea numelui colecţiei. Această căutare poate returna<br />
mai multe rezultate candidat. De obicei, nu mai mult <strong>de</strong> trei rezultate<br />
sunt preluate.<br />
5. Algoritmul caută apoi metadatele relevante din interiorul obiectelor<br />
digitale. În principal este utilizat apoi Best_Quality_URI.<br />
Procedura implică apoi scrierea <strong>de</strong> pagini semantice intr-un wiki semantic. Paginile wiki<br />
create <strong>de</strong> acest process sunt disponibile online, la:<br />
http://biowikifarm.net/test2/Category:Evaluation. Acest corpus astfel obţinut poate fi mai apoi<br />
pentru a obţine şi alte rezultate <strong>de</strong> interes statistic.<br />
Figure 6. 1. Exemplu <strong>de</strong> Metadata Aggregation Report în SMW, după o operaţiune <strong>de</strong><br />
preprocesare<br />
Am evaluat rata erorilor şi a mesajelor <strong>de</strong> avertizare. Numărul total <strong>de</strong> obiecte a fost calculate<br />
ca:<br />
Total number of objects = number of ingested objects + number of errors.<br />
(obiectele digitale conţinănd erori nu au fost stocate în reposotory ca urmare a procesului <strong>de</strong><br />
ingest).<br />
Error rate = number of errors / total number of objects.<br />
Warning rate = number of warnings / total number of objects.<br />
59
Rata <strong>de</strong> eroare a fost calculate pentru fiecare revizie a fiecărei colecţii. O tabelă globala este<br />
<strong>de</strong> asemenea diponibilă online.<br />
Urmatoarea tabelă prezintă un total:<br />
Rapoartele aferente celor două abordări<br />
Caracteristică Prima abordare A doua abordare<br />
Rata erorilor 0,04 0,03<br />
Rata mesajelor <strong>de</strong> avertizare 0,03 0,02<br />
Obiecte stocate in repo<strong>si</strong>tory 184.209 191.800<br />
Numărul <strong>de</strong> erori 5063 5047<br />
Numărul mesajelor <strong>de</strong> avertizare 3915 2812<br />
Următoarea diagram ilustrează distribuţia ratei erorilor în colecţii.<br />
Figure 6. 2. Rata erorilor pe colecţii<br />
Asa după cum se observă, rata mesajelor <strong>de</strong> avertizare este mai mica <strong>de</strong>cât rata erorilor.<br />
60
Figure 6. 3. Rata mesajelor <strong>de</strong> avertziare pe colecţii<br />
Evoluţia în timp a ratei erorilor pe colecţii poate <strong>de</strong>monstra importanţa colaborarii pentru<br />
activitatea <strong>de</strong> management al unui repo<strong>si</strong>tory <strong>de</strong> metadate.<br />
Figure 6. 4. Evoluţia în timp a ratei erorilor pe o colecţii.<br />
61
În continuare, este prezentată analiza rezultatelor pentru o <strong>si</strong>ngură colecţie. Rată erorilor<br />
pentru prima abordare este prezentată ca prima bară, în roşu închis. Rata <strong>de</strong> eroare a scăzut în<br />
mod constant până la sfârşitul perioa<strong>de</strong>i <strong>de</strong> evaluare. Aparent, rata <strong>de</strong> eroare rămâne aceeaşi<br />
atunci cand numărul <strong>de</strong> obiecte creşte. Colorată in mov, rata <strong>de</strong> eroare a scăzut uşor, dar ea<br />
rămâne constantă după 14.10.2010. O privire mai atentă la datele <strong>de</strong> evaluare indică faptul că<br />
un "bot" (unealtă automată MediaWiki) este responsabilă pentru ultimele metadata încărcate<br />
în colecţiile aferente.<br />
Concluzia este că metoda <strong>de</strong> colaborarea cu factorul uman este funcţională, şi ar trebui să fie<br />
exten<strong>si</strong>bila şi la unelte automate. Pentru a în<strong>de</strong>plini acest obiectiv, trei opţiuni sunt<br />
disponibile:<br />
Să <strong>de</strong> ofere un feedback semantic automat instrumentului automat pe care acest<br />
instrument să poată să-l analizeze, astfel încât propagarea erorilor să fie redusă la<br />
minim;<br />
Coraborarea feedback-ul uman lizibil cu notificările prin e-mail către furnizorul <strong>de</strong><br />
metadate;<br />
Scrierea <strong>de</strong> scurte notificări automate pe o pagină <strong>de</strong> discuţie. MediaWiki preve<strong>de</strong><br />
notificarea automată prin mesaje pe paginile <strong>de</strong> discuţie.<br />
Fiecare dintre aceste meto<strong>de</strong> poate fi implementată folo<strong>si</strong>nd Semantic MediaWiki. Ultima<br />
metodă pare mai atrăgătoare pentru că utilizează caracteristica cea mai importantă în<br />
MediaWiki: consensul prin accord mutual.<br />
Figure 6. 5. Rata <strong>de</strong> eroare pentru o <strong>si</strong>ngură colecţie<br />
62
7. CONCLUZII ŞI DIRECŢII<br />
ULTERIOARE DE CERCETARE<br />
Scopul principal al tezei este îmbunătăţirea calităţii managementului metadatelor pe Web, în<br />
general, şi <strong>de</strong> a obţine, astfel, avantaje din utilizarea <strong>de</strong> instrumente mai bune, medii <strong>de</strong><br />
colaborare mai bune şi creşterea gradului <strong>de</strong> întrebuinţare al tehnologiilor webului semantic,<br />
<strong>de</strong> exemplu, a ontologiilor prin furnizarea <strong>de</strong> meto<strong>de</strong> utilizabile pentru utilizatorii non-expert .<br />
În loc <strong>de</strong> o cla<strong>si</strong>ficare a celor mai bune meto<strong>de</strong> care ar putea eventual să ne spună dacă un<br />
mo<strong>de</strong>l <strong>de</strong> management al repo<strong>si</strong>tory-ului este cel mai bun, am optat pentru cea mai buna<br />
abordare pentru un context dat. Am arătat că mediile colaborative online ajută la scă<strong>de</strong>rea<br />
costurilor <strong>de</strong> întreţinere pentru gestionarea repo<strong>si</strong>tory-ului şi prin oferirea <strong>de</strong> meto<strong>de</strong> care<br />
semnalează po<strong>si</strong>bilele erori în avans. Rezultatele acestor evaluări sunt prezentate mai apoi,<br />
indicând gradul <strong>de</strong> întrebuinţare al meto<strong>de</strong>i şi al patformei. După evaluare, a <strong>de</strong>venit clar<br />
faptul că aceste meto<strong>de</strong>, fie <strong>si</strong>ngure, fie în combinaţie, pot garanta cele mai bune rezultate<br />
doar împreună cu implicarea comunităţii în toate activităţile legate <strong>de</strong> managementul<br />
metadatelor.<br />
7.1. Rezultatele<br />
Rezultatul acestei teze este un mo<strong>de</strong>l <strong>de</strong> referinţă şi trei platforme pentru gestionarea<br />
colaborativă a repo<strong>si</strong>tory-ului <strong>de</strong> metadate. Platformele organizează meto<strong>de</strong> şi instrumente în<br />
conformitate cu trei dimen<strong>si</strong>uni: tehnologice (meto<strong>de</strong> inginereşti, tehnologii şi protocoale<br />
tehnice), social şi organizaţional (colaborare, contextual, adaptabilitate, concizie, coerenţă şi<br />
antrenament organizaţional) şi aspecte semantice (<strong>de</strong> vocabular, <strong>si</strong>ntaxă, structură şi<br />
reprezentare). Am adăugat o serie <strong>de</strong> tehnici noi pentru setul <strong>de</strong> instrumente comunitare cu<br />
scopul <strong>de</strong> a construi un repo<strong>si</strong>tory, pentru a gestiona şi <strong>de</strong> a integra date din surse eterogene.<br />
Am <strong>de</strong>monstrat că, cu puţine resurse materiale şi umane, platformele colaborative pot sprijini<br />
infrastructura unui repo<strong>si</strong>tory şi a unui VRE.<br />
Platformele implementate în această teză sunt, <strong>de</strong> asemenea, o noutate în măsura în care au<br />
pus accentul pe unele meto<strong>de</strong> <strong>de</strong> evaluare a mediilor colaborative din perspectiva<br />
utilizatorului.<br />
Pentru a rezuma, vom trece în revistă cateva din întrebările iniţiale <strong>de</strong> cercetare.<br />
Principala provocare pentru managementul repo<strong>si</strong>tory digital este <strong>de</strong> a construi şi livra<br />
conţinutul digital adăugând beneficiile repo<strong>si</strong>tory, fără a împovara creatorii <strong>de</strong> conţinut şi<br />
utilizatorii finali, cu procese suplimentare. Abordările noastre în<strong>de</strong>plineasc acest <strong>de</strong>zi<strong>de</strong>rat<br />
prin utilizarea semi-automată sau gestionarea automată a fluxului <strong>de</strong> lucru.<br />
Table 7.1. <strong>Rezumat</strong>ul întrebarilor cercetării<br />
Intrebare Răspunsul dat <strong>de</strong> teză<br />
Care sunt factorii care influenţează<br />
nece<strong>si</strong>tăţile şi beneficiile în<br />
managementul repo<strong>si</strong>tory <strong>de</strong> metadate?<br />
Care este mo<strong>de</strong>lul cel mai potrivit<br />
pentru reprezentarea artefactelor aflate<br />
în diferite gra<strong>de</strong> <strong>de</strong> formalizare şi<br />
permite folo<strong>si</strong>rea lor în mod uniform?<br />
Care metodă este cea mai potrivita<br />
pentru încurajarea participarii<br />
Nece<strong>si</strong>tăţile utilizatorului şi cerinţele stipulate<br />
pentru un me<strong>de</strong>l semantic <strong>de</strong> repo<strong>si</strong>tory digital.<br />
Utilizarea unui wiki care sa înglobeze achiziţia <strong>de</strong><br />
cunoştinţe şi managementul partajat al<br />
repo<strong>si</strong>tory. Extin<strong>de</strong>rea funcţionalităţii wiki pentru<br />
satisfice cerinţele <strong>de</strong> <strong>de</strong>scoperire semantică a<br />
metadatelor.<br />
Meto<strong>de</strong> colaborative. Proiectarea unui feedback<br />
şi bazarea pe inteligenţa comunităţii. Se aleg<br />
63
utilizatorilor la întregul proces <strong>de</strong><br />
management al conţinutului digital?<br />
Ce metodologie este curent acceptată<br />
pentru a contra-balansa nivelului scăzut<br />
<strong>de</strong> expertiză tehnologică a utilizatorilor<br />
finali, cu nivelele ridicate ale<br />
nece<strong>si</strong>tăţilor funcţionale şi nonfuncţionale<br />
pe care platforma finală ar<br />
trebui să le în<strong>de</strong>plinească?<br />
tehnologii potrivite pentru a atinge scopurile,<br />
adoptarea <strong>de</strong> meto<strong>de</strong> neinvazive, ajută utilizatorul<br />
“să se alinieze” politicii comunităţii. Încre<strong>de</strong>rea<br />
în alegerea consensusului şi politici <strong>de</strong> contract.<br />
Scutirea utilizatorului <strong>de</strong> sarcini împovărătoare.<br />
Utilizarea wiki ca infrastructură. Schimbarea<br />
pon<strong>de</strong>rii <strong>de</strong> la <strong>de</strong>zvoltator la utilizator. Adoptarea<br />
<strong>de</strong> meto<strong>de</strong> automate pentru managementul<br />
repo<strong>si</strong>tory. Adoptarea tehnologiilor semantice<br />
<strong>si</strong>mple şi a ceea ce aceste medii au cel mai<br />
valoros: accentul pe contract. Tehnologiile se<br />
shimbă, dar acordurile rămân valabile pentru<br />
tot<strong>de</strong>auna.<br />
Acest lucru nu numai ca va îmbunatăţi disponibilitatea şi utilizarea <strong>de</strong> resurse digitale pe<br />
Web, dar, <strong>de</strong> asemenea, subliniază şi o cale <strong>de</strong> reconciliere a celor două direcţii <strong>de</strong> cercetare<br />
linked data şi gestionare a resurselor digitale, subliniind interesul comun convergent din<br />
fiecare dintre acestea.<br />
7.2. Rezultate tehnologice<br />
Soluţiile tehnologice pot fi împărţite în următoarele: Metadata Repo<strong>si</strong>tory Management<br />
Platform Definition, Metadata Repo<strong>si</strong>tory Management Tools, Automatic Workflow<br />
Execution, Workflow Visualization, Explicit User Feedback, şi Process Definition.<br />
7.3. Contributii<br />
Teza pretin<strong>de</strong> că răspun<strong>de</strong> principalelor provocări ridicate <strong>de</strong> managementul repo<strong>si</strong>tory-ului:<br />
<strong>de</strong> a construi şi livra conţinut digital şi a exploata beneficiile repo<strong>si</strong>tory-ului fără a împovara<br />
creatorii <strong>de</strong> conţinut şi utilizatorii finali cu procese suplimentare. Responsabilizarea<br />
utilizatorul <strong>de</strong> zi cu zi cu toate prerogativele administratorului <strong>de</strong> metadate restabileşte doar<br />
relaţia naturală între conţinutului digital şi cei care l-au creat.<br />
Această abordare nu este <strong>si</strong>ngulară, având în ve<strong>de</strong>re fiecare din părţile componente, ea fiind<br />
originală în măsura in care am re-examinat, re-utilizat şi mixat părţi ale mo<strong>de</strong>lului OAIS<br />
pentru gestionarea repo<strong>si</strong>tory con<strong>si</strong><strong>de</strong>rând şi tehnologiile semantice, într-o manieră orientată<br />
utilizator şi <strong>si</strong>milară paradigmei Social Semantic Web.<br />
7.3.1. Contribuţii teoretice<br />
A. O analiză completă a managementului repo<strong>si</strong>tory digital (DRM) şi Semantic MediaWiki.<br />
În primul rând, am con<strong>si</strong><strong>de</strong>rat <strong>si</strong>stemele <strong>de</strong> management al repo<strong>si</strong>tory digital orientate pe<br />
mo<strong>de</strong>l şi implementările <strong>de</strong> biblioteci digitale bazate pe software-ul open source existent.<br />
Am i<strong>de</strong>ntificat astfel principalele mo<strong>de</strong>le care stau la baza acestora precum şi limitele<br />
inerente şi constrângerile. În al doilea rând, am studiat mo<strong>de</strong>lul Semantic Wiki şi<br />
implementările existente, care i<strong>de</strong>ntifică caracteristici, funcţionalităţi şi diversele abordări<br />
oferite <strong>de</strong> <strong>si</strong>stemele recente. În al treilea rând, am studiat caracteristicle (Semantic)<br />
MediaWiki. A fost efectuat, <strong>de</strong> asemenea un studiu comparativ cu alte <strong>si</strong>steme <strong>de</strong><br />
management al conţinutului.<br />
B. Un nou mo<strong>de</strong>l <strong>de</strong> referinţă. Mo<strong>de</strong>lul <strong>de</strong> referinţă este construit într-un mod abstract,<br />
acoperind cerinţele din diferite cazuri <strong>de</strong> utilizare şi a fluxurilor <strong>de</strong> lucru implicate.<br />
Urmând mo<strong>de</strong>lul ciclului <strong>de</strong> viaţă al obiectului digital, mo<strong>de</strong>lul <strong>de</strong>scris cuprin<strong>de</strong>: (i) faze,<br />
sub-procese, şi sarcini, (ii) inter-conectarea tranziţiilor, (iii) taskuri specifice, şi (vi)<br />
formele datelor generate şi prelucrate <strong>de</strong> abordările propuse.<br />
C. Introducerea unei ontologii <strong>de</strong> nivel înalt pentru gestionarea colaborativă a repo<strong>si</strong>tory-ului.<br />
D. Conceperea unei meto<strong>de</strong> noi <strong>de</strong> evaluare a gradului <strong>de</strong> întrebuinţare. Evaluarea teoretică a<br />
mo<strong>de</strong>lului con<strong>si</strong><strong>de</strong>rând Systems of Systems Interoperability Mo<strong>de</strong>l (SoSI).<br />
64
7.3.2. Contribuţii practice<br />
E. Introducerea a trei arhitecturi separate pentru managementul repo<strong>si</strong>tory digital. Prima<br />
arhitectură utilizează caracteristicile MediaWiki pentru recoltarea metadatelor eterogene,<br />
colectarea şi agregarea într-un repo<strong>si</strong>tory extern, bazat pe mo<strong>de</strong>lul <strong>de</strong> conţinut specific<br />
Fedora Commons. A doua arhitectură utilizează caracteristici Semantic MediaWiki pentru<br />
a permite semantificarea metadatelor generate <strong>de</strong> un instrument folo<strong>si</strong>t pentru a crea<br />
automat cheile <strong>de</strong> i<strong>de</strong>ntificare în interiorul wiki-urilor. A treia arhitectura utilizează<br />
caracteristici Semantic MediaWiki, pentru a permite cercetatorilor să adnoteze colaborativ<br />
corpusul. Aceste adnotări sunt <strong>de</strong>stinate creării <strong>de</strong> instanţe ale ontologiilor din domeniu şi<br />
stabilirea proprietăţilor lor.<br />
F. Implementarea rezultatelor teoretice în <strong>si</strong>steme practice face rezultatele acestei teze<br />
acce<strong>si</strong>bile pentru utilizator. Implementările platformelelor con<strong>si</strong><strong>de</strong>ră primordial contextul<br />
în care acestea trebuie să funcţioneze. Prin urmare, prima implementare presupune<br />
existenţa resurselor media în <strong>si</strong>stemul furnizorul <strong>de</strong> date. O abordare MW se potriveşte<br />
mai bine în acest caz şi permite folo<strong>si</strong>rea unui repo<strong>si</strong>tory extern <strong>de</strong> metadate şi<br />
implementează mai multe unelte Java pentru managementul automat al repo<strong>si</strong>tory. A doua<br />
implementare presupune existenţa resurselor media în MediaWiki. O abordare SMW se<br />
potriveşte mai bine în acest caz şi permite folo<strong>si</strong>rea partajată a unui repo<strong>si</strong>tory <strong>de</strong> metadate<br />
în wiki. O exten<strong>si</strong>e jQuery şi un set <strong>de</strong> unelte Java completează integrarea. Al treilea caz<br />
<strong>de</strong> implementare reprezintă un mediu virtual <strong>de</strong> cercetare. Un instrument <strong>de</strong> adnotare<br />
pentru imagini, în SMW, extin<strong>de</strong> SMW cu noi funţionalităţi.<br />
G. Un instrument separat care gestionează problemele legate <strong>de</strong> drepturile <strong>de</strong> proprietate<br />
intelectuală. MediaWiki nece<strong>si</strong>tă o abordare atentă pentru conţinutul media. Declararea<br />
explicită a licenţelor este necesareă în spaţiul <strong>de</strong> nume "File". De obicei, resursele media<br />
sunt supuse la prelucrări suplimentare în MediaWiki. Aceste lucrări <strong>de</strong>rivative trebuie să<br />
fie protejate încă <strong>de</strong> la crearea lor in MediaWiki. Acest instrument încărcă resursele<br />
media în repo<strong>si</strong>tory-ul partajat MediaWiki, ataşează metadatele care <strong>de</strong>scriu drepturile <strong>de</strong><br />
proprietate intelectuală şi crează un backlink la resursa originală, pe serverul furnizorului<br />
<strong>de</strong> date.<br />
H. Implementarea unei noi platforme în Semantic MediaWiki pentru evaluarea primei<br />
arhitecturi care s-a dovedit a fi benefică din următoarele puncte <strong>de</strong> ve<strong>de</strong>re: economi<strong>si</strong>rea<br />
timpului <strong>de</strong> procesare; o curbă <strong>de</strong> învăţare mai uşoară cu facilităţi <strong>de</strong> colaborare;<br />
îmbunătăţirea gradul <strong>de</strong> utilizare oferind o privire <strong>de</strong> ansamblu asupra procesului, inclu<strong>si</strong>v<br />
modificărea stărilor la execuţie; creştere gradului <strong>de</strong> colaborare a utilizatorilor şi mai ales<br />
creşterea calitatăţii metadatelor.<br />
7.4. Direcţii viitoare <strong>de</strong> cercetare<br />
Dezvoltarea tezei a ridicat un număr întrebări <strong>de</strong> cercetare şi provocări ştiinţifice. Parte dintre<br />
platformele implementate aici au propria listă specifică <strong>de</strong> probleme <strong>de</strong>schise: este firesc să<br />
adopte meto<strong>de</strong> automatizate mai bune pentru a oferi feedback mai inteligent pentru furnizorii<br />
<strong>de</strong> date, să angajeze mai profund auto-controlul, cum ar fi cel oferit <strong>de</strong> noua ver<strong>si</strong>une 1.6.2 a<br />
SMW, atunci când toate caracteristicile şi exten<strong>si</strong>ile vor contribui la o gestionare mai bună al<br />
repo<strong>si</strong>tory-ului digital. Avem motive întemeiate să sperăm că <strong>de</strong> acest lucru va fi benefic şi va<br />
contribui la o mai bună integrare şi o mai bună raţionare asupra datelor interne şi externe,<br />
chiar şi pentru o integrare automată în norul linked date.<br />
Pe parcursul acestei teze ne-am pus mai multe întrebări <strong>de</strong> cercetare specifice. Am amintit, <strong>de</strong><br />
asemenea, şi o listă <strong>de</strong> întrebări mai generale <strong>de</strong> cercetare care se referă la platformele media<br />
ca un întreg.<br />
Cele mai multe dintre meto<strong>de</strong>le prezentate în această teză au fost puse în aplicare, fie ca<br />
instrumente proprii (integrarea VRE) sau ca părţi ale unui set <strong>de</strong> instrumente.<br />
Am implementat o serie <strong>de</strong> meto<strong>de</strong> <strong>de</strong> evaluare în cadrul <strong>si</strong>stemului colaborativ semantic <strong>de</strong><br />
authoring Semantic MediaWiki. Am facut acest lucru pentru că ne aşteptăm ca domeniul<br />
managementului colaborativ al repo<strong>si</strong>tory-ului va <strong>de</strong>veni un subiect tot mai important pentru<br />
cunoaşterea partajată. Ceea ce ve<strong>de</strong>m astăzi este doar începutul acestei căi interesante şi noi<br />
65
<strong>de</strong> cercetare-<strong>de</strong>zvoltare. Ne aşteptăm ca viitorul apropiat va promulga nivele necunoscute<br />
până în prezent <strong>de</strong> cooperare între grupuri <strong>de</strong> oameni şi fe<strong>de</strong>raţii <strong>de</strong> agenţi automaţi, care să<br />
lucreze împreună pentru a rezolva problemele complexe cu care ne confruntăm.<br />
Unele <strong>si</strong>steme mai noi <strong>de</strong> bibliotecă digitală semantică sau repo<strong>si</strong>tory au început să ţină seama<br />
<strong>de</strong> rolul fundamental al discursului şi a acordului între diferitele părţi interesate. Ei i<strong>de</strong>ntifică<br />
partajarea ("shared-ness") resurselor (resursele digitale, dar şi ontologii), ca o valoare<br />
explicită şi furnizează chiar procese pentru a garanta că aceast <strong>de</strong>zi<strong>de</strong>rat comun este realizat.<br />
Chiar dacă partajarea nu este văzută ca un obiectiv principal, aceasta este o parte integrantă a<br />
conceptualizării noastre. Deoarece partajarea este un aspect al semanticii, ea atinge o serie <strong>de</strong><br />
criterii: acurateţea, claritatea şi fitness-ul organizaţional.<br />
Cercetările viitoare vor avea drept scop o mai profundă aliniere a tehnologiilor semantice cu<br />
abordările sociale. Noi propunem doua directii <strong>de</strong> <strong>de</strong>zvoltare profe<strong>si</strong>onală:<br />
• Contribuirea la îmbunătăţirea încre<strong>de</strong>rii şi colaborării în gestionarea metadatelor prin<br />
<strong>si</strong>steme <strong>de</strong> recomandare şi <strong>de</strong> urmărire a provenienţei metadatelor, cu aplicabilitate la<br />
linked data, <strong>de</strong> asemenea.<br />
• Dezvoltarea unor meto<strong>de</strong> şi instrumente pentru procesul <strong>de</strong> bootstrapping a linked<br />
data, în scopul <strong>de</strong> a <strong>de</strong>scoperi noi resurse, pentru a permite accesul liber la resurse<br />
digitale partajate.<br />
În interiorul aceluiaşi grup <strong>de</strong> utilizatori, folo<strong>si</strong>nd acordurile informale sau semi-formalizate şi<br />
menţinând conţinutul prin forte proprii, accentul se concentrează pe încre<strong>de</strong>re şi grija<br />
reciprocă.<br />
66
67<br />
Referinţe<br />
[1] Agosti, M., Bonfiglio-Do<strong>si</strong>o, G. and Ferro, N., (2007). A historical and contemporary study on annotations to<br />
<strong>de</strong>rive key features for systems <strong>de</strong><strong>si</strong>gn, Int J Digit Libr 8:1–19, DOI 10.1007/s00799-007-0010-0, Springer-Verlag.<br />
(2007)<br />
[2] Alboaie, L. (2008): PRES - Personalized Evaluation System in a Web Community - A Conceptual Mo<strong>de</strong>l De<strong>si</strong>gned<br />
to Evaluate Reputation in Or<strong>de</strong>r to Achieve a Personalized View on the System for Each User. ICE-B 2008: 64-69.<br />
[3] Andren, B. (2009), Open Multimedia Platform framework, ERICSSON REVIEW 1/2009, pp. 17-21<br />
[4] Antoniou, A. and van Harmelen, F. (2008). Semantic Web Primer 2nd Edition, The MIT Press, Mars 2008.<br />
[5] Apache License Ver<strong>si</strong>on 2.0, http://xml.apache.org/xalan-j/#license (last vi<strong>si</strong>ted November 24, 2009).<br />
[6] Auer, S. and Lehmann, J. (2007). What have Innsbruck and Leipzig in common? Extracting semantics from wiki<br />
content. In Enrico Franconi, Michael Kifer, and Wolfgang May, editors, Proc. 4th European Semantic Web<br />
Conference (ESWC), 2007.<br />
[7] Auer, S., Dietzold, S. and Riechert, Th. (2006). ‘OntoWiki- a tool for social, semantic collaboration.‘, Proc. of the<br />
5th Int. Semantic Web Conference, number 4273 in Lecture Notes in Computer, Science, pp. 736-749. Springer,<br />
November 2006.<br />
[8] Azevedo, R. and Jacobson, M. J. (2008), Advances in scaffolding learning with hypertext and hypermedia: a<br />
summary and critical analy<strong>si</strong>s, Educational Technology, Research and Development; Feb 2008; 56, 1; Research<br />
Library, Springer, pg. 93.<br />
[9] Baker, T. (2003). DCMI Usage Board review of application profiles.<br />
http://dublincore.org/usage/documents/profiles/in<strong>de</strong>x.shtml (accessed January 2010).<br />
[10] Bao, J., Ding, L. and Hendler, J. (2009). Knowledge Representation and Query in Semantic MediaWiki: A Formal<br />
Study. Revi<strong>si</strong>on: August 12, 2009 http://tw.rpi.edu/wiki/TW-2008-42 (accessed 11.07.2011).<br />
[11] Baraba<strong>si</strong>, A.L. , Jeong, H. , Neda, Z. Ravasz, E., Schubert, A. and Vicsek, T. (2001). Evolution of the social<br />
network of scientific collaborations, In: arXiv:cond-mat/0104162v1 [cond-mat.soft] 10 Apr 2001,<br />
http://arxiv.org/PS_cache/cond-mat/pdf/0104/0104162v1.pdf (accessed January 2011).<br />
[12] Barker, A. and van Hemert, J. (2008). Scientific Workflow: A Survey and Research Directions,<br />
http://www.extreme.indiana.edu/swf-survey/ (accessed 10.04.2010).<br />
[13] Barrett, B. (2009). Wikipedia and beyond – MediaWiki, O'Reilly, 2009<br />
[14] Beagrie, N., Chruszcz J. and Lavoie, B., (2008). “Keeping Research Data Safe, a cost mo<strong>de</strong>l and guidance for UK<br />
univer<strong>si</strong>ties”, JISC, 2008, www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.doc (last<br />
vi<strong>si</strong>ted 5.08.2011).<br />
[15] Berners-Lee, T. Relational databases on the Semantic Web. http://www.w3.org/De<strong>si</strong>gnIssues/RDB-RDF.html,<br />
1998 (accessed December 2010).<br />
[16] Berners-Lee, T.; Fielding, R.; Ma<strong>si</strong>nter, L. Uniform Resource I<strong>de</strong>ntifier (URI): generic syntax.<br />
http://gbiv.com/protocols/uri/rfc/rfc3986.html, 2005 (accessed December 2010).<br />
[17] Berners-Lee, T.; Hall, W.; Hendler, J.; Shadbolt, N.; Weitzner, D. Creating a science of the Web. Science 2006,<br />
313 (5788), 769-771.<br />
[18] Berners-Lee, T.; Hall, W.; Hendler, J.A.; O’Hara, K.; Shadbolt, N.; Weitzner, D.J. A framework for Web Science.<br />
Foundations and Trends in Web Science 2006, 1 (1), 1-134.<br />
[19] BiomedGT http://biomedgt.nci.nih.gov/wiki/in<strong>de</strong>x.php/Main_Page (accessed: 12/08/2011)<br />
[20] Bizer, C. Lehmann, J. Kobilarov, G. Auer, S. Becker, C., Cyganiak, R. and Hellmann, S. (2009). DBpedia - A<br />
Crystallization Point for the Web of Data, in: Proceedings of the 2nd Linked Data on the Web Workshop, 2009.<br />
[21] Blyberg, J. AADL.org Goes Social post to blyberg.net, 2007. http://www.blyberg.net/2007/01/21/aadlorg-goessocial.<br />
(accessed: 12/08/2011)<br />
[22] Braines, D., Smart, P. and Bao, J. (2010). ‘Emergent Capabilities for Collaborative Teams’, in the Evolving Web<br />
Environment 3rd Annual Conference of ITA (ACITA), 2010.<br />
[23] Breslin, J. Passant, A. and Deker, S. (2009). The Social Semantic Web, Springer.<br />
[24] Bry, F., Eckert, M., Kotowski, J., Weiand, K. (2009). What the user interacts with: Reflections on conceptual<br />
mo<strong>de</strong>ls for sematic wikis. In: Proceedings of Semantic Wiki Workshop, ESWC, Greece, 2009. (2009)<br />
[25] Buchanan, M. (2003). Nexus: Small worlds and the ground breaking science of networks - WW Norton &<br />
Company, 2003<br />
[26] Buckland, K. M., (1997), What Is a ‘‘Document’’? In: JOURNAL OF THE AMERICAN SOCIETY FOR<br />
INFORMATION SCIENCE. 48(9):804–809, 1997.<br />
[27] Buraga, S.C. (2009). Dezvoltarea aplicatiilor Web - Dinspre Web-ul social spre Web-ul semantic, curs 1-13,<br />
<strong>Facultatea</strong> <strong>de</strong> Informatica, Univer<strong>si</strong>tatea “A.I.Cuza” – Ia<strong>si</strong>, Romania, 2009<br />
[28] C4ISR Interoperability Working Group, Department of Defense, Levels of Information Systems Interoperability<br />
(LISI). Washington, D.C., 1998<br />
[29] Can<strong>de</strong>la, L., Castelli Donatella, and Pagano, P. (2007). A Reference Architecture for Digital Library Systems:<br />
Principles and Applications in C. Thanos, F. Borri, and L. Can<strong>de</strong>la (Eds.): Digital Libraries: R&D, LNCS 4877, pp.<br />
22–35, 2007.Springer-Verlag Berlin Hei<strong>de</strong>lberg<br />
[30] Chambers, Sally (2007): Towards Metadata Interoperability between Archives, Audio- Visual Archives, Museums<br />
and Libraries: What can we learn from The European Library metadata interoperability mo<strong>de</strong>l? (August 31,
2007), http://www.edlproject.eu/downloads/EDLproject_D1.1_metadata_interoperability_report_v1.4.pdf (last<br />
vi<strong>si</strong>ted 17.06.2011).<br />
[31] Chan, L. M. and Zeng, M. L. (2006), Metadata Interoperability and Standardization – A Study of Methodology Part<br />
I., Part II. D-Lib Magazine, June 2006, 12/6, ISSN 1082-9873, http://www.dlib.org/dlib/june06/chan/06chan.html<br />
(last vi<strong>si</strong>ted 14.06.2011).<br />
[32] CIDOC Conceptual Reference Mo<strong>de</strong>l - Information Groups<br />
http://cidoc.ics.forth.gr/docs/infogroup_graphics_v2.doc (last vi<strong>si</strong>ted 17.06.2011).<br />
[33] Cloonan, M. V. and Dove, J. G., (2005). Do digital libraries violate the Third Law? In: Library Journal,<br />
04/01/2005. http://www.libraryjournal.com/article/CA512179.html (last vi<strong>si</strong>ted: 28.07.2011).<br />
[34] Consultative Committee for Space Data Systems (2002) Reference mo<strong>de</strong>l for an Open Archival Information<br />
System (OAIS). CCSDS 650.0-B-1 Blue Book, January 2002,<br />
http://public.ccsds.org/publications/archive/650x0b1.pdf (accessed 05.06.2011)<br />
[35] Creative Commons, http://creativecommons.org/ (accessed February 2010)<br />
[36] Cruz, I. F. and Xiao, H. (2005).The Role of Ontologies in Data Integration. Journal of Engineering Intelligent<br />
Systems, 13(4):245–252, December 2005.<br />
[37] Cruz, I. F. and Xiao, H. (2009). Ontology Driven Data Integration in Heterogeneous Networks. In: Complex<br />
Systems in Knowledge-based Environments: Theory, Mo<strong>de</strong>ls and Applications Studies in Computational<br />
Intelligence, 2009, Volume 168/2009, 75-98, Springer, DOI: 10.1007/978-3-540-88075-2_4<br />
[38] D4Science, http://www.d4science.eu/, (last vi<strong>si</strong>ted 19.07.2011).<br />
[39] Davies, J., Stu<strong>de</strong>r, R. and Warren, P. (2006), Semantic Web Technologies Trends and Research in Ontology based<br />
Systems, Wiley Publishing, 2006.<br />
[40] Davies, R. (2008). EuropeanaLocal – its role în improving access to Europe’s cultural heritage through the<br />
European Digital Library. Workshop on Information Access to Cultural Heritage (IACH 2008) at ECDL 2008,<br />
Aarhus, 18 September 2008, http://www.edlocal.eu/eng/Publications/Papers-and-documents,<br />
http://ilps.science.uva.nl/IACH2008/papers/Davies_EuropeanaLocal_IACH2008.pdf (last vi<strong>si</strong>ted 19.07.2011).<br />
[41] De Roure D, Goble C, 2009. Software De<strong>si</strong>gn for Empowering Scientists. IEEE Software 2009, 26:88-95.<br />
10.1109/MS.2009.22.<br />
[42] De Roure, D., Goble, C. and Stevens, R. 2009. The De<strong>si</strong>gn and Realisation of the myExperiment Virtual Research<br />
Environment for Social Sharing of Workflows. Future Generation Computer Systems 25, pp. 561-567.<br />
doi:10.1016/j.future.2008.06.010<br />
[43] Deelman, E, Gannon, D., Shields, M, and Taylor, I, 2009. Workflows and e-science: An overview of workflow<br />
system features and capabilities. Future Generation Computer Systems, 25(5):528–540, 2009.<br />
[44] Deelman, E., Singh, G., Su, M., Blythe, J., Gil, Y., Kesselman, C., Mehta, G., Vahi, K., Berriman, G.B., Good, J.,<br />
Laity, A., Jacob, J.C., and Katz, D.S., 2005. Pegasus: a framework for mapping complex scientific workflows onto<br />
distributed systems. Scientific Programming, 13(3):219–237, 2005.<br />
[45] Definition of Digital Library: http://home.wlu.edu/~whaleyt/classes/digilib/whaley/<strong>de</strong>finition.html (last vi<strong>si</strong>ted<br />
12.07.2011)<br />
[46] Dengler, F., Lamparter, S., Hefke, M. and Abecker, A., (2009). Collaborative Process Development u<strong>si</strong>ng Semantic<br />
MediaWiki. In WM’09: 5th In-ternational Conference of Profes<strong>si</strong>onal Knowledge Management. Köllen Verlag.<br />
[47] Dengler, F., Vran<strong>de</strong>cic, D. and Simperl, E. (2011). Wikiing pro: semantic wiki-based process editor, Proceedings of<br />
the <strong>si</strong>xth international conference on Knowledge capture, ACM New York, NY, USA, 2011, ISBN: 978-1-4503-<br />
0396-5.<br />
[48] Deutschen National Bibliothek, http://www.d-nb.<strong>de</strong>/service/pdf/zd_info_broschuere.pdf (last vi<strong>si</strong>ted: 8.08.2011).<br />
[49] Devarakonda, R., Palanisamy, G., Green, J. M. and Wilson, B.E. (2011). Data sharing and retrieval u<strong>si</strong>ng OAI-<br />
PMH, Earth Sci Inform 4:1–5, Springer-Verlag.<br />
[50] Di Iorio, A. Vitali, F. Zacchiroli, St. (2008) ‘Wiki Content Templating’, WWW 2008, April 21–25, 2008, Beijing,<br />
China. ACM 978-1-60558-085-2/08/04<br />
[51] DILIGENT, http://diligent.ercim.eu/, (last vi<strong>si</strong>ted 19.07.2011).<br />
[52] DiMario, M.J. (2006) System of Systems Interoperability Types and Characteristics in Joint Command and Control,<br />
Proceedings of the 2006 IEEE/SMC International Conference on System of Systems Engineering, Los Angeles,<br />
CA, USA - April 2006<br />
[53] Doan, A. Ramakrishnan, R. and Halevy, A. Y. (2011). ‘Crowdsourcing Systems on the World-Wi<strong>de</strong> Web’,<br />
Communications of the ACM, 2011, doi :10.1145/1924421.1924442<br />
[54] Dublin Core Metadata Initiative, http://dublincore.org/metadata-ba<strong>si</strong>cs/ (accessed January 2010).<br />
[55] Duval, E., Hodgins, W., Sutton, S. & Weibel, S.L. (2002). Metadata principles and practicalities. D-Lib Magazine,<br />
8(4).<br />
[56] Eclipse Public License - v 1.0, http://www.eclipse.org/legal/epl-v10.html (last vi<strong>si</strong>ted November 24, 2009).<br />
[57] Ell, B., 2009. Integration of external data in semantic wikis, Masterarbeit im Studiengang Informatik, Institut für<br />
Angewandte Informatik und Formale Beschreibungsverfahren KIT - Karlsruher Institut für Technologie, 2009.<br />
[58] Elmroth, E., Hernan<strong>de</strong>z, F., Tordsson, 2010, J. Three Fundamental Dimen<strong>si</strong>ons of Scientific Workflow<br />
Interoperability: Mo<strong>de</strong>l of Computation, Language, and Execution Environment. In: Future Generation Computer<br />
Systems Volume 26, Issue 2, Pages 245-256, http://dx.doi.org/10.1016/j.future.2009.08.011, Elsevier.<br />
[59] Engelbart, D.C. (1963). Augmenting Human Intellect: A Conceptual Framework, SRI Summary Report AFOSR-<br />
3223, http://www.dougengelbart.org/pubs/augment-3906.html, (last vi<strong>si</strong>ted: 30.07.2011).<br />
[60] Engeström, J. (2005). http://www.zengestrom.com/blog/2005/04/why-some-social-network-services-work-andothers-dont-or-the-case-for-object-centered-sociality.html<br />
(last vi<strong>si</strong>ted: 30.07.2011).<br />
68
[61] Fedora Commons Repo<strong>si</strong>tory Documentation, http://www.fedora-commons.org/docs/repo<strong>si</strong>tory. (Accessed:<br />
07/06/2011)<br />
[62] Fensel, D. Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce, 2nd Ed.; Springer,<br />
Berlin, 2004.<br />
[63] Fernan<strong>de</strong>s, A., Breitman, K.., Vieira, T.A.S., Casanova, M.A. and Furtado, A.L., (2006). Semi-automated<br />
Workflow Synthe<strong>si</strong>s. In: ISoLA 2006. Second International Sympo<strong>si</strong>um on Leveraging Applications of Formal<br />
Methods, Verification and Validation, 15-19 Nov. 2006, pg. 332 – 334, ISBN: 978-0-7695-3071-0.<br />
[64] Ferro, N., 2008, Digital Annotations: a Formal Mo<strong>de</strong>l and its Applications, Information Access through Search<br />
Engines and Digital Libraries The Kluwer International Series on Information Retrieval, 2008, Volume 22, 113-<br />
146, DOI: 10.1007/978-3-540-75134-2_7, Springer-Verlag<br />
[65] Fielding, R.T., 2000, Architectural Styles and the De<strong>si</strong>gn of Network-based Software Architectures, Doctoral<br />
Dissertation, ACM, ISBN: 0-599-87118-0, 2000.<br />
[66] Foster, I, Kesselman, C., Nick, J and Tuecke, S. (2002), “Grid Services for Distributed System Integration”, IEEE<br />
Computer 35, pp. 37-46, (6) June 2002.<br />
[67] Fuentes-Lorenzo, D., Morato, J. and Gómez, J. M. (2009), Knowledge management in biomedical libraries: A<br />
semantic web approach, Inf Syst Front (2009) 11:471–480, DOI 10.1007/s10796-009-9159-y, Springer-Verlag<br />
[68] Gartner Group. (2011). Data Management and Integration.<br />
http://www.gartner.com/technology/core/products/research/topics/dataManagementIntegration.jsp (last vi<strong>si</strong>ted:<br />
12.09.2011).<br />
[69] Gil, Y. 2006, “Workflow Compo<strong>si</strong>tion: Semantic Representations for Flexible Automation”, in “Workflows for e-<br />
Science”, Deelman, E., Gannon, D. Shields, M., and Taylor, I. (Eds), Springer Verlag, 2006.<br />
[70] Giurgiu, M., Homodi, A. Veja, C., Hagedorn, G. and Nimis, P. L.. ‘A search tool for the digital biodiver<strong>si</strong>ty<br />
resources of KeyToNature’, Nimis P. L., Vignes Lebbe R. (eds.), Tools for I<strong>de</strong>ntifying Biodiver<strong>si</strong>ty: Progress and<br />
Problems, Paris September 2010, pp. 19-24.<br />
[71] Gómez-Berbís, J. M., Colomo-Palacios, R., López-Cuadrado, J.L., González-Carrasco, I. and García-Crespo, A.<br />
(2011). “SEAN: Multi-ontology semantic annotation for highly accurate closed domains”, International Journal of<br />
the Phy<strong>si</strong>cal Sciences Vol. 6(6), pp. 1440-1451, ISSN 1992 - 1950 ©2011 Aca<strong>de</strong>mic Journals.<br />
[72] Gonçalves, M. A., Fox, E. A., Watson, L. T., & Kipp, N. (2004). Streams, structures, spaces, scenarios, societies<br />
(5S): a formal mo<strong>de</strong>l for digital libraries. ACM Transactions on Information Systems, 22(2), 270–312.<br />
[73] Gonçalves, M.A. and Fox, E.A. (2004). Toward a Digital Library Theory: A Formal Digital Library Ontology.<br />
SIGIR, Mathematical Formal Methods workshop, 2004.<br />
[74] Gonçalves, M.A. Streams, Structures, Spaces, Scenarios, and Societies (5S): A Formal Digital Library Framework<br />
and Its Applications, Ph.D. Dissertation, Virginia Tech, http://scholar.lib.vt.edu/theses/available/etd-12052004-<br />
135923, 2004. (last vi<strong>si</strong>ted 18.07.2011).<br />
[75] Gonçalves, M.A., France, R.K. Fox, E.A., Hilf, E.R., Zimmermann, K. and Severiens, Th. (2001) MARIAN:<br />
Flexible Interoperability for Fe<strong>de</strong>rated Digital Libraries, Springer Lecture Notes in Computer Science 2163, pp.<br />
173-186. Key: citeulike:634309<br />
[76] Gruber, T. (2007), Collective Knowledge Systems: Where the Social Web meets the Semantic Web. Web<br />
Semantics: Science, Services and Agents on the World Wi<strong>de</strong> Web (2007), doi:10.1016/j.websem.2007.11.011<br />
[77] Hagedorn, G, Weber, G., Plank, A. Giurgiu, M., Homodi, A. Veja, C., Schmidt, G., Mihnev, P., Roujinov, M.,<br />
Triebel, D., Morris, R. A., Zelazny, B. van Spronsen, Ed., Schalk, P., Kittl, Ch., Brandner, R., Martellos, St.<br />
Nimis, P.L. (2010). ‘An online authoring and publishing platform for field gui<strong>de</strong>s and i<strong>de</strong>ntification tools’, Proc. of<br />
Conf. Tools for I<strong>de</strong>ntifying Biodiver<strong>si</strong>ty: Progress and Problems, Paris, September 2010 – pp. 13-18<br />
[78] Hagedorn, G. (2008). Key to Nature EU <strong>de</strong>liverable D 4.4: Resource Metadata Exchange Agreement.<br />
http://www.keytonature.eu/wiki/Key_to_Nature_EU_<strong>de</strong>liverable_D_4.4:_Resource_Metadata_Exchange_Agreeme<br />
nt (last vi<strong>si</strong>ted: 12.01.2010).<br />
[79] Haslhofer, B. and Heuhold, J. (2011). A Retrospective on Semantics and Interoperability Research, In: Fensel, D.<br />
(Edt.) Foundations for the Web of Information and Services, ISBN: 978-3-642-19796-3, Springer, 2011.<br />
[80] Hausenblas, M., Troncy, R., Bürger, N. and Raimond, Y. (2009). Interlinking Multimedia - How to Apply Linked<br />
Data Principles to Multimedia Fragments. LDOW2009, April 20, Madrid, Spain, 2009.<br />
[81] Hecht, R. and Haslhofer, B. (2005). Joining the BRICKS Network - A Piece of Cake. Online at:<br />
http://conf.cpic.ru/upload/eva2005/reports/dokladEn_736.pdf, (last vi<strong>si</strong>ted 19.07.2011).<br />
[82] Heery, Rachel, An<strong>de</strong>rson, Sheila. (2005). Digital Repo<strong>si</strong>tories Review, UKOLN and AHDS,<br />
http://www.jisc.ac.uk/uploa<strong>de</strong>d_documents/digital-repo<strong>si</strong>tories-review-2005.pdf (last vi<strong>si</strong>ted 15.07.2011).<br />
[83] Hestenes, D. 2006. Notes for a Mo<strong>de</strong>lling Theory of Science, Cognition and Instruction, In: Proceedings of the<br />
2006 GIREP conference: Mo<strong>de</strong>lling in Phy<strong>si</strong>cs and Phy<strong>si</strong>cs Education,<br />
http://mo<strong>de</strong>ling.asu.edu/r&e/notes_on_mo<strong>de</strong>ling_theory.pdf, (last vi<strong>si</strong>ted: 29.07.2011).<br />
[84] Hill, L. L., Buchel, O., Janée, G., & Zeng, M. L. (2002). Integration of Knowledge Organization Systems into<br />
Digital Library Architectures: Po<strong>si</strong>tion Paper. In J.-E. Mai & C. Beghtol & J. Furner & B. Kwasnik (Eds.),<br />
Advances in Clas<strong>si</strong>fication Research. Proceedings of the 13th ASIST SIG/CR Workshop on "Reconceptutalizing<br />
Clas<strong>si</strong>fication Research" (pp. 62-68). Phila<strong>de</strong>lphia, PA.<br />
[85] Hoen<strong>de</strong>rboom, B. and Liang, P. (2008). ‘A Survey of Semantic Wikis for Requirements Engineering’, RUG-<br />
SEARCH-09-L03, 2008.<br />
[86] http://oaei.ontologymatching.org (Accessed: 02/06/2010)<br />
[87] http://www.omg.org/spec/UML/in<strong>de</strong>x.htm, (last vi<strong>si</strong>ted: 29.07.2011).<br />
[88] http://www.openarchives.org/ore/documents/ore-jcdl2007.pdf (last vi<strong>si</strong>ted 19.07.2011).<br />
[89] http://www.w3.org/TR/DOM-Level-2-Core/introduction.html (last vi<strong>si</strong>ted: 19.07.2011).<br />
69
[90] http://www.w3.org/TR/DOM-Level-3-Core/introduction.html, (last vi<strong>si</strong>ted: 29.07.2011).<br />
[91] http://www.w3.org/TR/xml-infoset/, (last vi<strong>si</strong>ted: 29.07.2011).<br />
[92] http://www.w3.org/XML/, (last vi<strong>si</strong>ted: 29.07.2011).<br />
[93] https://wikis.uit.tufts.edu/confluence/display/UITKnowledgebase/Digital+Libraries+and+Repo<strong>si</strong>tories (last vi<strong>si</strong>ted<br />
12.07.2011)<br />
[94] Hüner, K. M. and Otto, B.(2009).The Effect of U<strong>si</strong>ng a Semantic Wiki for Metadata Management: A Controlled<br />
Experimen’, DOI: 978-0-7695-3450-3/09,IEEE, 2009.<br />
[95] Hüner, K. M., Otto, B. and Österle, H. (2011) Collaborative management of bu<strong>si</strong>ness metadata. International<br />
Journal of Information Management (2011), doi:10.1016/j.ijinfomgt.2010.12.002, Elsevier.<br />
[96] Institute of Electrical and Electronics Engineers. IEEE Standard Computer Dictionary: A Compilation of IEEE<br />
Standard Computer Glossaries. New York, NY: 1990.<br />
[97] International Council of Museums (ICOM).The CIDOC Conceptual Reference, (2010).http://www.cidoc-crm.org/<br />
(last vi<strong>si</strong>ted 17.06.2011).<br />
[98] Ja<strong>de</strong> based process editor http://ja<strong>de</strong>.tilab.com/wa<strong>de</strong>/in<strong>de</strong>x.html (Accessed: 22/06/2010)<br />
[99] Janev, V., & Vraneš, S. (2010) Applicability assessment of Semantic Web technologies. Information Proces<strong>si</strong>ng<br />
and Management (2010), doi:10.1016/j.ipm.2010.11.002.<br />
[100] JaWE based process editor http://www.jped.org/ (Accessed: 09/06/2010)<br />
[101] Jentzsch A (2009) DBpedia – extracting structured data from Wikipedia. Presentation at Semantic Web in<br />
Bibliotheken (SWIB2009), Cologne, Germany<br />
[102] JISC InfoNet, http://www.jiscinfonet.ac.uk/infokits/repo<strong>si</strong>tories/ (last vi<strong>si</strong>ted: 16.07.2011).<br />
[103] Jones, R., Andrew, Th. and MacColl, J.(2006) The Institutional Repo<strong>si</strong>tory. Oxford: Chandos Publishing<br />
, 2006, URI: http://hdl.handle.net/1842/858 (last vi<strong>si</strong>ted 13.07.2011)<br />
[104] Kawamoto, K., Kitamura, Y. and Tijerino, Y. (2008). KawaWiki: A Template-Based SemanticWiki<br />
Where End and Expert Users Collaborate, 2008<br />
[105] KeyToNature Project, an eContentplus programme. Contract no. ECP-2006-EDU-410019.<br />
www.KeyToNature.eu<br />
[106] Khan, R. and Wilensky, R. (1995). A Framework for Distributed Digital Object Services, cnri.dlib/tn95-<br />
0, online at: http://www.cnri.reston.va.us/k-w.html (last vi<strong>si</strong>ted 19.07.2011).<br />
[107] Kleiner, F. and Abecker, A. (2008). ‘Towards a Collaborative Semantic Wiki-based Approach to IT<br />
Service Managemen’t, 2008.<br />
[108] Klyne, G.; Carroll, J.J.; McBri<strong>de</strong>, B. Resource Description Framework (RDF): concepts and abstract<br />
syntax. http://www.w3.org/TR/rdf-concepts/, 2004 (accessed December 2009).<br />
[109] Knorr Cetina, K. (2001). The practice turn in contemporary theory, edited by Theodor R. Schatzki, Karin<br />
Knorr Cetina, and Eike von Savigny (London 2001: Routledge.)<br />
[110] Kollias, St. and Cou<strong>si</strong>ns, J.(2008) Semantic Interoperability in the European Digital Library,<br />
Proceedings of the First International Workshop, SIEDL 2008, Tenerife, June 2, 2008<br />
[111] Koren, Y. (2011). Semantic MediaWiki vs. SharePoint, http://wikiworks.com/semantic-mediawiki-vssharepoint.html<br />
(last vi<strong>si</strong>ted: 16.07.2011)<br />
[112] Kotelnikov, M., Polonsky, A., Kiesel, M., Völkel, M., Haller, H., Sogrin, M., Lannerö, P. and Davis, B.<br />
(2007). The Social Semantic Desktop-Interactive Semantic Wikis, Deliverable D1.1-NEPOMUK , 2007<br />
[113] Kousetti, K., Millard, D. E. and Howard, Y. (2008). A Study of Ontology Convergence in a Semantic<br />
Wiki. Proccedings of WikiSym '08, September 8-10, Porto, Portugal. Copyright 2008 ACM 978-1-60558-128-<br />
3/08/09.<br />
[114] Koutsomitropoulos, D., Solomou, G., Alexopoulos, A. and Papatheodorou, Th., 2010. Semantic Web<br />
enabled digital repo<strong>si</strong>tories. In: International Journal on Digital Libraries, 10/4, Springer Berlin / Hei<strong>de</strong>lberg, pp.<br />
179-199, http://dx.doi.org/10.1007/s00799-010-0059-z<br />
[115] Krötzsch, M., Vran<strong>de</strong>cic, D. Völkel, M. Haller, H., Stu<strong>de</strong>r. R. (2007). Semantic Wikipedia. In Journal of<br />
Web Semantics 5/2007, pp. 251-261. Elsevier 2007.<br />
[116] Kruk, S.R. and McDaniel, B., 2009, Goals of Semantic Digital Libraries, In: Semantic Digital Libraries,<br />
Springer-Verlag, ISBN: 978-3-540-85433-3, pp. 71-76.<br />
[117] Kruk, S.R., Westerki, A. and Ewelina Kruk, 2009, Architecture of Semantic Digital Libraries, In:<br />
Semantic Digital Libraries, Springer-Verlag, ISBN: 978-3-540-85433-3, pp. 77-85.<br />
[118] Kuhn, T. (2009). How Controlled English can Improve Semantic Wikis. arXiv:0907.1245v1 [cs.HC] 7<br />
Jul 2009.<br />
[119] Lagoze, C. and Nelson, M. Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH<br />
initiative), http://www.openarchives.org/OAI/openarchivesprotocol.html (accessed January 2010).<br />
[120] Lange, Ch., Hausenblas, M., Bao, J. and Ding, L. (2010). ‘Semantics of Governmental Statistics Data’,<br />
Web Science Conf. 2010, April 26-27, 2010, Raleigh, NC, USA.<br />
[121] Lenzerini, M. (2002).Data Integration: A Theoretical Perspective, PODS '02 Proceedings of the twentyfirst<br />
ACM SIGMOD-SIGACT-SIGART sympo<strong>si</strong>um on Principles of database systems, ISBN:1-58113-507-6<br />
[122] Leuf, B., and Cunningham, W.(2001). The Wiki Way Quick Collaboration on the Web.<br />
[123] Lewis, G.A. and Wrage, L. (2005), Approaches to Constructive Interoperability (CMU/SEI-2004-TR-<br />
020 ESC-TR-2004-020). Pittsburgh, PA: Software Engineering Institute, Carnegie Mellon Univer<strong>si</strong>ty, 2005<br />
[124] Ludäscher, B., Altintas, I., Berkley, Ch., Higgins, D., Jaeger, E., Jones, M. Lee, E.A., Tao, J. Zhao, Y.,<br />
(2006). Scientific workflow management and the Kepler system, In: Concurrency and Computation: Practice and<br />
Experience, John Wiley & Sons, Ltd., DOI=10.1002/cpe.994, pg. 1039-1065.<br />
70
[125] Maccagnan et al., 2010. Combining ontologies and workflows to <strong>de</strong><strong>si</strong>gn formal protocols for biological<br />
laboratories. In: Automated Experimentation 2010, 2:3, DOI: 10.1186/1759-4499-2-3.<br />
[126] Marshall, C.C., Shipman III, F. and McCall, R. J. (1994). ‘Putting Digital Libraries to Work: Issues from<br />
Experience with Community Memories.’ Online: http://www.csdl.tamu.edu/DL94/paper/marshall.html (Accessed:<br />
02/06/2010)<br />
[127] Martin, M and Auer, S. (2010). ‘Categorisation of Semantic Web Applications’. SEMAPRO 2010 : The<br />
Fourth International Conference on Advances in Semantic Proces<strong>si</strong>ng. IARIA, 2010 ISBN: 978-1-61208-104-5, pg.<br />
179-185.<br />
[128] Martin, M., Gerber, D., Heino, N., Auer, S. and Ermilov, T. (2010). “Managing Multimodal and<br />
Multilingual Semantic Content”. In: Proceedings of the 7th International Conference on Web Information Systems<br />
and Technologies, 2010.<br />
[129] MEG Registry (Registry of MEG-related schemas),<br />
http://www.ukoln.ac.uk/metadata/education/registry/contents.html (last vi<strong>si</strong>ted 19.07.2011).<br />
[130] Melnik, S. and Decker, S. (2000). A Layered Approach to Information Mo<strong>de</strong>ling and Interoperability on<br />
the Web. In ECDL Workshop on the Semantic Web, Lisbon, Portugal, 2000.<br />
[131] Metcalf, C. and Lewis, G.A. (2006) Mo<strong>de</strong>l Problems in Technologies for Interoperability: OWL Web<br />
Ontology Language for Services (OWL-S). (CMU/SEI-2006-TN-018) Pittsburgh, PA: Software Engineering<br />
Institute, Carnegie Mellon Univer<strong>si</strong>ty, April 2006, http://www.sei.cmu.edu/reports/06tn018.pdf. (last vi<strong>si</strong>ted<br />
21.07.2011).<br />
[132] Mikeal, A. Creel, J. Maslov, A. Phillips, S. Leggett, J. and McFarland, M. (2009). Large-scale ETD<br />
repo<strong>si</strong>tories: A case study of a digital library application, Joint Conference on Digital Libraries 2009, June 15–19,<br />
2009, Austin,TX, USA.<br />
[133] Miller, P. (2000) "Interoperability. What is it and Why should I want it?", Ariadne Project, Ariadne Issue<br />
24, 21-Jun-2000, http://www.ariadne.ac.uk/issue24/interoperability/, (last vi<strong>si</strong>ted 19.07.2011).<br />
[134] Minguillón, J., Sicilia, M.A. and Lamb, B. (2011). “From Content Management to E-Learning Content<br />
Repo<strong>si</strong>tories”. In: N. Ferran and J. Minguillón (eds.), Content Management for E-Learning, DOI 10.1007/978-1-<br />
4419-6959-0_2, Springer Science&Bu<strong>si</strong>ness Media, LLC 2011, pg. 27-42<br />
[135] Morris, E., Levine, L., Meyers, L. Plakosh, D. and Place, P.(2004), Systems of Systems Interoperability,<br />
CMU/SEI-2004-TR-004, ESC-TR-2004-004, Software Engineering Institute, Carnegie Mellon Univer<strong>si</strong>ty, April<br />
2004.<br />
[136] myExperiment http://www.myexperiment.org/ (last vi<strong>si</strong>ted 19.07.2011).<br />
[137] Nau<strong>de</strong>t, Y., Latour, T., Hausmann, K., Abels, S., Hahn, A. and Johannesonn, P. (2006), Describing<br />
Interoperability: the OoI Ontology, Proceedings of CAiSE’06 The 18th Conference on Advanced Information<br />
Systems Engineering Luxembourg, 5-6 June, 2006. http://ftp.informatik.rwth-aachen.<strong>de</strong>/Publications/CEUR-<br />
WS/Vol-200/09.pdf (Accessed: 02/06/2010)<br />
[138] Neiswen<strong>de</strong>r, C. 2009. "Introduction to Metadata." In The MMI Gui<strong>de</strong>s: Navigating the World of Marine<br />
Metadata. http://marinemetadata.org/gui<strong>de</strong>s/mdataintro. (Accessed: 02/06/2010)<br />
[139] NISO (National Information Standards Organization) (2004). Un<strong>de</strong>rstanding metadata. Bethesda, MD:<br />
NISO Press., http://www.niso.org/standards/resources/Un<strong>de</strong>rstandingMetadata.pdf, (last vi<strong>si</strong>ted 19.07.2011).<br />
[140] OAI http://www.openarchives.org/, (last vi<strong>si</strong>ted 19.07.2011).<br />
[141] Object Management Group. MDA: Executive Overview (2005)<br />
http://www.omg.org/mda/executive_overview.htm (Accessed: 02/06/2010)<br />
[142] OCLC/RLG Working Group on Preservation Metadata. (2002). Preservation Metadata and the OAIS<br />
Information Mo<strong>de</strong>l, A Metadata Framework to Support the Preservation of Digital Objects. Available:<br />
http://www.oclc.org/research/projects/pmwg/pm_framework.pdf. (Accessed: 05/06/2010)<br />
[143] Ogasawara, E., Paulino, C., Murta, L., Werner, C., and Mattoso, M., (2009). Experiment Line: Software<br />
Reuse in Scientific Workflows, Scientific and Statistical Database Management, Lecture Notes in Computer<br />
Science, 2009, Volume 5566/2009, 264-272, Springer, DOI: 10.1007/978-3-642-02279-1_20.<br />
[144] Oinn T, Addis M, Ferris J, Marvin D, Senger M, Greenwood M, Carver T, Glover K, Pocock M, Wipat<br />
A, Li P, 2004. Taverna: a tool for the compo<strong>si</strong>tion and enactment of bioinformatics workflows. Bioinformatics<br />
(Oxford, England) 2004, 20:3045-3054. 10.1093/bioinformatics/bth361<br />
[145] Page, E.H., Briggs, R., and Tufarolo, J.A. (2004). “Toward a Family of Maturity Mo<strong>de</strong>ls for the<br />
Simulation Interconnection Problem.” Proceedings IEEE Spring Simulation Interoperability Workshop, IEEE CS<br />
Press<br />
[146] Parr, T. (2004). ‘Enforcing Strict Mo<strong>de</strong>l-View Separation in Template Engines’. In: Proceedings of<br />
WWW2004 Conference, May 17–20, 2004, New York, USA. ACM 158113844X/04/0005.<br />
[147] Peter, H., Sack, H. and Beckstein, C. (2006), SmartIn<strong>de</strong>xer – Amalgamating Ontologies and Lexical<br />
resources for Document In<strong>de</strong>xing, IN: Proceedings of OntoLex 2006, doi=10.1.1.116.8953.<br />
[148] Petty, M.D., and Weisel, E.W. (2003). “A Compos-ability Lexicon.” Proceedings Spring Simulation Interoperability<br />
Workshop, IEEE CS Press<br />
[149] Pir<strong>si</strong>g, R. (1974). Zen and the Art of Motorcycle Maintenance, New York: Bantam Books.<br />
[150] Pokraev, Stanislav and Reichert, Manfred and Steen, Maarten W.A. and Wieringa, Roel (2005) Semantic<br />
and Pragmatic Interoperability: A Mo<strong>de</strong>l for Un<strong>de</strong>rstanding. In: J. Castro, E. Teniente (Eds.) Proc. of the<br />
CAiSE'05 Workshops, June 2005, Porto, Portugal.<br />
[151] Repo<strong>si</strong>tory software survey, http://www.rsp.ac.uk/start/software-survey/results-2010/ (last vi<strong>si</strong>ted:<br />
16.07.2011).<br />
71
[152] Resource Metadata Exchange Agreement. (2008).<br />
http://www.keytonature.eu/wiki/Resource_Metadata_Exchange_Agreement. (Accessed: 02/06/2010).<br />
[153] Schaffert, S. (2006) Semantic social software: Semantically enabled social software or socially enabled<br />
semantic web? In Proceedings of the SEMANTICS 2006 conference, pp. 99–112, Vienna, Austria, November<br />
2006. OCG.<br />
[154] Schaffert, S. E<strong>de</strong>r, J., Grünwald, S., Kurz, T., Radulescu, M., Sint, R. and Stroka, S. (2009). ‘KiWi – a<br />
platform for semantic social software. ‘ In Proc. of the 4th Workshop on Semantic Wikis, ESW C 2009,<br />
Hersonissos, Greece, June 2009.<br />
[155] Schindler, C. and Rittberger, M. (2009). Herausfor<strong>de</strong>rungen für die Gestaltung von wissenschaftlichen<br />
Information<strong>si</strong>nfrastrukturen durch Web 2.0. In: Information - Wissenschaft & Praxis, 60, 4, 215-224.<br />
[156] Schindler, C., Veja, C. Rittberger, M. and Vran<strong>de</strong>cic, D. (2011). How to Teach Digital Library Data to<br />
Swim into Research. In Proceedings of i-Semantics conference, September 7 - 9, 2011, Graz, Austria, ACM 978-1-<br />
4503-0621-8, pp. 142-149.<br />
[157] Schindler, C., Vran<strong>de</strong>cic, D., Rittberger, M., Stu<strong>de</strong>r, R. and Veja, C. (2011). Kollaborative Analyse von<br />
historischen Netzwerken: Virtuelle Forschungsumgebung für die Historische Bildungsforschung. In Proceeding of<br />
“Kooperationen und Netzwerke in bildungshistorischer Perspektive“Jahrestagung <strong>de</strong>r Sektion Historische<br />
Bildungsforschung in <strong>de</strong>r DGfE, Basel, 16-18.09.2011. (publication accepted).<br />
[158] Sen, A. (2004). Metadata management: past, present and future, Deci<strong>si</strong>on Support Systems 37 (2004) pg.<br />
151– 173, Elsevier. doi:10.1016/S0167-9236(02)00208-7.<br />
[159] SGML, ISO 8879:1986, http://www.iso.org/iso/catalogue_<strong>de</strong>tail.htm?csnumber=16387 (Accessed:<br />
02/06/2010)<br />
[160] Shadbolt, N.; Hall, W.; Berners-Lee, T. The Semantic Web revi<strong>si</strong>ted. IEEE Intelligent Systems 2006, 21<br />
(3), 96-101.<br />
[161] Shnei<strong>de</strong>rman, B., (1989), “Reflections on Authoring, Editing, and Managing Hypertext, In: The Society<br />
of Text”, (ed. E. Barrett), MIT Press, 1989.<br />
[162] Siorpaes, K., and Simperl, E., (2010). Human intelligence in the process of semantic content creation.<br />
World Wi<strong>de</strong> Web WWW Journal, 13(1), 33–59.<br />
[163] Soergel, D. Digital Libraries and Knowledge Organization, (2009) in: Sebastian Ryszard Kruk,Bill<br />
McDaniel (editors):Semantic digital libraries, 2009, Springer.<br />
[164] Spivack, N. Making Sense of the Semantic Web, http://www.mindingtheplanet.net<br />
[165] Staab, St., Scherp, A., Arndt, R., Troncy, R., Grzegorzek, M., Saathoff, C., Schenk, S. and Hardman, L.<br />
(2008) Semantic Multimedia, http://homepages.cwi.nl/~troncy/Publications/Troncy_Staab-rw08.pdf (Accessed:<br />
12/06/2011)<br />
[166] Taylor, I., Shields, M., Wang, I., and Harrison, A. (2007). The Triana workflow environment:<br />
architecture and applications. In I. Taylor et al., editors, Workflows for e-Science, pages 320–339. Springer-Verlag,<br />
2007.<br />
[167] Tempich, C., Simperl, E., Luczak, M., Stu<strong>de</strong>r, R., Pinto, H.S., Argumentation-Based Ontology<br />
Engineering, IEEE Intelligent Systems, vol. 22, no. 6, pp. 52-59, Nov./Dec. 2007, doi:10.1109/MIS.2007.103.<br />
[168] Tolk A., Diallo SY, King RD, Turnitsa CD. A Layered Approach to Compo<strong>si</strong>tion and Interoperation in<br />
Complex Systems, Springer SCI 168, 2009, 41–74.<br />
[169] Tolk, A. and Muguira, J. A. (2003),The Levels of Conceptual Interoperability Mo<strong>de</strong>l, 2003 Fall<br />
Simulation Interoperability Workshop Orlando, Florida, September 2003.<br />
[170] Tolk, A (2004). Metamo<strong>de</strong>ls and Mappings–Ending the Interoperability War. In Fall Simulation<br />
Interoperability Workshop, pages 748–761. IEEE CS Press, 2004.<br />
[171] Tolk, A. (2003), “Beyond Technical Interoperability; Introducing a Reference Mo<strong>de</strong>l for Measures of<br />
Merit for Coalition Interoperability”, 8th International Command and Control Research and Technology<br />
Sympo<strong>si</strong>um (ICCRTS), Washington, D.C., June 17-19, 2003. Washington D.C., Command and Control Research<br />
Program (CCRP), 2003.<br />
[172] Tolk, A. (2006). What comes after the Semantic Web – PADS Implications for the Dynamic Web,<br />
Proceedings 20th ACM/IEEE/SCS* Workshop on Principles of Advanced and Distributed Simulation, IEEE/ACM<br />
Press, 2006<br />
[173] Tolk, A., Turnitsa, C. and Diallo, S. (2008). Implied Ontological Representation Within the Levels of<br />
Conceptual Interoperability Mo<strong>de</strong>l. Intelligent Deci<strong>si</strong>on Technologies, 2(1):3–20, 2008.<br />
[174] Trappey, C. V. Trappey, Amy J.C., Huang, C.-J., Ku, C.C. (2009). The <strong>de</strong><strong>si</strong>gn of a JADE-based<br />
autonomous workflow management system for collaborative SoC <strong>de</strong><strong>si</strong>gn. Expert Systems with Applications 36 pg.<br />
2659–2669<br />
[175] Treloar, A. and Wilkinson, R. (2008). “Rethinking Metadata Creation and Management in a Data-Driven<br />
Research World”, Fourth IEEE International Conference on eScience, DOI =10.1109/eScience.2008.41, pg. 782-<br />
789.<br />
[176] van <strong>de</strong>r Aalst, W.M.P. and van Hee, K.M, (2002). Workflow Management: Mo<strong>de</strong>ls, Methods, and<br />
Systems. MIT press, Cambridge, MA, 2002.<br />
[177] Vardigan, M. and Whiteman, C. (2007) ICPSR meets OAIS: applying the OAIS reference mo<strong>de</strong>l to the<br />
social science archive context. Arch Sci (2007) 7:73–87, DOI 10.1007/s10502-006-9037-z, Springer-Verlag.<br />
[178] Veja, C. http://biowikifarm.net/meta/MediaWiki_based_ingest_tool (Accessed: 19/06/2011)<br />
[179] Veja, C. http://biowikifarm.net/meta/MediaWiki_based_online_Tasks_management_for_ingest_tool<br />
(Accessed: 19/06/2011)<br />
72
[180] Veja, C., 2009, K2N-DCMI-Europeana metadata elements mappings, http://biowikifarm.net/meta/K2N-<br />
DCMI-Europeana_Metadata_Elements_Mapping. (Accessed: 19/06/2011)<br />
[181] Veja, C., 2010, Implementation <strong>de</strong>tails of Java-based Fedora Ingestion co<strong>de</strong>,<br />
http://biowikifarm.net/meta/Implementation_<strong>de</strong>tails_of_Java-based_Fedora_Ingestion_co<strong>de</strong> (last vi<strong>si</strong>ted February<br />
12, 2010)<br />
[182] Veja, C., Hagedorn, G., Weber, G. and Giurgiu, M. (2010) “Metadata Repo<strong>si</strong>tory Management u<strong>si</strong>ng the<br />
MediaWiki Interoperability Framework A Case Study:The KeyToNature Project”, Proc. Of Int. Conf. eChallenges<br />
e-2010, 27 - 29 October 2010 Warsaw, Poland, ISBN: 978-1-4244-8390-7.<br />
[183] Veja, C., Hagedorn, G., Weber, G. and Giurgiu, M. ‘Semantic MediaWiki Interoperability Framework<br />
from a Semantic Social Software Perspective’, Proc. of International Sympo<strong>si</strong>um on Electronics and<br />
Telecommunications ETC 2010, Timisoara, November 2010, pp. 403-406, IEEE<br />
DOI=10.1109/ISETC.2010.5679307.<br />
[184] Veja, C., Hagedorn, G., Weber, G., Suta, L., Vaida, F.M., (2011), Mo<strong>de</strong>ls for metadata repo<strong>si</strong>tory<br />
management u<strong>si</strong>ng Semantic Social Software. Proc. Of Int. Conf. eChallenges e-2011, October 25-27. Florence,<br />
Italy, ISBN 978-1-905824-27-4, pp. 1-8.<br />
[185] Veja, C., Vaida, F M, Hagedorn, G., (2011), “Sharing the knowledge: Semantic MediaWiki”. Acta<br />
Technica Napocen<strong>si</strong>s, 2/2011, vol. 52, pp. 10-17, ISSN: 1221-6542.<br />
[186] Veja, C., Weber, G., Hagedorn, G. and Giurgiu, M. (2010).“MediaWiki Interoperability Framework for<br />
Multimedia Digital Resources”, Proc. Of IEEE 6th Int. Conf. on Intelligent Computer Communication and<br />
Proces<strong>si</strong>ng, Cluj-Napoca, Romania, 2010, August 26-28. pp. 321-328.<br />
[187] Vieira, T.A.S., and Casanova, M.A., (2006), Flexible Workflow Execution through an Ontology-based<br />
Approach, DOI= 10.1.1.94.2349.<br />
[188] Vieira, T.A.S., Casanova, M.A. and Ferrao, L.G. (2004). An Ontology-Driven Architecture for Flexible<br />
Workflow Execution, presented at WebMedia and LA-Web, 2004.,<br />
http://dl.acm.org/citation.cfm?id=1032657.1034021, pg. 70-77.<br />
[189] Völkel, M. 2010, Personal Knowledge Mo<strong>de</strong>ls with Semantic Technologies, Ph.D the<strong>si</strong>s,<br />
http://digbib.ubka.uni-karlsruhe.<strong>de</strong>/volltexte/1000019641 (last vi<strong>si</strong>ted: 28.07.2011).<br />
[190] Völkel, M., 2007. Semantic Web Content Mo<strong>de</strong>l and Repo<strong>si</strong>tory. In: Proceedings of the 3rd International<br />
Conference on Semantic Technologies, Graz, Austria, pg. 254—262.<br />
[191] Voss, A. and Procter, R. (2009). Virtual research environments in scholarly work and communications.<br />
In: Library Hi Tech. 27, 2, 174-190. DOI = 10.1108/07378830910968146<br />
[192] Vran<strong>de</strong>cic, D. (2010), Ontology Evaluation, PhD the<strong>si</strong>s, Karlsruher Instituts fur Technologie (KIT), June<br />
2010.<br />
[193] Wallnau, K., Hissam, S. and Seacord, R. 2001, Building Systems from Commercial Components. New<br />
York, NY: Addison-Wesley, 2001.<br />
[194] Wang W.G., Tolk A., Wang W.P., (2009). The levels of conceptual interoperability mo<strong>de</strong>l: Applying<br />
systems engineering principles to M&S. Spring Simulation Multiconference (SpringSim'09). San Diego, CA, USA.<br />
(Published by SCS in the SpringSim'09 Proceedings), 2009.<br />
[195] Wang, S., Shen, W., & Hao, Q., (2006). An agent-based web service workflow mo<strong>de</strong>l for inter-enterprise<br />
collaboration. Expert Systems with Applications, 31(4), 787–799.<br />
[196] WfMC. (1999). Workflow management coalition terminology and glossary, document number WfMC-tc-<br />
1011, document status – issue 3.0.<br />
[197] Wikipedia, www.en.wikipedia.org<br />
[198] Wiley, D. (2007). “Content is infrastructure. Terra incognita.” Available at<br />
http://blog.worldcampus.psu.edu/in<strong>de</strong>x.php/2007/10/03/content-is-infrastructure/ (last vi<strong>si</strong>ted 19.07.2011).<br />
[199] Wrage, L. and Lewis, G. A. (2006) Mo<strong>de</strong>l Problems in Technologies for Interoperability: Web Service,<br />
CMU/SEI-2006-TN-021, Software Engineering Institute, Carnegie Mellon Univer<strong>si</strong>ty, June 2006.<br />
[200] Z39.50 protocol http://www.loc.gov/z3950/agency/ (last vi<strong>si</strong>ted 19.07.2011).<br />
[201] Zeng, M.L., & Xiao, L. (2001). Mapping metadata elements of different format. E-Libraries 2001,<br />
Proceedings, May 15-17, 2001, New York: 91-99. Medford, NJ: Information Today, Inc.<br />
[202] Zupancic. B. (2006). Vorlesungsaufzeichnungen und digitale Annotationen - Einsatz und Nutzen in <strong>de</strong>r<br />
Lehre. PhD the<strong>si</strong>s, Albert-Ludwigs Univer<strong>si</strong>taet Freiburg, July 2006.<br />
73