25.08.2013 Views

Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...

Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...

Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

mat. Cornelia-Flavia VEJA<br />

TEZA DE DOCTORAT<br />

<strong>Rezumat</strong><br />

MANAGEMENTUL COLABORATIV AL RESURSELOR DIGITALE<br />

PRIN SEMANTIC MEDIAWIKI<br />

COLLABORATIVE DIGITAL REPOSITORY MANAGEMENT<br />

THROUGH SEMANTIC MEDIAWIKI<br />

Comi<strong>si</strong>a <strong>de</strong> evaluare a tezei <strong>de</strong> doctorat:<br />

1<br />

Conduc@tor }tiin]ific<br />

Prof.dr.ing. Mircea-Florin VAIDA<br />

Pre}edinte: Prof.dr.ing. Virgil Dobrot@ - }ef al catedrei <strong>de</strong> Comunica]ii, <strong>Facultatea</strong><br />

<strong>de</strong> Electronic@, Telecomunica]ii }i Tehnologia Informa]iei, Univer<strong>si</strong>tatea<br />

Tehnic@ din Cluj-Napoca;<br />

Membri: Prof.dr.ing. Mircea-Florin Vaida - Conducător ştiinţific, Univer<strong>si</strong>tatea<br />

Tehnic@ din Cluj-Napoca;<br />

Prof.dr.mat. Florian-Mircea Boian - Referent, Univer<strong>si</strong>tatea „Babe}-Bolyai”<br />

din Cluj-Napoca;<br />

Prof.dr. ing. Ioan Naforniţa - Referent, Univer<strong>si</strong>tatea Politehnica –<br />

Timişoara;<br />

Prof.dr.ing. Liviu Miclea - Referent, Univer<strong>si</strong>tatea Tehnic@ din Cluj-<br />

Napoca.


CUPRINS<br />

Lista publicaţiilor în contextul tezei ........................................................................................................................ 4<br />

1. INTRODUCERE .................................................................................................................................... 5<br />

1.1. Conţinutul problemei ............................................................................................................................. 5<br />

1.2. Principalele mo<strong>de</strong>le <strong>de</strong> repo<strong>si</strong>tory şi biblioteci digitale ......................................................................... 6<br />

1.3. Caracteristicile managementului repo<strong>si</strong>tory-ului digital ........................................................................ 7<br />

1.4. Obiective generale şi specifice .............................................................................................................. 8<br />

1.5. Întrebările cercetarii ............................................................................................................................... 9<br />

1.6. Contribuţii............................................................................................................................................ 10<br />

2. DEFINIŢII ŞI FUNDAMENTE ...................................................................................................... 13<br />

2.1. Definitii legate <strong>de</strong> managementul repo<strong>si</strong>tory digital ............................................................................ 13<br />

2.2. Lucrări inrudite şi discutarea acestora în cadrul platformelor implementate ....................................... 15<br />

3. STUDIU PRIVIND MODELELE DE REPOSITORY, B IBIOTECI DIGITALE ŞI<br />

SISTEMELE DE MANAGEMENT AL CONŢINUTULUI ................................................................. 17<br />

3.1. Principalele mo<strong>de</strong>le <strong>de</strong> repo<strong>si</strong>tory şi biblioteci digitale ....................................................................... 17<br />

3.2. Sisteme <strong>de</strong> partajare a cunoştinţelor .................................................................................................... 18<br />

3.3. Repo<strong>si</strong>tory-uri multimedia interne şi partajate .................................................................................... 19<br />

4. UN MODEL CADRU CONCE PTUAL PENTRU MANAGEMENTUL COLABORATIV<br />

AL UNUI REPOSITORY DIGITAL ......................................................................................................... 20<br />

4.1. Scenarii <strong>de</strong> utilizare ............................................................................................................................. 20<br />

4.2. Descrierea mo<strong>de</strong>lelui <strong>de</strong> referinţă propus ............................................................................................ 23<br />

4.2.1. Metodologia .................................................................................................................................... 23<br />

4.3. Algoritmul <strong>de</strong> integrare in pseudocod ................................................................................................. 29<br />

4.4. Ontologia aplicaţiei.............................................................................................................................. 30<br />

4.5. Calitatea metadatelor ........................................................................................................................... 31<br />

4.6. Studiu comparative între mo<strong>de</strong>lul <strong>de</strong> referinţă OAIS şi mo<strong>de</strong>lul colaborativ propus <strong>de</strong> teză .............. 32<br />

5. ARHITECTURA DE REFERINŢĂ ŞI IMPEMENTĂRILE CONCRETE .......................... 34<br />

5.1. Descrierea tehnologiei şi <strong>de</strong>zvoltarea .................................................................................................. 34<br />

5.2. Prima arhitectură concretă ................................................................................................................... 35<br />

5.2.1. Obiect digital ....................................................................................................................................... 36<br />

5.2.2. Profilul utilizator şi specificarea colaborării ........................................................................................ 39<br />

5.2.3. Specificarea elementelor fluxului <strong>de</strong> lucru şi a relaţiilor dintre ele ..................................................... 40<br />

5.2.4. Alinierea mo<strong>de</strong>lelor şi specificarea interoperabilităţii ......................................................................... 42<br />

5.2.5. Prototip pentru realizarea interoperabilităţii cu biblioteca digitala Europeana DL .............................. 44<br />

5.3. A doua arhitectură concretă ................................................................................................................. 44<br />

2


5.4. A treia arhitectura concretă .................................................................................................................. 46<br />

5.4.1. Cerintele contextuale ale arhitecturii ................................................................................................... 46<br />

5.4.2. Metodologia ......................................................................................................................................... 46<br />

5.4.3. Descrierea tehnologiei şi <strong>de</strong>zvoltarea .................................................................................................. 47<br />

5.4.4. O ontologie <strong>si</strong>mplificată pentru mapare ............................................................................................... 49<br />

5.4.4.1. Maparea Metadatelor ................................................................................................................. 49<br />

5.4.4.2. I<strong>de</strong>ntificarea entităţilor relevante pentru interoperabilitate şi re-utilizare ................................ 50<br />

5.4.5. Realizarea interfeţei utilizator ......................................................................................................... 52<br />

5.4.6. Unealta <strong>de</strong> adnotare şi managentul drepturilor <strong>de</strong> proprietate intelectuală ...................................... 54<br />

6. PLATFORMA DE EVALUARE...................................................................................................... 56<br />

6.1. Validarea mo<strong>de</strong>lului ............................................................................................................................ 56<br />

6.2. Analiza performanţelor tehnice ale uneltelor ....................................................................................... 57<br />

6.3. Un cadru pentru evaluarea factorului <strong>de</strong> întrebuinţare ......................................................................... 57<br />

6.3.1. Extragerea datelor din Metadata Aggregation Reports ........................................................................ 57<br />

6.3.2. Sabilirea corpusului ............................................................................................................................. 58<br />

6.3.3. Stabilirea meto<strong>de</strong>i <strong>de</strong> evaluare ............................................................................................................. 58<br />

7. CONCLUZII ŞI DIRECŢII ULTERIOARE DE CERCETARE ............................................ 63<br />

7.1. Rezultatele ........................................................................................................................................... 63<br />

7.2. Rezultate tehnologice .......................................................................................................................... 64<br />

7.3. Contributii............................................................................................................................................ 64<br />

7.3.1. Contribuţii teoretice ............................................................................................................................. 64<br />

7.3.2. Contribuţii practice .............................................................................................................................. 65<br />

7.4. Direcţii viitoare <strong>de</strong> cercetare ................................................................................................................ 65<br />

Referinţe ............................................................................................................................................................ 67<br />

3


Revista BDI:<br />

Lista publicaţiilor în contextul tezei<br />

1. Veja Cornelia, Vaida Florin Mircea, Hagedorn Gregor, 2011, Sharing the knowledge:<br />

Semantic MediaWiki. Acta Technica Napocen<strong>si</strong>s, 2/2011, vol. 52, pp. 10-17, ISSN: 1221-<br />

6542.<br />

Conferinţe:<br />

2. Veja Cornelia, Weber Gisela, Hagedorn Gregor, Giurgiu Mircea,<br />

2010. MediaWiki Interoperability Framework for Multimedia<br />

Digital Resources. Proc. Of IEEE 6th Int. Conf. on Intelligent<br />

Computer Communication and Proces<strong>si</strong>ng, Cluj-Napoca, Romania.<br />

August 26-28, pp. 321-328. IEEE DOI=<br />

10.1109/ICCP.2010.5606419.<br />

3. Hagedorn, Gregor, Weber, Gisela, Plank, Aandreas Giurgiu, Mircea<br />

Homodi, Andrei, Veja Cornelia and others. 2010. An online<br />

authoring and publishing platform for field gui<strong>de</strong>s and i<strong>de</strong>ntification<br />

tools. Proc. of Conf. Tools for I<strong>de</strong>ntifying Biodiver<strong>si</strong>ty: Progress<br />

and Problems, Paris, pp. 13-18. ISBN 978-88-8303-295-0<br />

4. Mircea Giurgiu, Andrei Homodi, Cornelia Veja, Gregor Hagedorn,<br />

Pier Luigi Nimis, 2010. ‘A search tool for the digital biodiver<strong>si</strong>ty<br />

resources of KeyToNature’, Nimis P. L., Vignes Lebbe R. (eds.),<br />

Tools for I<strong>de</strong>ntifying Biodiver<strong>si</strong>ty: Progress and Problems, Paris<br />

September 2010 – pp. 19-24. ISBN 978-88-8303-295-0.<br />

5. Veja Cornelia, Hagedorn Gregor, Weber Gisela, Giurgiu Mircea.<br />

2010. Semantic MediaWiki Interoperability Framework from a<br />

Semantic Social Software Perspective. Proc. of Int. Symp. on<br />

Electronics and Telecommunications ETC 2010, Timisoara,<br />

November 2010, pp. 403-406, IEEE<br />

DOI=10.1109/ISETC.2010.5679307.<br />

6. Veja Cornelia, Hagedorn Gregor, Weber Gisela, Giurgiu Mircea.<br />

2010. Metadata Repo<strong>si</strong>tory Management u<strong>si</strong>ng the MediaWiki<br />

Interoperability Framework A Case Study:The KeyToNature<br />

Project. Proc. Of Int. Conf. eChallenges e-2010, 27-29 October.<br />

Warsaw, Poland, IEEE, pp. 1-9. ISBN: 978-1-4244-8390-7.<br />

7. Christoph Schindler, Cornelia Veja, Marc Rittberger, Denny<br />

Vran<strong>de</strong>cic, 2011. How to Teach Digital Library Data to Swim into<br />

Research. In Proceedings of i-Semantics conference, September 7 -<br />

9, 2011, Graz. Austria, pp. 142-149, ACM 978-1-4503-0621-8.<br />

8. Veja Cornelia, Hagedorn Gregor, Weber Gisela, Suta Loreta, Vaida<br />

Florin Mircea, 2011, Mo<strong>de</strong>ls for metadata repo<strong>si</strong>tory management<br />

u<strong>si</strong>ng Semantic Social Software, . Proc. Of Int. Conf. eChallenges e-<br />

2011, October 25-27. pp. 1-8, Florence, Italy. ISBN 978-1-905824-<br />

27-4.<br />

9. Christoph Schindler, Denny Vran<strong>de</strong>cic, Marc Rittberger, Rudi<br />

Stu<strong>de</strong>r, Cornelia Veja, 2011. Kollaborative Analyse von<br />

historischen Netzwerken: Virtuelle Forschungsumgebung für die<br />

Historische Bildungsforschung. In Proceeding of “Kooperationen<br />

und Netzwerke in bildungshistorischer Perspektive“ Jahrestagung<br />

<strong>de</strong>r Sektion Historische Bildungsforschung in <strong>de</strong>r DGfE, Basel,<br />

Swiss, pp. 1-8, 16-18.09.2011.<br />

4


1.1. Conţinutul problemei<br />

1. INTRODUCERE<br />

Noua generaţie <strong>de</strong> internet se va caracteriza prin convergenţa dintre comunicarea socială şi<br />

informaţia îmbogaţită semantic. Virtualizarea este prezentă inclu<strong>si</strong>v la nivelul organizaţiilor şi<br />

a comunităţilor <strong>de</strong> utilizatori. Sistemele <strong>de</strong> colaborare în masă (MC) <strong>si</strong>mulează lumea reală<br />

prin creearea unei reţele umane în jurul unul „obiectiv virtual”. Aceste <strong>si</strong>steme dau<br />

utilizatorilor po<strong>si</strong>biltatea creării unei reţele sociale evolutive în timp, exploatând totodata<br />

acestă reţea pentru a-i furniza servicii. Utilizatorii unora dintre aceste reţele sociale (wiki <strong>de</strong><br />

exemplu ) comasate în jurul obiectului virtual crează colaborativ valori intelectuale.<br />

Problemele apar când se <strong>de</strong>ci<strong>de</strong> plasarea valorile intelectuale al comunităţii, în special pentru<br />

comunităţile virtuale. Acestea sunt caracterizate printr-un înalt grad <strong>de</strong> eterogenitate la mai<br />

multe nivele. Resursele digitale pot fi uşor stocate în multe <strong>si</strong>steme acce<strong>si</strong>bile prin web:<br />

portaluri, <strong>si</strong>steme <strong>de</strong> management al conţinutului (CMS) sau <strong>de</strong>pozite digitale (repo<strong>si</strong>tory).<br />

Integrarea metadatelor este necesară pentru a stabili comunicarea între <strong>si</strong>steme multiple<br />

eterogene, unelte şi date. Creşterea rapidă a resurselor în internet şi a colecţiilor digitale a fost<br />

acompaniată <strong>de</strong> o prolifere a schemelor <strong>de</strong> metadate. Aceste scheme au fost construite în<br />

conformitate cu nevoile unei comunităţi particulare <strong>de</strong> utilizatori, utilizatori potenţiali, tipuri<br />

<strong>de</strong> materiale digitizate, domenii <strong>de</strong> aplicabilitate, nece<strong>si</strong>tăţile proiectelor, etc.<br />

Tehnologiile <strong>de</strong> management al repo<strong>si</strong>tory-ului au fost create iniţial pentru gestionarea<br />

metadatelor create cu scopul <strong>de</strong> a integra datele şi uneltele. [155].<br />

Pentru integrarea şi managementul datelor, repo<strong>si</strong>tory-ul digital agreghează diferite mo<strong>de</strong>le <strong>de</strong><br />

date, diferite scheme şi diferite unele software. Deşi publicarea datelor a fost con<strong>si</strong><strong>de</strong>rată o<br />

activitate adiţională, ea <strong>de</strong>vine din ce în ce mai mult o parte a ciclului <strong>de</strong> viaţă al obiectului<br />

digital, avînd în ve<strong>de</strong>re mai ales datele <strong>de</strong> natură dinamică (temporale, provenite <strong>de</strong> la senzori,<br />

etc).<br />

Managementul repo<strong>si</strong>tory-ului este parte intrinseca din contextul mai larg care se referă la<br />

integrarea informaţiei. El trebuie văzut ca o componentă a <strong>si</strong>stemului <strong>de</strong> management al<br />

conţinutului (CMS), în care managementul resurselor digitale nu poate fi separat <strong>de</strong><br />

managementului altor componente cum ar fi pagini web, diferitele înregistrări digitale,<br />

documente administrative, documentaţii tehnice, etc. Acest mediu lărgit în care repo<strong>si</strong>tory-ul<br />

digital coexistă şi cu care schimbă informaţii conţine date structurate şi nestructurate<br />

reprezintă baza <strong>de</strong> cunoştinţe explicite valoroase a unei organizaţiei [100].<br />

Prin excelenţă, managementului conţinutul (CM) se adresează unei comunităţi<br />

interdisciplinare dat fiind natura colaborativă a ciclului <strong>de</strong> viaţă al resurselor digitale [180].<br />

In timpul ciclul <strong>de</strong> viaţă al informaţiei aceasta îşi sporeşte valoarea trecand prin: creare,<br />

aducere la zi, publicare, traducere, arhivare şi regă<strong>si</strong>re. Setul <strong>de</strong> unelte cu care este înzestrat<br />

<strong>si</strong>stemul <strong>de</strong> management al continutului (CMS) are funcţionalităţi care gestionează acest ciclu<br />

<strong>de</strong> viaţă al obiectului digital: crearea conţinutului, întreţinere şi ver<strong>si</strong>onarea, şi diseminarea<br />

conţinutului prin portale şi diverse facilităţi <strong>de</strong> căutare [131]. Majoritatea CMS pun la<br />

dispoziţie şi unelte <strong>de</strong> adăugare a metadatelor la conţinut.<br />

Repo<strong>si</strong>tory-ul digital şi biblioteca digitală sunt astăzi printre cele mai comune medii şi unelte<br />

pentru managementul şi diseminarea colecţiilor <strong>de</strong> obiecte digitale din domeniile culturale,<br />

educaţionale, ştiinţifice şi a altor tipuri <strong>de</strong> conţinut web.<br />

Biblioteca digitală (DL) gestioneaza <strong>si</strong> furnizează accesul la colecţii largi <strong>de</strong> informaţii peste<br />

un repo<strong>si</strong>tory <strong>de</strong> cunoştinţe. În biblioteca digitală informaţia este bine organizată. De obicei<br />

DL este focalizeată pe categorizarea şi catalogarea resurselor digitale, furnizând informaţii <strong>de</strong><br />

calitate utilizatorilor. Aceste <strong>si</strong>steme <strong>de</strong> stocare şi diseminare a informaţiei au limitările lor<br />

5


printre care: ambiguităţii <strong>de</strong> limbaj natural, nu promovează <strong>de</strong>stul importanţa metadatelor şi<br />

nu angajează utilizatorii în procesul <strong>de</strong> transfer <strong>de</strong> cunoştinţe.<br />

Ca o clasă specială a CMS, repo<strong>si</strong>tory-ul digital este curent folo<strong>si</strong>t pentru gestionarea<br />

metadatelor utilizate cu scopul <strong>de</strong> a integra unelte şi datele. Repo<strong>si</strong>tory-ul este o colecţie <strong>de</strong><br />

obiecte digitale. Principalele caracteristici ale repo<strong>si</strong>tory-ului digital aşa cum au fost <strong>de</strong>scrise<br />

<strong>de</strong> (JISC) sunt:<br />

arhitectura flexibilă astfel încât sa poată gestiona atât conţinutul cât şi metadatele;<br />

conţinutul să fie acce<strong>si</strong>bil printr-un set <strong>de</strong> servicii <strong>de</strong> bază (put, search, get, etc);<br />

repo<strong>si</strong>tory-ul trebuie să fie disponibil şi <strong>de</strong> încre<strong>de</strong>re, bine susţinut şi bine gestionat.<br />

Funcţiile repo<strong>si</strong>tory-ului includ: achiziţia <strong>de</strong> documente, stocarea şi păstrarea documentelor<br />

<strong>de</strong> lungă durată, controlul ver<strong>si</strong>unilor, regă<strong>si</strong>rea documentelor şi prezentarea documentelor<br />

către utilizatorul final [104].<br />

Folo<strong>si</strong>nd terminologia specifică repo<strong>si</strong>tory-ului, mangementul acestuia constă dintr-un set <strong>de</strong><br />

activităţi referitoare la colectarea, combinarea, stocarea, şi gă<strong>si</strong>rea obiectelor digitale.<br />

Activităţile specifice sunt cele legate <strong>de</strong> curatoriat, raportarea şi păstrarea pe durată lungă.<br />

Cercetări recente în domeniul managementului bibliotecilor digitale sunt concentrate pe<br />

îmbunătăţirea infrastructurii <strong>si</strong>stemului <strong>de</strong> bibliotecă digitală (DLMS) care este <strong>de</strong> obicei un<br />

<strong>si</strong>stem repo<strong>si</strong>tory, pe <strong>de</strong> o parte, şi îmbunătăţirea mo<strong>de</strong>lului metadatelor folo<strong>si</strong>t pentru<br />

adnotarea colecţiilor <strong>de</strong> obiecte folo<strong>si</strong>nd tehnologiile semantice şi reţelele sociale pe <strong>de</strong> altă<br />

parte. Calitatea globală a informaţiei aflate în biblioteca digitală poate beneficia prin<br />

angajarea acestor tehnologii complementare, semantice şi sociale.<br />

Motivaţia <strong>de</strong> a stabili un repo<strong>si</strong>tory este condusă <strong>de</strong> interesul pragmatic comun al diferitelor<br />

comunităţi: biblioteci digitale, activitate <strong>de</strong> cercetare, învăţare, ştiinţă, publicare,<br />

managementul şi păstrare informatiei.<br />

Interdisciplinaritatea caracteristică managementului repo<strong>si</strong>tory-ului oferă po<strong>si</strong>bilitatea<br />

combinării <strong>de</strong> tehnologii diverse. Este <strong>de</strong> asemenea o oportunitate pentru a realiza transferuri<br />

<strong>de</strong> informaţie între unelte şi <strong>de</strong>zvoltarea muncii <strong>de</strong> colaborare.<br />

CMS vs. repo<strong>si</strong>tory.<br />

La prima ve<strong>de</strong>re, nu există diferenţe între CMS şi repo<strong>si</strong>tory. O mai clară abordare este aceea<br />

că CMS poate fi folo<strong>si</strong>t ca platformă pentru <strong>de</strong>zvoltarea resurselor, ori <strong>de</strong> câte ori<br />

funcţionalităţile acesteia sunt cerute. Mai mult, <strong>si</strong>stemele <strong>de</strong> repo<strong>si</strong>tory (DSpace, Fedora<br />

Commons) sunt folo<strong>si</strong>toare pentru păstrarea unei ver<strong>si</strong>uni <strong>de</strong> referinţă a resurselor digitale <strong>de</strong><br />

orice fel, şi poate fi a<strong>si</strong>milată cu funcţionalitatea unei arhive permanente în scopul păstrării <strong>de</strong><br />

lungă durată [131].<br />

Repo<strong>si</strong>tory vs. Biblioteca Digitală<br />

În repo<strong>si</strong>tory, utilizatorii sunt producătorii activi ai metadatelor prin interacţiunea comunităţii<br />

<strong>de</strong> bază, în timp ce biblioteca digitală furnizează rezultate mult mai concentrate şi mai exacte<br />

prin tehnicile <strong>de</strong> recomandare către utilizatorii finali [2]. Mo<strong>de</strong>lul <strong>de</strong> infrastructură al<br />

bibliotecii digitale – nivelul <strong>de</strong> management al <strong>si</strong>stemului bibliotecii (DLMS) este construit pe<br />

un <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory.<br />

1.2. Principalele mo<strong>de</strong>le <strong>de</strong> repo<strong>si</strong>tory şi biblioteci digitale<br />

Managementul repo<strong>si</strong>tory-ului cuprin<strong>de</strong> un set flexibil <strong>de</strong> procese şi practici, care <strong>de</strong>pind <strong>de</strong><br />

mo<strong>de</strong>lul <strong>si</strong>stemului <strong>de</strong> repo<strong>si</strong>tory, <strong>de</strong> conţinutul repo<strong>si</strong>tory-ului şi <strong>de</strong>stinaţia lui precum şi <strong>de</strong><br />

comunitatea care doreşte să îl utilizeze şi să beneficieze din exploatarea lui.<br />

Mo<strong>de</strong>lele principale pentru repo<strong>si</strong>tory şi biblioteci digitale sunt divizate în următoarele<br />

categorii:<br />

A. Mo<strong>de</strong>lul formal – 5S (secvenţe <strong>de</strong> date, spaţii, structuri, scenarii, societate) este cel mai<br />

cunoscut mo<strong>de</strong>l formal <strong>de</strong> repo<strong>si</strong>tory şi <strong>de</strong> bibliotecă digitală [70].<br />

6


B. Mo<strong>de</strong>lul <strong>de</strong> referinţă – Reference Mo<strong>de</strong>l for an Open Archival Information System<br />

(OAIS) [174]. Mo<strong>de</strong>lele <strong>de</strong>rivate din OAIS sunt:<br />

a. Three Tier Framework Reference Mo<strong>de</strong>l, cunoscut <strong>si</strong> sub numele <strong>de</strong> mo<strong>de</strong>lul Delos<br />

[29];<br />

b. CIDOC Conceptual Reference Mo<strong>de</strong>l [32].<br />

C. Mo<strong>de</strong>lul semantic <strong>de</strong> biblioteca digitală. Acest mo<strong>de</strong>l este bazat pe mo<strong>de</strong>lul OASIS dar<br />

permite o mai fină granularitate în structura şi serviciile furnizate utilizatorului final [115].<br />

Aceste mo<strong>de</strong>le se balansează între două extreme: prea multa formalizare a mo<strong>de</strong>lului 5S, dar<br />

<strong>de</strong>scrierea foarte bună la nivel structural; sau mo<strong>de</strong>lul Delos, care nu este foarte uşor adoptat<br />

<strong>de</strong> către o comunitate mică sau medie cu un nivel scăzut <strong>de</strong> expertiză tehnică.<br />

Aceste mo<strong>de</strong>le sunt <strong>de</strong> obicei numai ghiduri pentru implementatori, dar nu pot impune<br />

standar<strong>de</strong> pentru servicii şi protocoale. Implementatorii pot alege unul dintre mo<strong>de</strong>lele<br />

menţionate, dar <strong>de</strong> obicei ei adoptă un mo<strong>de</strong>l hibrid. Recent, cel mai comun mo<strong>de</strong>l <strong>de</strong> hibrid<br />

ales <strong>de</strong> implementatori, este mo<strong>de</strong>lul OAIS imbunatatit cu caracteristici semantice, aşa cum<br />

Cornell Univer<strong>si</strong>ty a adoptat pentru Fedora Commons.<br />

Principalul neajuns al implementării acestui mo<strong>de</strong>l hibrid este însuşi procesul <strong>de</strong> management<br />

al repo<strong>si</strong>tory-ului. Frecvent, aceasta este o <strong>de</strong>cizie administrativă şi nu o problemă <strong>de</strong><br />

software. Câteodată, este adoptată şi o implementare adiţională facuta <strong>de</strong> terţi, dar care numai<br />

parţial adresează problematica generală. De cele mai multe ori, aceste implementari nu sunt<br />

puse la dispoziţie întreagii comunităti care ar putea-o folo<strong>si</strong>.<br />

O soluţie po<strong>si</strong>bilă este să se adopte <strong>si</strong>stemul <strong>de</strong> repo<strong>si</strong>tory semantic ca tehnologie <strong>de</strong> stocare şi<br />

management al bibliotecii digitale.<br />

Sistemele <strong>de</strong> repo<strong>si</strong>tory semantice sunt încă la începuturile lor, chiar dacă există <strong>de</strong>ja câteva<br />

implementări disponibile. Sistemele pur semantice sunt însă soluţii „<strong>de</strong>-a gata”. Aceste<br />

<strong>si</strong>steme <strong>de</strong> management semantice complică în fapt şi mai mult managementul metadatelor<br />

<strong>de</strong>oarece se bazeaza pe evoluţia ontologiei [128].<br />

Asemenea soluţii nece<strong>si</strong>tă experţi <strong>de</strong> configurare şi mai apoi <strong>de</strong> întreţinere. Această soluţie se<br />

potriveşte mai bine in cazul <strong>de</strong>zvoltării unui <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory instituţional (aca<strong>de</strong>mic,<br />

guvernamental).<br />

Alegerea un mo<strong>de</strong>l complet <strong>de</strong> repo<strong>si</strong>tory semantic este în afara expertizei unor comunităţi<br />

mici sau medii, acestea neputând înţelege foarte bine ontologiile şi evoluţia lor. Aceste<br />

comunităţi care încearcă să creeze o DL pentru e-Learning (VLE) sau un mediu <strong>de</strong> cercetare<br />

virtual (VRE) sunt nevoite iniţial să angajeze câţiva experţi care să ajute la configurarea şi<br />

setarea <strong>si</strong>stemului <strong>de</strong> repo<strong>si</strong>tory, ceea ce duce la încarcarea costurilor <strong>de</strong> management, dar şi<br />

la <strong>de</strong>pen<strong>de</strong>nţa <strong>de</strong> personal tehnic calificat. O soluţie la în<strong>de</strong>mana acestor comunităţi în ceea ce<br />

priveşte activitatea <strong>de</strong> management al repo<strong>si</strong>tory-ului este adoptarea unui protocol automat<br />

pentru managementul acestuia, indiferent <strong>de</strong> <strong>si</strong>stemul <strong>de</strong> repo<strong>si</strong>tory ales.<br />

1.3. Caracteristicile managementului repo<strong>si</strong>tory-ului digital<br />

Pentru activitatea <strong>de</strong> management, nu există o reţetă pre<strong>de</strong>finită pentru publicarea fluxurilor<br />

<strong>de</strong> lucru, dar <strong>de</strong> obicei uneltele şi specialiştii sunt implicaţi în acest proces cu roluri şi<br />

responsabilităţi concrete. Una dintre cele mai importante activităţi în legătură cu<br />

managementul repo<strong>si</strong>tory-ului este stabilirea mo<strong>de</strong>lul <strong>de</strong> conţinut şi verificarea calitatăţii<br />

metadatelor.<br />

Calitatea metadatelor <strong>de</strong>pin<strong>de</strong> <strong>de</strong> un echilibru fragil: cât <strong>de</strong> multe metadate trebuie să<br />

înregistreze furnizorii <strong>de</strong> date sau să adauge uneltele inteligente? Fără calitate, substanţă şi<br />

standardizarea metadatelor, resurselor digitale stocate în repo<strong>si</strong>tory le lipseşte un ingredient<br />

vital care face ca acestea să fie utile pe web. Fără metadate <strong>de</strong> calitate, şansele ca o resursă să<br />

fie gă<strong>si</strong>tă sunt semnificativ diminuate. Mo<strong>de</strong>le, politicile, tratatele şi strategiile <strong>de</strong> colaborare<br />

sunt <strong>de</strong>zirabile aici împreună cu procesele automate pentru susţinerea efortului comunităţii şi<br />

scutirea utilizatorilor <strong>de</strong> munci împovărătoare, manuale.<br />

7


Conţinutul – documentele electronice, multimedia, conţinutul web şi în special conţinutul<br />

multimedia, sunt costi<strong>si</strong>toare <strong>de</strong> creat şi gestionat. Studii ca [172] au punctat faptul că<br />

majoritatea costurilor împovărătoare <strong>de</strong> gestionare a metadatelor sunt <strong>de</strong> obicei costuri umane.<br />

Paradigma Web 2.0 face mo<strong>de</strong>l tradiţionalul producător – consumator OAIS [173] un mo<strong>de</strong>l<br />

<strong>de</strong>păşit. Se promovează o nouă tehnologie care transformă granularitatea (<strong>de</strong>vine mai fină) şi<br />

conţinutul tipologiei (<strong>de</strong>vine mai larg). Mai mult <strong>de</strong>cât atât, facilitat <strong>de</strong> softul social creat <strong>de</strong><br />

comunitate, a apărut un nou <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory în interiorul unor comunităţi, aşa cum este<br />

<strong>si</strong>stemul wiki. În afară <strong>de</strong> implementarea mo<strong>de</strong>lului cla<strong>si</strong>c <strong>de</strong> stocare, aceste <strong>si</strong>steme utilizează<br />

protocoale şi servicii <strong>si</strong>mple pentru <strong>si</strong>mularea funcţionalităţii repo<strong>si</strong>tory-lui cla<strong>si</strong>c, dar nu şi<br />

gestionarea acestuia. Gestionarea repo<strong>si</strong>tory-ului poate fi o problemă software, dar cel mai<br />

a<strong>de</strong>sea este o <strong>de</strong>cizie administrativă intermediată <strong>de</strong> software.<br />

Trecerea, <strong>de</strong> la mo<strong>de</strong>lul producător – consumator (unul la mai mulţi) la mo<strong>de</strong>lul creeazăremixează-partajeaza<br />

(mai mulţi la mai mulţi), <strong>de</strong> asemenea a schimbat catacteristicile<br />

managementului conţinutului [128]. Aspectele referitoare la granularitatea conţinutului,<br />

tipologia conţinutului şi metadata trebuie să fie recon<strong>si</strong><strong>de</strong>rate pentru a fi create şi gestionate<br />

colaborativ.<br />

Pe <strong>de</strong> altă parte, <strong>si</strong>stemul <strong>de</strong> repo<strong>si</strong>tory cu facilităţi semantice are nevoie <strong>de</strong> exten<strong>si</strong>i pentru a<br />

achiziţiona funcţionalităţi îmbunătăţite.<br />

Critic, nivelul <strong>de</strong> expertiză tehnologică cerut <strong>de</strong> soluţiile mai sus menţionate este în afara<br />

înţelesului multor comunităţi mici şi medii [183].<br />

O soluţie pentru o comunitate închisa constă în folo<strong>si</strong>rea repo<strong>si</strong>tory-ul partajat furnizat <strong>de</strong> un<br />

<strong>si</strong>stem wiki. Exten<strong>si</strong>ile wiki pot folo<strong>si</strong> ca infrastructură pentru mangementul repo<strong>si</strong>tory-ului ca<br />

şi alte unelte create la comanda pentru procesul <strong>de</strong> management automat. Mai <strong>de</strong>parte, ele pot<br />

folo<strong>si</strong> serviciile semantic wiki <strong>si</strong>mplificate pentru a îmbunătăţi căutarea, interconectarea<br />

diferitelor <strong>si</strong>steme şi transferul <strong>de</strong> date [110]. Serviciile sociale furnizate <strong>de</strong> wiki lasă<br />

utilizatorii să beneficieze <strong>de</strong> nivelul <strong>de</strong> expertiză al fiecăruia dintre ei [146]; împreună ei îşi<br />

îmbunătăţesc cunoştinţele schimbând informaţii între ei şi gestionând repo<strong>si</strong>tory-ul.<br />

1.4. Obiective generale şi specifice<br />

Această teză prezintă, pornind <strong>de</strong> la mo<strong>de</strong>lele mai sus menţionate şi mo<strong>de</strong>lele <strong>de</strong> <strong>si</strong>stem <strong>de</strong><br />

colaborare în masă, un nou mo<strong>de</strong>l <strong>de</strong> gestionare a repo<strong>si</strong>tory, numit Mo<strong>de</strong>lul Colaborativ <strong>de</strong><br />

Management al Repo<strong>si</strong>tory Digital (CDRM). Noutatea acestei i<strong>de</strong>i reiese din implicarea<br />

comunităţii reţelei sociale formată în jurul repo<strong>si</strong>tory-ului în întregul proces <strong>de</strong> management<br />

al acestuia. Pentru a echilibra nevoia <strong>de</strong> funcţionalităţi avansate, nivelul scăzut <strong>de</strong> expertiză<br />

tehnologică cu costuri mici <strong>de</strong> gestionare, infrastructura trebuie să suporte protocoale, unelte,<br />

procese automate şi tehnologii semantice <strong>si</strong>mplificate.<br />

Obiectivul specific al tezei este focalizat pe managementul colaborativ al repo<strong>si</strong>tory-ului <strong>de</strong><br />

metadate, în interiorul unei comunităţi mici sau medii caracterizată printr-un nivel scazut <strong>de</strong><br />

expertiză tehnologică.<br />

Această teză explorează <strong>de</strong> asemenea impactul tehnologiilor <strong>de</strong> semantic web asupra evoluţiei<br />

bibliotecilor digitale <strong>si</strong> modul in care cercetatorii <strong>si</strong> bibliotecarii beneficiaza <strong>de</strong> aceste<br />

tehnologii folo<strong>si</strong>ndu-le pentru o mai bună aservire a furnizorului <strong>de</strong> date <strong>si</strong> a utilizatorului<br />

final. Avand suportul tehnologiilor semantice pe <strong>de</strong> o parte, şi abordarea specifică reţelelor<br />

sociale, pe <strong>de</strong> altă poarte, întregul proces <strong>de</strong> management al repo<strong>si</strong>tory-ului digital va fi<br />

translatat <strong>de</strong> la specialişti la utilizatori <strong>de</strong> zi cu zi cât mai mult po<strong>si</strong>bil. Utilizatorii sunt<br />

sprijiniţi – însă nu forţaţi - sa colaboreze la structurarea, organizarea, formarea şi validarea<br />

metadatelor lor şi a altor resurse, într-un mediu adaptabil, pentru o mai bună căutare şi<br />

refolo<strong>si</strong>re a resurselor.<br />

Mai specific, se intenţionează să:<br />

1. îmbunătăţească procesul <strong>de</strong> management al repo<strong>si</strong>tory-ului <strong>de</strong> metadate pentru a<br />

suporta automanagementul comunităţii şi automatizarea proceselor managementului<br />

repo<strong>si</strong>tory-ului. Automatizarea procesului este suportată <strong>de</strong> şabloane (templates),<br />

8


tehnologiile semantice şi unelte special create. Automanagementul trebuie să răspundă<br />

la provocarea principală în managementul repo<strong>si</strong>tory-ului: să construiască un<br />

repo<strong>si</strong>tory şi să expună serviciile repo<strong>si</strong>tory fără să împovareze creatorii <strong>de</strong> conţinut şi<br />

utilizatorii finali cu procese adiţionale [99].<br />

2. <strong>de</strong>zvoltarea soluţiilor orientate spre utilizatori finali cu scopul <strong>de</strong> a face conţinutul<br />

digital mult mai acce<strong>si</strong>bil, uşor <strong>de</strong> folo<strong>si</strong>t şi exploatat, folo<strong>si</strong>nd tehnologiile semantice.<br />

Managementul repo<strong>si</strong>tory-ului este o parte a integrării datelor care la randul său este<br />

principalul domeniu <strong>de</strong> aplicabilitate a ontologiilor.<br />

3. scă<strong>de</strong>rea semnificativă a <strong>de</strong>zorientării utilizatorilor, costurilor implicate şi a timpului<br />

<strong>de</strong> procesare. In consecinţă, furnizorii <strong>de</strong> date şi utilizatorii finali se pot focaliza pe<br />

schimbul <strong>de</strong> resurse şi crearea colaborative a cunoştinţelor, fiind scutiţi <strong>de</strong> sarcini<br />

împovaratoare adiţionale.<br />

4. creşterea semnificativă a implicării utilizatorilor în procesul <strong>de</strong> management al<br />

repo<strong>si</strong>tory-ului prin translatarea răspun<strong>de</strong>rii <strong>de</strong> la <strong>de</strong>zvoltatori la utilizatorii <strong>de</strong> zi cu zi.<br />

Această implicare are un rezultat concret : creşterea nivelul <strong>de</strong> calitate al metadatelor.<br />

Obiectivele menţionate mai sus sunt rezolvate folo<strong>si</strong>nd mo<strong>de</strong>le propuse, arhitecturi şi meto<strong>de</strong>:<br />

1. mo<strong>de</strong>lul <strong>de</strong> referinţă bidirecţional <strong>de</strong>zvoltat pentru managementul colaborativ al<br />

repo<strong>si</strong>tory. Noul mo<strong>de</strong>l creat recon<strong>si</strong><strong>de</strong>ră părţi din mo<strong>de</strong>lele principale din literatură<br />

cărora le măreşte flexibilitatea prin adăugarea <strong>de</strong> noi funcţionalităţi inspirate din<br />

principiile <strong>si</strong>stemelor <strong>de</strong> colaborare în masă. Acest mo<strong>de</strong>l încapsuleaza diferite aspecte<br />

ale logicii mo<strong>de</strong>lului <strong>de</strong> referinţă: ontologia aplicatiei (AO), ontologia fluxului <strong>de</strong><br />

lucru (WO), şi ontologia repo<strong>si</strong>tory digital (RO). Mo<strong>de</strong>lul <strong>de</strong> referinţă este <strong>de</strong>cuplat <strong>de</strong><br />

la mo<strong>de</strong>lul repo<strong>si</strong>tory-ului digital, trecând şi în sfera mai largă <strong>de</strong> acoperire a<br />

problemei integrării metadatelor indiferent <strong>de</strong> mediul <strong>de</strong> stocare specific.<br />

2. arhitectura <strong>de</strong> referinţă bazată pe mo<strong>de</strong>lul mediator, care reflectă proiectarea şi<br />

suplineşte cererile mo<strong>de</strong>lului <strong>de</strong> referinţă şi <strong>de</strong> asemenea capturează informaţiile<br />

colectate <strong>de</strong>-a lungul timpului în metadate.<br />

3. trei arhitecturi concrete <strong>de</strong>rivate şi implementările acestora, conforme cu mo<strong>de</strong>lul<br />

propus anterior.<br />

Aceste trei arhitecturi concrete ale mo<strong>de</strong>lului <strong>de</strong> referinţă corespund cu recoltarea<br />

(harvesting), agregarea şi căutarea metadatelor, sunt fiecare utilizate pentru scopuri<br />

specifice. Ele dau o soluţie pentru trei cazuri concrete <strong>de</strong> <strong>de</strong>zvoltare ale unor VLEs sau<br />

VREs în interiorul comunităţilor mici şi medii şi pentru care este nevoie <strong>de</strong> integrarea<br />

datelor. Prin aceste arhitecturi concrete este verificată validitatea conceptului bidirecţionl<br />

al mo<strong>de</strong>lului <strong>de</strong> referinţă.<br />

4. un nou mo<strong>de</strong>l <strong>de</strong> platformă pentru evaluarea nivelului <strong>de</strong> întrebuinţare a rezultatului<br />

primei implementări.<br />

Acest obiectiv este asociat cu realizari tehnologice, şi <strong>de</strong> asemenea cu beneficiile <strong>de</strong>rivate<br />

din utilizarea mai sus numitelor meto<strong>de</strong> şi unelte tehnologice.<br />

1.5. Întrebările cercetarii<br />

Această teză işi propune sa raspundă la următoarele întrebări <strong>de</strong> cercetare:<br />

Care sunt factorii care influenţează nece<strong>si</strong>tăţile şi beneficiile în managementul<br />

repo<strong>si</strong>tory-ului <strong>de</strong> metadate?<br />

Care este mo<strong>de</strong>lul cel mai potrivit pentru reprezentarea artefactelor aflate în diferite<br />

gra<strong>de</strong> <strong>de</strong> formalizare şi permite folo<strong>si</strong>rea lor în mod uniform?<br />

Care metodă este cea mai potrivita pentru încurajarea participarii utilizatorilor în<br />

întregul proces <strong>de</strong> management al conţinutului digital?<br />

9


Ce metodologie este curent acceptată pentru a contra-balansa nivelului scăzut <strong>de</strong><br />

expertiză tehnologică a utilizatorilor finali, cu nivelele ridicate ale nece<strong>si</strong>tăţilor<br />

funcţionale şi non-funcţionale pe care platforma finală ar trebui să le în<strong>de</strong>plinească?<br />

Care este cel mai potrivit mediu care poate să suporte tehnologiile webului semantic<br />

(ontologiile) pentru a unifica diferitele standar<strong>de</strong> <strong>de</strong> metadata? Poate acest mediu să<br />

ascundă complexitatea acestui proces pentru utilizatorii finali?<br />

Cum validam calitatea metadatelor şi cum lucrăm cu diferitele interpretări ale<br />

metadatelor furnizate <strong>de</strong> furnizorii date adoptând meto<strong>de</strong> neintruzive?<br />

Mo<strong>de</strong>lul conceptual este <strong>de</strong>stul <strong>de</strong> general pentru a suporta <strong>de</strong>rivaţiile şi constrângerile<br />

cerute pentru realizarea unui mediu virtual <strong>de</strong> cercetare un<strong>de</strong> furnizorii <strong>de</strong> metadate şi<br />

cercetătorii care adnotează resursele digitale sunt tehnologic agnostici?<br />

La sfârşitul tezei vom prezenta un răspuns pentru fiecare din aceste întrebări ca rezultat al<br />

cercetării noastre.<br />

1.6. Contribuţii<br />

Această teză se adresează managementului colaborativ al repo<strong>si</strong>tory digital la intersecţia<br />

<strong>si</strong>temului <strong>de</strong> calcul cu omul: o platformă pentru managementul colaborativ al repo<strong>si</strong>tory-ului<br />

şi managementul fluxurilor <strong>de</strong> lucru şi care permite adnotarea colaborativa a conţinutului<br />

digital utilizând Semantic MediaWiki. Principalul obiectiv este contribuţia la îmbunătăţirea<br />

tehnologiilor pentru transferul colaborativ <strong>de</strong> cunostinte, iar în mod specific integrarea<br />

datelor. În acest context, focalizarea este pe zonele <strong>de</strong> aplicaţii specifice îmbunătăţirii<br />

managementului repo<strong>si</strong>tory digital folo<strong>si</strong>nd tehnologia semantică şi construirea infrastructurii<br />

informaţiei.<br />

Principalele contribuţii ale acestei teze sunt:<br />

1. o analiză comprehen<strong>si</strong>vă a mo<strong>de</strong>lelor <strong>de</strong> repo<strong>si</strong>tory, a bibliotecilor digitale şi<br />

mo<strong>de</strong>lelor <strong>de</strong> management al repo<strong>si</strong>tory-ului digital; un studiu comparativ al<br />

<strong>si</strong>stemelor <strong>de</strong> semnatic wikis.<br />

2. propunerea unui nou mo<strong>de</strong>l <strong>de</strong> referinţă şi o arhitectură <strong>de</strong> referinţă pentru<br />

managementul unui repo<strong>si</strong>tory digital.<br />

3. propunerea unei ontologii <strong>de</strong> nivel înalt pentru managementul colaborativ al<br />

repo<strong>si</strong>tory-ului digital.<br />

4. propuneri pentru trei arhitecturi concrete, <strong>de</strong>zvoltate ca platforme separate pentru<br />

managementul colaborativ al unui repo<strong>si</strong>tory-ului digital.<br />

5. implementarea rezultatelor teoretice în platforme practice pentru a face rezultatele<br />

acestei teze acce<strong>si</strong>bil pentru utilizatori.<br />

6. realizarea practică a managementul conţinutului <strong>de</strong> repo<strong>si</strong>tory şi a adnotărilor<br />

semantice.<br />

7. o platformă pentru evaluarea rezultatelor implementarilor folo<strong>si</strong>nd mo<strong>de</strong>lul Semantic<br />

MediaWiki în comparaţie cu mo<strong>de</strong>lul <strong>de</strong> interoperabilitate Systems of Systems<br />

Interoperability (SoSI), şi un cadru pentru evaluarea gradului <strong>de</strong> întrebuinţare.<br />

1.7. Conţinutul tezei<br />

1. Primul capitol dă motivaţia pentru această teză şi <strong>de</strong>finiţia managementului<br />

repo<strong>si</strong>tory-ului digital (DRM), <strong>si</strong> prezinta legatura cu <strong>si</strong>stemele <strong>de</strong> management al<br />

10


conţinutului (CM). Se arată că principalul rol al DRM este <strong>de</strong> a furniza un ghid pentru<br />

utilizatori pentru a contrabalansa costurile <strong>si</strong> beneficiile în contextul unor comunităţi mici şi<br />

medii. Acest capitol introduce termeni cheie ca managementul colaborativ al repo<strong>si</strong>tory-ului<br />

digital şi explică cum aceste artefacte pot varia în mărime, funcţionalitate <strong>si</strong> structură.<br />

Capitolul concluzionează prin sumarizarea soluţiei şi precizează întrebările <strong>de</strong> cercetare.<br />

2. Definiţiile şi fundamentele acestei teze sunt prevăzute în capitolul 2. O secţiune<br />

complexa evi<strong>de</strong>ntiaza conceptele relevante pentru mo<strong>de</strong>le şi referinţele dintre ele. Ambele au<br />

avut o influenţă majoră conceptuală în această teză.<br />

Din punct <strong>de</strong> ve<strong>de</strong>re tehnic sunt <strong>de</strong>scrise: <strong>si</strong>stemul <strong>de</strong> repo<strong>si</strong>tory ca artefact software,<br />

hipertext, inginerie software, web-ul semantic, <strong>si</strong>stemele sociale <strong>de</strong> partajare a cunostintelor<br />

(wiki), managementul fluxului <strong>de</strong> lucru, şi adnotarile semantice. Aceste <strong>de</strong>talii tehnice sunt<br />

analizate în profunzime în capitolul trei.<br />

Abordări asociate sunt <strong>de</strong> asemenea introduse <strong>si</strong> discutate: adnotările digitale, webul social<br />

semantic, fluxul <strong>de</strong> lucru şi interoperabilitatea ca noţiune generalizatoare.<br />

3. Capitolul 3 startează cu prezentarea principalelor mo<strong>de</strong>le existente <strong>de</strong> management al<br />

repo<strong>si</strong>tory-ului şi introduce aici i<strong>de</strong>ea <strong>de</strong> management colaborativ al repo<strong>si</strong>tory-ului urmărind<br />

în<strong>de</strong>aproape ciclul natural <strong>de</strong> viaţă al informaţiei. O analiza profunda a literaturii relevă alte<br />

nece<strong>si</strong>tăţi semnalate <strong>de</strong> aceasta. Mo<strong>de</strong>lele existente sunt analizate cu intenţia <strong>de</strong> a gă<strong>si</strong> puncte<br />

comune între ele şi caută caracteristici structurale care ar putea fi prezente în viitoarele<br />

<strong>si</strong>steme colaborative <strong>de</strong> management al repo<strong>si</strong>tory-ului. O analiză <strong>si</strong>milară este adresata<br />

pentru evi<strong>de</strong>ntierea <strong>si</strong>stemelor sociale semantice colaborative cu partajare, <strong>de</strong> exemplu<br />

<strong>si</strong>stemele wiki.<br />

4. În capitolul 4 este prezentat mo<strong>de</strong>lul soluţiei. Capitolul începe cu o analiză profundă a<br />

factorului social în managementul repo<strong>si</strong>tory-ului <strong>de</strong> la care sunt <strong>de</strong>rivate primele nece<strong>si</strong>tati.<br />

Mo<strong>de</strong>lele <strong>de</strong> reprezentare managementul repo<strong>si</strong>tory-ului sunt utilizate la evi<strong>de</strong>ntierea<br />

nece<strong>si</strong>tatilor pentru managementul acestuia. Capitolul prezintă mai târziu un tabel concret <strong>de</strong><br />

nece<strong>si</strong>tăţi. Soluţia constă într-un mo<strong>de</strong>l <strong>si</strong>mplu <strong>de</strong> management colaborativ pentru repo<strong>si</strong>tory.<br />

Acest mo<strong>de</strong>l reprezintă mai bune variaţii în granularitate şi a relaţiilor dintre entităţi semantice<br />

şi este însotit <strong>de</strong> ontologia fluxului <strong>de</strong> lucru prin care se <strong>de</strong>scriu operaţiile comune utilizate<br />

pentru procesele <strong>de</strong> integrare a metadatelor. Acest capitol explică o ierarhie <strong>de</strong> relaţii <strong>de</strong>rivate,<br />

în măsură să <strong>de</strong>scrie mo<strong>de</strong>lele <strong>de</strong> management a repo<strong>si</strong>tory-ului.<br />

5. Capitolul 5 prezintă o arhitectură <strong>de</strong> referinţă, trei implementări concrete şi diferite<br />

unelte bazate pe mo<strong>de</strong>lul colaborativ <strong>de</strong> management al repo<strong>si</strong>tory-ului introdus in capitolul<br />

prece<strong>de</strong>nt. Serviciul colaborativ <strong>de</strong> Ingest al Fedora Common Repo<strong>si</strong>tory este un serviciu<br />

complex ce utilizează wiki pentru management. Uneltele <strong>de</strong> integrare colaborativă sunt<br />

utilizate mai <strong>de</strong>parte pentru integrea datelor intr-un <strong>si</strong>stem semantic wiki. Aceste unelte<br />

specifice <strong>de</strong>zvoltate ca exten<strong>si</strong>i wiki sunt <strong>de</strong> asemenea prezente. Acest capitol specifică<br />

cazurile <strong>de</strong> utilizare şi constrângerile <strong>de</strong> implementare pentru fiecare arhitectură completă.<br />

Uneltele adiţionale pentru adnotarea semantica a imaginilor este prezentată <strong>de</strong> asemenea în<br />

acest capitol.<br />

6. În continuare diferite tipuri <strong>de</strong> evaluare sunt prezentate în capitolul 6. O evaluare<br />

subiectiva foloseste mo<strong>de</strong>lul <strong>de</strong> interoperabilitate Systems of Systems interoperability ca<br />

mo<strong>de</strong>l matur <strong>de</strong> evaluare a interoperabilitatii. În continuare este prezentă o metodă <strong>de</strong><br />

evaluare utilizând semantic wiki ca suport şi datele din feedbackul furnizorilor <strong>de</strong> matadate.<br />

11


Rezultatele au fost comparate în diferite moduri cu abordarea cla<strong>si</strong>că pentru managementul<br />

<strong>de</strong>pozitului <strong>de</strong> metadate. Capitolul continuă cu prezentarea unui număr <strong>de</strong> abordari care au<br />

legătură cu diferite părţi ale soluţiei.<br />

7. În capitolul 7 sunt i<strong>de</strong>ntificate şi prezentate concluziile şi un număr <strong>de</strong> directii<br />

cercetări şi tematici viitoare <strong>de</strong> cercetare. În final sunt sumarizate contribuţiile principale ale<br />

acestei teze.<br />

12


2. DEFINIŢII ŞI FUNDAMENTE<br />

Acest capitol prezintă mai multe <strong>de</strong>finiţii, relevă anumite caracteristici <strong>de</strong> gestionare a<br />

resurselor digitale, acordându-le însă diferite pon<strong>de</strong>ri <strong>de</strong> importanţă. Pornind <strong>de</strong> la conţinutul<br />

digital şi terminând cu o <strong>de</strong>finiţie informală <strong>de</strong> repo<strong>si</strong>tory şi bibliotecă digitală, vom introduce<br />

treptat termenii relativi la managementul resurselor digitale, selectaţi în conformitate cu<br />

obiectivele generale ale tezei. Legat <strong>de</strong> managementul repo<strong>si</strong>tory digital, vom studia mo<strong>de</strong>lul<br />

<strong>de</strong> adnotare şi implementarile privind adnotarea imaginilor.<br />

Secţiuni ale acestui capitol sunt axate pe două probleme diferite, strâns legate <strong>de</strong> gestionarea<br />

repo<strong>si</strong>tory <strong>de</strong> metadate.<br />

În primul rând, <strong>de</strong>oarece managementul este o activitate orientată pe proces, vom rezuma din<br />

punct <strong>de</strong> ve<strong>de</strong>re conceptual fluxurile <strong>de</strong> lucru.<br />

În al doilea rând, având în ve<strong>de</strong>re problema integrării <strong>de</strong> metadate, vom analiza problemele<br />

eterogenităţii la mai multe niveluri. Vor fi relevate mai multe meto<strong>de</strong> şi practici pentru a<br />

abordarea problemele <strong>de</strong> interoperabilitate, rezumate din literatura <strong>de</strong> specialitate. În plus, vor<br />

fi prezentate pe scurt mo<strong>de</strong>lele mature <strong>de</strong> interoperabilitate, ca o metodă alternativă po<strong>si</strong>bilă<br />

pentru evaluarea interoperabilităţii la nivelul <strong>si</strong>stemelor.<br />

2.1. Definitii legate <strong>de</strong> managementul repo<strong>si</strong>tory digital<br />

Conţinutului digital, sau pur şi <strong>si</strong>mplu, conţinutul, este o informaţie digitală, care poate<br />

inclu<strong>de</strong> documente electronice, fişiere multimedia, conţinut Web sau alte tipuri <strong>de</strong> fişiere, cu<br />

un ciclu <strong>de</strong> viaţă care nece<strong>si</strong>tă management.<br />

O subclasă a conţinutului digital sunt <strong>de</strong> valorile digitale (digital asset), cum ar fi fotografii<br />

digitale, animaţii, clipuri vi<strong>de</strong>o şi muzică.<br />

Procesul <strong>de</strong> management al conţinutului, sau CM, este un set <strong>de</strong> procese şi tehnologii care<br />

sprijină ciclul <strong>de</strong> viaţă evolutiv al conţinutului digital.<br />

În funcţie <strong>de</strong> mi<strong>si</strong>unea şi obiectivele <strong>de</strong> bu<strong>si</strong>ness, managementul conţinutului poate varia în<br />

funcţie <strong>de</strong> etapele procesului, <strong>de</strong> terminologie şi <strong>de</strong> management. De obicei, ciclul <strong>de</strong> viaţă al<br />

conţinutului digital constă în 6 etape principale: crearea, actualizarea, publicarea, traducerea,<br />

arhivarea şi regă<strong>si</strong>rea, având ca o caracteristică comună colaborarea dintre creator, redactor,<br />

editor, administrator şi consumator.<br />

Sistemele <strong>de</strong> management al conţinutului (CMS) sunt programe <strong>de</strong> calculator şi / sau <strong>si</strong>steme<br />

hardware-ul utilizate pentru a sprijini şi <strong>de</strong> a gestiona fluxul <strong>de</strong> lucru tehnic necesar pentru a<br />

crea colaborativ, edita, revizui, in<strong>de</strong>xa şi căuta, publica şi arhivă conţinutul digital.<br />

CMS sunt frecvent utilizate pentru stocarea, controlul ver<strong>si</strong>unilor, publicarea şi documentarea<br />

specifică cum ar fi articole <strong>de</strong> ştiri, manuale <strong>de</strong> operatori, manuale tehnice, ghiduri <strong>de</strong> vânzări<br />

şi broşuri <strong>de</strong> marketing. Procesul <strong>de</strong> publicare este <strong>de</strong> obicei asumat <strong>de</strong> un CMS, având un<br />

instrument software integrat pentru authoring. Acest instrument trebuie să permită<br />

utilizatorilor non-tehnici să creeze şi să gestioneze cu relativă uşurinţă conţinutul.<br />

Sistemele <strong>de</strong> repo<strong>si</strong>tory utilizate <strong>de</strong> către CMS pot inclu<strong>de</strong> o bază <strong>de</strong> date. Conţinutul,<br />

cum ar fi metadatele şi / sau artefacte, sunt frecvent stocate ca fişiere XML.<br />

Indiferent <strong>de</strong> terminologia specifică utilizată, procesul <strong>de</strong> management (sau <strong>de</strong><br />

gestionare a resurselor digitale) constă în colectarea şi stocarea <strong>de</strong> valori în format<br />

digital. Valorile digitale sunt stocate împreună "metadatele" sale.<br />

Metadatele sunt piese primare <strong>de</strong> informaţie, care <strong>de</strong>scriu aspectele semnificative ale unei<br />

resurse şi ajută la gestionarea şi conservarea materialului digital <strong>de</strong>-a lungul timpului. Ele vor<br />

contribui la prezervarea informaţiilor esenţiale contextuale, istorice, tehnice şi sunt păstrate,<br />

împreună cu obiectele digitale şi au un rol crucial in <strong>de</strong>scoperirea acestora.<br />

13


Un repo<strong>si</strong>tory este o platformă <strong>de</strong> aplicaţie pentru gestionarea, stocarea şi a<strong>si</strong>gurarea accesului<br />

într-un mod convenabil la conţinutul digital.<br />

O altă <strong>de</strong>finiţie, publicat <strong>de</strong> către Joint Information Systems Committee (JISC) [83],<br />

subliniază funcţionalitatea unui repo<strong>si</strong>tory:<br />

"... Un repo<strong>si</strong>tory se <strong>de</strong>osebeşte <strong>de</strong> alte colecţii digitale prin următoarele caracteristici:<br />

• conţinutul este repo<strong>si</strong>toryat într-un repo<strong>si</strong>tory, fie <strong>de</strong> către creatorul conţinutului,<br />

proprietarul sau o terţă parte<br />

• arhitectura repo<strong>si</strong>tory gestionează conţinut precum şi metadatele<br />

• repo<strong>si</strong>tory-ul oferă un set minim <strong>de</strong> servicii <strong>de</strong> bază, <strong>de</strong> exemplu, stocare, primire,<br />

căutare, controlul accesului.<br />

• repo<strong>si</strong>tory-ul trebuie să fie durabil şi <strong>de</strong> încre<strong>de</strong>re, bine susţinut şi bine gestionat".<br />

În afară <strong>de</strong> atributele <strong>de</strong> mai sus, este <strong>de</strong> remarcat o caracteristică suplimentară, pentru că ea<br />

face diferenţierea faţă <strong>de</strong> alte <strong>si</strong>steme software <strong>si</strong>milare: repo<strong>si</strong>tory-ul digital a<strong>si</strong>gură "acces<br />

liber", cel puţin parţial [83]. Repo<strong>si</strong>tory-ul digital <strong>de</strong>schis se distinge prin următoarele<br />

caracteristici:<br />

• repo<strong>si</strong>tory-ul trebuie să ofere acces <strong>de</strong>schis la conţinutul acesteia (dacă nu există<br />

constrângeri legale), şi<br />

• repo<strong>si</strong>tory-ul trebuie să ofere acces <strong>de</strong>schis la metadate pentru harvesting.<br />

Scopul principal al unui repo<strong>si</strong>tory este <strong>de</strong> a menţine şi a <strong>de</strong>riva valoarea maximă din<br />

conţinutul acesteia. Un repo<strong>si</strong>tory poate sprijini activităţi umane cum ar fi cea <strong>de</strong> cercetare, <strong>de</strong><br />

învăţare, şi proceselor administrative. Repo<strong>si</strong>tory utilizează standar<strong>de</strong> internaţionale <strong>de</strong>schise,<br />

pentru a a<strong>si</strong>gura că conţinutul lor este acce<strong>si</strong>bil, astfel încât să poată fi cautat <strong>si</strong> preluat pentru<br />

o utilizare ulterioară. Utilizarea acestor standar<strong>de</strong> acceptate internaţional permite stabilirea <strong>de</strong><br />

strategii pentru importul, exportul, i<strong>de</strong>ntificarea, stocarea şi regă<strong>si</strong>rea conţinutului digital în<br />

repo<strong>si</strong>tory.<br />

Biblioteca Digitală (DL) este un <strong>si</strong>stem care oferă acces larg la o colecţie mare, gestionabilă<br />

<strong>de</strong> informaţii, organizată peste un repo<strong>si</strong>tory <strong>de</strong> cunoştinţe. Tema unificatoare a unei biblioteci<br />

digitale este aceea că informaţia este organizată pe calculatoare organizate în reţea, având<br />

proceduri pentru selectarea materialelor din colecţii, pe care le organizează, le pune apoi la<br />

dispoziţia utilizatorilor, şi le arhivează.<br />

Aici, utilizatorii nu au acces doar la conţinutul digital din repo<strong>si</strong>tory, mai mult, ei au<br />

instrumente pentru a re-organiza şi îmbogăţi conţinutul prin adnotari, construirea colecţiilor,<br />

şi bookmarking.<br />

O bibliotecă digitală trebuie să gestioneze documente compuse, ceea ce este o caracteristică<br />

DL. Documentele compuse poat fi <strong>de</strong>stul <strong>de</strong> complexe, şi <strong>de</strong> multe ori conţin mai multe<br />

documente multimedia, în cazul în care componentele sunt obiecte digitale la propriu, sau<br />

doar <strong>si</strong>mple adnotări. Un obiect compus ar putea fi o intreaga baza <strong>de</strong> date.<br />

Termenii "repo<strong>si</strong>tory" şi "biblioteci digitale" sunt confundaţi <strong>de</strong> multe ori. Pentru restul<br />

acestei teze, vom folo<strong>si</strong> fiecare termen în conformitate cu <strong>de</strong>finiţiile <strong>de</strong> mai sus.<br />

Soergel în [164] <strong>de</strong>fineşte repo<strong>si</strong>tory-ul digital în termenii funcţionalităţii (servicii oferite<br />

bibliotecii digitale):<br />

Un repo<strong>si</strong>tory este o bibliotecă digitală care oferă acces doar la o colecţie <strong>de</strong> elemente<br />

cunoscute.<br />

Funcţiile repo<strong>si</strong>tory-ul includ <strong>si</strong> achizitionarea <strong>de</strong> documente, stocarea în condiţii <strong>de</strong> <strong>si</strong>guranţă,<br />

<strong>de</strong> conservare, <strong>de</strong> control al ver<strong>si</strong>unii, căutarea documentelor şi prezentarea lor.<br />

Un repo<strong>si</strong>tory, <strong>de</strong> asemenea, are nevoie <strong>de</strong> un mo<strong>de</strong>l <strong>de</strong> document care <strong>de</strong>fineşte structura<br />

logică a documentului şi modul în care un document este accesat şi manipulat în scopul<br />

gestionării, cum ar fi mo<strong>de</strong>lul bazat pe XML Document Object (DOM) [90] (a se ve<strong>de</strong>a<br />

Wikipedia), sau Fedora Digital Object Mo<strong>de</strong>l [62].<br />

14


Obiectul digital<br />

Obiectele digitale (sau materiale digitale) se referă la orice element care este disponibil<br />

digital. Termenul cuprin<strong>de</strong> atât surogate digitale create ca rezultat al convertirii materialelor<br />

analoge în formă digitală (digitizare), cât şi cele "născute digital", pentru care nu a existat<br />

niciodată şi nu există nici o intenţie <strong>de</strong> creere a unui echivalent analogic.<br />

Agregările (Colecţii)<br />

Colecţia este o agregare <strong>de</strong> obiecte digitale împreună cu relaţiile dintre ele. Colecţiile, în<br />

general, suportă următoarele funcţii:<br />

• selectarea <strong>de</strong> conţinut: selectarea unui subset <strong>de</strong> obiecte disponibile;<br />

• organizarea: aplicarea unor principii coerente <strong>de</strong> ordonare;<br />

• documentaţie: metadatele contextuale, moştenite şi administrative; şi<br />

• arhivare: administrare pe termen lung.<br />

Figure 2. 1. Relaţiile dintre repo<strong>si</strong>tory-ul digital, CMS şi biblioteci digitale<br />

2.2. Lucrări inrudite şi discutarea acestora în cadrul platformelor<br />

implementate<br />

Abordări <strong>si</strong>milare se găsesc în cadrul proiectului APOSDLE 1 care are ca scop un proces <strong>de</strong><br />

mo<strong>de</strong>lare integrată a ontologiilor şi fluxurile <strong>de</strong> lucru. APOSDLE utilizează Semantic<br />

MediaWiki (SMW) pentru <strong>de</strong>zvoltarea colaborativă <strong>de</strong> mo<strong>de</strong>le informale create printr-o<br />

strânsă integrare, în mare parte automata, cu Semantic MediaWiki şi cu instrumente pentru<br />

mo<strong>de</strong>larea formală, în scopul <strong>de</strong> a reutiliza mo<strong>de</strong>le informale pentru crearea <strong>de</strong> mo<strong>de</strong>le<br />

formale.<br />

O altă abordare, folo<strong>si</strong>nd şabloane pentru extragerea <strong>de</strong> informaţii structurate din MediaWiki<br />

este prezentată în [7], dar această abordare nu a formalizat fluxul <strong>de</strong> lucru. Un studiu <strong>de</strong> caz a<br />

unei creări <strong>de</strong> biblioteci digitale folo<strong>si</strong>nd MediaWiki pe partea <strong>de</strong> interfaţă cu repo<strong>si</strong>tory-ul<br />

este prezentată în [175].<br />

Comparativ, cazurile <strong>de</strong> integrare a datelor în MediaWiki şi SMW ca platformă pentru VREs<br />

nu are realizari concrete comparabile cu abordarea noastră, medii virtuale <strong>de</strong> învăţare (VLEs)<br />

[133] sunt mai interesate <strong>de</strong> probleme <strong>si</strong>milare şi punctează aceleaşi neajunsuri în domeniul<br />

<strong>de</strong> integrării datelor. Aceasta oferă po<strong>si</strong>bilitatea <strong>de</strong> recon<strong>si</strong><strong>de</strong>ra experienţa acumulată în<br />

această directive, adaptand-o şi extinzând-o să fie compatibilă abordării nevoilor specifice ale<br />

mediilor <strong>de</strong> cercetare.<br />

Un alt mod <strong>de</strong> trata fluxurile <strong>de</strong> lucru pot fi gă<strong>si</strong>te în myExperiment. De Roure con<strong>si</strong><strong>de</strong>ră că<br />

fluxurile <strong>de</strong> lucru sunt obiecte ştiinţifice în <strong>si</strong>ne şi, prin urmare, acestea ar putea fi schimbate<br />

1 Advanced Process-Oriented Self-Directed Learning Environment http://www.aposdle.org<br />

15


şi reutilizate. myExperiment este o nouă iniţiativă pentru a crea un mediu <strong>de</strong> reţea socială a<br />

lucrătorilor în domeniul fluxurilor <strong>de</strong> lucru [43]. Luând exemplu paradigma reţelelor sociale,<br />

obiectul partajat în acest caz este fluxul <strong>de</strong> lucru în <strong>si</strong>ne.<br />

Un alt proiect VLE folo<strong>si</strong>nd ca suport pentru tehnologiile semantice SMW este OceanTeacher<br />

UNESCO. Aceasta este o bibliotecă digitală <strong>de</strong> cunoştinţe referitoare la date oceanografice şi<br />

<strong>de</strong> asemenea, permite gestionarea informaţiilor dinamice. Acesta inclu<strong>de</strong> texte, imagini,<br />

obiecte (PDF şi documente Word, pachetele <strong>de</strong> instalare <strong>de</strong> software, fişiere audio şi vi<strong>de</strong>o) şi<br />

legături către pagini web şi obiecte din alte <strong>si</strong>te-uri. Proiectul construieşte o platforma <strong>de</strong> e-<br />

Learning în domeniu. Metadatele marine sunt colectate automat <strong>de</strong> la senzori <strong>si</strong> traduse în<br />

proprietăţi SMW. Ulterior, metadatele sunt verificate şi validate manual. Deşi proiectul<br />

importă diferite documente, el nu integrează metadate eterogene, care sunt <strong>de</strong> interes în<br />

abordarea noastră.<br />

Un punct <strong>de</strong> plecare comun cu abordarea noastră este [38], care îşi propune sa construiască o<br />

platformă <strong>de</strong> integrare a datelor. Structura <strong>de</strong> interoperabilitate este stratificată şi urmăreşte<br />

în<strong>de</strong>aproape mo<strong>de</strong>lul ISO / OSI pentru crearea <strong>de</strong> reţele. Ei folosesc ontologia mediator<br />

pentru mapare, cu toate acestea nu utilizează în mod explicit un flux <strong>de</strong> lucru pentru aceasta.<br />

Dimpotrivă, fluxul <strong>de</strong> lucru este susţinut <strong>de</strong> mediul BiomedGT [18]. Acest mediu extin<strong>de</strong><br />

Semantic MediaWiki pentru a sprijini roluri specifice în BiomedGT (<strong>de</strong> exemplu, IMM-uri,<br />

Alpha IMM-uri, curator, etc), procesele create fiind utilizate pentru susţinerea <strong>de</strong> propuneri <strong>de</strong><br />

proiecte şi pentru sugerarea modificărilor. În mod <strong>si</strong>milar, coefficientMakna [161] -, <strong>de</strong><br />

asemenea, bazat pe o platformă wiki - este conceput în mod explicit să sprijine platforma <strong>de</strong><br />

argumentare DILIGENT pentru ingineria ontologiei.<br />

În [126] autorii a propus o <strong>de</strong>scriere directă pentru protocolul <strong>de</strong> laborator biologic, <strong>de</strong>finind<br />

fără ajutorul codării menţinerea şi reutilizarea specificaţiilor protocolului laboratorului, având<br />

astfel rezultate clare, uşor <strong>de</strong> citit şi <strong>de</strong> menţinut.<br />

Apropiat şi mai mult cu munca noastră este [70]. Gill şi alţii utilizează Wings şi Pegasus<br />

pentru crearea <strong>de</strong> fluxuri <strong>de</strong> lucru pentru calculul in grid folo<strong>si</strong>nd reprezentari semantice. Ei<br />

folosesc şabloane <strong>de</strong> flux <strong>de</strong> lucru şi ontologii <strong>de</strong> flux <strong>de</strong> lucru exprimate în RDF. Principala<br />

diferenţă este contextul în care sunt utilizate fluxurile <strong>de</strong> lucru: calculul în grid şi nu<br />

gestionarea repo<strong>si</strong>tory.<br />

Deşi aceste lucrari au abordări <strong>si</strong>milare cu abordarea tezei, acestea acoperă doar parţial soluţia<br />

noastră. Aşa cum se va arăta pe parcursul tezei, am preluat, mixat şi flexibilizat părţi ale<br />

<strong>si</strong>stemului OAIS pe care l-am îmbogăţit cu facilitaţi semantice şi fluxuri <strong>de</strong> lucru automate.<br />

Am introdus suportului software-ului social pentru partajarea rezultatelor, a documentaţiei, a<br />

tratatelor şi politicilor dar şi ca suport pentru tehnologii semantice <strong>si</strong>mplificate: <strong>de</strong>scrierea<br />

fluxurilor <strong>de</strong> lucru, configurarea <strong>si</strong>stemelor, dispecerizarea proceselor <strong>de</strong> management,<br />

validarea metadatelor.<br />

16


3. STUDIU PRIVIND MODELELE<br />

DE REPOSITORY, BIBIOTECI<br />

DIGITALE ŞI SISTEMELE DE<br />

MANAGEMENT AL<br />

CONŢINUTULUI<br />

Acest capitol prezintă mai multe <strong>si</strong>steme care facilitează stocarea producţiei intelectuale -mai<br />

mult sau mai puţin structurate- a unei organizaţii sau comunităţi.<br />

Capitolul conţine un studiu al literaturii <strong>de</strong> specialitate pentru consolidarea terminologiei<br />

utilizate. Am efectuat două studii pe această temă, care duc la elucidarea managementului<br />

repo<strong>si</strong>tory digital, atingând şi problematica bibliotecilor digitale, şi (Semantic) Social<br />

Software-ul din două puncte <strong>de</strong> ve<strong>de</strong>re diferite.<br />

În primul rând, vom prezenta mo<strong>de</strong>lele <strong>de</strong> repo<strong>si</strong>tory digital şi vom i<strong>de</strong>ntifica principalele<br />

mo<strong>de</strong>le <strong>de</strong> referinţă care stau la baza implementările pentru bibliotecile digitale,<br />

constrângerile şi limitele acestora. În al doilea rând, am efectuat un studiu privind (Semantic)<br />

MediaWiki. În cele din urmă, vom analiza repo<strong>si</strong>tory-le digitale partajate şi beneficiile aduse<br />

<strong>de</strong> acestea.<br />

În mediile <strong>de</strong> informare mo<strong>de</strong>rne, există mai multe <strong>si</strong>steme pentru stocarea şi / sau extragerea<br />

materialelor. Având în ve<strong>de</strong>re funcţionalităţile <strong>si</strong>milare a diverselor <strong>si</strong>steme, <strong>de</strong>cizia <strong>de</strong> a plasa<br />

producţia intelectuală a instituţiei este a<strong>de</strong>sea una dificilă.<br />

CMS sau wiki-urilor nu oferă instrumente <strong>de</strong>dicate pentru a a<strong>si</strong>gura accesul continuu pentru<br />

<strong>de</strong>scoperire <strong>de</strong> noi resurse digitale caracteristic software-ul repo<strong>si</strong>tory-ului digital. De obicei,<br />

ele nu le oferă interfeţe OAIs. Facilităţile <strong>de</strong> import / export a metadatelor bibliografice sunt<br />

slabe sau inexistente.<br />

3.1. Principalele mo<strong>de</strong>le <strong>de</strong> repo<strong>si</strong>tory şi biblioteci digitale<br />

În afară <strong>de</strong> convergenţa <strong>de</strong> interese, gestionarea repo<strong>si</strong>tory digital constă dintr-un set puternic<br />

personalizabil <strong>de</strong> procese şi practici, în conformitate cu mo<strong>de</strong>lul <strong>si</strong>stemului <strong>de</strong> repo<strong>si</strong>tory,<br />

conţinutul repo<strong>si</strong>tory-lui şi <strong>de</strong> <strong>de</strong>stinaţia pe care comunitatea care îl utilizează şi doreşte să<br />

beneficieze din el a stabilit-o iniţial.<br />

Mo<strong>de</strong>le principale pentru repo<strong>si</strong>tory-le şi bibliotecile digitale sunt în general împărţite în<br />

următoarele categorii:<br />

A. Mo<strong>de</strong>le formale - 5S (Streams, Spaces, Structures, Scenarios, Society) este cel mai<br />

cunoscut mo<strong>de</strong>l formal <strong>de</strong> bibliotecă digitală [71]. Principalele caracteristici ale acestui<br />

mo<strong>de</strong>l sunt:<br />

o construcţii foarte generale<br />

o granularitatea prea fină la nivelul spaţiului<br />

o este concentrat asupra unei DL minime<br />

o calitatea metadatelor este abordată în alt strat<br />

o abordare comportamentală pentru serviciile oferite prin scenarii<br />

o doar o implementare cunoscută - Marian-framework.<br />

B. Mo<strong>de</strong>le <strong>de</strong> referinţă - Reference Mo<strong>de</strong>l for an Open Archival Information System (OAIS)<br />

[173]. Mo<strong>de</strong>le <strong>de</strong>rivate din OAIS sunt:<br />

a. Three Tier Framework Reference Mo<strong>de</strong>l - cunoscut şi sub numele <strong>de</strong> mo<strong>de</strong>lul Delos [29]; şi<br />

17


. CIDOC Conceptual Reference Mo<strong>de</strong>l [32].<br />

Acest mo<strong>de</strong>l este folo<strong>si</strong>t în principal pentru managementul repo<strong>si</strong>tory-ului în conformitate cu<br />

mo<strong>de</strong>lul producător-consumator, aşa cum este promovat <strong>de</strong> OAIS [173]. Principalele<br />

caracteristici sunt după cum urmează:<br />

• abordare mai pragmatică, privind funcţionalitatea la acelaşi nivel cu <strong>de</strong>scrierea<br />

entităţilor;<br />

• granularitatea este menţinută la nivel entitate<br />

• <strong>de</strong>scriere conceptelor principale şi relaţiilor care caracterizează întregul univers al unei<br />

DL<br />

• calitatea (metadate şi servicii), abordată în mod explicit pe acelaşi strat<br />

• servicii numite explicit<br />

• a<strong>si</strong>gurarea integrării documentaţiei<br />

• există mai multe implementari conforme cu mo<strong>de</strong>lul: Delos, DSpace [61], METS, etc<br />

C. Mo<strong>de</strong>l semantic <strong>de</strong> bibliotecă digitală. Acest mo<strong>de</strong>l se bazează pe mo<strong>de</strong>lul OAIS, dar<br />

permite granularităţi mai fine privind structura şi serviciile oferite utlizatorilor finali.<br />

• concentrat asupra adaptabilităţii şi serviciilor avansate folo<strong>si</strong>nd tehnologii semantice la<br />

mai multe niveluri.<br />

• perspective utilizator diferite şi foarte bine adresate<br />

• soluţie <strong>de</strong>-a gata, nu foarte uşor adaptabilă şi nu foarte uşor <strong>de</strong> utilizat pentru<br />

comunităţile mici.<br />

• o <strong>si</strong>ngură implementare "curată semantic" - JeromeDL [112].<br />

Aceste mo<strong>de</strong>le ating două extreme: formalizarea prea multă la mo<strong>de</strong>lul 5S, dar <strong>de</strong>scriere<br />

foarte bună la nivel structural, şi mo<strong>de</strong>lul Delos, nu foarte uşor adoptabil <strong>de</strong> către o<br />

comunitate mică şi mijlocie, având un nivel scăzut <strong>de</strong> expertiză tehnică.<br />

Este <strong>de</strong> subliniat faptul că gestionarea repo<strong>si</strong>tory-ului este cea mai mare parte o <strong>de</strong>cizie<br />

administrativă mediată <strong>de</strong> software. Mo<strong>de</strong>lul conţinutului repo<strong>si</strong>tory digital, a obiectelor<br />

digitale, producţia <strong>de</strong> fluxuri <strong>de</strong> lucru, mo<strong>de</strong>lul <strong>de</strong> rapoartare se stabilesc într-o abordare <strong>de</strong><br />

sus în jos.<br />

3.2. Sisteme <strong>de</strong> partajare a cunoştinţelor<br />

MediaWiki şi Semantic MediaWiki, ca exemple <strong>de</strong> <strong>si</strong>steme <strong>de</strong> explicite <strong>de</strong> colaborare în<br />

masă, (Mass Collaboration) sunt menite să partajeze cunoştinţele. Sociabilitatea centrată pe<br />

obiect (object-centred sociality) se referă la utilizarea în viaţa reală a <strong>si</strong>te-uri sociale:<br />

• utilizarea semanticii pentru a <strong>de</strong>scrie această utilizare, prin reprezentarea obiectelor<br />

centrat pe conectare puternică şi reutilizare;<br />

• <strong>de</strong>scrie oameni, reţele, conţinut, prezenţa, cunoştinţe, tag-uri, etc şi semantica acestora<br />

• interconectare <strong>si</strong>turilor disconecte şi a profilelor utilizator: beneficiază <strong>de</strong> o<br />

"vocabulary onion", a ontologiilor prin furnizarea <strong>de</strong> soluţii permiţând noi utilizări în<br />

cadrul organizaţiilor, nu doar pentru Web-ul social, dar chiar pentru Enterprise 2.0.<br />

Deşi cunoştinţele încorporate în interiorul unui wiki sunt uşor <strong>de</strong> accesat <strong>de</strong> către om, acest<br />

lucru însă <strong>de</strong>vine dificil pantru agenţii automaţi care trebuie să re-utilizeze şi să preia<br />

informaţii din wiki. Soluţiile cunoscute sunt după cum urmează:<br />

• utilizarea <strong>de</strong> template-uri;<br />

• structurarea informaţiilor wiki prin adoptarea tehnologii semantice <strong>si</strong>mplificate.<br />

Acest capitol mai prezintă un studiu actualizat pentru wiki-uri semantice, cu accent pe<br />

Semantic MediaWiki. Am ales SMW, <strong>de</strong>oarece prezintă o soluţie echilibrată care să permită<br />

adoptarea semanticii <strong>si</strong>mplificate. Am prezentat, <strong>de</strong> asemenea, o metodă hibridă <strong>de</strong> structurare<br />

a informaţiei wiki, care combină şabloane semantic, împreună cu metadatele pentru a permite<br />

fluxul <strong>de</strong> lucru automat pentru gestionarea repo<strong>si</strong>tory.<br />

18


Din punct <strong>de</strong> ve<strong>de</strong>re tehnologic, wiki-urile sunt profiluri <strong>de</strong> aplicaţie pentru un mo<strong>de</strong>l comun,<br />

mo<strong>de</strong>lul MediaWiki. Similar, wiki-urile semantice sunt profiluri <strong>de</strong> aplicaţie pentru un mo<strong>de</strong>l<br />

comun Semantic MediaWiki.<br />

Câteva caracteristici ale wiki-urilor semantice sunt amintit <strong>de</strong> mai jos:<br />

• semantica este introdusă ca informaţie suplimentară prin marcaje semantice adaugate<br />

manual <strong>de</strong> către utilizatori.<br />

• un utilizator poate marca atât link-uri cât şi text pe o pagină wiki.<br />

• informaţii speciale aşa cum sunt Categoriile şi Proprietatile sunt utilizate pentru a<br />

marca paginile wiki. Un utilizator nu este necesar să înţeleagă ontologii sau RDF<br />

pentru a putea adăuga marcaje semantice.<br />

• Utilizatorii pot adăuga noi categorii şi să creeze noi proprietăţi semantice, dar este<br />

intot<strong>de</strong>auna recomandata reutilizarea categoriile şi a proprietăţilor <strong>de</strong>ja existente.<br />

Informaţiile <strong>de</strong> marcare adăugate sunt utilizate <strong>de</strong> motorul wiki semantic pentru a facilita<br />

căutarea semantică. Există un limbaj special <strong>de</strong> căutare, facil <strong>de</strong> utilizat <strong>de</strong> către utilizatorul<br />

obişnuit.<br />

Capacitatea <strong>de</strong> căutare impre<strong>si</strong>onantă oferit <strong>de</strong> motorul wiki semantic poate fi cu greu egalată<br />

<strong>de</strong> orice alt <strong>si</strong>te wiki traditional, şi totul este rezultatul marcajului <strong>si</strong>mplu pe care utilizatorii<br />

doresc să îl adauge.<br />

3.3. Repo<strong>si</strong>tory-uri multimedia interne şi partajate<br />

Intens utilizate în achiziţia <strong>de</strong> cunoştinţe bazată pe inteligenţă calculatoarelor, repo<strong>si</strong>tory-ul<br />

partajat este cea mai bună completare a comunicării umane, educaţiei şi formării, care<br />

transce<strong>de</strong> constrângerile <strong>de</strong> timp şi spaţiu, oferind un răspuns în timp real şi o modalitate <strong>de</strong><br />

lucru în paralel. Este una din componentele <strong>de</strong> bază a spaţiilor colaborative, reducând foarte<br />

mult pier<strong>de</strong>rile cauzate <strong>de</strong> interacţiunea directă a personalului.<br />

Un wiki poate folo<strong>si</strong> imagini din propriul său repo<strong>si</strong>tory mass-media (intern) sau din alte<br />

repo<strong>si</strong>torye externe partajate <strong>de</strong> către mai mulţi consumatori. Pentru aceşti membrii ai familiei<br />

wiki, comunitatea poate crea, <strong>de</strong> asemenea, o a doua locaţie pentru fişierele provenite dintr-o<br />

sursă externă; cunoscută sub numele “shared uploads” sau arhivă comună. De exemplu, o<br />

companie poate avea mai multe <strong>si</strong>t-uri MediaWiki şi are nevoie <strong>de</strong> un repo<strong>si</strong>tory <strong>de</strong> imagini<br />

comune [183].<br />

Aceste repo<strong>si</strong>tory-uri pot a<strong>si</strong>gura <strong>de</strong> asemenea acces comun la baza <strong>de</strong> date<br />

Accesul la arhivele partajate este a<strong>si</strong>gurat printr-un acces la baze <strong>de</strong> date pentru repo<strong>si</strong>tory-ul<br />

local sau printr-un serviciu xml, bazate pe API-uri web pentru un repo<strong>si</strong>tory la distanţă. Multe<br />

<strong>si</strong>te-uri wiki, numite “ferme wiki”, pot să partajeze un repo<strong>si</strong>tory local. Un unoscut repo<strong>si</strong>tory<br />

media acce<strong>si</strong>bil prin intermediul API este Wikimedia Commons 2 .<br />

La sfârşitul acestui capitol, sunt menţionate mai multe cazuri <strong>de</strong> utilizare şi aplicabilitate care<br />

folosesc SMW. Următorul capitol va prezenta un mo<strong>de</strong>l nou pentru gestionarea colaborativă a<br />

repo<strong>si</strong>tory digital, arhitectura <strong>si</strong> meto<strong>de</strong> rezumate aici ca profilurile <strong>de</strong> aplicaţii:<br />

• O platformă <strong>de</strong> authoring şi publicare on-line [78]<br />

• Utilizarea <strong>de</strong> şabloane MediaWiki ca formular invariant pentru implicarea<br />

utilizatorilor non-tehnici în întregul proces <strong>de</strong> gestionare a conţinutului digital [183]<br />

• Utilizarea mo<strong>de</strong>lului Semantic MediaWiki pentru gestionarea metadatelor în interiorul<br />

wiki [184].<br />

2 http://commons.wikimedia.org/<br />

19


4. UN MODEL CADRU<br />

CONCEPTUAL PENTRU<br />

MANAGEMENTUL<br />

COLABORATIV AL UNUI<br />

REPOSITORY DIGITAL<br />

Acest capitol prezintă un nou mo<strong>de</strong>l al ciclului <strong>de</strong> viaţă al obiectului digital gestionabil prin<br />

noul concept <strong>de</strong> management colaborativ al unui repo<strong>si</strong>tory digital.<br />

În acest capitol vom colecta şi analiza cerinţele pentru mo<strong>de</strong>lul <strong>de</strong> management al repo<strong>si</strong>toryului<br />

digital (DRMM). În scopul <strong>de</strong> a sprijin diferitele cazuri <strong>de</strong> utilizare al noului concept <strong>de</strong><br />

management colaborativ al repo<strong>si</strong>tory-ului <strong>de</strong> metadate, vor fi introduse meto<strong>de</strong> care permit<br />

individualizarea în arhitecturi şi implementări concrete.<br />

Diagrama <strong>de</strong> mai jos <strong>de</strong>scrie procesul incremental şi crescător <strong>de</strong> dobândirea a cunoştinţelor şi<br />

<strong>de</strong> partajare a acestora în epoca Web 2.0. Acest proces presupune implicarea în egală măsură<br />

a indivizilor şi a comunităţii din care aceştia fac parte. Ei vor transfera cunoştinţe la mai multe<br />

niveluri. Fiecare participant este atât producător cât şi consumator, dar nu numai atât. Acest<br />

pas, <strong>de</strong> la mo<strong>de</strong>lul <strong>de</strong> producător-consumator (unu-la-mai-mulţi) la mo<strong>de</strong>lul crează–<br />

remixează–partajează (mai-multe-la-mai-mulţi), modifică, <strong>de</strong> asemenea, toate aspectele legate<br />

<strong>de</strong> gestionarea conţinutului [128]. Aspecte legate <strong>de</strong> granularitatea conţinutului, tipologia<br />

conţinutului şi a metadatelor, trebuie să fie reexaminate şi gestionate colaborativ. Următoarea<br />

diagramă ilustrează dobândirea <strong>de</strong> cunoştinţe prin mo<strong>de</strong>lul cu partajare care este bidirecţional.<br />

Aceste observaţii stau la baza abordării noastre pentru mo<strong>de</strong>lul <strong>de</strong> management<br />

colaborativ al unui repo<strong>si</strong>tory digital.<br />

Figure 4. 1. Dobândirea <strong>de</strong> cunoştinţe prin mo<strong>de</strong>lul crescător cu partajare<br />

4.1. Scenarii <strong>de</strong> utilizare<br />

Să con<strong>si</strong><strong>de</strong>răm următoarele două scenarii ca şi cazuri <strong>de</strong> utilizare:<br />

20


Primul scenariu vizează un proiect în domeniul biodiver<strong>si</strong>tăţii menit să ducă la îmbunătăţirea<br />

<strong>de</strong>scoperirii instrumentelor <strong>de</strong> i<strong>de</strong>ntificare a biodiver<strong>si</strong>tăţii şi a resurselor digitale disponibile.<br />

Metoda <strong>de</strong> cercetare nece<strong>si</strong>tă construirea unui repo<strong>si</strong>tory digital central <strong>de</strong> metadate pentru a<br />

facilita accesul, utilizarea şi re-utilizare a resurselor digitale. În plus, partenerii îşi propun să<br />

atragă alte surse <strong>de</strong> metadate, din colecţii private şi publice sau din Wikimedia Commons,<br />

Flicr sau alte surse multimedia partajate în web. Scopul final este <strong>de</strong> a construi un repo<strong>si</strong>tory<br />

<strong>de</strong> eLearning în biologie.<br />

Consorţiul intenţionează să menţină repo<strong>si</strong>tory-ul <strong>de</strong> metadate după finalizarea proiectului şi<br />

după ce sprijinul financiar va scă<strong>de</strong>a în mod substanţial. Prin urmare, pentru a sprijini<br />

infrastructura proiectului a fost con<strong>si</strong><strong>de</strong>rată obligatorie construirea unei platforme <strong>de</strong><br />

documentare comune pentru publicarea problemelor tehnice şi pentru managementul<br />

proiectului.<br />

Resursele digitale sunt distribuite într-un număr <strong>de</strong> surse – la furnizorii <strong>de</strong> date, şi au un grad<br />

ridicat <strong>de</strong> eterogenitate tehnică, în format, structura şi semantică. Decizia finală a fost <strong>de</strong> a<br />

stoca centralizat doar metadatele, iar resursele multimedia să rămână în continuare pe<br />

<strong>si</strong>stemele locale ale furnizorilor <strong>de</strong> metadate.<br />

Furnizorii <strong>de</strong> date sunt muzee, instituţii <strong>de</strong> cercetare în biologie şi univer<strong>si</strong>tăţi. Ei sunt, <strong>de</strong><br />

asemenea, utilizatorii finali, împreună cu profesori <strong>de</strong> biologie pentru liceu, elevi şi stu<strong>de</strong>nţi.<br />

Cerinţele menţionate anterior au fost acompaniate şi <strong>de</strong> probleme tehnice şi organizatorice:<br />

nivelul <strong>de</strong> expertiză tehnică a variat <strong>de</strong> la inginer IT la biolog <strong>si</strong> fotograf.<br />

Figure 4. 2. Procesul <strong>de</strong> integrare a metadatelor în repo<strong>si</strong>tory-ul digital central.<br />

In al doilea scenariu, Chris, un istoric, doreşte să construiască un mediu virtual <strong>de</strong> cercetare<br />

(VRE), având ca subiect istoria educaţiei. Este necesar să se preconizeze o solutie web pentru<br />

cercetători, care să faciliteze adnotarea colaborarativă a corpusului cu o infrastructură care să<br />

permită integrarea instrumentelor externe, analizarea datelor şi publicarea rezultatelor<br />

cercetării.<br />

În primul rând, se intenţionează să se creeze infrastructura <strong>de</strong> VRE pentru integrarea surselor<br />

externe într-o platformă web colaborativă. Principalii furnizori ai viitorului VRE sunt<br />

bibliotecile digitale, proprietarii legali ai corpusurilor - lexicoane în istoria învăţământului –<br />

sub format digital. Paginile lexicoanelor (lemma) sunt reprezentate <strong>de</strong> imagini; capitole<br />

lexicoanelor sunt înregistrări <strong>de</strong> metadata iar înregistrările sunt agregate în volume. Fiecare<br />

lexicon este reprezentat în bibliotecă digitală <strong>de</strong> o colecţie digitală.<br />

Construcţia arhitecturii mo<strong>de</strong>lului DRM este, prin urmare, o combinaţie <strong>de</strong> părţi a diferitelor<br />

mo<strong>de</strong>le: (1) cerinţele şi obiectivele DRM prin viziunea mo<strong>de</strong>lului <strong>de</strong> bu<strong>si</strong>ness (mo<strong>de</strong>l <strong>de</strong> flux<br />

<strong>de</strong> lucru), (2) din studierea ghidului <strong>de</strong> funcţionalităţile (forward engineering), şi (3)<br />

specificaţiile <strong>de</strong> servicii ale implementărilor existente (reverse engineering), (4) extrase din<br />

abordările <strong>si</strong>milare din literatură, (5) feedback-ul utilizatorilor. Soluţia este combinarea<br />

primele trei surse într-un mo<strong>de</strong>l <strong>de</strong> referinţă complet şi o arhitectură concretă. Părţile comune<br />

între mo<strong>de</strong>le ne dau încre<strong>de</strong>re în convergenţa abordării noastre. Astfel, arhitectura reprezintă o<br />

abordare comună a tuturor părţilor implicate şi poate fi văzută ca o “foaie <strong>de</strong> parcurs” în<br />

ve<strong>de</strong>rea realizării DRM. În următoarele secţiuni vom prezenta câteva dintre cerinţele pe care<br />

21


am con<strong>si</strong><strong>de</strong>rat ca fiind <strong>de</strong>osebit <strong>de</strong> reprezentative pentru stabilirea mo<strong>de</strong>lului <strong>de</strong> DRM, şi<br />

astfel vom releva o listă <strong>de</strong> functionalitaţi noi extrase din aceste scenarii.<br />

Table 4.1. Centralizarea cerinţelor şi alinierea acestora<br />

Cod Nume Cerinţele<br />

utilizatorilor<br />

W01. Interfaţă utilizator<br />

intuitivă<br />

W02. Suport pentru<br />

feedback.<br />

W03. Funcţionalitate <strong>de</strong><br />

punere la zi facilă<br />

W04. Granularitate fină a<br />

informaţiei.<br />

W05. Suport pentru<br />

documentaţie şi<br />

ghiduri online<br />

22<br />

Cerinţele<br />

repo<strong>si</strong>tory digital<br />

U05 R01 C08<br />

U07<br />

W06. Multilingualism U06<br />

W07. Conţinut admiţând<br />

linkuri incrucişate<br />

W08. Integrarea cu alte<br />

CMS sau aplicatii<br />

Semantic Web<br />

W09. I<strong>de</strong>ntificatori<br />

per<strong>si</strong>stenţi<br />

W10. Funcţionalitate <strong>de</strong><br />

căutare intuitivă<br />

U03, U05, U09<br />

U01, U04 C01<br />

U09 C08<br />

U03 C02<br />

U09 R04, R05, R08,<br />

R09<br />

Cerinţele unui<br />

<strong>si</strong>stem <strong>de</strong><br />

semantic content<br />

management<br />

C03<br />

R07 C04<br />

U03 R02 C05<br />

W11. Navigare facilă U03 C06<br />

W12. Gra<strong>de</strong> diferite <strong>de</strong><br />

formalizare a<br />

informaţiei<br />

W13. Urmărirea<br />

modificărilor şi<br />

controlul ver<strong>si</strong>unii<br />

W14. Managementul<br />

drepturilor <strong>de</strong><br />

acces.<br />

W15. Acces <strong>de</strong>schis la<br />

obiecte.<br />

W16. Separarea datelor<br />

<strong>de</strong> metadate.<br />

U01, U02 C06<br />

U07, U08 R07 C10<br />

U05 R01 C09<br />

U05, U07 R01 C05<br />

U02 R03, R10 C06


4.2. Descrierea mo<strong>de</strong>lelui <strong>de</strong> referinţă propus<br />

4.2.1. Metodologia<br />

Obiectivul este <strong>de</strong> a gestiona colaborativ un repo<strong>si</strong>tory cu facilităţi semantice. Repo<strong>si</strong>tory-ul<br />

semantic va fi folo<strong>si</strong>t pentru a gestiona, integra şi <strong>de</strong> a crea arhitecturi din mai multe surse şi<br />

pentru utilizarea instrumentelor bazate pe diferite limbaje şi tehnologii. Ipo<strong>teza</strong> <strong>de</strong> cercetare<br />

nu susţine că mo<strong>de</strong>lul semantic <strong>de</strong> repo<strong>si</strong>tory şi <strong>de</strong> infrastructură vor fi necesare sau potrivite<br />

pentru toate cazurile <strong>de</strong> utilizare. În acest scop, repo<strong>si</strong>tory-ul semantic trebuie să fie capabil <strong>de</strong><br />

a trata cu arhitecturi exprimate în diferit limbaje <strong>de</strong> mo<strong>de</strong>lare şi expre<strong>si</strong>i idiomatice. Limbajele<br />

pentru proiectarea arhitecturilor sunt: UML, OWL, BPMN, RDFS şi XML, precum şi alte<br />

unelte în format propriu.<br />

Repo<strong>si</strong>tory-ul digital cu comportament semantic este necesar pentru a înţelege semantica<br />

încorporată în diverse arhitecturi exprimate folo<strong>si</strong>nd aceste formalisme şi a facilita o viziune<br />

comună coerentă a mo<strong>de</strong>lului <strong>de</strong> bu<strong>si</strong>ness.<br />

Pentru atingerea interoperabilităţii semantice este necesară o infrastructură <strong>de</strong> legatură care<br />

nece<strong>si</strong>tă o abordare MDA sau RDFS, sau ambele. Datorită intenţiei <strong>de</strong> mediere a acestor<br />

infrastructuri (cerinţa <strong>de</strong> bi-directionalitate a interfeţei cu <strong>si</strong>stemele din ambele medii pe care<br />

le leagă) şi în ambele sensuri (arhitectura ar trebui să admită inversă), mo<strong>de</strong>lul <strong>de</strong> referinţă<br />

poate fi folo<strong>si</strong>t din oricare punct <strong>de</strong> ve<strong>de</strong>re. RDFS este selectat ca fiind "limbaj <strong>de</strong> bază" şi iar<br />

MDA ca limbaj <strong>de</strong> mapare.<br />

Această nouă abordare prezentată în cele ce urmează îşi propune să combine ontologii şi<br />

fluxuri <strong>de</strong> lucru pentru protocoalele formalizate utilizate în managementul repo<strong>si</strong>tory.<br />

Fluxurile <strong>de</strong> lucru permit o reprezentare intuitivă a protocoalelor şi a resurselor. Specificaţiile<br />

fluxul <strong>de</strong> lucru pot fi stocate ca pagini wiki şi partajate în mod dual:<br />

1. reprezentare RDF şi mecanismul <strong>de</strong> şabloane SMW, şi<br />

2. limbajul standard XPDL prin exten<strong>si</strong>a Wikiing Pro Exten<strong>si</strong>on [47] (reprezentare<br />

grafică în BPMN).<br />

Prin intermediul ontologiilor, cunoştinţele referitoare la managementul repo<strong>si</strong>tory-ului digital<br />

pot fi direct integrate în mo<strong>de</strong>lul fluxului <strong>de</strong> lucru şi partajate utilizând mo<strong>de</strong>lul standard<br />

OWL, Web Ontology Language. În acest mod, constrângerile precis <strong>de</strong>finite în ontologii sunt<br />

transferate către blocurile <strong>de</strong> protocol (tasks sau actions). Protocoale pentru diferitele scenarii<br />

şi cazuri <strong>de</strong> utilizare sunt lip<strong>si</strong>te <strong>de</strong> ambiguitate folo<strong>si</strong>nd vocabularului comunităţii, şi astfel<br />

acţiunile importante sunt i<strong>de</strong>ntificate cu precizie.<br />

Ontologiile formale prezintă limitări atunci când <strong>de</strong>scriu protocoale. Structura modulară a<br />

proceselor <strong>de</strong> gestionare a repo<strong>si</strong>tory-ului nu este bine i<strong>de</strong>ntificată, iar acest lucru nu poate<br />

facilita refolo<strong>si</strong>rea <strong>de</strong> "blocuri <strong>de</strong> construcţie".<br />

Metoda <strong>de</strong> bază în managementul colaborativ al repo<strong>si</strong>tory-ului digital extin<strong>de</strong> mo<strong>de</strong>lul <strong>de</strong><br />

flux <strong>de</strong> lucru flexibil expus în [189] şi se bazează pe două mecanisme: şabloane wiki <strong>si</strong><br />

ontologia fluxului <strong>de</strong> lucru.<br />

În primul rând, mai multe tipuri şablon “recoltabil” au fost <strong>de</strong>zvoltate, având funcţionalităţi<br />

diferite, dar care vizează acelaşi obiectiv general: integrarea metadatelor. Fiecare tip <strong>de</strong> şablon<br />

recoltabil a fost <strong>de</strong>zvoltat ca o resursă şi are ataşat un şablon <strong>de</strong> flux <strong>de</strong> lucru. Ambele obiecte<br />

se stochează în stratul Mediator [183].<br />

În contrast cu structura binară utilizată pentru concepte şi indivizi, şabloanele sunt<br />

caracterizate printr-un triplet format în care elementul central este un predicat, şi anume, un<br />

nume <strong>de</strong> relaţie, care există între unul sau mai multe argumente introduse prin intermediul<br />

rolurilor. Formatul general al şablonului abstract este următorul:<br />

(Pi (R1 a1) (R2 a2)... (Rn an))<br />

În expre<strong>si</strong>a anterioară, Pi <strong>de</strong>notă o etichetă care <strong>de</strong>fineşte un şablon predicativ, Rk, k = 1,...,n,<br />

<strong>de</strong>fineşte <strong>si</strong>mbolic rolurile, iar ak, k = 1,...,n, <strong>de</strong>finesc <strong>si</strong>mbolic argumentele.<br />

23


Instanţele (ca evenimente predicative) din şabloanele predicative reprezintă evenimente unice,<br />

specifice, şi sunt în domeniul componentei factuale.<br />

Această abordare recon<strong>si</strong><strong>de</strong>ră rezultatul din [147], care stipulează faptul că clasele<br />

restricţionate <strong>de</strong> şabloane corespund cu tipul <strong>de</strong> gramatici Chomsky 1-3: senzitive la context,<br />

libere <strong>de</strong> context, şi regulate. O teoremă <strong>de</strong>mnonstrată <strong>de</strong> Parr afirmă că: şabloanele regulate<br />

generează limbaje regulate.<br />

De obicei, şabloanele operează cu un set <strong>de</strong> atribute. Atributele sunt văzute ca terminale<br />

(vocabulare) ale unei gramatici generative iar şabloanele sunt regulile <strong>de</strong> producţie. De<br />

exemplu, pentru XML <strong>de</strong>finiţiile tipului <strong>de</strong> document (DTD-uri) sunt, în esenţă gramatici<br />

libere <strong>de</strong> context, şi prin urmare, un şablon cu caracteristicile unei gramatici libere <strong>de</strong> context<br />

poate genera orice document XML <strong>de</strong>finibile printr-un DTD. Un motor <strong>si</strong>mplu pentru<br />

randarea unui şablon care emulează un automat “push-down” poate genera automat<br />

documente XML, şi astfel impune separarea strictă a mo<strong>de</strong>lului şi interfaţă [147].<br />

A doua componentă este o ontologie, numită ontologia fluxului <strong>de</strong> lucru [183], care reprezintă<br />

relaţiile între fluxurile <strong>de</strong> lucru, resurse şi utilizatori. Metoda combină mo<strong>de</strong>lul pentru<br />

managementul fluxului <strong>de</strong> lucru cu mo<strong>de</strong>lul <strong>de</strong> şablon pentru interoperabilitate. Utilizatorii,<br />

mesajele, şabloanele, metadatele sunt resurse.<br />

Un mo<strong>de</strong>l <strong>de</strong> flux <strong>de</strong> lucru poate fi privit din patru perspective, şi anume, controlul fluxului,<br />

fluxul <strong>de</strong> date, mo<strong>de</strong>lul organizaţional, şi constrângerile fluxului <strong>de</strong> lucru.<br />

Fluxul <strong>de</strong> control captează perspectiva structurală a fluxului <strong>de</strong> lucru şi se referă la ordinea <strong>de</strong><br />

executare a sarcinilor.<br />

Fluxul datelor <strong>de</strong>scrie elementele <strong>de</strong> date care sunt consumate, produse şi transferate <strong>de</strong> către<br />

activităţi şi construcţiile <strong>de</strong> direcţionare şi <strong>de</strong>pen<strong>de</strong>nţele lor. Ele sunt resurse <strong>de</strong> intrare-ieşire.<br />

Mo<strong>de</strong>lul organizaţional <strong>de</strong>fineşte fluxul <strong>de</strong> lucru asociat resurselor, cum ar fi utilizatorii,<br />

rolurile, unităţile organizatorice şi aplicaţii, precum şi relaţiile dintre ele.<br />

Figure 4. 3. Reprezentarea fluxului <strong>de</strong> lucru ca graf.<br />

Diagrama <strong>de</strong> mai sus prezintă o schemă <strong>si</strong>mplă a flux <strong>de</strong> lucru reprezentat sub forma unui<br />

graf. Fluxul <strong>de</strong> lucru este con<strong>si</strong><strong>de</strong>rat valid dacă şi numai dacă poate fi stabilită o relaţie <strong>de</strong><br />

mapare (din punct <strong>de</strong> ve<strong>de</strong>re <strong>si</strong>ntactic şi semantic) între fluxului <strong>de</strong> control <strong>de</strong> intrare şi <strong>de</strong><br />

ieşire a componentelor aferente. În mod <strong>si</strong>milar, aceleaşi tipuri <strong>de</strong> relaţii <strong>de</strong> mapare se vor<br />

stabili şi pentru fluxurile <strong>de</strong> date.<br />

24


Constrângerile fluxul <strong>de</strong> lucru servesc ca hub care conectează cele trei perspective menţionate<br />

mai sus prin specificarea <strong>de</strong> norme pentru executarea fluxului <strong>de</strong> lucru, cum ar fi normele <strong>de</strong><br />

rutare pentru nodurile <strong>de</strong> ramificare, atribuirea <strong>de</strong> resurse (şabloanele, fişiere <strong>de</strong> intrareieşire),<br />

şi alocarea elementele <strong>de</strong> date către activităţi.<br />

În continuare prezentăm mo<strong>de</strong>lul metadatelor pentru fluxul <strong>de</strong> lucru după cum urmează:<br />

Message = {Msg#, Msg, replyMsg}<br />

Document = {Doc#, Abstract, DocType, Doc}<br />

MetadataTemplate = {MetTemp#, Rules}<br />

Task = {Task#, User, Msg#, Doc#, ClientApps, InvokedApps, DispatchingRules,<br />

InputParameters, OutputParameters}<br />

TaskInstance = {TaskIns#, Task#}<br />

WorkflowTemplate = {WfTemp#, Task#, Tran<strong>si</strong>tion-Rules, MetTemp#}<br />

WorkflowInstance = {WfIns#, User, WfTemp#, OutputReport#}<br />

Figure 4. 4. Ontologia fluxului <strong>de</strong> lucru<br />

Ontologia aplicaţiei <strong>de</strong>fineşte precis semantica pentru activităţile referitoare la managementul<br />

repo<strong>si</strong>tory, în timp ce fluxurile <strong>de</strong> lucru sunt, în principal concepute pentru a le orchestra.<br />

I<strong>de</strong>ea a pornit <strong>de</strong> la mo<strong>de</strong>lul general care foloseşte ontologia fluxului <strong>de</strong> lucru şi care poate fi<br />

formalizat ca în figura [4. 5.].<br />

Mo<strong>de</strong>lul rafinează nivelurile <strong>de</strong> abstracţie în care fluxurile <strong>de</strong> lucru pot fi <strong>de</strong>finite, [173]<br />

introducând un strat <strong>de</strong> mediator <strong>de</strong> mapare, având mo<strong>de</strong>lul <strong>de</strong> software social ca suport.<br />

Acesta este nivelul <strong>de</strong> abstractizare care susţine managementul fluxului <strong>de</strong> lucru, monitorizare<br />

şi control. Deşi pare mai <strong>de</strong>grabă un mo<strong>de</strong>l tipic <strong>de</strong> flux <strong>de</strong> date, mo<strong>de</strong>lul este o <strong>si</strong>mplă<br />

adoptarea a unui mo<strong>de</strong>l hibrid adaptând limbjul folo<strong>si</strong>t <strong>de</strong> fluxul <strong>de</strong> date cu construcţii limitate<br />

tranzacţionale <strong>de</strong> control. Această abordare are cele mai bune şanse <strong>de</strong> a fi interoperabilă cu<br />

cele mai multe unelte şi platforme pentru ducerea la bun sfârşit a scopului tezei.<br />

Multe din elementele ontologiei aplicaţiei sunt adoptate din ontologia repo<strong>si</strong>tory digital, aşa<br />

cum sunt <strong>de</strong>finite în mo<strong>de</strong>lul 5Ss. Aceste elemente sunt transferate către clasa "Process" ca<br />

blocuri <strong>de</strong> component (taskuri) ale <strong>de</strong> fluxuri <strong>de</strong> lucru, şi folo<strong>si</strong>rea vocabularului repo<strong>si</strong>toryului<br />

ca parametri pentru procese (<strong>de</strong> exemplu obiecte digitale, colecţii). Procesele sunt<br />

executate folo<strong>si</strong>nd un set <strong>de</strong> instrumente specifice (variind <strong>de</strong> la wiki editor la aplicaţii<br />

personalizate <strong>de</strong>zvoltate special), pentru execuţia intregului protocol.<br />

25


Se foloseşte indirect un standard disponibil în cadrul comunităţii fluxului <strong>de</strong> lucru: notarea<br />

BPMN şi serializarea sa XPDL prin exten<strong>si</strong>a Semantic MediaWiki Process Exten<strong>si</strong>on Editor<br />

[47], care, la rândul său, pune în aplicare un plugin către editorul Oryx 3. Această exten<strong>si</strong>e se<br />

bazează pe capacitatea <strong>de</strong> interogare a proprietăţilor semantice care este furnizată <strong>de</strong> Semantic<br />

MediaWiki, şi afişează aceste rezultatele interogării ca un proces grafic. Interogarea adaugă o<br />

po<strong>si</strong>bilitate <strong>de</strong> formatare a rezultatului special SMW care transformă rezultatul interogării<br />

unui proces în limbaj GraphViz DOT şi returnează graficul procesului corespunzător creat cu<br />

DOT.<br />

O altă abordare semantică pentru formalizarea fluxului <strong>de</strong> lucru, complementar cu acesta este<br />

folo<strong>si</strong>rea conceptului <strong>de</strong> mo<strong>de</strong>lare a procesului şi este <strong>de</strong>rivat din reţele Petri. În această<br />

abordare, luăm procesele formalizate în RDF, le transforma în reţele <strong>si</strong>mple Petri şi le<br />

utilizăm într-un motor <strong>de</strong> execuţie <strong>de</strong> proces. Utilizatorii le pot apoi modifica fie prin paginile<br />

Wiki care conţin şabloanele sau direct modificând mo<strong>de</strong>lul procesului.<br />

Pentru <strong>de</strong>scrierea fluxlui <strong>de</strong> lucru, ne bazăm pe caracteristica SMW <strong>de</strong> a forma o ontologie<br />

<strong>si</strong>mplificată dat fiind crearea paginilor în semantic wiki. Am combinat această caracteristică<br />

cu şabloanele wiki semantice pentru a reprezenta <strong>de</strong>scrierea fluxului <strong>de</strong> lucru. Fiecare<br />

activitate poate fi reprezentată <strong>de</strong> o pagină wiki semantică. În acest fel, întreaga ontologie<br />

poate fi împărţită în componente (a se ve<strong>de</strong>a figura 4. 4).<br />

Apoi am urmat i<strong>de</strong>ea <strong>de</strong> a lega cele două meta-mo<strong>de</strong>le, XPDL şi ontologia SMW, pentru a<br />

stabili corespon<strong>de</strong>nţe semantice între elemente respective. Decizia <strong>de</strong> a folo<strong>si</strong> serializarea<br />

XPDL nu este obligatorie. În loc <strong>de</strong> XPDL (care este un standard), un şablon wiki şi<br />

serializarea XML pentru şablon poat juca acelaşi rol. Construcţii ca Action şi Application pot<br />

fi emulate prin şabloane wiki şi proprietăţi semantice.<br />

XPDL poate fi con<strong>si</strong><strong>de</strong>rat ca făcând parte din meta-mo<strong>de</strong>lul <strong>de</strong>finit în XSD, care este metameta-mo<strong>de</strong>lelul<br />

său. Prin urmare, construcţiile limbajului XPDL inclu<strong>si</strong>v Application şi<br />

Activity, aparţin nivelului M2. În M1 am plasat <strong>de</strong>finiţiile <strong>de</strong> Application şi invocarea şi<br />

instanţe <strong>de</strong> Activity. O activitate reprezintă o acţiune care se va realiza printr-o combinaţie <strong>de</strong><br />

resurse şi / sau a aplicaţiilor informatice. Definiţia <strong>de</strong> aplicare reflectă interfaţa care trebuie să<br />

fie utilizate pentru a apela serviciile specifice executate <strong>de</strong> respective activitate, inclu<strong>si</strong>v<br />

parametrii <strong>de</strong> apelare.<br />

Al doilea meta-mo<strong>de</strong>l este SMW care are OWL ca meta-meta-mo<strong>de</strong>l.<br />

Prin urmare, în SMW categoriile şi subcategoriile <strong>de</strong> proces sunt abstractii ale Action <strong>de</strong><br />

asemenea. Ca urmare a acestei interpretări, Categoriile şi instanţele din Subcategorii, aparţin<br />

nivelului M1. Deoarece SMW şi XPDL sunt ambele plasate la nivelul M2, am aplicat o<br />

transformare mo<strong>de</strong>l la mo<strong>de</strong>l din meta-mo<strong>de</strong>lul SMW la meta-mo<strong>de</strong>lul XPDL care permite<br />

integrarea lor.<br />

Meto<strong>de</strong>le OOP, <strong>de</strong>finiţia şi invocarea lor, aparţin nivelului M1, întrucât regulile gramaticale<br />

aplicate pentru a scrie meto<strong>de</strong>le sunt plasate la nivelul M2. Instanţe ale clasei Process pot fi<br />

con<strong>si</strong><strong>de</strong>rate ca meto<strong>de</strong> şi clasa Process ca meta-metodă, <strong>de</strong>oarece acesta <strong>de</strong>scrie ceea ce este o<br />

metodă. Stabilirea unei relaţii între clase SMW şi aplicaţiile XPDL permit integrarea<br />

semantică a ontologiei în fluxurile <strong>de</strong> lucru.<br />

Datorită naturii versatile a SMW, fiecare categorie corespun<strong>de</strong> unei clase <strong>de</strong> ontologie, dar în<br />

acelaşi timp, reprezintă şi o instanţă a ontologiei, fiind, <strong>de</strong> asemenea, o pagină wiki.<br />

Proprietăţile semantice (aparţin owl: DatatypeProperty), specifica tipurile disponibile <strong>de</strong><br />

parametri. Ierarhiile <strong>de</strong> categorii pot să conţină direct obiecte care pot fi manipulate prin<br />

acţiuni; şi valorile scalare, care pot fi apelate <strong>de</strong> acţiuni. Procesele pot fi <strong>de</strong>scrise prin<br />

utilizarea unei combinaţii <strong>de</strong> şabloane semantice, proprietăţi, paginile wiki şi vocabulare<br />

controlate.<br />

Prin urmare, mo<strong>de</strong>lul SMW suportă ambele nivelule <strong>de</strong> abstractizare în care fluxurile <strong>de</strong> lucru<br />

pot fi <strong>de</strong>finite: şablonul <strong>de</strong> flux <strong>de</strong> lucru şi instanţă fluxului <strong>de</strong> lucru. Exten<strong>si</strong>ile SMW RDF<br />

3 Oryx web-based Bu<strong>si</strong>ness Process Editor http://co<strong>de</strong>.google.com/p/oryx-editor/<br />

26


import / export, adaugă un nivel intermediar <strong>de</strong> mapare între ontologia SMW, ontologia<br />

fluxului <strong>de</strong> lucru şi motorul <strong>de</strong> execuţie. O relaţie poate fi stabilită între instanţele <strong>de</strong> Action<br />

(pagini wiki) şi Application.<br />

În cazul <strong>de</strong> utilizare a serializării XPDL, un mecanism <strong>de</strong> translaţie oferă un set <strong>de</strong> construcţii<br />

Application XPDL apelabile prin activităţi blocurilor <strong>de</strong> flux <strong>de</strong> lucru. Aplicaţiile invocate<br />

impun specificarea completă a parametrilor formali ai acestora. Fişierele <strong>de</strong> date, ca resurse<br />

pot fi reprezentate grafic în fluxul <strong>de</strong> lucru (compatibilitate BPMN) şi / sau reprezentarea pe<br />

baza şabloanelor.<br />

Figure 4. 5. Exemplu <strong>de</strong> sablon <strong>de</strong> flux <strong>de</strong> lucru reprezentat prin MediaWiki Process Exten<strong>si</strong>on<br />

Editor<br />

În exemplul <strong>de</strong> mai sus este prezentată o <strong>de</strong>scriere a şablonului <strong>de</strong> flux <strong>de</strong> lucru utilizând<br />

reprezentarea grafică în paginile wiki. Uneltele sunt reprezentate ca Roluri (adică Ingest Tool,<br />

Wiki Editor). Resursele sunt <strong>de</strong>scrise prin folo<strong>si</strong>rea icoanei "fol<strong>de</strong>r". Procesul este <strong>de</strong>scries în<br />

etape cu ajutorul sub-proceselor ca pagini wiki. Unul dintre aceste procese este reprezentat,<br />

după cum urmează:<br />

{{Process Step<br />

|Belongs to process=Workflow Template<br />

|has Role= Harvesting Tool<br />

|has Successor = Process Metadata<br />

|uses Resource = Configuration File.xml<br />

}}<br />

The process starts with Input Collection into Wiki.<br />

27


Tool support:<br />

* wiki<br />

* wiki template syntax<br />

* Metadata Exchange Agreement<br />

Un mechanism <strong>de</strong> translaţie permite reprezentarea şablonului <strong>de</strong> flux <strong>de</strong> lucru direct în<br />

paginile SMW prin exten<strong>si</strong>a RDF import/export. Pentru reprezentarea grafică ca în figura <strong>de</strong><br />

mai sus, se utilizează <strong>de</strong> asemenea şabloane wiki combinate cu interogări semantice.<br />

Infrastructura <strong>de</strong> metadate este hub-ul în care capacităţile diferite ale repo<strong>si</strong>tory-ului semantic<br />

se integrează. Aceasta inclu<strong>de</strong> <strong>si</strong>ncronizare în ambele sensuri, cu sursele externe <strong>de</strong> informaţii<br />

- mo<strong>de</strong>le, arhitecturi, ontologii, cerinţe, procese, etc - <strong>de</strong>finirea entităţilor şi modul în care<br />

aceasta funcţionează, ca şi în următoarea diagramă.<br />

Figure 4. 6. Mo<strong>de</strong>lul <strong>de</strong> referinţă şi arhitecturile concrete<br />

28


Metadatele joacă rol dublu în abordarea noastră: ele au rol <strong>de</strong> resurse (repo<strong>si</strong>tory este în<br />

primul rând cel care conţine metadate), şi rol comportamental - acestea fiind utilizate şi <strong>de</strong><br />

care instrumente pentru a-şi în<strong>de</strong>plini mi<strong>si</strong>unea <strong>de</strong> bu<strong>si</strong>ness.<br />

Sursele <strong>de</strong> resurse utilizează limbaje sursă. Acestea au fost analizate pentru a releva semantica<br />

şi a le <strong>de</strong>fini ca componente semantice, ori <strong>de</strong> câte ori este po<strong>si</strong>bil interpretarea lor neambiguă.<br />

Setul <strong>de</strong> componente semantice reprezintă nucleul semantic. O <strong>si</strong>ntaxă specifică sau un format<br />

<strong>de</strong> fişier este mapat la reprezentarea sa <strong>de</strong> bază semantică din nucleu atunci când este importat<br />

în sau exportate din repo<strong>si</strong>tory-ul digital.<br />

Sursele <strong>de</strong> metadate noi, achiziţionate printr-un şablon nou vor implica un nou şablon flux <strong>de</strong><br />

lucru şi va genera un şablon <strong>de</strong> ieşire nou, pentru integrarea in repo<strong>si</strong>tory.<br />

4.3. Algoritmul <strong>de</strong> integrare in pseudocod<br />

Start thread:<br />

if exists more then n threads then exit;<br />

else {<br />

if(exists on thread which process thumbnails) call processMetadata;<br />

else if exists image_jobs call processImages;<br />

else call processMetadata;<br />

}<br />

exit;<br />

procedure processMetadata<br />

{<br />

read metadata templates from resource;<br />

read the workflow template attached to every metadata templates;<br />

if exists waiting jobs<br />

{<br />

process jobs in conformity with metadata template;<br />

exit;<br />

}<br />

else<br />

{<br />

read medatata from template-parameter-in<strong>de</strong>xer service;<br />

if(metadata_set not null) then<br />

{<br />

create_task_instance_for_proces<strong>si</strong>ng;<br />

write the result in user interface;<br />

exit;<br />

}<br />

else exit;<br />

}<br />

}<br />

29


4.4. Ontologia aplicaţiei<br />

Figure 4. 7. Ontologia aplicației prezentată la nivel înalt<br />

30


Am creat trei mo<strong>de</strong>le diferite, care inglobează aspecte diferite ale logicii mo<strong>de</strong>lului <strong>de</strong><br />

referinţă: mo<strong>de</strong>l <strong>de</strong> ontologiei aplicţiei (AO), mo<strong>de</strong>lul ontologiei fluxului <strong>de</strong> lucru (WO), şi<br />

mo<strong>de</strong>lul ontologiei repo<strong>si</strong>tory digital (RO). Aceste mo<strong>de</strong>le nu reflectă numai proiectarea ci şi<br />

acoperă parţial arhitectura <strong>de</strong> referinţă, dar şi captează, <strong>de</strong> asemenea, informaţiile <strong>de</strong>spre<br />

metadate adunate în timp (<strong>de</strong> exemplu, pe parcursul întregului ciclu <strong>de</strong> viaţă al obiectului<br />

digital). Metadatele includ informaţii <strong>de</strong>spre ver<strong>si</strong>uni, şabloane şi colecţii. Am conectat<br />

ontologia aplicaţiei la alte ontologii <strong>de</strong>ja existente din alte domenii. Un ingest in repo<strong>si</strong>tory,<br />

<strong>de</strong> exemplu, poate fi văzut ca o reprezentare a unui flux <strong>de</strong> lucru. Prin urmare, am folo<strong>si</strong>t<br />

conceptele <strong>de</strong>finite <strong>de</strong> ontologia fluxului <strong>de</strong> lucru a lui Tim Berners-Lee pe care am extins-o<br />

cu concepte specifice. Descriem în continuare pe scurt ontologiile externe şi abrevierile<br />

(prefix) utilizate.<br />

doap: Description of a Project <strong>de</strong>fineşte concept <strong>de</strong>spre <strong>de</strong>pizitul digital ca şi diferitele<br />

ver<strong>si</strong>uni <strong>de</strong> <strong>de</strong>pizit utilizate în abordarea <strong>de</strong> faţă (<strong>de</strong> ex., CVS Repo<strong>si</strong>tory, metadata<br />

repo<strong>si</strong>tory)<br />

dcterms: Dublin Core este folo<strong>si</strong>tă ca ontologie generală pentru creatori. În această<br />

ontologie, conceptele mo<strong>de</strong>lează activităţile creatorilor (autori, lucrări).<br />

foaf: The Friend Of A Friend Ontology este o abordare care mo<strong>de</strong>lează reţele sociale<br />

persoane şi conexiunile dintre ele.<br />

wf: ontologia <strong>de</strong> flux <strong>de</strong> lucru a şui Tim Berners-Lee. În abordarea noastră, <strong>de</strong> exmplu,<br />

procesul <strong>de</strong> ingest este con<strong>si</strong><strong>de</strong>rat un flux <strong>de</strong> lucru. Atfel, un transfer in wiki este<br />

wf:Instance care este compus din wf:Tasks care la randul său poate avea o stare<br />

neterminală wf:NonTerminalState (procesare în etape) sau o stare terminală<br />

wf:Terminal-State (process închis).<br />

Metadate exprimate ca metadate structurate reprezintă resurse. Artefactele aplicaţiei sunt<br />

resurse şi sunt cuprind parametrii <strong>de</strong> intrare-ie<strong>si</strong>re, template-uri <strong>si</strong> altele. Unitatea principală<br />

logică <strong>de</strong> procesare este colecţia şi pe această resursă este bazată logica aplicaţiei.<br />

Relaţiile între conceptele sunt, în general, bidirecţionale, fiecare relaţie dispune <strong>de</strong> o relaţie<br />

inversă. De exemplu, între o colecţie şi obiectelor sale digitale există o relaţie moştenită <strong>de</strong> la<br />

ontologia <strong>de</strong> <strong>de</strong>po<strong>si</strong>t digital: Colecţia hasMember un DigitalObject şi DigitalObject<br />

isMemberOf a unei colecţii date.<br />

O parte din aceste ontologii sunt reprezentate în Semantic MediaWiki folo<strong>si</strong>nd concepte şi<br />

proprietăţi semantice. Pentru moment, ele sunt folo<strong>si</strong>te doar pentru o <strong>de</strong>scriere lizibilă atât<br />

pentru factorul uman cat şi pentru maşină, dar mai târziu, odată cu creşterea capacităţii <strong>de</strong><br />

raţionare a SMW peste reprezentarea RDF, sperăm în creerea <strong>de</strong> cunoştinţe suplimentare şi<br />

funcţionalităţi îmbunătăţite prin <strong>de</strong>ducerea <strong>de</strong> triplete noi.<br />

4.5. Calitatea metadatelor<br />

De obicei, mai multi specialiști colaborează pentru a gestiona metadatele şi conţinutul:<br />

creatori <strong>de</strong> date, managerii <strong>de</strong> date şi curatori, cei care caută date, transformatorii <strong>de</strong> date <strong>si</strong><br />

inginerii software. Sarcina utilă se balansează între două extreme: metadatele complete<br />

încarcă costurile pe creatori, manageri, curatori şi, pe <strong>de</strong> altă parte, metadatele minimale,<br />

încarcă costurile pe <strong>de</strong>scoperitorii <strong>de</strong> date.<br />

Calitatea metadatelor <strong>de</strong>pin<strong>de</strong> <strong>de</strong> doi factori. Unul dintre factori este acest fragil compromis:<br />

cat <strong>de</strong> multe <strong>de</strong> metadate trebuie să fie prezentate <strong>de</strong> către furnizorii <strong>de</strong> date sau adăugate cu<br />

ajutorul instrumentelor inteligente? Fără metadatate <strong>de</strong> calitate, semnificative şi standardizate,<br />

lipseşte ingredientul esenţial care le va face eficiente pe Web. Fără metadate <strong>de</strong> calitate,<br />

şansele <strong>de</strong> a fi gă<strong>si</strong>t conţinutul sunt în mod semnificativ diminuate.<br />

Pe <strong>de</strong> altă parte, un manager <strong>de</strong> metadate, <strong>de</strong> obicei, are sarcina <strong>de</strong> a verifica metadatele<br />

folo<strong>si</strong>nd instrumente mai mult sau mai puţin automate. Această procedură este costi<strong>si</strong>toare ca<br />

timp, predispuse la erori şi încarcă gestionarea repo<strong>si</strong>tory cu costuri umane suplimentare.<br />

Rezultatul acestui proces se rezumă la acceptarea sau respingerea metadatelor la nivel global.<br />

Feedback-ul către furnizorii <strong>de</strong> date este în cele mai multe cazuri contradictoriu şi făcut<br />

înainte <strong>de</strong> intrare (mediat <strong>de</strong> software).<br />

31


Verificarea calităţii metadatelelor este explicit făcută în cadrul abordării tezei. Prin adoptarea<br />

protocoalelor din wiki, politicile şi tratatelor, soluţiile software suportive pot ajuta la uşurarea<br />

controlului calităţii şi revizuirea metadatelor.<br />

Furnizorii <strong>de</strong> date pot fi conştientizaţi <strong>de</strong> existenţa unui set minim <strong>de</strong> metadate folo<strong>si</strong>nd<br />

protocoale în wiki şi mecanismul <strong>de</strong> şabloane din MediaWiki, împreună cu software-ul care<br />

doar susţine controlul calităţii metadatelor (după intrarea). Ei vor fi notificați, dar nu forţaţi, să<br />

transfere din nou, un set complet <strong>de</strong> metadate. Există doar un caz <strong>si</strong>ngular în care metadatele<br />

vor fi respinse complet: nici un URI valabil nu a fost <strong>de</strong>tectat şi resursele media nu pot fi<br />

i<strong>de</strong>ntificate in <strong>si</strong>stemul furnizorului.<br />

4.6. Studiu comparative între mo<strong>de</strong>lul <strong>de</strong> referinţă OAIS şi mo<strong>de</strong>lul<br />

colaborativ propus <strong>de</strong> teză<br />

Tabelul care urmează compară mo<strong>de</strong>lul <strong>de</strong> referinţă OAIS, aşa cum este el prezentat în<br />

Capitolul 3.1 cu mo<strong>de</strong>lul colaborativ pentru managemnetul repo<strong>si</strong>tory-ului. Vom sublinia<br />

nejunsurile şi limitările acestui mo<strong>de</strong>l pe componente şi sub-componente. Mo<strong>de</strong>lul nostru<br />

colaborativ nu este un mo<strong>de</strong>l generic, din contră, el este puternic ancorat în comunitatea şi<br />

mediul social format în jurul acestui obiectiv virtual care este repo<strong>si</strong>tory-ul.<br />

Table 4.2. Comparaţia dintre mo<strong>de</strong>lul <strong>de</strong> referinţă OAIS şi mo<strong>de</strong>lul colaborativ<br />

pentru managementul repo<strong>si</strong>tory-ului<br />

Componente Sub-componente Mo<strong>de</strong>lul OAIS Mo<strong>de</strong>lul Colaborativ<br />

Mediul Nivelul strategic Interacţiunea cu <strong>si</strong>stemele externe<br />

nu este bine stabilită. În fapt, dacă<br />

<strong>si</strong>stemele externe nu pot fi<br />

cla<strong>si</strong>ficate conform rolurilor<br />

prestabilite <strong>de</strong> OAIS (Producer,<br />

Consumer sau Management)<br />

mo<strong>de</strong>lul nu poate lua în<br />

con<strong>si</strong><strong>de</strong>rare interacţiunea cu<br />

Mo<strong>de</strong>l<br />

Informaţional<br />

Mo<strong>de</strong>l<br />

Functional<br />

Comunitatea<br />

<strong>de</strong>stinatară<br />

aceste <strong>si</strong>steme.<br />

Este necesară o mai fină<br />

granularitate pe un nivel<br />

intermediar astfel încât să se poată<br />

distinge comunitatea primară <strong>de</strong><br />

alte comunităţi din acelaşi mediu.<br />

Partenerii Partenerii sunt împărţiţi în 3<br />

categorii: Producer, Consumer şi<br />

Management. Nu există nici o<br />

ipoteză asupra relaţiilor dintre<br />

aceste categorii sau alte categorii<br />

<strong>de</strong> parteneri care nu se încadrează<br />

aici.<br />

Definirea fluxului<br />

<strong>de</strong> lucru<br />

Ingest<br />

(operaţiunea<br />

abstractă put())<br />

OAIS sugerează existenţa unui<br />

flux <strong>de</strong> lucru rigid între SIP, AIP<br />

şi DIP. Mo<strong>de</strong>lul nu reflectă astfel<br />

practicile curente ale repo<strong>si</strong>tory-<br />

urilor.<br />

Funţia <strong>de</strong> pre-ingest este<br />

con<strong>si</strong><strong>de</strong>rată într-un alt mo<strong>de</strong>l.<br />

32<br />

Nivelul strategic este bine-<strong>de</strong>finit<br />

datorită contextului colaborativ şi<br />

social în care se presupune ca<br />

mo<strong>de</strong>lul va fi aplicat. Strategia este<br />

bazată pe politici, tratate şi consens.<br />

Nivelul strategic este reprezentat pe<br />

acelaşi nivel ca şi nivelul <strong>de</strong><br />

management al repo<strong>si</strong>tory-ului.<br />

Comunitatea ptimară este foarte bine<br />

<strong>de</strong>finită în abordarea noastră. Este<br />

comunitatea comasată în jurul<br />

repo<strong>si</strong>tory-ului. Restul comunităţilor<br />

nu sunt explicit numite, dar coexistă<br />

implicit şi schimbă date şi mesaje<br />

prin functinalităţi <strong>de</strong> import/ export<br />

către CMS, biblioteci digitale şi alte<br />

grupuri <strong>de</strong> utilizatori.<br />

În abordarea noastră, există un <strong>si</strong>ngur<br />

tip <strong>de</strong> actor: membrii comunităţii<br />

având roluri <strong>si</strong> prerogative uşor<br />

diferenţiate. Această impărţire<br />

arbitrară în 3 categorii făcută <strong>de</strong><br />

OAIS se reflectă nenatural în ciclul<br />

<strong>de</strong> viaţă al obiectului informaţional:<br />

achiziţionarea informaţiei fără<br />

partajare („shared-ness”) .<br />

Colecţia este <strong>si</strong>ngura entitate logică<br />

gestionată <strong>de</strong> fluxul <strong>de</strong> lucru. Această<br />

abordare care utilizează ontologia<br />

fluxului <strong>de</strong> lucru este mai flexibilă şi<br />

cuprin<strong>de</strong> şi nivelul strategic.<br />

Funcţia <strong>de</strong> pre-ingest este inclusă în<br />

ontologia fluxului <strong>de</strong> lucru şi în<br />

fiecare şablon <strong>de</strong> flux <strong>de</strong> lucru. Faza


Managementul<br />

datelor<br />

Managementul datelor nu reflect<br />

munca laborioasă care va fi făcută<br />

la acest nivel.<br />

Arhivarea Urmărirea adiţională şi<br />

înregistrarea fluxului poate fi<br />

necesară.<br />

Administrativ OAIS preve<strong>de</strong> feedback către<br />

Producători, dar acest <strong>de</strong>zi<strong>de</strong>rat<br />

este unul administrativ şi nu este<br />

obligatoriu.<br />

Managementul colecţiilor, politici<br />

legate <strong>de</strong> colecţii, protecţia datelor<br />

şi controlul accesului nu sunt<br />

acoperite suficient <strong>de</strong> mo<strong>de</strong>lul<br />

OAIS.<br />

33<br />

<strong>de</strong> validare se face după intrarea în<br />

<strong>si</strong>stem (software supported):<br />

i. faza preliminară – inclu<strong>de</strong><br />

contracte şi negicieri;<br />

ii. faza formalizării –<br />

proiectarea colecţiei şi stabilirea<br />

tratatelor;<br />

iii. faza <strong>de</strong> transfer – transferul<br />

colecţiei pe platforma <strong>de</strong><br />

management;<br />

iv. faza <strong>de</strong> validare –<br />

procesarea validării;<br />

v. faza <strong>de</strong> feedback – validarea<br />

rezultatelor şi feedback.<br />

Parţial, managementul datelor este<br />

inclus în ontologia fluxului <strong>de</strong> lucru.<br />

Această funţonalitate este prevăzută<br />

într-o component specială a fluxului<br />

<strong>de</strong> lucru: Workflow Dispatcher.<br />

In abordarea noastră, acest feedback<br />

către producători este inclus in fluxul<br />

<strong>de</strong> lucru. Feedback-ul este un process<br />

iterativ: primul feedback este dat<br />

imediat după încarcarea datelor, iar<br />

celalălalt inclu<strong>de</strong> rezultatul<br />

procesului <strong>de</strong> ingest.<br />

Managementul colecţiilor este<br />

punctual central în abordarea noastră;<br />

colecţia fiind <strong>si</strong>ngura entitate<br />

manageabilă <strong>de</strong> către repo<strong>si</strong>tory.<br />

Politicile legate <strong>de</strong> colecţii sunt<br />

incluse în stratul strategic. Protejarea<br />

datelor şi controlul accesului rămân<br />

la nivelul administrativ.


5. ARHITECTURA DE<br />

REFERINŢĂ ŞI<br />

IMPEMENTĂRILE CONCRETE<br />

In acest capitol este prezentata arhitectura <strong>de</strong> referinţă precum trei arhitecturi concrete şi<br />

implementarile aferente lor.<br />

Arhitectura <strong>de</strong> referinţă urmeaza paradigma Mediator. Arhitectura <strong>de</strong> referinţă utilizează<br />

ontologia aplicaţiei pentru a comunica cu şabloanele <strong>de</strong> date şi repo<strong>si</strong>tory-ul digital care nu<br />

vor comunica direct una cu alta. Anumite constrangeri <strong>de</strong> comunicare pot fi impuse la acest<br />

nivel. Stratul Mediator <strong>de</strong>fineste regulile <strong>de</strong> control care dictează modul în care<br />

interacţioneaza nivelele <strong>de</strong> jos şi <strong>de</strong> sus. Straturile sunt slab cuplate, caracteristică care este<br />

menţinută prin comunicarea cu stratul Mediator. Aceasta comunicare este po<strong>si</strong>bila urmand<br />

cativa pa<strong>si</strong>:<br />

Mai intai, s-au <strong>de</strong>zvoltat cateva tipuri <strong>de</strong> şabloane, avand diferite functionalităţi – e.g.,<br />

colectarea metadatelor, chei <strong>de</strong> i<strong>de</strong>ntificare wiki, integrarea metadatelor dintr-un repo<strong>si</strong>tory<br />

extern. Fiecare tip <strong>de</strong> şablon MediaWiki poate fi folo<strong>si</strong>t la colectarea metadatelor are ataşat un<br />

şablon <strong>de</strong> flux <strong>de</strong> lucru; ambele şabloane sunt stocate în MediaWiki ca “pagini” într-un spaţiu<br />

<strong>de</strong> nume special [182].<br />

Componenta urmatoare este o ontologie, numită şi ontologia fluxului <strong>de</strong> lucru [182] şi ea<br />

reprezintă relaţiile dintre fluxurile <strong>de</strong> lucru, resurse şi utilizatori. În acest fel se combină<br />

mo<strong>de</strong>lul <strong>de</strong> management al fluxului <strong>de</strong> lucru cu mo<strong>de</strong>lul <strong>de</strong> şabloane MediaWiki pentru<br />

interoperabilitate. Utilizatorii, mesajele, şabloanele şi metadatele sunt con<strong>si</strong><strong>de</strong>rate resurse.<br />

O component importanta este dispecerul fluxului <strong>de</strong> lucru [41] care este responsabil pentru<br />

intregul proces: <strong>de</strong>finirea elementelor, crearea şabloanelor şi generarea instantelor (automatic<br />

şi <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> context). Monitorizarea fluxului <strong>de</strong> lucru şi controlul uneltelor implicate este<br />

trasat în mod real prin interogarea instanţelor fluxului <strong>de</strong> lucru.<br />

5.1. Descrierea tehnologiei şi <strong>de</strong>zvoltarea<br />

Mo<strong>de</strong>lul <strong>de</strong> referinţă este construit pe tehnologiile MediaWiki şi Semantic MediaWiki [115].<br />

Alegerea acestor tehnologii MediaWiki ca tehnologii suport se bazeaza pe caracteristici ca:<br />

unealtă colaborativă, crearea facilă a paginilor şi linkajul lor, unealtă care tratează în mod<br />

uniform şi formal specificaţiile informale ale diferitelor componente ale mo<strong>de</strong>lului unei<br />

intreprin<strong>de</strong>ri.<br />

Scopul general este integrarea media şi/sau a metadatelor aferente într-un repo<strong>si</strong>tory<br />

centralizat, în conformitate cu standard structurale şi <strong>de</strong> conţinut, şi cu un protocol <strong>de</strong> transfer<br />

al metadatelor. O asemenea integrare constă în urmatorii paşi:<br />

A. Stabilirea furnizorilor datelor şi/sau metadatelor, acorduri asupra protocolului <strong>de</strong> transfer<br />

al metadatelor şi strategia <strong>de</strong> integrare. Acest pas stabileşte sub<strong>si</strong>stemul <strong>de</strong> intrare în<br />

<strong>si</strong>stemul <strong>de</strong> integrare.<br />

B. Stabilirea repo<strong>si</strong>tory final şi arhitectura sa. Pentru aceasta, este nevoie <strong>de</strong> urmatorii paşi:<br />

Arhitectura Obiectului Digital. Arhitectura obiectului digital reprezintă structura atomică a<br />

repo<strong>si</strong>tory digital şi trebuie <strong>de</strong> asemenea să exprime relaţiile dintre obiectele digitale.<br />

Formatul acestei reprezentari este strâns legat cu tehnologia <strong>de</strong> <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory.<br />

Arhitectura Obiectului la nivel <strong>de</strong> repo<strong>si</strong>tory. Acest obiect reprezintă un mo<strong>de</strong>l compozit<br />

structura lui constă din agregarea mai multor obiecte digitale. Acesta agregare <strong>de</strong> obiecte<br />

34


digitale reprezintă mo<strong>de</strong>lul structural al repo<strong>si</strong>tory şi unitatea logică care va fi menţinută la<br />

nivelul acestuia.<br />

C. Dezvoltarea conţinutului şi productia fluxurilor <strong>de</strong> lucru. Urmand protocolul şi ciclul <strong>de</strong><br />

viaţă al resurselor digitale, şabloanele pentru managementul metadatelor şi uneltele<br />

<strong>de</strong>zvoltate pentru realizarea acestora sunt:<br />

Colectarea metadatelor <strong>de</strong> la furnizorii <strong>de</strong> metadate<br />

Agregarea metadatelor în repo<strong>si</strong>tory<br />

Feedback-ul catre furnizorii <strong>de</strong> metadata şi rapoartele privind<br />

managementul repo<strong>si</strong>tory-ului.<br />

D. Servicii <strong>de</strong> intreţinere şi unelte <strong>de</strong> cautare.<br />

Pentru a îmbunatăţi cooperarea şi coordonarea dintre unelte, am creat ontologia fluxului <strong>de</strong><br />

lucru [182] şi am implementat un flux standard <strong>de</strong> management al repo<strong>si</strong>tory digital înauntrul<br />

unui <strong>si</strong>stem wiki.<br />

Figure 5. 1. Mo<strong>de</strong>lul pe nivele suportat <strong>de</strong> MediaWiki<br />

Prima şi a doua arhitectură concretă utilizeaza atributele MediaWiki şi SMW pentru<br />

colectarea, agregarea şi stocarea metadatelor. Aceste arhitecturi concrete au fost prezentate în<br />

articolele [36][37][38][39].<br />

Cea <strong>de</strong>-a treia arhitectură adresează problema integrării metadatelor. Metadatele şi conţinutul<br />

media sunt furnizate <strong>de</strong> o biblioteca digitală şi integrate în SMW. Aceasta arhitectură concretă<br />

a fost prezentată în articole [184][156].<br />

5.2. Prima arhitectură concretă<br />

Constrângerile <strong>de</strong> implementare şi cerintele contextuale:<br />

1. Iniţial, conţinutul media şi metadatele se aflau în <strong>si</strong>stemelor proprii ale furnizorilor <strong>de</strong><br />

date;<br />

2. Integrarea se face într-un <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory extern. Opţiunea cea mai potrivită este<br />

<strong>si</strong>stemul Fedora Commons, fiind un <strong>si</strong>stem <strong>de</strong> repo<strong>si</strong>tory cu facilităţi semantice şi<br />

permitând o arhitectură flexibilă. Fedora Commons este prezentat în capitolul 3 al<br />

35


tezei ca <strong>si</strong> caz concret <strong>de</strong> implementare al mo<strong>de</strong>lului OAIS <strong>de</strong> management al<br />

repo<strong>si</strong>tory-ului digital. Am ales aceasta variantă pentru că este un <strong>si</strong>stem open source<br />

cu instanţe funcţionale multiple iar proiectul este în continuare menţinut <strong>de</strong><br />

Univer<strong>si</strong>tatea Cornell.<br />

3. în repo<strong>si</strong>tory se vor integra numai metadatele în conformitate cu standardul structural<br />

şi <strong>de</strong> conţinut stabilite anterior în protocolul <strong>de</strong> transfer al metadatelor [186].<br />

Cele trei nivele ale primei arhitecturi concrete sunt dupa cum urmează:<br />

1. Nivelul <strong>de</strong> colectare a metadatelor. Acest nivel este susţinut <strong>de</strong> <strong>si</strong>stemul MediaWiki.<br />

Acest nivel este <strong>de</strong> fapt confundat în stratul utilizator – <strong>de</strong> cautare şi consultare. În<br />

acestă abordare aceste doua straturi partajează aceeaşi infrastructură.<br />

2. Nivelul <strong>de</strong> agregare – un set <strong>de</strong> unelte Java.<br />

3. Nivelul <strong>de</strong> date –reprezentat <strong>de</strong> 3 baze <strong>de</strong> date: o baza <strong>de</strong> date este utilizată <strong>de</strong> Fedora<br />

Commons pentru stocarea metadatelor, iar celelelte doua baze <strong>de</strong> date sunt utilizate <strong>de</strong><br />

unelte.<br />

5.2.1. Obiect digital<br />

Integrarea numai a metadatelor este o modalitate obişnuită <strong>de</strong> a construi o bibliotecă digitală<br />

şi constă în cativa pa<strong>si</strong>:<br />

1. Arhitectura obiectului digital. Mai întâi se stabileşte un mo<strong>de</strong>l <strong>de</strong> obiect digital<br />

compatibil cu mo<strong>de</strong>lul <strong>de</strong> conţinut al Fedora Commons Repo<strong>si</strong>tory [178]. Structura<br />

metadatelor va fi compatibila cu entităţile <strong>de</strong>finite în protocolul Resource Metadata<br />

Exchange Agreement [152].<br />

Dintre tipurile <strong>de</strong> metadata (<strong>de</strong>scriptive, administrative, <strong>de</strong> prezervare, <strong>de</strong> <strong>de</strong>scrierea<br />

drepturilor intelectuale, etc) metadata sunt cel mai <strong>de</strong>s folo<strong>si</strong>te în cautarea obiectului digital,<br />

acţionând ca un un proxy pentru obiect, chiar daca in<strong>de</strong>xarea directă nu este disponibilă.<br />

S-au stabilit urmatoarele tipuri <strong>de</strong> obiecte:<br />

Obiecte Media care corespund obiectelor din lumea reală (i.e. imagini, vi<strong>de</strong>o,<br />

translatări şi transcieri, fişiere audio).<br />

Obiecte Provi<strong>de</strong>r – un obiect strcturat logic care <strong>de</strong>scrie un furnizor <strong>de</strong> metadate;<br />

Obiecte Collection ( agregări):<br />

Colectie reală sau virtuală (agregare).<br />

Colecţii <strong>de</strong> colecţii.<br />

Secvenţe <strong>de</strong> date (datastreams) utilizate pentru a regă<strong>si</strong> toate submulţimile<br />

membrilor:<br />

o metadate pentru agregare<br />

o reguli specifice după care se compun colecţiile.<br />

A fost aleasă o arhitectură <strong>si</strong>mplă şi flexibilă pentru obiectul digital integrat în repo<strong>si</strong>tory-ul<br />

Fedora Commons: toate metadatele sunt exprimate ca relaţii RDF şi înglobate în fluxul <strong>de</strong><br />

date RELS-EXT. Aceste relaţii şi proprietăţi sunt exprimate via RDF şi <strong>de</strong>scrise prin:<br />

Inclu<strong>de</strong>rea relaţiilor moştenite din ontologia <strong>de</strong> bază Fedora Commons:<br />

colecţie/membru; întreg/parte; etc.<br />

Inclu<strong>de</strong>rea relaţiilor proprii ontologiei comunităţii care foloseşte repo<strong>si</strong>tory-ul digital.<br />

Toate metadatele fac parte din fluxul <strong>de</strong> date RELS-EXT. în acest mod există şansa <strong>de</strong> a<br />

utiliza SPARQL, limbajul Web <strong>de</strong> interogare semantic.<br />

Obiectul Media “isMemberOf” în mai multe colecţii.<br />

Obiectul Media este în relaţia “serviceProvi<strong>de</strong>dBy” Obiectul Provi<strong>de</strong>r.<br />

36


Figure 5. 2. Architectura obiectului digital<br />

2. Arhitectura Obiectului Digital la nivel <strong>de</strong> repo<strong>si</strong>tory digital. Colecţia este mo<strong>de</strong>lul <strong>de</strong><br />

obiect digital agregat aleasă pentru Fedora Commons Repo<strong>si</strong>tory. S-a <strong>de</strong>cis ca toate obiectele<br />

digitale să aprţină unei colecţii. Acesta va fi obiectul digital care este menţinut la nivel logic.<br />

3. Mo<strong>de</strong>lul <strong>de</strong> <strong>de</strong>zvoltare al conţinutului şi producţia <strong>de</strong> fluxuri <strong>de</strong> lucru. Principalii paşi<br />

pentru producţia <strong>de</strong> fluxuri <strong>de</strong> lucru sunt:<br />

a. Furnizorii <strong>de</strong> metadata transmit metadatele care <strong>de</strong>scriu fişierele media sau uneltele <strong>de</strong><br />

i<strong>de</strong>ntificare utilizand o formă speciala (metadata harvesting).<br />

b. Metadatele sunt stocate intr-un repo<strong>si</strong>tory extern (metadata ingest).<br />

c. O interfaţă a unei unealte <strong>de</strong> căutare permite utilizatorilor să lanseze interogări asupra<br />

metadatelor din repo<strong>si</strong>tory-ul digital.<br />

Urmând protocolul <strong>de</strong> management al resurselor digitale, şablonul <strong>de</strong> flux <strong>de</strong> lucru care<br />

<strong>de</strong>scrie protocolul <strong>de</strong> management al metadatelor şi uneltele <strong>de</strong>zvoltate pentru în<strong>de</strong>plinirea<br />

obiectivelor sunt:<br />

A. Colectarea metadatelor <strong>de</strong> la furnizorii <strong>de</strong> metadate.<br />

Structura metadatelor va fi conformă cu Resource Metadata Exchange Agreement [78].<br />

Acestă convenţie <strong>de</strong>fineşte o shemă proprie pentru interoperabilitatea metadatelor. Această<br />

schemă conţine elemente care extend schema Dublin Core cu elemente <strong>de</strong>rivate din<br />

aceasta.<br />

Transferul utilizează <strong>si</strong>ntaxa şablonelor MediaWiki ca <strong>si</strong>ntaxă specifică pentru sub<strong>si</strong>stemul<br />

<strong>de</strong> intrare. Deoarece şabloanele sunt direct transformate pe platforma <strong>de</strong> repo<strong>si</strong>tory şi<br />

afişate în browser, aceasta conferă beneficiul implementării unui feedback şi o validare<br />

parţială imediat dupa ce metadatele au fost încarcate pe server, permitând furnizorilor să<br />

<strong>de</strong>tecteze şi să corecteze imediat erorile.<br />

Acest mecanism <strong>de</strong> recoltare a metadatelor (obiecte wiki în structură XML) este<br />

implemetat în PHP ca exten<strong>si</strong>e MediaWiki.<br />

B. Agregarea meta<strong>de</strong>lor în repo<strong>si</strong>tory-ul digital. S-au <strong>de</strong>zvoltat un set <strong>de</strong> unelte în Java,<br />

pentru managementul obiectelor digitale în Fedora Commons Repo<strong>si</strong>tory, compus din şapte<br />

unelte [183]. Am utilizat componente in<strong>de</strong>pen<strong>de</strong>nte şi re-utilizabile şi tehnologii <strong>de</strong>schise<br />

(Eclipse Public License - v 1.0 4 , şi Apache License Ver<strong>si</strong>on 2.0 [5] ). Declanşate <strong>de</strong> un fişier<br />

general <strong>de</strong> configurare XML stocat ca pagina normală wiki, aceste unelte pot lucra fie în<br />

combinaţie fie separate indiferent <strong>de</strong> platformă. Datele transferate între unelte folosesc<br />

formatul XML. Orchestrarea acestor unelte <strong>de</strong>pin<strong>de</strong> <strong>de</strong> şablonul <strong>de</strong> flux <strong>de</strong> lucru ataşat care la<br />

rândul sau <strong>de</strong>pin<strong>de</strong> <strong>de</strong> şablonul wiki care va fi folo<strong>si</strong>t <strong>de</strong> sub<strong>si</strong>stemul <strong>de</strong> intrare. Orice instanţa<br />

<strong>de</strong> flux <strong>de</strong> lucru este mapată la colecţie, ca element logic, astfel:<br />

4 http://www.eclipse.org/legal/epl-v10.html<br />

37


Datele în format XML sunt interogate <strong>de</strong> o unealta Java:<br />

Transformările XML şi XSLT, a<strong>si</strong>state <strong>de</strong> Metadata Exchange Agreement, vali<strong>de</strong>ază<br />

metadatele şi crează obiectul digital în format FOXML propriu Fedora Commons;<br />

Unealta <strong>de</strong> interogare internă, Internal Search tool, interoghează repo<strong>si</strong>tory-ul digital<br />

cautând colecţii <strong>de</strong>ja existente în repo<strong>si</strong>tory. Pentru aceasta se utilizează două motoare <strong>de</strong><br />

cautare: un motor bazat pe text - Lucene – şi un motor bazat pe interogări semantice cum ar<br />

fi SPARQL [178]. Această unealtă <strong>de</strong>ci<strong>de</strong> automat, dacă colecţia curentă <strong>de</strong> prelucrat este<br />

aceeaşi cu o colecţie <strong>de</strong>ja existentă în repo<strong>si</strong>tory-ul digital. Daca există aceasta egalitate,<br />

colecţia veche este ştearsă din repo<strong>si</strong>tory şi se va înlocui cu colecţia nouă şi din nou <strong>de</strong>pusă<br />

în repo<strong>si</strong>tory.<br />

C. Rapoarte şi statistici <strong>de</strong>spre repo<strong>si</strong>tory afişate în MediaWiki. O unealtă pentru editare<br />

crează pagini wiki care conţin rezultatele ingestului, statistici şi starea fluxului <strong>de</strong> lucru.<br />

Această unealtă <strong>de</strong> raportare, statistici şi managementul fluxului <strong>de</strong> lucru utilizeaza mecanisme<br />

MediaWiki şi sunt implementate ca exten<strong>si</strong>i ale motorului Bliki, un API scris în Java pentru<br />

MediaWiki [178].<br />

Prin mecanismul MediaWiki al categoriilor, furnizorii <strong>de</strong> date sunt informaţi asupra<br />

rezultatelor stocării în repo<strong>si</strong>tory-ul digital.<br />

Generarea <strong>de</strong> statistici este <strong>de</strong>clanşată <strong>de</strong> un proces programabil. Utilizarea şabloanelor<br />

MediaWiki reflectă tot timpul starea nivelului <strong>de</strong> agregare al obiectelor digitale în<br />

repo<strong>si</strong>tory-ul digital.<br />

D. Cautarea în repo<strong>si</strong>tory. O unealtă bazată pe tehnologii web Adobe Flex implementează o<br />

interfaţă orientată spre utilizatorul final şi a fost <strong>de</strong>zvoltată pentru a realiza interogarea<br />

serviciului expus <strong>de</strong> Fedora Commons Generic Search Service (gSearch) [70]. Acestă interfaţă<br />

este integrată în MediaWiki şi a fost implementată <strong>de</strong> o terţa parte.<br />

Pentru a imbunataţi cooperarea şi coordonarea dinte unelte, a fost creată ontologia fluxului <strong>de</strong><br />

lucru [183]. Ea a fost implementată ca un mo<strong>de</strong>l <strong>de</strong> flux <strong>de</strong> lucru standardizat şi reprezentat în<br />

MediaWiki.<br />

Figure 5. 3. Interfaţa MediaWiki care permite urmărirea în timp real a stării fluxului <strong>de</strong> lucru<br />

38


O component vizuală este integrată în interfaţa MediaWiki, şi are rolul <strong>de</strong> a afişa starea curentă<br />

aferentă instanţelor fluxului <strong>de</strong> lucru online. Această componentă este implementată ca<br />

exten<strong>si</strong>e MediaWiki şi foloseşte PHP şi tehnologii Ajax [174]. Componentele responsabile cu<br />

resetarea stării fluxului <strong>de</strong> lucru prin fluxul <strong>de</strong> control nu au fost implementate dinadins.<br />

Explicaţia pentru alegerea acestei opţiuni constă în natura absolut transparentă pentru utilizator<br />

a interfeţei suport şi a po<strong>si</strong>bilităţii ca fluxul <strong>de</strong> control să fie acci<strong>de</strong>ntal intrerupt <strong>de</strong> aceştia.<br />

5.2.2. Profilul utilizator şi specificarea colaborării<br />

Pentru standardizarea metadatelor colectate <strong>de</strong> la diverşi furnizori, a fost sabilit Resource<br />

Metadata Exchange Agreement. El <strong>de</strong>fineşte tipul resurselor şi <strong>de</strong> asemenea câmpurile <strong>de</strong><br />

metadate pentru fiecare tip <strong>de</strong> resursa: title, keywords, subject category, scientific names,<br />

copyright, license, format şi URIs. Sunt suportate diferite nivele <strong>de</strong> calitate ale resurselor<br />

digitale (<strong>de</strong> exemplu, high-resolution, web-optimized, sau diferite mărimi <strong>de</strong> miniaturi) şi în<br />

limbi diferite (<strong>de</strong> exemplu, titlul în engleza şi slovena) sub diferite URI-uri. De asemenea s-au<br />

stabilit şi nivelele <strong>de</strong> nece<strong>si</strong>tate ale entităţilor <strong>de</strong> metadate pe fiecare tip <strong>de</strong> resursa: necesare,<br />

urgent necesare sau opţionale.<br />

Utilizarea şabloanelor MediaWiki în paginile wiki permite citirea usoara a textului şi<br />

raportarea la timp a erorilor, astfel încat transferal <strong>de</strong> la furnizorii <strong>de</strong> metadate către <strong>si</strong>stem este<br />

mult uşurat, ei fiind <strong>si</strong>ngurii responsabili pentru aducerea la zi a datelor pe propriile<br />

calculatoare şi nivelul calitativ al acestora. Sintaxa unul apel <strong>de</strong> şablon este <strong>si</strong>milara<br />

exemplului următor:<br />

{{Metadata<br />

| Type = StillImage<br />

| Collection Page = Drawings from G. Viennot-Bourgin 1956 (entire plates)<br />

| Provi<strong>de</strong>r Page = Julius Kühn Institute – Fe<strong>de</strong>ral Research Institute for<br />

Cultivated Plants<br />

| Title = Planche 1<br />

| Resource ID = 1851242627<br />

| Copyright Statement = © G. Viennot-Bourgin<br />

| License Statement = Licenses must be individually negotiated.<br />

| Creators = by G. Viennot-Bourgin; edited by G. Hagedorn & W. Bran<strong>de</strong>nburger<br />

| Metadata Creator = G. Hagedorn<br />

| Language = zxx<br />

| Metadata Language = en<br />

| Original Creation Date = 20.11.2002<br />

| Country Co<strong>de</strong>s = global<br />

| Subject Category = Fungi-sensu-lato<br />

| Taxonomic Coverage = Fungi (sensu lato, including Oomycota)<br />

| Taxon Count = 1<br />

|Best Quality URI =<br />

http://160.45.63.55/storage/Fungi/Mixed/VBourg56/Plates/edt/Pl_01.png<br />

| Best Quality Availability = online (free)<br />

}}<br />

39


Figure 5. 4. Şablon metadata<br />

In acest mod, utilizarea şabloanelor pentru transferal metdatelor în wiki poate a<strong>si</strong>gura rapoarte<br />

atractive şi clare, facilitând raportarea erorilor (câmpuri absolut necesare, valori incorecte, etc).<br />

Tot în scopul uşurarii colectarii datelor <strong>de</strong> la furnizorii <strong>de</strong> date care îşi vor pune datele în<br />

formularele create prin şablonare şi <strong>de</strong> asemenea pentru a automatiza procesul <strong>de</strong> transfer, <strong>de</strong><br />

exemplu din tablele MS Access, s-au creat pagini ajutatoare în wiki în acest scop (dupa<br />

principiul : ‘help user snap to grid’).<br />

La acest nivel, utilizatorul va avea la dispoziţie şi facilităţile MediaWiki: pagini favorite,<br />

pagini supravegheate, şabloane adiţionale, pagini <strong>de</strong> discuţie, etc. Toţi furnizorii <strong>de</strong> date fac<br />

parte din aceelaşi grup <strong>de</strong> utilizatori wiki având aceleaşi drepturi <strong>de</strong> utilizare. Caţiva furnizori<br />

<strong>de</strong> date utilizează unelte automate pentru a transfera resurse sau metadata în wiki (bots în<br />

limbaj wiki).<br />

5.2.3. Specificarea elementelor fluxului <strong>de</strong> lucru şi a relaţiilor dintre ele<br />

Am utilizat şabloane MediaWiki ca formulare <strong>de</strong> structuri <strong>de</strong> date utilizand <strong>si</strong>ntaxa wiki pentru<br />

a permite furnizorilor <strong>de</strong> date sa publice metadatele <strong>de</strong>spre conţinutul media intr-o operație <strong>de</strong><br />

“împingere” (push) în repo<strong>si</strong>tory-ul digital.<br />

Fluxul <strong>de</strong> lucru implică apoi o procedură <strong>de</strong> colectare automată a metadatelor în repo<strong>si</strong>tory-ul<br />

digital Fedora Commons, combinată cu crearea automată <strong>de</strong> rapoarte în paginile wiki. Aceste<br />

rapoarte a<strong>si</strong>gură feedback-ul către furnizorii <strong>de</strong> date şi utilizatorul final.<br />

Metoda mai sus menţionată extin<strong>de</strong> mo<strong>de</strong>lul flexibil <strong>de</strong> flux <strong>de</strong> lucru expus în [187] şi se<br />

bazează pe două mecanisme, după cum urmează:<br />

In primul rând, au fost create câteva tipuri <strong>de</strong> şabloane pentru recoltarea datelor, având<br />

funcţiuni diverse – colectarea metdatelor, metadate asociate cu cheile <strong>de</strong> i<strong>de</strong>ntificare, etc.<br />

Fiecare tip <strong>de</strong> şablon <strong>de</strong>zvoltat în MediaWiki are un flux <strong>de</strong> lucru ataşat; ambele obiecte sunt<br />

stocate în MediaWiki ca “pagini” într-un spaţiu <strong>de</strong> nume special.<br />

A doua componentă este o ontologie, numită ontologia fluxului <strong>de</strong> lucru [174], care reprezintă<br />

relaţile dintre fluxuri <strong>de</strong> lucru, resurse şi utilizatori finali. Metoda combină metoda <strong>de</strong><br />

management al fluxului <strong>de</strong> lucru cu mo<strong>de</strong>lul <strong>de</strong> şabloanele MediaWiki pentru<br />

interoperabilitate.<br />

Un manager <strong>de</strong> flux <strong>de</strong> lucru [182][183] este responsabil cu ciclul <strong>de</strong> viata al fluxului <strong>de</strong> lucru<br />

care consta în 3 faze principale:<br />

40


Definirea elementelor fluxului <strong>de</strong> lucru: aceste <strong>de</strong>fineşte contextual taskului şi ataşează<br />

mesajele sau informaţia din elementele documentului [183].<br />

Crearea şablonului fluxului <strong>de</strong> lucru: managerul fluxului <strong>de</strong> lucru <strong>de</strong>fineşte informaţiile<br />

<strong>de</strong>spre fluxul <strong>de</strong> lucru şi combină teaskurile şi regulile <strong>de</strong> tranziţie pentru a forma un şablon<br />

<strong>de</strong> flux <strong>de</strong> lucru.<br />

Generarea instanţelor <strong>de</strong> flux <strong>de</strong> lucru (automatic şi <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> context): se selectează<br />

în mod dinamic un şablon <strong>de</strong> flux <strong>de</strong> lucru din lista <strong>de</strong> şabloane disponibile şi se crează o<br />

instanţă executabilă <strong>de</strong> flux <strong>de</strong> lucru.<br />

Monitorizarea şi controlul stării reale a fluxului <strong>de</strong> lucru este realizat <strong>de</strong> o unealtă care<br />

interoghează instanţele active ale fluxului <strong>de</strong> lucru. Această unealta are două faze <strong>de</strong><br />

activitate:<br />

Monitorizarea fluxului <strong>de</strong> lucru: verifică starea fluxurilor <strong>de</strong> lucru cu starea neterminală<br />

din lista <strong>de</strong> fluxuri <strong>de</strong> lucru şi supraveghează progresul fluxurilor selecţionate;<br />

Controlul fluxului <strong>de</strong> lucre: seteaza şi reseteaza starea fluxului <strong>de</strong> lucru ca Suspend,<br />

Resume, şi Abort.<br />

In urmatoarea imagine se observă progresul fluxurilor <strong>de</strong> lucru pentru activitatea <strong>de</strong> ingest în<br />

repo<strong>si</strong>tory-ul digital:<br />

Figure 5. 5. Fluxul <strong>de</strong> lucru MediaWiki – privire <strong>de</strong> ansamblu.<br />

Arhitectura corespunzatoare, pe straturi, este prezentată în figura următoare:<br />

41


Figure 5. 6. Arhitectura cadrului <strong>de</strong> lucru în MediaWiki pentru obţinerea interoperabiliăţii<br />

5.2.4. Alinierea mo<strong>de</strong>lelor şi specificarea interoperabilităţii<br />

Alinierea între şabloane şi fluxurile <strong>de</strong> lucru se realizează prin două mecanisme: <strong>de</strong>scrierea<br />

şabloanelor MediaWiki şi handlerul <strong>de</strong> şabloane.<br />

Şabloanele sunt pagini Wiki care pot fi 'transcluse' (incluse cu procesare) în alte pagini.<br />

Sintaxa <strong>de</strong> baza este:<br />

{{Templatename<br />

| parametername1 = parametervalue1<br />

| parametername2 = parametervalue2<br />

|… }}<br />

Metadatele unui obiect media într-o pagina wiki sunt transmise sub forma:<br />

{{meta-data<br />

| meta-datafield1 = meta-datavalue1<br />

| meta-datafield2 = meta-datavalue2<br />

|… }}<br />

Acest format este relativ uşor <strong>de</strong> recoltat şi stocat în tabele create special pentru asta în baza<br />

<strong>de</strong> date native MediaWiki. Astfel are loc o validare parţială la acest prim nivel, bazată pe<br />

capabilităţile programatice şi <strong>de</strong> raportare native ale şabloanelor MediaWiki. Aceastea sunt<br />

prevăzute cu un mecanism instant <strong>de</strong> raportare al erorilor.<br />

Fiecare şablon are un handler ataşat. Unealta <strong>de</strong> ingest mapează sablonul <strong>de</strong> lucru potrivit cu<br />

șablonul wiki corespon<strong>de</strong>nt. Aceasta mapare se face printr-o pagină wiki <strong>si</strong>mpla. Pentru un<br />

nou şablon <strong>de</strong> metadate, este necesar un nou flux <strong>de</strong> lucru şi un nou şablon wiki.<br />

Fluxul <strong>de</strong> lucru mapează mo<strong>de</strong>lul <strong>de</strong> şablon pe mo<strong>de</strong>lul <strong>de</strong> repo<strong>si</strong>tory utilizând transformări<br />

XSLT. Paşii care se parcurg în cadrul acestui process sunt <strong>de</strong>finiţi ca în pictograma<br />

următoare:<br />

42


Metadata.xml<br />

Figure 5. 7. Descrierea transformărilor XSLT şi validarea procesului<br />

O pagină <strong>de</strong> mapare wiki conţine un <strong>si</strong>mplu document XML care reprezintă configuraţia:<br />

<br />

<br />

<br />

<br />

<br />

<br />

Preprocess<br />

metadata_preprocess.xslt<br />

Metadata_preprocess.x<br />

ml<br />

Split files<br />

metadata_split.xslt<br />

Legatură dintre repo<strong>si</strong>tory-ul digital şi furnizorii <strong>de</strong> date este realizată prin mecanismul <strong>de</strong><br />

<strong>de</strong>scris în Metadata Aggregation Report. Unealta <strong>de</strong> ingest colectează toate erorile şi<br />

atenţionările care au loc în timpul procesului şi le rapoarteaza în wiki. Fiecare colecţia va avea<br />

un raport ataşat asupra bunul curs al operaţiunii <strong>de</strong> ingest. Toate rapoartele sunt colectate apoi<br />

şi raportate într-o pagina ataşată paginii furnizorului <strong>de</strong> metadate. Aceste rapoarte se vor<br />

folo<strong>si</strong> mai apoi pentru a obţine datele pentru evaluare.<br />

43<br />

000001.xml<br />

000002.xml<br />

Split_files.xml<br />

Validate files<br />

metadata_validate.xslt<br />

Split elements containing<br />

multiple values<br />

metadata_multiple_tags.xslt<br />

Validation_<br />

results.xml<br />

000001.xml.tmp<br />

000002.xml.tmp<br />

Splitted_files.x<br />

ml<br />

Vocabulary_type.xml<br />

Generate FOXML files<br />

metadata_foxml_2.xslt<br />

Create error/warning files<br />

metadata_filter_files.xslt<br />

metadata_filter_warnings.xslt<br />

metadata_filter_errors.xslt<br />

foxml/000001.xml<br />

forml/000002.xml<br />

Foxml/valid.<br />

xml<br />

Valid_files.xml<br />

../errors.xml<br />

../warnings.xml


Figure 5. 8. Metadata Aggregation Report<br />

Această implementare lucrează <strong>de</strong>ja automat <strong>de</strong> peste un an (septembrie 2010).<br />

5.2.5. Prototip pentru realizarea interoperabilităţii cu biblioteca digitala<br />

Europeana DL<br />

La sfârşitul acestei secţiuni este <strong>de</strong>mn <strong>de</strong> menţionat prototipul <strong>de</strong> interoperabilitate <strong>de</strong>zvoltat<br />

pentru a realiza colaborarea cu biblioteca Europeana DL. S-a instalat exten<strong>si</strong>a furnizorul<br />

Fedora’Commons OAI şi s-au <strong>de</strong>zvoltat cateva transformări XSLT pentru a translata mo<strong>de</strong>lul<br />

<strong>de</strong> conţinut actual al repo<strong>si</strong>tory digital în conformitate cu mo<strong>de</strong>lul <strong>de</strong> conţinut digital al<br />

Europeana DL [40]. Am utilizat “crosswalking” pentru alinierea schemei cu schema <strong>de</strong>finită<br />

<strong>de</strong> Europeana DL. Documentaţia şi rezultele testelor sunt disponibile pe platforma <strong>de</strong><br />

documentare <strong>de</strong> la adresa [180]. Procesul poate fi oricând repetat iar unelata este disponibilă<br />

şi executabilă în interfaţa modificată a furnizorului OAI.<br />

5.3. A doua arhitectură concretă<br />

A doua arhitectură utilizează tehnologiile <strong>de</strong> repo<strong>si</strong>tory partajat proprie Semantic MediaWiki:<br />

şabloane wiki, proprietăţi semantice, export RDF şi interogări semantice în timp real în<br />

paginile wiki. Acest mo<strong>de</strong>l reprezintă conceptual o arhitectură <strong>de</strong> trecere între primul mo<strong>de</strong>l şi<br />

cel care foloseşte pe <strong>de</strong>plin tehnologiile semantice.<br />

Metodologia<br />

A doua arhitectură pentru managementul repo<strong>si</strong>tory digital este bazată pe Semantic<br />

MediaWiki, este construită şi face uz <strong>de</strong> proprietăti semnatice, ca şi <strong>de</strong> şabloane semantice.<br />

Interogările în timp real şi constructorul <strong>de</strong> interogări in-line ajuta utilizatorii finali non tehnici<br />

sa regăseasca uşor resursele digitale.<br />

44


Mo<strong>de</strong>lul implică meto<strong>de</strong> care colectează automat metadatele generate <strong>de</strong> o unealtă web<br />

utilizată <strong>de</strong> biologi, un editor <strong>de</strong> chei <strong>de</strong> i<strong>de</strong>ntificare. (editor jKey). Cheile <strong>de</strong> i<strong>de</strong>ntificare cu o<br />

<strong>si</strong>ngură intrare pot fi stocate direct în obiecte wiki [186].<br />

Structura <strong>de</strong> baza este un şablon Key Start care conţine metadate cum sunt titlul, <strong>de</strong>scrierea,<br />

autorul cheii, sablonul pentru secvenţa <strong>de</strong> indrumare (sau Lead Question plus Lead) care<br />

conţine cheia propriu-zisă, şi un şablon Key End [78]. Cheile <strong>de</strong> i<strong>de</strong>ntificare sunt afişate în<br />

wiki utilizând funcţionalitatea standard a şabloanelor MediaWiki şi nu este necesară o exten<strong>si</strong>e<br />

anumită [184].<br />

La inceput, metadatele ataşate şabloanelor cheilor <strong>de</strong> i<strong>de</strong>ntificare au fost colectate ca şi oricare<br />

alte metadate. Apoi urmând scopul introducerii tehnologiilor semantice am <strong>de</strong>cis să abordam<br />

acestă problemă altfel.<br />

a) Arhitectura<br />

Am transformat fluxul <strong>de</strong> lucru astfel:<br />

Şabloanele Metadata <strong>de</strong>vin şabloane Metadata semantice prin adăugarea <strong>de</strong> proprietăţi<br />

semantice;<br />

Obiectele digitale pentru colecţie şi furnizor nu mai sunt necesare;<br />

Fluxul <strong>de</strong> lucru KeyStart ramane acelaşi în fapt, excepţie făcând repo<strong>si</strong>tory-ul Fedora<br />

Commons care a fost înlaturat şi el;<br />

In loc <strong>de</strong> ingest în repo<strong>si</strong>tory-ul extern, am folo<strong>si</strong>t unealta <strong>de</strong> Raportare MediaWiki .<br />

Această unealtă crează o nouă pagină într-un wiki un<strong>de</strong> este instalată exten<strong>si</strong>a Semantic<br />

Wiki, facand uz <strong>de</strong> elementele sablonul Metadata.<br />

In acest moment, metadatele ataşate cheilor <strong>de</strong> i<strong>de</strong>ntificare sunt disponibile pentru<br />

uneltele <strong>de</strong> căutare semantice.<br />

b) Imbunătăţirea fluxului <strong>de</strong> lucru<br />

Noul şablon <strong>de</strong> flux <strong>de</strong> lucru scurtează timpul <strong>de</strong> lucru necesar pentru execuţia instanţelor <strong>de</strong><br />

flux <strong>de</strong> lucru. Operaţiile care sunt mari consumatoare <strong>de</strong> timp ca – cautarea colecţiilor vechi<br />

în repo<strong>si</strong>tory sau ingestul în repo<strong>si</strong>tory-ul extern în Fedora Commons nu mai sunt acum<br />

necesare.<br />

c) Inglobarea interogărilor semantice<br />

Prin înglobarea interogărilor semantice în textul wiki, uilizatorii pot crea pagini dinamice care<br />

încorporeaza interogările cele mai utilizate [115].<br />

Utilizând exportul RDF al SMW, uneltele externe pot beneficia <strong>de</strong> pagini wiki îmbogăţite<br />

semantic.<br />

Figure 5. 9. Fluxul <strong>de</strong> lucru Key Start<br />

45


5.3.1. Descrierea tehnologiei şi <strong>de</strong>zvoltarea<br />

A. Stabilirea furnizorilor <strong>de</strong> date şi/sau metadate şi strategiile <strong>de</strong> integrare. Metadatele sunt<br />

furnizate <strong>de</strong> o unealtă automată şi este nevoie <strong>de</strong> o schemă <strong>de</strong> interoperabilitate a<br />

metadatelor. Aceasta schema conţine elemente care extind schema Dublin Core prin<br />

elemente <strong>de</strong>rivate din ea. Transferul utilizează <strong>si</strong>ntaxa şabloanelor Semantic MediaWiki ca<br />

mediu pentru un formular <strong>de</strong> intrare.<br />

B. Stabilirea repo<strong>si</strong>tory-ului <strong>de</strong>stinatar şi a arhitecturii sale concrete.<br />

Arhitectura Obiectului Digital. Repo<strong>si</strong>tory-ul digital <strong>de</strong>stinaţie este Semantic MediaWiki.<br />

Arhitectura obiectului digital la nivelul repo<strong>si</strong>tory. La nivelul repo<strong>si</strong>tory digital, structura<br />

logica manageabilă este colecţia.<br />

C. Mo<strong>de</strong>lul ales opentru conţinut şi producţia <strong>de</strong> fluxuri <strong>de</strong> lucru. Un set <strong>de</strong> unelte Java<br />

realizează maparea dintre mo<strong>de</strong>lul utilizator şi mo<strong>de</strong>lul repo<strong>si</strong>tory intern din semantic wiki.<br />

Aceste unelte transformă şabloanele (surse wiki) în şabloane SMW şi scriu automat<br />

rezultatul ca pagini intr-un wiki semantic (wiki <strong>de</strong>stinaţie).<br />

D. Servicii <strong>de</strong> maintenanţa şi uneltele aferente. Rapoartele automate nu mai sunt necesare<br />

<strong>de</strong>oarece rezultatele integrarii şi statisticile se bazează pe mecanismele interne SMW care<br />

fac rapoartele automat disponibile în browser.<br />

5.4. A treia arhitectura concretă<br />

Urmatoarea secţiune prezintă rezultatul participarii autorului tezei la un proiect 5 german care<br />

nazuia să construiască un VRE în domeniul istoriei educatiei [157].<br />

5.4.1. Cerintele contextuale ale arhitecturii<br />

Ţelul general este construirea unui mediu <strong>de</strong> cercetare în domeniul educaţiei cu scopul <strong>de</strong> a<br />

analiza lexicoanelor care au o vechime <strong>de</strong> 200 ani. Datele bibliografice sunt utilizate pentru o<br />

analiză bibliometrică; ele vor fi îmbogăţite şi adnotate colaborativ <strong>de</strong> către cercetatori în<br />

scopul facilitării analizei cantitative [156].<br />

Colectia <strong>de</strong> lexicoane în discuţie este original disponibilă într-o biblioteca digitală numită<br />

Scripta Paedagogica Online (SPO) 6 . Este gazduită <strong>de</strong> Biblioteca pentru Istoria Educatiei la<br />

DIPF care a in<strong>de</strong>xat-o şi o poate furniza către terţi. Corpusul conţine un total <strong>de</strong> 22,000<br />

articole şi mai mult <strong>de</strong> 20 lexicoane. Fiecare lexicon este <strong>de</strong>scris bibliografic ca o ediţie<br />

colecţie şi stocată în baza <strong>de</strong> date a bibliotecii sub un <strong>si</strong>stem allegro-C 7 .<br />

Protocolul <strong>de</strong> interoperabilitate Z39.50 implemntat conţine restricţii pentru transferal datelor<br />

în timp real, astfel metadatele necesare în procesul <strong>de</strong> integrare sunt transferate prin fişiere<br />

Allegro-XML [157].<br />

5.4.2. Metodologia<br />

A treia arhitectură este menită să uşureze integrarea datelor structurate externe. Acest mo<strong>de</strong>l<br />

este construit pe mo<strong>de</strong>lul Semantic MediaWiki şi serveşte un Virtual Research Environment.<br />

Principala provocare pentru integrarea datelor este importarea informaţiei structurate eterogen<br />

(date şi metadata) din repo<strong>si</strong>torye digitale externe şi prezentarea lor în wiki utilizând<br />

ontologii. Fluxul <strong>de</strong> procesare a metadatelor este <strong>de</strong>scries în wiki cu ajutorul proprietăţilor<br />

semantice, a şabloanelor semantice şi a interogărilor în timp real [182].<br />

Mecanismul <strong>de</strong> aliniere al procesului <strong>de</strong> integrare între biblioteca digitală, SMW şi<br />

MediaWiki este iterativ şi bidirecţional. Următorii trei paşi au fost <strong>de</strong>terminanţi:<br />

5 Proiectul Virtual Research Environment "Semantic MediaWiki for Collaborative Corpora Analy<strong>si</strong>s” (SMW-<br />

CorA) este finanţat <strong>de</strong> German Research Foundation (DFG), iniţiat <strong>de</strong> DIPF în cooperare cu KIT, BBF şi<br />

cercetători care activeaza în domeniul istoriei educaţiei.<br />

6 Lexicoanele sunt disponibile la http://bbf.dipf.<strong>de</strong>/digitale-bbf/scripta-paedagogica-online/digitali<strong>si</strong>erte-<br />

nachschlagewerke.<br />

7 Vezi http://www.allegro-c.<strong>de</strong>/<br />

46


1. I<strong>de</strong>ntificarea entităţilor relevante la nivelul bibliotecii digitale (colecţii, obiecte<br />

digitale, cataloage <strong>de</strong> metadate şi structura metadatelor) şi mo<strong>de</strong>lul <strong>de</strong> utilizarea pentru<br />

efectuarea cercetării în VRE.<br />

2. Construirea unei ontologii facile pentru ca obiectele din biblioteca să se alinieze cu<br />

MediaWiki şi SMW <strong>si</strong> să ofere o interfaţă a<strong>de</strong>cvată pentru cercetatori.<br />

3. Configurarea unui manager pentru fluxul <strong>de</strong> lucru al procesului <strong>de</strong> integrare care să<br />

satisfacă elementele ontologiei, să creze şabloane şi să genereze instanţe.<br />

Fluxul <strong>de</strong> lucru semi-automat utilizat pentru integrarea metadatelor este <strong>de</strong>scris mai jos şi este<br />

construit având ca suport două tehnologii: şabloanele MediaWiki şi un mo<strong>de</strong>l flexibil al<br />

ontologiei fluxului <strong>de</strong> lucru. Acest flux <strong>de</strong> lucru este teoretic bazat pe [188] şi pe mo<strong>de</strong>lul<br />

flexibil <strong>de</strong> flux <strong>de</strong> lucru expus în [182]. Mo<strong>de</strong>lul <strong>de</strong> referinţă introdus în capitolul 4 este extins<br />

şi adaptat în acest nou context şi utilizează şabloane semantice.<br />

Figure 5. 10. Procesul <strong>de</strong> integrare al metadatelor<br />

5.4.3. Descrierea tehnologiei şi <strong>de</strong>zvoltarea<br />

A. Stabilirea furnizorilor <strong>de</strong> date/metadate, a protocolului <strong>de</strong> transfer şi a strategiei <strong>de</strong><br />

integrare. Structura metadatelor trebuie să urmeze un protocol care să <strong>de</strong>finească schema<br />

pentru interoperabilitatea metadatelor. Aceasta schemă conţine elemente care extend<br />

schema Dublin Core, şi vocabularele controlate Foaf şi Prism. Transferul utilizează<br />

şabloanele Semantic MediaWiki şi un protocol cu furnizorii <strong>de</strong> metadate (biblioteca<br />

digitală) pentru livrarea metadatelor în format XML.<br />

B. Stabilirea repo<strong>si</strong>tory <strong>de</strong>stinaţie şi arhitectura sa.<br />

Arhitectura obiectului digital. Repo<strong>si</strong>tory-ul digital <strong>de</strong>stinatar este repo<strong>si</strong>tory-ul local al<br />

MediaWiki şi arhitectura obiectului digital este <strong>si</strong>milară cu cea a unei paginini wiki<br />

semantice.<br />

Arhitectura Repo<strong>si</strong>tory Digital. Unitatea logică la nivelul repo<strong>si</strong>tory digital şi cu<br />

corespon<strong>de</strong>nt direct la nivelul VRE este colecţia. Structura colecţiei conţine agregări ale<br />

altor obiecte.<br />

C. Dezvoltarea mo<strong>de</strong>lului <strong>de</strong> conţinut şi producţia <strong>de</strong> fluxuri <strong>de</strong> lucru. Un set <strong>de</strong> unelte Java şi<br />

exten<strong>si</strong>i MediaWiki a<strong>si</strong>gură maparea dintre mo<strong>de</strong>lul bibliotecii digitale şi mo<strong>de</strong>lul<br />

repo<strong>si</strong>tory digital semantic wiki. Aceste unelte transformă fişierele XML încarcate în wiki<br />

în şabloane SMW şi scriu automatic rezultatul în pagini wiki semantice.<br />

Componentele principale ale procesului <strong>de</strong> integrare sunt a<strong>si</strong>gurate <strong>de</strong> setul <strong>de</strong> unelte Java<br />

care transformă fişierele XML şi încarcă resursele digitale in wiki [181]. Aceste<br />

componente in<strong>de</strong>pen<strong>de</strong>nte şi re-utilizabile sunt bazate pe tehnologii <strong>de</strong>schise [186][183].<br />

Declanşate <strong>de</strong> un fişier <strong>de</strong> configurare general XML intr-o pagină wiki, aceste unelte pot<br />

47


funcţiona împreună sau in<strong>de</strong>pen<strong>de</strong>nt. Datele transferate între unelte utilizează formatul<br />

XML. Orchestrarea uneltelor <strong>de</strong>pin<strong>de</strong> <strong>de</strong> şablonul fluxului <strong>de</strong> lucru care la randul său este<br />

mapat la şabloanele <strong>de</strong> metadate pentru colectare. Această mapare este specificată prin<br />

intermediul unei pagini <strong>de</strong> configurare wiki în spaţiul <strong>de</strong> nume special “MediaWiki”.<br />

Această pagină wiki conţine parametrii şi comentarii <strong>de</strong>spre modul <strong>de</strong> funcţionare şi<br />

utilizare a şabloanelor wiki.<br />

Unealta <strong>de</strong> integrare recoltează numai paginile wiki care un lexicon în format XML ca<br />

ataşament. De exemplu, parametrul următor specifică numele proprietăţii semantice<br />

prevăzute ca fişier ataşat XML:<br />

attachParam = Wikitext Metadata Attachment<br />

(Configuration parameter as semantic property referring to the lexicon în XML<br />

format)<br />

În exemplul <strong>de</strong> mai sus se specifică că pagina wiki conţinând proprietatea semantică<br />

Wikitext Metadata Attachment conţine ultimul fişier XML pentru recoltarea metadatelor.<br />

Pagina <strong>de</strong> configurare poate fi diferită pentru un alt wiki. Singura constrângere cerută este<br />

ca ambele wiki să aiba exten<strong>si</strong>a SMW activată.<br />

Şabloanele <strong>de</strong> flux <strong>de</strong> lucru care se referă la managementul metadatelor <strong>si</strong> uneltele<br />

prevăzute pentru aceasta sunt: IntegrationLexiconTemplate, AchiveImageResouce şi<br />

UploadImageToWiki. Ultimele două şabloane sunt constrânse după cum urmează: orice<br />

instanţă UploadImageToWiki va funcţiona numai după ce instanţa AchiveImageResouce sa<br />

terminat cu succes [156] [157].<br />

Orice instanţă a fluxului <strong>de</strong> lucru este efectiv mapată pe un lexicon ca unitate logică <strong>de</strong><br />

prelucrare. O instanţă <strong>de</strong> flux <strong>de</strong> lucru poate executa următoarele acţiuni:<br />

a. Furnizorii <strong>de</strong> metadata (Biblioteca Digitală) încarcă metadatele în wiki (metadata<br />

harvesting).<br />

b. Datele în format XML format sunt interogate <strong>de</strong> o unealtă automată Java.<br />

c. Transformările XML şi XSLT sunt bazate pe un protocol <strong>de</strong> transfer (Metadata<br />

Exchange Agreement) şi apoi validate şi crează obiecte digitale ca pagini în wiki.<br />

d. Resursele digitale (imagini) sunt <strong>de</strong>scărcate din biblioteca digitală şi încarcate în<br />

repo<strong>si</strong>tory-ul media wiki. Concomitent se creaza automat noi metadate <strong>de</strong>spre licenţă,<br />

copyright şi proprietarul drepturilor <strong>de</strong> publicare.<br />

e. Metadatele şi resursele media sunt stocate în repo<strong>si</strong>tory-ul digital wiki ca pagini wiki.<br />

D. Servicii <strong>de</strong> întreţinere şi unelte <strong>de</strong>dicate. Rapoartele automate nu sunt necesare pentru că<br />

rezultatele integrării şi statisticile se bazează pe mecanismul intern SMW care le face apoi<br />

disponibile în browser. Prin înglobarea interogărilor în textul wiki, utilizatorii pot crea<br />

pagini dinamice care încorporează cele mai frecvente <strong>si</strong> utilizate interogări.<br />

Utilizarea XML a<strong>si</strong>gură o interfaţă uniformă pentru date şi facilitează integrarea automata<br />

pentru resurse <strong>si</strong>milare aflate în biblioteci digitale. În loc <strong>de</strong> a crea diverse unelte <strong>de</strong><br />

transformare a datelor, se aplică transformări XSLT. Pentru un alt furnizor <strong>de</strong> metadate se<br />

ajustează numai transformările XSLT.<br />

Pentru metoda <strong>de</strong> integrare s-a aplicat o strategie hibridă: Global and Local as View (GLAV)<br />

care poate crea o ve<strong>de</strong>re a surselor <strong>de</strong> date prin generarea unei ve<strong>de</strong>ri <strong>de</strong> ansamblu peste<br />

schema globală <strong>de</strong>scrisă <strong>de</strong> <strong>de</strong>scriptorii surselor. Deoarece această strategie nu este<br />

con<strong>si</strong><strong>de</strong>rată <strong>de</strong>stul <strong>de</strong> flexibilă, este necesară combinarea ei cu meto<strong>de</strong> specific<br />

interoperabilităţii metadatelor, cum este ”crosswalk”. Mai mult, maparea dinamică dintre<br />

<strong>de</strong>scriptori complecşi <strong>de</strong> metadate care mixează elemente din diverse domenii, este a<strong>si</strong>gurată<br />

<strong>de</strong> un profil <strong>de</strong> aplicaţie având suportul versatil al SMW (proprietăţi echivalente, importarea<br />

<strong>de</strong> vocabulare controlate, export RDF) [121].<br />

48


5.4.4. O ontologie <strong>si</strong>mplificată pentru mapare<br />

5.4.4.1. Maparea Metadatelor<br />

Pentru a alinia entităţile bibliografice şi metadatele bibliotecii digitale <strong>si</strong> integrarea acestora in<br />

spaţiul <strong>de</strong> nume MediaWiki este utilizată o schemă <strong>de</strong> mapare (XML/XSLT). Astfel,<br />

principalele entităţi din biblioteca digitală reprezintă pagini wiki utilizând hierarhia <strong>de</strong> pagini<br />

MW. Următioarele relaţii <strong>de</strong> mapare sunt utilizate şi exemplificate în [Figure 5. 11]:<br />

lexicon isEquivalent cu pagina wiki Lexicon.<br />

volumul isEquivalent cu o subpagină wiki<br />

articolul isEquivalent cu o sub-sub-pagină<br />

ficare imagine a unui articol isEquivalent cu o pagină wiki în spatial <strong>de</strong> nume “File”<br />

special pentru media.<br />

Figure 5. 11. Obiectele bibliotecii digitale integrate în Wiki<br />

Imaginile din articole sunt stocate în spatiul <strong>de</strong> nume File al MediaWiki, păstrând metadatele<br />

<strong>de</strong>spre lexicon şi imaginile scanate separate. Se crează o proprietate care conectează articolul<br />

(lemma) cu imaginea, oferind astfel acces direct utilizatorilor. Astfel fiecare proprietate<br />

semantică reprezintă o pagină wiki în spatial <strong>de</strong> nume “Property” al SMW.<br />

Spaţiul <strong>de</strong> nume MediaWiki “File” a<strong>si</strong>gură po<strong>si</strong>bilitatea <strong>de</strong> a vizualiza fişierele media<br />

împreună cu metadatele.<br />

Utilizatorii pot ataşa metadate special create fiecarui fişier media. De obicei, aici este locul<br />

metadatelor relative la dreptul proprietăţii intelectuale. În cazul <strong>de</strong> faţă, se specifică ca<br />

imaginile aparţin <strong>de</strong> drept Bibliotecii Digitale.<br />

Adiţional, ontologia <strong>de</strong> mapare aliniază metadatele obiectelor din biblioteca digital, crează<br />

entităţi şi adaugă aceste metadata sub forma proprietăţilor semantice. Aceasta permite<br />

cercetătorilor să creeze noi entităţi şi să insereze <strong>de</strong>scrieri mai mult sau mai puţin formalizate<br />

acestor pagini wiki. [Figure 5. 12] reprezintă principele aspecte ale mecanismului <strong>de</strong> aliniere.<br />

Schema <strong>de</strong> mapare adresează nece<strong>si</strong>tăţi viitoare şi adaugă proprietăţi SMW obţinute prin<br />

procesare metadatelor. Pentru interacţiunea cu obiectele <strong>de</strong> cercetare şi pentru expunerea<br />

<strong>de</strong>taliată a metadatelor au fost create cateva proprietăţi semantice adiţionale:<br />

• firstPage, lastPage al unui articol, firstName şi lastName al unui autor sau editor<br />

• isPartOf (volum); hasPart (articol), hasImage<br />

• Type (volum, articol, referinţă)<br />

S-a adăugat <strong>de</strong> asemenea un i<strong>de</strong>ntificator pentru manevrarea şi monitorizarea schimbărilor.<br />

49


Figure 5. 12. Mapare dintre schema bibliotecii digitale şi SMW<br />

5.4.4.2. I<strong>de</strong>ntificarea entităţilor relevante pentru interoperabilitate şi re-utilizare<br />

Scopul final al integrării este <strong>de</strong> a oferi datele bibliografice într-un format uniform aşa cum<br />

este RDF, <strong>de</strong> a crea instrumente <strong>de</strong> analiză a acestor capabilităţi şi pentru re-utilizarea parţială<br />

a lanţurilor <strong>de</strong> valori ştiinţifice nou create în aceste comunităţi.<br />

S-au folo<strong>si</strong>t tehnologiile semantice ca platformă principală pentru a<strong>si</strong>gurarea interoperabilităţii<br />

cu analiza şi instrumentele externe bibliografice şi <strong>de</strong> re-utilizarea inter-wiki a metadatelor. În<br />

prima etapă, am folo<strong>si</strong>t vocabulare controlate <strong>de</strong> granularitate fină relative la standar<strong>de</strong>le<br />

Semantic Web (PRISM, SKOS, foaf, DC) pentru a <strong>si</strong>mplifica exportul RDF către terţi.<br />

Elementele acestor vocabularelor au fost integrate în wiki folo<strong>si</strong>nd mecanismul SMW <strong>de</strong><br />

import <strong>de</strong> vocabulare şi ontologii. Astfel proprietăţile <strong>de</strong> mapare între bibliotecă şi metadate<br />

SMW sunt, <strong>de</strong> asemenea, aliniate (<strong>de</strong> exemplu prism:startingPage). Pentru a conferi<br />

bibliotecii digitale po<strong>si</strong>bilitatea <strong>de</strong> a urmări metadatele, este utilizat vocabularul DCterms<br />

pentru specifica aspectele dreptului <strong>de</strong> autor. Următoarea [Figura 5. 13] prezintă o parte din<br />

exportul Semantic MediaWiki RDF catre biblioteca digitală.<br />

Pentru a crea o interfaţă <strong>de</strong> utilizator, schema <strong>de</strong> mapare utilizează <strong>si</strong>stemul MW, <strong>si</strong>ntaxa wiki<br />

şi şabloanelor MW. Au fost generate articole pentru po<strong>si</strong>bilităţile <strong>de</strong> navigare pentru imagini,<br />

şi tabele <strong>de</strong> conţinut aşa cum s-a solicitat <strong>de</strong> către cercetătorii în domeniul educaţiei. În plus,<br />

formele semantice combinate cu şabloane permit cercetătorului modificarea valorilor<br />

proprietăţilor, cum ar fi numele autorilor, fără a utiliza <strong>si</strong>ntaxa wiki. În plus, exten<strong>si</strong>a semantic<br />

form furnizează po<strong>si</strong>bilitatea utilizării <strong>de</strong> vocabulare controlate şi cla<strong>si</strong>ficatorilor pentru a<br />

reduce erorile <strong>de</strong> tastare şi <strong>de</strong> a reglementa adnotarea semantică.<br />

50


Figure 5. 13. Maparea cu vocabulare controlate<br />

În loc <strong>de</strong> a proiecta un VRE în mod izolat, platforma foloseşte o abordare participativă la<br />

<strong>de</strong><strong>si</strong>gn care are drept scop împuternicirea comunităţii <strong>de</strong> cercetare pentru a obţine o implicare<br />

activă în procesul <strong>de</strong> proiectare al VRE. SMW permite o <strong>de</strong>zvoltare agilă a platformei. Acesta<br />

permite acumularea <strong>de</strong> cunoştinţe în domeniul respectiv, şi <strong>de</strong> asemenea, o curbă <strong>de</strong> învăţare<br />

scăzută pentru utilizarea noii platforme multimedia.<br />

Dezvoltarea <strong>si</strong>stemului şi utilizarea lui sunt <strong>si</strong>ncronizate. Acest fenomen este <strong>de</strong>scris în<br />

[Figura 5. 16]. Cercetătorii utilizează <strong>si</strong>stemul, în acelaşi timp cu <strong>de</strong>zvoltarea prototipului. Ei<br />

au cla<strong>si</strong>ficat articolele folo<strong>si</strong>nd "Cuprinsul" [a se ve<strong>de</strong>a Figura 5. 16, la stânga]. Între timp,<br />

cercetatorii au semnalat câteva neconcordanţe între lexiconul real şi datele XML importate<br />

din Biblioteca digitală.<br />

51


Figure 5. 14. Dezoltarea platformei şi provenienţa metadatelor<br />

5.4.5. Realizarea interfeţei utilizator<br />

Interfaţa utilizator profită <strong>de</strong> caracteristicile MediaWiki şi Semantic MediaWiki. Paginile wiki<br />

create automat sunt iniţial “însămanţate” <strong>de</strong> o unealtă automată (bot). Această formatare are<br />

mai multe scopuri:<br />

Utilizarea şabloanelor pentru interfaţă, astfel permiţând separarea metadatelor <strong>de</strong><br />

modul <strong>de</strong> vizualizare;<br />

Utilizarea exten<strong>si</strong>ei semantic forms pentru a permite cercetătorilor categorizarea<br />

articolelor;<br />

Example:<br />

1.<br />

== Nächstes Lemma ==<br />

{{<br />

#ask: [[Category:Lexikon <strong>de</strong>r Pädagogik <strong>de</strong>r Gegenwart]]<br />

[[FirstPage::>{{#show: {{PAGENAME}} | ?LastPage}}]] | ?Titel= | format =<br />

tabel | limit = 1<br />

}}<br />

2.<br />

== Vorheriges Lemma ==<br />

{{<br />

#ask: [[Category:Lexikon <strong>de</strong>r Pädagogik <strong>de</strong>r Gegenwart]]<br />

[[LastPage::


Primul exemplu interoghează wiki pentru a obţine următoarea lemmă, in timp ce al doilea<br />

exemplu interoghează wiki pentru a obţine lemma anterioară. Rezultatul acestori interogări se<br />

observă în următoarea imagine.<br />

Interogări #ask care a<strong>si</strong>gură navigarea între paginile wiki<br />

Utilizarea mecanismului <strong>de</strong> transclu<strong>de</strong>re MW pentru a inclu<strong>de</strong> tabelele <strong>de</strong> conţinut în<br />

paginile lexiconului [See Figure 5. 15, left];<br />

Interogările semantice pentru navigarea în paginile wiki.<br />

Example:<br />

1.<br />

2.<br />

== hat verfasst ==<br />

{{<br />

PAGENAME}} hat insgesamt {{#ask: [[Verfasser::{{PAGENAME}}]]|<br />

| ?Verfasser= | format = count<br />

}} Lemmata verfast.<br />

{{<br />

#ask: [[Verfasser::{{PAGENAME}}]]|<br />

| ?Verfasser= | format = table<br />

}}<br />

În exemplul anterior, prima interogare returnează numărul <strong>de</strong> articole care aparţin unui autor<br />

iar a doua interogare returnează lista lucrărilor autorului respectiv.<br />

53


Figure 5. 15. Tabela <strong>de</strong> conţinut (stânga) şi pagina principal al ediţiei Spieler Lexikon(dreapta)<br />

aşa cum apar ele în SMW<br />

5.4.6. Unealta <strong>de</strong> adnotare şi managentul drepturilor <strong>de</strong> proprietate intelectuală<br />

O abordare separată se ocupă cu conţinutul digital, în special cu imaginile din lexicon. În<br />

cazurile menţionate anterior, imaginile sunt “cetăţeni cu drepturi <strong>de</strong>pline”. MediaWiki impune<br />

constrângeri în utilizarea conţinutului media, din cauza cerinţelor drepturilor <strong>de</strong> proprietate<br />

intelectuală (IPR).<br />

În mod regulat în <strong>si</strong>te-uri bazate pe HTML, orice imagini <strong>de</strong> pe net poate fi încorporată, fără<br />

prea mult grijă pentru drepturile intelectuale <strong>de</strong> management al datelor. Mecanismele<br />

MediaWiki pot preveni această încălcare, cerând explicitarea unei "surse <strong>de</strong> date prietenoasă<br />

la distanţă", un repo<strong>si</strong>tory comun local serverului sau un repo<strong>si</strong>tory intern al wiki-ului curent.<br />

O cerinţă specială pentru această arhitectură concretă a fost crearea unui instrument <strong>de</strong><br />

adnotare. În momentul în care s-a scris <strong>teza</strong>, este disponibil numai un instrument <strong>de</strong> adnotare<br />

<strong>si</strong>mplă.<br />

Prin urmare, am conceput un instrument care <strong>de</strong>scărca imagini din repo<strong>si</strong>tory-ul furnizor <strong>de</strong><br />

date şi îl încărcă în MediaWiki. Imaginile trebuie să fie încărcate în repo<strong>si</strong>tory-ul intern<br />

MediaWiki şi să creeze şi imagini în format redus (thumbnails). Concomitent, crearea<br />

metadatelor IPR este obligatorie, astfel se crează metadatele: <strong>de</strong> licenţă, <strong>de</strong>claraţia <strong>de</strong> licenţă,<br />

<strong>de</strong> proprietate, etc<br />

În a doua etapă se poate folo<strong>si</strong> instrumentul adnotator. Adnotările pot cuprin<strong>de</strong> o gamă largă<br />

<strong>de</strong> informaţii, având gra<strong>de</strong> diferite <strong>de</strong> formalizare. Adnotarea poate fi informală – numai<br />

wikitext - sau wikitext complet formalizat cu proprietăţi semantice.<br />

Diagrama <strong>de</strong> mai jos prezintă instrumentul modificat numit MediaWiki Image-Annotator care<br />

realizează adnotarea <strong>de</strong> bază aşa cum funcţionează <strong>de</strong>ocamdată.<br />

54


Figure 5. 16. Adnotarea imaginilor prin utilizarea <strong>de</strong> propertăţi semantice<br />

Figure 5. 17. Metadatele IPR ataşate automat <strong>de</strong> unealtă.<br />

Diagrama <strong>de</strong> mai sus arată explicit metadatele Data Right Management care au fost ataşate<br />

automatic <strong>de</strong> către unealtă imaginii. Acestea, împreună cu metadatele ataşate manual <strong>de</strong> către<br />

cercetători, formează o bază <strong>de</strong> cunoştinţe care va putea fi interogată mai tarziu <strong>de</strong> către<br />

uneltele <strong>de</strong> analiză.<br />

55


6. PLATFORMA DE EVALUARE<br />

6.1. Validarea mo<strong>de</strong>lului<br />

Mo<strong>de</strong>lul Mediator este menit să a<strong>si</strong>gure interoperabilitatea semantică, după cum am văzut<br />

<strong>de</strong>ja în capitolul 2 al tezei. Mo<strong>de</strong>lul propus funcţionează bi-directional, şi poate să gestioneze<br />

doua repo<strong>si</strong>tory în acelaşi timp. El este aliniat cu mo<strong>de</strong>lul <strong>de</strong> referinţă DELOS şi la mo<strong>de</strong>lul<br />

<strong>de</strong> conţinut al Fedora Commons. Este compatibil cu mo<strong>de</strong>lele prezentate în [131] şi [38].<br />

A<strong>si</strong>gurarea interoperabilităţii în domeniul tehnologiei informaţiei şi <strong>de</strong> cercetare este o sarcină<br />

dificilă.<br />

Parteneri implicaţi sunt entităţi complexe care au <strong>de</strong>zvoltat instrumente pentru i<strong>de</strong>ntificare sau<br />

e-Learning şi/sau furnizori <strong>de</strong> date sau cercetători. Aceşti participanţi sunt con<strong>si</strong><strong>de</strong>raţi <strong>si</strong>steme<br />

separate, care ar trebui să interoperează la mai multe niveluri.<br />

Procesul va fi analizat având ca indicatori aspectele promulgate <strong>de</strong> Systems of Systems<br />

Interoperability Mo<strong>de</strong>l (SoSI) [136]. Pentru a realiza acest lucru, ne propunem să folo<strong>si</strong>m<br />

mo<strong>de</strong>lul MediaWiki, subliniind "cele mai bune practici", procesele şi meto<strong>de</strong>le care ar putea fi<br />

adoptate cu uşurinţă şi <strong>de</strong> către alte proiecte sau comunităţi restrânse. În conformitate cu<br />

mo<strong>de</strong>lul SoSI, implicarea utilizatorului în întreagul proces a<strong>si</strong>gură cel mai înalt nivel <strong>de</strong><br />

interoperabilitate.<br />

Prin urmare, soluţiile <strong>de</strong> interoperabilitate sunt limitate în mod necesar [174], <strong>de</strong>oarece<br />

nazuinţa <strong>de</strong> a captura semantica comună a datelor între diferitele <strong>si</strong>steme duce la nece<strong>si</strong>tatea<br />

<strong>de</strong>finirii <strong>de</strong> exten<strong>si</strong>i <strong>de</strong> <strong>si</strong>stem specifice care să reflecte intenţia şi cazurile specifice <strong>de</strong><br />

utilizare a <strong>si</strong>stemului pentru fiecare furnizor <strong>de</strong> date în parte.<br />

La nivel <strong>si</strong>ntactic efortul <strong>de</strong> standardizare adoptat a<strong>si</strong>gură suficientă interoperabilitate. Un<br />

profil standard <strong>de</strong> aplicaţie bazat pe standar<strong>de</strong>le existente, este o soluţie <strong>de</strong> dorit, dar o sarcină<br />

dificilă.<br />

La nivelul aplicaţiei (constructiv), mai multe tehnologii actuale prevăd elementele <strong>de</strong><br />

interoperabilitate.<br />

Dar, la cel mai înalt nivel <strong>de</strong> interoperabilitate la nivelul <strong>si</strong>stemului, care implică<br />

interoperabilitate programatică şi operaţională, toate soluţiile actuale pot adresa doar o parte a<br />

realităţii complexe a unei organizaţii. Critic, nivelul <strong>de</strong> expertiza tehnologica impus <strong>de</strong> unele<br />

soluţii este dincolo <strong>de</strong> po<strong>si</strong>bilităţile multor comunităţi mici sau medii.<br />

Evi<strong>de</strong>nt, formatul <strong>de</strong> date XML şi validare pe baza schemei adresează parţial unele dintre<br />

aceste probleme tehnice. Cu toate acestea, o restricţie la schema XML a transferului <strong>de</strong> date ar<br />

putea fi dincolo <strong>de</strong> capacităţile tehnologice ale multor utilizatori. În consecinţă, această nouă<br />

metodă <strong>de</strong> transfer bazată pe <strong>si</strong>ntaxa <strong>si</strong>mplă MediaWiki s-a dovedit a fi o soluţie viabilă.<br />

În ceea ce priveşte mo<strong>de</strong>lul <strong>de</strong> interoperabilitate SoSI, am putea sublinia următoarele [187]:<br />

A. Paşi pentru a realiza interoperabilităţii programatice:<br />

tratatele și politicile pentru transferul metadatelor<br />

utilizarea <strong>de</strong> şabloane MediaWiki<br />

protocoale <strong>de</strong> nivelul tehnologic scăzut între MediaWiki şi furnizorii <strong>de</strong> date.<br />

B. Paşi pentru realizarea interoperabilitaţii constructive:<br />

procese inginereşti: MediaWiki API, exten<strong>si</strong>i MediaWiki, formate <strong>de</strong> date<br />

standar<strong>de</strong> <strong>de</strong> date: XML, Resource Description Framework (RDF), Dublin Core<br />

acordurile tehnice între participanţi.<br />

Utilizarea ontologiilor prin angajarea infrastructurii Semantic MediaWiki la nivel <strong>de</strong><br />

tehnologie semantică (RDF, RDFS), permite o abordare axată pe utilizator şi o <strong>de</strong>zvoltare <strong>de</strong><br />

schemă <strong>si</strong>mplificată.<br />

56


C. Prin intermediul mecanismului Category al MediaWiki, furnizorii <strong>de</strong> date sunt informaţi cu<br />

privire la rezultatele stocării <strong>de</strong> metadate. Acest feedback pentru furnizorii <strong>de</strong> date realizează<br />

interoperabilitatea operaţională <strong>de</strong> bază.<br />

Con<strong>si</strong><strong>de</strong>rând cele <strong>de</strong> mai sus, susţinem că platforma bazată pe MediaWiki a<strong>si</strong>gură un nivel <strong>de</strong><br />

bază operaţional în conformitate cu mo<strong>de</strong>lul SoSI <strong>de</strong> interoperabilitate.<br />

6.2. Analiza performanţelor tehnice ale uneltelor<br />

Rezultatele evaluării metodologiei <strong>de</strong> ingest folo<strong>si</strong>nd MediaWiki şi managementul automat al<br />

fluxului <strong>de</strong> lucru <strong>de</strong>monstrează că metoda noastră este <strong>de</strong> încre<strong>de</strong>re. Instanţe multiple ale<br />

şablonului fluxului <strong>de</strong> lucru conlucrat împreună şi în timpul acestui test am arătat gradul <strong>de</strong><br />

utilizare a resurselor, performanţele şi calitatea procesului <strong>de</strong> ingest. Condiţii extreme (<strong>de</strong><br />

exemplu refuzul <strong>de</strong> serviciu (<strong>de</strong>nial of service), colecţii foarte mari procesate concomitent,<br />

număr maxim <strong>de</strong> instanţe ale fluxului <strong>de</strong> lucru executate concomitent), au fost <strong>si</strong>mulate cu<br />

scopul <strong>de</strong> a <strong>de</strong>monstra valabilitatea abordării noastră. În timpul testelor, am extras mai mulţi<br />

indicatori <strong>de</strong> performanţă:<br />

1. memoria folo<strong>si</strong>tă <strong>de</strong> către serviciul <strong>de</strong> ingest al aplicaţie:<br />

Serviciul Ingest utilizează 320MB <strong>de</strong> memorie la încărcare maxima şi 50% din puterea<br />

unui procesor <strong>de</strong> 1,8 GB, din cauza utilizării motorului XSLT Xalan-Java 2.7.1.<br />

Pregătirea <strong>de</strong> ingest a metadatelor utilizează cea mai multă memorie, ingestul efectiv<br />

foloseşte doar 60MB <strong>de</strong> memorie.<br />

2. rezultatele testelor<br />

• După testarea serviciului <strong>de</strong> ingest pe cea mai mare colecţie (Vascular Plants), se raportează,<br />

după cum urmează:<br />

• pregătirea <strong>de</strong> ingest: 52 minute. Validarea fişierelor <strong>si</strong> împărţirea lor în mai multe elemente<br />

<strong>de</strong> acelaşi nivel a luat 35 <strong>de</strong> minute timp total calculat pentru 49851 obiecte.<br />

Ingestul ca atare a durat 12:50:00 - 17:45:00 PM, aproximativ 10.000 <strong>de</strong> obiecte digitale / oră.<br />

Rezultatele tesării pentru colecţia Vascular Plants<br />

Criteriul Un <strong>si</strong>ngur flux activ Trei fluxuri active<br />

Timp <strong>de</strong> recoltare 7 min 10 min<br />

Timp <strong>de</strong> preprocesare 10 min 17 min<br />

Timp <strong>de</strong> validare 21 min 36 min<br />

Tmp <strong>de</strong> generare al fişierelor<br />

FOXML<br />

11 min 20 min<br />

Timp <strong>de</strong> eliminare a colecţiilor<br />

vechi<br />

80 min 98 min<br />

Timp <strong>de</strong> ingest efectiv 345 min 420 min<br />

6.3. Un cadru pentru evaluarea factorului <strong>de</strong> întrebuinţare<br />

6.3.1. Extragerea datelor din Metadata Aggregation Reports<br />

Într-o primă abordare a recoltării metadatelor în care furnizorii trimiteau metadatele utilizând<br />

meto<strong>de</strong> tradiţionale (email, transfer direct pe server, etc) şi rezultatele ingestului au urmat<br />

aceaşi politică, adică ele au fost exportate în format document şi fişierul rezultat trimis prin email<br />

furnizorilor. Au fost întâmpinate problem diverse atât cu metoda <strong>de</strong> recoltarea<br />

metadatelor cat şi cu acest fişier <strong>de</strong> feedback (<strong>de</strong> exemplu, probleme <strong>de</strong> codare, dificultăţi <strong>de</strong><br />

control al calităţii). Instrumentul <strong>de</strong> ingest folosea o bază <strong>de</strong> date MySQL pentru stocarea<br />

erorilor şi mesajelor <strong>de</strong> avertizare.<br />

57


Având în ve<strong>de</strong>re nivelul scăzut <strong>de</strong> expertiză tehnologică a părţilor interesate, s-a <strong>de</strong>cis să se<br />

pună în aplicare o soluţie acce<strong>si</strong>bilă pentru furnizorii <strong>de</strong> date non-experţi. Mo<strong>de</strong>lul MediaWiki<br />

odata ales s-a extins şi la raportarea rezultatelor ingestului catre furnizori, după cum s-a<br />

dovedit a fi o solutie scalabilă. Utilizarea <strong>de</strong> template-uri în paginile MediaWiki permite<br />

prezentarea şi citirea mai uşoră a datelor şi raportare a erorilor furnizorii pot actualiza datele<br />

lor în orice moment <strong>de</strong> la propriile computere.<br />

Pentru a standardiza diferitele metadate eşantion colectate <strong>de</strong> la furnizori, a fost proiectat un<br />

acord <strong>de</strong> schimb <strong>de</strong> metadate. El <strong>de</strong>fineşte tipurile <strong>de</strong> resurse implicate în proiect şi, <strong>de</strong><br />

asemenea, câmpurile <strong>de</strong> metadate pentru fiecare tip <strong>de</strong> resursă, <strong>de</strong> exemplu, titlul, cuvinte<br />

cheie, categoria subiectului, <strong>de</strong>numiri ştiinţifice, licenţă şi drepturi <strong>de</strong> autor, formatul şi URIuri.<br />

Acestea oferă suport pentru resursele disponibile la nivele <strong>de</strong> calitate diferite (<strong>de</strong> exemplu,<br />

<strong>de</strong> înaltă rezoluţie, optimizate pentru web, sau <strong>de</strong> diferite marimi, miniatură), sub diferite<br />

URI-uri, şi pentru mai multe limbi (titlul <strong>de</strong> exemplu, în limba engleză, precum şi limba<br />

slovenă). Se specifică, <strong>de</strong> asemenea elementele <strong>de</strong> metadate care sunt obligatorii, solicitate<br />

urgent, sau opţionale, pentru fiecare tip <strong>de</strong> resursă.<br />

6.3.2. Sabilirea corpusului<br />

În această secţiune, vom utiliza datele reale on-line obţinute prin procesul <strong>de</strong> bootstrapping al<br />

Metadata Aggregation Report. Vrem să <strong>de</strong>monstrăm faptul că rata <strong>de</strong> eroare este mai mică<br />

<strong>de</strong>cât prin metoda batch din prima abordare pentru recoltarea <strong>de</strong> metadate. Am comparat<br />

calitatea metadatelor care rezultă din ambele studii.<br />

În prezent, există 2.067.224 <strong>de</strong> metadate disponibile în repo<strong>si</strong>tory-ul Fedora Commons,<br />

agregate în 132 colecţii. Aceste colecţii, transmise <strong>de</strong> furnizori <strong>de</strong> date sunt în continuare<br />

disponibile on-line. Raportul <strong>de</strong> Agregarea al Metadatelor este o pagina wiki, care conţin<br />

feedback-ul după fiecare activitate <strong>de</strong> ingest. Raportul <strong>de</strong> Agregare al Metadatelor este legat<br />

cu datele din pagina wiki a colectiei la care raportul face referinţă.<br />

În timp, metadatele au fost transmise <strong>de</strong> mai multe ori şi astfel ele sunt mapate pe ver<strong>si</strong>uni<br />

diferite ale aceleiaşi pagina wiki <strong>de</strong> Raport <strong>de</strong> agregare al metadatelor<br />

Rezultatul acestor rapoarte MediaWiki este analizate automat <strong>de</strong> către un agent care<br />

realizează analiza statistică.<br />

Am construit un instrument pentru captarea semanticii informaţiilor conţinute acolo.<br />

Coroborând acest lucru cu informaţiile obţinute <strong>de</strong> la prima abordare, pretin<strong>de</strong>m acum că a<br />

doua abordare este benefică pentru utilizator. Aceasta este "veriga lipsă" pentru atingerea<br />

interoperabilităţii operaţionale.<br />

6.3.3. Stabilirea meto<strong>de</strong>i <strong>de</strong> evaluare<br />

Am adoptat o metodă data-driven <strong>de</strong> evaluare a rezultatului.<br />

În primul rând, am transformat fiecare revizie a paginii wiki într-o pagină separată semantic<br />

wiki, pentru oferi datele pentru analiză şi interogare semantică.<br />

Pentru a compara rezultatele, instrumentul a căutat <strong>de</strong> asemenea colecţia corespunzătoare care<br />

a fost stocata cu prilejul primei abordări.<br />

Algoritmul <strong>de</strong> mapare este bazat pe algoritmul <strong>de</strong> <strong>si</strong>militudine folo<strong>si</strong>nd patru variabile:<br />

numele furnizorului, ID-ul <strong>de</strong> colectare, nume <strong>de</strong> colecţie şi URI-ul relevant <strong>de</strong> metadate<br />

(Best_Quality_URI). Acest algoritm reprezintă un mo<strong>de</strong>l real, <strong>de</strong> asemenea, utilizat pentru a<br />

oferi măsura a ceea ce este con<strong>si</strong><strong>de</strong>rat o aproximare rezonabilă pentru o anumită utilizare, şi<br />

anume numele colecţiei se putea schimba între recoltarea metadatelor primul şi al doilea<br />

sondaj. Algoritmul funcţionează după cum urmează:<br />

58


1. Gaseşte toţi furnizorii ale colectii <strong>de</strong> metadata <strong>de</strong> la prima<br />

abordare;<br />

2. Gaseste toate colecţiile <strong>de</strong> la al doilea abordare.<br />

3. I<strong>de</strong>ntificaţi colecţiile ambelor abordări utilizând Resource_ID. Dacă<br />

ID-ul lipseşte sau nu este prezent în ambele sondaje, atunci:<br />

4. Aplică algoritmi <strong>de</strong> căutare bazat pe Distanţa fuzzy Levenshtein<br />

pentru aproximarea numelui colecţiei. Această căutare poate returna<br />

mai multe rezultate candidat. De obicei, nu mai mult <strong>de</strong> trei rezultate<br />

sunt preluate.<br />

5. Algoritmul caută apoi metadatele relevante din interiorul obiectelor<br />

digitale. În principal este utilizat apoi Best_Quality_URI.<br />

Procedura implică apoi scrierea <strong>de</strong> pagini semantice intr-un wiki semantic. Paginile wiki<br />

create <strong>de</strong> acest process sunt disponibile online, la:<br />

http://biowikifarm.net/test2/Category:Evaluation. Acest corpus astfel obţinut poate fi mai apoi<br />

pentru a obţine şi alte rezultate <strong>de</strong> interes statistic.<br />

Figure 6. 1. Exemplu <strong>de</strong> Metadata Aggregation Report în SMW, după o operaţiune <strong>de</strong><br />

preprocesare<br />

Am evaluat rata erorilor şi a mesajelor <strong>de</strong> avertizare. Numărul total <strong>de</strong> obiecte a fost calculate<br />

ca:<br />

Total number of objects = number of ingested objects + number of errors.<br />

(obiectele digitale conţinănd erori nu au fost stocate în reposotory ca urmare a procesului <strong>de</strong><br />

ingest).<br />

Error rate = number of errors / total number of objects.<br />

Warning rate = number of warnings / total number of objects.<br />

59


Rata <strong>de</strong> eroare a fost calculate pentru fiecare revizie a fiecărei colecţii. O tabelă globala este<br />

<strong>de</strong> asemenea diponibilă online.<br />

Urmatoarea tabelă prezintă un total:<br />

Rapoartele aferente celor două abordări<br />

Caracteristică Prima abordare A doua abordare<br />

Rata erorilor 0,04 0,03<br />

Rata mesajelor <strong>de</strong> avertizare 0,03 0,02<br />

Obiecte stocate in repo<strong>si</strong>tory 184.209 191.800<br />

Numărul <strong>de</strong> erori 5063 5047<br />

Numărul mesajelor <strong>de</strong> avertizare 3915 2812<br />

Următoarea diagram ilustrează distribuţia ratei erorilor în colecţii.<br />

Figure 6. 2. Rata erorilor pe colecţii<br />

Asa după cum se observă, rata mesajelor <strong>de</strong> avertizare este mai mica <strong>de</strong>cât rata erorilor.<br />

60


Figure 6. 3. Rata mesajelor <strong>de</strong> avertziare pe colecţii<br />

Evoluţia în timp a ratei erorilor pe colecţii poate <strong>de</strong>monstra importanţa colaborarii pentru<br />

activitatea <strong>de</strong> management al unui repo<strong>si</strong>tory <strong>de</strong> metadate.<br />

Figure 6. 4. Evoluţia în timp a ratei erorilor pe o colecţii.<br />

61


În continuare, este prezentată analiza rezultatelor pentru o <strong>si</strong>ngură colecţie. Rată erorilor<br />

pentru prima abordare este prezentată ca prima bară, în roşu închis. Rata <strong>de</strong> eroare a scăzut în<br />

mod constant până la sfârşitul perioa<strong>de</strong>i <strong>de</strong> evaluare. Aparent, rata <strong>de</strong> eroare rămâne aceeaşi<br />

atunci cand numărul <strong>de</strong> obiecte creşte. Colorată in mov, rata <strong>de</strong> eroare a scăzut uşor, dar ea<br />

rămâne constantă după 14.10.2010. O privire mai atentă la datele <strong>de</strong> evaluare indică faptul că<br />

un "bot" (unealtă automată MediaWiki) este responsabilă pentru ultimele metadata încărcate<br />

în colecţiile aferente.<br />

Concluzia este că metoda <strong>de</strong> colaborarea cu factorul uman este funcţională, şi ar trebui să fie<br />

exten<strong>si</strong>bila şi la unelte automate. Pentru a în<strong>de</strong>plini acest obiectiv, trei opţiuni sunt<br />

disponibile:<br />

Să <strong>de</strong> ofere un feedback semantic automat instrumentului automat pe care acest<br />

instrument să poată să-l analizeze, astfel încât propagarea erorilor să fie redusă la<br />

minim;<br />

Coraborarea feedback-ul uman lizibil cu notificările prin e-mail către furnizorul <strong>de</strong><br />

metadate;<br />

Scrierea <strong>de</strong> scurte notificări automate pe o pagină <strong>de</strong> discuţie. MediaWiki preve<strong>de</strong><br />

notificarea automată prin mesaje pe paginile <strong>de</strong> discuţie.<br />

Fiecare dintre aceste meto<strong>de</strong> poate fi implementată folo<strong>si</strong>nd Semantic MediaWiki. Ultima<br />

metodă pare mai atrăgătoare pentru că utilizează caracteristica cea mai importantă în<br />

MediaWiki: consensul prin accord mutual.<br />

Figure 6. 5. Rata <strong>de</strong> eroare pentru o <strong>si</strong>ngură colecţie<br />

62


7. CONCLUZII ŞI DIRECŢII<br />

ULTERIOARE DE CERCETARE<br />

Scopul principal al tezei este îmbunătăţirea calităţii managementului metadatelor pe Web, în<br />

general, şi <strong>de</strong> a obţine, astfel, avantaje din utilizarea <strong>de</strong> instrumente mai bune, medii <strong>de</strong><br />

colaborare mai bune şi creşterea gradului <strong>de</strong> întrebuinţare al tehnologiilor webului semantic,<br />

<strong>de</strong> exemplu, a ontologiilor prin furnizarea <strong>de</strong> meto<strong>de</strong> utilizabile pentru utilizatorii non-expert .<br />

În loc <strong>de</strong> o cla<strong>si</strong>ficare a celor mai bune meto<strong>de</strong> care ar putea eventual să ne spună dacă un<br />

mo<strong>de</strong>l <strong>de</strong> management al repo<strong>si</strong>tory-ului este cel mai bun, am optat pentru cea mai buna<br />

abordare pentru un context dat. Am arătat că mediile colaborative online ajută la scă<strong>de</strong>rea<br />

costurilor <strong>de</strong> întreţinere pentru gestionarea repo<strong>si</strong>tory-ului şi prin oferirea <strong>de</strong> meto<strong>de</strong> care<br />

semnalează po<strong>si</strong>bilele erori în avans. Rezultatele acestor evaluări sunt prezentate mai apoi,<br />

indicând gradul <strong>de</strong> întrebuinţare al meto<strong>de</strong>i şi al patformei. După evaluare, a <strong>de</strong>venit clar<br />

faptul că aceste meto<strong>de</strong>, fie <strong>si</strong>ngure, fie în combinaţie, pot garanta cele mai bune rezultate<br />

doar împreună cu implicarea comunităţii în toate activităţile legate <strong>de</strong> managementul<br />

metadatelor.<br />

7.1. Rezultatele<br />

Rezultatul acestei teze este un mo<strong>de</strong>l <strong>de</strong> referinţă şi trei platforme pentru gestionarea<br />

colaborativă a repo<strong>si</strong>tory-ului <strong>de</strong> metadate. Platformele organizează meto<strong>de</strong> şi instrumente în<br />

conformitate cu trei dimen<strong>si</strong>uni: tehnologice (meto<strong>de</strong> inginereşti, tehnologii şi protocoale<br />

tehnice), social şi organizaţional (colaborare, contextual, adaptabilitate, concizie, coerenţă şi<br />

antrenament organizaţional) şi aspecte semantice (<strong>de</strong> vocabular, <strong>si</strong>ntaxă, structură şi<br />

reprezentare). Am adăugat o serie <strong>de</strong> tehnici noi pentru setul <strong>de</strong> instrumente comunitare cu<br />

scopul <strong>de</strong> a construi un repo<strong>si</strong>tory, pentru a gestiona şi <strong>de</strong> a integra date din surse eterogene.<br />

Am <strong>de</strong>monstrat că, cu puţine resurse materiale şi umane, platformele colaborative pot sprijini<br />

infrastructura unui repo<strong>si</strong>tory şi a unui VRE.<br />

Platformele implementate în această teză sunt, <strong>de</strong> asemenea, o noutate în măsura în care au<br />

pus accentul pe unele meto<strong>de</strong> <strong>de</strong> evaluare a mediilor colaborative din perspectiva<br />

utilizatorului.<br />

Pentru a rezuma, vom trece în revistă cateva din întrebările iniţiale <strong>de</strong> cercetare.<br />

Principala provocare pentru managementul repo<strong>si</strong>tory digital este <strong>de</strong> a construi şi livra<br />

conţinutul digital adăugând beneficiile repo<strong>si</strong>tory, fără a împovara creatorii <strong>de</strong> conţinut şi<br />

utilizatorii finali, cu procese suplimentare. Abordările noastre în<strong>de</strong>plineasc acest <strong>de</strong>zi<strong>de</strong>rat<br />

prin utilizarea semi-automată sau gestionarea automată a fluxului <strong>de</strong> lucru.<br />

Table 7.1. <strong>Rezumat</strong>ul întrebarilor cercetării<br />

Intrebare Răspunsul dat <strong>de</strong> teză<br />

Care sunt factorii care influenţează<br />

nece<strong>si</strong>tăţile şi beneficiile în<br />

managementul repo<strong>si</strong>tory <strong>de</strong> metadate?<br />

Care este mo<strong>de</strong>lul cel mai potrivit<br />

pentru reprezentarea artefactelor aflate<br />

în diferite gra<strong>de</strong> <strong>de</strong> formalizare şi<br />

permite folo<strong>si</strong>rea lor în mod uniform?<br />

Care metodă este cea mai potrivita<br />

pentru încurajarea participarii<br />

Nece<strong>si</strong>tăţile utilizatorului şi cerinţele stipulate<br />

pentru un me<strong>de</strong>l semantic <strong>de</strong> repo<strong>si</strong>tory digital.<br />

Utilizarea unui wiki care sa înglobeze achiziţia <strong>de</strong><br />

cunoştinţe şi managementul partajat al<br />

repo<strong>si</strong>tory. Extin<strong>de</strong>rea funcţionalităţii wiki pentru<br />

satisfice cerinţele <strong>de</strong> <strong>de</strong>scoperire semantică a<br />

metadatelor.<br />

Meto<strong>de</strong> colaborative. Proiectarea unui feedback<br />

şi bazarea pe inteligenţa comunităţii. Se aleg<br />

63


utilizatorilor la întregul proces <strong>de</strong><br />

management al conţinutului digital?<br />

Ce metodologie este curent acceptată<br />

pentru a contra-balansa nivelului scăzut<br />

<strong>de</strong> expertiză tehnologică a utilizatorilor<br />

finali, cu nivelele ridicate ale<br />

nece<strong>si</strong>tăţilor funcţionale şi nonfuncţionale<br />

pe care platforma finală ar<br />

trebui să le în<strong>de</strong>plinească?<br />

tehnologii potrivite pentru a atinge scopurile,<br />

adoptarea <strong>de</strong> meto<strong>de</strong> neinvazive, ajută utilizatorul<br />

“să se alinieze” politicii comunităţii. Încre<strong>de</strong>rea<br />

în alegerea consensusului şi politici <strong>de</strong> contract.<br />

Scutirea utilizatorului <strong>de</strong> sarcini împovărătoare.<br />

Utilizarea wiki ca infrastructură. Schimbarea<br />

pon<strong>de</strong>rii <strong>de</strong> la <strong>de</strong>zvoltator la utilizator. Adoptarea<br />

<strong>de</strong> meto<strong>de</strong> automate pentru managementul<br />

repo<strong>si</strong>tory. Adoptarea tehnologiilor semantice<br />

<strong>si</strong>mple şi a ceea ce aceste medii au cel mai<br />

valoros: accentul pe contract. Tehnologiile se<br />

shimbă, dar acordurile rămân valabile pentru<br />

tot<strong>de</strong>auna.<br />

Acest lucru nu numai ca va îmbunatăţi disponibilitatea şi utilizarea <strong>de</strong> resurse digitale pe<br />

Web, dar, <strong>de</strong> asemenea, subliniază şi o cale <strong>de</strong> reconciliere a celor două direcţii <strong>de</strong> cercetare<br />

linked data şi gestionare a resurselor digitale, subliniind interesul comun convergent din<br />

fiecare dintre acestea.<br />

7.2. Rezultate tehnologice<br />

Soluţiile tehnologice pot fi împărţite în următoarele: Metadata Repo<strong>si</strong>tory Management<br />

Platform Definition, Metadata Repo<strong>si</strong>tory Management Tools, Automatic Workflow<br />

Execution, Workflow Visualization, Explicit User Feedback, şi Process Definition.<br />

7.3. Contributii<br />

Teza pretin<strong>de</strong> că răspun<strong>de</strong> principalelor provocări ridicate <strong>de</strong> managementul repo<strong>si</strong>tory-ului:<br />

<strong>de</strong> a construi şi livra conţinut digital şi a exploata beneficiile repo<strong>si</strong>tory-ului fără a împovara<br />

creatorii <strong>de</strong> conţinut şi utilizatorii finali cu procese suplimentare. Responsabilizarea<br />

utilizatorul <strong>de</strong> zi cu zi cu toate prerogativele administratorului <strong>de</strong> metadate restabileşte doar<br />

relaţia naturală între conţinutului digital şi cei care l-au creat.<br />

Această abordare nu este <strong>si</strong>ngulară, având în ve<strong>de</strong>re fiecare din părţile componente, ea fiind<br />

originală în măsura in care am re-examinat, re-utilizat şi mixat părţi ale mo<strong>de</strong>lului OAIS<br />

pentru gestionarea repo<strong>si</strong>tory con<strong>si</strong><strong>de</strong>rând şi tehnologiile semantice, într-o manieră orientată<br />

utilizator şi <strong>si</strong>milară paradigmei Social Semantic Web.<br />

7.3.1. Contribuţii teoretice<br />

A. O analiză completă a managementului repo<strong>si</strong>tory digital (DRM) şi Semantic MediaWiki.<br />

În primul rând, am con<strong>si</strong><strong>de</strong>rat <strong>si</strong>stemele <strong>de</strong> management al repo<strong>si</strong>tory digital orientate pe<br />

mo<strong>de</strong>l şi implementările <strong>de</strong> biblioteci digitale bazate pe software-ul open source existent.<br />

Am i<strong>de</strong>ntificat astfel principalele mo<strong>de</strong>le care stau la baza acestora precum şi limitele<br />

inerente şi constrângerile. În al doilea rând, am studiat mo<strong>de</strong>lul Semantic Wiki şi<br />

implementările existente, care i<strong>de</strong>ntifică caracteristici, funcţionalităţi şi diversele abordări<br />

oferite <strong>de</strong> <strong>si</strong>stemele recente. În al treilea rând, am studiat caracteristicle (Semantic)<br />

MediaWiki. A fost efectuat, <strong>de</strong> asemenea un studiu comparativ cu alte <strong>si</strong>steme <strong>de</strong><br />

management al conţinutului.<br />

B. Un nou mo<strong>de</strong>l <strong>de</strong> referinţă. Mo<strong>de</strong>lul <strong>de</strong> referinţă este construit într-un mod abstract,<br />

acoperind cerinţele din diferite cazuri <strong>de</strong> utilizare şi a fluxurilor <strong>de</strong> lucru implicate.<br />

Urmând mo<strong>de</strong>lul ciclului <strong>de</strong> viaţă al obiectului digital, mo<strong>de</strong>lul <strong>de</strong>scris cuprin<strong>de</strong>: (i) faze,<br />

sub-procese, şi sarcini, (ii) inter-conectarea tranziţiilor, (iii) taskuri specifice, şi (vi)<br />

formele datelor generate şi prelucrate <strong>de</strong> abordările propuse.<br />

C. Introducerea unei ontologii <strong>de</strong> nivel înalt pentru gestionarea colaborativă a repo<strong>si</strong>tory-ului.<br />

D. Conceperea unei meto<strong>de</strong> noi <strong>de</strong> evaluare a gradului <strong>de</strong> întrebuinţare. Evaluarea teoretică a<br />

mo<strong>de</strong>lului con<strong>si</strong><strong>de</strong>rând Systems of Systems Interoperability Mo<strong>de</strong>l (SoSI).<br />

64


7.3.2. Contribuţii practice<br />

E. Introducerea a trei arhitecturi separate pentru managementul repo<strong>si</strong>tory digital. Prima<br />

arhitectură utilizează caracteristicile MediaWiki pentru recoltarea metadatelor eterogene,<br />

colectarea şi agregarea într-un repo<strong>si</strong>tory extern, bazat pe mo<strong>de</strong>lul <strong>de</strong> conţinut specific<br />

Fedora Commons. A doua arhitectură utilizează caracteristici Semantic MediaWiki pentru<br />

a permite semantificarea metadatelor generate <strong>de</strong> un instrument folo<strong>si</strong>t pentru a crea<br />

automat cheile <strong>de</strong> i<strong>de</strong>ntificare în interiorul wiki-urilor. A treia arhitectura utilizează<br />

caracteristici Semantic MediaWiki, pentru a permite cercetatorilor să adnoteze colaborativ<br />

corpusul. Aceste adnotări sunt <strong>de</strong>stinate creării <strong>de</strong> instanţe ale ontologiilor din domeniu şi<br />

stabilirea proprietăţilor lor.<br />

F. Implementarea rezultatelor teoretice în <strong>si</strong>steme practice face rezultatele acestei teze<br />

acce<strong>si</strong>bile pentru utilizator. Implementările platformelelor con<strong>si</strong><strong>de</strong>ră primordial contextul<br />

în care acestea trebuie să funcţioneze. Prin urmare, prima implementare presupune<br />

existenţa resurselor media în <strong>si</strong>stemul furnizorul <strong>de</strong> date. O abordare MW se potriveşte<br />

mai bine în acest caz şi permite folo<strong>si</strong>rea unui repo<strong>si</strong>tory extern <strong>de</strong> metadate şi<br />

implementează mai multe unelte Java pentru managementul automat al repo<strong>si</strong>tory. A doua<br />

implementare presupune existenţa resurselor media în MediaWiki. O abordare SMW se<br />

potriveşte mai bine în acest caz şi permite folo<strong>si</strong>rea partajată a unui repo<strong>si</strong>tory <strong>de</strong> metadate<br />

în wiki. O exten<strong>si</strong>e jQuery şi un set <strong>de</strong> unelte Java completează integrarea. Al treilea caz<br />

<strong>de</strong> implementare reprezintă un mediu virtual <strong>de</strong> cercetare. Un instrument <strong>de</strong> adnotare<br />

pentru imagini, în SMW, extin<strong>de</strong> SMW cu noi funţionalităţi.<br />

G. Un instrument separat care gestionează problemele legate <strong>de</strong> drepturile <strong>de</strong> proprietate<br />

intelectuală. MediaWiki nece<strong>si</strong>tă o abordare atentă pentru conţinutul media. Declararea<br />

explicită a licenţelor este necesareă în spaţiul <strong>de</strong> nume "File". De obicei, resursele media<br />

sunt supuse la prelucrări suplimentare în MediaWiki. Aceste lucrări <strong>de</strong>rivative trebuie să<br />

fie protejate încă <strong>de</strong> la crearea lor in MediaWiki. Acest instrument încărcă resursele<br />

media în repo<strong>si</strong>tory-ul partajat MediaWiki, ataşează metadatele care <strong>de</strong>scriu drepturile <strong>de</strong><br />

proprietate intelectuală şi crează un backlink la resursa originală, pe serverul furnizorului<br />

<strong>de</strong> date.<br />

H. Implementarea unei noi platforme în Semantic MediaWiki pentru evaluarea primei<br />

arhitecturi care s-a dovedit a fi benefică din următoarele puncte <strong>de</strong> ve<strong>de</strong>re: economi<strong>si</strong>rea<br />

timpului <strong>de</strong> procesare; o curbă <strong>de</strong> învăţare mai uşoară cu facilităţi <strong>de</strong> colaborare;<br />

îmbunătăţirea gradul <strong>de</strong> utilizare oferind o privire <strong>de</strong> ansamblu asupra procesului, inclu<strong>si</strong>v<br />

modificărea stărilor la execuţie; creştere gradului <strong>de</strong> colaborare a utilizatorilor şi mai ales<br />

creşterea calitatăţii metadatelor.<br />

7.4. Direcţii viitoare <strong>de</strong> cercetare<br />

Dezvoltarea tezei a ridicat un număr întrebări <strong>de</strong> cercetare şi provocări ştiinţifice. Parte dintre<br />

platformele implementate aici au propria listă specifică <strong>de</strong> probleme <strong>de</strong>schise: este firesc să<br />

adopte meto<strong>de</strong> automatizate mai bune pentru a oferi feedback mai inteligent pentru furnizorii<br />

<strong>de</strong> date, să angajeze mai profund auto-controlul, cum ar fi cel oferit <strong>de</strong> noua ver<strong>si</strong>une 1.6.2 a<br />

SMW, atunci când toate caracteristicile şi exten<strong>si</strong>ile vor contribui la o gestionare mai bună al<br />

repo<strong>si</strong>tory-ului digital. Avem motive întemeiate să sperăm că <strong>de</strong> acest lucru va fi benefic şi va<br />

contribui la o mai bună integrare şi o mai bună raţionare asupra datelor interne şi externe,<br />

chiar şi pentru o integrare automată în norul linked date.<br />

Pe parcursul acestei teze ne-am pus mai multe întrebări <strong>de</strong> cercetare specifice. Am amintit, <strong>de</strong><br />

asemenea, şi o listă <strong>de</strong> întrebări mai generale <strong>de</strong> cercetare care se referă la platformele media<br />

ca un întreg.<br />

Cele mai multe dintre meto<strong>de</strong>le prezentate în această teză au fost puse în aplicare, fie ca<br />

instrumente proprii (integrarea VRE) sau ca părţi ale unui set <strong>de</strong> instrumente.<br />

Am implementat o serie <strong>de</strong> meto<strong>de</strong> <strong>de</strong> evaluare în cadrul <strong>si</strong>stemului colaborativ semantic <strong>de</strong><br />

authoring Semantic MediaWiki. Am facut acest lucru pentru că ne aşteptăm ca domeniul<br />

managementului colaborativ al repo<strong>si</strong>tory-ului va <strong>de</strong>veni un subiect tot mai important pentru<br />

cunoaşterea partajată. Ceea ce ve<strong>de</strong>m astăzi este doar începutul acestei căi interesante şi noi<br />

65


<strong>de</strong> cercetare-<strong>de</strong>zvoltare. Ne aşteptăm ca viitorul apropiat va promulga nivele necunoscute<br />

până în prezent <strong>de</strong> cooperare între grupuri <strong>de</strong> oameni şi fe<strong>de</strong>raţii <strong>de</strong> agenţi automaţi, care să<br />

lucreze împreună pentru a rezolva problemele complexe cu care ne confruntăm.<br />

Unele <strong>si</strong>steme mai noi <strong>de</strong> bibliotecă digitală semantică sau repo<strong>si</strong>tory au început să ţină seama<br />

<strong>de</strong> rolul fundamental al discursului şi a acordului între diferitele părţi interesate. Ei i<strong>de</strong>ntifică<br />

partajarea ("shared-ness") resurselor (resursele digitale, dar şi ontologii), ca o valoare<br />

explicită şi furnizează chiar procese pentru a garanta că aceast <strong>de</strong>zi<strong>de</strong>rat comun este realizat.<br />

Chiar dacă partajarea nu este văzută ca un obiectiv principal, aceasta este o parte integrantă a<br />

conceptualizării noastre. Deoarece partajarea este un aspect al semanticii, ea atinge o serie <strong>de</strong><br />

criterii: acurateţea, claritatea şi fitness-ul organizaţional.<br />

Cercetările viitoare vor avea drept scop o mai profundă aliniere a tehnologiilor semantice cu<br />

abordările sociale. Noi propunem doua directii <strong>de</strong> <strong>de</strong>zvoltare profe<strong>si</strong>onală:<br />

• Contribuirea la îmbunătăţirea încre<strong>de</strong>rii şi colaborării în gestionarea metadatelor prin<br />

<strong>si</strong>steme <strong>de</strong> recomandare şi <strong>de</strong> urmărire a provenienţei metadatelor, cu aplicabilitate la<br />

linked data, <strong>de</strong> asemenea.<br />

• Dezvoltarea unor meto<strong>de</strong> şi instrumente pentru procesul <strong>de</strong> bootstrapping a linked<br />

data, în scopul <strong>de</strong> a <strong>de</strong>scoperi noi resurse, pentru a permite accesul liber la resurse<br />

digitale partajate.<br />

În interiorul aceluiaşi grup <strong>de</strong> utilizatori, folo<strong>si</strong>nd acordurile informale sau semi-formalizate şi<br />

menţinând conţinutul prin forte proprii, accentul se concentrează pe încre<strong>de</strong>re şi grija<br />

reciprocă.<br />

66


67<br />

Referinţe<br />

[1] Agosti, M., Bonfiglio-Do<strong>si</strong>o, G. and Ferro, N., (2007). A historical and contemporary study on annotations to<br />

<strong>de</strong>rive key features for systems <strong>de</strong><strong>si</strong>gn, Int J Digit Libr 8:1–19, DOI 10.1007/s00799-007-0010-0, Springer-Verlag.<br />

(2007)<br />

[2] Alboaie, L. (2008): PRES - Personalized Evaluation System in a Web Community - A Conceptual Mo<strong>de</strong>l De<strong>si</strong>gned<br />

to Evaluate Reputation in Or<strong>de</strong>r to Achieve a Personalized View on the System for Each User. ICE-B 2008: 64-69.<br />

[3] Andren, B. (2009), Open Multimedia Platform framework, ERICSSON REVIEW 1/2009, pp. 17-21<br />

[4] Antoniou, A. and van Harmelen, F. (2008). Semantic Web Primer 2nd Edition, The MIT Press, Mars 2008.<br />

[5] Apache License Ver<strong>si</strong>on 2.0, http://xml.apache.org/xalan-j/#license (last vi<strong>si</strong>ted November 24, 2009).<br />

[6] Auer, S. and Lehmann, J. (2007). What have Innsbruck and Leipzig in common? Extracting semantics from wiki<br />

content. In Enrico Franconi, Michael Kifer, and Wolfgang May, editors, Proc. 4th European Semantic Web<br />

Conference (ESWC), 2007.<br />

[7] Auer, S., Dietzold, S. and Riechert, Th. (2006). ‘OntoWiki- a tool for social, semantic collaboration.‘, Proc. of the<br />

5th Int. Semantic Web Conference, number 4273 in Lecture Notes in Computer, Science, pp. 736-749. Springer,<br />

November 2006.<br />

[8] Azevedo, R. and Jacobson, M. J. (2008), Advances in scaffolding learning with hypertext and hypermedia: a<br />

summary and critical analy<strong>si</strong>s, Educational Technology, Research and Development; Feb 2008; 56, 1; Research<br />

Library, Springer, pg. 93.<br />

[9] Baker, T. (2003). DCMI Usage Board review of application profiles.<br />

http://dublincore.org/usage/documents/profiles/in<strong>de</strong>x.shtml (accessed January 2010).<br />

[10] Bao, J., Ding, L. and Hendler, J. (2009). Knowledge Representation and Query in Semantic MediaWiki: A Formal<br />

Study. Revi<strong>si</strong>on: August 12, 2009 http://tw.rpi.edu/wiki/TW-2008-42 (accessed 11.07.2011).<br />

[11] Baraba<strong>si</strong>, A.L. , Jeong, H. , Neda, Z. Ravasz, E., Schubert, A. and Vicsek, T. (2001). Evolution of the social<br />

network of scientific collaborations, In: arXiv:cond-mat/0104162v1 [cond-mat.soft] 10 Apr 2001,<br />

http://arxiv.org/PS_cache/cond-mat/pdf/0104/0104162v1.pdf (accessed January 2011).<br />

[12] Barker, A. and van Hemert, J. (2008). Scientific Workflow: A Survey and Research Directions,<br />

http://www.extreme.indiana.edu/swf-survey/ (accessed 10.04.2010).<br />

[13] Barrett, B. (2009). Wikipedia and beyond – MediaWiki, O'Reilly, 2009<br />

[14] Beagrie, N., Chruszcz J. and Lavoie, B., (2008). “Keeping Research Data Safe, a cost mo<strong>de</strong>l and guidance for UK<br />

univer<strong>si</strong>ties”, JISC, 2008, www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.doc (last<br />

vi<strong>si</strong>ted 5.08.2011).<br />

[15] Berners-Lee, T. Relational databases on the Semantic Web. http://www.w3.org/De<strong>si</strong>gnIssues/RDB-RDF.html,<br />

1998 (accessed December 2010).<br />

[16] Berners-Lee, T.; Fielding, R.; Ma<strong>si</strong>nter, L. Uniform Resource I<strong>de</strong>ntifier (URI): generic syntax.<br />

http://gbiv.com/protocols/uri/rfc/rfc3986.html, 2005 (accessed December 2010).<br />

[17] Berners-Lee, T.; Hall, W.; Hendler, J.; Shadbolt, N.; Weitzner, D. Creating a science of the Web. Science 2006,<br />

313 (5788), 769-771.<br />

[18] Berners-Lee, T.; Hall, W.; Hendler, J.A.; O’Hara, K.; Shadbolt, N.; Weitzner, D.J. A framework for Web Science.<br />

Foundations and Trends in Web Science 2006, 1 (1), 1-134.<br />

[19] BiomedGT http://biomedgt.nci.nih.gov/wiki/in<strong>de</strong>x.php/Main_Page (accessed: 12/08/2011)<br />

[20] Bizer, C. Lehmann, J. Kobilarov, G. Auer, S. Becker, C., Cyganiak, R. and Hellmann, S. (2009). DBpedia - A<br />

Crystallization Point for the Web of Data, in: Proceedings of the 2nd Linked Data on the Web Workshop, 2009.<br />

[21] Blyberg, J. AADL.org Goes Social post to blyberg.net, 2007. http://www.blyberg.net/2007/01/21/aadlorg-goessocial.<br />

(accessed: 12/08/2011)<br />

[22] Braines, D., Smart, P. and Bao, J. (2010). ‘Emergent Capabilities for Collaborative Teams’, in the Evolving Web<br />

Environment 3rd Annual Conference of ITA (ACITA), 2010.<br />

[23] Breslin, J. Passant, A. and Deker, S. (2009). The Social Semantic Web, Springer.<br />

[24] Bry, F., Eckert, M., Kotowski, J., Weiand, K. (2009). What the user interacts with: Reflections on conceptual<br />

mo<strong>de</strong>ls for sematic wikis. In: Proceedings of Semantic Wiki Workshop, ESWC, Greece, 2009. (2009)<br />

[25] Buchanan, M. (2003). Nexus: Small worlds and the ground breaking science of networks - WW Norton &<br />

Company, 2003<br />

[26] Buckland, K. M., (1997), What Is a ‘‘Document’’? In: JOURNAL OF THE AMERICAN SOCIETY FOR<br />

INFORMATION SCIENCE. 48(9):804–809, 1997.<br />

[27] Buraga, S.C. (2009). Dezvoltarea aplicatiilor Web - Dinspre Web-ul social spre Web-ul semantic, curs 1-13,<br />

<strong>Facultatea</strong> <strong>de</strong> Informatica, Univer<strong>si</strong>tatea “A.I.Cuza” – Ia<strong>si</strong>, Romania, 2009<br />

[28] C4ISR Interoperability Working Group, Department of Defense, Levels of Information Systems Interoperability<br />

(LISI). Washington, D.C., 1998<br />

[29] Can<strong>de</strong>la, L., Castelli Donatella, and Pagano, P. (2007). A Reference Architecture for Digital Library Systems:<br />

Principles and Applications in C. Thanos, F. Borri, and L. Can<strong>de</strong>la (Eds.): Digital Libraries: R&D, LNCS 4877, pp.<br />

22–35, 2007.Springer-Verlag Berlin Hei<strong>de</strong>lberg<br />

[30] Chambers, Sally (2007): Towards Metadata Interoperability between Archives, Audio- Visual Archives, Museums<br />

and Libraries: What can we learn from The European Library metadata interoperability mo<strong>de</strong>l? (August 31,


2007), http://www.edlproject.eu/downloads/EDLproject_D1.1_metadata_interoperability_report_v1.4.pdf (last<br />

vi<strong>si</strong>ted 17.06.2011).<br />

[31] Chan, L. M. and Zeng, M. L. (2006), Metadata Interoperability and Standardization – A Study of Methodology Part<br />

I., Part II. D-Lib Magazine, June 2006, 12/6, ISSN 1082-9873, http://www.dlib.org/dlib/june06/chan/06chan.html<br />

(last vi<strong>si</strong>ted 14.06.2011).<br />

[32] CIDOC Conceptual Reference Mo<strong>de</strong>l - Information Groups<br />

http://cidoc.ics.forth.gr/docs/infogroup_graphics_v2.doc (last vi<strong>si</strong>ted 17.06.2011).<br />

[33] Cloonan, M. V. and Dove, J. G., (2005). Do digital libraries violate the Third Law? In: Library Journal,<br />

04/01/2005. http://www.libraryjournal.com/article/CA512179.html (last vi<strong>si</strong>ted: 28.07.2011).<br />

[34] Consultative Committee for Space Data Systems (2002) Reference mo<strong>de</strong>l for an Open Archival Information<br />

System (OAIS). CCSDS 650.0-B-1 Blue Book, January 2002,<br />

http://public.ccsds.org/publications/archive/650x0b1.pdf (accessed 05.06.2011)<br />

[35] Creative Commons, http://creativecommons.org/ (accessed February 2010)<br />

[36] Cruz, I. F. and Xiao, H. (2005).The Role of Ontologies in Data Integration. Journal of Engineering Intelligent<br />

Systems, 13(4):245–252, December 2005.<br />

[37] Cruz, I. F. and Xiao, H. (2009). Ontology Driven Data Integration in Heterogeneous Networks. In: Complex<br />

Systems in Knowledge-based Environments: Theory, Mo<strong>de</strong>ls and Applications Studies in Computational<br />

Intelligence, 2009, Volume 168/2009, 75-98, Springer, DOI: 10.1007/978-3-540-88075-2_4<br />

[38] D4Science, http://www.d4science.eu/, (last vi<strong>si</strong>ted 19.07.2011).<br />

[39] Davies, J., Stu<strong>de</strong>r, R. and Warren, P. (2006), Semantic Web Technologies Trends and Research in Ontology based<br />

Systems, Wiley Publishing, 2006.<br />

[40] Davies, R. (2008). EuropeanaLocal – its role în improving access to Europe’s cultural heritage through the<br />

European Digital Library. Workshop on Information Access to Cultural Heritage (IACH 2008) at ECDL 2008,<br />

Aarhus, 18 September 2008, http://www.edlocal.eu/eng/Publications/Papers-and-documents,<br />

http://ilps.science.uva.nl/IACH2008/papers/Davies_EuropeanaLocal_IACH2008.pdf (last vi<strong>si</strong>ted 19.07.2011).<br />

[41] De Roure D, Goble C, 2009. Software De<strong>si</strong>gn for Empowering Scientists. IEEE Software 2009, 26:88-95.<br />

10.1109/MS.2009.22.<br />

[42] De Roure, D., Goble, C. and Stevens, R. 2009. The De<strong>si</strong>gn and Realisation of the myExperiment Virtual Research<br />

Environment for Social Sharing of Workflows. Future Generation Computer Systems 25, pp. 561-567.<br />

doi:10.1016/j.future.2008.06.010<br />

[43] Deelman, E, Gannon, D., Shields, M, and Taylor, I, 2009. Workflows and e-science: An overview of workflow<br />

system features and capabilities. Future Generation Computer Systems, 25(5):528–540, 2009.<br />

[44] Deelman, E., Singh, G., Su, M., Blythe, J., Gil, Y., Kesselman, C., Mehta, G., Vahi, K., Berriman, G.B., Good, J.,<br />

Laity, A., Jacob, J.C., and Katz, D.S., 2005. Pegasus: a framework for mapping complex scientific workflows onto<br />

distributed systems. Scientific Programming, 13(3):219–237, 2005.<br />

[45] Definition of Digital Library: http://home.wlu.edu/~whaleyt/classes/digilib/whaley/<strong>de</strong>finition.html (last vi<strong>si</strong>ted<br />

12.07.2011)<br />

[46] Dengler, F., Lamparter, S., Hefke, M. and Abecker, A., (2009). Collaborative Process Development u<strong>si</strong>ng Semantic<br />

MediaWiki. In WM’09: 5th In-ternational Conference of Profes<strong>si</strong>onal Knowledge Management. Köllen Verlag.<br />

[47] Dengler, F., Vran<strong>de</strong>cic, D. and Simperl, E. (2011). Wikiing pro: semantic wiki-based process editor, Proceedings of<br />

the <strong>si</strong>xth international conference on Knowledge capture, ACM New York, NY, USA, 2011, ISBN: 978-1-4503-<br />

0396-5.<br />

[48] Deutschen National Bibliothek, http://www.d-nb.<strong>de</strong>/service/pdf/zd_info_broschuere.pdf (last vi<strong>si</strong>ted: 8.08.2011).<br />

[49] Devarakonda, R., Palanisamy, G., Green, J. M. and Wilson, B.E. (2011). Data sharing and retrieval u<strong>si</strong>ng OAI-<br />

PMH, Earth Sci Inform 4:1–5, Springer-Verlag.<br />

[50] Di Iorio, A. Vitali, F. Zacchiroli, St. (2008) ‘Wiki Content Templating’, WWW 2008, April 21–25, 2008, Beijing,<br />

China. ACM 978-1-60558-085-2/08/04<br />

[51] DILIGENT, http://diligent.ercim.eu/, (last vi<strong>si</strong>ted 19.07.2011).<br />

[52] DiMario, M.J. (2006) System of Systems Interoperability Types and Characteristics in Joint Command and Control,<br />

Proceedings of the 2006 IEEE/SMC International Conference on System of Systems Engineering, Los Angeles,<br />

CA, USA - April 2006<br />

[53] Doan, A. Ramakrishnan, R. and Halevy, A. Y. (2011). ‘Crowdsourcing Systems on the World-Wi<strong>de</strong> Web’,<br />

Communications of the ACM, 2011, doi :10.1145/1924421.1924442<br />

[54] Dublin Core Metadata Initiative, http://dublincore.org/metadata-ba<strong>si</strong>cs/ (accessed January 2010).<br />

[55] Duval, E., Hodgins, W., Sutton, S. & Weibel, S.L. (2002). Metadata principles and practicalities. D-Lib Magazine,<br />

8(4).<br />

[56] Eclipse Public License - v 1.0, http://www.eclipse.org/legal/epl-v10.html (last vi<strong>si</strong>ted November 24, 2009).<br />

[57] Ell, B., 2009. Integration of external data in semantic wikis, Masterarbeit im Studiengang Informatik, Institut für<br />

Angewandte Informatik und Formale Beschreibungsverfahren KIT - Karlsruher Institut für Technologie, 2009.<br />

[58] Elmroth, E., Hernan<strong>de</strong>z, F., Tordsson, 2010, J. Three Fundamental Dimen<strong>si</strong>ons of Scientific Workflow<br />

Interoperability: Mo<strong>de</strong>l of Computation, Language, and Execution Environment. In: Future Generation Computer<br />

Systems Volume 26, Issue 2, Pages 245-256, http://dx.doi.org/10.1016/j.future.2009.08.011, Elsevier.<br />

[59] Engelbart, D.C. (1963). Augmenting Human Intellect: A Conceptual Framework, SRI Summary Report AFOSR-<br />

3223, http://www.dougengelbart.org/pubs/augment-3906.html, (last vi<strong>si</strong>ted: 30.07.2011).<br />

[60] Engeström, J. (2005). http://www.zengestrom.com/blog/2005/04/why-some-social-network-services-work-andothers-dont-or-the-case-for-object-centered-sociality.html<br />

(last vi<strong>si</strong>ted: 30.07.2011).<br />

68


[61] Fedora Commons Repo<strong>si</strong>tory Documentation, http://www.fedora-commons.org/docs/repo<strong>si</strong>tory. (Accessed:<br />

07/06/2011)<br />

[62] Fensel, D. Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce, 2nd Ed.; Springer,<br />

Berlin, 2004.<br />

[63] Fernan<strong>de</strong>s, A., Breitman, K.., Vieira, T.A.S., Casanova, M.A. and Furtado, A.L., (2006). Semi-automated<br />

Workflow Synthe<strong>si</strong>s. In: ISoLA 2006. Second International Sympo<strong>si</strong>um on Leveraging Applications of Formal<br />

Methods, Verification and Validation, 15-19 Nov. 2006, pg. 332 – 334, ISBN: 978-0-7695-3071-0.<br />

[64] Ferro, N., 2008, Digital Annotations: a Formal Mo<strong>de</strong>l and its Applications, Information Access through Search<br />

Engines and Digital Libraries The Kluwer International Series on Information Retrieval, 2008, Volume 22, 113-<br />

146, DOI: 10.1007/978-3-540-75134-2_7, Springer-Verlag<br />

[65] Fielding, R.T., 2000, Architectural Styles and the De<strong>si</strong>gn of Network-based Software Architectures, Doctoral<br />

Dissertation, ACM, ISBN: 0-599-87118-0, 2000.<br />

[66] Foster, I, Kesselman, C., Nick, J and Tuecke, S. (2002), “Grid Services for Distributed System Integration”, IEEE<br />

Computer 35, pp. 37-46, (6) June 2002.<br />

[67] Fuentes-Lorenzo, D., Morato, J. and Gómez, J. M. (2009), Knowledge management in biomedical libraries: A<br />

semantic web approach, Inf Syst Front (2009) 11:471–480, DOI 10.1007/s10796-009-9159-y, Springer-Verlag<br />

[68] Gartner Group. (2011). Data Management and Integration.<br />

http://www.gartner.com/technology/core/products/research/topics/dataManagementIntegration.jsp (last vi<strong>si</strong>ted:<br />

12.09.2011).<br />

[69] Gil, Y. 2006, “Workflow Compo<strong>si</strong>tion: Semantic Representations for Flexible Automation”, in “Workflows for e-<br />

Science”, Deelman, E., Gannon, D. Shields, M., and Taylor, I. (Eds), Springer Verlag, 2006.<br />

[70] Giurgiu, M., Homodi, A. Veja, C., Hagedorn, G. and Nimis, P. L.. ‘A search tool for the digital biodiver<strong>si</strong>ty<br />

resources of KeyToNature’, Nimis P. L., Vignes Lebbe R. (eds.), Tools for I<strong>de</strong>ntifying Biodiver<strong>si</strong>ty: Progress and<br />

Problems, Paris September 2010, pp. 19-24.<br />

[71] Gómez-Berbís, J. M., Colomo-Palacios, R., López-Cuadrado, J.L., González-Carrasco, I. and García-Crespo, A.<br />

(2011). “SEAN: Multi-ontology semantic annotation for highly accurate closed domains”, International Journal of<br />

the Phy<strong>si</strong>cal Sciences Vol. 6(6), pp. 1440-1451, ISSN 1992 - 1950 ©2011 Aca<strong>de</strong>mic Journals.<br />

[72] Gonçalves, M. A., Fox, E. A., Watson, L. T., & Kipp, N. (2004). Streams, structures, spaces, scenarios, societies<br />

(5S): a formal mo<strong>de</strong>l for digital libraries. ACM Transactions on Information Systems, 22(2), 270–312.<br />

[73] Gonçalves, M.A. and Fox, E.A. (2004). Toward a Digital Library Theory: A Formal Digital Library Ontology.<br />

SIGIR, Mathematical Formal Methods workshop, 2004.<br />

[74] Gonçalves, M.A. Streams, Structures, Spaces, Scenarios, and Societies (5S): A Formal Digital Library Framework<br />

and Its Applications, Ph.D. Dissertation, Virginia Tech, http://scholar.lib.vt.edu/theses/available/etd-12052004-<br />

135923, 2004. (last vi<strong>si</strong>ted 18.07.2011).<br />

[75] Gonçalves, M.A., France, R.K. Fox, E.A., Hilf, E.R., Zimmermann, K. and Severiens, Th. (2001) MARIAN:<br />

Flexible Interoperability for Fe<strong>de</strong>rated Digital Libraries, Springer Lecture Notes in Computer Science 2163, pp.<br />

173-186. Key: citeulike:634309<br />

[76] Gruber, T. (2007), Collective Knowledge Systems: Where the Social Web meets the Semantic Web. Web<br />

Semantics: Science, Services and Agents on the World Wi<strong>de</strong> Web (2007), doi:10.1016/j.websem.2007.11.011<br />

[77] Hagedorn, G, Weber, G., Plank, A. Giurgiu, M., Homodi, A. Veja, C., Schmidt, G., Mihnev, P., Roujinov, M.,<br />

Triebel, D., Morris, R. A., Zelazny, B. van Spronsen, Ed., Schalk, P., Kittl, Ch., Brandner, R., Martellos, St.<br />

Nimis, P.L. (2010). ‘An online authoring and publishing platform for field gui<strong>de</strong>s and i<strong>de</strong>ntification tools’, Proc. of<br />

Conf. Tools for I<strong>de</strong>ntifying Biodiver<strong>si</strong>ty: Progress and Problems, Paris, September 2010 – pp. 13-18<br />

[78] Hagedorn, G. (2008). Key to Nature EU <strong>de</strong>liverable D 4.4: Resource Metadata Exchange Agreement.<br />

http://www.keytonature.eu/wiki/Key_to_Nature_EU_<strong>de</strong>liverable_D_4.4:_Resource_Metadata_Exchange_Agreeme<br />

nt (last vi<strong>si</strong>ted: 12.01.2010).<br />

[79] Haslhofer, B. and Heuhold, J. (2011). A Retrospective on Semantics and Interoperability Research, In: Fensel, D.<br />

(Edt.) Foundations for the Web of Information and Services, ISBN: 978-3-642-19796-3, Springer, 2011.<br />

[80] Hausenblas, M., Troncy, R., Bürger, N. and Raimond, Y. (2009). Interlinking Multimedia - How to Apply Linked<br />

Data Principles to Multimedia Fragments. LDOW2009, April 20, Madrid, Spain, 2009.<br />

[81] Hecht, R. and Haslhofer, B. (2005). Joining the BRICKS Network - A Piece of Cake. Online at:<br />

http://conf.cpic.ru/upload/eva2005/reports/dokladEn_736.pdf, (last vi<strong>si</strong>ted 19.07.2011).<br />

[82] Heery, Rachel, An<strong>de</strong>rson, Sheila. (2005). Digital Repo<strong>si</strong>tories Review, UKOLN and AHDS,<br />

http://www.jisc.ac.uk/uploa<strong>de</strong>d_documents/digital-repo<strong>si</strong>tories-review-2005.pdf (last vi<strong>si</strong>ted 15.07.2011).<br />

[83] Hestenes, D. 2006. Notes for a Mo<strong>de</strong>lling Theory of Science, Cognition and Instruction, In: Proceedings of the<br />

2006 GIREP conference: Mo<strong>de</strong>lling in Phy<strong>si</strong>cs and Phy<strong>si</strong>cs Education,<br />

http://mo<strong>de</strong>ling.asu.edu/r&e/notes_on_mo<strong>de</strong>ling_theory.pdf, (last vi<strong>si</strong>ted: 29.07.2011).<br />

[84] Hill, L. L., Buchel, O., Janée, G., & Zeng, M. L. (2002). Integration of Knowledge Organization Systems into<br />

Digital Library Architectures: Po<strong>si</strong>tion Paper. In J.-E. Mai & C. Beghtol & J. Furner & B. Kwasnik (Eds.),<br />

Advances in Clas<strong>si</strong>fication Research. Proceedings of the 13th ASIST SIG/CR Workshop on "Reconceptutalizing<br />

Clas<strong>si</strong>fication Research" (pp. 62-68). Phila<strong>de</strong>lphia, PA.<br />

[85] Hoen<strong>de</strong>rboom, B. and Liang, P. (2008). ‘A Survey of Semantic Wikis for Requirements Engineering’, RUG-<br />

SEARCH-09-L03, 2008.<br />

[86] http://oaei.ontologymatching.org (Accessed: 02/06/2010)<br />

[87] http://www.omg.org/spec/UML/in<strong>de</strong>x.htm, (last vi<strong>si</strong>ted: 29.07.2011).<br />

[88] http://www.openarchives.org/ore/documents/ore-jcdl2007.pdf (last vi<strong>si</strong>ted 19.07.2011).<br />

[89] http://www.w3.org/TR/DOM-Level-2-Core/introduction.html (last vi<strong>si</strong>ted: 19.07.2011).<br />

69


[90] http://www.w3.org/TR/DOM-Level-3-Core/introduction.html, (last vi<strong>si</strong>ted: 29.07.2011).<br />

[91] http://www.w3.org/TR/xml-infoset/, (last vi<strong>si</strong>ted: 29.07.2011).<br />

[92] http://www.w3.org/XML/, (last vi<strong>si</strong>ted: 29.07.2011).<br />

[93] https://wikis.uit.tufts.edu/confluence/display/UITKnowledgebase/Digital+Libraries+and+Repo<strong>si</strong>tories (last vi<strong>si</strong>ted<br />

12.07.2011)<br />

[94] Hüner, K. M. and Otto, B.(2009).The Effect of U<strong>si</strong>ng a Semantic Wiki for Metadata Management: A Controlled<br />

Experimen’, DOI: 978-0-7695-3450-3/09,IEEE, 2009.<br />

[95] Hüner, K. M., Otto, B. and Österle, H. (2011) Collaborative management of bu<strong>si</strong>ness metadata. International<br />

Journal of Information Management (2011), doi:10.1016/j.ijinfomgt.2010.12.002, Elsevier.<br />

[96] Institute of Electrical and Electronics Engineers. IEEE Standard Computer Dictionary: A Compilation of IEEE<br />

Standard Computer Glossaries. New York, NY: 1990.<br />

[97] International Council of Museums (ICOM).The CIDOC Conceptual Reference, (2010).http://www.cidoc-crm.org/<br />

(last vi<strong>si</strong>ted 17.06.2011).<br />

[98] Ja<strong>de</strong> based process editor http://ja<strong>de</strong>.tilab.com/wa<strong>de</strong>/in<strong>de</strong>x.html (Accessed: 22/06/2010)<br />

[99] Janev, V., & Vraneš, S. (2010) Applicability assessment of Semantic Web technologies. Information Proces<strong>si</strong>ng<br />

and Management (2010), doi:10.1016/j.ipm.2010.11.002.<br />

[100] JaWE based process editor http://www.jped.org/ (Accessed: 09/06/2010)<br />

[101] Jentzsch A (2009) DBpedia – extracting structured data from Wikipedia. Presentation at Semantic Web in<br />

Bibliotheken (SWIB2009), Cologne, Germany<br />

[102] JISC InfoNet, http://www.jiscinfonet.ac.uk/infokits/repo<strong>si</strong>tories/ (last vi<strong>si</strong>ted: 16.07.2011).<br />

[103] Jones, R., Andrew, Th. and MacColl, J.(2006) The Institutional Repo<strong>si</strong>tory. Oxford: Chandos Publishing<br />

, 2006, URI: http://hdl.handle.net/1842/858 (last vi<strong>si</strong>ted 13.07.2011)<br />

[104] Kawamoto, K., Kitamura, Y. and Tijerino, Y. (2008). KawaWiki: A Template-Based SemanticWiki<br />

Where End and Expert Users Collaborate, 2008<br />

[105] KeyToNature Project, an eContentplus programme. Contract no. ECP-2006-EDU-410019.<br />

www.KeyToNature.eu<br />

[106] Khan, R. and Wilensky, R. (1995). A Framework for Distributed Digital Object Services, cnri.dlib/tn95-<br />

0, online at: http://www.cnri.reston.va.us/k-w.html (last vi<strong>si</strong>ted 19.07.2011).<br />

[107] Kleiner, F. and Abecker, A. (2008). ‘Towards a Collaborative Semantic Wiki-based Approach to IT<br />

Service Managemen’t, 2008.<br />

[108] Klyne, G.; Carroll, J.J.; McBri<strong>de</strong>, B. Resource Description Framework (RDF): concepts and abstract<br />

syntax. http://www.w3.org/TR/rdf-concepts/, 2004 (accessed December 2009).<br />

[109] Knorr Cetina, K. (2001). The practice turn in contemporary theory, edited by Theodor R. Schatzki, Karin<br />

Knorr Cetina, and Eike von Savigny (London 2001: Routledge.)<br />

[110] Kollias, St. and Cou<strong>si</strong>ns, J.(2008) Semantic Interoperability in the European Digital Library,<br />

Proceedings of the First International Workshop, SIEDL 2008, Tenerife, June 2, 2008<br />

[111] Koren, Y. (2011). Semantic MediaWiki vs. SharePoint, http://wikiworks.com/semantic-mediawiki-vssharepoint.html<br />

(last vi<strong>si</strong>ted: 16.07.2011)<br />

[112] Kotelnikov, M., Polonsky, A., Kiesel, M., Völkel, M., Haller, H., Sogrin, M., Lannerö, P. and Davis, B.<br />

(2007). The Social Semantic Desktop-Interactive Semantic Wikis, Deliverable D1.1-NEPOMUK , 2007<br />

[113] Kousetti, K., Millard, D. E. and Howard, Y. (2008). A Study of Ontology Convergence in a Semantic<br />

Wiki. Proccedings of WikiSym '08, September 8-10, Porto, Portugal. Copyright 2008 ACM 978-1-60558-128-<br />

3/08/09.<br />

[114] Koutsomitropoulos, D., Solomou, G., Alexopoulos, A. and Papatheodorou, Th., 2010. Semantic Web<br />

enabled digital repo<strong>si</strong>tories. In: International Journal on Digital Libraries, 10/4, Springer Berlin / Hei<strong>de</strong>lberg, pp.<br />

179-199, http://dx.doi.org/10.1007/s00799-010-0059-z<br />

[115] Krötzsch, M., Vran<strong>de</strong>cic, D. Völkel, M. Haller, H., Stu<strong>de</strong>r. R. (2007). Semantic Wikipedia. In Journal of<br />

Web Semantics 5/2007, pp. 251-261. Elsevier 2007.<br />

[116] Kruk, S.R. and McDaniel, B., 2009, Goals of Semantic Digital Libraries, In: Semantic Digital Libraries,<br />

Springer-Verlag, ISBN: 978-3-540-85433-3, pp. 71-76.<br />

[117] Kruk, S.R., Westerki, A. and Ewelina Kruk, 2009, Architecture of Semantic Digital Libraries, In:<br />

Semantic Digital Libraries, Springer-Verlag, ISBN: 978-3-540-85433-3, pp. 77-85.<br />

[118] Kuhn, T. (2009). How Controlled English can Improve Semantic Wikis. arXiv:0907.1245v1 [cs.HC] 7<br />

Jul 2009.<br />

[119] Lagoze, C. and Nelson, M. Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH<br />

initiative), http://www.openarchives.org/OAI/openarchivesprotocol.html (accessed January 2010).<br />

[120] Lange, Ch., Hausenblas, M., Bao, J. and Ding, L. (2010). ‘Semantics of Governmental Statistics Data’,<br />

Web Science Conf. 2010, April 26-27, 2010, Raleigh, NC, USA.<br />

[121] Lenzerini, M. (2002).Data Integration: A Theoretical Perspective, PODS '02 Proceedings of the twentyfirst<br />

ACM SIGMOD-SIGACT-SIGART sympo<strong>si</strong>um on Principles of database systems, ISBN:1-58113-507-6<br />

[122] Leuf, B., and Cunningham, W.(2001). The Wiki Way Quick Collaboration on the Web.<br />

[123] Lewis, G.A. and Wrage, L. (2005), Approaches to Constructive Interoperability (CMU/SEI-2004-TR-<br />

020 ESC-TR-2004-020). Pittsburgh, PA: Software Engineering Institute, Carnegie Mellon Univer<strong>si</strong>ty, 2005<br />

[124] Ludäscher, B., Altintas, I., Berkley, Ch., Higgins, D., Jaeger, E., Jones, M. Lee, E.A., Tao, J. Zhao, Y.,<br />

(2006). Scientific workflow management and the Kepler system, In: Concurrency and Computation: Practice and<br />

Experience, John Wiley & Sons, Ltd., DOI=10.1002/cpe.994, pg. 1039-1065.<br />

70


[125] Maccagnan et al., 2010. Combining ontologies and workflows to <strong>de</strong><strong>si</strong>gn formal protocols for biological<br />

laboratories. In: Automated Experimentation 2010, 2:3, DOI: 10.1186/1759-4499-2-3.<br />

[126] Marshall, C.C., Shipman III, F. and McCall, R. J. (1994). ‘Putting Digital Libraries to Work: Issues from<br />

Experience with Community Memories.’ Online: http://www.csdl.tamu.edu/DL94/paper/marshall.html (Accessed:<br />

02/06/2010)<br />

[127] Martin, M and Auer, S. (2010). ‘Categorisation of Semantic Web Applications’. SEMAPRO 2010 : The<br />

Fourth International Conference on Advances in Semantic Proces<strong>si</strong>ng. IARIA, 2010 ISBN: 978-1-61208-104-5, pg.<br />

179-185.<br />

[128] Martin, M., Gerber, D., Heino, N., Auer, S. and Ermilov, T. (2010). “Managing Multimodal and<br />

Multilingual Semantic Content”. In: Proceedings of the 7th International Conference on Web Information Systems<br />

and Technologies, 2010.<br />

[129] MEG Registry (Registry of MEG-related schemas),<br />

http://www.ukoln.ac.uk/metadata/education/registry/contents.html (last vi<strong>si</strong>ted 19.07.2011).<br />

[130] Melnik, S. and Decker, S. (2000). A Layered Approach to Information Mo<strong>de</strong>ling and Interoperability on<br />

the Web. In ECDL Workshop on the Semantic Web, Lisbon, Portugal, 2000.<br />

[131] Metcalf, C. and Lewis, G.A. (2006) Mo<strong>de</strong>l Problems in Technologies for Interoperability: OWL Web<br />

Ontology Language for Services (OWL-S). (CMU/SEI-2006-TN-018) Pittsburgh, PA: Software Engineering<br />

Institute, Carnegie Mellon Univer<strong>si</strong>ty, April 2006, http://www.sei.cmu.edu/reports/06tn018.pdf. (last vi<strong>si</strong>ted<br />

21.07.2011).<br />

[132] Mikeal, A. Creel, J. Maslov, A. Phillips, S. Leggett, J. and McFarland, M. (2009). Large-scale ETD<br />

repo<strong>si</strong>tories: A case study of a digital library application, Joint Conference on Digital Libraries 2009, June 15–19,<br />

2009, Austin,TX, USA.<br />

[133] Miller, P. (2000) "Interoperability. What is it and Why should I want it?", Ariadne Project, Ariadne Issue<br />

24, 21-Jun-2000, http://www.ariadne.ac.uk/issue24/interoperability/, (last vi<strong>si</strong>ted 19.07.2011).<br />

[134] Minguillón, J., Sicilia, M.A. and Lamb, B. (2011). “From Content Management to E-Learning Content<br />

Repo<strong>si</strong>tories”. In: N. Ferran and J. Minguillón (eds.), Content Management for E-Learning, DOI 10.1007/978-1-<br />

4419-6959-0_2, Springer Science&Bu<strong>si</strong>ness Media, LLC 2011, pg. 27-42<br />

[135] Morris, E., Levine, L., Meyers, L. Plakosh, D. and Place, P.(2004), Systems of Systems Interoperability,<br />

CMU/SEI-2004-TR-004, ESC-TR-2004-004, Software Engineering Institute, Carnegie Mellon Univer<strong>si</strong>ty, April<br />

2004.<br />

[136] myExperiment http://www.myexperiment.org/ (last vi<strong>si</strong>ted 19.07.2011).<br />

[137] Nau<strong>de</strong>t, Y., Latour, T., Hausmann, K., Abels, S., Hahn, A. and Johannesonn, P. (2006), Describing<br />

Interoperability: the OoI Ontology, Proceedings of CAiSE’06 The 18th Conference on Advanced Information<br />

Systems Engineering Luxembourg, 5-6 June, 2006. http://ftp.informatik.rwth-aachen.<strong>de</strong>/Publications/CEUR-<br />

WS/Vol-200/09.pdf (Accessed: 02/06/2010)<br />

[138] Neiswen<strong>de</strong>r, C. 2009. "Introduction to Metadata." In The MMI Gui<strong>de</strong>s: Navigating the World of Marine<br />

Metadata. http://marinemetadata.org/gui<strong>de</strong>s/mdataintro. (Accessed: 02/06/2010)<br />

[139] NISO (National Information Standards Organization) (2004). Un<strong>de</strong>rstanding metadata. Bethesda, MD:<br />

NISO Press., http://www.niso.org/standards/resources/Un<strong>de</strong>rstandingMetadata.pdf, (last vi<strong>si</strong>ted 19.07.2011).<br />

[140] OAI http://www.openarchives.org/, (last vi<strong>si</strong>ted 19.07.2011).<br />

[141] Object Management Group. MDA: Executive Overview (2005)<br />

http://www.omg.org/mda/executive_overview.htm (Accessed: 02/06/2010)<br />

[142] OCLC/RLG Working Group on Preservation Metadata. (2002). Preservation Metadata and the OAIS<br />

Information Mo<strong>de</strong>l, A Metadata Framework to Support the Preservation of Digital Objects. Available:<br />

http://www.oclc.org/research/projects/pmwg/pm_framework.pdf. (Accessed: 05/06/2010)<br />

[143] Ogasawara, E., Paulino, C., Murta, L., Werner, C., and Mattoso, M., (2009). Experiment Line: Software<br />

Reuse in Scientific Workflows, Scientific and Statistical Database Management, Lecture Notes in Computer<br />

Science, 2009, Volume 5566/2009, 264-272, Springer, DOI: 10.1007/978-3-642-02279-1_20.<br />

[144] Oinn T, Addis M, Ferris J, Marvin D, Senger M, Greenwood M, Carver T, Glover K, Pocock M, Wipat<br />

A, Li P, 2004. Taverna: a tool for the compo<strong>si</strong>tion and enactment of bioinformatics workflows. Bioinformatics<br />

(Oxford, England) 2004, 20:3045-3054. 10.1093/bioinformatics/bth361<br />

[145] Page, E.H., Briggs, R., and Tufarolo, J.A. (2004). “Toward a Family of Maturity Mo<strong>de</strong>ls for the<br />

Simulation Interconnection Problem.” Proceedings IEEE Spring Simulation Interoperability Workshop, IEEE CS<br />

Press<br />

[146] Parr, T. (2004). ‘Enforcing Strict Mo<strong>de</strong>l-View Separation in Template Engines’. In: Proceedings of<br />

WWW2004 Conference, May 17–20, 2004, New York, USA. ACM 158113844X/04/0005.<br />

[147] Peter, H., Sack, H. and Beckstein, C. (2006), SmartIn<strong>de</strong>xer – Amalgamating Ontologies and Lexical<br />

resources for Document In<strong>de</strong>xing, IN: Proceedings of OntoLex 2006, doi=10.1.1.116.8953.<br />

[148] Petty, M.D., and Weisel, E.W. (2003). “A Compos-ability Lexicon.” Proceedings Spring Simulation Interoperability<br />

Workshop, IEEE CS Press<br />

[149] Pir<strong>si</strong>g, R. (1974). Zen and the Art of Motorcycle Maintenance, New York: Bantam Books.<br />

[150] Pokraev, Stanislav and Reichert, Manfred and Steen, Maarten W.A. and Wieringa, Roel (2005) Semantic<br />

and Pragmatic Interoperability: A Mo<strong>de</strong>l for Un<strong>de</strong>rstanding. In: J. Castro, E. Teniente (Eds.) Proc. of the<br />

CAiSE'05 Workshops, June 2005, Porto, Portugal.<br />

[151] Repo<strong>si</strong>tory software survey, http://www.rsp.ac.uk/start/software-survey/results-2010/ (last vi<strong>si</strong>ted:<br />

16.07.2011).<br />

71


[152] Resource Metadata Exchange Agreement. (2008).<br />

http://www.keytonature.eu/wiki/Resource_Metadata_Exchange_Agreement. (Accessed: 02/06/2010).<br />

[153] Schaffert, S. (2006) Semantic social software: Semantically enabled social software or socially enabled<br />

semantic web? In Proceedings of the SEMANTICS 2006 conference, pp. 99–112, Vienna, Austria, November<br />

2006. OCG.<br />

[154] Schaffert, S. E<strong>de</strong>r, J., Grünwald, S., Kurz, T., Radulescu, M., Sint, R. and Stroka, S. (2009). ‘KiWi – a<br />

platform for semantic social software. ‘ In Proc. of the 4th Workshop on Semantic Wikis, ESW C 2009,<br />

Hersonissos, Greece, June 2009.<br />

[155] Schindler, C. and Rittberger, M. (2009). Herausfor<strong>de</strong>rungen für die Gestaltung von wissenschaftlichen<br />

Information<strong>si</strong>nfrastrukturen durch Web 2.0. In: Information - Wissenschaft & Praxis, 60, 4, 215-224.<br />

[156] Schindler, C., Veja, C. Rittberger, M. and Vran<strong>de</strong>cic, D. (2011). How to Teach Digital Library Data to<br />

Swim into Research. In Proceedings of i-Semantics conference, September 7 - 9, 2011, Graz, Austria, ACM 978-1-<br />

4503-0621-8, pp. 142-149.<br />

[157] Schindler, C., Vran<strong>de</strong>cic, D., Rittberger, M., Stu<strong>de</strong>r, R. and Veja, C. (2011). Kollaborative Analyse von<br />

historischen Netzwerken: Virtuelle Forschungsumgebung für die Historische Bildungsforschung. In Proceeding of<br />

“Kooperationen und Netzwerke in bildungshistorischer Perspektive“Jahrestagung <strong>de</strong>r Sektion Historische<br />

Bildungsforschung in <strong>de</strong>r DGfE, Basel, 16-18.09.2011. (publication accepted).<br />

[158] Sen, A. (2004). Metadata management: past, present and future, Deci<strong>si</strong>on Support Systems 37 (2004) pg.<br />

151– 173, Elsevier. doi:10.1016/S0167-9236(02)00208-7.<br />

[159] SGML, ISO 8879:1986, http://www.iso.org/iso/catalogue_<strong>de</strong>tail.htm?csnumber=16387 (Accessed:<br />

02/06/2010)<br />

[160] Shadbolt, N.; Hall, W.; Berners-Lee, T. The Semantic Web revi<strong>si</strong>ted. IEEE Intelligent Systems 2006, 21<br />

(3), 96-101.<br />

[161] Shnei<strong>de</strong>rman, B., (1989), “Reflections on Authoring, Editing, and Managing Hypertext, In: The Society<br />

of Text”, (ed. E. Barrett), MIT Press, 1989.<br />

[162] Siorpaes, K., and Simperl, E., (2010). Human intelligence in the process of semantic content creation.<br />

World Wi<strong>de</strong> Web WWW Journal, 13(1), 33–59.<br />

[163] Soergel, D. Digital Libraries and Knowledge Organization, (2009) in: Sebastian Ryszard Kruk,Bill<br />

McDaniel (editors):Semantic digital libraries, 2009, Springer.<br />

[164] Spivack, N. Making Sense of the Semantic Web, http://www.mindingtheplanet.net<br />

[165] Staab, St., Scherp, A., Arndt, R., Troncy, R., Grzegorzek, M., Saathoff, C., Schenk, S. and Hardman, L.<br />

(2008) Semantic Multimedia, http://homepages.cwi.nl/~troncy/Publications/Troncy_Staab-rw08.pdf (Accessed:<br />

12/06/2011)<br />

[166] Taylor, I., Shields, M., Wang, I., and Harrison, A. (2007). The Triana workflow environment:<br />

architecture and applications. In I. Taylor et al., editors, Workflows for e-Science, pages 320–339. Springer-Verlag,<br />

2007.<br />

[167] Tempich, C., Simperl, E., Luczak, M., Stu<strong>de</strong>r, R., Pinto, H.S., Argumentation-Based Ontology<br />

Engineering, IEEE Intelligent Systems, vol. 22, no. 6, pp. 52-59, Nov./Dec. 2007, doi:10.1109/MIS.2007.103.<br />

[168] Tolk A., Diallo SY, King RD, Turnitsa CD. A Layered Approach to Compo<strong>si</strong>tion and Interoperation in<br />

Complex Systems, Springer SCI 168, 2009, 41–74.<br />

[169] Tolk, A. and Muguira, J. A. (2003),The Levels of Conceptual Interoperability Mo<strong>de</strong>l, 2003 Fall<br />

Simulation Interoperability Workshop Orlando, Florida, September 2003.<br />

[170] Tolk, A (2004). Metamo<strong>de</strong>ls and Mappings–Ending the Interoperability War. In Fall Simulation<br />

Interoperability Workshop, pages 748–761. IEEE CS Press, 2004.<br />

[171] Tolk, A. (2003), “Beyond Technical Interoperability; Introducing a Reference Mo<strong>de</strong>l for Measures of<br />

Merit for Coalition Interoperability”, 8th International Command and Control Research and Technology<br />

Sympo<strong>si</strong>um (ICCRTS), Washington, D.C., June 17-19, 2003. Washington D.C., Command and Control Research<br />

Program (CCRP), 2003.<br />

[172] Tolk, A. (2006). What comes after the Semantic Web – PADS Implications for the Dynamic Web,<br />

Proceedings 20th ACM/IEEE/SCS* Workshop on Principles of Advanced and Distributed Simulation, IEEE/ACM<br />

Press, 2006<br />

[173] Tolk, A., Turnitsa, C. and Diallo, S. (2008). Implied Ontological Representation Within the Levels of<br />

Conceptual Interoperability Mo<strong>de</strong>l. Intelligent Deci<strong>si</strong>on Technologies, 2(1):3–20, 2008.<br />

[174] Trappey, C. V. Trappey, Amy J.C., Huang, C.-J., Ku, C.C. (2009). The <strong>de</strong><strong>si</strong>gn of a JADE-based<br />

autonomous workflow management system for collaborative SoC <strong>de</strong><strong>si</strong>gn. Expert Systems with Applications 36 pg.<br />

2659–2669<br />

[175] Treloar, A. and Wilkinson, R. (2008). “Rethinking Metadata Creation and Management in a Data-Driven<br />

Research World”, Fourth IEEE International Conference on eScience, DOI =10.1109/eScience.2008.41, pg. 782-<br />

789.<br />

[176] van <strong>de</strong>r Aalst, W.M.P. and van Hee, K.M, (2002). Workflow Management: Mo<strong>de</strong>ls, Methods, and<br />

Systems. MIT press, Cambridge, MA, 2002.<br />

[177] Vardigan, M. and Whiteman, C. (2007) ICPSR meets OAIS: applying the OAIS reference mo<strong>de</strong>l to the<br />

social science archive context. Arch Sci (2007) 7:73–87, DOI 10.1007/s10502-006-9037-z, Springer-Verlag.<br />

[178] Veja, C. http://biowikifarm.net/meta/MediaWiki_based_ingest_tool (Accessed: 19/06/2011)<br />

[179] Veja, C. http://biowikifarm.net/meta/MediaWiki_based_online_Tasks_management_for_ingest_tool<br />

(Accessed: 19/06/2011)<br />

72


[180] Veja, C., 2009, K2N-DCMI-Europeana metadata elements mappings, http://biowikifarm.net/meta/K2N-<br />

DCMI-Europeana_Metadata_Elements_Mapping. (Accessed: 19/06/2011)<br />

[181] Veja, C., 2010, Implementation <strong>de</strong>tails of Java-based Fedora Ingestion co<strong>de</strong>,<br />

http://biowikifarm.net/meta/Implementation_<strong>de</strong>tails_of_Java-based_Fedora_Ingestion_co<strong>de</strong> (last vi<strong>si</strong>ted February<br />

12, 2010)<br />

[182] Veja, C., Hagedorn, G., Weber, G. and Giurgiu, M. (2010) “Metadata Repo<strong>si</strong>tory Management u<strong>si</strong>ng the<br />

MediaWiki Interoperability Framework A Case Study:The KeyToNature Project”, Proc. Of Int. Conf. eChallenges<br />

e-2010, 27 - 29 October 2010 Warsaw, Poland, ISBN: 978-1-4244-8390-7.<br />

[183] Veja, C., Hagedorn, G., Weber, G. and Giurgiu, M. ‘Semantic MediaWiki Interoperability Framework<br />

from a Semantic Social Software Perspective’, Proc. of International Sympo<strong>si</strong>um on Electronics and<br />

Telecommunications ETC 2010, Timisoara, November 2010, pp. 403-406, IEEE<br />

DOI=10.1109/ISETC.2010.5679307.<br />

[184] Veja, C., Hagedorn, G., Weber, G., Suta, L., Vaida, F.M., (2011), Mo<strong>de</strong>ls for metadata repo<strong>si</strong>tory<br />

management u<strong>si</strong>ng Semantic Social Software. Proc. Of Int. Conf. eChallenges e-2011, October 25-27. Florence,<br />

Italy, ISBN 978-1-905824-27-4, pp. 1-8.<br />

[185] Veja, C., Vaida, F M, Hagedorn, G., (2011), “Sharing the knowledge: Semantic MediaWiki”. Acta<br />

Technica Napocen<strong>si</strong>s, 2/2011, vol. 52, pp. 10-17, ISSN: 1221-6542.<br />

[186] Veja, C., Weber, G., Hagedorn, G. and Giurgiu, M. (2010).“MediaWiki Interoperability Framework for<br />

Multimedia Digital Resources”, Proc. Of IEEE 6th Int. Conf. on Intelligent Computer Communication and<br />

Proces<strong>si</strong>ng, Cluj-Napoca, Romania, 2010, August 26-28. pp. 321-328.<br />

[187] Vieira, T.A.S., and Casanova, M.A., (2006), Flexible Workflow Execution through an Ontology-based<br />

Approach, DOI= 10.1.1.94.2349.<br />

[188] Vieira, T.A.S., Casanova, M.A. and Ferrao, L.G. (2004). An Ontology-Driven Architecture for Flexible<br />

Workflow Execution, presented at WebMedia and LA-Web, 2004.,<br />

http://dl.acm.org/citation.cfm?id=1032657.1034021, pg. 70-77.<br />

[189] Völkel, M. 2010, Personal Knowledge Mo<strong>de</strong>ls with Semantic Technologies, Ph.D the<strong>si</strong>s,<br />

http://digbib.ubka.uni-karlsruhe.<strong>de</strong>/volltexte/1000019641 (last vi<strong>si</strong>ted: 28.07.2011).<br />

[190] Völkel, M., 2007. Semantic Web Content Mo<strong>de</strong>l and Repo<strong>si</strong>tory. In: Proceedings of the 3rd International<br />

Conference on Semantic Technologies, Graz, Austria, pg. 254—262.<br />

[191] Voss, A. and Procter, R. (2009). Virtual research environments in scholarly work and communications.<br />

In: Library Hi Tech. 27, 2, 174-190. DOI = 10.1108/07378830910968146<br />

[192] Vran<strong>de</strong>cic, D. (2010), Ontology Evaluation, PhD the<strong>si</strong>s, Karlsruher Instituts fur Technologie (KIT), June<br />

2010.<br />

[193] Wallnau, K., Hissam, S. and Seacord, R. 2001, Building Systems from Commercial Components. New<br />

York, NY: Addison-Wesley, 2001.<br />

[194] Wang W.G., Tolk A., Wang W.P., (2009). The levels of conceptual interoperability mo<strong>de</strong>l: Applying<br />

systems engineering principles to M&S. Spring Simulation Multiconference (SpringSim'09). San Diego, CA, USA.<br />

(Published by SCS in the SpringSim'09 Proceedings), 2009.<br />

[195] Wang, S., Shen, W., & Hao, Q., (2006). An agent-based web service workflow mo<strong>de</strong>l for inter-enterprise<br />

collaboration. Expert Systems with Applications, 31(4), 787–799.<br />

[196] WfMC. (1999). Workflow management coalition terminology and glossary, document number WfMC-tc-<br />

1011, document status – issue 3.0.<br />

[197] Wikipedia, www.en.wikipedia.org<br />

[198] Wiley, D. (2007). “Content is infrastructure. Terra incognita.” Available at<br />

http://blog.worldcampus.psu.edu/in<strong>de</strong>x.php/2007/10/03/content-is-infrastructure/ (last vi<strong>si</strong>ted 19.07.2011).<br />

[199] Wrage, L. and Lewis, G. A. (2006) Mo<strong>de</strong>l Problems in Technologies for Interoperability: Web Service,<br />

CMU/SEI-2006-TN-021, Software Engineering Institute, Carnegie Mellon Univer<strong>si</strong>ty, June 2006.<br />

[200] Z39.50 protocol http://www.loc.gov/z3950/agency/ (last vi<strong>si</strong>ted 19.07.2011).<br />

[201] Zeng, M.L., & Xiao, L. (2001). Mapping metadata elements of different format. E-Libraries 2001,<br />

Proceedings, May 15-17, 2001, New York: 91-99. Medford, NJ: Information Today, Inc.<br />

[202] Zupancic. B. (2006). Vorlesungsaufzeichnungen und digitale Annotationen - Einsatz und Nutzen in <strong>de</strong>r<br />

Lehre. PhD the<strong>si</strong>s, Albert-Ludwigs Univer<strong>si</strong>taet Freiburg, July 2006.<br />

73

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!