Selected papers - Garr
Selected papers - Garr
Selected papers - Garr
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
quisizione di conoscenza nel dominio di applicazione<br />
dell’ontologia stessa. Tale acquisizione<br />
può richiedere molto tempo e risorse umane<br />
(in particolare esperti del dominio).<br />
Molti sforzi della ricerca nell’ambito delle ontologie<br />
sono mirati a studiare tecniche e metodi<br />
per costruire ontologie in maniera semi-automatica<br />
a partire da conoscenza espressa in<br />
forma di testo strutturato o meno, da dizionari,<br />
basi di conoscenza, schemi semi-strutturati<br />
e relazionali. In questo senso, possiamo definire<br />
il processo di ontology learning (o ontology<br />
extraction) come l’insieme dei metodi e<br />
delle tecniche usate per costruire una ontologia<br />
ex-novo o per arricchirne o adattarne una<br />
esistente in maniera semi-automatica usando<br />
diverse sorgenti.<br />
Esistono diversi approcci per l’automatizzazione<br />
parziale del processo di acquisizione<br />
di conoscenza. Per eseguire questa automatizzazione,<br />
possono essere usate tecniche di natural<br />
language processing e di machine learning.<br />
Tali tecniche prevedono operazioni di<br />
potatura, unione, arricchimento di ontologie<br />
preesistenti, o anche creazione di ontologie ex<br />
novo, benché in quest’ultimo caso l’apporto<br />
umano sia ancora nettamente predominante.<br />
Il processo di ontology learning definito<br />
e utilizzato nell’ambito delle attività di LC3<br />
prevede l’estrazione, per mezzo di un’analisi<br />
testuale ed eventualmente strutturale dei documenti<br />
disponibili, delle caratteristiche salienti<br />
dei documenti, sulla base dalla ricorrenza<br />
statistica dei lemmi più significativi e<br />
dei collegamenti tra i documenti e tra le loro<br />
parti..<br />
Il tool sviluppato per la realizzazione delle<br />
fasi descritte in figura presenta una serie di<br />
pannelli che consentono avviare la fase di Text<br />
Analysis che fornirà il file delle caratteristiche,<br />
necessario per la successiva fase di clusterizzazione<br />
dei documenti processati.<br />
4.3 Definizione di tecniche semantiche per<br />
l’IR<br />
Il sistema prototipale presentato in questo la-<br />
voro, Semantic Searcher, oltre ad utilizzare le<br />
tecniche di Information Retrieval e Natural<br />
Language Processing, si basa anche sulle ontologie,<br />
ma diversamente dagli approcci che<br />
tendono ad utilizzarle come un mero supporto<br />
al query expansion, le utilizza per aiutare il<br />
sistema nel processamento della query utente,<br />
fornendo una base di conoscenza specifica<br />
che permetta di esplorarne il suo significato<br />
semantico e fornisca una risposta precisa a<br />
query anche molto complesse.<br />
4.4 Profilazione client side e adattamento dei<br />
contenuti<br />
Al fine di adattare la ricerca dei contenuti (e il<br />
risultato stesso della ricerca) al loro contesto<br />
di utilizzo, occorre fornire il profilo che descrive<br />
l’utilizzatore e identificare il set di risorse<br />
di cui serve disporre.<br />
L’architettura del sistema multicanale context-aware<br />
progettato e sviluppato nell’ambito<br />
del progetto LC3 è rappresentata in figura<br />
2. Gran parte dei terminali mobili oggi disponibili<br />
sul mercato aggiungono nell’header<br />
HTTP un link che punta ad un descrittore<br />
standard del particolare prodotto commerciale.<br />
Queste tipologie di profilo sono naturalmente<br />
statiche. Tecniche di profilazione automatica<br />
dei terminali di tipo avanzato sono necessarie<br />
per una profilazione che riesca a recuperare<br />
attributi quali l’effettiva memoria disponibile,<br />
il software installato sul terminale,<br />
la banda, la carica della batteria, la posizione<br />
dell’utente, ecc.<br />
Fig. 2 Architettura del sistema multicanale del progetto LC3<br />
Le tecniche sviluppate nell’ambito del progetto<br />
utilizzano la tecnologia ad Agenti Mobili.<br />
59