| Gli argomenti che l'Unità
di Bologna tratterà nell'ambito del progetto sono relativi
ai Temi 1 e 3 e così sintetizzabili:
Tema 1:
- creazione di “content summaries” per le sorgenti
informative (Content summaries)
Tema 3:
- esecuzione di interrogazioni distribuite in WISDOM (Esecuzione)
- fruizione e navigazione basata su ontologia dei risultati
di interrogazioni (Navigazione)
In particolare, l’attività
relativa ai “Content summaries” ha lo scopo di fornire
una caratterizzazione (“profilo”) delle sorgenti
dal punto di vista statistico che permetta una più precisa
valutazione della rilevanza delle sorgenti stesse relativamente
a una data interrogazione e, conseguentemente, la selezione
delle sorgenti più significative. L’attività
di “Esecuzione” include aspetti di esecuzione distribuita
dell’interrogazione sulle diverse sorgenti e il coordinamento/sincronizzazione
di tali esecuzioni, al fine di determinare, con il minimo dispendio
di risorse, i risultati ritenuti più rilevanti. Infine,
l’attività di “Navigazione”, che opera
a valle del processo di elaborazione vero e proprio, ha lo scopo
di fornire meccanismi per poter fruire dei risultati in forma
compatta e flessibile, considerando i livelli di astrazione
offerti dalla specifica ontologia di dominio.
La ricerca su tali argomenti, rispettando
le fasi previste dal progetto, si articolerà come segue:
FASE 1
Per tutti i 3 argomenti la prima fase del progetto sarà
innanzitutto dedicata all'analisi critica dello stato dell'arte,
allo scopo di definire compiutamente i limiti delle soluzioni
attualmente disponibili per i problemi di interesse. Si procederà
quindi alla formulazione dei requisiti specifici per i 3 argomenti
di ricerca. Nello specifico:
(Content summaries) La fase di analisi verterà principalmente
sulla possibilità di estendere le tecniche oggi disponibili
per la costruzione di profili al caso di sorgenti descritte
da un’ontologia di dominio. In particolare si definiranno
compiutamente i requisti che i content summaries devono soddisfare
al fine di poter essere efficacemente usati per determinare
la rilevanza di una sorgente rispetto a un’interrogazione.
(Esecuzione) Partendo da un’analisi delle principali tipologie
di elaborazione in ambiente distribuito ed eterogeneo, si definiranno
compiutamente i limiti delle stesse in relazione all’architettura
di WISDOM (nella quale, si ricorda, una sorgente è visibile
esternamente solo attraverso l’ontologia di dominio che
la integra). In particolare, considerando i vari aspetti che
possono contribuire a determinare la rilevanza di un risultato,
si analizzerà se e come tali aspetti sono influenzati
dall’architettura di WISDOM.
(Navigazione) Si analizzerà la possibilità di
elaborare i dati restituiti dalle interrogazioni al fine di
presentarli all’utente in forma compatta e facilmente
fruibile. Si valuterà quindi in che misura sia opportuno
abbinare tecniche di navigazione e sintesi proprie della business
intelligence a forme di rappresentazione di pattern proprie
del data mining con l’obiettivo di garantire massima flessibilità
nella specifica del livello di granularità a cui analizzare
i dati. Inoltre, si studierà in che modo estendere i
paradigmi sviluppati per l’interrogazione visuale di basi
di dati al caso di interrogazione di insiemi di documenti, tenendo
in considerazione le
peculiarità derivanti dall’utilizzo di ontologie.
Infine si lavorerà, congiuntamente a tutte le altre Unità,
alla definizione dell'architettura metodologica e funzionale
di riferimento per l'intero progetto (prodotto D0.R1).
PRODOTTI
I prodotti attesi in questa fase del progetto sono di tipo rapporto
tecnico (sigla R). La sigla dopo la D indica il tema (0 se il
prodotto è comune a tutti i temi).
D0.R1 Rapporto sull'architettura metodologica e funzionale di
riferimento (in collaborazione con Modena e Reggio Emilia -
MO, Roma - RM, Trento - TN)
D1.R1 Analisi critica dei linguaggi e standard emergenti per
le ontologie (in collaborazione con MO, RM, TN)
D3.R1 Analisi critica di linguaggi di interrogazione e tecniche
di riscrittura basati su ontologie (in collaborazione con MO,
TN)
D3.R2 Analisi critica delle tecniche di esecuzione di interrogazioni
in ambiente eterogeneo
FASE 2
Nella seconda fase del progetto verranno messe a punto le soluzioni
di base per i 3 argomenti specifici trattati dall'Unità:
(Content summaries) Nella seconda fase verranno definiti i meccanismi
attraverso i quali ogni ontologia di dominio può essere
corredata da informazioni di natura quantitativa. L’idea
di base è estendere le tecniche esistenti di “probing”
(interrogazione) delle sorgenti considerando le informazioni
di natura ontologica, e i vincoli che da tali informazioni sono
desumibili. Le soluzioni che si deriveranno saranno ispirate
a principi di economia, nel senso di: 1) richiedere il minor
numero di “probes”, e 2) fornire le informazioni
quantitative più significative, a parità di memoria
richiesta per la memorizzazione dei “content summaries”.
In linea con gli obiettivi del Tema 1, verranno inoltre dettagliate
le modalità di aggiornamento dei “content summaries”
a fronte dell’introduzine di una nuova sorgente e all’estensione
della relativa ontologia di dominio.
(Esecuzione) Scopo di questa fase è pervenire alla definizione
di tecniche per l’esecuzione di interrogazioni distribuite
che, considerando i limiti imposti dall’architettura di
WISDOM, siano in grado di restituire i risultati ritenuti più
rilevanti minimizzando le risorse necessarie. Poiché
la rilevanza di un oggetto può dipendere da vari fattori
e dal modo come tali fattori sono tra loro combinati, le tecniche
che si svilupperanno saranno di tipo generalizzato, ovvero in
grado di funzionare correttamente ed efficientemente anche al
variare del criterio di combinazione. Per tale criterio, che
nel caso base può ridursi ad una somma pesata dei vari
fattori, verrà anche considerato il caso più generale
di tipo “qualitativo”, ovvero definito non necessariamente
mediante tecniche numeriche.
(Navigazione) Relativamente alla fruizione dei risultati, verranno
messi a punto metodi per permettere all’utente di specificare
in maniera puntuale il livello di risoluzione desiderato. In
particolare, si definiranno tecniche per rappresentare l’informazione
in forma compatta e ricca di semantica a differente livelli
di astrazione, e si individueranno operatori per la navigazione
interattiva dell’informazione sui vari livelli in accordo
con l’ontologia di dominio.
Infine si lavorerà, congiuntamente a tutte le altre Unità,
alla definizione delle interfacce dei componenti per il prototipo
integrato (prodotto D0.R2).
PRODOTTI
D0.R2 Specifiche delle interfacce dei componenti del prototipo
integrato (in collaborazione con MO, RM, TN)
D1.R2 Definizione del linguaggio per la specifica di una ontologia
di dominio (in collaborazione con MO, TN)
D1.R3 Definizione di tecniche per la creazione di “content
summaries”
D3.R3 Definizione del linguaggio di interrogazione e delle tecniche
di riscrittura basate su ontologie (in collaborazione con MO,
TN)
D3.R4 Definizione di tecniche per l’esecuzione di interrogazioni
in WISDOM
FASE 3
Nella terza fase del progetto verranno sviluppati 3 prototipi,
e si collaborerà con le altre Unità all’integrazione
dei prototipi realizzati durante il progetto.
Il primo prototipo, a partire da un’ontologia di dominio
preesistente, implementerà tecniche di “probing”
delle sorgenti relative e di produzione dei relativi “content
summaries” a partire dai risultati ottenuti Il secondo
prototipo, realizzato in collaborazione con l’Unità
di Modena e Reggio Emilia (MO), si farà carico dell’acquisizione
e analisi delle interrogazioni, oltre che della determinazione
delle sorgenti rilevanti per l’interrogazione stessa.
Il terzo prototipo implementerà le tecniche di esecuzione
di interrogazione messe a punto durante la fase 2, e includerà
un’interfaccia per la navigazione interattiva dell’informazione
a diversi livelli di astrazione sulla base dell’ontologia
di dominio.
Per tutti i prototipi verrà condotta un'intensa attività
sperimentale volta a verificare gli aspetti di natura prestazionale.
PRODOTTI
I prodotti attesi in questa fase del progetto sono sia di tipo
rapporto tecnico (sigla R) che di tipo prototipo software (sigla
P).
D0.P1 Prototipo integrato di sistema (in collaborazione con
MO, RM, TN)
D1.P2 Prototipo per la creazione di “content summaries”
D3.P1 Prototipo per la formulazione di interrogazioni (in collaborazione
con MO)
D3.P2 Prototipo per l’esecuzione di interrogazioni distribuite
in WISDOM
|