Unità di ricerca: Università di Bologna

Dipartimento di Elettronica, Informatica e Sistemistica

 

Programma di Ricerca dell'Unità (modello B)

Coordinatore Scientifico del Programma di Ricerca

Prof. Ciaccia Paolo

Dipartimento di ELETTRONICA, INFORMATICA E SISTEMISTICA
Facoltà di INGEGNERIA
Università degli Studi di BOLOGNA

Viale Risorgimento, 2 - 40136 Bologna, Italia
Tel  :+39 051 2093070
Fax :+39 051 2093540

E-mail: pciaccia@deis.unibo.it
Home page: http://www-db.deis.unibo.it/~pciaccia

Partecipanti al programma dell'Unità di Ricerca
 
Partecipante
Dipartimento
Qualifica
CIACCIA PAOLO Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Prof. Ordinario
RIZZI STEFANO Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Prof. Straordinario
GOLFARELLI MATTEO Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Prof. Associato
PATELLA MARCO Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Ricercatore
PENZO WILMA Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Ricercatrice
BARTOLINI ILARIA Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Ricercatrice
BALDACCI LORENZO Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Dottorando
LINARI ALESSANDRO Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Dottorando
MATTEO DI CARLO Dip. ELETTRONICA, INFORMATICA E SISTEMISTICA Personale a contratto

Titolo specifico del programma svolto dall'unità di ricerca

Elaborazione di interrogazioni distribuite basata su ontologie di dominio e profili di sorgenti

 
Descrizione del programma e dei compiti dell'Unità di Ricerca

Gli argomenti che l'Unità di Bologna tratterà nell'ambito del progetto sono relativi ai Temi 1 e 3 e così sintetizzabili:
Tema 1:
- creazione di “content summaries” per le sorgenti informative (Content summaries)
Tema 3:
- esecuzione di interrogazioni distribuite in WISDOM (Esecuzione)
- fruizione e navigazione basata su ontologia dei risultati di interrogazioni (Navigazione)

In particolare, l’attività relativa ai “Content summaries” ha lo scopo di fornire una caratterizzazione (“profilo”) delle sorgenti dal punto di vista statistico che permetta una più precisa valutazione della rilevanza delle sorgenti stesse relativamente a una data interrogazione e, conseguentemente, la selezione delle sorgenti più significative. L’attività di “Esecuzione” include aspetti di esecuzione distribuita dell’interrogazione sulle diverse sorgenti e il coordinamento/sincronizzazione di tali esecuzioni, al fine di determinare, con il minimo dispendio di risorse, i risultati ritenuti più rilevanti. Infine, l’attività di “Navigazione”, che opera a valle del processo di elaborazione vero e proprio, ha lo scopo di fornire meccanismi per poter fruire dei risultati in forma compatta e flessibile, considerando i livelli di astrazione offerti dalla specifica ontologia di dominio.

La ricerca su tali argomenti, rispettando le fasi previste dal progetto, si articolerà come segue:

FASE 1
Per tutti i 3 argomenti la prima fase del progetto sarà innanzitutto dedicata all'analisi critica dello stato dell'arte, allo scopo di definire compiutamente i limiti delle soluzioni attualmente disponibili per i problemi di interesse. Si procederà quindi alla formulazione dei requisiti specifici per i 3 argomenti di ricerca. Nello specifico:
(Content summaries) La fase di analisi verterà principalmente sulla possibilità di estendere le tecniche oggi disponibili per la costruzione di profili al caso di sorgenti descritte da un’ontologia di dominio. In particolare si definiranno compiutamente i requisti che i content summaries devono soddisfare al fine di poter essere efficacemente usati per determinare la rilevanza di una sorgente rispetto a un’interrogazione.
(Esecuzione) Partendo da un’analisi delle principali tipologie di elaborazione in ambiente distribuito ed eterogeneo, si definiranno compiutamente i limiti delle stesse in relazione all’architettura di WISDOM (nella quale, si ricorda, una sorgente è visibile
esternamente solo attraverso l’ontologia di dominio che la integra). In particolare, considerando i vari aspetti che possono contribuire a determinare la rilevanza di un risultato, si analizzerà se e come tali aspetti sono influenzati dall’architettura di WISDOM.
(Navigazione) Si analizzerà la possibilità di elaborare i dati restituiti dalle interrogazioni al fine di presentarli all’utente in forma compatta e facilmente fruibile. Si valuterà quindi in che misura sia opportuno abbinare tecniche di navigazione e sintesi proprie della business intelligence a forme di rappresentazione di pattern proprie del data mining con l’obiettivo di garantire massima flessibilità nella specifica del livello di granularità a cui analizzare i dati. Inoltre, si studierà in che modo estendere i paradigmi sviluppati per l’interrogazione visuale di basi di dati al caso di interrogazione di insiemi di documenti, tenendo in considerazione le
peculiarità derivanti dall’utilizzo di ontologie. Infine si lavorerà, congiuntamente a tutte le altre Unità, alla definizione dell'architettura metodologica e funzionale di riferimento per l'intero progetto (prodotto D0.R1).


PRODOTTI
I prodotti attesi in questa fase del progetto sono di tipo rapporto tecnico (sigla R). La sigla dopo la D indica il tema (0 se il prodotto è comune a tutti i temi).
D0.R1 Rapporto sull'architettura metodologica e funzionale di riferimento (in collaborazione con Modena e Reggio Emilia - MO, Roma - RM, Trento - TN)
D1.R1 Analisi critica dei linguaggi e standard emergenti per le ontologie (in collaborazione con MO, RM, TN)
D3.R1 Analisi critica di linguaggi di interrogazione e tecniche di riscrittura basati su ontologie (in collaborazione con MO, TN)
D3.R2 Analisi critica delle tecniche di esecuzione di interrogazioni in ambiente eterogeneo

 


FASE 2
Nella seconda fase del progetto verranno messe a punto le soluzioni di base per i 3 argomenti specifici trattati dall'Unità:
(Content summaries) Nella seconda fase verranno definiti i meccanismi attraverso i quali ogni ontologia di dominio può essere corredata da informazioni di natura quantitativa. L’idea di base è estendere le tecniche esistenti di “probing” (interrogazione) delle sorgenti considerando le informazioni di natura ontologica, e i vincoli che da tali informazioni sono desumibili. Le soluzioni che si deriveranno saranno ispirate a principi di economia, nel senso di: 1) richiedere il minor numero di “probes”, e 2) fornire le informazioni quantitative più significative, a parità di memoria richiesta per la memorizzazione dei “content summaries”.
In linea con gli obiettivi del Tema 1, verranno inoltre dettagliate le modalità di aggiornamento dei “content summaries” a fronte dell’introduzine di una nuova sorgente e all’estensione della relativa ontologia di dominio.
(Esecuzione) Scopo di questa fase è pervenire alla definizione di tecniche per l’esecuzione di interrogazioni distribuite che, considerando i limiti imposti dall’architettura di WISDOM, siano in grado di restituire i risultati ritenuti più rilevanti minimizzando le risorse necessarie. Poiché la rilevanza di un oggetto può dipendere da vari fattori e dal modo come tali fattori sono tra loro combinati, le tecniche che si svilupperanno saranno di tipo generalizzato, ovvero in grado di funzionare correttamente ed efficientemente anche al variare del criterio di combinazione. Per tale criterio, che nel caso base può ridursi ad una somma pesata dei vari fattori, verrà anche considerato il caso più generale di tipo “qualitativo”, ovvero definito non necessariamente mediante tecniche numeriche.
(Navigazione) Relativamente alla fruizione dei risultati, verranno messi a punto metodi per permettere all’utente di specificare in maniera puntuale il livello di risoluzione desiderato. In particolare, si definiranno tecniche per rappresentare l’informazione in forma compatta e ricca di semantica a differente livelli di astrazione, e si individueranno operatori per la navigazione interattiva dell’informazione sui vari livelli in accordo con l’ontologia di dominio.
Infine si lavorerà, congiuntamente a tutte le altre Unità, alla definizione delle interfacce dei componenti per il prototipo integrato (prodotto D0.R2).

 

PRODOTTI
D0.R2 Specifiche delle interfacce dei componenti del prototipo integrato (in collaborazione con MO, RM, TN)
D1.R2 Definizione del linguaggio per la specifica di una ontologia di dominio (in collaborazione con MO, TN)
D1.R3 Definizione di tecniche per la creazione di “content summaries”
D3.R3 Definizione del linguaggio di interrogazione e delle tecniche di riscrittura basate su ontologie (in collaborazione con MO, TN)
D3.R4 Definizione di tecniche per l’esecuzione di interrogazioni in WISDOM

 


FASE 3
Nella terza fase del progetto verranno sviluppati 3 prototipi, e si collaborerà con le altre Unità all’integrazione dei prototipi realizzati durante il progetto.
Il primo prototipo, a partire da un’ontologia di dominio preesistente, implementerà tecniche di “probing” delle sorgenti relative e di produzione dei relativi “content summaries” a partire dai risultati ottenuti Il secondo prototipo, realizzato in collaborazione con l’Unità di Modena e Reggio Emilia (MO), si farà carico dell’acquisizione e analisi delle interrogazioni, oltre che della determinazione delle sorgenti rilevanti per l’interrogazione stessa.
Il terzo prototipo implementerà le tecniche di esecuzione di interrogazione messe a punto durante la fase 2, e includerà un’interfaccia per la navigazione interattiva dell’informazione a diversi livelli di astrazione sulla base dell’ontologia di dominio.
Per tutti i prototipi verrà condotta un'intensa attività sperimentale volta a verificare gli aspetti di natura prestazionale.


PRODOTTI
I prodotti attesi in questa fase del progetto sono sia di tipo rapporto tecnico (sigla R) che di tipo prototipo software (sigla P).
D0.P1 Prototipo integrato di sistema (in collaborazione con MO, RM, TN)
D1.P2 Prototipo per la creazione di “content summaries”
D3.P1 Prototipo per la formulazione di interrogazioni (in collaborazione con MO)
D3.P2 Prototipo per l’esecuzione di interrogazioni distribuite in WISDOM