TEMA 2
SEMANTICA EMERGENTE: SCOPERTA DI
MAPPING SEMANTICI TRA ONTOLOGIE DI DOMINIO
|
|
| Unità
coinvolte nel Tema |
|
Università di Modena e Reggio
Emilia
|
|
Università di Trento
|
|
Università di Bologna
|
|
Università di Roma Tre
|
|
|
| Obiettivi del
Tema |
| Relativamente al TEMA 2, un
primo obiettivo è la definizione di un linguaggio per
la appresentazione di mapping complessi tra ontologie di dominio.
Tale linguaggio dovrà permettere di rappresentare tutti
quegli elementi del mapping che sono necessari per potere risolvere
una query rispetto a differenti ontologie, cioè la riscrittura
della query, e 'individuazione di sorgenti utili. Un altro obiettivo
è l’analisi e lo sviluppo di tecniche di mapping
semantico tra ontologie, compresa una valutazione del contributo
che ognuna di queste tecniche può portare alla computazione
delle differenti tipologie di mapping definite nel linguaggio.
Tecniche innovative per scoprire mappings tra ontologie di dominio
saranno definite. In particolare, verranno considerate tecniche
basate sulla semantica del linguaggio e catene lessicali e le
tecniche basate sulla deduzione logica. Inoltre, verranno considerate
anche tecniche per inferire mapping in base alla similarità
tra i dati contenuti nelle sorgenti in quanto la caratterizzazione
sintetica del contenuto (istanze) è un aspetto rilevante
del progetto.
L’ultimo obiettivo è la definizione di un'architettura
generale per la scoperta e la gestione di mapping semantici
tra ontologie, che includa i principali moduli concettuali necessari
per la computazione di mapping semantici, come per esempio risorse
lessicali (ad esempio, WordNet) e moduli di ragionamento automatico.
|
| |
| Fasi di lavoro |
| Fase 1 (durata 6 mesi:
1/12/2004 - 31/05/2005)
|
| Questa prima fase si concentrerà
sull'analisi e sul confronto tra le tecniche allo stato dell'arte
per il mapping semantico (prodotto D2.R1), compresa una valutazione
del contributo che ognuna di queste tecniche può portare
alla computazione di mapping nel contesto specifico dell'architettura
di WISDOM, nella quale sono rilevanti mapping tra un certo numero
di ontologie di dominio, ognuna delle quali integra una certa
collezione di sorgenti informative in uno schema globale virtuale.
Nell'analizzare in modo critico i principali algoritmi di matching
presenti in letteratura, particolare attenzione sarà
rivolta a quelli che prevedono tecniche per la risoluzione dei
conflitti tra le varie rappresentazioni di uno stesso concetto.
Verranno inoltre analizzate eventuali proposte di standard per
il mapping tra ontologie, allo scopo di valutarne il loro impiego
nel contesto del progetto WISDOM.
Sulla base dei risultati di queste analisi si delineerà
un framework comune per il mapping di ontologie di dominio,
con particolare riferimento alla specifica di quale tipo di
informazione debba essere rappresentato in un mapping.
|
| Fase 2 (durata 6 mesi: 1/6/2005
- 31/11/2005)
|
| L’obiettivo di questa
fase è duplice. Prima di tutto verrà definito
un linguaggio per rappresentare mapping complessi tra ontologie
di dominio eterogenee. Quindi verranno sviluppate tecniche innovative
per scoprire mapping tra ontologie di dominio. In
particolare, verranno considerate tecniche di scoperta basate
sia sulla semantica del linguaggio e le catene lessicali (ricerca
di sorgenti) che sulla deduzione logica (Context Matching).
Inoltre verranno prese in esame anche tecniche per inferire
mapping in base alla similarità tra i dati contenuti
nelle sorgenti informative in quanto, come stabilito nel TEMA1,
la caratterizzazione sintetica del contenuto (istanze) di una
nuova sorgente informativa è un aspetto caratterizante
del progetto.
|
| Fase 3 (durata 12 mesi:
1/12/2005 - 31/11/2006)
|
| Una prima attività sarà
rivolta all’estrazione della rappresentazione sintetica
delle sorgenti tramite la tecnica delle catene lessicali.
In particolare, verranno valutati gli algoritmi proposti nel
TEMA 1 secondo vari parametri, tra i quali alcuni di natura
tecnologica (robustezza del processo estrattivo, complessità
computazionale,…) altri di natura qualitativa (espressività
delle catene lessicali come metodologia descrittiva delle sorgenti,
possibilità di estensione in ambito multilinguistico,
efficacia delle tecniche proposte in relazione all’assegnazione
di semantica ai dati estratti). Verranno studiate e sviluppate
misure di similarità semantica fra le catene lessicali
e l’ontologia di riferimento stessa.
Verrà realizzato un prototipo software che implementerà
in collaborazione tra le unità di Modena e Trento una
piattaforma per la gestione e la scoperta di mapping semantici
tra ontologie di dominio (prodotto D2.P1). La piattaforma delineata
in tale prototipo può essere vista come un servizio che
può essere invocato per generare tali mapping. Essa costituisce
un sistema altamente modulare e indipendente dal dominio, in
cui diversi componenti funzionali possono essere inseriti "plug
and play" o customizzati. A seconda delle scelte architetturali
che verranno fatte per il progetto WISDOM, la piattaforma potrà
essere usata come un servizio condiviso a livello globale, o
usato localmente in modalità "peer-to-peer".
Il prototipo sarà oggetto di attività sperimentale
utilizzando sorgenti informative su Web.
|
|
|
|