TEMA 2

SEMANTICA EMERGENTE: SCOPERTA DI MAPPING SEMANTICI TRA ONTOLOGIE DI DOMINIO

Unità coinvolte nel Tema

Università di Modena e Reggio Emilia

Università di Trento

Università di Bologna

Università di Roma Tre

Obiettivi del Tema

Relativamente al TEMA 2, un primo obiettivo è la definizione di un linguaggio per la appresentazione di mapping complessi tra ontologie di dominio. Tale linguaggio dovrà permettere di rappresentare tutti quegli elementi del mapping che sono necessari per potere risolvere una query rispetto a differenti ontologie, cioè la riscrittura della query, e 'individuazione di sorgenti utili. Un altro obiettivo è l’analisi e lo sviluppo di tecniche di mapping semantico tra ontologie, compresa una valutazione del contributo che ognuna di queste tecniche può portare alla computazione delle differenti tipologie di mapping definite nel linguaggio. Tecniche innovative per scoprire mappings tra ontologie di dominio saranno definite. In particolare, verranno considerate tecniche basate sulla semantica del linguaggio e catene lessicali e le tecniche basate sulla deduzione logica. Inoltre, verranno considerate anche tecniche per inferire mapping in base alla similarità tra i dati contenuti nelle sorgenti in quanto la caratterizzazione sintetica del contenuto (istanze) è un aspetto rilevante del progetto.
L’ultimo obiettivo è la definizione di un'architettura generale per la scoperta e la gestione di mapping semantici tra ontologie, che includa i principali moduli concettuali necessari per la computazione di mapping semantici, come per esempio risorse lessicali (ad esempio, WordNet) e moduli di ragionamento automatico.

 

 
Fasi di lavoro

Fase 1 (durata 6 mesi: 1/12/2004 - 31/05/2005)

Questa prima fase si concentrerà sull'analisi e sul confronto tra le tecniche allo stato dell'arte per il mapping semantico (prodotto D2.R1), compresa una valutazione del contributo che ognuna di queste tecniche può portare alla computazione di mapping nel contesto specifico dell'architettura di WISDOM, nella quale sono rilevanti mapping tra un certo numero di ontologie di dominio, ognuna delle quali integra una certa collezione di sorgenti informative in uno schema globale virtuale.
Nell'analizzare in modo critico i principali algoritmi di matching presenti in letteratura, particolare attenzione sarà rivolta a quelli che prevedono tecniche per la risoluzione dei conflitti tra le varie rappresentazioni di uno stesso concetto.
Verranno inoltre analizzate eventuali proposte di standard per il mapping tra ontologie, allo scopo di valutarne il loro impiego nel contesto del progetto WISDOM.
Sulla base dei risultati di queste analisi si delineerà un framework comune per il mapping di ontologie di dominio, con particolare riferimento alla specifica di quale tipo di informazione debba essere rappresentato in un mapping.

Fase 2 (durata 6 mesi: 1/6/2005 - 31/11/2005)

L’obiettivo di questa fase è duplice. Prima di tutto verrà definito un linguaggio per rappresentare mapping complessi tra ontologie di dominio eterogenee. Quindi verranno sviluppate tecniche innovative per scoprire mapping tra ontologie di dominio. In
particolare, verranno considerate tecniche di scoperta basate sia sulla semantica del linguaggio e le catene lessicali (ricerca di sorgenti) che sulla deduzione logica (Context Matching). Inoltre verranno prese in esame anche tecniche per inferire mapping in base alla similarità tra i dati contenuti nelle sorgenti informative in quanto, come stabilito nel TEMA1, la caratterizzazione sintetica del contenuto (istanze) di una nuova sorgente informativa è un aspetto caratterizante del progetto.

Fase 3 (durata 12 mesi: 1/12/2005 - 31/11/2006)

Una prima attività sarà rivolta all’estrazione della rappresentazione sintetica delle sorgenti tramite la tecnica delle catene lessicali.
In particolare, verranno valutati gli algoritmi proposti nel TEMA 1 secondo vari parametri, tra i quali alcuni di natura tecnologica (robustezza del processo estrattivo, complessità computazionale,…) altri di natura qualitativa (espressività delle catene lessicali come metodologia descrittiva delle sorgenti, possibilità di estensione in ambito multilinguistico, efficacia delle tecniche proposte in relazione all’assegnazione di semantica ai dati estratti). Verranno studiate e sviluppate misure di similarità semantica fra le catene lessicali e l’ontologia di riferimento stessa.
Verrà realizzato un prototipo software che implementerà in collaborazione tra le unità di Modena e Trento una piattaforma per la gestione e la scoperta di mapping semantici tra ontologie di dominio (prodotto D2.P1). La piattaforma delineata in tale prototipo può essere vista come un servizio che può essere invocato per generare tali mapping. Essa costituisce un sistema altamente modulare e indipendente dal dominio, in cui diversi componenti funzionali possono essere inseriti "plug and play" o customizzati. A seconda delle scelte architetturali che verranno fatte per il progetto WISDOM, la piattaforma potrà essere usata come un servizio condiviso a livello globale, o usato localmente in modalità "peer-to-peer". Il prototipo sarà oggetto di attività sperimentale utilizzando sorgenti informative su Web.