Introduzione al Semantic Web

Oreste Signore, <oreste@w3.org>
Responsabile Ufficio Italiano W3C
Area della Ricerca CNR - via Moruzzi, 1 - 56124 Pisa


Web Senza Barriere ‘08

Roma, 7-8-9 maggio 2008


Presentazione: http://www.w3c.it/talks/2008/wsb08/slides.html
Documento pdf: http://www.w3c.it/papers/wsb08.pdf

Cover page W3C Office Logo Cover page Weblab Logo Valid XHTML 1.0! Valid CSS!

Ringraziamenti

Lo cerco sul Web…

I limiti del Web attuale

L' integrazione dei dati

esportazione dei dati semplificata

Una versione semplificata di una biblioteca (Dataset "A")

Tabella Book
ID Author Title Publisher Year
ISBN 0-00-651409-X id_xyz The Glass Palace id_qpr 2000
Tabella Author
ID Name Home page
id_xyz Amitav Ghosh http://www.amitavghosh.com/
Tabella Publisher
ID Publisher Name City
id_qpr Harper Collins London

Rappresentata come grafo …

The previous table in an RDF format

Alcune osservazioni sull' esportazione dei dati

Un' altra biblioteca (dataset "F")

Tabella Livre
ID Titre Auteur Traducteur Original
ISBN 2020386682 Le Palais des miroirs i_abc i_qrs ISBN 0-00-651409-X
Tabella Auteur
ID Nom
i_abc Amitav Ghosh
i_qrs Christiane Besse

Secondo passo: esportare il secondo insieme di dati

The French data in RDF

Terzo passo: Merging dei dati

The French and English data side by side

Terzo passo: Merging dei dati (cont.)

The merged data with nodes with identical URI-s pointed out

Merging delle risorse identiche

The merged data with one of the nodes merged with common URI

Le Query più semplici…

The merged data with one of the nodes merged with common URI

…ma si può avere di più

Sorpresi?

In reltà cosa abbiamo fatto?

E il processo può essere anche più ricco

E il Semantic Web?

L' architettura del Semantic Web

immagine dei livelli del semantic web
Il Semantic Web ...
  • è un' infrastruttura basata su metadati per poter svolgere ragionamenti sul Web
  • estende, non sostituisce il web attuale
I metadati sono:
  • Informazioni, elaborabili automaticamente (machine understandable), relative a una risorsa web o a qualche altra cosa
  • ... data about data
  • ... informazioni che possono essere utilizzate da intelligent software agents per fare un uso appropriato delle risorse
  • ... dati ...
  • ... che possono essere descritti da altri metadati ...

Perché i metadati?

Elementi di RDF

Cosa è RDF?

RDF è per il Semantic Web ciò che HTML è stato per il web

Triple RDF

Triple RDF (cont.)

(<http://…isbn 6682>, <http://…/original>, <http://…isbn 409X>)

Triple RDF (cont.)

Un esempio semplice di RDF (in RDF/XML)

A Simple RDF Graph with full URI-s
<rdf:Description rdf:about="http://…/isbn/2020386682">
    <f:titre xml:lang="fr">Le palais des mirroirs</f:titre>
    <f:original rdf:resource="http://…/isbn/000651409X"/>
</rdf:Description>

(Nota: per semplificare gli URI sono stati usati i namespace)

Un esempio semplice di RDF (in Turtle)

A Simple RDF Graph with full URI-s
<http://…/isbn/2020386682>
    f:titre "Le palais des mirroirs"@fr;
    f:original <http://…/isbn/000651409X>.

Quale sintassi?

Il ruolo fondamentale degli URI

Nodi "interni"

A graph with a blank node in the middle (labelled with "?")

Extra URI … oppure … blank nodes

RDFSchema

Perché RDF Schema?

Perché RDF Schema?

Classi, Risorse, …

Classi, Risorse, … (cont.)

Classi, Risorse in RDF(S)

A slide showing the book with its own Schema and the RDFS entitites, all merged

Un esempio di RDFS in RDF/XML

Inferenza delle proprietà

A slide showing an inferred property

Proprietà

Proprietà (cont.)

Anche un po' di RDFS può dare enormi vantaggi…

Alcune Classi e proprietà predefinite

Ontologie (OWL)

Ontologie

Ontologie (cont.)

Cos'è un' ontologia?

Jim Hendler

A set of knowledge terms, including the vocabulary, the semantic interconnections and some simple rules of inference and logic for some particular topic

Studer et al. (1998)

An ontology is a formal, explicit specification of a shared conceptualisation.
A 'conceptualisation' refers to an abstract model of some phenomenon in the world by having identified the relevant concepts of that phenomenon.
'Explicit' means that the type of concepts used, and the constraints on their use are explicitly defined. For example, in medical domains, the concepts are diseases and symptoms, the relations between them are causal and a constraint is that a disease cannot cause itself.
'Formal' refers to the fact that the ontology should be machine readable, which excludes natural language.
'Shared' reflects the notion that an ontology captures consensual knowledge, that is, it is not private to some individual, but accepted by a group.

Disaccordo o accordo?

Il Semantic Web: la visione del W3C

Ipotesi e sfide
  • il Web è intrinsecamente distribuito
  • le macchine possono accedere ad un insieme strutturato di informazioni e a un insieme di regole di inferenza da utilizzare per il ragionamento automatico
  • per ragionare sui dati occorrono le ontologie
  • fornire un linguaggio per esprimere dati e regole per ragionare sui dati
  • esportare sul web delle regole da qualunque sistema di rappresentazione della conoscenza
Metadati
  • informazioni, comprensibili dalla macchina, relative a una risorsa web o a qualche altra cosa

Ontologie sul Web

Il Semantic Web: le tecnologie W3C

Resource Description Framework (RDF)
  • strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati
  • consente l'interoperabilità tra applicazioni che si scambiano sul web informazioni machine-understandable
Web Ontology Language (OWL)
  • linguaggio per descrivere proprietà, vincoli, cardinalità, etc.
  • permette di esportare ontologie in modo interoperabile

OWL: tre sottolinguaggi

OWL Lite
per rappresentare classificazioni gerarchiche e vincoli semplici. Permette una migrazione rapida per thesauri e altre tassonomie.
OWL DL
per utenti che desiderano la massima potenza espressiva garantendo comunque la completezza computazionale (tutte le conclusioni sono computabili) e la decidibilità (tutte le computazioni terminano in un tempo finito)
OWL Full
per utenti che desiderano la massima potenza espressiva e la libertà sintattica di RDF.
Non fornisce garanzie sui tempi di computazione, e difficilmente sarà supportato nella sua interezza da software che implementano il ragionamento

Relazioni di sottoclasse tra alcune primitive RDF/RDFS e OWL

RDFandOWL

Le classi in OWL

Caratterizzazione delle proprietà

Object e Datatype Property

owl:ObjectProperty
  • consentono di mettere in relazione tra di loro gli oggetti (es.: possiede, insegna, etc.)
owl:DatatypeProperty
  • consentono di mettere in relazione gli oggetti con i valori (es. numeroDiTelefono, nome, dataDiNascita, etc.)
  • non esistono tipi predefiniti
  • è possibile utilizzare i data type di XML Schema, restando così aderenti all' architettura a strati del Semantic Web

Caratterizzazione delle proprietà

owl:minCardinality
owl:maxCardinality
owl:SymmetricProperty
owl:TransitiveProperty
owl:FunctionalProperty
  • ha al massimo un valore per ogni oggetto (es. dataDiNascita, peso, nome)
owl:InverseFunctionalProperty
  • proprietà per cui due oggetti diversi non possono avere lo stesso valore (es. èCodiceFiscaleDi, èNumeroDiMatricolaDi, etc.)

Un esempio di caratterizzazione delle proprietà

Equivalenza e Relazioni tra termini

Esempio: equivalenza inglese-francese

Example of equivalence between English and Hungarian terms

L' integrazione dei dati: il ruolo delle tecnologie

integrazione dei dati con indicazione delle tecnologie

Conclusioni

Grazie per l' attenzione

Domande?


Se non è sul Web non esiste ...

... troverete sul sito dell' Ufficio (http://www.w3c.it/)
le slide (http://www.w3c.it/talks/2008/wsb08/)
e il documento: http://www.w3c.it/papers/wsb08.pdf