Tecnologie del Web Semantico per le Digital Libraries

Oreste Signore, <oreste@w3c.it>
Responsabile Ufficio Italiano W3C
Area della Ricerca CNR - via Moruzzi, 1 - 56124 Pisa


Cultura Senza Barriere
Università degli Studi di Padova
Padova, 18-20 febbraio 2010


Slides: http://www.w3c.it/talks/2010/csb2010-swdl/slides.html
Versione pdf: [ pagina singola] [ due pagine]

Cover page W3C Office Logo Cover page Weblab Logo Valid XHTML 1.0! Valid CSS!

Ringraziamenti

Contenuto

Il text retrieval

Naturalis Historia - frontespizio
Plinio il Vecchio-immagine

In principio fu lo scriptorium…

miniatura di un amanuense

stat rosa pristina nomine, nomina nuda tenemus

…poi venne Gutenberg…

Gutenberg - la Bibbia

(http://upload.wikimedia.org/wikipedia/commons/b/b0/Gutenberg_Bible.jpg)

…e infine i calcolatori

Dublin Core: la grammatica

png

Dublin Core: due esempi

Lo cerco sul Web…

Una versione semplificata di una biblioteca (Dataset "A")

Tabella Book
ID Author Title Publisher Year
ISBN 0-00-651409-X id_xyz The Glass Palace id_qpr 2000
Tabella Author
ID Name Home page
id_xyz Amitav Ghosh http://www.amitavghosh.com/
Tabella Publisher
ID Publisher Name City
id_qpr Harper Collins London

Rappresentata come grafo …

The previous table in an RDF format

Alcune osservazioni sull' esportazione dei dati

Un' altra biblioteca (dataset "F")

Tabella Livre
ID Titre Auteur Traducteur Original
ISBN 2020386682 Le Palais des miroirs i_abc i_qrs ISBN 0-00-651409-X
Tabella Auteur
ID Nom
i_abc Amitav Ghosh
i_qrs Christiane Besse

Secondo passo: esportare il secondo insieme di dati

The French data in RDF

Terzo passo: Merging dei dati

The French and English data side by side

Terzo passo: Merging dei dati (cont.)

The merged data with nodes with identical URI-s pointed out

Merging delle risorse identiche

The merged data with one of the nodes merged with common URI

Le Query più semplici…

The merged data with one of the nodes merged with common URI

Sorpresi?

In realtà cosa abbiamo fatto?

E il Semantic Web?

L' architettura del Semantic Web

immagine dei livelli del semantic web
Il Semantic Web …
  • è un' infrastruttura basata su metadati per poter svolgere ragionamenti sul Web
  • estende, non sostituisce il web attuale
I metadati sono:
  • Informazioni, elaborabili automaticamente (machine understandable)
  • vocabolari (ontologie) condivisi
  • un data model condiviso
Gli standard tecnologici
  • RDF, OWL, SKOS,…

…solo un aspetto tecnico

Elementi di RDF

Resource Description Framework (RDF) è per il Semantic Web quello che HTML è stato per il Web

immagine dei livelli del semantic web immagine dei livelli del semantic web

Triple RDF

Triple RDF (cont.)

(<http://…isbn 6682>, <http://…/original>, <http://…isbn 409X>)

Triple RDF (cont.)

Un esempio semplice di RDF (in RDF/XML)

A Simple RDF Graph with full URI-s
<rdf:Description rdf:about="http://…/isbn/2020386682">
    <f:titre xml:lang="fr">Le palais des mirroirs</f:titre>
    <f:original rdf:resource="http://…/isbn/000651409X"/>
</rdf:Description>

(Nota: per semplificare gli URI sono stati usati i namespace)

Un esempio semplice di RDF (in Turtle)

A Simple RDF Graph with full URI-s
<http://…/isbn/2020386682>
    f:titre "Le palais des mirroirs"@fr;
    f:original <http://…/isbn/000651409X>.

Dublin Core in RDF

png

Quale sintassi?

RDFSchema

immagine dei livelli del semantic web immagine dei livelli del semantic web

Perché RDF Schema?

Perché RDF Schema?

Classi, Risorse, …

A slide showing an inferred property

Classi, Risorse, … (cont.)

Classi, Risorse in RDF(S)

A slide showing the book with its own Schema and the RDFS entitites, all merged

Un esempio di RDFS in RDF/XML

Inferenza delle proprietà

A slide showing an inferred property

Proprietà

Ontologie (OWL)

SW logo immagine dei livelli del semantic web

Ontologie

Cos'è un' ontologia?

Jim Hendler

A set of knowledge terms, including the vocabulary, the semantic interconnections and some simple rules of inference and logic for some particular topic

Studer et al. (1998)

An ontology is a formal, explicit specification of a shared conceptualisation.
A 'conceptualisation' refers to an abstract model of some phenomenon in the world by having identified the relevant concepts of that phenomenon.
'Explicit' means that the type of concepts used, and the constraints on their use are explicitly defined. For example, in medical domains, the concepts are diseases and symptoms, the relations between them are causal and a constraint is that a disease cannot cause itself.
'Formal' refers to the fact that the ontology should be machine readable, which excludes natural language.
'Shared' reflects the notion that an ontology captures consensual knowledge, that is, it is not private to some individual, but accepted by a group.

Disaccordo o accordo?

OWL: tre sottolinguaggi

OWL logo
OWL Lite
per rappresentare classificazioni gerarchiche e vincoli semplici. Permette una migrazione rapida per thesauri e altre tassonomie.
OWL DL
per utenti che desiderano la massima potenza espressiva garantendo comunque la completezza computazionale (tutte le conclusioni sono computabili) e la decidibilità (tutte le computazioni terminano in un tempo finito)
OWL Full
per utenti che desiderano la massima potenza espressiva e la libertà sintattica di RDF.
Non fornisce garanzie sui tempi di computazione, e difficilmente sarà supportato nella sua interezza da software che implementano il ragionamento

Le classi in OWL

Caratterizzazione delle proprietà

owl:minCardinality
owl:maxCardinality
owl:SymmetricProperty
owl:TransitiveProperty
owl:FunctionalProperty
  • ha al massimo un valore per ogni oggetto (es. dataDiNascita, peso, nome)
owl:InverseFunctionalProperty
  • proprietà per cui due oggetti diversi non possono avere lo stesso valore (es. èCodiceFiscaleDi, èNumeroDiMatricolaDi, etc.)

Caratterizzazione delle proprietà: un esempio

example of symmetric property

From: Antoine Isaac (with Guus Schreiber): Publishing Vocabularies on the Web. NETTAB 2007 workshop on A Semantic Web for Bioinformatics: Goals, Tools, Systems, Applications. Pisa, Italy, June 14, 2007.
[ Slides]

Caratterizzazione delle proprietà: un altro esempio

example of inverse property

From: Antoine Isaac (with Guus Schreiber): Publishing Vocabularies on the Web. NETTAB 2007 workshop on A Semantic Web for Bioinformatics: Goals, Tools, Systems, Applications. Pisa, Italy, June 14, 2007.
[ Slides]

Thesauri e SKOS

Thesauri e ontologie

(da: Fausto Giunchiglia and Ilya Zaihrayeu: LIGHTWEIGHT ONTOLOGIES - October 2007 - Technical Report DIT-07-071)

Thesaurus
  • può essere rappresentato come un grafo
  • nodi = termini di thesaurus
  • archi = associazioni semantiche

Simple Knowledge Organization System (SKOS)

Dai thesauri alle ontologie

Un esempio di SKOS: Glossario (1)

“Assertion”
“(i) Any expression which is claimed to be true. (ii) The act of claiming something to be true.”
“Class”
“A general concept, category or classification. Something used primarily to classify or categorize other things.”
“Resource”
“(i) An entity; anything in the universe. (ii) As a class name: the class of everything; the most inclusive category possible.”

(from the RDF Semantics Glossary)

Un esempio di SKOS: Glossario (2)

un esempio semplice di glossario

Un esempio di SKOS: Thesaurus (1)

Term
Economic cooperation
Used For
Economic co-operation
Broader terms
Economic policy
Narrower terms
Economic integration, European economic cooperation, …
Related terms
Interdependence
Scope Note
Includes cooperative measures in banking, trade, …

(from UK Archival Thesaurus)

Un esempio di SKOS: Thesaurus (2)

A slide for a simple SKOS thesaurus

Un esempio di SKOS: etichette multilingua per i concetti

example of symmetric property

From: Antoine Isaac (with Guus Schreiber): Publishing Vocabularies on the Web. NETTAB 2007 workshop on A Semantic Web for Bioinformatics: Goals, Tools, Systems, Applications. Pisa, Italy, June 14, 2007.
[ Slides]

Un esempio di SKOS: collezioni

example of symmetric property

From: Antoine Isaac (with Guus Schreiber): Publishing Vocabularies on the Web. NETTAB 2007 workshop on A Semantic Web for Bioinformatics: Goals, Tools, Systems, Applications. Pisa, Italy, June 14, 2007.
[ Slides]

Conclusioni

Grazie per l' attenzione

Domande?

... e risposte


Se non è sul Web non esiste ...

... troverete sul sito dell' Ufficio (http://www.w3c.it/)
le slide (http://www.w3c.it/talks/2010/csb2010-swdl/)
e un documento: http://www.w3c.it/papers/wsb08.pdf utile