Knowledge creation: integrazione di HTML e Semantic Web

Oreste Signore, <oreste@w3.org>
Responsabile Ufficio Italiano W3C
Area della Ricerca CNR - via Moruzzi, 1 - 56124 Pisa


The 12th KNOWLEDGE MANAGEMENT FORUM
Organised by JEKPOT

Milano, Italy, 26 - 28 November 2007


Presentazione: http://www.w3c.it/talks/2007/km12/slides.html
Versione pdf: http://www.w3c.it/talks/2007/km12/slides.pdf
Documento: http://www.w3c.it/papers/km12.pdf

Cover page Weblab Logo Cover page W3C Office Logo Valid XHTML 1.0! Valid CSS!

Ringraziamenti

Knowledge creation: integrazione di HTML e Semantic Web

Web e W3C

Il Web è ambiente sociale

“The Web is more a social creation than a technical one. I designed it for a social effect - to help people work together - and not as a technical toy. The ultimate goal of the Web is to support and improve our weblike existence in the world.”
(Tim Berners-Lee - Weaving the Web, p. 123)

World Wide Web Consortium (W3C)

Photo of TBL

“To lead the World Wide Web to its full potential by developing protocols and guidelines that ensure long-term growth for the Web”

Knowledge creation: integrazione di HTML e Semantic Web

Condividere la conoscenza

L' integrazione dei dati

esportazione dei dati semplificata

I limiti del Web attuale

L' architettura del Semantic Web

immagine dei livelli del semantic web
Il Semantic Web ...
  • è un' infrastruttura basata su metadati per poter svolgere ragionamenti sul Web
  • estende, non sostituisce il web attuale
I metadati sono:
  • Informazioni, elaborabili automaticamente (machine understandable), relative a una risorsa web o a qualche altra cosa
  • ... data about data
  • ... informazioni che possono essere utilizzate da intelligent software agents per fare un uso appropriato delle risorse
  • ... dati ...
  • ... che possono essere descritti da altri metadati ...

Perché i metadati?

Cos'è un' ontologia?

Jim Hendler

A set of knowledge terms, including the vocabulary, the semantic interconnections and some simple rules of inference and logic for some particular topic

Studer et al. (1998)

An ontology is a formal, explicit specification of a shared conceptualisation.
A 'conceptualisation' refers to an abstract model of some phenomenon in the world by having identified the relevant concepts of that phenomenon.
'Explicit' means that the type of concepts used, and the constraints on their use are explicitly defined. For example, in medical domains, the concepts are diseases and symptoms, the relations between them are causal and a constraint is that a disease cannot cause itself.
'Formal' refers to the fact that the ontology should be machine readable, which excludes natural language.
'Shared' reflects the notion that an ontology captures consensual knowledge, that is, it is not private to some individual, but accepted by a group.

Disaccordo o accordo?

Il Semantic Web: le tecnologie W3C

logo W3C semantic web
Resource Description Framework (RDF)
  • strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati
  • consente l'interoperabilità tra applicazioni che si scambiano sul web informazioni machine-understandable
Web Ontology Language (OWL)
  • linguaggio per descrivere proprietà, vincoli, cardinalità, etc.
  • permette di esportare ontologie in modo interoperabile

L' integrazione dei dati: il ruolo delle tecnologie

esportazione dei dati con indicazione delle tecnologie

Knowledge creation: integrazione di HTML e Semantic Web

Come creare i metadati?

Dove sono i metadati?

Il Web 2.0 e il "mashup"

Come includere i metadati nelle pagine HTML?

Microformati
  • approccio web-based alla formattazione dei dati
  • riutilizza come metadati il contenuto esistente
embedded RDF
  • si inserisce nell' (X)HTML un sottoinsieme di RDF
RDFa
  • si esprimono i dati strutturati usando gli attributi RDF e alcuni nuovi attributi definiti ad hoc

Un esempio di microformato

Con il markup tradizionale
<div>
   <div>Oreste Signore</div>
   <div>Ufficio Italiano W3C - CNR</div>
   <div>+39 (050) 315 2995</div>
   <a href="http://www.w3c.it/">http://www.w3c.it/</a>
 </div>
Con il formato di markup hCard
<div class="vcard">
   <div class="fn">Oreste Signore</div>
   <div class="org">Ufficio Italiano W3C - CNR</div>
   <div class="tel">+39 (050) 315 2995</div>
   <a class="url" href="http://www.w3c.it/">http://www.w3c.it/</a>
 </div>

Knowledge creation: integrazione di HTML e Semantic Web

GRDDL: esempi

GRDDL

logo grddl

Combinare agende

Il problema
  • Un utente utilizza un calendaring service che pubblica la sua agenda sotto forma di feed RSS 1.0
  • Vuole organizzare un incontro con tre colleghi che vivono in altre città, ma seguono spesso le stesse conferenze.
  • Supponiamo che ognuno di questi pubblichi la sua agenda personale, utilizzando meccanismi diversi (microformato hCalendar, eRDF e RDFa).
La soluzione
  • Tutte le agende possono essere utilizzate come input per GRDDL e convertite in RDF
  • Un GRDDL-aware agent identifica le trasformazioni necessarie per estrarre automaticamente i dati
  • I dati vengono caricati in un RDF store e combinati in un unico modello
  • Il modello risultante può essere interrogato con SPARQL (Simple Protocol And RDF Query Language)

Accesso a dati clinici

esempio di combinazione di dati clinici

GRDDL con i microformati: la tecnica

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="it" lang="it">
  <head profile="http://www.w3.org/2003/g/data-view">
    <title>Agenda Oreste Signore</title>
    <link rel="transformation" href="http://www.w3.org/2002/12/cal/glean-hcal"/>
  </head>
  <body>
    <ol class="schedule">
      <li>2006
         […]
      </li>
      <li>2007
        <ol>
          […]
          <li class="vevent">
            <strong class="summary">Conferenza KM12</strong> in 
            <span class="location">Milano, Italia</span>: da
            <abbr class="dtstart" title="2007-11-27 09:00">27 nov</abbr> a 
            <abbr class="dtend" title="2007-11-28 17:00">28 nov</abbr>
          </li>
        </ol>
      </li>
    </ol>
  </body>
</html>

GRDDL con i microformati: il meccanismo di trasformazione

processo per la conversione di calendari

La trasformazione in RDF …

Comprensibile alle macchine, non pensata per esseri umani!


<?xml version="1.0" encoding="UTF-8" ?> 
<rdf:RDF xmlns:_6="http://www.w3.org/2002/12/cal/icaltzd#" 
         xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<rdf:Description rdf:nodeID="jTCXOrie6">
  <_6:location xml:lang="it">Milano, Italia</_6:location> 
  <rdf:type rdf:resource="http://www.w3.org/2002/12/cal/icaltzd#Vevent" /> 
  <_6:url rdf:resource="http://www.w3c.it/calendar/oreste-hcal-grddl.html" /> 
  <_6:summary xml:lang="it">Conferenza KM12</_6:summary> 
  <_6:dtstart rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2007-11-27</_6:dtstart> 
  <_6:dtend rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2007-11-28</_6:dtend> 
  </rdf:Description>
  </rdf:RDF>


…e il grafo RDF risultante

il grafo RDF

Knowledge creation: integrazione di HTML e Semantic Web

Riflessioni e conclusioni

Conclusioni

Non chiedetevi:
cosa può fare il web per me?
…ma…
cosa posso fare io per il Web?
W3C Member Logo … e il supporters program

Grazie per l' attenzione

Domande?


Se non è sul Web non esiste ...

... troverete sul sito dell' Ufficio (http://www.w3c.it/)
le slide (http://www.w3c.it/talks/2007/km12/)
e il documento (http://www.w3c.it/papers/km12.pdf)