Publicado el 29 de Mayo del 2018
533 visualizaciones desde el 29 de Mayo del 2018
1,4 MB
28 paginas
Creado hace 20a (22/07/2004)
Tecnologías XML y
Web Semántica
Departamento de Informática
Universidad de Oviedo
Fundamentos de la Web Semántica
Justificación
Esquema General
Principales Vocabularios
Departamento de Informática
Universidad de Oviedo
Reflexiones sobre la WWW
Web actual = mayor almacén de información recopilado
por personas humanas
Grandes cantidades de información sobre cualquier
asunto
Acceso casi instantáneo desde cualquier lugar con
conexión a Internet
Sistema no centralizado Cualquier persona puede
añadir más información
Reflexiones sobre la Web
Ahora estamos en la Web Sintáctica
href
recurso
href
href
href
recurso
recurso
recurso
recurso
href
href
href
recurso
recurso
href
href
href
recurso
recurso
La Web Sintáctica
Características actuales de la Web sintáctica
Biblioteca Digital con hipertexto
Enorme biblioteca con documentos (llamados páginas Web)
conectados entre sí mediante enlaces
Una base de datos (o plataforma común de aplicaciones)
Un portal común de aplicaciones accesibles a través de páginas Web
y que muestran sus resultados como páginas Web
Una plataforma para multimedia
Una nueva forma de transmimtir programas de radio, TV y vídeos
Un esquema de nombres
Identidad única para los documentos
Los ordenadores realizan la presentación visual (tarea fácil) y
las personas navegan e interpretan el contenido (tarea difícil)
¿Sería posible que los ordenadores hiciesen algo más?
Tareas difíciles en la Web sintáctica
Buscar fotos del profesor de este curso (Labra)
Buscar fotos del Director del Depto. donde
trabaja el profesor de este curso....
Tareas difíciles en la Web Sintáctica
Buscar información sobre la Universidad de Beihang en China...
¿Hacer un viaje de la Universidad de Beihang a la Universidad de Hainan?
Tareas difíciles en la Web Sintáctica
Buscar un ave que utilice el oído para orientarse y que no sea un murciélago
y si os digo que en inglés es barn owl ?
Tareas difíciles en la Web Sintáctica
Búsquedas complejas
Localizar información en almacenes de datos
Búsqueda de viajes
Comparar Precios de productos
Encontrar y utilizar “servicios web”
Delegar tareas complejas a agentes de la Web
Organizar un viaje en algún lugar con playa no
demasiado caro en el que hablen inglés
Buscar y comparar noticias que hablen de las
últimas elecciones
Encargar una comida en el restaurante que no
tenga demasiadas calorías
El problema de la Web Sintáctica
Las marcas de HTML
incluyen información
sobre la visualización
(tipo de letra, color, etc.)
El significado es
accesible a las
personas pero
no es
(fácilmente)
accesible a los
ordenadores…
<html><head><title>Pizzeria Al Capone</title></head>
<body bgcolor="blue" text="yellow">
<h1>Pizzas del Restaurante Al Capone</h1>
<table>
<caption>Tipos de Pizzas</caption>
<tr>
<td>Barbacoa</td><td>Salsa barbacoa, mozzarella, Pollo
Bacon, Ternera </td><td>8€</td>
</tr>
. . .
</body>
</html>
El problema de la Web Sintáctica
La información que vemos nosotros...
Pizzas del Restaurante Al Capone
Tipos de Pizzas
Barbacoa
Salsa barbacoa, mozzarella, Pollo, Bacon,
Ternera 8€
Lo que ve la máquina...
...
WWW2002
The eleventh international world
wide web conference
Sheraton waikiki hotel
Honolulu, hawaii, USA
7-11 may 2002
1 location 5 days learn interact
Registered participants coming
from
australia, can
XML como posible solución?
Incluir etiquetas con un significado determinado...
<título>Pizzas del Restaurante Al Capone</título>
<pizza>
<nombre>Barbacoa</nombre><ingredientes>Salsa barbacoa,
mozzarella, Pollo, Bacon, Ternera
</ingredientes><precio>8€ </precio></pizza>
...
La máquina vería...
<título>Registered fdsja gts </título>
<pizza><nombre> participants
</nombre><ingredientes> Salsa barbacoa,
mozzarella, Pollo, Bacon,
Ternera</ingredientes>
<precio>ic</precio></pizza>
...
XML como posible solución?
Pero si vamos a otro contexto
<ave><nombreComún>Lechuza Común</nombreComún>
<nombre>Tyto alba</nombre>
<clasificación>Orden Estrigiformes, familia Titónidos.
</clasificación>
<características>33-39 cm. 300-380 g. </características
...
La máquina vería...
<ave><nombreComœn>Lechuza
Comœn</nombreComœn>
<famili>Tyto
alba</familia></ave>
<clasificacin>Orden
Estrigiformes, familia
Titnidos. </clasific
El problema es que las etiquetas no tienen un significado compartido
Ontologías
Posibilidad: Acuerdo global sobre el significado de las
anotaciones
Ejemplo: Dublin Core
Especifica etiquetas globales de anotación de recursos. Por
ejemplo: dc:creator
Problemas:
Inflexibilidad
Limita el número de cosas que pueden expresarse
Otra posibilidad: Utilización de Ontologías
Definen el significado de las anotaciones
Los términos nuevos pueden formarse a partir de otros
anteriores
El significado se define formalmente
Pueden especificarse relaciones entre términos de varias
ontologías...
Web Semántica
La Web semántica (Tim Berners-Lee) pretende
desarrollar lenguajes que faciliten la inclusión en la
Web de contenido legible por las máquinas
Características de la Web que deben tenerse en
cuenta...
No centralizada: problemas para garantizar integridad de la
información)
Información Dinámica: puede cambiar la información e
incluso el conocimiento sobre esa información
Mucha información: El sistema no puede pretender acaparar
toda la información
Es abierta: Muchos sistemas anteriores usaban la Closed
World Assumption
Web Semántica
Antecedentes
Sistemas de representación del conocimiento
Árbol de la naturaleza y de la lógica
Ramón Llull (1235-1316)
Web Semántica
Antecedentes
Sistemas de representación del conocimiento
Redes semánticas (R. Quillian, 1968)
Redes de conceptos enlazados entre sí.
is-a = pertenece
ako (a kind of) = incluido
canario
ako
animal
isa
Piolín
Web Semántica
Antecedentes
Lógica = Estudio de los razonamientos
Lenguaje de la lógica permite representar conocimiento e
inferencias
Niveles:
Lógica proposicional
Lógica de predicados de primer orden
Órdenes superiores
Sistemas de inferencia:
animal(x) )
" x(canario(x) fi
canario(piolín)
animal(piolín)
Consistencia: Todo lo que se deduce es correcto
Completud: Todo lo que es correcto es deducible
Decidibilidad: El algoritmo de deducción finaliza
Tratabilidad: El algoritmo termina en un tiempo razonable
Problema P - NP
Web Semántica
Antecedentes
Diagramas entidad-relación
Utilizados en la modelización de Bases de Datos
Pizza
contiene
ingrediente
nombre
tiempo
calorías
Otras notaciones de modelado en Ingeniería del Software
Ejemplo: UML
Web Semántica
Antecedentes
Mapas de tópicos
(http://www.topicmaps.org/)
Estándar de definición de índices
XTM es un vocabulario para mapas
de tópicos basado en XML
<topic id="pizzas"/> ...
<occurrence>
<instanceOf>
<topicRef xlink:href="#barbacoa"/>
</instanceOf>
<scope>
<topicRef xlink:href="#pizza"/>
</scope>
<resourceRef xlink:href="barbacoa.jpg"/>
</occurrence>
...
</topic>
Web Semántica
Reglas
Confianza
Demostración
Datos
Docum.
auto-
descrito
Datos
Lógica
Ontologías
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode
URI
s
e
l
a
t
i
g
d
s
a
m
i
r
i
F
RDF
RDF (Resource Description Framework)
Origen: PICS (Platform for Internet Content Selection)
Descripción de contenidos en Internet (meta-información)
RDF define un modelo basado en tripletas
Dicho modelo tiene una sintaxis XML asociada
Las tripletas son de la forma:
Sujeto --- Predicado --- Objeto
Amarillo
tieneColor
Incluye algunas propiedades predefinidas (type)
Mecanismos de reificación
RDF Schema
Permite definir:
Clases y propiedades
Ej. "juan" es un individuo
"profesores" es una clase
"daClaseDe" es una propiedad
Jerarquías de clases y herencia
Ej. La clase "profesores" está incluida en "personas"
Jerarquías de propiedades
Ej. "esPadre" es una subpropiedad de "esProgenitor"
OWL
OWL (Web Ontology Language)
Permite definir Ontologías
Se basa en lógica descriptiva (description logics)
Aumenta la expresividad de RDF(S)
Comprimiso entre expresividad/computabilidad (3 niveles)
Se pueden indicar:
Restricciones de rango (las vacas sólo comen hierba)
Clases disjuntas (ej. hombres y mujeres)
Combinaciones booleanas (unión, intersección, etc.)
Personas=Hombres ¨ Mujeres
Restricciones de Cardinalidad (una persona tiene 2 progenitores)
Características de propiedades (transitividad, unicidad, inversa, ...)
Lógica y Demostración
Orígenes = Representación del conocimiento
Lógica = Fundamento de Representación del Conocimiento
Existen técnicas de prueba para subconjuntos de lógica de
primer orden
Propiedades: Consistencia, Completud, tratabilidad
RDF(S) y OWL son subconjuntos de lógica descriptiva
Otros formalismos: Cláusulas Horn
Lenguajes de reglas en desarrollo. Ej. RuleML
Propiedades:
Reglas Monótonas vs. No monótonas
Mundo cerrado vs. Abierto
Ejercicio para mañana
Plantear una posible aplicación para la Web Semántica
Se puede consultar...
http://challenge.semanticweb.org/
Premio: 1000€ para viaje y 250€ para libros...
Selección de Enlaces
Página del consorcio: http://www.w3c.org/RDF
SemanticWeb: http://www.semanticweb.org
Directorio de Ontologías: http://www.schemaweb.info
Ontologías: http://www.ontology.org
Dublin Core: http://www.dcmi.org
Darpa Markup Language: http://www.daml.org
Open Directory Project: http://www.dmoz.org
OntoWeb:
Topic Maps: http://easytopicmaps.com
http://www.ontoweb.org
Fin de la Presentación
Comentarios de: Tecnologías XML y Web Semántica (0)
No hay comentarios