Publicado el 29 de Mayo del 2018
768 visualizaciones desde el 29 de Mayo del 2018
827,0 KB
45 paginas
Creado hace 19a (05/04/2006)
Tecnologías XML y
Web Semántica
Departamento de Informática
Universidad de Oviedo
Fundamentos de la Web Semántica
Justificación
Esquema General
Principales Vocabularios
Departamento de Informática
Universidad de Oviedo
1
Reflexiones sobre la WWW
Web actual = mayor almacén de información
recopilado por personas humanas
Características:
Grandes cantidades de información sobre cualquier
asunto
Acceso casi instantáneo desde cualquier lugar con
conexión a Internet
Sistema no centralizado ⇒ Cualquier persona puede
añadir más información
Plataforma Multimedia (Texto, Imágenes, Vídeo, etc.)
Identificación de recursos unificada (URIs)
Reflexiones sobre la Web
Actualmente, estamos en la Web Sintáctica
Un conjunto de recursos enlazados entre sí (Grafo dirigido)
recurso
href
href
href
recurso
recurso
recurso
recurso
href
href
href
recurso
recurso
href
href
recurso
recurso
href
Los ordenadores realizan la presentación visual (tarea fácil) y las personas
navegan e interpretan el contenido (tarea difícil)
¿Sería posible que los ordenadores hiciesen algo más?
2
Tareas difíciles en la Web sintáctica
Buscar fotos del profesor de este curso (Labra)
Tareas difíciles en la Web Sintáctica
Buscar información sobre la Universidad de Beihang en China...
3
Tareas difíciles en la Web Sintáctica
Otras tareas:
- Buscar si hubo alguien que se autoproclamó rey de los
Estados Unidos
- Buscar un ave que utilice el oído para orientarse y que
no sea un murciélago
Tareas difíciles en la Web Sintáctica
Búsquedas complejas
Información multimedia: imágenes, vídeos, audio
Información en otros idiomas
Imformación imprecisa
Búsquedas conceptuales
Localizar información en almacenes de datos
Búsqueda de viajes
Comparar Precios de productos
Encontrar y utilizar “servicios web”
Delegar tareas complejas a agentes de la Web
Organizar un viaje en algún lugar con playa no demasiado caro en el que
hablen chino
Buscar y comparar noticias que hablen de las últimas elecciones
Encargar una comida en el restaurante que no tenga demasiadas calorías
4
El problema de la Web Sintáctica
<html><head><title>Pizzeria Al Capone</title></head>
<body bgcolor="blue" text="yellow">
<h1>Pizzas del Restaurante Al Capone</h1>
<table>
<caption>Tipos de Pizzas</caption>
<tr>
<td>Barbacoa</td><td>Salsa barbacoa, mozzarella, Pollo
Bacon, Ternera </td><td>8€</td>
</tr>
. . .
</body>
</html>
Las marcas de HTML
incluyen información
sobre la visualización
(tipo de letra, color,
etc.)
El significado es accesible
a las personas pero no
es accesible a los
ordenadores…
El problema de la Web Sintáctica
La información que vemos nosotros...
Pizzas del Restaurante Al Capone
Tipos de Pizzas
Barbacoa
Salsa barbacoa, mozzarella, Pollo, Bacon, Ternera 8€
...
Lo que ve la máquina...
<html><head><title> </title></head>
<body>
<h1></h1>
<table>
<caption></caption>
<tr>
<td></td><td></td><td></td>
</tr>. . .
</body>
</html>
5
¿XML como posible solución?
Posible solución: XML. Etiquetas con significado propio
<título>Pizzas del Restaurante Al Capone</título>
<pizza>
<nombre>Barbacoa</nombre><ingredientes>Salsa barbacoa,
mozzarella, Pollo, Bacon, Ternera
</ingredientes><precio>8€ </precio></pizza>
...
La máquina vería...
<título> </título>
<pizza><nombre>
</nombre><ingredientes> 3 96
46933 6336 65
959</ingredientes>
<precio></precio></pizza>
...
¿XML como posible solución?
Problema: Si se cambia de contexto, ¿se definen nuevas etiquetas?
<ave><nombreComún>Lechuza Común</nombreComún>
<nombre>Tyto alba</nombre>
<clasificación>Orden Estrigiformes, familia Titónidos.
</clasificación>
<características>33-39 cm. 300-380 g. </características
...
La aplicación que trabajaba con Pizzas no entendería las nuevas etiquetas
5649645
6455649645
40306
34030
3000595
900694 4030
0506 300
Problema: Las etiquetas no tienen un significado compartido
6
¿Cómo compartir etiquetas?
Utilización de Ontologías
Definen el significado de las anotaciones
Los términos nuevos pueden formarse a partir de otros anteriores
El significado se define formalmente
Pueden especificarse relaciones entre términos de varias ontologías...
Pizza
Ingredientes
Animal
Ave
Mamífero
Bacon
Ternera
Pollo
Gallina
Lechuza
Vaca
Cerdo
Web Semántica
La Web semántica (Tim Berners-Lee) es una visión:
“disponer datos en la Web definidos y enlazados de forma
que puedan ser utilizados por las máquinas no solamente
para visualizarlos sino también para:
automatizar tareas,
integrar y
reutilizar datos entre aplicaciones”
7
Web Semántica
Características de la Web que deben tenerse en cuenta...
No centralizada: problemas para garantizar integridad de la
información)
Información Dinámica: puede cambiar la información e incluso el
conocimiento sobre esa información
Mucha información: El sistema no puede pretender acaparar toda la
información
Es abierta: Muchos sistemas anteriores usaban la Closed World
Assumption
Datos
Datos
Docum.
auto-
descrito
Lógica
Ontologías
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode
URI
Visión de la Web Semántica
Reglas
Confianza
Demostración
s
e
l
a
t
i
g
d
s
a
m
i
r
i
F
8
Antecedentes
Ontologías
Árbol de la naturaleza y de la lógica
Ramón Llull (1235-1316)
9
Lógica
Orígenes: Aristóteles (-342 a. de C.)
Desarrollo de la Lógica formal a finales s. XIX (De Morgan, Fregge)
Lógica computacional (Hilbert, Church, Turing, Herbrand, Tarski, …)
Lógica proposicional
Lógica de Predicados de Primer Orden
∀x( elefante(x) → mamífero(x) )
∀x( mamífero(x) → lactante(x))
∀x( elefante(x) → númeroPatas(x,4) )
∃x( elefante(x) ∧ seLlema(Pipo))
∃x ( lactante(x))
Premisas
Conclusión
Razonamiento
Sistemas de Razonamiento
Sistema de razonamiento: Conjunto de Axiomas + Reglas de Inferencia
Propiedades
Expresividad: Capacidad de representar un problema
Consistencia: Todo lo que se deduce es correcto
Completud: Todo lo que es correcto puede deducirse
Decidibilidad: Existe un algoritmo para decidir si se cumple una
conclusión
Tratabilidad: El algoritmo de decisión tiene una complejidad
razonable
Clases de complejidad
P ⊆ NP ⊆ PSPACE ⊆ EXPTIME ⊆ NEXPTIME ⊆ EXPSPACE
10
Redes Semánticas
Redes Semánticas (Quillian, 68): Grafos dirigidos donde los vértices
son conceptos y los enlaces son relaciones entre conceptos
2 tipos especiales de relaciones: is-a (pertenencia) y ako (inclusión)
Sí
tienePelo
mamífero
Gris
color
ako
Sí
lactante
ako
4
patas
elefante
is-a
e1
patas
nombre
pipo
3
trompa
1
perro
4
patas
sonido
ladra
is-a
e2
nombre
pluto
Frames
Desarrollados en los años 70 para estructurar el conocimiento de las redes
semánticas
Un frame o marco = colección de atributos (slots) que describen una entidad
Puede representar un concepto (o clase) y un individuo (o instancia)
Clase: Mamífero
tienePelo: Sí
lactante: Sí
Clase: Elefante
ako: Mamífero
patas: 4
trompa: 1
color: gris
Clase: Perro:
ako: Mamífero
patas: 4
sonido: ladra
Individuo: e1
isa: Elefante
patas: 3
nombre: Pipo
Individuo: e2
is-a: Perro
nombre: Pluto
11
Diagramas Entidad-Relación
Diagramas Entidad-Relación (Chen, 1976): Representaciones gráficas
utilizadas para capturar modelos de dominio.
Utilizados en el desarrollo de Bases de Datos
Elefante
trabajaEn
Circo
nombre
patas
dueño
Mapas de Tópicos
(Topic Maps)
Mapas de tópicos (http://www.topicmaps.org/)
Estándar de definición de índices
XTM es un vocabulario para mapas de tópicos basado en XML
<topic id="pizzas"/> ...
<occurrence>
<instanceOf>
<topicRef xlink:href="#barbacoa"/>
</instanceOf>
<scope>
<topicRef xlink:href="#pizza"/>
</scope>
<resourceRef xlink:href="barbacoa.jpg"/>
</occurrence>
...
</topic>
12
Modelos Orientados a Objetos
Modelos Orientados a Objetos: Especificación de herencia y jerarquía de
objetos
Lenguajes de modelado. UML incluye diagramas de clase que describen
la estructura de objetos, atributos, operaciones, etc.
RDF
13
Reglas
Confianza
Demostración
Datos
Datos
Docum.
auto-
descrito
Lógica
Ontologías
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode
URI
s
e
l
a
t
i
g
d
s
a
m
i
r
i
F
RDF
RDF (Resource Description Framework)
Mecanismo para describir recursos
Recurso: Cualquier cosa que pueda nombrarse mediente u
Comentarios de: Tecnologías XML y Web Semántica (0)
No hay comentarios