Publicado el 29 de Mayo del 2018
675 visualizaciones desde el 29 de Mayo del 2018
964,2 KB
43 paginas
Creado hace 19a (13/07/2005)
Tecnologías X M L y
W eb Sem ántica
Departamento de Informática
Universidad de Oviedo
F undam entos de la W eb Sem ántica
Justificación
Esquema General
Principales Vocabularios
Departamento de Informática
Universidad de Oviedo
1
R eflexiones sobre la W W W
Web actual = mayor almacén de información
recopilado por personas humanas
Características:
- Grandes cantidades de información sobre cualquier
asunto
- Acceso casi instantáneo desde cualquier lugar con
conexión a Internet
- Sistema no centralizado ⇒ Cualquier persona puede
añadir más información
- Plataforma Multimedia (Texto, Imágenes, Vídeo, etc.)
- Identificación de recursos unificada (URIs)
R eflexiones sobre la W eb
Actualmente, estamos en la Web Sintáctica
Un conjunto de recursos enlazados entre sí (Grafo dirigido)
recurso
href
href
href
recurso
recurso
recurso
recurso
href
href
href
recurso
recurso
href
href
href
recurso
recurso
Los ordenadores realizan la presentación visual (tarea fácil) y las
personas navegan e interpretan el contenido (tarea difícil)
¿Sería posible que los ordenadores hiciesen algo más?
2
Tareas difíciles en la W eb sintáctica
Buscar fotos del profesor de este curso (Labra)
Tareas difíciles en la W eb Sintáctica
Buscar información sobre la Universidad de Beihang en China...
3
Tareas difíciles en la W eb Sintáctica
Otras tareas:
- Buscar si hubo alguien que se autoproclamó rey de los
Estados Unidos
- Buscar un ave que utilice el oído para orientarse y que
no sea un murciélago
Tareas difíciles en la W eb Sintáctica
- Búsquedas complejas
- Localizar información en almacenes de datos
Búsqueda de viajes
Comparar Precios de productos
- Encontrar y utilizar “servicios web”
- Delegar tareas complejas a agentes de la Web
Organizar un viaje en algún lugar con playa no demasiado caro
en el que hablen inglés
Buscar y comparar noticias que hablen de las últimas
elecciones
Encargar una comida en el restaurante que no tenga
demasiadas calorías
4
E l problem a de la W eb Sintáctica
<html><head><title>Pizzeria Al Capone</title></head>
<body bgcolor="blue" text="yellow">
<h1>Pizzas del Restaurante Al Capone</h1>
<table>
<caption>Tipos de Pizzas</caption>
<tr>
<td>Barbacoa</td><td>Salsa barbacoa, mozzarella, Pollo
Bacon, Ternera </td><td>8€</td>
</tr>
. . .
</body>
</html>
Las marcas de HTML
incluyen información
sobre la visualización
(tipo de letra, color,
etc.)
El significado es accesible
a las personas pero no
es accesible a los
ordenadores…
E l problem a de la W eb Sintáctica
La información que vemos nosotros...
Pizzas del Restaurante Al Capone
Tipos de Pizzas
Barbacoa
Salsa barbacoa, mozzarella, Pollo, Bacon, Ternera 8€
...
Lo que ve la máquina...
<html><head><title> </title></head>
<body>
<h1></h1>
<table>
<caption></caption>
<tr>
<td></td><td></td><td></td>
</tr>. . .
</body>
</html>
5
¿XM L com o posible solución?
Posible solución: XML. Etiquetas con significado propio
<título>Pizzas del Restaurante Al Capone</título>
<pizza>
<nombre>Barbacoa</nombre><ingredientes>Salsa barbacoa,
mozzarella, Pollo, Bacon, Ternera
</ingredientes><precio>8€ </precio></pizza>
...
La máquina vería...
<título> </título>
<pizza><nombre>
</nombre><ingredientes> 3 96
46933 6336 65
959</ingredientes>
<precio></precio></pizza>
...
¿XM L com o posible solución?
Problema: Si se cambia de contexto, ¿se definen nuevas
etiquetas?<ave><nombreComún>Lechuza Común</nombreComún>
<nombre>Tyto alba</nombre>
<clasificación>Orden Estrigiformes, familia Titónidos.
</clasificación>
<características>33-39 cm. 300-380 g. </características
...
Pero la aplicación que trabaja con Pizzas no entendería las nuevas etiquetas
5649645
6455649645
40306
34030
30005 9!5
900694 4030
050!6 300
Problema: Las etiquetas no tienen un significado compartido
6
¿Cóm o com partir etiquetas?
Posibilidad: Acuerdo global sobre el significado de las
anotaciones
Ejemplo: Dublin Core
Especifica etiquetas globales de anotación de recursos. Por ejemplo:
dc:creator
Problemas:
Inflexibilidad
Limita el número de cosas que pueden expresarse
¿Cóm o com partir etiquetas?
Otra posibilidad: Utilización de Ontologías
Definen el significado de las anotaciones
Los términos nuevos pueden formarse a partir de otros anteriores
El significado se define formalmente
Pueden especificarse relaciones entre términos de varias ontologías...
Pizza
Ingredientes
Animal
Ave
Mamífero
Bacon
Ternera
Pollo
Gallina
Lechuza
Vaca
Cerdo
7
W eb Sem ántica
La Web semántica (Tim Berners-Lee) es una visión:
“disponer datos en la Web definidos y enlazados de forma
que puedan ser utilizados por las máquinas no solamente
para visualizarlos sino también para:
automatizar tareas,
integrar y
reutilizar datos entre aplicaciones”
W eb Sem ántica
Características de la Web que deben tenerse en cuenta...
No centralizada: problemas para garantizar integridad de la
información)
Información Dinámica: puede cambiar la información e incluso el
conocimiento sobre esa información
Mucha información: El sistema no puede pretender acaparar toda la
información
Es abierta: Muchos sistemas anteriores usaban la Closed World
Assumption
8
V isión de la W eb Sem ántica
Reglas
Confianza
Demostración
Datos
Docum.
auto-
descrito
Datos
Lógica
Ontologías
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode
URI
s
e
l
a
t
i
g
d
s
a
m
i
r
i
F
A ntecedentes
R epresentación del Conocim iento
Árbol de la naturaleza y de la lógica
Ramón Llull (1235-1316)
9
A ntecedentes
L ógica
Orígenes: Aristóteles (-342 a. de C.)
Desarrollo de la Lógica formal a finales s. XIX (De Morgan, Fregge)
Lógica computacional (Hilbert, Church, Turing, Herbrand, Tarski, …)
Lógica proposicional
Lógica de Predicados de Primer Orden
" x( elefante(x) fi mamífero(x) )
" x( mamífero(x) fi
" x( elefante(x) fi
$ x( elefante(x) seLlema(Pipo))
$ x ( lactante(x))
lactante(x))
númeroPatas(x,4) )
Premisas
Conclusión
Razonamiento
A ntecedentes
Sistem as de R azonam iento
Sistema de razonamiento: Conjunto de Axiomas + Reglas de Inferencia
Propiedades
Expresividad: Capacidad de representar un problema
Consistencia: Todo lo que se deduce es correcto
Completud: Todo lo que es correcto puede deducirse
Decidibilidad: Existe un algoritmo para decidir si se cumple una
conclusión
Tratabilidad: El algoritmo de decisión tiene una complejidad
razonable
Clases de complejidad
P ˝ NP ˝ PSPACE ˝ EXPTIME ˝ NEXPTIME ˝ EXPSPACE
10
A ntecedentes
R edes Sem ánticas
Redes Semánticas (Quillian, 68): Grafos dirigidos donde los vértices
son conceptos y los enlaces son relaciones entre conceptos
2 tipos especiales de relaciones: is-a (pertenencia) y ako (inclusión)
Sí
tienePelo
mamífero
Gris
color
ako
Sí
lactante
ako
4
patas
elefante
is-a
e1
patas
nombre
pipo
3
trompa
1
perro
4
patas
sonido
ladra
is-a
e2
nombre
pluto
A ntecedentes
F ram es
Desarrollados en los años 70 para estructurar el conocimiento de las
redes semánticas
Un frame o marco = colección de atributos (slots) que describen una
entidad
Puede representar un concepto (o clase) y un individuo (o instancia)
Clase: Mamífero
tienePelo: Sí
lactante: Sí
Clase: Elefante
ako: Mamífero
patas: 4
trompa: 1
color: gris
Clase: Perro:
ako: Mamífero
patas: 4
sonido: ladra
Individuo: e1
isa: Elefante
patas: 3
nombre: Pipo
Individuo: e2
is-a: Perro
nombre: Pluto
11
A ntecedentes
D iagram as E ntidad-R elación
Diagramas Entidad-Relación (Chen, 1976): Representaciones
gráficas utilizadas para capturar modelos de dominio.
Utilizados en el desarrollo de Bases de Datos
Elefante
trabajaEn
Circo
nombre
patas
dueño
A ntecedentes
M apas de Tópicos (Topic M aps)
Mapas de tópicos (http://www.topicmaps.org/)
Estándar de definición de índices
XTM es un vocabulario para mapas de tópicos basado en XML
<topic id="pizzas"/> ...
<occurrence>
<instanceOf>
<topicRef xlink:href="#barbacoa"/>
</instanceOf>
<scope>
<topicRef xlink:href="#pizza"/>
</scope>
<resourceRef xlink:href="barbacoa.jpg"/>
</occurrence>
...
</topic>
12
A ntecedentes
M odelos O rientados a O bjetos
Modelos Orientados a Objetos: Especificación de herencia y jerarquía de
objetos
Lenguajes de modelado. UML incluye diagramas de clase que describen
la estructura de objetos, atributos, operaciones, etc.
R D F
13
Reglas
Confianza
Demostración
Datos
Docum.
auto-
descrito
Datos
Lógica
Ontologías
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode
URI
s
e
l
a
t
i
g
d
s
a
m
i
r
i
F
R D F
RDF (Resource Description Framework)
Mecanismo para describir recursos
Recurso: Cualquier cosa que pueda nombrarse mediente una
URI
Propiedad: Característica o atributo de un recurso
Tiene asociada u
Comentarios de: Tecnologías XML y Web Semántica (0)
No hay comentarios