Actualizado el 17 de Julio del 2018 (Publicado el 28 de Mayo del 2018)
719 visualizaciones desde el 28 de Mayo del 2018
568,5 KB
29 paginas
Creado hace 19a (02/04/2006)
XML, Servicios Web y
Web Semántica
Departamento de Informática
Universidad de Oviedo
Antes de empezar…
Lo siento, pero No váisa aprender XML, Servicios Web y Web Semántica
…en 2 semanas
Objetivo: Conocer las tecnologías y para quésirven
1
Arquitectura de la Web
Lenguaje XML
Departamento de Informática
Universidad de Oviedo
Esquema de la Sesión
Arquitectura de la Web
Internet
WWW
Unicode
URIs
Introducción a XML
Definición de XML
DTDs
Ventajas/Inconvenientes
Creación y validación documentos XML con DTDs
2
Internet
Evolución
(60-80) Origen militar
Protocolos de comunicación (TCP/IP)
Seguridad ante ataques (múltiples servidores)
(80 – 95) Implantación académica
Protocolos de intercambio de información (FTP, SMTP, HTTP, ...)
Enorme biblioteca con material hipermedia
(95 – 00) Acceso comercial
Posibilidad de negocio ⇒ Dinero!!
Boom comercial
La red es un ordenador gigante para hacer negocios
(00-) Crisis de las punto com
Historias de fracasos ⇒ Lecciones aprendidas
Revisión de las arquitecturas tradicionales
Internet
Modem
ISP local
Router
ISP regional
Acceso particular
servidores
Telefonía móvil
Acceso corporativo
wireless
3
Internet
Repaso de conceptos
IP (Internet Protocol) protocolo de intercambio de paquetes
Asigna direcciones globales únicas (32 bits)
IPv6: nueva versión propuesta, con direcciones de 128 bits
Host: es un nodo de la red (con dirección IP)
Cliente: Ordenador que solicita servicios
Servidor: Ordenador que propicia respuestas a los clientes
Además de la dirección IP, el puerto (16bits) identifica el servicio
Varios puertos predefinidos (80 = HTTP, 25 = SMTP, 20/21 = FTP, etc.)
Protocolo TCP: Permite comunicación entre nodos manteniendo una
conexión.
En condiciones normales, todos los paquetes llegan
Incluye servicio de transporta confiable y mecanismo de control de
congestiones
No se garantizan tiempos ni retardos mínimos
Se utiliza para transmitir correos, ficheros, etc.
Protocolo UDP (Datagrama) no se realiza una conexión
Pueden producirse pérdidas de algunos paquetes
Utilizado para transmisión de voz
Internet
Principales Protocolos
HTTP: Protocolo de transferencia de hipertexto
Puerto 80
Utiliza TCP/IP como protocolo subyacente
No incluye estado (no se almacena información del cliente)
HTTP/1.1 proporciona conexiones persistentes
FTP: Transferencia de ficheros
Puertos 20/21
Mantiene estado
SMTP (simple mail transfer protocol)
Formato de mensajes mediante MIME
Protocolos de acceso (POP3, IMAP, etc.)
DNS: Asignación de nombres de dominio
Otros: LDAP , NNTP, WebDAV, etc.
4
World Wide Web
Evolución
Hipertexto (Ted Nelson, 1965)
Texto no secuencial, con enlaces
WWW (Tim Berners-Lee, 1989)
Protocolo HTTP (Hypertext transfer protocol)
Se basa en Internet
Arquitectura cliente/servidor
Lenguaje HTML (HyperText Markup Language)
Enlaces mediante URLs
Marcas
Símbolos extras que se añaden al texto ordinario
Modifican la representación del texto por parte del explorador
World Wide Web: Red de ordenadores que se comunican mediante el
protocolo HTTP
World Wide Web
Esquema Cliente-servidor
Arquitectura cliente/servidor
Cliente
Protocolo
http
Servidor
Visualizador
GET http://servidor.com/hola.html
http:/1.0 200 OK
http:/1.0 200 OK
<html>
<html>
<body>
<body>
Enlace a
Enlace a
<a href =“otro.html”>Otro</a>
<a href =“otro.html”>Otro</a>
</body>
</body>
</html>
</html>
5
World Wide Web
Características
WWW = Mayor almacen de información jamás recopilado por la
humanidad
Características
Grandes cantidades de información sobre cualquier asunto
Acceso casi instantáneo desde cualquier lugar con conexión a
Internet
Sistema no centralizado ⇒ Cualquier persona puede añadir más
información
Plataforma Multimedia (Texto, Imágenes, Vídeo, etc.)
Identificación de recursos unificada (URIs)
World Wide Web
Grandes Retos
Integración de aplicaciones
Búsqueda de lenguajes comunes: Estandarización
Interoperabilidad y computación ubicua
Modelos Orientados a Servicios
Automatización de tareas
Representaciones comprensibles por las máquinas
Creación de agentes autónomos
Accesibilidad
Acceso universal
Atención a todos los usuarios: discapacidades, entornos diferentes, etc.
6
World Wide Web
Arquitectura propuesta
Reglas
Confianza
Demostración
s
e
l
a
t
i
g
d
s
a
m
i
r
i
F
Datos
Datos
Docum.
auto-
descrito
Lógica
Ontologías
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode
URI
Representación de Información
Bits, bytes, números, caracteres, ...
Los ordenadores manejan código binario: 0s y 1s
Bytes: Grupos de 8 bits
Números: Sistemas de codificación binaria, octal, hexadecimal...
Caracteres: Código que asocia a cada carácter un nº
ASCII: 7 bits ⇒ (0 – 127)
(A)merican (S)tandard (C)ode for (I)nformation (I)nterchange
Extensiones de ASCII
ISO-8859-1 (iso-latin-1)
(8 bits) ASCII (0-127) + otros caracteres típicos de Europa occidental
Familia ISO-8859-X = Otros alfabetos europeos
ISO-8859-15 (iso-latin-9) Igual que iso-8859-1 + símbolo de €
¡CUIDADO! ...hay muchos idiomas y muchos caracteres...
ℜ € き ㄝ ㌟ ㉃ ⋐ ∀ ℵ ₤ ウ ぼ
7
Unicode
ISO-10646 (31 bits) Define un repertorio universal de caracteres (UCS)
En continua revisión: ISO-10646-2:2001 contiene más de 70.000 caracteres
UNICODE = Consorcio de empresas que define restricciones sobre la
implementación de ISO-10646
Varias codificaciones (UTF = Unicode Transformation Format)
- UTF-8: Los primeros 127 códigos se presentan igual (compatible con ASCII)
El resto se codifican en longitud variable
Relativamente Eficiente
- UTF-16: Usa 16bits para los caracteres más comunes, el resto con pares de 16
bits
- UTF-32: Codificación directa en 32 bits (desperdicio de espacio)
NOTA: Conviene distinguir:
Carácter: Entidad abstracta (Letra A)
Glifo (Glyph): Representación del carácter A A A A A A
Fuente (Font): Conjunto de glyphs, ejemplo: Times Roman, Arial, etc.
Información multimedia
Imágenes: En pantalla = matriz de puntos de colores (pixels)
Formatos Raster (Raw): Se enumeran todos los puntos con sus
colores
Ejemplo: Bitmap, TIFF
Compresión: diversos algoritmos de compresión
GIF: Utiliza 8 bits (hasta 256 colores)
Byte de color = Indice en la paleta de colores
JPEG: utiliza 24 bits (hasta 16 millones de colores)
Vectorial: Se enumeran las instrucciones de dibujo
Ejemplos: DXF, SVG (estándar de Internet)
Sonido: Formatos raster (WAV) y comprimidos (MP3)
Vídeo: Formatos comprimidos (MPEG)
Realidad Virtual: Lenguaje de Modelado (VRML, X3D)
8
Identificación Recursos
URI: (Uniform resource Indentifier) Identifica un recurso de forma global
Puede sub-clasificarse en:
URL (Uniform resource locator)
Además de identificar el recurso, indica cómo llegar hasta él
esquema: //servidor:puerto /ruta?datosGET
http://www.uniovi.es:8080/prueba/carrito?action=print
URN (Uniform resource name): Nombre de recurso
Ejemplo: urn:xmlorg:objects:schema:xmlschema:xcatalog
IRIs (Internationalized Resource Identifiers)
permiten utilizar caracteres Unicode en los identificadores
URLs
URNs
URIs
Datos
Datos
Docum.
auto-
descrito
Lógica
Ontologías
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode
URI
Arquitectura de la Web
Reglas
Confianza
Demostración
s
e
l
a
t
i
g
d
s
a
m
i
r
i
F
9
Orígenes de XML
Marcado de documentos
Orígenes: Industria de la Publicación
Uso de marcas = indica cómo componer documento para impresión
Ejemplo de corrección tipográfica
Fuente: http://recursos.cnice.mec.es/bancoimagenes
Marcado de documentos
Sólo texto
ALBA Abril de 1915 Granada Mi corazón oprimido
siente junto a la alborada el dolor de sus
amores y el sueño de las distancias.
Texto marcado
]ALBA[ ← Título, negrita, centrado, 14pt
]Abril de 1915[← SubTítulo, negrita, centrado
]Granada[← SubTítulo cursiva, centrado
]Mi corazón oprimido [← Verso, 10pt
]siente junto a la alborada [← Verso
]el dolor de sus amores [← Verso
]y el sueño de las distancias. [← Verso
Resultado
ALBA
Abril de 1915
Granada
Mi corazón oprimido
siente junto a la alborada
el dolor de sus amores
y el sueño de las distancias.
10
Marcado Descriptivo
El marcado no es la información que contiene el documento
Marcado = información acerca del documento = meta-información
Lenguajes de Marcado descriptivo: Incluyen marcas que describen cómo
procesar el documento
Ejemplo: HTML
<html>
<head><title>Poema</title></head>
<body lang=“es”>
<h1>Alba</h1>
<h2>Abril de 1915 </h2>
<h2><i>Granada</i></h2>
<p>Mi corazón oprimido</p>
<p>siente junto a la alborada</p>
<p>el dolor de sus amores</p>
<p>y el sueño de las distancias. </p>
</body>
</html>
Marcado Generalizado
Marcado generalizado = Sintaxis común que facilita la creación de
lenguajes descriptivos
HTML
<html>
<head><title>Poema</title></head>
<body lang=“es”>
<h1>Alba</h1>
<h2>Abril de 1915 </h2>
<h2><i>Granada</i></h2>
<p>Mi corazón oprimido</p>
<p>siente junto a la alborada</p>
<p>el dolor de sus amores</p>
<p>y el sueño de las distancias.</p>
</body>
</html>
Otras marcas...(misma sintaxis)
<poema fecha="Abril de 1915"
lugar="Granada">
<titulo>Alba</titulo>
<verso>Mi corazón oprimido</verso>
<verso>siente junto a la alborada</verso>
<verso>el dolor de sus amores</verso>
<verso>y el sueño de las distancias. </verso>
</poema>
Sintaxis común
<etiqueta atrib=“valor”>contenido
</etiqueta>
11
Marcado Generalizado
SGML
(70- ) GML desarrollado en IBM – Generalized Markup
Language (Goldfarb, Mosher, Lorie)
(86) SGML Standard Generalized Markup Language
(Estándar ISO)
Utilizado para el intercambio de documentos
Principio: Separar contenido de la forma de
representarlo
Muy flexible (permite definir vocabularios específicos
para cada aplicación)
HTML era un vocabulario de SGML
Marcado Generalizado
XML
Desarrollado por T. Bray, J. Paoli, C. M. Sperberg-McQueen (1995)
T. Bray: Consultor de Textuality para Netscape (ahora en Sun)
C. M. Sperberg-McQueen (TEI, SGML)
J. Paoli (Microsoft)
Objeti
Comentarios de: XML, Servicios Web y Web Semántica (0)
No hay comentarios