Publicado el 18 de Julio del 2018
645 visualizaciones desde el 18 de Julio del 2018
899,0 KB
66 paginas
Creado hace 19a (27/12/2005)
Web Semántica
Jose Emilio Labra Gayo
Departamento de Informática
Universidad de Oviedo
www.fundacionctic.org
www.fundacionctic.org
Tecnologías de Base
Internet
World Wide Web
HTTP
Unicode
URI
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
1
Internet
Evolución
(60-80) Origen militar
Protocolos de comunicación (TCP/IP)
Seguridad ante ataques (múltiples servidores)
(80 – 90) Implantación académica
Protocolos de intercambio de información (FTP, SMTP, ...)
(90-95) World Wide Web
HTTP, HTML, etc.
Enorme biblioteca con material hipermedia
(95 – 00) Acceso comercial
Posibilidad de negocio ⇒ Dinero!!
Boom comercial
(00-) Crisis de las punto com
Historias de fracasos ⇒ Lecciones aprendidas
Nuevas posibilidades: Computación ubicua, Web semántica, etc.
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Internet
Modem
ISP local
Router
ISP regional
Acceso
particular
servidores
Telefonía móvil
Acceso corporativo
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
wireless
2
Internet
Repaso de conceptos
IP (Internet Protocol) protocolo de intercambio de paquetes
Asigna direcciones globales únicas (32 bits)
IPv6: nueva versión propuesta, con direcciones de 128 bits
Host: es un nodo de la red (con dirección IP)
Cliente: Ordenador que solicita servicios
Servidor: Ordenador que propicia respuestas a los clientes
Además de la dirección IP, el puerto (16bits) identifica el servicio
Varios puertos predefinidos (80 = HTTP, 25 = SMTP, 20/21 = FTP, etc.)
Protocolo TCP: Comunicación entre nodos manteniendo una
conexión.
Incluye servicio de transporte y de control de congestiones
No garantiza tiempos ni retardos mínimos
Se utiliza para transmitir correos, ficheros, etc.
Protocolo UDP (Datagrama) no se realiza una conexión
Pueden producirse pérdidas de algunos paquetes
Utilizado para transmisión de voz
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Internet
Principales Protocolos
HTTP: Protocolo de transferencia de hipertexto
Puerto 80
Utiliza TCP/IP como protocolo subyacente
No incluye estado (no se almacena información del cliente)
HTTP/1.1 proporciona conexiones persistentes
FTP: Transferencia de ficheros
Puertos 20/21
Mantiene estado
SMTP (simple mail transfer protocol)
Formato de mensajes mediante MIME
Protocolos de acceso (POP3, IMAP, etc.)
DNS: Asignación de nombres de dominio
Otros: LDAP , NNTP, WebDAV, etc.
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
3
World Wide Web
Evolución
Hipertexto (Ted Nelson, 1965)
Texto no secuencial, con enlaces
WWW (Tim Berners-Lee, 1989):
Protocolo HTTP (Hypertext transfer protocol)
Arquitectura cliente/servidor
Lenguaje HTML (HyperText Markup Language)
Lenguaje de Marcado descriptivo para hipermedia
URIs (Identificadores universales de recursos)
Identificación única de recursos (nombres globales)
Describen protocolo de acceso (http, ftp, etc.)
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
World Wide Web
Arquitectura cliente/servidor
Cliente
Protocolo
http
Servidor
Visualizador
GET http://servidor.com/hola.html
http:/1.0 200 OK
<html>
<body>
Enlace a
<a href=“http://www.di.uniovi.es/p.html”>
Otro</a>
</body>
</html>
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
4
Filosofía de la WWW
Universalidad
Sistema de información a nivel mundial
Enlaces únicos (URI)
Accesibilidad
Facilitar el acceso desde cualquier punto
Evitar discriminación por razón de ...
Estandarización
Gran número de plataformas y entornos computacionales
Linux / Windows / Macintosh /...
Mainframes / PCs / PDA / ...
Sistema basado en recomendaciones
Consorcio formado por
Organismos internacionales
Industrias
Instituciones educativas
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Datos
Datos
Docum.
auto-
descrito
Lógica
Ontologías
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode
URI
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Arquitectura de la Web
Reglas
Confianza
Demostración
s
e
l
a
t
i
g
d
s
a
m
i
r
i
F
5
Representación de la Información
Bits, bytes, números, caracteres, ...
Los ordenadores manejan código binario: 0s y 1s
Bytes: Grupos de 8 bits
Números: Sistemas de codificación binaria, octal, hexadecimal...
Caracteres: Código que asocia a cada carácter un nº
ASCII: 7 bits ⇒ (0 – 127)
(A)merican (S)tandard (C)ode for (I)nformation (I)nterchange
Extensiones de ASCII
ISO-8859-1 (iso-latin-1)
(8 bits) ASCII (0-127) + otros caracteres típicos de Europa
occidental
Familia ISO-8859-X = Otros alfabetos europeos
ISO-8859-15 (iso-latin-9) Igual que iso-8859-1 + símbolo de €
¡CUIDADO! ...hay muchos idiomas y muchos caracteres...
ℜ € き ㄝ ㌟ ㉃ ⋐ ∀ ℵ ₤ ウ ぼ
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Representación de la Información
Unicode
ISO-10646 (31 bits) Define un repertorio universal de caracteres
(UCS)
En continua revisión: ISO-10646-2:2001 contiene más de
70.000 caracteres
UNICODE = Consorcio de empresas que define restricciones sobre
la implementación de ISO-10646
Varias codificaciones (UTF = Unicode Transformation Format)
- UTF-8: Los primeros 127 códigos se presentan igual (compatible con
ASCII)
El resto se codifican en longitud variable
Relativamente Eficiente
- UTF-16: Usa 16bits para los caracteres más comunes, el resto con pares
de 16 bits
- UTF-32: Codificación directa en 32 bits (desperdicio de espacio)
NOTA: Conviene distinguir:
Carácter: Entidad abstracta (Letra A)
Glifo (Glyph): Representación del carácter A A A A A A
Fuente (Font): Conjunto de glyphs, ejemplo: Times Roman, Arial, etc.
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
6
Representación de la Información
Imágenes, Audio, Vídeo, Realidad Virtual
Imágenes: En pantalla = matriz de puntos de colores (pixels)
Formatos Raster (Raw): Se enumeran todos los puntos con sus
colores
Ejemplo: Bitmap, TIFF
Compresión: diversos algoritmos de compresión
GIF: Utiliza 8 bits (hasta 256 colores)
Byte de color = Indice en la paleta de colores
Bueno para dibujos o texto, poco recomendable para fotografías
JPEG: utiliza 24 bits (hasta 16 millones de colores)
Recomendable para forografías
Vectorial: Se enumeran las instrucciones de dibujo
Ejemplos: DXF, SVG (estándar de Internet)
Sonido: Formatos raster (WAV) y comprimidos (MP3)
Vídeo: Formatos comprimidos (MPEG)
Realidad Virtual: Lenguaje de Modelado (VRML, X3D)
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Identificación de Recursos
URIs
URI: (Uniform resource Indentifier) Identifica un recurso de forma
global
Puede sub-clasificarse en:
URL (Uniform resource locator)
Además de identificar el recurso, indica cómo llegar hasta él
esquema://servidor:puerto /ruta?datosGET
http://www.uniovi.es:8080/prueba/carrito?action=print
URN (Uniform resource name): Nombre de recurso
Ejemplo: urn:xmlorg:objects:schema:xmlschema:xcatalog
URLs
URNs
URIs
IRIs (Internationalized Resource Identifiers)
permiten utilizar caracteres Unicode en los identificadores
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
7
Sesión 2
Lenguaje XML
Departamento de Informática
Universidad de Oviedo
Marcado de documentos
Orígenes: Industria de la Publicación
Se usaban marcas para indicar cómo componer el documento para la
impresión
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Ejemplo de corrección tipográfica
Fuente: http://recursos.cnice.mec.es/bancoimagenes
8
Marcado de documentos
Sólo texto
ALBA Abril de 1915 Granada Mi corazón oprimido
siente junto a la alborada el dolor de sus
amores y el sueño de las distancias.
Texto marcado
]ALBA[ ← Título, negrita, centrado, 14pt
]Abril de 1915[← SubTítulo, negrita, centrado
]Granada[← SubTítulo cursiva, centrado
]Mi corazón oprimido [← Verso, 10pt
]siente junto a la alborada [← Verso
]el dolor de sus amores [← Verso
]y el sueño de las distancias. [← Verso
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Resultado
ALBA
Abril de 1915
Granada
Mi corazón oprimido
siente junto a la alborada
el dolor de sus amores
y el sueño de las distancias.
Marcado Descriptivo
El marcado no es la información que contiene el documento
Marcado = información acerca del documento = meta-
información
Lenguajes de Marcado descriptivo: Incluyen marcas que
describen cómo procesar el documento
Ejemplo: HTML
<html>
<head><title>Poema</title></head>
<body>
<h1>Alba</h1>
<h2>Abril de 1915 </h2>
<h2><i>Granada</i></h2>
<p>Mi corazón oprimido</p>
<p>siente junto a la alborada</p>
<p>el dolor de sus amores</p>
<p>y el sueño de las distancias. </p>
</body>
</html>
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
9
Marcado Generalizado
Marcado generalizado = Sintaxis común que facilita la
creación de lenguajes descriptivos
HTML
<html>
<head><title>Poema</title></head>
<body>
<h1>Alba</h1>
<h2>Abril de 1915 </h2>
<h2><i>Granada</i></h2>
<p>Mi corazón oprimido</p>
<p>siente junto a la alborada</p>
<p>el dolor de sus amores</p>
<p>y el sueño de las distancias.</p>
</body>
</html>
Otras marcas...(misma sintaxis)
<poema fecha="Abril de 1915"
lugar="Granada">
<titulo>Alba</titulo>
<verso>Mi corazón oprimido</verso>
<verso>siente junto a la alborada</verso>
<verso>el dolor de sus amores</verso>
<verso>y el sueño de las distancias. </verso>
</poema>
Jose Emilio Labra Gayo, Nov. 2005
www.fundacionctic.org
Marcado Generalizado
SGML
(70- ) GML desarrollado en IBM – Generalized Markup Language
(Goldfarb, Mosher, Lorie)
(86) SGML Standard Generalized Markup Language (Estándar ISO)
Utilizado para el intercambio de documentos
Principio: Separar contenido de la forma de representarlo
Muy flexible (permite definir vocabularios específicos para cada
aplicación)
HTML era un vocabulario de SGML
Ejemplo de la especificación de HTML en SGML
La etiqueta final es obligatoria
<P> párrafo <UL> lista </UL>
?
<!ELEMENT UL - -
<!ELEMENT LI - O (%flow;)* >
<!ELEMENT P
- O (%inli
Comentarios de: Web Semántica (0)
No hay comentarios