Publicado el 29 de Mayo del 2018
532 visualizaciones desde el 29 de Mayo del 2018
1,1 MB
33 paginas
Creado hace 21a (23/03/2004)
XML, Servicios Web y
Web Semántica
Departamento de Informática
Universidad de Oviedo
Sesión 1
Internet, HTML
Hojas de estilos
Departamento de Informática
Universidad de Oviedo
1
Esquema de la Sesión
Repaso de Conceptos
Representación de la Información
Internet
World Wide Web
Reflexiones sobre procesos de Estandarización
HTML
Hojas de estilos
Representación de la Información
Bits, bytes, números, caracteres, ...
Los ordenadores manejan código binario: 0s y 1s
Bytes: Grupos de 8 bits
Números: Sistemas de codificación binaria, octal, hexadecimal...
Caracteres: Código que asocia a cada carácter un nº
ASCII: 7 bits
(0 – 127)
(A)merican (S)tandard (C)ode for (I)nformation (I)nterchange
Extensiones de ASCII
ISO-8859-1 (iso-latin-1)
(8 bits) ASCII (0-127) + otros caracteres típicos de Europa occidental
Familia ISO-8859-X = Otros alfabetos europeos
ISO-8859-15 (iso-latin-9) Igual que iso-8859-1 + símbolo de €
¡CUIDADO! ...hay muchos idiomas y muchos caracteres...
?
? ? £ ?
?
R €
?
?
?
?
2
Representación de la Información
Unicode
ISO-10646 (31 bits) Define un repertorio universal de caracteres (UCS)
En continua revisión: ISO-10646-2:2001 contiene más de 70.000 caracteres
UNICODE = Consorcio de empresas que define restricciones sobre la
implementación de ISO-10646
Varias codificaciones (UTF = Unicode Transformation Format)
- UTF-8: Los primeros 127 códigos se presentan igual (compatible con ASCII)
El resto se codifican en longitud variable
Relativamente Eficiente
- UTF-16: Usa 16bits para los caracteres más comunes, el resto con pares de
16 bits
- UTF-32: Codificación directa en 32 bits (desperdicio de espacio)
NOTA: Conviene distinguir:
Carácter: Entidad abstracta (Letra A)
Glifo (Glyph): Representación del carácter A A A A A A
Fuente (Font): Conjunto de glyphs, ejemplo: Times Roman, Arial, etc.
Representación de la Información
Imágenes, Audio, Vídeo, Realidad Virtual
Imágenes: En pantalla = matriz de puntos de colores (pixels)
Formatos Raster (Raw): Se enumeran todos los puntos con sus colores
Ejemplo: Bitmap, TIFF
Compresión: diversos algoritmos de compresión
GIF: Utiliza 8 bits (hasta 256 colores)
Byte de color = Indice en la paleta de colores
Bueno para dibujos o texto, poco recomendable para fotografías
JPEG: utiliza 24 bits (hasta 16 millones de colores)
Recomendable para forografías
Vectorial: Se enumeran las instrucciones de dibujo
Ejemplos: DXF, SVG (estándar de Internet)
Sonido: Formatos raster (WAV) y comprimidos (MP3)
Vídeo: Formatos comprimidos (MPEG)
Realidad Virtual: Lenguaje de Modelado (VRML, X3D)
3
Internet
Evolución
(60-80) Origen militar
Protocolos de comunicación (TCP/IP)
Seguridad ante ataques (múltiples servidores)
(80 – 95) Implantación académica
Protocolos de intercambio de información (FTP, SMTP, HTTP, ...)
Enorme biblioteca con material hipermedia
(95 – 00) Acceso comercial
Posibilidad de negocio Dinero!!
Boom comercial
La red es un ordenador gigante para hacer negocios
(00-) Crisis de las punto com
Historias de fracasos
Revisión de las arquitecturas tradicionales
Lecciones aprendidas
Internet
Modem
ISP local
Router
ISP regional
Acceso particular
servidores
Telefonía móvil
Acceso corporativo
wireless
4
Internet
Repaso de conceptos
IP (Internet Protocol) protocolo de intercambio de paquetes
Asigna direcciones globales únicas (32 bits)
IPv6: nueva versión propuesta, con direcciones de 128 bits
Host: es un nodo de la red (con dirección IP)
Cliente: Ordenador que solicita servicios
Servidor: Ordenador que propicia respuestas a los clientes
Además de la dirección IP, el puerto (16bits) identifica el servicio
Varios puertos predefinidos (80 = HTTP, 25 = SMTP, 20/21 = FTP, etc.)
Protocolo TCP: Permite comunicación entre nodos manteniendo una conexión.
En condiciones normales, todos los paquetes llegan
Incluye servicio de transporta confiable y mecanismo de control de
congestiones
No se garantizan tiempos ni retardos mínimos
Se utiliza para transmitir correos, ficheros, etc.
Protocolo UDP (Datagrama) no se realiza una conexión
Pueden producirse pérdidas de algunos paquetes
Utilizado para transmisión de voz
Internet
Principales Protocolos
HTTP: Protocolo de transferencia de hipertexto
Puerto 80
Utiliza TCP/IP como protocolo subyacente
No incluye estado (no se almacena información del cliente)
HTTP/1.1 proporciona conexiones persistentes
FTP: Transferencia de ficheros
Puertos 20/21
Mantiene estado
SMTP (simple mail transfer protocol)
Formato de mensajes mediante MIME
Protocolos de acceso (POP3, IMAP, etc.)
DNS: Asignación de nombres de dominio
Otros: LDAP , NNTP, WebDAV, etc.
5
Internet
Identificación de Recursos
URI: (Uniform resource Indentifier) Identifica un punto en el espacio
Puede sub-clasificarse en:
URL (Uniform resource locator)
Además de identificar el recurso, indica cómo llegar hasta él
Esquema: //servidor:puerto /ruta?datosGET
http://www.aulanet.uniovi.es:8900/webct/ticketLogin?action=print
URN (Uniform resource name): Nombre de recurso
Ejemplo: urn:xmlorg:objects:schema:xmlschema:xcatalog
URLs
URNs
URIs
World Wide Web
Evolución
Hipertexto (Ted Nelson, 1965)
Texto no secuencial, con enlaces
WWW (Tim Berners-Lee, 1989)
Protocolo HTTP (Hypertext transfer protocol)
Se basa en Internet
Arquitectura cliente/servidor
Lenguaje HTML (HyperText Markup Language)
Enlaces mediante URLs
Marcas
Símbolos extras que se añaden al texto ordinario
Modifican la representación del texto por parte del explorador
World Wide Web: Red de ordenadores que se comunican mediante el
protocolo HTTP
6
HTML
Relación con HTTP
Arquitectura cliente/servidor
Cliente
Protocolo
http
Servidor
Visualizador
GET http://servidor.com/hola.html
http:/1.0 200 OK
http:/1.0 200 OK
<html>
<html>
<body>
<body>
Enlace a
Enlace a
<a href =“otro.html”>Otro</a>
<a href =“otro.html”>Otro</a>
</body>
</body>
</html>
</html>
HTML
7
World Wide Web
SGML, HTML, XML
(70- ) GML: Desarrollado en IBM por C. Goldfarb, E. J. Mosher, R. Lorie
Proyecto para representar documentos legales
(78) SGML: Estándar ANSI
Aplicaciones en sistemas de documentación
(90) HTML (Tim Berners-Lee, 1990)
Desarrollado en el CERN.
Intercambio de información científica sobre Internet
(94) HTML 2.0 (IETF, Internet Engineering Task Force)
(94) Consorcio Web (W3C)
Formado por compañías y universidades internacionales
Desarrolla recomendaciones (» estándares de facto)
(96-) XML 1.0 versión simplificada de SGML
(98) HTML 4.01 última versión basada en SGML
(99) XHTML 1.0 Adaptación de HTML a XML
(02) XHTML 2.0 Borrador
(03) XML 1.1 Mejorar el Soporte de Unicode
World Wide Web
HTML, SGML, XML
Meta-vocabulario
Vocabulario
SGML
XML
Años
70
1990
1996
1999
HTML
XHTML
8
Proceso de Estandarización
¿Dónde está tu tecnología favorita?
Éxito
(Diversificación)
Posibles perversiones...
No estandarización
Estandarizar algo que no tiene éxito
Estándar demasiado pronto
Estándar demasiado tarde
Comités poco representativos
Estándar sin prototipos
No adoptar el estándar
etc., etc.
Primeros
prototipos
Idea brillante
Adopción
del estándar
(limitaciones)
Necesidad
de estándar
Especificación
(comité)
Internacionales
ISO, W3C, IETF, ECMA, etc.
Página Web del Consorcio
9
Filosofía de la WWW
Facilitar el acceso desde cualquier punto
Evitar discriminación por razón de ...
Estandarización
Gran número de plataformas y entornos computacionales
Universalidad
Accesibilidad
Sistema de información a nivel mundial
Enlaces únicos (URI)
Linux / Windows / Macintosh /...
Mainframes / PCs / PDA / ...
Sistema basado en recomendaciones
Consorcio formado por
Organismos internacionales
Industrias
Instituciones educativas
Porqué tenemos que obligar al usuario a usar
un determinado Software?
10
Accesibilidad
Editores WYSIWYG
Ejemplo: Utilizar Word para generar HTML
11
Código generado por el WORD
Editores WYSIWYG
Código escrito directamente
Código escrito directamente
Editores WYSIWYG
Ventajas
Facilidad de uso (discutible)
Independencia de la evolución de los estándares
Desventajas
Problemas de accesibilidad
No todo el mundo puede/quiere ver lo mismo que nosotros
Incompatibilidad de código generado
Incorporación de extensiones
Generación de código no-válido
Engañosa facilidad de desarrollo
Limitación del aprendizaje
Menor control de lo que se está realizando
12
Nosotros codificaremos HTML a pelo!!
Cabecera
Cuerpo
Lista
Enlaces
Detalles de
presentación
AlCapone.html
<html>
<head>
<title>Pizzeria Al Capone</title>
</head>
<body bgcolor="blue" text="yellow"
link="red" vlink="white">
<h1>Pizzería Al Capone</h1>
<p>Lista de enlaces</p>
<ul>
<li><a href="Pizzas.html">
Tipos de Pizzas</a></li>
<li><a href="http://www.mafia.it">
Patrocinadores</a></li>
<li><a href="#Contacto">Contacto</a></li>
<ul>
<h2><a name="Contacto">Contacto</a></h2>
<p><font color="red">Dirección:</font>
C/ Génova Nº 3, Oviedo, España</p>
<p><font color="red">Teléfono:</font>
985203040</p>
</body>
</html>
Ejemplo de HTML
Página visualizada
13
Estructura de documentos HTML
Un documento HTML tiene el formato
DTD
Cabecera
Cuerpo
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.0//EN”
“http://www.w3.org/TR/REC-html40/strinct.dtd”
<html>
<head>
. . .
</head>
<body>
. . .
</body>
</html>
DTD = Declaración de tipo de documento
Muchos visualizadores asumen tipo HTML por defecto
Su inclusión garantiza mayor compatibilidad y validación
La cabecera incluye información sobre el documento actual (meta-información)
Título, autor, palabras clave para robots de búsqueda, etc.
El cuerpo incluye el contenido del documento
El formato HTML se basa en la utilización de elementos
Formato de documentos HTML
Un elemento está formado por:
Una etiqueta inicial (nombre entre signos < y > ): <etiqueta>
La etiqueta inicial puede contener atributos: <etiqueta atributo=“valor”>
El element
Comentarios de: XML, Servicios Web y Web Semántica (0)
No hay comentarios