Publicado el 30 de Julio del 2017
854 visualizaciones desde el 30 de Julio del 2017
2,5 MB
38 paginas
Creado hace 13a (08/03/2012)
Manual para preparación de archivos HTML
Julio /2011
UNAM. DGB. SciELO-México
INDICE
Introducción
Estructura de carpetas
Conversión de archivos a formato HTML
Estructura del documento
Código HTML
Imágenes y enlaces
Anexo A. Habilitar vínculos en imágenes
1
2
5
10
20
25
33
UNAM. DGB. SciELO-México
Introducción
La edición electrónica de revistas en las colecciones SciELO requiere cumplir con una serie de
requisitos para la realización del proceso de marcación de etiquetas, así como para la instalación de los
documentos en el sitio SciELO. Dichos requisitos tienen que ver con aspectos relacionados con el
código de los archivos HTML y la estructura y presentación de cada documento.
En virtud de que el sistema proporciona al usuario el texto completo de cada documento en formato
PDF y HTML, es necesario obtener cada documento en ambos formatos. El formato PDF forma parte de
los productos finales de la edición, pero la versión HTML tiene que obtenerse a partir de los archivos de
edición de la versión impresa en herramientas como InDesign, PageMaker o Word, o a partir del
archivo PDF. La versión del texto en HTML es requerida principalmente para la marcación de
metadatos y necesita de una adaptación especial para ello. Esta adaptación tiene como objetivo
cumplir tres aspectos: ajustar el documento del medio impreso al medio electrónico, uniformizar la
estructura de los documentos para facilitar su producción y, sobre todo, presentar los elementos del
documento en el orden conveniente para su marcación.
El siguiente esquema muestra las etapas que sigue una revista para su incorporación a SciELO:
Archivos electrónicos
recibidos
HTML
Conversión texto
HTML SciELO
Archivos HTML de
acuerdo con la
definición de
código SciELO
HTML
HTML
HTML
HTML
..…
InDesign
Word
PageMaker
Ventura
Quark
Latex
Carga en la
base de datos
Marcación y
Parser
Operación en Internet
Este manual comprende solamente los aspectos necesarios para crear la versión HTML de los
documentos, las demás etapas del proceso son tratadas en otro manual.
08/03/2012
1
UNAM. DGB. SciELO-México
Estructura de carpetas
Cuando una revista ingresa a SciELO se le asignan unas siglas que la identificarán en forma única en
todo el sistema, por ejemplo:
aneuroc
Archivo de Neurociencias
agritm
Agricultura Técnica de México
atm
Atmósfera
geoint
Geofísica Internacional
vetmex
Veterinaria México
Al asignar las siglas es necesario asegurarse que no hayan sido utilizadas en la colección SciELO, si
fuera el caso, habría que adicionarle otras letras para crear una nueva. A partir de este acrónimo se
crea una estructura de carpetas que contendrán la información de todos los fascículos de la revista.
El nombre de la carpeta de un fascículo específico deberá nombrarse con el volumen y número al que
corresponde, por ejemplo:
v102n3
Volumen 102 número 3
v8n24
n28
Volumen 8 número 24
Número 28
Los suplementos y números especiales se nombran de la siguiente manera:
v28nspe
Volumen 28 número especial
V53s1
Volumen 53 suplemento 1 (Suplemento de volumen)
v31n1s1
Volumen 31 suplemento del número 1 (Suplemento de número)
A su vez, para cada fascículo se crearán las carpetas <body>, <img>, <pdf> y <source>. Cada una
de las cuales contiene:
<body>
La versión HTML de cada artículo del fascículo.
contenido.
El nombre de cada archivo debe contener el volumen y número de la publicación, así
como el número correspondiente al orden en que aparece el documento en la tabla de
La extensión de los archivos con el código HTML debe ser .htm.
08/03/2012
2
UNAM. DGB. SciELO-México
Volumen(v) + número(n) + archivo(a)
<img>
Los archivos de las imágenes que contiene el fascículo.
Para que los nombres no sean muy largos sólo se toma en cuenta el artículo al cual
pertenece y el nombre del archivo de la imagen. Se sugiere que el nombre que se le
asigne a la imagen indique el tipo de imagen de que se trata, como se muestra en la
siguiente tabla:
a
e
f
g
m
t
… etc.
anexo
ecuación, esquema
foto, figura,
gráfica
mapa
tabla
Ejemplos:
La gráfica 3 del primer artículo:
La tabla 2 del quinto artículo:
La foto 10 del octavo artículo
La ecuación 15 del segundo artículo
a1g3.jpg
a5t2.jpg
a8f10.jpg
a2e15.jpg
<pdf>
La versión PDF de cada artículo de la revista.
Es indispensable contar con la versión PDF de cada uno de los documentos que
conforman un fascículo, esta versión generalmente se obtiene al finalizar la edición
impresa del fascículo y es proporcionada por el editor. Si se tiene un solo archivo PDF de
todo el fascículo, habrá que segmentarlo para obtener un archivo PDF por artículo.
08/03/2012
3
UNAM. DGB. SciELO-México
El nombre que se asigna a cada uno de los archivos PDF debe ser el mismo del archivo
HTML que le corresponde.
<source> Los archivos originales que el editor envió para su inclusión en SciELO.
Esta carpeta se creará sólo cuando el formato de los archivos originales no sea PDF.
Tanto los nombres de las carpetas como de los archivos que éstos
contengan deben escribirse en minúsculas, sin espacios o caracteres especiales.
Se sugiere que la longitud de estos nombres no sea de más de 8 caracteres.
08/03/2012
4
UNAM. DGB. SciELO-México
Conversión de archivos a formato HTML
La versión HTML puede obtenerse a partir de la versión original que entregó el editor en el formato del
software de edición de la versión impresa, es decir en InDesign, Corel, Word, PageMaker, Ventura, etc.
Para llevar a cabo este proceso es necesario identificar, en el software, la opción para exportar
información al formato HTML; cada programa, según su versión, puede ofrecer una variedad de
opciones de conversión, se elegirá la que ofrezca un código más sencillo y sin estilos. Es importante
señalar que cada software genera un código con ciertas particularidades que habrá que revisar.
Código HTML
SciELO requiere características específicas de código HTML, en general las etiquetas que se emplean
son básicas y no permiten el uso de estilos. Si estas características no se cumplen probablemente
resulte afectado el procesamiento del fascículo para su incorporación en el sitio SciELO. Dichas
características se especifican en la sección Código HTML.
Texto
Al obtener la versión HTML del fascículo es de suma importancia cuidar que el texto HTML sea fiel al
original, esto es, que no se altere o se pierda información. Para ello es conveniente cotejar la versión
HTML con la versión impresa o el PDF de la revista. Además debe asegurarse que los estilos del texto
(negritas, cursivas, etc.) del archivo original también se encuentren en el HTML, de no ser así habrá
que recuperarlo manualmente. En general, el texto debe seguir las indicaciones de formato de la
sección Estructura del documento.
Imágenes
Las imágenes pueden ser fotos, mapas, figuras, tablas, gráficas, esquemas, ecuaciones, etc., con su
respectivo encabezado o pie de imagen. No existe un tamaño patrón, lo más importante es que sean
legibles. En general, una conversión a HTML no deja las imágenes como se requieren, por lo que
frecuentemente es necesario recortarlas y extraerlas de la versión PDF del documento.
MAL
08/03/2012
5
UNAM. DGB. SciELO-México
Los textos frecuentemente contienen expresiones como fórmulas, ecuaciones o símbolos que no
pueden ser representados con código HTML. Éstos también serán tratados como imágenes:
BIEN
Cuando las expresiones sean complejas será recomendable también recortarlas como imágenes e
insertarlas en el texto HTML.
08/03/2012
6
UNAM. DGB. SciELO-México
Ejemplo de Conversión de Formato PDF a HTML
Por lo regular se cuenta con una versión PDF de la revista para iniciar su incorporación a SciELO.
A partir de la versión PDF de cada documento o artículo se obtendrá una versión HTML. Este proceso
puede realizarse con el software ABBY Transformer.
Ejecutar el programa
Cargar el archivo PDF
08/03/2012
7
UNAM. DGB. SciELO-México
Indicar que el archivo PDF
original se guardará como
HTML
El software informa el
nombre del archivo de salida
y el lugar donde lo dejará. Si
desea modificaciones use el
botón Cambiar
Ahora puede seleccionar el
botón de Finalizar para
hacer la conversión o
modificar las Opciones para
llevar a cabo una
recuperación más exacta
08/03/2012
8
UNAM. DGB. SciELO-México
En Opciones es posible
seleccionar el idioma del
texto del artículo. Si el
artículo contiene texto en dos
idiomas, puede seleccionar
un idioma secundario
Seleccione las opciones que
permitan optimizar la versión
HTML
La resolución debe seguir el
patrón para Internet de 72
dpi.
El resultado de la conversión es un archivo HTML y un conjunto de archivos con las imágenes que
contiene el artículo. El código HTML debe cumplir lo indicado en la sección Código HTML, el código
que no cumpla será eliminado. En general, las imágenes obtenidas con este procedimiento no
contienen el texto del pie de la imagen y tampoco cumplen con las dimensiones que SciELO especifica,
por este motivo deben eliminarse.
Las características y manejo de las imágenes dentro de un HTML se detallan en la sección Imágenes
y enlaces.
Para obtener las imágenes a partir del archivo PD
Comentarios de: Manual para preparación de archivos HTML (0)
No hay comentarios