Publicado el 20 de Junio del 2018
694 visualizaciones desde el 20 de Junio del 2018
12,5 MB
203 paginas
Creado hace 17a (01/03/2008)
Centro de Investigacion y de Estudios Avanzados
del Instituto Politecnico Nacional
Departamento de Computacion
Tavlab: entorno estadstico basado en workows
con Taverna
Tesis que presenta
Ulises Revilla Duarte
para obtener el Grado de
Maestro en Ciencias
en la Especialidad de
Ingeniera Electrica
Codirectores de la Tesis
Dr. Jorge Buenabad Chavez
Dra. Ana Mara Antonia Martnez Enrquez
Mexico, D.F.
Marzo 2008
ii
Resumen
Esta tesis presenta el diseño e implementacion de una infraestructura de com-
ponentes de software distribuidos que pueden integrarse en sistemas de workows
destinados a la resolucion de problemas cientcos de analisis estadstico de datos
experimentales. Concretamente, esta infraestructura permitira al usuario nal inte-
ractuar con ujos de datos dentro de un ambiente graco de solucion de problemas
en forma distribuida (DPSE: Distributed Problem Solving Environment). En un
ambiente graco de este tipo, se utilizan los recursos de multiples equipos individua-
les interconectados mediante una red (principalmente la Internet) para la solucion
de problemas computacionales a gran escala.
Con la nalidad de validar la in-
fraestructura de servicios Web construida, se resuelven diversos casos practicos en
Biotecnologa, Ingeniera Qumica y Medicina Estadstica.
Abstract
This thesis presents the design and implementation of an infrastructure of software
components to be integrated within workows for statistical analysis of experimental
data. This infrastructure allows users to interact with data ows within a graphical
problem-solving environment in a distributed way,
if need be. This kind of envi-
ronment makes possible to use multiple distributed resources reachable through the
Internet in the solution of large-scale computational problems. To validate our in-
frastructure, several practical problems from Biotechnology, Chemestry Engineering
and Statistical Medicine were solved.
iii
Agradecimientos
Al Centro de Investigacion y de Estudios Avanzados del I.P.N. por
abrirme las puertas de su importante centro de investigacion, y permitirme seguir
con mis estudios de Maestra.
Al Consejo Nacional de Ciencia y Tecnologa por la beca que me otorgo para
realizar mis estudios de Maestra.
Al Dr. Jorge Buenabad Chavez por su amistad, invaluable apoyo y consejos,
e innita paciencia y gua en el desarrollo de la presente tesis.
A la Dra. Ana Mara Antonia Martnez Enrquez por su amistad, por
dirigir mi trabajo de investigacion con enorme interes y entusiasmo, por su invalua-
ble apoyo y consejos, as como por el impulso decisivo para la terminacion de mi
documento de tesis.
Al Dr. Adriano de Luca Pennacchia por su apoyo e interes en mi trabajo de
investigacion y por su participacion como parte del Jurado en el examen de Grado.
Al Dr. Jose Oscar Olmedo Aguirre por la revision de mi documento de tesis,
por contribuir al mejoramiento de la misma a traves de sus comentarios y preguntas,
as como por su participacion como parte del Jurado en el examen de Grado.
A la Dra. Sonia Mendoza Chapa por su gran apoyo y consejos, por sus
palabras de motivacion e interes en la terminacion de este trabajo de tesis.
Al Dr. Sergio Chapa Vergara por su apoyo y consejos.
A los ingenieros Mirna Guadalupe Botello Sandoval e Ivan Israel Uresti
Adame por su amistad, por la revision de mi documento de tesis y por el apoyo que
siempre me han brindado.
A mis compañeros de la generacion 2005 por el apoyo que me brindaron
durante la Maestra.
A la Sra. Sofa Reza Cruz quien amablemente me orientaba sobre los tramites
administrativos durante mi estancia en el Departamento de Computacion.
As, como a todas las personas que directa o indirectamente han contribuido para
la realizacion de esta tesis.
A todos Ustedes muchas gracias.
iv
Dedicatoria
A Dios que siempre me ayuda y me da fuerzas para seguir esforzandome.
A la memoria de mi padre,
Javier Miguel Revilla Arellano
A mi madre,
Mercedes Duarte Prado
A mis hermanos,
Aquiles y Benjamn Revilla Duarte
A mi abuela Elena
A mi to,
Sergio Duarte Prado y a su esposa Adriana
A mis sobrinos,
Javier, Ulises y Jesus Alejandro.
Indice general
Captulo 1: Introduccion
1 Agentes de software
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Modelo de un workows . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 Motivacion y justicacion . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . .
5 Contribucion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6 Organizacion de la tesis
. . . . . . . . . . . . . . . . . . . . . . . . . . .
Captulo 2: Taverna
2.1 Ambientes gracos de workows
. . . . . . . . . . . . . . . . . . . . .
2.1.1 Servicios Web . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.2 Workows cientcos . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
2.1.3 Arquitectura de capas
2.1.4 Plataformas gracas para workows cientcos
. . . . . . . . .
2.2 Creacion de un workow en Taverna . . . . . . . . . . . . . . . . . . .
2.2.1 Pasos para crear un workow en Taverna
. . . . . . . . . . . .
2.2.2 Ejemplo de la calculadora . . . . . . . . . . . . . . . . . . . . .
2.2.3 Ejecucion del workow . . . . . . . . . . . . . . . . . . . . . . .
2.2.4 Revision de resultados
. . . . . . . . . . . . . . . . . . . . . . .
2.3 Busqueda semantica de servicios con Feta . . . . . . . . . . . . . . . .
2.4 Captura y publicacion de servicios con PeDRo . . . . . . . . . . . . . .
Integracion de Feta y PeDRo en Taverna . . . . . . . . . . . . . . . .
2.5 Sumario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Captulo 3 De Taverna a Tavlab
3.1 Recursos de servicios Web en Tavlab . . . . . . . . . . . . . . . . . . .
3.1.1 Nivel I: manejo de datos de entrada . . . . . . . . . . . . . . . .
3.1.2 Nivel II: aplicaciones . . . . . . . . . . . . . . . . . . . . . . . .
3.1.3 Nivel III: apoyo y consulta . . . . . . . . . . . . . . . . . . . . .
3.1.4 Nivel IV: presentacion de resultados . . . . . . . . . . . . . . . .
3.2 Servidor de recursos en Tavlab . . . . . . . . . . . . . . . . . . . . . .
3.3 Implementacion de los recursos de servicios Web . . . . . . . . . . . . .
3.3.1 Estructura general de los programas . . . . . . . . . . . . . . . .
3.3.2 Estandares y lenguajes de los servicios Web . . . . . . . . . . .
1
2
5
9
9
11
17
19
20
20
22
26
27
31
32
34
37
38
42
48
48
49
51
51
52
55
58
60
61
63
63
65
v
vi
INDICE GENERAL
3.3.3 Java proxies para los servicios Web . . . . . . . . . . . . . . . .
3.4 Iconos representativos de los metodos . . . . . . . . . . . . . . . . . . .
3.5 Sumario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
74
77
Captulo 4 Aplicacion de Tavlab en Biotecnologa
79
81
4.1 Analisis de varianza
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
4.2 La prueba de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
4.3 La prueba LSD de Fisher
. . . . . . . . . . . . . . . . . . . . . . . . .
89
4.4 Organizacion y distribucion de recursos de servicios Web . . . . . . . .
92
4.5 Utilizacion del entorno estadstico Tavlab
. . . . . . . . . . . . . . . .
92
4.5.1 Obtencion de la tabla de analisis de varianza . . . . . . . . . . .
4.5.2 Aplicacion de la prueba LSD de Fisher . . . . . . . . . . . . . .
97
4.5.3 Aplicacion de la prueba de Tukey . . . . . . . . . . . . . . . . . 100
4.6 Sumario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Captulo 5: Quimiometra y Medicina Estadstica
107
5.1 Estadstica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
. . . . . . . . . . . . . . . . . . . 108
5.1.1 Medidas de tendencia central
5.1.2 Medidas de dispersion . . . . . . . . . . . . . . . . . . . . . . . 108
5.1.3 Ecuacion de regresion . . . . . . . . . . . . . . . . . . . . . . . . 109
5.1.4 Coeciente de correlacion . . . . . . . . . . . . . . . . . . . . . 110
. . . . . . . . . . . . . . . . . . . . . . . . 111
5.1.5 Prueba t de Student
5.2 Aplicaciones en Quimiometra y Medicina Estadstica . . . . . . . . . . 112
5.2.1 Problema 1: estadsticas de medidas repetidas . . . . . . . . . . 112
5.2.2 Problema 2: estadsticas de medidas repetidas . . . . . . . . . . 119
5.2.3 Problema 3: contrastes de signicacion . . . . . . . . . . . . . . 123
5.2.4 Problema 4: correlacion y regresion . . . . . . . . . . . . . . . . 127
5.2.5 Problema 5: prueba de signicacion . .
Comentarios de: Entorno estadístico basado en workfows con Taverna (0)
No hay comentarios