Actualizado el 12 de Septiembre del 2020 (Publicado el 14 de Enero del 2017)
864 visualizaciones desde el 14 de Enero del 2017
71,7 MB
86 paginas
Creado hace 12a (30/01/2013)
CENTRO OE INVE STIGA\.ION Y fH
£S TUDIOS AV ANZ'D t1S D!: l
I. P. N.
BI BL!OT~:CA
IN GENIER IA ELECT RlCA
CENTRO DE INVESTIGACION Y ESTUDIOS A V ANZADOS
DEL lPN
DEPARTAMENTO DE JNGENIERJA ELECTRJCA
SECCION COMPUT A CION
"DESARROLLO DE UN ALGORJTMO PARA EL ANALISIS DE DATOS Y
CLASIFICACION TIPO TIPICIDAD Y CONTRASTE"
TESIS
QUE PARA OBTENER EL GRADO DE
MAESTRO EN CIENCIAS
PRESENT A
LETICIA VEGA ALVARADO
DIRECTOR DE TESIS : DR. JOSE RUIZ SHULCLOPER
ME XICO, D.F
ENERO, 1996
C L• SJ> , 9b•9
,
•1>-UIS.,~:r. . \L\ "'" i -I
U CHA .1_ C\. Ei61~\ q_ .(, t
-=• -\> DN
.
t
_____ j
L .
In dice
Introducci6n
Capitulo 1 Conceptos y resultados previos
1.1 Analisis de datos y Ia determinacion de anomalias
1.2 Algoritmo para el analisis de datos
(Diordenko y Vaskosvskii)
1.3 Algoritmo para clasificaci6n y analisis de datos
(L. Vega)
Capitulo 2 Algoritmo para clasificaci6n y amllisis
de datos (L.Vega+)
2.1 Conceptos basicos
2.2 Descripci6n del algoritmo
Capitulo 3 lmplantaci6n computacional
3.1 lntroducci6n
3.2 Estructuras y funciones
3.3 Manejo del sistema
Conclusiones
Apendice
Bibliografia
5
7
19
32
32
36
46
46
49
52
54
56
77
~t, l•:<! rt;'tfi) AC ION 'f -~
'" '' (l ~ l}f I.
.
r~ . \ · .
f> ;.
1':~i~:-.XFt.r,;, ~. L!.k:;;.;.~ii~A
Introduce ion
El reconocimiento es un atributo del ser hurnano , asi como de otros organismos vivos. El
proceso de reconocimiento est.a presente en cada instante de sus vidas. Pueden reconocer
los objetos que estan a su alrededor, de una manera nipida y sencilla, y moverse y actuar
sobre Ia base de ellos. En este sentido, uno de los maximos retos a lo largo de los afios ha
sido el Jograr que una computadora sea capaz de reconocer y percibir patrones de manera
similar a como lo hace el ser hurnano. Asi, a principios de los afios 50 · s, con el
surgimiento y auge de las computadoras digitales se dieron los primeros pasos en el
reconocimiento automatizado de patrones . En Ia decada de los 60 · s se incrementaron
rapidamente las investigaciones en el area del reconocimiento de patrones . Durante esta
epoca aparecieron cientos de articulos referentes a Ia clasificacion de patrones, algoritmos
para el procesamiento de imagenes y Ia aplicacion de tecnicas de reconocimiento de
patrones a problemas practicos.
En los ultimos afios ha crecido enormemente el interes en el reconocimiento de
patrones en estudios interdisciplinarios e investigaciones de diferentes campos como son:
Medicina, Psicologia, las Geociencias, Sociologia y otras mas en las cuales con frecuencia
surgen problemas que tienen que ver con Ia clasificacion, el diagnostico, pronostico y el
ana.Jisis de datos . Por ejemplo, el pronostico de complicaciones postoperatorias de un
paciente, Ia determinacion de zonas perspectivas para alglin mineral, el diagnostico del
estado mental de un paciente, etc .. Esto ha creado una necesidad inmensa de desarrollar
metodos y tecnicas para ser utilizadas en el diseno de sistemas de
informacion
computarizado para el reconocimiento de patrones.
No obstante que el desarrollo y creacion de
los metodos y
tecnicas de
reconocimiento de patrones surgieron por Ia necesidad de resolver los problemas
las
planteados anteriormente,
caracteristicas mas importantes que presentan los problemas, ya que imponen una serie de
restricciones que provocan que el problema se tenga que ajustar a Ia tecnica y no de
manera contraria, es decir, que Ia tecnica se ajuste a las propiedades del problema.
Ia mayoria de dichos metodos no cumplen con
",";;~,~~' ·:~;;~ ~ ~·~·,; l ,,
-~- E C A
L'-. -.~- .. --
-" Lh JciiJA ELEC rRICA
-· . . C-'
lntroducciOn
Uno de los factores mas importantes que se presentan es que, ergeneral , los
problemas no son representables en espacios metricos , ya que involucran diferentes tipos
de variables, desde las que denotan Ia presencia o ausencia de alguna propiedad, como es
el caso del sexo, las que solo pueden tomar k diferentes valores , hasta aquellas cuya
descripcion es lingiiistica y subjetiva; como son los casos del dolor y el olor, que estan en
dependencia de Ia persona que las describe. Sin embargo, muchos metodos consideran que
todas las variables toman valores en el conjunto de los numeros reales y a partir de ahi se
incorporan al problema todas las propiedades de estos numeros y se hallan normas y
distancias; o aquellos modelos en donde se codifica Ia informacion, es decir, que cada
variable se convierte en una propiedad que se cumple o no se cumple y entonces se hace
uso de Ia logica bivalente y de todas sus propiedades.
Otra de las caracteristicas que tambien aparece con frecuencia , es que no siempre
se tiene Ia informacion completa, es decir, que hay propiedades que no han sido
determinadas ya sea porque es imposible hacerlo o porque resulte muy costoso; como por
ejemplo, en el caso de Ia geologia, que para conocer Ia perspectividad en una zona de un
cierto mineral, se deben tomar en cuenta una serie de manifestaciones indirectas del
mineral que se encuentra en Ia tierra, como pueden ser el campo magnetico, algunas
manifestaciones geoquimicas, ciertas propiedades geomorfologicas, etc .. Pero algunas
veces estas medidas no se pueden obtener, como es el caso del campo magnetico en una
zona pantanosa, por ejemplo. Sin embargo, muchos metodos no consideran Ia posibilidad
de ausencia de informacion y cuando esta se presenta en los problemas reales se hace uso
de Ia estadistica para estimarla, lo cual nos podria llevar a falsear Ia informacion, ya que
para estimar Ia informacion se parte de una serie de presupuestos que en muchas
ocasiones no se cumplen en los problemas reales, por ejemplo, considerar que los datos
faltantes siguen una distribucion normal.
Ademas existen problemas en los cuales las clases no siempre son disjuntas , como
por ejemplo en el caso del diagnostico medico en el cual un paciente puede presentar una
serie de sintomas y signos que correspondan a mas de una enfermedad a! mismo tiempo,
contrario a Ia prospeccion geologica, donde se puede determinar si
una zona es
perspectiva o no, pero es evidente que no puede ser ambas cosas a Ia vez. Asimismo, hay
problemas donde las clases se vuelven imprecisas, de modo que no siempre un
especialista puede con toda certeza afirmar si un objeto pertenece a una cierta clase, sino
que valora de alguna manera cierto grado de certidumbre para su afinnacion. Pero muchos
de los metodos desarrollados hasta ahora consideran unicamente Ia posibilidad de clases
no disjuntas.
CtNTRO 0:0
ES "T t.OiflS .
1:~\' F Sfi CA Ci m! Y I'IE
- ... z DO S DEL
E.
iN (i::
r.·o
: ' ~
k
~ . 1 •
-,-::::: C A
~ :_ f:,J rrdCA
lntroducciOn
Considerando las lirnitantes que presentan Ia mayoria de los modelos que se
utilizan en Ia soluci6n de los problemas reales, nos damos cuenta que aun cuando en los
ultimos aiios el Reconocimiento de Patrones ha tenido un gran auge en el desarrollo de
metodos y tecnicas, sigue existiendo Ia necesidad de crear, buscar o extender modelos que
se ajusten de una manera mas adecuada a las caracteristicas del problema y no de manera
contraria, como se ha venido realizando hist6ricamente.
Por tanto, uno de los objetivos y motivaciones de este trabajo es fundamentalmente
Ia necesidad de resolver de una manera mas apropiada los problemas que hemos
mencionado a lo largo de este epigrafe, elaborando un algoritmo de analisis de datos y
clasificaci6n que se ajuste de una mejor manera a las caracteristicas de los problemas
reales , es decir, que considere que las variables que describen a los objetos pueden ser de
cualquier tipo: numericas , bivalentes e incluso difusas ; que pueda trabajar con ausencia de
informacion en las descripciones de los objetos y que tome en cuenta que los objetos
pueden pertenecer a mas de una clase e incluso, que puedan pertenecer a todas las clases
con cierto grado de certidumbre, i.e, que las clases en que se divide nuestro problema no
necesariamente tengan que ser disjuntas. La implantaci6n computacional del algoritmo
constituye el otto objetivo del trabajo, y para el desarrollo de este nos apoyaremos en las
ideas basicas de un algoritmo de clasificaci6n y analisis de datos que se presenta en un
trabajo previa de Diordenko L. y Vaskovskii B.[ 1].
El presente trabajo esta constituido por tres capitulos. En el capitulo I haremos una
breve descripci6n de lo que es el analisis de datos y de su importancia en algunas areas de
Ia investigaci6n. Describiremos el algoritmo de analisis de datos propuesto por Diordenko
L. y Vaskosvskii B. [!], asi como los primeros resultados obtenidos , los cuales se
presentan en el trabajo de Vega L. [2], mencionando las limitantes que presentan los
rnismos . El capitulo 2 estara dedicado a Ia exposici6n de un nuevo algoritmo de
clasificaci6n y analisis de datos multivariado, basado en las ideas principales de los
Comentarios de: Tesis: Leticia Vega - DESARROLLO DE UN ALGORJTMO PARA EL ANALISIS DE DATOS Y CLASIFICACION TIPO TIPICIDAD Y CONTRASTE (0)
No hay comentarios