Actualizado el 12 de Septiembre del 2020 (Publicado el 14 de Enero del 2017)
783 visualizaciones desde el 14 de Enero del 2017
63,2 MB
67 paginas
Creado hace 12a (30/01/2013)
IS08;t . ;?;;
rt~l5·1fi??
QITRt IE IIICYEST I&A CIIII Y tt
ISTU!IIS <YANZ >e fl S IHL
I. P . N .
• IB L I OT EO A
•••r,E NIERIA ELECTR I C~
CENTRO DE INVESTIGACIONES Y DE ESTUDIOS A V ANZADOS
DEL INSTITUTO POLITECNICO NACIONAL
DEPARTAMENTO DE INGENIERiA ELECTRICA
SECCION DE COMPUT ACION
Metodo para el reconocimiento de objetos 3D
mediante el enfoque logico-combinatorio
del Reconocimiento de Patrones
Tesis que presenta
para obtener el grado de
Miguel Angel Norzagaray Cosio
Maestro en Ciencias CIN J EST AV
con especialidad Ingenieria Elect rica.
Trabajo dirigido por
I P N
AD OUI31CION
DE LI BROS
Dr. Jose Ruiz Shulcloper
Dr. Juan Humberto Sossa Azuela
CINVEST A V - CONACyT
MEXICO D. F., JULIO DE 1997
~tflTII& !lf !~HShHC! U Y li.
t STU~~~-;; ,l
• i .. , "' -e- $ S!l
·-~- i':-
~
X M
I ' E C H A • -
! < " ) " ' / }
r:~:::: :"B;:7~~l_:f·;;=.
I'ROCIID.~:&.».Li.:.Xi2:L~~
/ & - ) < -
········--
in dice
Agradeci mientos
Presentaci6n
Capitulo I
Vision por Computadora: trabajos recientes
Capitulo 2
Metodologia Propuesta
Capitulo 3
Metodologia Propuesta
Capitulo 4
Ejemplo de Aplicaci6n: Reconocimiento de Poliedros
Capitulo 5
Conclusiones y Perspectivas
Referencias
Cf..lltt I)[ :., n~l•!i•r ru .,. tu
ESTU!IItS AV.I~. • H)$ !,f[
I. P. 1\1 •
•
lli8 L IOTEC A
'~'~ENIE RlA ELECT RIC-'
17
27
37
53
56
Agradecimientos
Sin duda alguna son muchas las personas e instituciones a las que debo
agradecer, y pese a que no es dificil omitir a algunas por error, deseo correr el riesgo y
hacerlo
Primeramente deseo dar las gracias a Jose Ruiz Shulcloper y a Juan Humberto
Sossa Azuela, los directores de este trabajo, quienes me lo propusieron hace mas tiempo
que el que quisiera, confiando que lograriamos un buen resultado, maestros y amigos de
los que no solo aprendi en lo academico
Junto con ellos a mis compafieros del
seminario de Reconocimiento de Patrones, quienes con sus opiniones y criticas aportaron
valiosas ideas para Ia realizaci6n de esta tesis
Agradezco tambien a mis maestros y compafieros de Ia maestria, quienes
influyeron significativamente en mi y siempre fueron un impulso para concluir. Tambien
de Ia Secci6n de Computaci6n quiero agradecer al personal administrativo que me ayudo
y asesor6 durante estos afios. A Feliu Sagols debo agradecer su buena influencia al
haber sido mi asesor desde que llegue al CINVEST A V
A mis compafieros y amigos de Ia Escuela Superior de C6mputo, donde realice
gran parte del trabajo y en especial a Jose Madrid Flores y a Ruben Mercado Escutia,
por todas las razones que los tres sabemos muy bien
Mucho debo agradecer a mis padres y hermanos, a quienes extrafio mas de lo que
parece.
A Pedro porque se Ia debo y porque fue el que me meti6 en todo esto
Finalmente debo agradecer a CONACyT y a CINVEST A V, las instituciones que
hicieron posible que realizara mis estudios de posgrado
c;PTI!t eE n• n~l~s ··· :~w • 111.
U TU rt iU AVP<?•86S H<
I. p. !'L
.
lf.ilL IOT E CA
•··~r:NIE RI A ELECTRIC#
Presentacion
La vista es un sentido de gran utilidad. Una gran cantidad de las actividades humanas
estan basadas en el hecho de que Ia mayoria de las personas posee tal sentido. Por ejemplo,
muchos medios de comunicacion hacen uso de Ia vision para darnos informacion en forma
de anuncios televisados, luminosos, asi como seiialamientos de tninsito y otros. Por
supuesto, no hay que olvidar que el ingrediente auditivo enfatiza muchos de tales
comunicados y que en ocasiones el sonido es lo unico de que se dispone para establecer Ia
comunicacion. La radio es un ejemplo de esto ultimo.
Desde hace mucho tiempo se ha buscado que Ia mano de obra humana sea
remplazada por maquinas por tres razones principales. La primera es que el dar
mantenimiento a una maquina puede resultar mas barato que estarle pagando el sueldo a una
persona. La segunda es que una maquina no se cansa, en muchos casos es mas precisa y
trabaja mas rapido, es decir, su rendimiento es mayor. La tercera es para sustituir al ser
humano en labores riesgosas como Ia recoleccion de basura, instalacion de pozos petroleros
maritimos, manipulacion de materiales peligrosos y manejo de herramientas de alto riesgo.
Es claro que estas tres razones son muy poderosas y frecuentemente se les encuentran
juntas.
Sin embargo, el sustituir a una persona implica el sustituir todos lo recursos que
dicha persona utiliza para desempeiiar Ia labor de que se trate, como pueden ser Ia vista, el
tacto, oido, olfato, gusto, fuerza fisica y criterio para tomar decisiones en deterrninados
momentos. La fuerza puede ser sustituida de manera bastante ventajosa sin grandes
problemas, pero hay recursos en los que Ia sustitucion no es tan sencilla. La vista y el criterio
son dos de ellos. La vista es dificil porque sin saber como es que vemos queremos que las
maquinas lo hagan.
Gracias al desarrollo del mundo de Ia computacion, se dispone ahora de variadas y
efectivas herramientas para abordar el problema de dotar a las maquinas de capacidades
visuales, buscando reemplazar en cierta forma las funciones del ojo humano. Es asi como
nace Ia vision por computadora (VC).
La VC puede definirse como el proceso de tratamiento de seiiales que permite
extraer informacion de manera inteligente acerca del medio ambiente, en base a cierta
informacion sensorial. Para esto, Ia VC
tom a como entrada datos provenientes de sensores,
•
• procesa convenientemente dicha informacion por medio de ciertos metodos y
• produce como salida una representacion simbolica de los datos de entrada y sus
relaciones.
El problema ha sido abordado de diversas maneras y por su complejidad se ha visto
Ia necesidad de trabajar en dos grandes lineas: vision bidimensional (2D) y tridimensional
(3D). Ambas tienen una gran cantidad de aplicaciones y son de dificil solucion. En este
trabajo hemos decidido abordar el segundo pro~lema: Ia VC en 3D.
Es importante aclarar que esta tesis es Ia primera parte del proyecto "Sistema para el
Agrupamiento Perceptual de Imagenes por Metodos Conctptuales", Ref 211085-5-4490A,
patrocinado por el CONACyT a cargo del Dr. Juan Humberto Sossa Azuela, co-director de
esta tesis. El proyecto consiste en elaborar nuevas metodologias para resolver el problema
de Ia VC en 3D, haciendo uso del enfoque logico-combinatorio del Reconocimiento de
Patrones (RP), una herramienta que surgio hace tres decadas y que, pese a que el problema
de VC en 3D tiene una edad similar, no ha sido aplicada en ese marco.
El RP en su enfoque logico-combinatorio es una herramienta de modelacion
matematica cuidadosamente fundamentada y facilmente apegable a Ia realidad, por lo que no
se dudo en probarla en este importante problema, haciendo uso de Ia idea de que para
reconocer un objeto es necesario tener un concepto previo de el. Uno no sabra que algo es
un zapato si jamas a visto uno o si nunca le han dicho como son.
Lo que se propone en esta tesis es una metodologia de proposito general para
resolver el problema de vision en 3D a partir de multiples vistas. Basandose en Ia experiencia
de otros trabajos, se determino que era necesario abordar el problema de manera gradual,
considerando varias etapas.
En esta primera parte del proyecto se penso en suponer que las imagenes no poseen
ruido, que se trata de ver un solo objeto y que este completo, es decir, se tienen imagenes
sinteticas (lo cual no se tiene en Ia practica). Sin embargo, al final tambien se considero el
caso de Ia existencia de ruido. El problema de imagenes con varios objetos a Ia vez,
ocultandose unos con otros se considerara en otra etapa del proyecto. Ademas, daremos por
resuelto el problema de Ia extraccion de caracteristicas en imagenes, tales como los
contornos, vertices y caras, el cual tambien sera abordado en etapas posteriores.
Se pudiera pensar que tales restricciones son bastante fuertes, pero en Ia medida en
que el proyecto vaya obteniendo resultados y se vea que es posible pasar a las siguientes
etapas, dichas restricciones se iran eliminando. La importancia principal de esta tesis es el
presentar una nueva metodologia de proposito general para resolver problemas de vision en
3D, haciendo uso de herramientas matematicas que no han sido aplicadas en dicho
problema, asi como sentar las bases para soluciones posteriores mas apegadas a Ia realidad y
abrir las puertas para nuevas lineas de investigacion en el area de Reconocimiento de
Patrones.
Estructura de Ia tesis
Como primer capitulo se hace una revision de algunos de los trabajos mas
importantes del dominio publico en los ultimos aiios, de una manera critica, es decir, se
analiza, en Ia medida de lo posible, emil es el problema exacto que se abordo, o sea, que
restricciones se impusieron; se indican que metodologia se uso; de que herramientas
matematicas hace uso y cuales fueron sus resultados.
En el segundo capitulo se presenta Ia metodologia propuesta y como se llego a ese
ultimo refinamiento. En el tercer capitulo se exponen brevemente las herramientas de
Re
Comentarios de: Tesis: Miguel Norzagaray - Metodo para el reconocimiento de objetos 3D mediante el enfoque logico-combinatorio del Reconocimiento de Patrones (0)
No hay comentarios