Publicado el 11 de Julio del 2017
1.322 visualizaciones desde el 11 de Julio del 2017
1,6 MB
24 paginas
Creado hace 14a (29/03/2011)
Técnicas de inteligencia artificial
Visión Artificial
Reconocimiento de objetos
Indice
Introducción
Reconocimiento mediante características
PCA
Introducción
El reconocimiento de objetos consiste en, dado
algún conocimiento (forma, apariencia, etc.) sobre
uno o varios objetos y una imagen, encontrar qué
objetos están en la imagen y dónde
El reconocimiento es un proceso difícil debido a:
•Presencia de otros objetos no modelados
•Cambio de iluminación
•Cambio de punto de vista del objeto
•Oclusión
•Escala
Ejemplos: reconociento facial
Ampliamente extendido: cámaras, Picasa
http://www.youtube.com/watch?v=ryMR8-9RQpw&feature=related
Se suele reconocer una posible posición en la
imagen para una cara (mediante color de la piel,
identificación de los ojos, etc.) y luego se reconoce la
persona (con técnicas de aprendizaje)
Reconocimiento con características
Imaginemos que tenemos una imagen de un objeto
a reconocer (modelo)
Extraemos, por ejemplo, las características SIFT de
dicha imagen. El objeto ahora es representado por
sus características SIFT
Ahora tenemos una nueva imagen (escena) donde
queremos “buscar” ese objeto
Extraemos los SIFT de esta nueva imagen
Encontramos las correspondencias entre las
características del modelo y de la imagen
euclídea del descriptor
Para cada característica del modelo:
Reconoc. Características: emparejamiento
Esto se puede hacer calculando la distancia
Encontramos la característica de la escena cuya
distancia euclídea esté por debajo de un cierto
umbral
Ahora tenemos una correspondencia entre los
descriptores del modelo y de la escena
Reconocimiento características: transformación
Ahora debemos encontrar la transformación entre
el modelo y la escena
Para simplificar, vamos a ver cómo se puede
obtener la transformación 2D-2D afín:
donde las variables m son los parámetros de
rotación y escala y los t son los de traslación
Reconocimiento características: transformación
Tenemos un sistema de varias ecuaciones con varias
incógnitas, reescribimos la ecuación de arriba
Cada emparejamiento introduce dos nuevas filas a
la primera y última matriz. Nombramos las
matrices como:
Reconocimiento características: transformación
Tenemos un sistema de varias ecuaciones con varias
incógnitas, reescribimos la ecuación de arriba
Cada emparejamiento introduce dos nuevas filas a
la primera y última matriz. Nombramos las
matrices como:
Reconocimiento características: transformación
Resolvemos el sistema anterior mediante mínimos
cuadrados
Consiste en encontrar la matriz x que minimiza el error
cuadrático medio entre todos los emparejamientos
Se resuelve este sistema:
Reconocimiento mediante PCA
PCA (Principal Components Analysis): análisis de
componentes principales
Reduce la dimensionalidad de los datos de entrada
Proyecta los datos de entrada en un subespacio
Este subespacio está creado a partir de los
autovectores de la matriz de covarianza de los datos
de entrada
¿En qué consiste?
PCA
Tenemos un conjunto de entrenamiento: (para el caso de
imágenes, hacemos la imagen como un vector de una
dimensión)
Cada elemento es un vector:
Calculamos la media de todo el conjunto de entrenamiento
Centramos el conjunto de entrenamiento en el origen
restándole la media a cada elemento
Entrenamiento
Construimos una BD de imágenes intentando tener
la máxima variabilidad y que el fondo no nos afecte
PCA
Construimos una matriz donde cada columna es un
elemento del conjunto de entrenamiento:
Calculamos la matriz de covarianza: (matriz NxN, se
obtiene el mismo resultado con XTX, matriz PxP, que suele
ser de menor tamaño)
La matriz de covarianza Q tiene P autovalores con sus
correspondientes autovectores (pueden ser calculados
mediante la descomposición SVD (Singular Value
Decomposition))
PCA
Los autovalores y autovectores crean un nuevo
espacio (autoespacio, eigenspace)
Cada elemento de entrada (imagen) se puede
escribir en función de dichos autovectores (los
elementos e son los autovectores y g son las
coordenadas del elemento en el nuevo espacio):
Valores medios y autovectores
El resultado será una imagen media y las
correspondientes imágenes para de cada
autovector. Aquí se muestran ordenadas por su
autovalor asociado
PCA
Resumen del método:
Calculamos imagen media
Se resta la media a cada imagen
Se construye la matriz de covarianza
Se calculan los autovalores y autovectores de dicha
La clave de este método es que solo los mayores
autovalores son importantes, es decir, podemos
eliminar la información de los autovalores más
pequeños
matriz
PCA
Antes teníamos lo siguiente:
Ahora, si tomamos solo los primero k autovalores y
autovectores
PCA
Para calcular las coordenadas de una imagen en el
nuevo espacio
Reconocimiento
Primero calculamos las coordenadas de todas las
imágenes de entrenamiento en el nuevo espacio
Dependiendo de la aplicación, el proceso de
reconocimiento puede variar
Dada una nueva imagen, calculamos sus
coordenadas en el nuevo espacio
Si se trata de varios objetos o clases distintas,
encontramos a qué elemento (o cluster) del
conjunto de entrenamiento se parece más (está
más cerca)
Reconocimiento de caras
Aplicación: reconocimiento de gestos
Objetivo: reconocer gestos
Reconocen gestos con PCA y utilizan un
autómata de estados finitos para reconocer el
gesto
Autovectores de todo el conjunto
Comentarios de: Técnicas de inteligencia artificial - Visión Artificial - Reconocimiento de objetos (0)
No hay comentarios