Publicado el 20 de Julio del 2017
646 visualizaciones desde el 20 de Julio del 2017
26,3 KB
10 paginas
Creado hace 22a (02/09/2002)
CapÃtulo 6
Evaluación de algoritmos
La evaluación de los algoritmos propuestos en el capÃtulo 2 (Soundex, Similarex,
Clases de Caracteres), se realizó en base a las caracterÃsticas del texto previamente
reconocido con OCR. De ahà que se utilizaran algoritmos que trabajaran bajo este contexto,
en donde la información presentarÃa cierto grado de error, para el cual era necesario
establecer criterios y parámetros de evaluación, aspecto al cual se dedica este capÃtulo.
El material utilizado como indicamos en capÃtulos anteriores, fue material
bibliográfico perteneciente al acervo franciscano, colección que está constituida por libros
que datan aproximadamente del siglo XVI a XIX y cuyas caracterÃsticas iban a propiciar la
existencia de errores en cuanto al reconocimiento de caracteres se refiere.
Como muestra se tomaron 6 libros de esta colección, de los cuales se digitalizaron
aproximadamente 25 páginas por unidad(libro). El tamaño de dicha muestra pudiera
parecer pequeño, sin embargo, fue suficiente para definir la eficiencia de cada algoritmo, ya
que estos trabajan a nivel de error en la información, no a nivel de volumen o cantidad,
debido a sus caracterÃsticas.
A su vez, se analizó el texto generado por OCRde cada página para obtener una lista
de palabras (150) que presentaban errores por reconocimiento y que nos permitirÃan realizar
las pruebas de estos algoritmos. También fue necesario corregir cada una de las páginas de
la muestra para asà poder calcular el número de ocurrencias reales de este conjunto de
palabras en la misma, valor que nos servirÃa posteriormente para el cálculo de los
porcentajes de precisión del apartado 6.1.
6.1 Parámetros de evaluación
Para
poderdeterminar
la
eficiencia
de
dichosalgoritmos,fue
necesario
establecerciertos parámetros de evaluación. En este caso nuestro parámetro fue la precisión,
que es la exactitud en la localización y recuperación del texto buscado en la información
existente.
Debido a la escasez en la información con respecto a estos algoritmos, no fue posible
localizar parámetros de evaluación preestablecidos por lo cual se proponen los siguientes.
-porcentaje de información correcta recuperada
-porcentaje de información relevante en resultados
-promedio general.
6.1.1 Porcentaje de información correcta recuperada
Por porcentaje de información correcta recuperada nos referimos a que parte del
total de ocurrencias existentes de una palabra en la muestra fueron obtenidas por el
algoritmo.
Para calcular este porcentaje tomamos como referencia el número de ocurrencias
correctas localizadas por el algoritmoy lo dividimos entre el numero total de ocurrencias
reales existentes en la muestra.
De esta manera tenemos que:
PICR = OCLX100
NTOR
donde:
PICR: porcentaje de información correcta recuperada
OCL: ocurrencias correctas localizadas por algoritmo
NTOR: número total de ocurrencias reales
Ejemplo:
Palabra buscada:
puntos
Ubicación real:
libro 1 página 5
libro 3 página 163
libro 4 página 145
Tabla 6.1 Ejemplo de ocurrencias recuperadas poralgoritmo
Palabra encontrada
Libro en la que se encontró
libro 4
libro 1
libro 1
libro 3
Número de página
145
201
5
144
puntos
apunto
puntos
punto
En este ejemplo la información correcta recuperada serán solamente las ocurrencias
que correspondan exactamente a la palabra puntos (Tabla 6.1), asà nuestro PICR para el
mismo queda de la siguiente manera:
OCL = 2
NTOR = 3
Por lo tantoPICR = (2/3) * 100 =66.66%.
Esto significarÃa que de 100 ocurrencias reales que existan de una palabra en el
acervo, este algoritmo nos estarÃa encontrando solamente 66 .
6.1.2 Porcentaje de información relevante en resultados
Entiéndase por información relevante aquella que presenta una correspondencia
exacta con la palabra buscada con respecto al total de la información recuperada por el
algoritmo. Para calcular este porcentajese consideró el número de ocurrencias
correctamente localizadas por el algoritmo, dividido entre el número total de ocurrencias
recuperadas por el mismo,asÃ:
PIR = OCL X100
NTO
Donde:
PIR: porcentaje de información relevante
NTO: número total de ocurrencias recuperadas en la búsqueda.
OCL: ocurrencias correctas localizadas por algoritmo
Continuando con el ejemplo de la sección6.1.1la información relevante se refiere
alas ocurrencias que correspondan exactamente a la palabra puntos (Tabla 6.1). De esta
manera el PIR serÃa:
OCL = 2
NTO = 4
Por lo tanto PIR = (2/4) * 100 = 50%
Este resultado implicarÃa entonces que de 100 ocurrencias devueltas por la
búsqueda, solamente 50 corresponde exactamente a la palabra buscada.
6.1.3 Promedio general
Debido a que el porcentaje deinformación recuperada representa qué tanto de la
información existente en la muestra se va a recuperar, y a que el porcentaje de información
relevante nos dice de los resultados obtenidos por el algoritmo qué porcentaje corresponde
a la búsqueda original, ambos se encuentran ligados debido a que un algoritmo que obtenga
un porcentaje alto de información recuperada, pero un bajo porcentaje de información
relevante no resulta práctico, ya que aunque se localice la mayor parte de la información
existente, esta se encontrarÃa dentro de una gran cantidad de información incorrecta, por
ejemplo, si un algoritmo obtiene un porcentaje de información recuperada de 100% y un
porcentaje de información relevante recuperada de 10%significarÃa que de 100 ocurrencias
existentes de una palabra se recuperarÃan las 100,pero habrÃa 900 ocurrencias incorrectas
más,por lo que la eficiencia general del algoritmo no seria muy buena. En base a lo anterior
se promediaran ambos porcentajes para obtener un porcentaje general de eficiencia.
6.2MetodologÃa de evaluación
Para poder evaluar los parámetros anteriormente mencionados necesitábamos
establecer una metodologÃa acorde a la naturaleza de loserrores en la información
almacenada, por lo cual se estimó necesario realizar las pruebas en base a los siguientes
criterios
•
•
•
ubicación del error en una palabra
longitud de palabra buscada
localización de palabra con error especÃfico
6.2.1 Ubicación del error en una palabra
Uno de los criterios de evaluación establecidos se refiere a la ubicación que presenta
el error dentro de una palabra.
Para esto fue necesario realizar un análisis del texto reconocido para obtener
palabras claves que sirvieran para las pruebas en la búsqueda de información. Dichas
palabras se eligieron y clasificaron en las siguientes categorÃas:
•
•
•
palabras que presentaron errores al inicio
palabras que tuvieron errores en su punto medio
palabras que presentaron errores al final
Entiéndase como error al inicio de una palabra cuando este se ubica dentro de su
primera sÃlaba. Un error al final por lo tanto corresponderá al que se ubica en la última
sÃlaba. Por último el error en el punto medio es el que no se encuentra en ninguno de los
dos casos anteriores.
Este criterio se consideró importante debido aque es muy probable que una palabra
que tenga error al inicio sea más difÃcil de localizar por la forma de codificación de los
algoritmos.
6.2.2 Longitud de palabras buscadas
Para poder efectuar la prueba en base al tamaño de una palabra respecto a su
longitud, fue necesario primeramente establecer el número mÃnimo y máximo permisible en
la longitud de una cadena. Esto con la finalidad de aislar aquellaspalabras que no tuvieran
relevancia en la búsqueda,asà como de considerar la mayor cantidad de palabras existentes
en nuestro lenguaje, para lo cual se generó la siguiente tabla.
Tabla 6.2 Longitud de palabra establecidos
Longitud de palabra
5
6
7
8
9
10
11
Debido a que una palabra de longitud pequeña puede presentar una probabilidad
mayor de pérdida de información en comparación con una de tamañomás grande por la
confusión durante el reconocimiento, seconsideró importante basar parte de las pruebas en
este criterio
6.2.3 Localización de palabra con error especÃfico
Para esta prueba se seleccionaron palabras del
texto
reconocido que
presentabanerror en más de una sÃlaba. A diferencia de las dos evaluaciones anteriores, en
esta sólo se tomó en cuenta si se encontraba o no la palabraen la ubicación original de
donde se seleccionó, no tomando en cuenta cualquier otra ocurrencia de la misma dentro
del acervo.
Finalmente, las pruebas se realizaron empleando el software desarrollado y la base
de datos que contenÃa la información de los libros utilizados,que consistieron básicamente
en la búsqueda de información a nivel de contenido.
En la siguiente sección se mostrarán los resultados de esta evaluación asà como las
conclusiones obtenidas de la misma.
6.3 Evaluación de los algoritmos propuestos
En base a las pruebasy parámetros establecidos en los apartados anteriores, se llegó
a los resultados que se describirán a continuación. Los parámetros de evaluación PICR,
PIR,sobre los cuales se obtuvieron los promedios generales mostrados en las Tablas 6.3 y
6.4 se muestran en el Apéndice B.
6.3.1 Resultados de pruebas por longitud de palabra buscada
En estos resultado
Comentarios de: CapÃtulo 6 Evaluación de algoritmos (0)
No hay comentarios