Publicado el 26 de Junio del 2017
1.097 visualizaciones desde el 26 de Junio del 2017
2,3 MB
290 paginas
Creado hace 17a (09/10/2007)
Ramón Alberto Carrasco González
Granada, Junio de 2003
UNIVERSIDAD DE GRANADA
E.T.S. INGENIERÍA INFORMÁTICA
Departamento de
Ciencias de la Computación
e Inteligencia Artificial
TESIS DOCTORAL
memoria que presenta
Ramón Alberto Carrasco González
para optar al grado de
Doctor en Informática
Junio de 2003
Finalmente leída el 29 Septiembre de 2003 obteniendo la calificación de
Sobresaliente-Cum Laude por unanimidad
Lenguajes e Interfaces de Alto Nivel
para Data Mining
con Aplicación Práctica a Entornos Financieros
DIRECTORA
María Amparo Vila Miranda
DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN
E INTELIGENCIA ARTIFICIAL
E.T.S. INGENIERÍA INFORMÁTICA UNIVERSIDAD DE GRANADA
La memoria titulada “Lenguajes e Interfaces de Alto Nivel para Data Mining con
Aplicación Práctica a Entornos Financieros”, que presenta D. Ramón Alberto Carrasco
González para optar al grado de Doctor, ha sido realizada en el Departamento de Ciencias
de la Computación e Inteligencia Artificial de la Universidad de Granada bajo la dirección
de la Doctora María Amparo Vila Miranda.
Granada, junio de 2003.
El Director
El Doctorando
Fdo. Ramón Alberto Carrasco González
Fdo. María Amparo Vila Miranda
Agradecimientos y dedicatorias
Desde estas líneas quiero agradecer a la directora de este trabajo María Amparo Vila la
confianza en mí depositada y su apoyo constante. A los miembros del grupo de investigación
Idbis, especialmente a José Galindo por la infinita colaboración prestada. Al matemático Jesús
Salvador Álvarez por la ayuda en algunas formulaciones, aunque por otro lado sea un bayesiano
recalcitrante. Al experto informático-bursátil Antonio Caba por su gran ayuda en la aplicación
del análisis técnico bursátil. A Ignacio Requena por su ayuda con la aplicación de Redes
Neuronales Artificiales. Al Gobierno Español y la Caja General de Ahorros por su
colaboración en los proyectos de investigación TIC-1997-0931 (Diseño de una Herramienta
para la Explotación de Bases de Datos, basada en Técnicas de Computación Flexible), TIC-
2001-3321-C03-01 (Knowledge-based Intelligent Miner, un Sistema Inteligente para la Minería de
Datos), y CICYT TIC-2002-04021-C02-02 (Fuzzy Knowledge-based Intelligent Miner, un Sistema
Inteligente Difuso para la Minería de Datos).
Quiero dedicar este trabajo a toda mi familia en el sentido amplio, y en el sentido
menos amplio a Álvaro y Darío a los que pido disculpas por tantas tardes de “consola” (yo de
ordenador y ellos de “con-sola” mente mi presencia “virtual”). Por último mi dedicación más
especial es para María de los Ángeles que además de ser mi esposa he tenido la suerte de que es
un gran documentalista.
ÍNDICES
Índice General
CAPÍTULO 1
CAPÍTULO 2
2.1
2.1.1
2.1.1.4
2.2
2.2.3.1
2.2.3.1.1
2.2.3.1.2
2.1.1.1
2.1.1.2
2.1.1.3
INTRODUCCIÓN ........................................................................................................ 11
DATA MINING EN BASES DE DATOS RELACIONALES................................... 17
DATA MINING COMO ÁREA INDEPENDIENTE .................................................................................. 18
Técnicas de Data Mining.......................................................................................................... 20
Extracción de reglas de asociación................................................................................................. 20
Generalización de datos a nivel múltiple, resumen y caracterización............................................. 21
Clustering....................................................................................................................................... 21
2.1.1.3.1 Métodos particionales ............................................................................................................... 24
2.1.1.3.2 Métodos jerárquicos.................................................................................................................. 25
2.1.1.3.3 Métodos basados en densidad................................................................................................... 25
2.1.1.3.4 Métodos basados en rejillas (grid) ............................................................................................ 26
Clasificación................................................................................................................................... 26
APLICACIONES PRÁCTICAS DE DATA MINING: UNA VISIÓN EMPRESARIAL ..................................... 28
Requerimientos y problemas en aplicaciones prácticas ........................................................... 28
2.2.1
2.2.2 Un marco adecuado para Data Mining: Data Warehouse....................................................... 29
2.2.3
Aplicaciones representativas relacionadas con el sector financiero........................................ 30
Marketing....................................................................................................................................... 30
Identificación de los mejores segmentos de mercado con “Nuggets” ....................................... 30
Segmentación de clientes en entidades financieras realizadas con “DataEngine” .................... 31
Estudio de características de usuarios de tarjetas en distintos puntos de venta por “Ultragem©”.. 32
Neovista© ...................................................................................................................................... 33
Inversiones financieras................................................................................................................... 35
Detección de fraude........................................................................................................................ 35
MODELOS RELACIONALES DE BASES DE DATOS PARA EL
2.2.3.2
2.2.3.3
2.2.3.4
2.2.3.5
CAPÍTULO 3
TRATAMIENTO DE LA INFORMACIÓN IMPRECISA........................................................................ 37
MODELO RELACIONAL CLÁSICO..................................................................................................... 39
Estructura e integridad de los datos......................................................................................... 39
3.1.1
3.1.2 Manipulación de los datos........................................................................................................ 40
Álgebra Relacional......................................................................................................................... 40
Cálculo Relacional ......................................................................................................................... 41
TEORÍA DE CONJUNTOS DIFUSOS ................................................................................................... 44
3.2.1 Conjuntos Difusos..................................................................................................................... 45
3.2.2 Conceptos sobre Conjuntos Difusos......................................................................................... 47
3.2.3 Operaciones sobre Conjuntos Difusos ..................................................................................... 49
Unión e intersección....................................................................................................................... 50
Complemento o negación............................................................................................................... 54
3.2.4 Números difusos ....................................................................................................................... 54
El principio de extensión (Extension Principle)............................................................................. 56
Aritmética difusa............................................................................................................................ 57
Teoría de la Posibilidad ........................................................................................................... 58
MODELO RELACIONAL DIFUSO ....................................................................................................... 59
Aproximaciones que no emplean la Lógica Difusa .................................................................. 59
Aproximación de Codd .................................................................................................................. 59
Otras aproximaciones..................................................................................................................... 59
3.3.2 Modelo básico de bases de datos.............................................................................................. 60
3.3.3 Modelo de Buckles y Petry ....................................................................................................... 60
3.3.4 Modelo de Prade y Testemale................................................................................................... 61
3.3.5 Modelo de Umano y Fukami..................................................................................................... 61
3.3.6 Modelo de Zemankova y Kaendel............................................................................................. 62
3.2.3.1
3.2.3.2
3.2.4.1
3.2.4.2
3.3
3.2.5
3.3.1
3.1
3.2
3.1.2.1
3.1.2.2
3.3.1.1
3.3.1.2
LENGUAJES E INTERFACES DE ALTO NIVEL PARA DATA MINING CON APLICACIÓN PRÁCTICA A ENTORNOS FINANCIEROS
1
ÍNDICES
3.4.2
3.4.3
3.4.4
3.4
3.4.1
4.2.1
4.2.1.1
4.2.1.2
4.2.1.2.1
3.3.7.1
3.3.7.2
3.4.1.1
3.4.1.2
ADAPTACIÓN DE FIRST AL MODELO GENERALIZADO P
Comentarios de: Lenguajes e Interfaces de Alto Nivel para Data Mining con Aplicación Práctica a Entornos Financieros (0)
No hay comentarios