1.067 visualizaciones desde el 19 de Abril del 2017
467,8 KB
17 paginas
Creado hace 10a (18/11/2014)
Fundamentos y Aplicaciones Prácticas
del Descubrimiento de Conocimiento
en Bases de Datos
- Sesión 1 -
Juan Alfonso Lara Torralbo
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
1
Índice de contenidos
• Presentación del docente
• Presentación de los estudiantes
• Guía docente
• Actividad. Evaluación inicial
• El proceso de KDD
• Visión de conjunto
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
2
Presentación del docente
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
3
Presentación de los
estudiantes
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
4
Guía docente
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
5
Actividad – Evaluación inicial
• Trabajo en grupo, sin Internet, para intentar definir los
siguientes términos:
• Data Mining
• Proceso de KDD (Knowledge Discovery in Databases)
• Data Warehouse
• Clustering
• Árbol de decisión
• Atípico
• Big Data, Open Data, Linked Data
Puesta en común
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
6
El proceso de KDD (I)
• Knowledge Discovery in Databases
• Proceso extracción automatizada de
conocimiento a partir de grandes
volúmenes de datos
• Es un término más general que Data
Mining
• Entonces, ¿por qué “nos suena” más Data
Mining que KDD?
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
7
El proceso de KDD (II)
• ¿Cualquier tipo de conocimiento?
• NO.
• Características:
• No trivial
• Implícito
• Previamente desconocido
• Útil
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
8
El proceso de KDD (III)
• Se encuentra oculto en los datos.
• De nada sirve extraer conocimiento que carezca de importancia.
• El conocimiento extraído deber servir para algo, de lo contrario no
tiene ningún sentido invertir esfuerzos en extraerlo
• Nada nuevo se aporta si el conocimiento extraído ya había sido
descubierto anteriormente.
• ¿Con qué características se relaciona cada definición anterior?
• No trivial
Implícito
•
• Previamente desconocido
• Útil
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
9
El proceso de KDD (IV) - Fases
1.Recopilación de datos.
2.Selección, limpieza y transformación
de Datos.
3.Data Mining.
4.Interpretación y evaluación de
modelos.
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
10
El proceso de KDD (V) - Fases
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
11
El proceso de KDD (VI) - Fases
• Naturaleza secuencial e iterativa
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
12
El proceso de KDD (VII) - Fases
• Recopilación de Datos
• DW no sólo usado para DM.
También para DSS, OLAP,
Reporting
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
13
El proceso de KDD (VIII) - Fases
• Selección, limpieza y transformación
•
•
•
¿Qué datos necesito?
¿Hay algo extraño en ellos que tenga que ser
reparado?
¿El formato se adapta a lo que exigen los
algoritmos posteriores?
14
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
El proceso de KDD (IX) - Fases
• DATA MINING
•
¿Por qué se generaliza el término?
• Tareas predictivas predecir el valor
desconocido de uno o varios atributos.
• Tareas descriptivas modelos que, de alguna
15
forma, describen los datos.
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
El proceso de KDD (X) - Fases
•
Interpretación y evaluación
• ¿Valen todos los modelos?
• NO Deben ser Precisos,
interesantes, comprensibles, …
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
16
Visión de conjunto
• Data Mining: etapa de un proceso más general
• KDD: Proceso general de extracción de
conocimiento
• Compuesto por fases
• En cada fase se aplican técnicas
• En la fase de DM se aplican técnicas para
resolver tipos de problemas tareas
• El resultado de resolver una tarea es un modelo
de data mining
2014 Juan Alfonso Lara Torralbo. Todos los derechos reservados.
17
Links de descarga
http://lwp-l.com/pdf3116
Comentarios de: Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 1 (0)
Comentarios de: Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 1 (0)
No hay comentarios