PDF de programación - Data Warehouse y Data Mining Aplicados al Estudio del Rendimiento Académico

Imágen de pdf Data Warehouse y Data Mining Aplicados al Estudio del Rendimiento Académico

Data Warehouse y Data Mining Aplicados al Estudio del Rendimiento Académicográfica de visualizaciones

Publicado el 10 de Mayo del 2017
848 visualizaciones desde el 10 de Mayo del 2017
1.006,7 KB
6 paginas
Creado hace 15a (31/10/2009)
Data Warehouse y Data Mining Aplicados al Estudio del

Rendimiento AcadØmico

D. L. LA RED MARTINEZ, J. C. ACOSTA, L. A. CUTRO

V. E. URIBE, A. R. RAMBO

Dpto. InformÆtica. FACENA. Univ. Nac. del Nordeste

(3400) Corrientes. Argentina

E-mail: [email protected]

31 de octubre de 2009

ABSTRACT

lneas futuras de accin, los reconocimientos y las refe-
rencias.

En la Sociedad de la Informacin y el Conocimiento
(SIC) es imprescindible la aplicacin de tØcnicas de Al-
macenes de Datos (Data Warehouses: DW) y de Minera
de Datos (Data Mining: DM) basadas en clustering, en-
tre otras, para la bœsqueda de perles de los alumnos de
la Asignatura Sistemas Operativos (SO) de la FACENA
de la UNNE segœn su rendimiento acadØmico, situacin
demogrÆca y socio econmica, con el propsito de de-
terminar a priori situaciones potenciales de Øxito o de
fracaso acadØmico, lo cual permitira encarar las me-
didas tendientes a minimizar los fracasos. El presente
trabajo tiene por objetivo brindar una breve descrip-
cin de aspectos relacionados con el almacØn de datos
construido y algunos procesos de minera de datos de-
sarrollados sobre el mismo.

Palabras Claves: Base de Datos, AlmacØn de Datos,
Minera de Datos, Clustering, Cluster DemogrÆco.

1 INTRODUCCIN

En el contexto de la SIC (Joyanes Aguilar, 1997), (Bo-
laæos Calvo, 2001), (Taquini, 2001), (Peir, 2001) y a
los efectos de la determinacin de los perles carac-
tersticos de los alumnos de SO de la FACENA de la
UNNE, se ha construido un DW con informacin per-
sonal, acadØmica, demogrÆca y socio econmica de los
alumnos y de su nœcleo familiar, el cual se ha comenzado
a explorar con tØcnicas de DM, presentÆndose en este
trabajo algunos de los resultados obtenidos (aœn pre-
liminares y parciales). Este artculo se ha estructurado
de la siguiente manera: primeramente se plantearÆ el
objetivo principal del mismo, luego se harÆ una muy
breve revisin de los principales conceptos involucra-
dos en cuanto a DW y DM, seguidamente se indicarÆ
brevemente el software utilizado, para continuar con la
metodologa seguida y la presentacin de algunos resul-
tados obtenidos, para nalizar con las conclusiones y

2 OBJETIVO PRINCIPAL

El objetivo principal de este trabajo es encontrar per-
les de alumnos por medio de la aplicacin de tØcnicas
de DM a un DW con datos acadØmicos, socio econmi-
co y demogrÆco correspondientes a alumnos de SO de
la Licenciatura en Sistemas de Informacin (LSI) de la
FACENA de la UNNE.

3 REVISIN CONCEPTUAL

Un DW es una coleccin de datos orientado a temas, in-
tegrado, no volÆtil, de tiempo variante, que se usa para
el soporte del proceso de toma de decisiones gerenciales
(Kubski, 2005), (Cutro, 2008). Es tambiØn un conjun-
to de datos integrados orientados a una materia, que
varan con el tiempo, y que no son transitorios, los
cuales soportan el proceso de toma de decisiones de una
administracin (Inmon, 1992), (Inmon, 1996), (Simon,
1997), (Trujillo, Palomar & Gmez, 2000).

La DM es la etapa de descubrimiento en el proceso
de KDD (Knowledge Discovery from Databases), es
el paso consistente en el uso de algoritmos concretos
que generan una enumeracin de patrones a partir de
los datos preprocesados (Fayyad, Grinstein & Wierse,
2001), (Fayyad, Piatetskiy-Shapiro, Smith, & Ramasas-
my, 1996), (Han & Kamber, 2001), (Hand, Mannila &
Smyth, 2000).

Es tambiØn un mecanismo de explotacin, consistente
en la bœsqueda de informacin valiosa en grandes
volœmenes de datos. EstÆ muy ligada a los DW ya que
los mismos proporcionan la informacin histrica con la
cual los algoritmos de minera obtienen la informacin

necesaria para la toma de decisiones (GutiØrrez, 2001),
(IBM Software Group, 2003).

La DM es un conjunto de tØcnica de anÆlisis de datos
que permiten extraer patrones, tendencias y regulari-
dades para describir y comprender mejor los datos y
extraer patrones y tendencias para predecir compor-
tamientos futuros (Simon, 1997), (Berson & Smith,
1997), (Frawley, Piatetsky-Shapiro & Matheus, 1992),
(White, 2001).

En la gura 1 se muestra la arquitectura de un DW.

Figura 1: Arquitectura de un Data Warehouse.

4 SOFTWARE UTILIZADO

Se ha utilizado el IBM Data Warehouse Edition (DWE)
V.9.5, que incluye al DB2 Enterprise Server Edition
(DB2 ESE), al Design Studio (DS) y al Intelligent Miner
(IM).

En la gura 2 se muestra el Centro de Control del DB2
ESE.

Figura 2: Centro de Control del DB2 ESE.

En la gura 3 se presenta una pantalla del Design Stu-
dio.

5 METODOLOG˝A SEGUIDA

El presente estudio se realiz sobre datos obtenidos me-
diante encuestas realizadas al alumnado de SO, con-
siderando ademÆs los resultados de las distintas instan-
cias de evaluacin previstas durante el cursado de dicha

Figura 3: Pantalla del Design Studio.

asignatura. Se utiliz un entorno integrado de gestin
de bases de datos y data warehouse (DB2 versin 9.5),
obtenido de la empresa IBM mediante los Acuerdos
rmados entre dicha empresa y la UNNE; dicho en-
torno permite la extraccin de conocimiento en bases
de datos y DW mediante tØcnicas de DM como ser
clustering (o agrupamiento de datos) que consiste en
la particin de un conjunto de individuos en subcon-
juntos lo mÆs homogØneos posible, el objetivo es maxi-
mizar la similitud de los individuos del cluster y maxi-
mizar la diferencia entre clusters. El cluster demogrÆco
es un algoritmo desarrollado por IBM e implementado
en el IM, componente del DWE, entorno antes men-
cionado, que resuelve automÆticamente los problemas
de denicin de mØtricas de distancia / similitud, pro-
porcionando criterios para denir una segmentacin p-
tima (Grabmeier, & Rudolph, 1998), (Baragoin, Chan,
Gottschalk, Meyer, Pereira & Verhees, 2002), (Ballard,
Rollins, Ramos, Perkins, Hale, Dorneich, Cas Milner &
Chodagam, 2007), Ballard, Beaton, Chiou, Chodagam,
Lowry, Perkins, Phillips & Rollins, 2006).

Los pasos realizados durante el presente trabajo han
sido los siguientes:

Recoleccin de los datos.

Tratamiento y depuracin de los datos.

Preparacin de la base de datos y del DW co-
rrespondiente sobre la plataforma de trabajo se-
leccionada.

Seleccin de la tØcnica de minera de datos para la
realizacin del estudio (predominantemente clus-
tering).

Generacin de diferentes grÆcos para el estudio
de los resultados.

Estudio de los resultados obtenidos.

Obtencin de las conclusiones.

En esta etapa se trabaj con una porcin (Data Mart:
DM) del DW, cuya estructura se muestra en la gura
4.

6 RESULTADOS OBTENIDOS

Figura 4: Estructura del DM utilizado, parte del
DW.

Figura 5: Licenciatura en Sistemas de Informacin.

Se obtuvieron diferentes clasicaciones mediante la uti-
lizacin (preferentemente) de tØcnicas de clustering,
segœn diferentes criterios de agrupacin de los datos.

Se utiliz la siguiente equivalencia de nombres y signi-
cados de variables:

SIT_LABORAL_ALUM: Situacin laboral del
alumno.

IMP_EST_ALUM: Importancia dada al estudio
por el alumno.

RAZON_EST_ALUM: Razn para
segœn el alumno.

estudiar

IMP_TICS_ALUM: Importancia dada a las TICs
por el alumno.

NOTA_PP_ALUM: Nota primer parcial.

NOTA_RPP_ALUM: Nota recuperatorio primer
parcial.

NOTA_SP_ALUM: Nota segundo parcial.

NOTA_RSP_ALUM: Nota recuperatorio segun-
do parcial.

NOTA_EXT_ALUM: Nota recuperatorio extra-
ordinario.

SIT_FIN_ALUM: Situacin nal del alumno
luego del cursado.

Seguidamente se muestran algunos de los resultados
obtenidos.

Minera de Clasicacin segœn Carrera: guras 5, 6.

Miniera de Clasicacin segœn Situacin Final del
Alumno: guras 7, 8.

Se considera Libre al alumno que no ha cumplimentado
la aprobacin de los trabajos prÆcticos y de laborato-
rio, Regular a quien ha cumplimentado dichas exigen-
cias pero con un promedio inferior a 7 en la escala 0-10,

Figura 6: Licenciatura en Sistemas.

Figura 7: Situacin nal del alumno1.

Figura 8: Situacin nal del alumno - calidad del
modelo.

nalmente se considera Promocin a quien ha cumpli-
mentado las exigencias con un promedio igual o superior
a 7.

Minera de Clasicacin segœn Importancia Dada al Es-
tudio: guras 9, 10.

Figura 10: Importancia dada al estudio: calidad del
modelo.

Figura 9: Importancia dada al estudio - 1.

Minera de Clustering DemogrÆco segœn Situacin Fi-
nal del Alumno como variable principal: guras 11, 12,
13.

Minera de Clustering de Kohonen segœn Situacin Fi-
nal del Alumno como variable principal: guras 14, 15,
16.

7 CONCLUSIONES Y L˝NEAS FUTURAS

Se obtuvieron diversos modelos de minera de datos
referidos a diversos aspectos de los alumnos de la asig-
natura mencionada, lo que permiti descubrir el per-
l de dichos estudiantes, destacÆndose especialmente lo
siguiente:

Los libres son en su mayora solteros, y en menor
proporcin divorciados, los libres indican en mayor
porcentaje darle mÆs importancia al estudio que a
la diversin que los regulares y los promocionados.

Figura 11: Situacin nal del alumno: Libre.

Figura 12: Situacin nal del alumno:
  • Links de descarga
http://lwp-l.com/pdf3498

Comentarios de: Data Warehouse y Data Mining Aplicados al Estudio del Rendimiento Académico (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad