Publicado el 18 de Julio del 2018
2.407 visualizaciones desde el 18 de Julio del 2018
1,5 MB
114 paginas
Creado hace 17a (27/11/2007)
Prácticas de Estadística en R
Ingeniería Técnica en Informática de Sistemas
Manuel Febrero Bande
Pedro Galeano San Miguel
Julio González Díaz
Beatriz Pateiro López
Prácticas de Estadística en R
Ingeniería Técnica en Informática de Sistemas
Manuel Febrero Bande
Pedro Galeano San Miguel
Julio González Díaz
Beatriz Pateiro López
Índice general
1. Introducción
1.1. ¿Qué puedes encontrar en este libro? . . . . . . . . . . . . . . . . . . . . .
1.2. Los conjuntos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
1
2. El software R
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.
2.2. Comandos y conceptos básicos
. . . . . . . . . . . . . . . . . . . . . . . .
2.3. Objetos y operaciones básicas . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1. Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.2. Arrays y matrices
. . . . . . . . . . . . . . . . . . . . . . . . . . .
3
3
4
5
5
7
2.4. Procedimientos gráficos
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.5. Programando en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.6. Librerías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Importando datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.7.
3. Un ejemplo para aprender R. El Hitori
17
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.1.
3.2. Práctica en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3. El código . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.3.1. Función para dibujar el tablero . . . . . . . . . . . . . . . . . . . . 18
3.3.2. Función principal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4. Ejercicios para practicar con R
21
4.1. Obteniendo ayuda en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.2. Directorio de trabajo (“workspace”)
. . . . . . . . . . . . . . . . . . . . . 22
4.3. Objetos y operaciones básicas . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.3.1. Operaciones con vectores
. . . . . . . . . . . . . . . . . . . . . . . 22
4.3.2. Arrays y matrices
. . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.3.3. Listas, data frames y factores . . . . . . . . . . . . . . . . . . . . . 25
4.4. Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.5. Programando en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.6. Ejercicios de exámenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
IV
ÍNDICE GENERAL
5. Estadística descriptiva
5.1.
5.2.
5.3. Tablas de frecuencia y gráficos para variables cualitativas
5.4. Tablas de frecuencia y gráficos para variables cuantitativas
37
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Importando datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
. . . . . . . . . 38
. . . . . . . . 40
5.4.1. Variables discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.4.2. Variables continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.5. Medidas de centralización, dispersión y forma . . . . . . . . . . . . . . . . 43
5.5.1. Gráficos basados en los cuartiles: el gráfico de caja . . . . . . . . . 45
. . . . . . . . . . . . . . . . . . . . . . . 46
5.6. Gráficos para multiples variables
6. Variables aleatorias
49
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
6.1.
. . . . . . . . . . . . . . . . . . . . . . . . . . . 50
6.2. Distribución de Bernoulli
6.3. Distribución binomial
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
6.4. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6.5. Distribución exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.6. Distribución gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
6.7. Distribución normal
6.8. Variables aleatorias bidimensionales
. . . . . . . . . . . . . . . . . . . . . 60
6.9. Teorema Central del Límite . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7. Transformaciones de variables aleatorias
65
7.1.
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2. Tipificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.3. Transformaciones de Box-Cox . . . . . . . . . . . . . . . . . . . . . . . . . 66
8. Gráficos dinámicos para el análisis de datos
69
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.1.
8.2. Los datos
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.3. Representación gráfica de datos bidimensionales . . . . . . . . . . . . . . . 70
8.4. Localización e identificación de datos . . . . . . . . . . . . . . . . . . . . . 70
8.5. Reescalado y utilización de factores de visión (“zooms”) . . . . . . . . . . 71
8.6. Representación gráfica de datos multidimensionales . . . . . . . . . . . . . 72
8.6.1. Las funciones matplot y matpoints . . . . . . . . . . . . . . . . . . 73
8.6.2. La función pairs
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.7. Brushing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
9. Inferencia paramétrica
77
9.1.
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
9.2. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . . 77
9.3. Un ejemplo: la paradoja de M`eré . . . . . . . . . . . . . . . . . . . . . . . 79
9.3.1. Programa R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
9.3.2. Distribución del estadístico en el muestreo . . . . . . . . . . . . . . 80
ÍNDICE GENERAL
V
10.Tests de bondad de ajuste
81
10.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
10.2. Conjunto de datos: Tiempo de acesso a la web desde biblioteca . . . . . . 82
10.2.1. Análisis exploratorio de los datos . . . . . . . . . . . . . . . . . . . 82
10.2.2. Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
10.2.3. Diagnosis del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 86
11.Intervalos de confianza y contrastes de hipótesis
91
11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
11.2. Distribuciones asociadas al muestreo en poblaciones normales . . . . . . . 91
11.2.1. Distribución χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
11.2.2. Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . 92
11.2.3. Distribución F de Snedecor . . . . . . . . . . . . . . . . . . . . . . 92
11.2.4. Funciones en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
11.3. Distribuciones de los estadísticos en el muestreo . . . . . . . . . . . . . . . 94
11.3.1. Estimadores de la media y varianza . . . . . . . . . . . . . . . . . 94
11.3.2. Distribución de estadísticos en el muestreo . . . . . . . . . . . . . . 94
11.4. Intervalos de confianza y contrastes de hipótesis . . . . . . . . . . . . . . . 95
12.El modelo de regresión lineal simple
97
12.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
12.2. Simulación de observaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 99
12.3. Estimación del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
12.4. Análisis del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Capítulo 1
Introducción
1.1.
¿Qué puedes encontrar en este libro?
Este libro es el resultado de la recopilación del material utilizado en las clases prácti-
cas de la asignatura de Estadística de la titulación de Ingeniería Técnica en Informática
de Sistemas de la Universidad de Santiago de Compostela. Estas prácticas se entienden
como un apoyo para la comprensión de la materia, además de introducir al alumno en
un nuevo lenguaje de programación, R, de gran utilidad en estadística.
Los Capítulos 2, 3 y 4 están dedicados fundamentalmente al manejo de R como her-
ramienta informática, sin profundizar todavía en conceptos estadísticos. Se ha incluido,
además de las prácticas, una colección de ejercicios de boletines y exámenes con los que
se pretende repasar los comandos básicos que se necesitarán a lo largo del curso: consulta
de ayuda en R, importación de archivos, representaciones gráficas, sintaxis, etc.
A partir del Capítulo 5, una vez que el alumno ya está más familiarizado con el
lenguaje, se desarrollan las prácticas relacionadas con los contenidos de la materia: es-
tadística descriptiva, variables aleatorias, inferencia estadística, etc.
El objetivo fundamental de esta recopilación es proporcionar un material completo
y estructurado a todos aquellos que deseen introducirse en la estadística a través de
la herramienta R. Pretendemos que sirva de ayuda para entender, tanto el lenguaje de
programación como los contenidos de la materia y que los diferentes ejemplos propuestos
contribuyan a hacer más amena la lectura y comprensión.
1.2. Los conjuntos de datos
A lo largo de las prácticas se ha trabajado con diferentes conjuntos de datos con los
que pretendíamos ilustrar los contenidos de la materia. Algunos son conjuntos de datos
clásicos, como los Fisher’s iris data, disponibles en R y otros han sido creados específi-
camente para la asignatura. Todos ellos se encuentran disponibles en la página web de
la materia http://eio.usc.es/eipc1/ASIG.php. De esta manera se podrán reproducir las
prácticas y ejercicios incluidos a lo largo de los siguientes capítulos.
Capítulo 2
El software R
2.1.
Introducción
R es un entorno espe
Comentarios de: Prácticas de Estadística en R (0)
No hay comentarios