Actualizado el 17 de Junio del 2017 (Publicado el 15 de Enero del 2017)
2.147 visualizaciones desde el 15 de Enero del 2017
2,2 MB
157 paginas
Creado hace 14a (28/06/2010)
Métodos Estadísticos
con R y R Commander
Versión 2.1, julio de 2010
Prof. Dr. Antonio José Sáez Castillo
Dpto de Estadística e Investigación Operativa
Universidad de Jaén
Esta obra está bajo una licencia Reconocimiento-No
comercial-Sin obras derivadas 3.0 España de Creative
Commons. Para ver una copia de esta licencia, visite
http://creativecommons.org/licenses/by-nc-
nd/3.0/es/ o envie una carta a Creative Commons, 171
Second Street, Suite 300, San Francisco, California
94105, USA.
Métodos Estadísticos
con R y R Commander
Prof. Dr. Antonio José Sáez Castillo
Departamento de Estadística e Investigación Operativa
Universidad de Jaén
Junio de 2010
Prólogo
El presente documento se creó originalmente como Guión de Prácticas para la asignatura Métodos
Estadísticos de la Ingeniería, impartida en distintas especialidades de Ingeniería Técnica Industrial
de la Universidad de Jaén. Sin embargo, dada la escasez de documentación en español acerca del
uso de R, he querido redactar un documento más general que sirva como guía introductoria para
usuarios principiantes de R.
Es sabido que existen en el mercado distintos paquetes de software estadístico propietario, como
SPSS, Statgraphics, Minitab, Statistica, SAS, S-Plus, etc, que cubren todas las necesidades de
cualquier usuario de técnicas estadísticas, básicas o avanzadas. Frente a estas opciones, en los últimos
años R ha surgido con fuerza como alternativa de software libre en muy distintos ambientes docentes
y de investigación.
En este sentido, antes de tomar la decisión de utilizar R como programa bajo el que desarrollar mis
prácticas, he discutido ampliamente (en el buen sentido de la expresión) con compañeros y alumnos
al respecto. Como conclusión de esos debates (a veces encendidos), quisiera plasmar dos aspectos
que, a mi juicio, avalan la decisión:
Después de algún tiempo, cada vez que se me cuestiona acerca de ¾por qué usar R?, he
desarrollado una respuesta rápida: ¾y por qué no hacerlo? Facilita todo lo necesario, luego,
como punto de partida, es una solución factible.
Es software libre, lo que, en primer lugar, es una ventaja desde el punto de vista económico
para la Universidad. Además, esto es una ventaja desde el punto de vista económico para
nuestro alumnado y para cualquier usuario en general. Supone la posibilidad de acceder al
programa desde sus propios equipos fuera del horario de clase y en cualquier momento de
su futuro ejercicio profesional. Finalmente, este hecho, el que sea software libre tiene, a nivel
personal, unas connotaciones importantes sobre la manera de entender el papel que juega la
Universidad en la sociedad. La construcción del conocimiento hoy en día me parece muy difícil
de entender sin el acceso libre por parte de toda la comunidad a las herramientas fundamentales
2
Métodos Estadísticos con R y R Commander
que lo favorecen. Con ello no quiero decir que esté en contra de que determinadas empresas
comercialicen paquetes de software estadístico, sino que me tranquiliza que existan alternativas
a estos paquetes que permitan decidir en libertad si quiero comprarlo o no.
Probablemente alguien pensará que R debe tener alguna desventaja en comparación con los pro-
gramas estadísticos más habituales. Mi experiencia me hace resaltar las siguientes:
1. Su entorno no es tan bonito como el de los programas comerciales. Esta cuestión está parcial-
mente resuelta con la utilización del paquete R Commander, cuya apariencia es muy similar
al de otros programas comerciales.
2. Tampoco facilita las salidas, fundamentalmente las tablas de resultados, de forma tan directa
como otros paquete comerciales, donde exportar estas tablas a paquetes omáticos como
Microsoft Word es tan sencillo como copiar-pegar.
3. Hemos comprobado que algunas opciones de ventana del paquete R Commander hacen que el
programa se cuelgue con frecuencia, obligándonos a reiniciarlo. Mi experiencia es que éste es
un problema muy infrecuente en el uso de R desde la consola.
El documento está pensado para que quien lo lea pueda elegir si desea manejar R utilizando su código
o bien sólo hacerlo a través de los menús desplegables tipo ventana que facilita R Commander. Así se
especica en cada apartado. Tan sólo hay dos capítulos, el de estimación puntual y el de contrastes
no paramétricos, que no pueden abordarse íntegramente con los menús de R Commander y otro,
el de el manejo de distribuciones, en el que, pudiendo utilizar Commander, sugiero que se use el
código.
Esta posibilidad de elegir entre código y ventanas del Commander podría hacer pensar en usuarios
avanzados (los que opten por el código) o no avanzados (los que opten por R Commander). No
me parece una distinción afortunada. Mi consejo es que se utilice el código, pero quienes estén
acostumbrados a manejar programas estadísticos con licencia comercial puede que preeran empezar
con un entorno, el de Commander, que les resulte más familiar. Yo, sin embargo, les animo a que
den el paso y disfruten de todas las ventajas que el manejo de un lenguaje de computación como
R proporciona. También hay que reconocer que el propio diseño de R Commander, mostrando en
su ventana de instrucciones el código correspondiente a las ventanas desplegables, puede ser una
excelente manera de ir aprendiendo poco a poco sobre el lenguaje de R.
Para nalizar, quiero agradecer especialmente a mi compañero el Prof. Dr. Jesús Navarro Moreno,
su ayuda en la depuración del documento y en la redacción de algunos de sus apartados.
Prof. Dr. Antonio José Sáez Castillo. Universidad de Jaén
3
Índice general
1. Instalación e introducción a R y R Commander
10
1.1.
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.
Instalación de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3. La consola y el editor de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.
Instalación e introducción a R Commander
. . . . . . . . . . . . . . . . . . . . . . . 14
2. Preliminares sobre el lenguaje de R
19
2.1.
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2. Algunos tipos de objetos de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1. Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.2. Factores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.3. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.4. Hojas de datos
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3. Funciones más comunes en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4. Operaciones lógicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5. La ayuda de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3. Manejo de datos
27
3.1.
Introducción de datos nuevos
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.1. La hoja de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.2.
Introducción de la hoja de datos mediante código . . . . . . . . . . . . . . . . 28
3.1.3.
Introducción de una hoja de datos en R Commander . . . . . . . . . . . . . . 30
3.1.4. Almacenamiento de un conjunto de datos mediante código. Las funciones save
y load . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4
Métodos Estadísticos con R y R Commander
3.1.5. Almacenamiento de un conjunto de datos en R Commander . . . . . . . . . . 33
3.1.6. Datos faltantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.
Importar datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.1.
Importar datos de tipo texto . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2.1.1. Mediante código. La función read.table . . . . . . . . . . . . . . . . . 36
3.2.1.2. Mediante R Commander
. . . . . . . . . . . . . . . . . . . . . . . . 37
3.2.2.
Importar archivos de tipo Excel . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.2.1. Mediante código. El paquete RODBC . . . . . . . . . . . . . . . . . 38
3.2.2.2. Mediante R Commander
. . . . . . . . . . . . . . . . . . . . . . . . 38
3.3. Exportar datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3.1. Mediante código. Función write.table . . . . . . . . . . . . . . . . . . . . . . . 39
3.3.2. Mediante R Commander . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4. Recodicación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4.1. Recodicación de una variable numérica . . . . . . . . . . . . . . . . . . . . . 40
3.4.1.1. Mediante código. Función recode del paquete car . . . . . . . . . . . 41
3.4.1.2. Mediante R Commander
. . . . . . . . . . . . . . . . . . . . . . . . 41
3.4.2. Recodicación de una variable tipo carácter . . . . . . . . . . . . . . . . . . . 42
3.5. Cálculo de nuevas variables
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.5.1. Mediante código . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.5.2. Mediante R Commander . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.6. Filtrado de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.6.1. Mediante código . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.6.2. Mediante R Commander . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.7. Almacenamiento de instrucciones y resultados . . . . . . . . . . . . . . . . . . . . . . 47
3.7.1. Mediante código. El script y la sesión de trabajo . . . . . . . . . . . . . . . . 47
3.
Comentarios de: Métodos Estadísticos con R y R Commander (0)
No hay comentarios