1 ullrtoolbox Intalacion de R y toolbox PDF

Title 1 ullrtoolbox Intalacion de R y toolbox
Author Lucía Afonso Canet
Course Fundamentos de Metodología I
Institution Universidad de La Laguna
Pages 20
File Size 612 KB
File Type PDF
Total Downloads 99
Total Views 132

Summary

Download 1 ullrtoolbox Intalacion de R y toolbox PDF


Description

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

1. Instalación de R y de ULLRToolbox R es un programa de análisis estadístico y realización de gráficos, que posee una doble naturaleza de programa de análisis de datos y lenguaje de programación. Se distribuye gratuitamente bajo licencia GNU General Public Licence y está disponible para prácticamente todas las plataformas, tanto en su versión binaria pre-compilada como en el código fuente. R posee una comunidad muy activa y numerosa, dirigida y coordinada por eminentes investigadores, dando lugar a un programa excepcional por su potencia, flexibilidad, calidad y gratituidad. Existe una abundante literatura tanto para principiantes como para expertos. La página web oficial de R se encuentra en http://cran.r-project.org aunque es suficiente con solicitar en google R cran para acceder de forma inmediata a dicha página. Una vez en ella, seleccionamos el enlace del sistema operativo de nuestra máquina y si se trata de Windows, elegiremos además el enlace base. Esto nos conducirá al archivo ejecutable R-versionwin32.exe (la última versión hasta el momento es la 2.15.1). Descargamos el archivo y lo ejecutamos para llevar a cabo la instalación del programa. Una vez instalado, R nos pondrá su icono de acceso rápido en el escritorio (una R de gran tamaño de color azul). Al ejecutar dicho icono (si tu sistema operativo es Window 7, la primera vez debes arrancarlo como Administrador, con ratón derecho y Ejecutar como Administrador ) entraremos en la ventana de consola de R.

La consola de R.

1

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

El símbolo > de color rojo que vemos en la ventana de consola y el cursor parpadeante, nos indica que el programa está preparado para recibir instrucciones del usuario. Escribe por ejemplo 2 + 3*(7/2) y al pulsar la tecla retorno (intro) obtendrás en la parte inferior el resultado en color azul 12.5.

ULLRTOOLBOX Como cualquier programa, R funciona a partir de librerías o conjunto de herramientas que permiten llevar a cabo los diferentes análisis. A diferencia de las aplicaciones comerciales donde muchas de las librerías más complejas son de pago, en R el programa ya cuenta con una gran cantidad de ellas en la instalación por defecto. Sin embargo, R es mucho más y así lo evidencian las más de 1500 librerías especializadas y gratuitas disponibles hasta el momento y de uso libre. R es sobre todo una comunidad de usuarios investigadores de todos los campos de la ciencia por eso tenemos librerías de genética, biología molecular, psicología y un largo etcétera. El principal inconveniente de este excelente lenguaje de programación es que requiere de un cierto esfuerzo para aprender las reglas fundamentales de su lenguaje de programación orientado a objetos. Para solventar este problema, hemos creado ULLRToolbox que es una “caja de herramientas” que viene a aliviar al usuario precisamente de la necesidad de aprender dicho lenguaje y su mas o menos compleja sintaxis. A partir de llamadas a funciones muy simples incluso el usuario mas novel puede llevar a cabo análisis de datos desde los procedimientos mas simples de estadística descriptiva como de análisis multivariado.

https://sites.google.com/site/ullrtoolbox/ En las siguientes apartados aprenderás los conceptos mínimos que debes adquirir para lograr un manejo confortable con la herramienta. Estos son: aprender a poner a R en el directorio de trabajo, donde tenemos almacenados la base de datos que queremos analizar, como abrir una ventana de sintaxis desde la cual construir tus procedimientos de análisis, como instalar el toolbox por primera vez y activarlo en cada sesión de trabajo y una introducción básica a conceptos tan importantes como vector, data.frame, lista y función. Cuando finalices este primer capítulo y realices los ejercicios propuestos al final del mismo estarás preparado/a para avanzar a lo largo de este manual en el manejo y control de la herramienta de análisis estadístico basada en R ULLRToolbox.

2

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

Poner al programa R en un directorio de trabajo. La información con cualquier software debe estar adecuadamente organizada y R no es una excepción. Es muy conveniente que cada trabajo o unidad temática que tratemos ahora y en el futuro, este situada en un determinado directorio de nuestro ordenador. Partiremos de un ejemplo en el que crearemos un nuevo directorio de trabajo de nombre trabajo1 dentro del directorio genérico del usuario mis documentos. Para ello: 1. Abrir el explorador de archivos de Windows. 2. Seleccionamos en la parte superior izquierda Documentos. 3. En el panel que se muestra a la derecha, colocaremos el cursor en una zona vacía hacia la derecha y activamos el clic derecho del ratón. 4. En el cuadro de diálogo que se abre seleccionamos Nuevo y posteriormente Carpeta a la que le daremos el nombre propuesto trabajo1 (no dejes espacios entre el nombre y el número). 5. Bájate de la web del toolbox https://sites.google.com/site/ullrtoolbox/ el archivo maestro de funciones ULLRtoolbox.v.1.0.R y guárdalo precisamente en el directorio que acabas de crear (sin esta operación nada funcionará). 6. En el explorador de archivos verás que en la parte superior en la barra de direcciones tienes el nombre completo del directorio recién creado (directorios y subdirectorios). En tu caso será algo así como: C:\Users\usuario\Documents\trabajo1 o quizás así C:\Documents and Settings\usuario\Documents\trabajo1

7. Copia esa dirección marcándola completamente y activando ratón derecho seleccionaras Copiar. Ya estamos preparados para poner a R en nuestro nuevo directorio de trabajo. Para ello iremos nuevamente en R a la pestaña Archivo en la parte superior izquierda de la ventana de consola y posteriormente Cambiar directorio. R nos abrirá un cuadro de diálogo, el cual nos permitirá pegar en la parte inferior (Carpeta) en el espacio ocupado actualmente por la palabra Equipo (que debes borrar primero) la dirección de nuestro directorio de trabajo copiada en el último paso anterior. R ya está ubicado en tu nuevo directorio de trabajo. Para comprobarlo puedes escribir en consola dir( ) y deberías obtener la siguiente información si has copiado correctamente el archivo del paso 5 anterior. > dir( ) [1] "ULLRtoolbox.v.1.0.R"

R te informa que en el directorio activo tiene el archivo maestro de funciones (toolbox) imprescindible para poder ejecutar los análisis estadísticos y gráficos de este manual. 3

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

Abrir una ventana de sintaxis (script). En R podemos trabajar e introducir órdenes de dos maneras: directamente en consola y a través de una ventana de comandos (archivo de script). Sin embargo, es mucho más cómodo y productivo hacerlo en una ventana de sintaxis o scripts e ir ejecutando línea a línea o por bloques las instrucciones que deseemos o necesitemos. Para abrir una ventana de sintaxis, o script seleccionamos Archivo en la parte superior izquierda y, posterior-mente, Nuevo Script. En ese momento R nos abrirá una nueva ventana en la que podemos escribir nuestro código e ir ejecutándolo simplemente con la pulsación combinada de las tecla CTRL + R. De igual manera, podemos seleccionar múltiples líneas (o incluso todas) y ejecutar al final CTRL + R. (Cmd + intro en Mac). A lo largo de este manual, los comandos utilizados estarán escritos en tipografía courier precedidos en algunas ocasiones por el símbolo > para representar la consola. El usuario no debe escribir este símbolo, que se presenta sólo para identificar el comando que se va a procesar, emulando así la apariencia de la consola de R.

Activar el archivo maestro de funciones del toolbox: ULLRtoolbox.v.1.0.R Es obligatorio que la primera vez que ejecutemos la línea de comando del párrafo siguiente estemos conectados a internet. Escribimos en la nueva ventana que hemos creado con Nuevo script la siguiente orden prestando una especial atención a los apóstrofes y apertura y cierre de paréntesis. Si omites alguno, la ejecución de dicha línea con CTRL y R generará un error que debe ser subsanado antes de ejecutarla nuevamente.

source('ULLRtoolbox.v.1.0.R')

IMPORTANTE. No omitir los apóstrofes o comillas de apertura y de cierre del nombre del archivo. Igualmente, no omitir la apertura y cierre de paréntesis.

Una vez ejecutada la orden anterior R irá a comprobar si tienes instaladas las librerías que el toolbox necesita. Dado que es la primera vez que lo ejecutas no encontrará ninguna y activará un cuadro de diálogo con el nombre CRAN mirror (servidores espejos de R en el mundo). Con el cursor desciende hasta encontrar Spain (Madrid). Selecciona ese servidor y pulsa OK. Durante algunos segundos o minutos (dependerá de tu velocidad de conexión a la red) R irá automáticamente descargando e instalando las librerías que necesita para el correcto funcionamiento del toolbox. Si la calidad de tu conexión a internet es baja podría darse el caso de que alguna librería quedase incorrectamente instalada. Si esto ocurriese ejecuta nuevamente la línea hasta obtener la instalación completa y correcta de todas las librerías necesarias. 4

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

A partir de este momento, todo script de trabajo debe obligatoriamente comenzar con la ejecución de la instrucción anterior source('ULLRtoolbox.v.1.0.R'). El proceso de instalación solo se produce la primera vez que ejecutas dicha orden. A partir de la segunda (siempre con CTRL y R) dará lugar al siguiente mensaje en consola: ******************************************************************** Toolbox made by Juan A. Hernandez Cabrera Departamento Psicobiologia y Metodologia FACULTAD DE PSICOLOGIA -UNIVERSIDAD DE LA LAGUNA Canary Islands - SPAIN https://sites.google.com/site/ullrtoolbox ******************************************************************** *** Todas las librerias necesarias estan correctamente instaladas *** (1)

Este mensaje te indica que el procesador está preparado para ejecutar las múltiples funciones de análisis que aprenderás en este manual. (1) Nota Dada la necesaria compatibilidad entre sistemas (windows, Linux y OsX) se han eliminado los acentos de todos los mensajes que el toolbox presenta al usuario. A ser posible evita el uso de tildes en los scripts de análisis, aunque puede usarlos libremente en las líneas de comentarios . NO PONER TILDES NUNCA EN LOS NOMBRES DE ARCHIVOS, OBJETOS Y VARIABLES

Introducción básica a R y al uso del toolbox Los siguientes puntos de este capítulo introductorio pretenden llevarte de forma rápida y sencilla al mundo de R y más precisamente a la ejecución de las funciones automatizadas contenidas en el toolbox que acabas de activar. A lo largo de los diferentes capítulos posteriores ampliaremos cada uno de los apartados que ahora presentamos de forma introductoria, con un especial énfasis en la simpleza para ayudarte a conseguir con la mayor rapidez un nivel adecuado que te permita afrontar con éxito la utilización de cualquier técnica de análisis de datos al uso en el trabajo cotidiano, tanto en el contexto docente como investigador. Si en la consola después del símbolo > escribimos 2+5 y pulsamos la tecla ENTRAR obtendremos el resultado en la siguiente línea. > 2+5 [1] 7

Una manera de trabajar con números de forma más eficiente a la larga consiste en guardar dichos números en almacenes temporales. Es lo que se conoce como asignación de valores a variables. Así, la operación x = 2 guarda el número 2 en la variable o almacén x. Veamos algunos ejemplos: > x=2 > y=5

5

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

Ahora podemos sumar los almacenes x e y para obtener la suma de lo que ambos contienen. > x+y [1] 7

En las variables (almacenes) no sólo se puede guardar números sino que también otras variables o incluso operaciones con ellas. > z=x+y

Para ver el contenido de z basta con escribir y pulsar: > z [1] 7

En general, cuantas más variables creemos, más complicado será el trabajo, por eso conviene economizar y podemos ahorrarnos la creación de la variable z simplemente asignando a x el resultado de sumar el valor de x más el de y. > x=x+y > x [1] 7

En esta operación hay dos x: la antigua a la derecha del signo igual y la nueva a la izquierda de este. Con esta operación x adquiere el valor de la suma y se pierde su antiguo valor. El trabajo en consola es útil de forma puntual pero es mucho más eficiente hacerlo en una ventana de sintaxis (script), donde podemos escribir nuestros comandos y ejecutarlos posteriormente línea a línea o en bloque con la pulsación combinada de las teclas CTRL y R. Por ese motivo trabajaremos de ahora en adelante SIEMPRE en una ventana de scripts y solo esporádica o puntualmente en consola. Por ese motivo omitiremos de ahora en adelante el símbolo > que hemos utilizado para indicar que se ejecuta en consola ya que lo haremos en una ventana de sintaxis.

Cómo crear un vector de datos Hasta ahora se ha asignado (guardado) a cada variable (almacén) un solo valor. Pero también se pueden guardar muchos valores en un solo almacén (variable u objeto). Así con la operación: medida1 = c(10,12,14,16,24)

Se asigna a la variable medida1 los valores 10, 12, 14,16 y 24. Si queremos ver el contenido de la variable medida1, simplemente escribimos medida1 y pulsamos Entrar: medida1 [1] 10 12 14 16 24

6

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

Si quisiéramos acceder al elemento tres del almacén (variable o vector) medida1 escribiremos: medida1[3] [1] 14

Mediante el uso de corchetes puedo acceder a cualquier elemento de un vector [ ]. El símbolo almohadilla (#) identifica un mero comentario del usuario que el programa ignorará. medida1[5] [1] 24

# Accedo al quinto elemento de medida1

medida2 = c(11,12,18,22,12) # Creo otro vector de nombre medida2 medida2 [1] 11 12 18 22

A la asignación de varios valores a una variable se le denomina creación de un vector. Observa dos cuestiones de importancia en R. La primera se refiere al comando c( ) que es una función genérica y primordial en R. Esta es una de las formas fundamentales que usaremos para asignar valores a una determinada variable. Hemos creado dos objetos: medida1 y medida2 mediante el uso de c( ). La otra cuestión está en que puedo poner más de un comando por línea si lo deseo, pero debo separarlos con un punto y coma (;). De esta forma por ejemplo asigno valores a una variable y veo seguidamente su contenido. Lo cual es equivalente a print(medida1). Veámoslo. Primero asigno a medida1 los elementos del vector con c( ) y después solicito que imprima el

medida1=c(10,12,14,16,24); [1] 10 12 14 16 24

contenido, separando ambas órdenes con el carácter punto y coma.

medida1

En este punto podemos por ejemplo restar ambas variables u objetos. medida1-medida2 [1] -1 0 -4 -6 12

También puedo calcular el cuadrado de dicha resta utilizando el caracter ^ (circunflejo que indica a R el concepto “elevado a “). (medida1-medida2)^2 [1] 1 0 16 36 144

Y se puede además de una vez calcular la suma del cuadrado de esa diferencia mediante la función sum( ). sum(medida1-medida2)^2 [1] 1

Ahora crearemos un vector de valores alfanuméricos (vector character) también con la ya conocida función c( ). mi.factor=c('Alto','Medio','Bajo')

7

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

Vemos como cada elemento del vector esta precedido y seguido por un apóstrofe (puede ser también las dobles comillas). Un error muy frecuente consiste en omitir algún o algunos de los apóstrofes de apertura y cierre de los elementos de un vector alfanumérico (tipo carácter). Error. Se ha omitido el apóstrofe de cierre del segundo elemento ‘Medio

mi.factor=c('Alto','Medio,'Bajo')

Error: inesperado símbolo en "mi.factor=c('Alto','Medio,'Bajo"

Se ha omitido el apóstrofe de cierre del segundo elemento 'Medio, y el programa nos lo indica con Error aunque de una forma no demasiado clara. Este es probablemente uno de los errores más frecuentes en los inicios con R. El usuario debe ser especialmente cuidadoso cuando introduce nombres de variables o valores alfanuméricos y no omitir la apertura y cierre de apóstrofes dado que genera un error difícil de localizar para los “nuevos” en un lenguaje de programación como es R.

El concepto de DATA FRAME La estructura fundamental de datos en R es el data.frame cuya traducción literal sería marco de datos. Es la forma natural en la que los valores de n sujetos en p variables es almacenada por la mayor parte de los programas de análisis de datos. Veamos con un ejemplo en qué consiste. R dispone de cientos, si no miles, de bases de datos de demostración y una de ellas es attitude.

Utilizaremos inicialmente las función head( ),

dimension( ) y

nombres.var( ) para interrogar attitude. head(attitude) 1 2 3 4 5 6

rating complaints privileges learning raises critical advance 43 51 30 39 61 92 45 63 64 51 54 63 73 47 71 70 68 69 76 86 48 61 63 45 47 54 84 35 81 78 56 66 71 83 47 43 55 49 44 54 49 34

dimension(attitude) El objeto es una matriz que pertenece a la clase data.frame y tiene 30 filas y 7 columnas (variables)

Hemos utilizado una nueva función de extraordinaria importancia y utilidad en R. Con head(nombre del objeto), indicamos a R que queremos conocer los primeros 6 registros o valores del objeto que introducimos como argumento (attitude en este caso). En consola vemos que tenemos 7 variables. La primera fila nos indica los nombres de las 8

ULLRToolBox. ANÁLISIS DE DATOS EN PSICOLOGÍ A. - Instalación y activación.

variables contenidas en ese objeto. Además a la izquierda tenemos el número de la fila que ocupa cada registro. El comando head permite una visión muy rápida del contenido de una base de datos. Nos informa visualmente si las variables son numéricas o de carácter. Del número y nombre de dichas variables. Muchos errores de lectura y codificación se detectan de forma temprana con head. Con dimension(attitude) indicamos que queremos conocer qué tipo de objeto es attitude y que dimensiones tiene. En este ejemplo nos informa de que attitude es un objeto del tipo data.frame (marco de datos) y que tiene 30 filas y 7 columnas. nombres.var(attitude) nombre numero tipo 1 rating 1 numeric 2 complaints 2 numeric 3 privileges 3 numeric 4 learning 4 numeric 5 raises 5 numeric 6 critical 6 numeric 7 advance 7 numeric

Con nombres.var(attitude)estoy solicitando los nombres de las variables (en una columna) del objeto entregado y el número de la columna que cada variable ocupa en la base de datos. Asimismo obtengo la naturaleza o tipo de cada variables. Ya veremos muy pronto que esta información será de extraordinaria utilidad cuando queramos utilizar determinadas variables de una base de datos con un gran número de columnas (variables). El data.frame attitude tiene filas y columnas a las cuales podemos acceder mediante los subíndices apropiados dentro de corchetes. Si la matriz tiene más de una columna, necesitaremos un corchete con dos valores separados por coma objeto[que.fila,que.columna].Si deseamos todas las filas podemos dejar vacío a la

izquierda de la coma y R entenderá que deseamos ver todas las filas. Lo mismo si lo que dejamos vacío es el espacio de las columnas. Algunos ejemplos que puedes ejecutar y observar su resultado en consola. attitude[,1] attitude[1:10,1] attitude[10:20,] attitude[20,-2] attitude[-c(1:4),-c(3,5)]

# todas las filas de la columna 1 # filas 1 hasta 10 de la columna 1 # filas 10 a la 20 en to...


Similar Free PDFs