Tema 6a. Primeros pasos en r-studio

¿Qué es r studio?

Rstudio es un entorno que permite ejecutar programas en el lenguaje r. Incluye una consola, un editor de sintaxis y diferentes herramientas para depurar el código.

El lenguaje r es un lenguaje de programación que incluye numerosas funcionalidades matemáticas y estadísticas.

Se trata de un software abierto que se expande gracias a sus librerías, que incluyen numerosas funcionalidades para las diferentes áreas de las matemáticas y la estadística.

Se trata de un software gratuito que podemos descargar desde su página web:

https://rstudio.com/

En esta página podemos encontrar las últimas versiones del software para Windows, MacOS y Ubuntu entre otros sistemas operativos. Para su instalación es necesario tener previamente instalado el software r (https://www.r-project.org/), también disponible para los diferentes sistemas operativos.

Una vez instalado, al entrar encontramos el siguiente interfaz:

1. Editor de Scripts: En esta ventana se escriben los listados de comandos que forman el código a ejecutar.

2. Consola: En esta ventana se incluyen los comandos para ser ejecutados y aparecen los resultados de las operaciones realizadas. Aquí no se pueden guardar los comandos, por lo que se deben escribir  y guardar en el editor de Scripts.

3. Entorno e historial: El entorno incluye un listado con todas las variables creadas en la sesión y sus valores. El historial de todas las operaciones realizadas en la sesión. Este historial guarda únicamente las operaciones y no incluye sus resultados.

4. Archivos, gráficos, paquetes…: En esta zona podemos consultar el directorio de archivos con el que estamos trabajando, los gráficos que se han ido generando, los paquetes instalados y la ayuda.

Algunos comandos básicos

Directorio de trabajo

El directorio de trabajo es el lugar del ordenador en el que tenemos los archivos y variables con los que estamos trabajando. Algunas funciones interesantes relacionadas con el directorio de trabajo son las siguientes:

  • getwd(): Muestra en consola el directorio de trabajo con el que estamos trabajando.
  • setwd(‘miDirectorio’): Cambia el directorio de trabajo, fijando en la ruta que se indica (miDirectorio).
  • ls(): Muestra el listado de objetos que tenemos en el directorio de trabajo.
  • dir(): Muestra las carpetas y archivos que hay en el directorio de trabajo.
  • rm(objeto): Borra el objeto indicado del directorio de trabajo.
  • history() : Muestra el historial de comandos ejecutados.
  • savehistory() – savehistory( file=‘historialR.R’) : Guarda el historial en el archivo que le indiquemos.
  • loadhistory ( ‘ruta/archivo’) : Carga un historial de comandos guardado.
  • saveimage(‘archivo.R’) : Guarda objetos en formato .Rdata.
  • load(‘workspace.R’) : Carga el Workspace que se indique.

Objetos

R trabaja gestionando objetos que pueden ser de distintos tipos, entre los que destacan: variables, variables indexadas, cadenas de caracteres, funciones, etc. Alguna de las funciones básicas relacionadas con los principales objetos son:

  • NombreVariable <- Valor o NombreVariable = Valor : Guarda en una variable el valor que se indique, si la variable no existe la crea.

Ejemplo.- Edad <- 25.

  • NombreVariable <- (Valor1, Valor2, Valor3…): Guarda en una variable los valores que se indiquen, si la variable no existe la crea.

  Ejemplo.- Edad2 <- c(25, 24, 26, 25, 21, 24).

  • length(variable) : Indica el número de componentes que tiene una variable.

  Ejemplo.- length (Edad2)

  • str(variable) : Devuelve la estructura de un objeto.

  Ejemplo.- str (Edad2)

  • class(variable) : Indica de qué tipo es un objeto.

  Ejemplo.- class(Edad2)

Abrir un archivo

Trabajaremos con los datos del archivo: “Gasto en móvil vs Ingresos.xslx”, que contiene datos del gasto en móvil y los ingresos mensuales para una muestra de 50 individuos.

Para abrir los datos de este archivo Excel usaremos la ventana inferior izquierda (4) y su pestaña files. En ella buscaremos el archivo en nuestro pc y simplemente haremos clic y después “Import Dataset”. Nos aparecerá el cuadro de dialogo que aparece a continuación.

R importará todo el conjunto de datos como una única variable con las dimensiones necesarias para integrar a las variables que incluya la hoja Excel. Para r una variable es un vector de datos.

Si queremos ver los datos de la variable en consola, simplemente escribimos su nombre, en este caso:

Gasto_Mensual_en_móvil_vs_ingresos

Si queremos acceder a una única columna de datos escribiremos el nombre de la variable, a continuación $ y después el nombre de la columna. Rstudio nos ayudará desplegando los nombres de las columnas cuando escribamos Gasto_Mensual_en_móvil_vs_ingresos$

Para no trabajar con unos nombres tan largos los simplificaremos:

GastoIngreso <- Gasto_Mensual_en_movil_vs_ingresos #Volcamos la variable en otra.

rm(Gasto_Mensual_en_movil_vs_ingresos) #Eliminamos la variable original.

ls() #Mostramos en pantalla las variables para comprobar que está correcto.

names (GastoIngreso) <- c(“Gasto”, “Ingreso”) #Cambiamos los nombres de la columnas de la variable.