¿Qué es r studio?
Rstudio es un entorno que permite ejecutar programas en el lenguaje r. Incluye una consola, un editor de sintaxis y diferentes herramientas para depurar el código.
El lenguaje r es un lenguaje de programación que incluye numerosas funcionalidades matemáticas y estadísticas.
Se trata de un software abierto que se expande gracias a sus librerías, que incluyen numerosas funcionalidades para las diferentes áreas de las matemáticas y la estadística.
Se trata de un software gratuito que podemos descargar desde su página web:
En esta página podemos encontrar las últimas versiones del software para Windows, MacOS y Ubuntu entre otros sistemas operativos. Para su instalación es necesario tener previamente instalado el software r (https://www.r-project.org/), también disponible para los diferentes sistemas operativos.
Una vez instalado, al entrar encontramos el siguiente interfaz:
1. Editor de Scripts: En esta ventana se escriben los listados de comandos que forman el código a ejecutar.
2. Consola: En esta ventana se incluyen los comandos para ser ejecutados y aparecen los resultados de las operaciones realizadas. Aquí no se pueden guardar los comandos, por lo que se deben escribir y guardar en el editor de Scripts.
3. Entorno e historial: El entorno incluye un listado con todas las variables creadas en la sesión y sus valores. El historial de todas las operaciones realizadas en la sesión. Este historial guarda únicamente las operaciones y no incluye sus resultados.
4. Archivos, gráficos, paquetes…: En esta zona podemos consultar el directorio de archivos con el que estamos trabajando, los gráficos que se han ido generando, los paquetes instalados y la ayuda.
Algunos comandos básicos
Directorio de trabajo
El directorio de trabajo es el lugar del ordenador en el que tenemos los archivos y variables con los que estamos trabajando. Algunas funciones interesantes relacionadas con el directorio de trabajo son las siguientes:
- getwd(): Muestra en consola el directorio de trabajo con el que estamos trabajando.
- setwd(‘miDirectorio’): Cambia el directorio de trabajo, fijando en la ruta que se indica (miDirectorio).
- ls(): Muestra el listado de objetos que tenemos en el directorio de trabajo.
- dir(): Muestra las carpetas y archivos que hay en el directorio de trabajo.
- rm(objeto): Borra el objeto indicado del directorio de trabajo.
- history() : Muestra el historial de comandos ejecutados.
- savehistory() – savehistory( file=‘historialR.R’) : Guarda el historial en el archivo que le indiquemos.
- loadhistory ( ‘ruta/archivo’) : Carga un historial de comandos guardado.
- saveimage(‘archivo.R’) : Guarda objetos en formato .Rdata.
- load(‘workspace.R’) : Carga el Workspace que se indique.
Objetos
R trabaja gestionando objetos que pueden ser de distintos tipos, entre los que destacan: variables, variables indexadas, cadenas de caracteres, funciones, etc. Alguna de las funciones básicas relacionadas con los principales objetos son:
- NombreVariable <- Valor o NombreVariable = Valor : Guarda en una variable el valor que se indique, si la variable no existe la crea.
Ejemplo.- Edad <- 25.
- NombreVariable <- (Valor1, Valor2, Valor3…): Guarda en una variable los valores que se indiquen, si la variable no existe la crea.
Ejemplo.- Edad2 <- c(25, 24, 26, 25, 21, 24).
- length(variable) : Indica el número de componentes que tiene una variable.
Ejemplo.- length (Edad2)
- str(variable) : Devuelve la estructura de un objeto.
Ejemplo.- str (Edad2)
- class(variable) : Indica de qué tipo es un objeto.
Ejemplo.- class(Edad2)
Abrir un archivo
Trabajaremos con los datos del archivo: “Gasto en móvil vs Ingresos.xslx”, que contiene datos del gasto en móvil y los ingresos mensuales para una muestra de 50 individuos.
Para abrir los datos de este archivo Excel usaremos la ventana inferior izquierda (4) y su pestaña files. En ella buscaremos el archivo en nuestro pc y simplemente haremos clic y después “Import Dataset”. Nos aparecerá el cuadro de dialogo que aparece a continuación.
R importará todo el conjunto de datos como una única variable con las dimensiones necesarias para integrar a las variables que incluya la hoja Excel. Para r una variable es un vector de datos.
Si queremos ver los datos de la variable en consola, simplemente escribimos su nombre, en este caso:
Gasto_Mensual_en_móvil_vs_ingresos
Si queremos acceder a una única columna de datos escribiremos el nombre de la variable, a continuación $ y después el nombre de la columna. Rstudio nos ayudará desplegando los nombres de las columnas cuando escribamos Gasto_Mensual_en_móvil_vs_ingresos$
Para no trabajar con unos nombres tan largos los simplificaremos:
GastoIngreso <- Gasto_Mensual_en_movil_vs_ingresos #Volcamos la variable en otra.
rm(Gasto_Mensual_en_movil_vs_ingresos) #Eliminamos la variable original.
ls() #Mostramos en pantalla las variables para comprobar que está correcto.
names (GastoIngreso) <- c(“Gasto”, “Ingreso”) #Cambiamos los nombres de la columnas de la variable.