En este post explico como calcular las principales medidas de estadística descriptiva para variables bidimensionales en r studio. Para ilustrarlos se utilizará el ejemplo Gasto en móvil vs Ingresos.xslx, que contiene datos del gasto en móvil y los ingresos mensuales para una muestra de 50 individuos. Si no sabes como abrir este archivo Excel desde r studio consulta: https://estadisticaparatodos.com/primeros-pasos-en-r-studio/
Si en vez de leerlo prefieres un vídeo sobre como se hace lo encontrarás al final.
Índice
Covarianza
Para obtener la covarianza entre dos variables en r haremos:
covarianza <- cov(variable1,variable2)
Ejemplo.-
covarianza <- cov(GastoIngreso$Gasto,GastoIngreso$Ingreso)
También podemos escribir directamente:
covarianza <- cov(GastoIngreso)
Entonces obtendremos la matriz de varianzas-covarianzas entre ambas variables.
Correlación
Para obtener el coeficiente de correlación entre dos variables necesitaremos instalar la librería “boot”:
Coef_correlacion <- corr(variable*)
*Pero ahora la variable debe ser bidimensional
Ejemplo.-
Coef_correlacion <- corr(GastoIngreso)
Si nuestras variables estuviesen separadas podríamos juntarlas en una variable bidimiensional del siguiente modo:
variablebidimensional <- cbind(GastoIngreso$Gasto, GastoIngreso$Ingreso)
Regresión
Podemos obtener una grafico de dispersión entre dos variables haciendo uso de la función ‘plot’:
plot(variable1,variable2)
Ejemplo.-
plot(GastoIngreso$Gasto,GastoIngreso$Ingreso)
Para obtener la recta de regresión usaremos la función ‘lm’:
lm(GastoIngreso$Gasto~GastoIngreso$Ingreso)
Así estimaremos la recta que explica el Gasto a partir del ingreso y obtendremos el siguiente resultado:

El valor denominado Intercept, es el punto de corte de la recta con el eje y, por lo que la recta en este caso es:

Si quisiésemos obtener la recta que estima los ingresos de un individuo a partir de su gasto en móvil, haremos:
lm(GastoIngreso$Ingreso~GastoIngreso$Gasto)


Si te interesa la teoría sobre estas medidas puedes consultarla en: https://estadisticaparatodos.com/variable-n-dimensional-tablas-de-contingencia/