Trabajaremos de nuevo con los datos del archivo: “Gasto en móvil vs Ingresos.xslx”, que contiene datos del gasto en móvil y los ingresos mensuales para una muestra de 50 individuos. Si no sabes como abrirlo consulta: https://estadisticaparatodos.com/primeros-pasos-en-r-studio/.
Empezaremos obteniendo el tamaño muestral. Para ello usamos la función length del siguiente modo:
length(variable)
Ejemplo.- n <- length(GastoIngreso$Gasto)
Para obtener los datos y sus frecuencias vamos a crear un objeto “data frame”, en este caso con forma de tabla. Esta tabla tendrá en la primera columna los datos y en la segunda sus frecuencias:
Columnas12 <- as.data.frame(table(GastoIngreso$Gasto))
Si nuestra variable requiere agrupar los datos en intervalos podemos hacerlo del siguiente modo:
Columnas12 <-as.data.frame(table(G=factor(cut(G,breaks=10))))
Obtendremos las frecuencias acumuladas utilizando la función cumsum, del siguiente modo:
Columna3 <- cumsum(Columnas12[,2])
La siguiente columna tendrá las frecuencias relativas (fi), que calcularemos dividiendo las frecuencias entre el tamaño muestral:
Columna4 <- Columnas12[,2]/n
Finalmente, las frecuencias relativas acumuladas (Fi) se obtienen utilizando de nuevo la función cumsum, ahora para sumar las frecuencias relativas: q
Columna5 <- cumsum(Columna4)
Una vez que tenemos todas las columnas que forman la distribución de frecuencias, las juntamos en una única tabla haciendo uso de la función cbind, del siguiente modo:
TablaFrecuencia <-cbind (Columnas12, Columna3, Columna4, Columna5)
Y para terminar cambiaremos los nombres de la columnas por medio de la función name:
colnames(TablaFrecuencia) <- c(“xi”, “ni”, “Ni”, “fi”, “Fi”)
Escribiendo el nombre del objeto creado podemos ver el resultado:
TablaFrecuencia