Tema 6b. Distribución de frecuencias en r studio

Trabajaremos de nuevo con los datos del archivo: “Gasto en móvil vs Ingresos.xslx”, que contiene datos del gasto en móvil y los ingresos mensuales para una muestra de 50 individuos. Si no sabes como abrirlo consulta: https://estadisticaparatodos.com/primeros-pasos-en-r-studio/.

Empezaremos obteniendo el tamaño muestral. Para ello usamos la función length del siguiente modo:

length(variable)

Ejemplo.- n <- length(GastoIngreso$Gasto)

Para obtener los datos y sus frecuencias vamos a crear un objeto “data frame”, en este caso con forma de tabla. Esta tabla tendrá en la primera columna los datos y en la segunda sus frecuencias:

Columnas12 <- as.data.frame(table(GastoIngreso$Gasto))

Si nuestra variable requiere agrupar los datos en intervalos podemos hacerlo del siguiente modo:

Columnas12 <-as.data.frame(table(G=factor(cut(G,breaks=10))))

Obtendremos las frecuencias acumuladas utilizando la función cumsum, del siguiente modo:

Columna3 <- cumsum(Columnas12[,2])

La siguiente columna tendrá las frecuencias relativas (fi), que calcularemos dividiendo las frecuencias entre el tamaño muestral:

Columna4 <- Columnas12[,2]/n

Finalmente, las frecuencias relativas acumuladas (Fi) se obtienen utilizando de nuevo la función cumsum, ahora para sumar las frecuencias relativas: q

Columna5 <- cumsum(Columna4)

Una vez que tenemos todas las columnas que forman la distribución de frecuencias, las juntamos en una única tabla haciendo uso de la función cbind, del siguiente modo:

TablaFrecuencia <-cbind (Columnas12, Columna3, Columna4, Columna5)

Y para terminar cambiaremos los nombres de la columnas por medio de la función name:

colnames(TablaFrecuencia) <- c(“xi”, “ni”, “Ni”, “fi”, “Fi”)

Escribiendo el nombre del objeto creado podemos ver el resultado:

TablaFrecuencia