Tema 5b. Medidas de concentración

Concepto de concentración.

La concentración de una distribución hace referencia al mayor o menor grado de igualdad en el reparto del total de los valores de una variable. Las medidas de dispersión son indicadores del grado de equidistribución de la variable y tienen por tanto interés cuando tratamos con variables económicas como las rentas o los salarios.

La concentración no debe confundirse con la dispersión  que como ya hemos visto, hace referencia a la variabilidad de los datos y, por tanto, a la representatividad de los promedios, pero no está relacionada con el grado de equidistribución de los valores.

Ejemplo: Se calculan medidas de concentración para los distintos países con el fin de estudiar hasta qué punto el total de la riqueza del país está equitativamente repartido entre sus habitantes.

Para acercarnos a la construcción de las medidas de concentración consideraremos primero las dos situaciones extremas:

1.La concentración máxima, que se produce cuando en un reparto un único individuo percibe el total de la cantidad a repatir y el resto no perciben nada:

x_1=x_2=. . .=x_{n-1}=0     y     x_n \neq 0.

2.La concentración mínima o equidistribución, que se produce cuando todos los individuos perciben exactamente la misma cantidad:

x_1=x_2=. . .=x_{n-1}=x_n

Consideraremos una distribución de frecuencias (x_i, n_i) referida a una distribución de renta o variable similar, en la que como es habitual los valores x_i están ordenados de menor a mayor. Para la variable considerada calcularemos las siguiente columnas:

  1. Los productos x_i n_i: que nos indicaran la cantidad total percibida por los n_i individuos que recibirán x_i cada uno.
  2. Las frecuencias absolutas acumuladas N_i
  3. Los acumulados los productos x_i n_i, a los que denominaremos u_i:
    u_1=x_1 n_1
    u_2=x_1 n_1+x_2 n_2
    u_n=x_1 n_1+x_2 n_2 . . . + x_n n_n = \sum_{i=1}^n x_in_i
    De modo que u_i será la renta total percibida por los N_i primeros rentistas.
  4. Las frecuencias acumuladas relativas expresadas en porcentaje, a las que denominaremos p_i.
  5. Las u_i expresadas en porcentaje a las que denominaremos q_i.Estas dos últimas columnas nos ofrecen información del reparto de las distintas cantidades.Por ejemplo si p_i = 38% y q_i=23% diremos que el 38% de los individuos se reparten el 23% del total.

Ejemplo 1 .- Considere la siguiente muestra de salarios de trabajadores de una misma empresa (excluyendo directivos) y obtenga las medidas que nos permitirán analizar la equidad en el reparto de los salarios de dicha empresa:

(L_{i-1},L_i]

(salarios brutos anuales en miles de €)

n_i
(15, 20] 150
(20, 25] 80
(25, 30] 65
(30, 35] 40
(35,40] 25
(40,45] 10
(45,50] 8

Solución.-

(L_{i-1},L_i](salarios brutos anuales en miles de €) x_i n_i x_in_i N_i u_i p_i q_i
(15, 20] 17,5 150 2625 150 2625 39,68 28,36
(20, 25] 22,5 80 1800 230 4425 60,85 47,81
(25, 30] 27,5 65 1787,5 295 6212,5 78,04 67,13
(30, 35] 32,5 40 1300 335 7512,5 88,62 81,17
(35,40] 37,5 25 937,5 360 8450 95,24 91,30
(40,45] 42,5 10 425 370 8875 97,88 95,89
(45,50] 47,5 8 380 378 9255 100,00 100,00

A la vista de la tabla anterior podemos decir por ejemplo que en esta empresa el 60,85% de los individuos se reparten el 47,81% de la masa salarial de la empresa. O que el 95,24% se reparte el 91,30%.

La curva de Lorenz.

Este tipo de repartos se pueden representar gráficamente mediante la denominada Curva de concentración o Curva de Lorenz.

Definición.- Curva de concentración o curva de Lorenz.

La curva de concentración o curva de Lorenz es la representación gráfica en los ejes de coordenadas de las pi en el eje x y q_i en el eje y. De este modo la curva de Lorenz será similar a esta:

Consideraciones:

  • La curva de Lorenz se situará siempre por debajo de la recta que une los puntos O y B. Esto se debe a que la variable estará ordenada de menor a mayor, de forma que los porcentajes de individuos situados a un determinado nivel p_i, nunca pondrá superar el porcentaje del total que se reparten.
  • El orden también nos garantiza que la curva sea siempre creciente, ya que ambos porcentajes son acumulados.
  • La mínima concentración posible, es decir la equidistribución se situaría justamente sobre la línea que une O y B, ya que en esta situación, en todo momento p_i=q_i.
  • En el caso de concentración máxima, donde un único individuo recibe el total y el resto no reciben nada la curva de Lorenz se encontraría en las líneas que unen los puntos OA y OB.
  • En general diremos que cuanto más próxima este la curva a la diagonal OB más equitativo será el reparto.

El Índice de Gini.

El índice de Gini es una medida de la concentración de una distribución o equidad en el reparto de una distribución que se obtiene mediante la siguiente expresión:

I_G=\frac {\sum_{i=1}^{n-1} p_i-q_i}{\sum_{i=1}^{n-1} p_i}.

Así, en el caso de mínima concentración o equidistribución, p_i=q_i:

I_G=\frac {0}{\sum_{i=1}^{n-1} p_i}=0.

Y en el caso de máxima concentración, q_1=q_2=. . .=q_{n-1}=0:

I_G=\frac {\sum_{i=1}^{n-1} p_i-0}{\sum_{i=1}^{n-1} p_i}=1.

  • El índice de Gini es por tanto una media que toma valores entre 0 y 1, 0≤I_G≤1. De forma que cuanto más próximo a cero se encuentra más equitativo es el reparto.
  • El índice de Gini es capaz de resumir en una cifra la información de la curva de Lorenz, permitiendo así comparar fácilmente la equidad en el reparto que presenta una distribución.
  • Debemos considerar, no obstante, que es posible que dos distribuciones diferentes presenten un valor similar para el índice de Gini. En este sentido debemos acompañar siempre esta medida de la curva de Lorenz para entender adecuadamente las diferentes situaciones.

Ejemplo.- Considere de nuevo los datos de los salarios de trabajadores de una misma empresa (excluyendo directivos) y obtenga el índice de Gini y la curva de Lorenz.

(L_{i-1},L_i] (salarios brutos anuales en miles de €) x_i n_i x_i n_i N_i u_i p_i q_i p_i-q_i
(15, 20] 17,5 150 2625 150 2625 39,68 28,36 11,32
(20, 25] 22,5 80 1800 230 4425 60,85 47,81 13,03
(25, 30] 27,5 65 1787,5 295 6212,5 78,04 67,13 10,92
(30, 35] 32,5 40 1300 335 7512,5 88,62 81,17 7,45
(35,40] 37,5 25 937,5 360 8450 95,24 91,30 3,94
(40,45] 42,5 10 425 370 8875 97,88 95,89 1,99
(45,50] 47,5 8 380 378 9255 100,00 100,00

I_G=\frac {\sum_{i=1}^{n-1} p_i-q_i}{\sum_{i=1}^{n-1} p_i}=\frac{48,65}{460,32}=0,10568.