Probabilidad condicionada

Disponer de información sobre un suceso puede modificar su espacio muestral y por tanto sus probabilidades.

Podemos decir que cuanta mas información tengamos más reducido quedará el espacio muestral.

Ejemplo.- Si se ha lanzado un dado y pretendemos adivinar el resultado, nuestra probabilidad de acierto será de 1/6. Sin embargo, si sabemos que el valor obtenido ha sido un número par, el espacio muestral quedará reducido a solo 3 posibles valores, por lo que nuestra probabilidad de acierto será mayor (1/3).

Otro ejemplo de problema de probabilidad condicionada es el famoso dilema de las puertas. Nos situamos en un concurso en el que debemos elegir una puerta y nos llevaremos el premio que aparezca tras ella. Hay 3 puertas para elegir y detrás de una de ellas hay un coche, detrás de las otras dos una cabra. Asumiendo que nos interesa llevarnos el coche elegimos una puerta sin saber que hay detrás de cada una. Una vez que la hemos seleccionado, el presentador abre una de las puertas no seleccionadas, nos muestra una cabra y nos da la opción de cambiar nuestra selección. La pregunta es, ¿debemos cambiarla? ¿Incrementará esto nuestras probabilidades de llevarnos el coche?

Nuestras probabilidades de ganar a priori, independientemente de la puerta elegida son de 1/3. Sin embargo, las probabilidades a posteriori son diferentes, de modo que la probabilidad de ganar el coche si cambio, será de 2/3 mientras que si mantengo mi elección es de 1/3. Para entenderlo bien, podemos analizar la posibles situaciones:

  • Si he elegido la puerta número 1, el presentador abrirá la número 2 y al cambiar de puerta ganaré el coche.
  • Si he elegido la puerta número 2, el presentador abrirá la número 1 y al cambiar de puerta ganaré el coche.
  • Si he elegido la puerta número 3, el presentador abrirá cualquiera de la otras dos y al cambiar de puerta ganaré una cabra.

Como podemos observar, cambiando la puerta seleccionada gano en 2 de las 3 situaciones, por lo que tendré más posibilidades de llevarme el coche si cambio la selección. Aunque, por supuesto en ningún caso tengo el premio garantizado.

Definición.- Probabilidad condicionada

Consideremos dos sucesos S1 y S2, para los que sabemos que existe cierto grado de relación, de forma que lo que suceda con S1 afectará a S2. En esta situación definiremos la probabilidad de S1 condicionado a S2 como:

P(S_1 / S_2)= \frac{P(S_1 \cap S_2)}{P(S_2)}

siempre que “latex P(S_2)>0&s=2$.

P(S_1 / S_2) es una probabilidad, por lo que debe cumplir los tres axiomas de Kolmogorov.

Independencia de sucesos

Cuando dos sucesos (S1 y S2) están condicionados, la probabilidad de uno depende lo que haya sucedido con el otro, es decir,

P(S_1) \neq P( S_1/S_2 ).

Por el contrario, si S1 no está condicionado a S2, la probabilidad de S1 no dependerá de S2 y  diremos que ambos sucesos son independientes. En este caso se verificará que:

P(S_1) = P(S_1/S_2).

Cuando dos sucesos son independientes se cumple que la probabilidad de su intersección es igual al producto de sus probabilidades:

P(S_1 / S_2 ) = \frac{P(S_1 \cap S_2 )} {P(S_2)} \rightarrow  P(S_1\cap S_2 ) = P(S_1 / S_2 ) P(S_2)   \rightarrow  P(S_1 \cap S_2 ) = P(S_1 ) P(S_2)

Teorema de Bayes

El teorema de Bayes permite obtener la probabilidad del suceso S1 condicionado a S2 (P(S1/S2)) a partir de la probabilidad del suceso S2 condicionado a S1 (P(S2/S1)) del siguiente modo:

P(S_1 / S_2 ) = \frac{ P(S_2 / S_1 ) \cdot P(S_1)}{ P(S_2) }

Este teorema es la base de la estadística Bayesiana, ya que permite pasar de la probabilidad a priori de S1, basada en nuestro conocimiento del suceso, a su probabilidad a posteriori cuando incorporamos la información conocida (la que proporciona el suceso S2).

Demostración.-

Teorema de la probabilidad total

Consideremos la siguiente expresión para dos sucesos no independientes S1 y S2:

S_1 =  (S_1 \cap S_2 ) \cup (S_1 \cap \bar{S_2} )

Como S_1 \cap S_2 y S_1 \cap \bar{S_2} son sucesos disjuntos podemos obtener su probabilidad como la suma de ambas probabilidades:

P(S_1) =  P(S_1 \cap S_2 ) +P (S_1 \cap \bar{S_2} )

P(S_1) =  P(S_1 / S_2 ) \cdot P(S_2) + P (S_1 / \bar{S_2} ) \cdot P( \bar{S_2} )

Ilustraremos el uso de ambos problemas con algunos ejemplos:

Ejemplo.-

Una compañía de seguros clasifica a sus clientes en dos categorías los que tienen una probabilidad baja de tener un siniestro durante el año de duración del contrato de seguro (PB), y aquellos para los que la probabilidad es alta (PA). Sus estadísticas demuestran que una persona del grupo PA sufre un accidente en el año de duración del contrato, con probabilidad 0,4. Esta probabilidad es 0.2 para las personas del grupo PB. Asumiendo que el 30% de sus clientes potenciales pertenecen al grupo PA, se pide:

a) ¿Cuál es la probabilidad un cliente sufra un accidente el año que duración de su póliza?

b) Supongamos que un nuevo cliente sufre un accidente dentro del año de duración de su póliza. ¿Cuál es la probabilidad que él/ella pertenezca al grupo PA?

Con la información del enunciado podemos construir el siguiente árbol:

Y con dicha información se pueden completar fácilmente las probabilidades que faltan en el árbol del siguiente modo:

a) ¿Cuál es la probabilidad un cliente sufra un accidente el año que duración de su póliza?

Para responder a esta pregunta se debe aplicar el teorema de la probabilidad total del siguiente modo:

P(A) =  P(A / PA ) \cdot P(PA) + P (A / PB ) \cdot P(PB) = 0,4 \cdot 0,3 + 0,2 \cdot 0,7 = 0,26

b) Supongamos que un nuevo cliente sufre un accidente dentro del año de duración de su póliza. ¿Cuál es la probabilidad que él/ella pertenezca al grupo PA?

En este caso aplicaremos el teorema de Bayes:

P(PA / A ) = \frac{ P(A / PA ) \cdot P(PA)}{ P(A) } = \frac{0,4 \cdot 0,3}{0,26} = 0,46

Ejemplo.-

Una compañía dedicada al marketing está analizando el impacto de sus campañas que pueden ser en Radio (R), Televisión (TV) o en Internet (I). Para ello categoriza los resultados del impacto de sus campañas en Buenos (B), Medios (Me) o Malos (M). La compañía sabe que las campañas en televisión nunca son malas y son buenas con una probabilidad de 0,7. Respecto a las campañas de Radio, la probabilidad de que su impacto sea medio es de 0,3 y será malo con una probabilidad de 0,15. Además todas las campañas de internet obtienen un impacto medio. Si la compañía realiza un 30% de campañas de radio y un 25% de campañas en internet, calcule:

a) Probabilidad de que una campana realizada por la compañía sea Buena.

b) Si una campaña ha tenido un impacto medio, probabilidad de se trate de una campaña llevada a cabo en la radio.

c) Probabilidad de que una campaña de marketing se haya llevado a cabo en televisión con buenos resultados.

Con la información del enunciado podemos construir el siguiente árbol:

Y con dicha información se pueden completar fácilmente las probabilidades que faltan en el árbol del siguiente modo:

a) Probabilidad de que una campana realizada por la compañía sea Buena.

P(B) = P( B / R ) \cdot P(R)   + P(B / TV) \cdot P(TV) + P(B / I) \cdot P(I) = 0,7  \cdot 0,45 + 0,55   \cdot 0,3 + 0 \cdot 0,25=0,48

b) Si una campaña ha tenido un impacto medio, probabilidad de se trate de una campaña llevada a cabo en la radio.

P\left( R / Me \right)  =  P(B) = \frac{P(Me / R) \cdot P(R)}{P(Re)}

P(Me) = P(Me  / R ) \cdot P(R)   + P(Me / TV) \cdot P(TV) + P(Me / I) \cdot P(I) = 0,3  \cdot 0,45 + 0,3   \cdot 0,3 + 1 \cdot 0,25 = 0,475

P\left( R / Me \right)  =  P(B) = \frac{P(Me / R) \cdot P(R)}{P(Re)} =\frac{0,3 \cdot 0,3}{0,475} = 0,1895

c) Probabilidad de que una campaña de marketing se haya llevado a cabo en televisión con buenos resultados.

P(TV \cap B) = P(B  / TV ) \cdot P(TV) = 0,7  \cdot 0,45 = 0,315

Ejemplo.-

Un bufete de abogados está especializado en casos de derecho de familia, derecho laboral y derecho tributario y lleva el mismo número de casos de cada especialidad.  Hasta el momento el bufete ha ganado un 90% de los casos de derecho de familia y un 85% de los de derecho laboral. Si se sabe además que el bufete gana un 80% de los casos que lleva a juicio, se pide:

a) Probabilidad de que el bufete gane un caso de derecho tributario.

b) Si el bufete pierde un caso, probabilidad de que sea de derecho de familia.