TEOREMA DE BAYES El Teorema de Bayes representa un buen instrumento de operación matemática para establecer valores de probabilidad condicional (conjunta, hacia atrás). Es decir, el caso en que la probabilidad de que se manifieste un determinado fenómeno está directamente sujeto a que previamente haya ocurrido otro. El uso del diagrama de árbol también contribuye a que el teorema de Bayes, resulte mucho más sencillo de operar, ya que permite obtener los valores de probabilidad conjunta de una sola vez, rama por rama. En términos algebraicos la fórmula del Teorema de Bayes se expresa como: T. DE BAYES =
Valor de probabilidad conjunta del fenómeno específicamente determinado ∑ Probabilidades conjuntas de todas las posibilidades relativas al fenómeno En otros términos:
P (A) · P (A/X)
T. DE BAYES =
P (A) ·P (A/X) + P (B) ·P (B/X) + P(C) ·P(C/X) +
…
Que se lee: P(A) · P(A/X) =
Valor de la probabilidad conjunta de que suceda el caso “A”, previamente dado el caso “X”
P (B) · P (B/X) =
Valor de la probabilidad conjunta de que suceda el caso “B”, previamente dado el caso “X”
P(C) · P(C/X) =
Valor de la probabilidad conjunta de que suceda el caso “C”, previamente dado el caso “X”. Etc.
El siguiente ejercicio sirve de ejemplo. Obsérvese como el diagrama de árbol es un sencillo instrumento que contribuye a obtener los valores de probabilidad “individual” y “conjunta” (Individual expresado en cada “rama”, conjunta expresada como el producto de “rama” por “rama”, al final de cada una de ellas.
Página 1 de 8
Ejemplo ilustrativo Una compañía posee tres plantas procesadoras de café en oro (café sin cascara). La producción, en quintales por hora, de cada planta es la siguiente: a) Planta A: 400 quintales. b) Planta B: 600 quintales. c) Planta C: 1000 quintales. El supervisor de control de calidad ha establecido que, por cada lote de producción por hora, las procesadoras cometen errores en el llenado. De los 400 producidos por la planta A, 10 quintales resultan con cascarilla; de los producidos por la planta B, 20 resultan con cascarilla y de la planta C, 40 resultan con cascarilla. Si se selecciona un quintal al azar (sin previa verificación y sin saber de qué planta proviene), y resulta ser un quintal que tiene cascarilla, determinar el valor de probabilidad de que éste haya sido llenado por la planta A. En este caso se está ante un típico problema de probabilidad condicional hacia atrás, que puede muy bien resolverse por medio del Teorema de Bayes. Usando el Diagrama de Árbol, establecemos los valores de probabilidad individual y de conjunto de todos los posibles casos que puedes suceder. Por supuesto que este procedimiento no es necesario ni obligatorio, pero para que el estudiante aprenda en detalle a realizarlo se hará completo; es decir, estableciendo los valores de probabilidades individual y de conjunto de todo lo que puede suceder, de acuerdo a la información con que se cuenta. En otras palabras, si proviene de la planta A o C también; y si el quintal obtenido al azar estuviera correcto, de dónde viene; ya que tal información es útil para resolver otros cuestionamientos que pueden estar relacionados con este problema. PROCEDIMIENTO PARA ELABORAR DIAGRAMAS DE ARBOL, CON VALORES DE PROBABILIDAD INDIVIDUAL Y CONJUNTO 1. Determine el número de ramas con que inicia el árbol. (Las opciones o alternativas, según los casos expuestos). En este caso se habla de tres plantas (A, B y C), con tal información se deduce que el árbol abre inicialmente tres ramas: una para la A, otra para la B y una tercera para la C. 2. Cada planta produce (procesa) “quintales de café”, que pueden estar “correctos” o “incorrectos” (con cascarilla); con esta información determinamos que hay dos nuevas ramas de cada planta: la rama de “quintales correctos” y “quintales con cascarilla”. 3. De existir otras variables en juego, se seguiría abriendo ramas, pero como no las hay, aquí termina el gráfico del árbol. Página 2 de 8
El diagrama de árbol en consecuencia sería como el que a continuación se dibuja: PRIMER EVENTO Plantas A
B
C
SEGUNDO EVENTO Condiciones o calidad”
“
CORRECTO INCORRECTO CORRECTO INCORRECTO CORRECTO INCORRECTO
Ahora que ya se tiene claridad en cuanto al número de ramas en que se ha dividido el árbol, solo falta incluir los valores de probabilidad individual que le corresponde a cada rama, para luego obtener el valor de probabilidad conjunta por rama. En este caso (no siempre es así), cada primera rama de árbol representa una planta de procesamiento de café y cada planta procesa diferente cantidad (una 400, la otra 600 y la otra 1000), el valor de probabilidad de obtener al azar un quintal que provenga de A, dentro de un gran total (donde hay de A, B y C), es muy distinto del valor de probabilidad de que provenga de B y por supuesto mucho más diferente del valor de probabilidad de que provenga de C. Siendo C la planta que más cantidad aporta al total de la producción por hora, es mucho más lógico esperar que cualquier quintal que se escoja del total, tenga mayor probabilidad de ser de C, que de B o A. Si la cantidad de producción fuera estándar (igual planta) podríamos asumir que cada planta provee el 33% de la producción total y ese sería el valor de probabilidad de obtener un quintal de cualquier de ellas. El valor de probabilidad matemática o a priori, bajo tal supuesto, sería uno de tres o 1/3, lo que es lo mismo a 0.33 o 33%. Sin embargo, como para el presente caso no es así, debemos obtener el valor matemático de la probabilidad de la siguiente manera: PROCEDIMIENTO PARA OBTENER EL VALOR DE PROBABILIDAD INDIVIDUAL DE LA PRODUCCIÓN POR PLANTA 1. Se suman los valores absolutos de la producción generada por cada planta. Para el presente caso sería: 400 + 600 + 1000 lo que nos da un total de 2000 (unidades o quintales por hora, en este fábrica) Página 3 de 8
2. Se divide la producción individual de plante, entre la producción total de fábrica. Así: a. Pala la planta “A” sería: 400/2000, lo que nos da un valor de 1/5, o lo que es lo mismo: 0.20 o 20% b. Para la planta “B” tendríamos: 600/2000 = 0.30 o 30% c. Para la planta “C” sería: 1000/2000 = 0.50 o 50% Como medio de comprobación podemos sumar todos los valores relativos obtenidos, esto es 0.20 + 0.30 + 0.50 y el resultado debe ser la unidad (1). Si la suma no suma “uno”, es indicativa de que existe un error; de ser así, habría que volver a revisar las operaciones. 3. Ahora ya se está en disposición de colocar en cada rama del árbol (la que corresponde a cada planta de procesamiento de la fábrica) su correspondiente valor de probabilidad individual. Esto sería: PRIMER EVENTO Plantas A
0.20
B
0.30
C
0.50
SEGUNDO EVENTO Condiciones o calidad”
“
4. Solo resta obtener los valores de probabilidad individual de quintales correcta e incorrectamente por planta. Así: a. En la primera planta se tiene que el registro indica que de cada 400 procesados, 10 se obtienen con error (con cascarilla). Si se desea saber el porcentaje de los con error tendríamos que dividir 10 entre 400; si se quiere saber el porcentaje (o valor de probabilidad de quintales procesados correctamente) se tendría que restarle a los 400 los 10 malos y luego este resultado (390) dividirlo entre 400 de nuevo, para obtener el valor de probabilidad de los correctos. Por cualquiera de los dos métodos, una vez obtenida una respuesta (para correcta o incorrectos), por diferencia con la unidad se podría obtener la otra respuesta. Observe:
Página 4 de 8
10/400 = 0.025 incorrectos. Si a la unidad se le resta el 0.025, dará como correctos: 0.975 El mismo resultado se obtendría si a los 400 se les hubiera restado los 10 incorrectos y, los 390 (correctos) restantes se hubieran dividido entre 400. Observe y verifique 390/400 = 0.975. b. La planta “B” procesa 600 y los registros muestran 20 incorrectos del total. Si se dividen los 20 entre los 600 totales del valor de probabilidad de encontrar un incorrecto dentro de ese grupo es de 20/600 = 0.0333 Por lógica deductiva si 0.0333 es el valor de probabilidad de encontrar un incorrecto, el valor de probabilidad de encontrar un correcto dentro de tal grupo es de 0.9667 c. La planta “C” registra 40 incorrectos por cada 1000 procesados; esto quiere decir que el valor de probabilidad de encontrar un incorrecto dentro de este grupo de 1000 es de 0.04 (40/1000 = 0.04) De nuevo, el valor de probabilidad de encontrar un correcto es 1 – 0.04 = 0.96 5. Ahora ya se está en disposición de anotar en cada rama del árbol los valores de probabilidad individual que les corresponde. Esto es: por planta y por correcto e incorrecto. Obsérvese el Diagrama de Árbol con los valores de probabilidad individual que le corresponde: PRIMER EVENTO Plantas Probabilidad Individual A 0.20 B 0.30 C 0.50
Página 5 de 8
SEGUNDO EVENTO Condiciones o calidad”
“
Probabilidad Individual CORRECTO
= 0.975
INCORRECTO
= 0.025
CORRECTO
= 0.9667
INCORRECTO
= 0.0333
CORRECTO
= 0.96
INCORRECTO
= 0.04
PROCEDIMIENTO PARA OBTENER LOS VALORES DE PROBABILIDAD CONJUNTA 1. Los valores de probabilidad “conjunta” son el resultado de multiplicar, en línea: “rama por rama ”. En este caso el valor de probabilidad individual de que el quintal obtenido al azar sea de la planta “A” = 0.20 por el valor de probabilidad individual de que sea un incorrecto de esta planta (0.025) o sea 0.20 x 0.025 = 0.005 De igual manera para todas las ramas finales así: Final de rama uno: 0.20 (planta “A”) x 0.025 (incorrecto) = 0.005 = 0.00, por aproximación. Nota: no necesariamente habrá que simplificar o aproximar a dos cifras. Si el estudiante lo prefiere, para manejar las cifras más exactas puede utilizar tres o cuatro decimales, o bien basarse en el criterio dado por su profesor. Valor de probabilidad conjunta, esto es: un quintal escogido al azar entre esa producción de 400 (planta “A”) y que además este incorrecto. Final de la rama dos: 0.20 (planta “A”) x 0.975 (correcto) = 0.195 (0.20, por aproximación) y así sucesivamente. Los valores de probabilidad conjunta de todas las ramas (de la 1 a la 6 inclusive) son:
Rama 1: 0.20 x 0.025 Rama 2: 0.20 x 0.975 Rama 3: 0.30 x 0.033 Rama 4: 0.30 x 0.967 Rama 5: 0.50 x 0.04 Rama 6: 0.50 x 0.96
= 0.00 = 0.195 = 0.0099 = 0.2901 = 0.02 = 0.48
= 0.00 = 0.20 = 0.01 = 0.29 = 0.02 = 0.48
Suma de todas las ramas: 1.00 2. Anote al final de cada rama, su correspondiente valor de probabilidad conjunta. Un método para determinar si los valores de probabilidad conjunta están bien calculados es sumar uno a uno los valores de probabilidad conjunta y el resultado como siempre, debe ser la unidad.
Página 6 de 8
PRIMER EVENTO
SEGUNDO EVENTO
Plantas
Condiciones o calidad”
“
Probabilidad Individual
Probabilidad Individual
A 0.20 B 0.30 C 0.50 SUMAS
Conjunta
CORRECTO
= 0.975
0.195
INCORRECTO
= 0.025
0.005
CORRECTO
= 0.9667
0.29
INCORRECTO
= 0.0333
0.01
CORRECTO
= 0.96
0.48
INCORRECTO
= 0.04
0.02
1.00
1.00
1.00
PROCEDIMIENTO PARA DAR RESPUESTA AL PROBLEMA PLANTEADO: 1. Seleccionar la información necesaria, con base a la fórmula propuesta:
P (A) · P (A/X)
T. Bayes =
P (A) ·P (A/X) + P (B) ·P (B/X) + P(C) ·P(C/X) +
…
2. Operar matemáticamente. 3. Enunciar la respuesta. Retomando el ejemplo ilustrativo, se tiene por pregunta: Si se selecciona un quintal al azar (sin previa verificación y sin saber de qué planta proviene), y resulta ser un quintal que tiene cascarilla, determinar el valor de probabilidad de que éste haya sido llenado por la planta A. Aplicando el procedimiento se tiene:
Página 7 de 8
1. Seleccionar la información necesaria, con base a la fórmula propuesta:
P (A) · P (A/X)
T. Bayes =
P (A) ·P (A/X) + P (B) ·P (B/X) + P(C) ·P(C/X) +
…
En este caso, el valor de probabilidad de que suceda el evento P(A), (que para el caso debe leerse: saco con cascarilla o incorrecto) que provenga de la planta “A”. El valor de probabilidad conjunta para evento es de 0.005 (observe valor final de la rama A, incorrecto) Observe que la fórmula cambió en el numerador los símbolos que corresponden al problema tratado. Sobre todos los valores de probabilidad conjunta que participan. Así:
0.20 · 0.025
T. Bayes =
0.20 · 0.025 + 0.30 · 0.033 + 0.50 · 0.04 Observe que los valores de probabilidad conjunta que se están anotando en el denominador son sólo aquellos que muestran la probabilidad de obtener sacos con cascarillas (incorrectos). No toma en cuenta los correctos, ya que la pregunta se refirió a incorrectos, no a correctos. Además, se incluye al universo de plantas que incurren en tal error. 2. Operar matemáticamente.
0.005
T. Bayes =
0.005 + 0.01 + 0.02 Que es igual a: 0.1428 3. Enunciar la respuesta. El valor de probabilidad de que al seleccionar un saco de café con cascarilla, éste provenga de la planta “A”, es del 14.28%
Página 8 de 8