INSTITUCIÓN UNIVERSITARIA “ANTONIO JOSÉ CAMACHO” TALLER PRIMER ENCUENTRO ESTADÍSTICA APLICADA A LA SALUD OCUPACIONAL I TALLER Conceptos básicos de probabilidad Experimento aleatorio: Antes de su realización, conocemos de antemano todos sus posibles resultados,
pero no el resultado concreto que vamos a obtener, aunque se observan regularidades al repetir varias veces el experimento. Espacio muestral (S) : El conjunto de todos los posibles resultados de un experimento aleatorio, normalmente se representa por S. Por ejemplo, si lanzamos una moneda nuestro espacio muestral tiene 2 elementos y coincide con S= {c, s} donde c=cara y s= sello. Evento : Es un subconjunto del espacio muestral S. Esto implica que S también es un evento así como lo es el conjunto vacío. Cualquier resultado individual también puede considerarse como un evento. Se dice que dos eventos A y B, son mutuamente excluyentes si no pueden ocurrir juntos; es decir, la intersección de A y B es el conjunto vacío. Enfoques de probabilidad
La probabilidad clásica es aquella que se toma de manera objetiva, puesto que se conoce el número exacto de opciones a ocurrir y presenta un resultado exacto y que puede considerarse a priori. - Probabilidad a Priori . La probabilidad de un evento A, P(A), es la medida del chance de que ese evento ocurra. En este caso los resultados del experimento son igualmente probables. Este método fue desarrollado por Laplace. # de maneras que A puede ocurrir P(A) = ------------------------------------------------# total de resultados posibles Clásica:
Ejemplo.
Se lanzan dos monedas al aire, ¿cuál es la probabilidad de que ambas sean cara (C)? S = {CC, CS, SC, SS} A = {CC} P (CC) = ¼ Frecuentista o Probabilidad a posteriori . En el caso que los eventos no poseen igual posibilidad de
ocurrencia, el problema de asignar las probabilidades ocurre a posteriori. El concepto de probabilidad a posteriori lo desarrolla Richard Von Mises y se conoce también como de frecuencia relativa y es apropiado cuando se tienen los datos para estimar la proporción del tiempo que ocurrirá el evento en el experimento si el experimento se repite un número grande de veces y cuyos resultados no son exactos. Frecuencia relativa: Supongamos que repetimos n veces un experimento, y sean A y B dos eventos asociados con el experimento. Sean n A y nB el número de veces que el evento A y el B (respectivamente) ocurrieron en las n repeticiones. Entonces, definimos f A A = n A / n como la frecuencia relativa del evento A en las n repeticiones del experimento. La frecuencia relativa f A A tiene las siguientes propiedades: -
0 ≤ f A ≤ 1.
f A = 1 si y sólo si A ocurre cada vez en las n repeticiones. f A = 0 si y sólo si A nunca ocurre en las n repeticiones. Si A y B son dos eventos mutuamente excluyentes (o sea con frecuencia conjunta 0), y si f(A U B) es la frecuencia relativa asociada al evento A U B, entonces f(A U B) = f A A + f B. f A, basada en la n repeticiones del experimento y considerada para una función de n, "converge" en cierto sentido probabilístico a P(A) cuando n-- >+∞. (Esto no es lo mismo que el concepto corriente de convergencia que se encuentra en otra parte en matemáticas. En realidad, ésta no es una conclusión matemática, sino simplemente un hecho empírico.) Lo importante de esta propiedad es que si un
experimento se realiza un gran número de veces, la frecuencia relativa con que ocurre un evento A tiende a variar cada vez menos a medida que el número de repeticiones aumenta. Subjetiva: esta probabilidad ocurre cuando no existen frecuencias ni sabemos el número de opciones a ocurrir, por lo tanto es asignada de forma subjetiva por expertos en el área específica. Axiomas de probabilidad: Sea E un experimento y S un espacio muestral asociado con E. Con cada evento
A asociamos un número real, designado con P(A) y llamado probabilidad de A, el cual satisface las siguientes propiedades: -
0 ≤ P(A) ≤1
P(S) = 1 Si A y B son dos eventos mutuamente excluyentes, P(A U B) = P(A) + P(B) Si AC es el evento complementario de A, entonces P(A) = 1 - P(A C) Si A y B son dos eventos cualesquiera, entonces P(A U B) = P(A) + P(B) - P(A ∩ B) Si S = Ai entonces P(S) = P(Ai) A : Partición
Ejemplos
1. Una empresa necesita aportes de sus socios para dos proyectos. La probabilidad de que los socios aporten al proyecto A es del 30%, de que aporten al proyecto B es del 60% y de que aporten en ambos es del 8% ¿Qué probabilidad hay de que aporten al menos en un proyecto? Solución
Al menos a 1 sería al proyecto A o al proyecto B o a ambos, esto se define como la unión de dos conjuntos P(A U B) = P(A) + P (B) – P(A B) = 0.3 + 0.6 - 0.08 = 0.82 PROBABILIDAD MARGINAL Y CONJUNTA
Una manera, muy usada en la práctica, para denominar la probabilidad de un evento simple en un espacio muestral es como probabilidad simple o marginal , la cual hace referencia a la probabilidad de un evento simple, y se denota con P(A), siendo A el evento simple en cuestión. El nombre de probabilidad marginal se debe a que esta medida se puede obtener a partir de los totales marginales de una tabla de contingencia. Ejemplo
Si en un estudio se hace una encuesta a 800 alumnos de una universidad sobre el grado de satisfacción con la carrera y el grado de satisfacción con el progreso en la misma. Los resultados de la encuesta se muestran en la siguiente tabla. Satisfecho carrera Si No Total
en
la Si 362 18 380
Satisfecho en su progreso No Total 350 712 70 88 420 800
La probabilidad de que un alumno se encuentre satisfecho con la carrera, es decir, la probabilidad de que ocurra el evento A = “satisfecho con la carrera elegida” será igual al número de alumnos que están satisfechos
(712) divido por el número de total de alumnos encuestados (800), es decir, P(A) = 712/800 = 0.89. Esta es una probabilidad marginal. La denominación de probabilidad conjunta se utiliza para referirse a la probabilidad de ocurrencia de dos o más eventos simples simultáneamente. Por ejemplo, si se usa los datos del ejemplo, la probabilidad de que ocurran simultáneamente los siguientes eventos simples A = “el alumno está satisfecho con su carrera” y B = “el alumno está satisfecho con su avance en la carrera” se calcula como el número de alumnos que se
encuentran satisfechos tanto con la carrera como con sus avances en la misma (362, que es donde se cruzan las dos opciones requeridas) divido por el número total de alumnos encuestados (800), y se denota con P(A y B) o con P( A ∩ B ) puesto que es una intersección y en esta caso es igual a 362/800 = 0.4525. Observaciones:
1. Las definiciones dadas hasta ahora, son aplicables a situaciones donde el espacio muestral S se considera formado por n puntos. Por ejemplo, en la encuesta de alumnos n= 800. Cada uno de estos puntos (empleados) tiene probabilidad 1/n= 1/800 de ser elegido al azar. 2. Si el espacio muestral es particionado en r eventos, A 1, A 2,…, Ar , que definen una característica como por ejemplo “Satisfacción con la carrera”; y si en este mismo espacio se considera otra partición generada por s eventos B1, B2,…, Bs, que definen otra característica como ser “Satisfacción con su progreso en la carrera”,
entonces el espacio muestral S queda particionado en r s subconjuntos. En el ejemplo de la encuesta, r = s = 2, y donde A1 = “Si está satisfecho con la carrera”, A 2= “No está satisfecho con la carrera”, B 1= “Si está satisfecho con su progreso” y B 2= “No está satisfecho con su progreso”, luego el espacio muestral queda dividido en 4 subconjuntos a saber A 1∩B1, A2∩B1, A 1∩B2, A 2∩B2, y sus respectivas probabilidades P[A i∩B j] = P[Ai y B j], son las ya definidas probabilidades conjuntas, mientras que las probabilidades de los eventos determinados por cada partición, es decir, P[A i] y P[B j] son las probabilidades marginales correspondientes a la primera y segunda partición respectivamente. 3. Si dos eventos no tienen puntos comunes, es decir, ellos no pueden ocurrir simultáneamente (no se cruzan), entonces, se dice que son mutuamente excluyentes. Por otra parte, un conjunto de eventos se dice que son colectivamente exhaustivos, si uno de ellos debe ocurrir necesariamente. Por ejemplo, A 1 y A2 son mutuamente excluyentes y colectivamente exhaustivos, ¿Por qué? Porque son complementos ¿Lo son también A1 y B2? 4. A partir de la definición de probabilidad conjunta, y considerando que el número de alumnos que presentan la característica A1= “están satisfechos con la carrera” se obtiene sumando el número de alumnos que pertenecen al evento (A 1∩B1) y al evento (A1∩B2), entonces se verifica que: P[A 1] = P[A1∩B1] + P[A1∩B2]. 5. En general si B 1, B2,…, Bk son eventos mutuamente excluyentes y colectivamente exhaustivos y A es cualquier evento definido en el mismo espacio muestral, se verifica que: P(A) = P[A∩B 1] + P[A∩B2] + … + P[A∩B k] PROBABILIDAD CONDICIONAL E INDEPENDENCIA
El concepto de Probabilidad Condicional surge cuando se quiere obtener la probabilidad de un evento A, y se tiene conocimiento que ya ocurrió otro evento B relacionado al primero y se denota con P[A|B] la cual se lee como “probabilidad de A dado B”, o también como “la ocurrencia de A de los que son de B”. Una pregunta que podría hacerse el lector es sobre la necesidad de introducir este concepto. Para obtener una respuesta a este interrogante, al menos intuitivamente, supongamos se quiere conocer la probabi lidad del evento A = “lloverá” y se sabe que se presentó el evento B = “está nublado”. Intuitivamente se percibe que la P[A] aumentará si se
sabe que ocurrió B ya que ambos eventos están relacionados. Ejemplo
Antes de dar la definición de probabilidad condicional considérese los datos de la encuesta a los 800 estudiantes y siguiendo la notación dada, se quiere calcular P[está satisfecho con la carrera / está satisfecho con su progreso en la misma] = P[A/B]. El número de estudiantes satisfechos con la carrera dentro de los 380 estudiantes no satisfechos con su progreso es 362, entonces se verifica que P[A/B] = 362/380 = 0.9526, o sea, que de los que están satisfechos con el progreso de la carrera, qué porcentaje o cuál es la probabilidad de que estén satisfechos con la carrera. Tres cosas debe observarse en esta igualdad:
(a) Si no se dispone de la información sobre B’, entonces P[A]= 712/800 = 0.89 es decir, la probabilidad de A
sin el conocimiento de que ocurrió B es menor que P[A/B]. (b) El numerador (362) es el número de estudiantes que están satisfechos con la carrera y están satisfechos con su progreso en la misma, es decir pertenecen al evento conjunto “A y B” (la intersección). (c) El denominador (380) es el número de empleados que pertenecen al e vento “B”, esto equivale a considerar un nuevo espacio muestral donde el número de puntos se redujo de 800 a 480, el total de los que están satisfechos con el progreso. (d) Si se divide numerador y denominador de la igualdad por 800, es decir, el número total de estudiantes, se tiene que P[A/B]
362/800
0.9526 380/800 Y entonces se debe observar que el numerador es la P[A y B]= P[A∩B] y el denominador es P[B].
A partir de esta última observación surge naturalmente la definición formal del concepto de Probabilidad Condicional para dos eventos cualesquiera A y B, como: P[A/B]
P[A B)
P[A y B]
P[B]
P[B]
La comparación de los valores obtenidos de P[A/B] con P[A] en el ejemplo revela cierta información importante: el conocimiento del progreso en la carrera afecta la predicción de la satisfacción con la carrera elegida. Por lo tanto, desde una perspectiva estadística se puede establecer que estos eventos están asociados de alguna manera. Esto lleva a definir uno de los conceptos más importantes de la estadística y que es el concepto de Independencia Estadística de la siguiente manera: Dos eventos A y B se dice que son independientes estadísticamente si P[A/B]=P[A] o P[B/A]=P[B] o P[A∩B]=P[A]P[B]
Es decir que el conocimiento de la ocurrencia de B no afecta a la P [A].
NOMBRE: CARLOS ANDRES GUZMAN GRUPO: 6490. SALUD OCUPACIONAL.
TALLER A continuación se presentan tres ejercicios los cuales deben resolverse y enviarse previamente en la plataforma en PDF, según lo indicado en la agenda para el primer encuentro. Ejercicio #1
Considere experimento de lanzar un dado no alterado en una ocasión, para este caso: 1. Describa el espacio muestral asociado a este experimentó. S= (1,2,3,4,5, 6) 2. Calcule la probabilidad del evento: obtener el número 5 en el lanzamiento. S= (1,2,3,4,5, 6) P(A)=1/6 = 0.166 = 16.6% 3. Calcule la probabilidad del evento: obtener un número par en el lanzamiento. S= (1, 2 ,3 ,4 ,5 ,6) P(A)=3/6 = 0.50 = 50% 4. Calcule la probabilidad del evento: obtener un número menor que cinco en el lanzamiento. S= (1, 2 ,3 ,4 ,5 ,6) P(A)=4/6 = 0.66 = 66%
5. Indique si la siguiente afirmación es falsa o verdadera : Los eventos simples de este experimento son independientes. ( V )
6. Pruebe que resultado1.
la suma de los
eventos
excluyentes que componen el espacio muestral
R//= S= (1, 2, 3, 4, 5, 6) A= (SI SALE UN NUMERO PAR); P (A) = 3 / 6 = 0,50 P (B) = 3 / 6 = 0,50 P(A U B) = 0,50 + 0,50 = 1
B= (SALE UN NUMERO IMPAR)
da como
Ejercicio #2
Cooper Realty es una empresa pequeña de bienes raíces que se especializa en inmuebles habitacionales. Recientemente les ha interesado determinar la posibilidad de que una de sus propiedades se venda dentro de cierto tiempo. Un análisis de las ventas de 800 casas, efectuada por esa empresa en años pasados, arrojó los datos siguientes: Días hasta la venta Menos de De 31 a Mas de 30 90 90
Oferta inicial
Menos de 50 millones De 50 a 100 millones De 100 a 150 millones Más de 150 millones Total
Tota l
50
40
10
100
20
150
80
250
20
280
100
400
10
30
10
50
100
500
200
800
7. Estime la probabilidad de que una casa se vende en más de 90 días. P(A) = 200/800 = 0.25 = 25%
8. Determine la probabilidad de que una casa se venda en más de 90 días y cueste más de 150 millones. A= MAS DE 90 DIAS B=MAS DE 150 MILLONES
P( A ∩ B ) P(A) = 200/50 = 4 = 4%
9. Suponiendo que se acaba de firmar un contrato para anunciar una casa cuyo precio inicial es menor de 50 millones, ¿Cuál es la probabilidad de que Cooper Realty tarde más de 90 días en venderla? (probabilidad condicional). A= MENOS DE 50 MILLONES B=MAS DE 90 DIAS
P( A ∩ B ) P(A)= 100/200= 0.5 = 50%
10. Suponiendo que Cooper Realty tardó de 31 a 90 días en vender una casa, ¿Cuál es la probabilidad de que cuyo precio inicial sea entre 100 y 150 millones? (probabilidad condicional) A= DE 31 A 90 DIAS B= ENTRE 100 Y 150 MILLONES
P( A ∩ B ) P(A) = 400/500 = 0.8 = 80%
Ejercicio #3
11. Una caja contiene ocho artículos en buen estado y tres defectuosos, se extraen dos de ellos de manera consecutiva, calcule La probabilidad de que los dos artículos sean defectuosos S=(1,2,3,4,5,6,7,8) Artículos en buen estado = 5/8 Defectuosos= 3/8 S=(1,2,3,4,5,6,7) Artículos en buen estado = 5/7 Defectuosos= 2/7 = 0.28 = 28%
Ejercicio #4 (distribución de probabilidad binomial)
Considere el caso de un jugador de baloncesto con una efectividad de encestar del 60% en disparos desde la línea de tiros libres. Si en un partido le dan la oportunidad de cobrar una falta técnica y realizar cinco lanzamientos seguidos desde la línea de tiros libres. 12. ¿Cuál es la probabilidad que acierte exactamente en tres de los lanzamientos? T= 5 tiros X= 3 probabilidad E= 60% = 0.6 efectividad F= 1 – E = 0.4 5
5
P(X=3) = (3)0.63 X 0.45−3 = P(X=3) = (3)0.63 X 0.42
(53) =
5! = 10 3!5−3!
P(X=3) = 10 X 0.63 X 0.42 = 0.3456 de probabilidad de acierto en los tres lanzamientos.
13. ¿cuál es la probabilidad que acierte en máximo un lanzamiento? T= 5 tiros X= 1 probabilidad E= 60% = 0.6 efectividad F= 1 – E = 0.4 5
5
P(X=1) = (1)0.61 X 0.45−1 = P(X=1) = (1)0.61 X 0.4
(51) =
5! = 5 1!5−1!
P(X=1) = 5 X
0.61 X 0.4 = 0.0768
de probabilidad de acierto en un lanzamientos.