ESTADÍSTICA Algunas Algunas distribuc distribucione ioness import important antes es de variab variables les aleatoria aleatoriass discretas discretas Vladimiro Contreras Tito
[email protected]
25 de mayo de 2017
Índice Índice
1
1. Distribuc Distribución ión de Bernoulli Bernoulli
2
2. Distribuc Distribución ión Binomial Binomial
2
3. Distribuc Distribución ión Geométrica Geométrica
3
4. Distribuc Distribución ión Binomial negativ negativa o Pascal Pascal
4
5. Distribuc Distribución ión Hipergeométric Hipergeométricaa
5
6. Distribuc Distribución ión de Poisson Poisson
6
7. Aproximac Aproximación ión de la distribución distribución binomial binomial a la Poisson Poisson
8
8. Ejercicios Ejercicios de aplicac aplicación ión
8
1
2
DISTRIBUCIÓN BINOMIAL
1. Distribución de Bernoulli Se denomina prueba o ensayo de Bernoulli a todo experimento aleatorio que consiste de solo dos resultados posibles mutuamente excluyentes, generalmente llamados éxito (E) y fracaso (F). El espacio muestral asociado al experimento aleatorio de Bernoulli se puede escribir como el conjunto Ω = {E, F }.
Definición 1.1. La v.a. X definida en Ω de manera que atribuye a E el valor 1 y a F el valor 0, se denomina v.a. Bernoulli.
Definición 1.2. Si p = P [X = 1] es la probabilidad de éxito siendo 0 ≤ p ≤ 1 y q = P [X = 0] = 1 − p es probabilidad de fracaso, la distribución de probabilidad de Bernoulli de parámetro p es descrita por la ecuación f (x) = P [X = x] = p x q 1−x , x = 0, 1
Teorema 1.1. Si X tiene distribucuón de Bernoulli de parámetro p, entonces E (X ) = p
,
V (X ) = p q
Ejemplo 1.1. Supongamos que un experimento aleatorio X consiste en seleccionar un artículo defectuoso de un lote de 100 que contienen 5 artículos defectuosos. Halle la distribución de probabilidad de X , dado que X es una v.a. de Bernoulli.
Solución X : N de artículos defectuosos. o
5 95 = 0, 05 , q = = 0, 95 100 100 Luego, la distribución de probabilidad de Bernoulli de parámetro p es: p =
f (x) = P [X = x] = 0, 05x 0, 951−x ,
x = 0, 1
2. Distribución Binomial El experimento binomial se caracteriza por ser un experimento aleatorio que consiste en efectuar n pruebas independientes y repetidas de Bernoulli. La probabilidad de éxito p se mantiene constante a través de las n pruebas.
Definición 2.1. Se denomina variable binomial, a la v.a. X definida en Ω como el N de éxitos que ocurren en las n pruebas de Bernoulli . Los posibles o
valores de X son: 0, 1, 2,...,n. V. Contreras T.
Página 2
3
DISTRIBUCIÓN GEOMÉTRICA
Definición 2.2. Se dice que la v.a. binomial X tiene distribución binomial con parámetros n y p y se escribe X ∼ B(n, p), si su función de probabilidad es: f (x) = P [X = x] =
n x
px q n−x , x = 0, 1, 2,...,n.
Teorema 2.1. Si X ∼ B(n, p), entonces E (X ) = n p
,
V (X ) = n p q
Ejemplo 2.1. La probabilidad de producir un artículo defectuoso en una fábrica es: 0,1. Halle la probabilidad de que: 1. un lote de 12 artículos contenga 2 defectuosos. 2. al revisar 6 lotes de 12 artículos se encuentre al menos 1 lote con 2 defectuosos.
Solución X : N de artículos defectusos en los 12 artículos del lote. X ∼ B(12, p) donde p = 0, 1 probabilidad de éxito. a). 12 P [X = 2] = 0, 12 0, 912−2 = 0, 23 2 o
b). Y : N de lotes con 2 artículos defectuosos de los 6 lotes revisados. X ∼ B(6, p) donde p = 0, 23 y q = 0, 77. o
P [X ≥ 1] = 1 − P [Y = 0] = 1 −
6 0
0, 230 0, 776 = 0, 79
3. Distribución Geométrica Consideremos una sucesión de ensayos de Bernoulli, Si X representa el N de pruebas hasta conseguir el primer éxito después de x − 1 fracasos, se llama v.a.geométrica. o
Definición 3.1. Se dice que la v.a. geométrica X tiene distribución geométrica con parámetro p y se escribe X ∼ G( p), si su función de probabilidad es: f (x) = P [X = x] = (1 − p)x−1 p
,
x = 1, 2, .....
,
0 < p < 1
Teorema 3.1. V. Contreras T.
Página 3
4
DISTRIBUCIÓN BINOMIAL NEGATIVA O PASCAL
Si X ∼ G( p) entonces E (X ) =
1 p
,
V (X ) =
q p2
Ejemplo 3.1. En cierta fábrica la probabilidad de producir un artículo defectuoso es 0,1. Halle la probabilidad de que: 1. Sea necesario revisar 5 artículos para hallar el primer defectuoso. 2. Halle la esperanza y la varianza de la distribución.
Solución X : N de artículos que se necesita revisar para encontrar el primer defectuoso. a). X ∼ G(0, 1) o
f (5) = (1 − 0, 1)5−1 0, 1 = 0, 06561 b). E (X ) =
1 = 10 0, 1
,
V (X ) =
0, 9 = 90 0, 12
4. Distribución Binomial negativa o Pascal La v.a. X que se define como el N de intentos hasta que ocurra el éxito número r se llama v.a. binomial negativa o de Pascal. o
Definición 4.1. Se dice que la v.a. binomial negativa o Pascal X tiene distribución Pascal con parámetros p y r ( r > 0 , X ∼ Pascal( p, r), si su función de probabilidad es: f (x) = P [X = x] =
x − 1 r−1
(1 − p)x−r pr
,
0 < p < 1) y se escribe
x = r, r + 1, r + 2, ....
Teorema 4.1. Si X ∼ Pascal( p, r) entonces E (X ) =
r p
,
V (X ) =
r (1 − p) p2
Ejemplo 4.1.
V. Contreras T.
Página 4
5
DISTRIBUCIÓN HIPERGEOMÉTRICA
Una máquina se utiliza para fabricar cierto tipo de objetos en serie. Se sabe que la probabilidad de que cada objeto sea defectuoso es 1/10. Si se controla la calidad de cada objeto producido y si la máquina se apaga cuando se producen 4 objetos defectuosos, ¿cuál es la probabilidad de que se pare la máquina en el décimo objeto producido?
Solución X: N de objetos producidos hasta controlar 4 defectuosos. Los posibles valores de X son 4,5,6,... cada objeto se produce independientemente con probabilidad p = 1/10 = 0, 1 de que sea defectuoso. La máquina se para si se encuentran r = 4 defectuosos. La probabilidad de que se pare la máquina en el décimo objeto producido es: o
f (10) = P [X = 10] =
10 − 1 4−1
(1 − 0, 1)10−4 0, 14 = 0, 00446
5. Distribución Hipergeométrica Un conjunto de N objetos contiene r objetos clasificados como éxitos y N − r objetos clasificados como fracasos. Se selecciona una muestra con tamaño de n objetos al azar (sin reemplazo) de los N objetos, donde r ≤ N y n ≤ N .
Definición 5.1. La v.a. X que se define como el N de exitos en una muestra de tamaño n que se selecciona al azar sin reposición de N objetos de los cuales r son clasificados como éxitos y los restantes N − r como fracasos, se llama v.a. hipergeométrica. o
Definición 5.2. Se dice que la v.a. hipergeométrica X tiene distribución hipergeométrica y se escribe X ∼ H (N,n,r), si su función de probabilidad es: C xr C nN −−xr f (x) = P [X = x] = C nN
,
x = 0, 1, 2, 3, ....
Teorema 5.1. Si X ∼ H (N,n,r) entonces E (X ) = n p
,
V (X ) = n p q
N − n N − 1
r , q = 1 − p donde p = N Además si N tiende a +∞ entonces H (N,n,r) se aproxima a una distribución binomial B(n, p) (la aproximación es buena si n ≤ 0, 1 × N )
Ejemplo 5.1.
V. Contreras T.
Página 5
6
DISTRIBUCIÓN DE POISSON
Un lote contiene 100 piezas de un proveedor "A&B" de tuberías y 200 unidades de un proveedor "Plastic" de tuberías. Si se seleccionan 4 piezas al azar y sin reemplazo. 1. ¿Cuál es la probabilidad de que todas sean del proveedor "A& B"? 2. ¿Cuál es la probabilidad de que dos o más piezas de la muestra sean del proveedor "A& B"? 3. ¿Cuál es la probabilidad de que al menos una pieza de la muestra sea del proveedor "A& B"?
Solución X : N de piezas de la muestra del proveedor "A& B". a). C 4100 C 0200 = 0, 0119 P [X = 4] = C 4300 o
b). P [X ≥ 2] =
C 2100 C 2200 C 3100 C 1200 C 4100 C 0200 + + = 0, 408 C 4300 C 4300 C 4300
c). P [X ≥ 1] = 1 − P [X = 0] = 0, 196
6. Distribución de Poisson Dado un intervalo de números reales, suponga que ocurren conteos al azar a lo largo del intervalo. Si puede hacerse la partición del intervalo en subintervalos con una longitud suficientemente pequeña tal que: 1. La probabilidad de más de un conteo en un subintervalo es cero. 2. La probabilidad de un conteo en un subintervalo es la misma para todos los subintervalos y proporcional a la longitud de subintervalos. 3. El conteo en cada subintervalo es independiente de los demás subintervalos. Entonces el experimento aleatorio se denomina proceso de Poisson.
Definición 6.1. Si el número promedio de conteos en el intervalo es λ > 0, la v.a. X que es igual al número de conteos en el intervalo tiene una distribución de Poisson con parámetro λ (se escribe X ∼ P (λ)) y tiene función de probabilidad dada por: e−λ λx f (x) = P [X = x] = , x = 0, 1, 2, 3,.... x! V. Contreras T.
Página 6
6
DISTRIBUCIÓN DE POISSON
NOTA 6.1. La distribución de Poisson se aplica a problemas donde la v.a. X es el N de eventos que ocurren en un intervalo de tiempo ó en una región por ejemplo: o
N de llamadas que recibe una central telefónica en el periodo de 1 minuto. o
N de fallas de un sistema en un día dado. o
N de accidentes de trabajo que ocurren en una fábrica durante una semana. o
Teorema 6.1. Si X ∼ P (λ) entonces E (X ) = λ
,
V (X ) = λ
Ejemplo 6.1. El arribo de camiones de carga a un muelle sigue una distribución de Poisson, siendo la tasa de llegada, 2 camiones por hora. 1. Calcule la probabilidad de que en un periodo de 4 horas lleguen entre 6 y 10 camiones. 2. ¿Cuál es la probabilidad de tener que esperar más de 4 horas hasta la llegada del primer camión?.
Solución X :N de camiones que llega al muelle en una hora. En este caso λ = 2, X ∼ P (λ = 2). Y :N de camiones que llega al muelle en 4 horas. En este caso λ = 2(4), Y ∼ P (λ = 8). Entonces: o
o
e−8 8y f (y) = P [Y = y] = y! 10
y = 0, 1, 2, 3, ....
8y y!
−8
e a). P (6 ≤ Y ≤ 10) = y =6
,
e−8 80 b). P [Y = 0] = = e−8 0!
V. Contreras T.
Página 7
8
EJERCICIOS DE APLICACIÓN
7. Aproximación de la distribución binomial a la Poisson Teorema 7.1. Sea X una v.a. con distribución binomial B(n, p). Si n → ∞ , p → 0 y λ = n p, permanece constante, entonces la distribución binomial se aproxima a la distribución de Poisson con parámetro λ, esto es: P [X = x] =
x n
px (1 − p)n−x tiende a P [X = x] =
e−λ λx x!
NOTA 7.1. La aproximación es buena, si n > 30 y n p ≤ 5.
Ejemplo 7.1. Un manual se edita con un tiraje de 100000 ejemplares. La probabilidad de que un manual esté encuadernado en tela incorrectamente es igual a 0,0001. Halle la probabilidad de que el tiraje contenga exactamente 5 libros defectuosos.
Solución X : N de libros incorrectamente encuadernados en un tiraje de 100000 ejemplares. X ∼ B(100000; 0, 0001). Como n = 100000 es grande (n → ∞) y p = 0, 0001 tiende a cero, aproximemos la distribución binomial X ∼ B(100000; 0, 0001) a la distribución de Poisson P (λ) donde λ = n p = (100000) (0, 0001) = 10. Luego: e−10 105 P [X = 5] = = 0, 0375 5! o
8. Ejercicios de aplicación 1. Una máquina utiliza tres componentes idénticas que trabajan en forma independiente. La probabilidad de que falle cada componente es 0.1 y estas se cambian por nuevas una sola vez. a ) Obtenga la distribución de probabilidades del número de componentes que podrían fallar en la máquina. b) Un usuario que utiliza la máquina recibe una utilidad constante diaria de 100 soles y una utilidad variable de 10 soles por cada componente que no falla, pero, pierde 50 soles por cada componente que falla. Calcule la utilidad esperada diaria del usuario.
V. Contreras T.
Página 8
8
EJERCICIOS DE APLICACIÓN
2. La pequeña empresa "Juguetes ecológicos" empaca su producción en lotes de 5unidades. Antes de sacar al mercado la empresa realiza un control total de calidad de cada lote a un costo de 5 u.m. Si cada unidad le cuesta producir 10 u.m, lo vende a 25 u.m.y reemplaza en el lote el número X de las unidades defectuosas que encuentra y si el porcentaje de producción defectuosa es 10 %, a ) ¿Cuántas unidades defectuosas espera encontrar por lote?. Interprete su respuesta. b) ¿Cuánto es la utilidad esperada de la empresa por lote?. 3. Debido a que no todos los pasajeros que hacen una reservaciń se presentan, una aerolínea vende 125 asientos para un vuelo con capacidad para solo 120 pasajeros. La probabilidad de que un pasajero no se presente es 0,1 y el comportamiento de los pasajeros es independiente a ) ¿Cuál es la probabilidad de que todos los pasajeros que se presenten puedan tomar el vuelo? b) ¿Cuál es la probabilidad de que el vuelo parta con asientos vacios? 4. Una compañía alquila computadoras por periodos de tiempo de t horas, por lo cual recibe 600 dólares por hora. El número de veces que una computadora falla en t horas es una v.a. con distribución de Poisson con µ = 0, 8t. Si una máquina falla x veces en t horas, el costo de reparación es 50x2 dólares. ¿Qué valor de t maximiza su utilidad esperada? 5. Las unidades producidas por dos máquinas A y B, en igual proporción, llegan a una bandeja de control. El 3 % y el 1 % de las unidades producidas respectivamente por A y B son defectuosas. Un ingeniero controla la calidad del producto revisando una por una (sin devolución) las unidades de la bandeja. a ) ¿Qué probabilidad hay de que la décima unidad controlada sea la primera defectuosa?. b) ¿Cuántas unidades en promedio controla hasta que aparece la primera defectuosa?. c ) ¿Qué probabilidad hay de que la décima unidad controlada sea la tercera defectuosa?. d ) Si el ingeniero controla las unidades antes que caigan a la bandeja, calcule la probabilidad de que la primera defectuosa encontrada sea la cuarta de A y la sexta de B?.
V. Contreras T.
Página 9
8
EJERCICIOS DE APLICACIÓN
6. El proceso de producción de un bien se debe detener tan luego produzca la primera unidad que no cumpla con las especificaciones establecidas. Se estima en 0.99 la probabilidad de que una unidad producida cumpla las especificaciones. Si el objetivo es producir 150 unidades del bien de manera que cumplan con las especificaciones. a ) ¿Qué probabilidad hay de lograr el objetivo?. b) Si después de producir 100 unidades del bien aún no se ha detenido el proceso, ¿con qué probabilidad se lograría el objetivo?. 7. Un sistema eléctrico consiste de 6 componentes conectados en serie, es decir, el sistema funciona si todos las componentes funcionan. Si las componentes del sistema se seleccionan al azar de un lote de 20 que contiene tres que no funcionan. a ) Describa el modelo de probabilidad del número posible de componentes que no funcionan de los 6 escogidos y calcule la probabilidad de que el sistema no funcione. b) ¿Cuánto sería el costo esperado del sistema si cada componente tiene un costo de 4 unidades monetarias (u.m.) y si cada componente que no funcionan de los 6 seleccionados se cambia por uno del lote que si funciona a un costo adicional de 1,5 u.m.? 8. Para tomar la decisión de aceptar o rechazar lotes que contienen 20 unidades de un producto se toman tres unidades al azar del lote, si más de una unidad es defectuosa se rechaza el lote, si las tres no son defectuosas se acepta el lote y si una es defectuosa se toman otras dos unidades al azar de las 17 que quedan. Esta vez, si alguna es buena se acepta el lote, de otro modo se rechaza. Si se controla un lote que contiene 4 unidades defectuosos (se desconoce este hecho), a ) Obtenga la distribución de probabilidades del número de defectuosos en el primer y en el segundo control. ¿Con qué probabilidad se acepta el lote?. Aplique un diagrama de árbol para la solución. b) Si se rechaza el lote, ¿con qué probabilidad esto ocurra en el segundo control? 9. Un artillero dispara a un blanco y sale que la probabilidad de acertar es p = 0, 01 ¿Cu ’antos disparos tendrá que hacer para tener una probabilidad mayor que 90 % de dar en el blanco por lo menos una vez?. o
10. Solo uno de cada mil generadores ensamblados en una fábrica tienen unidades defectuosas y los generadores defectuosos se distribuyen aleatoriamente e independientemente a través de la producción. V. Contreras T.
Página 10
8
EJERCICIOS DE APLICACIÓN
a ) ¿Cuál es la probabilidad de que en un embarque de 500 generadores no contenga ningún generador defectoso? b) ¿Qué en un embarque de 100 haya por lo menos un generador defectuoso? 11. La ”Compañía Petrolera” ha sido designada para perforar pozos en la amazonia peruana hasta obtener un resultado exitoso. La Compañía estima en 0,7 la probabilidad de no hallar petróleo por cada pozo que perfora. a ) ¿Suponga que la Compañía Petrolera cree que una serie de exploraciones será rentable si el número de pozos perforados hasta que ocurra el primer exito es menor o igual que 5. Calcule la probabilidad de que la exploración no será rentable si ya fueron perforados 3 pozos y en ninguno de ellos se encontró petróleo. b) El costo para perforar cada pozo es de 10 000 dólares. Si un ensayo no resulta exitoso, el siguiente ensayo tiene costo adicional de 5 000 dólares. ¿Cuánto es el costo esperado del proyecto? c ) Si la Compañía dispone de un presupuesto de 145 000 dólares , ¿cuál es la probabilidad de que los trabajadores experimentales tengan un costo que sobrepase el presupuesto de la Compañía? 12. Un sistema de comunicaciones recibe mensajes digitales de ceros y unos. Cada dígito del mensaje puede ser recibido como correcto ó incorrecto. La probabilidad de recibir un dígito incorrecto es 0,01 y los dígitos de reciben de manera independiente. a ) ¿Con qué probabilidad un mensaje de 10 dígitos binarios se recibe incorrectamente? b) Si el sitema recibiera 15 mensajes de 10 dígitos cada uno, ¿cuál es la probabilidad de que al menos 12 de ellos se reciban correctamente? c ) Si un mensaje se recibe de forma incorrecta, se repite el envio hasta que sea recibido correctamente. ¿Con qué probabilidad un mensaje de 10 dígitos binarios es correctamente recibido en el cuarto intento? d ) Calcule el costo esperado del número de mensajes de 10 dígitos que se envian al sistema hasta conseguir el mensaje correcto si este proceso se repite 3 veces y si el costo de los 3 procesos, en décimos soles, es igual al cuadrado del número de intentos. 13. En una autopista pasan, en promedio 180 vehículos por hora. Se desea obtener la distribución de probabilidad del tiempo, en minutos, entre dos vehículos consecutivos. Si un peatón necesita 20 segundos para cruzar la pista, calcular la probabilidad de que sea capaz de hacerlo entre los dos proximos vehículos. V. Contreras T.
Página 11
8
EJERCICIOS DE APLICACIÓN
14. Un fabricante ofrece el artículo que produce en lotes de 10 unidades, de las cuales el 80 % está en buenas condiciones. El comprador plantea someter el lote a una prueba que consiste en sacar al azar dos artículos del lote y si están en buenas condiciones los dos, compra el lote; en caso contrario, lo rechaza. El costo de producción y “puesta en tienda” de cada lote es de 800 soles. Cuando se vende el lote se obtiene una utilidad de 300 soles. a ) Se desea expresar la ganancia neta por lote como función de la v.a.X que toma el valor de 1 si se vende el lote y toma el valor de cero caso contrario. b) Si cada día el fabricante ofrece 15 de estos lotes, ¿cuál es el número esperado de lotes que vende? 15. Una máquina que produce cierto tipo de objeto se apaga automáticamente cuando ha llegado a producir el 5to defectuoso. Si la probabilidad de que cada objeto producido sea defectusos es 0,05. ¿Cuál es la probabilidad de que la máquina se apague cuando ha producido 12 objetos? 16. Se estima que el 30 % de electores de una determinada ciudad votarán por el candidato HML. En una encuesta realizada en tal población, a ) ¿Cuál es la probabilidad de que la sexta persona encuestada sea la 4 ta que votará por HML? b) ¿Cuántas personas en promedio se deben encuestar hasta tener 12 que votarán por HML? 17. Una firma comercializadora de parquet recibe un lote grande de parquet en parquets de 120 unidades cada una. Un paquete es rechazado si al revisar 10 unidades de parquet elegidos al azar una a una sin reposición se encuentrán 3 o más defectuosos. Calcule la probabilidad de que un paquete sea aceptado si este contiene 20 % de defectuosos. a ) A partir de la verdadera distribución del número de objetos defectuosos que se encuentra en la revisión. b) Utilizando una aproximación adecuada. 18. Suponga que el número de accidentes de trabajo que se producen por semana en una fábrica sigue la ley de Poisson de manera que la probabilidad de que se ocurran 2 accidentes es igual a 2/3 de la probabilidad de que ocurra un accidente. Calcule la probabilidad de que no ocurran accidentes en 3 semanas consecutivas. 19. Las fallas superficiales en ciertas placas de metal siguen una distribución de Poisson con una media de 0,04 fallas por placa. Una empresa solicita V. Contreras T.
Página 12
8
EJERCICIOS DE APLICACIÓN
un pedido grande de estas placas al fabricante y puede seguir uno de los siguientes procesos de inspección. Proceso 1: Inspecciona 35 placas al azar y si encuentra menos de 3 con fallas acepta el pedido. Proceso 2: Inspecciona una por una las placas y si encuentra la tercera 3 placa con falla en la inspección 25, detiene la inspección y rechaza el pedido. ¿Con cuál de estos dos procesos es más probable que rechace el pedido? 20. Las fallas en los rollos de tela de algodón de la empresa "Textiles P&C" se producen a través de un proceso de Poisson y con una tasa de de faila de λ = 0, 05 por metro. El control de calidad de los rollos de 100 metros, consiste en escoger de cada rollo una sección al azar de 20 metros de longitud, si esta contiene más de una falla, el rollo será reemplazado por uno nuevo. En caso contrario el rollo pasará el control y se venderá en el mercado. a ) ¿Qué probabilidad existe de que pase el control un rollo que contiene 2 errores? b) Cada rollo tiene un costo de producción de 100 dólares y se vende en el mercadoa a 200 dólares. La empresa garantiza restituir todo rollo que contenga no cumpla las especificaciones de control (es decir, que tenga mas de 5 fallas) y más aún indemnizar por este motivo al consumidor con 20 dólares. Halle la utilidad esperada que generarán los rollos que tienen tres fallas. 21. Uno de los productos principales de la empresa "Algodón H&A" es una tela que saca al mercado en rollos de 60 metros de longitud, donde, el número de puntos fallado de la tela se distribuyen de acuerdo al modelo de probabilidad de Poisson con una tasa de falla de uno por cada 10 metros. El control de calidad de la tela consiste en selcccionar al azar de cada rollo una sección de 5 metros de longitud concluyendo que el rollo no cumple las especificaciones y por lo tanto es rechazado, si en esta sección se halla más de un punto fallado. Si un consumidor de esta tela recibe 200 rollos de 60 metros cada uno, y aplica el procedimiento de control indicado. a ) ¿Cuántos rollos que cumplen las especificaciones se rechazarán?. b) ¿Cuántos rollos pasarán el control, si cada uno tiene 7 defectos?
V. Contreras T.
Página 13