MODELOS
PROBABILISTICOS
O
DISTRIBUCIONES
DE
PROBABILIDAD INTRODUCCIÓN. Estadística. Herramienta analítica de apoyo a la investigación que se genera genera en la Ingeniería. Investigación. Cada vez tiende a una una presentación sintética de los resultados de una investigación. Presentación sintética. sintética. Expresión matemática (Modelo de probabilidad) que que relaciona las diversas variables y parámetros inmersos en una investigación. i nvestigación.
MODELO PROBABILISTICO . Un modelo probabilístico o distribución de probabilidad es una expresión matemática deducida de un conjunto de supuestos con el doble propósito: de describir el comportamiento de un experimento aleatorio y de predecir resultados futuros del experimento cuando se realiza repetidas veces. Los modelos que exponemos son las que adopta más comúnmente el ingeniero para su uso empírico. Esto se debe a que son bien conocidos, están tabulados y se opera fácilmente con ellos. La deducción entre modelos probabilísticos comunes, se basa basa en: La forma del polígono de frecuencias, cuando se trata de una variable. La forma del diagrama de dispersión cuando se trata de 2 variables. En el mecanismo mecanismo físico que genera el fenómeno bajo estudio. (* ) Frecuentemente, lo único de que dispone el ingeniero es ese camino empírico. Con el fin de que las conclusiones sean las más exactas y útiles posibles, y justificar cuando sea necesario la extrapolación fuera de los datos observados, es preferible de que la selección del modelo se base, siempre que sea posible, en un conocimiento de cómo la situación física pudo dar lugar a la distribución de datos empíricos (* ).
CLASIFICACION DE MODELOS DE PROBABILIDADES . Consideramos la siguiente clasificación: A.
MODELOS A PARTIR DE PRUEBS ALEATORIAS SIMPLES Modelo de Bernoulli Modelo Binomial Modelo Geonmétrico Modelo de Pascal Modelo Hipergeométrico Modelo Multinomial
B.
MODELOS A PARTIR DE OCURRENCIAS ALEATORIAS Modelo de Poisson Modelo Exponencial Modelo Gamma
C.
MODELOS A PARTIR DE CASOS LÍMITES Modelo Normal Modelo Lognormal
D.
MODELOS RELACIONADOS CON LA NORMAL 1
Modelo t-Student Modelo Chi Cuadrada Modelo F de Snédecor E
MODELOS DE VALORES EXTREMOS Modelo Pearson Modelo Weibull Modelo de Gúmbel
MODELOS A PARTIR DE PRUEBAS ALEATORIAS DISCRETAS SIMPLES La situación básica más simple, es aquella donde los resultados se pueden separar en dos categorías mutuamente excluyentes. Por ejemplo: - Satisfactorio o no satisfactorio. - Dentro de las especificaciones o no. Las siguientes distribuciones surgen en esta situación a partir de las variables aleatorias de interés. 0) MODELO UNIFORME DISCRETO.
I) MODELO DE BERNOULLI: Ensayo de Bernoulli.- Un ensayo de Bernoulli es un experimento que tiene dos posibles resultados mutuamente excluyentes, generalmente llamado éxito y fracaso . Nos interesa interesa la clase de experimentos que que tienen 2 resultados posibles mutuamente mutuamente excluyentes, excluyentes, uno de los cuales denominaremos EXITO y el otro FRACASO. Por ejemplo: - Probar una muestra de material para ver si satisface (éxito) o no (fracaso) las especificaciones de fabricación. - Tratar de cargar una componente hasta su capacidad final prevista y registrar su capacidad (éxito) o falta de capacidad (fracaso) para soportar la carga.
DEFINICION: Sea X v.a. de Bernoulli y asignémosle valores: x = 1; si se observa un éxito. x = 0; si se observa un fracaso.
Función masa de probabilidad (F.M.P.) p;
x=1
p(x) = 1-p; x=0 Siendo: p = probabilidad de éxito. 1 - p = probabilidad de fracaso. 2
Modelo t-Student Modelo Chi Cuadrada Modelo F de Snédecor E
MODELOS DE VALORES EXTREMOS Modelo Pearson Modelo Weibull Modelo de Gúmbel
MODELOS A PARTIR DE PRUEBAS ALEATORIAS DISCRETAS SIMPLES La situación básica más simple, es aquella donde los resultados se pueden separar en dos categorías mutuamente excluyentes. Por ejemplo: - Satisfactorio o no satisfactorio. - Dentro de las especificaciones o no. Las siguientes distribuciones surgen en esta situación a partir de las variables aleatorias de interés. 0) MODELO UNIFORME DISCRETO.
I) MODELO DE BERNOULLI: Ensayo de Bernoulli.- Un ensayo de Bernoulli es un experimento que tiene dos posibles resultados mutuamente excluyentes, generalmente llamado éxito y fracaso . Nos interesa interesa la clase de experimentos que que tienen 2 resultados posibles mutuamente mutuamente excluyentes, excluyentes, uno de los cuales denominaremos EXITO y el otro FRACASO. Por ejemplo: - Probar una muestra de material para ver si satisface (éxito) o no (fracaso) las especificaciones de fabricación. - Tratar de cargar una componente hasta su capacidad final prevista y registrar su capacidad (éxito) o falta de capacidad (fracaso) para soportar la carga.
DEFINICION: Sea X v.a. de Bernoulli y asignémosle valores: x = 1; si se observa un éxito. x = 0; si se observa un fracaso.
Función masa de probabilidad (F.M.P.) p;
x=1
p(x) = 1-p; x=0 Siendo: p = probabilidad de éxito. 1 - p = probabilidad de fracaso. 2
Esperanza o valor esperado de X E(X) = 1(p) + 0(1-p) = p
Varianza de X V(X) = p.q
Función Generatriz de Momentos
() = () = EJEMPLO: Por experiencia se conoce que una fábrica produce el 90% de artículos buenos; si de un día de producción se selecciona un artículo al azar. a) Defínase una variable X que asigne valores a los resultados del experimento. b) Determine la F.M.P. de la variable X c) Determine E(X) y V(X)
SOLUCION Sea X v.a. discreta que asume x = 1 si el artículo es bueno (éxito) y x = 0 si es malo
a) (fracaso) b) La F.M.P. de la variable X sería: 0.9
si x=1
0.1
si x=0
p(x) =
c)
E(X) = 1(0.9) + 0(0.1) = 0.9 V(X) = (0.9)(0.1) = 0.09 σx = 0.3
II) MODELO BINOMIAL ( pruebas repetidas) puede Secuencia de Bernoulli .- Es una sucesión fija de "n" pruebas simples donde cada prueba puede arrojar dos resultados (eventos) mutuamente excluyentes, arbitrariamente denominados éxito y fracaso.
Ejemplo: 1.- Se ponen a prueba 5 componentes de un sistema para ver si funcionan correctamente (éxito) o no funcionan correctamente (Fracaso), asumir que p= 0.9 2.- Durante un periodo de 5 años, cada año el máximo máximo flujo de un río puede: Exceder algún nivel especificado.(éxito) o no exceder el nivel especificado (Fracaso). Problemas como los descritos se denominan secuencia de Bernoulli, los cuales se basan en las sgtes. suposiciones: a) Un experimento simple se repite un número finito de veces, por decir "n" (pruebas) y sus resultados son independientes. b) Los resultados de cada prueba prueba pueden clasificarse en dos categorías "Exito" o "Fracaso". 3
c)
La probabilidad de éxito en una prueba es "P" y es constante en todas las pruebas; la probabilidad de fracaso es (1-p) = q
d) En una prueba determinada, la atención se centra; en sí resulta éxito o fracaso.
DEFINICION: La variable aleatoria discreta X que denota el número de éxitos en n pruebas de una secuencia de Bernoulli, se denomina variable Binomial y tiene la sgte. distribución: Función masa de probabilidad de X
p(X = x) = p(x) =
n
C x
px qn-x ; x = 0,1,2,......n
Donde: p(x) :Función binomial (depende de los parámetros n y p.) n : número de pruebas (veces que se realiza el experimento simple) p : probabilidad de éxito. n! n ; Coeficiente binomial C x x!( n x)!
La función p(x) nos proporciona la probabilidad de obtener x éxitos en n pruebas de Bernoulli
Función de Distribución Acumulada de X: r
P (x) = p( X r ) p ( x) 0
Esperanza o Valor Esperado de X: n
E (X) =
x p ( x) np 0
Varianza de la Variable Binomial X V(X) = E (x2) - E2(x) = (n2 p2 - np2 + np) - (n2 p2) V(X) = np(1-p) = npq
Función generatriz de momentos
() = () EJEMPLO: Si en cada una de 3 obras independientes, la probabilidad de que la cotización ofrecida por un contratista sea favorable es 1/3. a) Determinar la probabilidad de que exactamente dos cotizaciones sean favorables. b) Determinar la probabilidad de que a lo más 2 cotizaciones sean favorables. 4
c) Determinar el número esperado de cotizaciones favorables. d) Determinar la varianza y la desviación estándar del número de cotizaciones favorables.
solución En primer lugar definimos la variable aleatoria X : x : número de cotizaciones favorables: 0,1,2,3. p = p(cotización favorable) = 1/3 a) La f.m.p. de la variable X es la sgte: p(x) =
n
C x
(1/3)x (2/3)n-x ; x= 0, 1, 2, 3.
p(x=2) = 3C2 (1/3)2(2/3)3-2 = 3(1/3)2(2/3) = 6/27 = 22% b) La F.d.a. de la variable X sería: r
F(r) = p( X r ) p ( x) 0 2
3
F(2) = p( X 2) p ( x) =
0
x
3Cx (1/3)
x (2/3)n-x =
p(0) + p(1) + p(2)
0
p(x)
F(x)
0
0.9263
0.9263
1
0.4444
0.14074
2
0.2222
0.96296
3
0.0370
1.000
c) El número promedio de cotizaciones favorables que obtendría el contratista sería: E(X) = np = 3(1/3) = 1 cotiz/g.tra. d) La varianza sería: V(X) = npq = 3(1/3)(2/3) = 0.67 σx = (2/3)1/2 = 0.82
2.- En el planeamiento del sistema de control del flujo de un río, es de interés el máximo flujo anual del río. Supóngase que la probabilidad de que el máximo flujo anual exceda algún nivel "h" especificado en el diseño es 0.10 en cualquier año; ¿cuál es la probabilidad de que el nivel "h" será excedido una vez en los próximos 5 años.
SOLUCION: En este caso observamos que el intervalo de tiempo natural es un año, y dentro de cada año 5
hay sólamente un máximo flujo que puede o no puede exceder el nivel "h". Por lo tanto, las series de flujos anuales pueden ser considerados (modelados) como una secuencia de Bernoulli. Además asumiendo que "h" es bastante alto que no hay probabilidad de que sea excedido más que una vez en un año, entonces el número de excedencias del nivel "h", tiene distribución binomial. Sobre esta base si X es el número de excedencias del nivel "h" en los próximos 5 años, entonces tenemos: p (X≤1) = p(x=0) + p(x=1) = 5C0 (0.1)0 (0.9)5 + 5C1 (0.1)1(0.9)4 = 0.590 + 0.328 p(X≤1) = 0.918 El número promedio de flujos máximos anuales que exceden el nivel especificado durante períodos de 10 años E(X) = np = 10(0.1) = 1 flujo anual máximo / 10 años.
Varianza de X: V(X) = npq = 10(0.1)(0.9) = 0.9 σx = (0.9)0.5= 0.95 Intervalo (68.27%) = E(X) ± 0.95 = <0.05, 1.95> En condiciones normales , el número de flujos máximos que exceden al nivel especificado puede variar entre 0 y 2 aproximadamente.
III) MODELO GEOMETRICO (PRUEBAS REPETIDAS) En una secuencia de Bernoulli, el número N de pruebas realizadas hasta que ocurra el primer éxito es gobernado o descrito por la Distribución Geométrica. Observamos que si el primer éxito ocurre en la n-ésima prueba, es porque en las n-1 pruebas ocurrieron sólo fracasos. Por lo tanto N es una v.a.d que tiene como función masa de probabilidad la s iguiente: p(N=n) = (1-p)n-1 p; n = 1, 2, 3, ... La cual es conocida como la distribución geométrica.
Función de Distribución Acumulada F.D.A. P(n) = p(N
n)
= Σ (1-p)J-1 p
n=nº de términos
Nos proporciona la probabilidad de que haya al menos un éxito en "n" pruebas; es decir: P(n) = 1 - p (ningún éxito en n pruebas) = 1 - (1 -p) n
Esperanza de N ( Período de Retorno ) En un tiempo o espacio, problema que puede ser descrito como una secuencia de Bernoulli, el número de intervalos de tiempo (o espacio) hasta la primera ocurrencia de un evento, es llamado el tiempo de la primera ocurrencia 6
Observe que si las pruebas individuales ( o intervalos) en la secuencia son estadísticamente independientes, el tiempo de la primera ocurrencia debe también ser el tiempo entre cualesquiera 2 ocurrencias consecutivas del mismo evento, esto es, el tiempo de ocurrencia, es igual al tiempo de la primera ocurrencia. Por lo tanto el tiempo de ocurrencia en una Secuencia de Bernoulli tiene también una distribución geométrica; el tiempo medio de ocurrencia, el cual es popularmente conocido en Ingeniería como el Periodo de Retorno, por consiguiente es: E(N) = 1/p ...(indica que para valores pequeños de p se necesitan muchas pruebas a fin de que ocurra el primer éxito) E(N) = E(T) = 1/p ...(Periodo Promedio de Retorno)
Varianza V(N) = q/p2
() = EJEMPLOS: 1. En una sucesión de obras independientes la probabilidad de que la cotización ofrecida por un contratista sea favorable es 1/3. a) ¿ Cuál es la probabilidad de que la tercera obra cotizada sea favorable? b) Determinar la probabilidad de que dentro de las cinco primeras obras haya al menos una cotizada favorablemente. c) Determine el número promedio de obras que se deben cotizar a fin de que ocurra una cotización favorable. solución: a) Sea N = número de obras cotizadas hasta obtener una favorable. Entonces: p (N=3) = (1-p)2 p = (2/3)2 (1/3) = 4/27 b) p(5) = p(N≤ 5) = 1 - (1 - p)5 = 1 - (2/3)5 = 0.868 c) E(N) = 1/p = 1/(1/3) = 3 cotizaciones. 2. Una estructura es diseñada para una altura de 8 metros sobre el nivel del mar. Hay un 10% de probabilidad de que esta altura sea excedida por olas del mar en un año. ¿Cuál es la probabilidad de que la estructura estará expuesta a olas del mar que exceden los 8 m. de altura dentro del periodo de retorno? solución El período de retorno para las olas diseñadas es: T = 1/p = 1/0.1 = 10 años Por lo tanto: 7
p(x > 8 m. en 10 años) = 1-(1-p)10 = 1-(0.9)10 = 0.6513 Si asumimos que cuando ocurren olas que excedan la altura de diseño, hay una probabilidad del 20% de que la estructura pueda ser dañada, la cual es la probabilidad de daños a la estructura dentro de 3 años. Esta probabilidad tomaría en consideración que pueden haber 0,1,2 ó 3 excedencias en 3 años, asumiendo que la probabilidad de que más de una ola semejante en un año es insignificante. Además se asume que los daños de la estructura por más de una excedencia son estadísticamente independientes. X: número de olas que exceden los 8 m. de altura. Entonces de acuerdo al teorema de la probabilidad total: p(ningún daño en 3 años) = Σ p(ningún daño/X=x)p(X=x)
= 1.00 (0.9)3 + 0.8 [3 (0.1) (0.9)2 ] + 0.82 [3(0.1)2 (0.9)] - 0.83 (0.1)3 = 0.9412 Por lo tanto la probabilidad de : p(daños en 3 años) = 1 - p(ningún daño en 3 años) = 1 - 0.9412 = 0.0588 3.
Una torre de transmisión de radio es diseñada para "50 años viento" esto es una velocidad del viento teniendo un periodo de retorno de 50 años.
a)
¿Cuál es la probabilidad de que la velocidad de viento diseñada será excedida por primera vez sobre los 5 años después de haber completado la estructura?
b) ¿Cuál es la probabilidad de que la primera velocidad del viento semejante ocurrirá dentro de 5 años después del completamiento de la estructura? a)
solución: En este caso la probabilidad de encontrar los 50 años viento en cualquier año es: p = 1 / 50 = 0.02 5
b). p(N≤5) =
(0.98)n-1 0.02 0
= 0.02 + 0.0196 + 0.0192 + 0.0188 + 0.0184 = 0.096 Podemos reconocer que esto es lo mismo que el evento de " al menos un 50 años viento dentro de 5 años". De este modo la probabilidad deseada puede ser obtenida como: p(al menos 1 50 años viento dentro de 5 años) = 1 - (0.98) 5 = 0.096
IV) MODELO DE PASCAL (distribución binomial negativa ) En una serie de ensayos de Bernoulli independientes, con una probabilidad constante de éxito p, sea la variable aleatoria T el número de ensayos efectuados hasta que se tienen k éxitos. Esto es, si T es el número de pruebas hasta la K-ésima ocurrencia del evento en una serie de pruebas de Bernoulli, entonces: 8
P(Tk = t) =
t 1
C k 1
pk qt-k ; t=k, k+1,....
DEDUCCION: Si la K-ésima ocurrencia es realizada en la t-ésima prueba, deben haber exactamente (K-1) ocurrencias del evento en las t-1 pruebas anteriores y en la t-ésima prueba el evento también ocurre. De este modo, por la ley binomial: P(Tk = t) = C k t 11 pk-1 qt-k p resultando por lo tanto, el modelo de pascal o función binomial negativa.
Esperanza y Varianza de T E(T) = K/p V(T) = kq/p2 Para deducir estos momentos de T, es posible considerar a T como la suma de v.a. independientes Ni geométricas, esto es: TK = N1 + N2 + ..... + N k Donde: N1 : Número de repeticiones necesarias hasta obtener el primer evento (éxito). N2 : Número de repeticiones necesarias entre la primera ocerrencia hasta la segunda ocurrencia del evento (éxito). . . . Nk : Número de repeticiones entre las (k-1) ocurrencias, hasta la ocurrencia del K-ésimo evento(éxito)
RELACION ENTRE EL MODELO BINOMIAL Y EL MODELO DE PASCAL 1) P (T≤ n) = p (x>K) 2) P (T>n) = p (x
1
() =
EJEMPLOS: 1.- En el ejemplo 3 anterior, ¿ Cuál es la probabilidad de que un segundo viento similar a 50 años viento ocurrirá exactamente sobre el quinto año después del completamiento de la estructura? solución Sea T el número de pruebas hasta que ocurra el K-ésimo evento: t=5yK=2 La probabilidad requerida será: P(T = 5) =
t 1
C k 1
pk-1 qt-k p 9
= 4C1 p1 q3 p = 4(0.02)2 (0.98)3 = 0.0015 La probabilidad es del 0.15% aproximadamente.
2. En una sucesión de obras independientes la probabilidad de que la cotización ofrecida por un contratista sea favorable es 1/3. a)
¿ Cuál es la probabilidad de que la segunda obra cotizada favorablemente sea la tercera? Solución T: El número de cotizaciones realizadas hasta que ocurra la segunda cotización favorable.
3.
Suponga que un cable está compuesto de un número de alambres independientes (ver fig.).Ocasionalmente el cable es sujetado a sobrecargas en ambos sentidos; en tales ocasiones la probabilidad de que un alambre se fracture es 0.05. Asumir que la falla de 2
10
MODELO DE POISSON Muchos eventos ocurren no como resultado de un número definido de pruebas de un experimento, sino en un intervalo de tiempo, espacio o volumen al azar. El evento puede ser: -
El número de admisiones por hora en un hospital.
-
El número de accidentes de tráfico en un día determinado en una gran cuidad El número de muertes debido a cierta enfermedad en una región. El número de glóbulos rojos en una muestra de sangre ( 1 mm³ ). El número de moléculas raras particulares en una muestra de aire de 1 cm 3 En cada ejemplo los eventos ocurren según un proceso casual, denominado Proceso de Poisson el que presenta las siguientes características:
1. 2.
El evento puede ocurrir aleatoriamente en algún intervalo de tiempo o espacio. La ocurrencia de un evento en un intervalo de tiempo o espacio es independiente de las ocurrencias en cualquier otro intervalo que no se superponga. La probabilidad de ocurrencia de un evento en un intervalo pequeño es proporcional a la magnitud del intervalo, se desprecia la probabilidad de más de 01 ocurrencia del evento.
3.
Definición. La variable aleatoria (v.a.d.) X que indica el número de veces que ocurre un evento en un intervalo de tiempo o espacio, se denomina variable de Poisson y su distribución es: x
p ( X
x)
e
x!
; x
0,1,2,...,
donde: p (x): :
Probabilidad de que el evento ocurra x veces en el intervalo predefinido. Tasa promedio de ocurrencias por intervalo unitario (Parámetro de la distribución)
Propiedades de la Distribución de Poisson. 1.
El valor esperado de la v.a-X E(X) =
xp( x) = x
2.
Varianza de la v.a. X V(X) = = µ
3. 4. 5. 6. 7.
Se usa para aproximar las Probabilidades binomiales, Cuando = np ≤ 5. Sin embargo, en la práctica, si n es muy grande, se admite hasta np = =30. Sólo depende de un parámetro . Cuando crece, la distribución de Poisson se aproxima a la Distribución Normal. X es una variable entera y positiva ( valores de x N+ ) La función de distribución correspondiente es: x
p( X x)
e x 0
x
x!
Ejemplo 1. Un líquido contiene ciertas bacterias cuyo promedio es de 4 por cm 3. 11
a) Halla la probabilidad de que no exista bacteria alguna en 0.5 cm3 b) Halla la probabilidad de que no exista bacteria alguna en 1 cm3 c) Hallar la probabilidad de que exista 2 o menos bacterias en 1 cm 3 del líquido. Solución Definimos X como el número de bacterias en una muestra de 1 cm 3 de líquido. X sigue una distribución de Poisson con parámetro = 4 bact./ cm3. a) La probabilidad de que no exista ninguna bacteria en 0.5 cm 3 del líquido es ( 4 )( 0.5) (4(0.5)) 0 e = 0.1353 p( X 0) 0! 4*1 e (4) 0 b) P ( X 0) = 0.0183 0! c) P(X 2 ) = P(0) + P(1) + P(2) = 0.0183 + 0.0733 + 0.1465 = 0.2381
Ejemplo 2. Los registros de un hospital revelan que el número de admisiones diarias de emergencia es aproximadamente de 03 durante este período. Asumiendo que el número de admisiones de emergencia sugieren una distribución de Poisson, hallar: a) La probabilidad de que en un día dado ocurran exactamente 02 admisiones de emergencia. b) La probabilidad de que ocurran máximo 04 admisiones de emergencia.
Solución: X: No. de admisiones de emergencia por día: X = 0, 1, 2, ... : No. promedio de admisiones de emergencia por día = 3 x
X p( X , )
a) p( x
2)
e
3
32 2!
e
x!
0.050(9)
2 *1
0.225
4
b) p ( x 4) p ( x) p (0) p (1) p (2) p (3) p ( 4) x 0
3 3 3 3 3 0.647 0! 1! 2! 3! 4! 0
e
3
1
2
3
4
Ejemplo 3. El 0.2% de los habitantes de una cuidad fallece por accidentes de tránsito. Una compañía de seguros tiene 2000 asegurados contra accidentes de tránsito. ¿ Cuál es la probabilidad de que la compañía tenga que pagar durante un año al menos 2 de los 2000 asegurados? Solución Sea X = Número de asegurados que fallecen por accidentes de tránsito durante un año. La variable X tiene distribución Binomial con parámetros n = 2000 y p = 0.002 12
Cómo np = 4 < 5, la probabilidad pedida p ( X 2), se puede calcular usando la aproximación del modelo Binomial mediante Poisson con parámetro = 4. 1
Se tiene entonces que p ( X 2) = 1 – p (X < 2 ) = x
0
e
4
4
x!
x
= 1 – ( e-4 + e-
4
4 ) = 0.9084 Ejemplo 4. Supóngase que la razón anual de incidencia de leucemia en el estado de Iowa es 11.2 casos por 100 000 habitantes en la población. Si 100 000 ciudadanos son seguidos por un año: a) ¿ Cuál es la probabilidad de ningún caso nuevo de leucemia ? b) Si una población de 1000 son seguidos por un año, ¿ cuál es la probabilidad de que no se encuentren nuevos casos de leucemia ?
Solución Para responder las 02 proposiciones, nosotros debemos calcular la razón de nuevos casos en un año para cada una de estas dos poblaciones hipotéticas. -
Para la población de 100 000 nuevos casos la razón es 11.2 y entonces X será definida como el número de nuevos casos en un año entre 100 000 pobladores: p( x
-
0)
(11.2)
0
e
11.2
0!
0.0000137
Por otro lado, para la población de 1000 pobladores la razón de nuevos casos de leucemia es 0.112 ( esto es (11.2 / 100 000 ) *1000), entonces para X definido como el número de nuevos casos en un año entre 1000 pobladores: p( x
0)
(0.112)
0
e
0.112
0!
0.89
De este modo la razón de nuevos casos debe ser ajustado de acuerdo al tamaño de la población.
MODELO UNIFORME CONTÍNUO Se conoce como variable aleatoria uniforme continua en el intervalo (a,b) a la variable X que tiene función de densidad igual a:
f(x)=
− 0
si a≤ x≤ b
en otro caso
Definición. Si X es una variable aleatoria uniforme en (a, b), entonces la media, la varianza y la función generatriz de momentos son iguales a: a)
µ =
(+)
13
b) 2 =
(−)
− Mx(t) = (−)
c)
Ejemplo. Sea X una variable aleatoria uniforme e el intervalo [2,4]; X Calcular: a) P(2.3≤ x≤ 3.4) b) Graficar f(x) c) La media de X d) La varianza de X e) La funci´´o generatriz de momentos. Solución a) b)
P(2.3≤ x≤ 3.4)= 0.55 µ =
(+)= 3
c)
Gráfica de f(x).
d)
2 =
e)
− Mx(t) = (−)
(−) = 1/3
14
U[ 2,4].
MODELO EXPONENCIAL
Algunas secuencias de eventos hidrológicos, como la
ocurrencia de
precipitación, pueden considerarse como un proceso de Poisson, en los cuales los eventos ocurren instantánea e independientemente en un horizonte de tiempo, o a lo largo de una línea. El tiempo entre tales eventos (x) o tiempo de interarribo, está descrito por una distribución o modelo exponencial, cuya función de densidad es: f(x) = λ e-λ x ; x ≥ 0 Donde: es el parámetro dela distribución
Considerando la definición de función de distribución, se tiene que:
F(x) = ∫0 − = 1 −
F(X ≥x) =
−
Función de distribución acumulado de X F(x) = 1 - e-λx ; X ≥0 = 0; X < 0
Estimación de Parámetros Sea X una variable aleatoria exponencial con parámetro , entonces su media varianza y función generatriz de momentos son: µ
= 1/
2 = 1/ 2.
Mx(t) =
−
; <
Aplicaciones En La Hidrología La distribución exponencial se utiliza para describir los tiempos de interarribo de choques aleatorios en sistemas hidrológicos, tales como volúmenes de escorrentía contaminada que entran a los ríos a medida que la lluvia lava los contaminantes 15
localizados por la superficie del terreno. Ejemplo.
Ejemplo: Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en años está dado por la variable aleatoria T, distribuida exponencialmente con tiempo promedio de falla . Sí 5 de estos componentes se instalan en diferentes sistemas, ¿cuál es la probabilidad de que al menos 2 continúen funcionando después de 8 años?
Solución: La probabilidad de que un determinado componente esté funcionando aún después de 8 años es:
la | nos indica que la integral se va a evaluar desde 8 hasta Sea x el número de componentes funcionando después de 8 años. Entonces mediante la distribución Binomial, n=5 p = 0.20 = probabilidad de que un componente esté funcionando después de 8 años q = 1-p = 0.80 = probabilidad de que un componente no funcione después de 8 años P(x 2 ) = p(x=2) + p(x=3) + p(x=4)+p(x=5) = 1 – p(x = 0, 1)
16
MODELO GAMA (DISTRIBUCION GAMMA) Función Gamma La función dada por la relación
(α) =
∫0∞ − −
Se conoce como función Gamma. Teorema.
La función gamma satisface las siguientes condiciones:
=(α-1) (α-1).
a) Para cualquier α> 1, (α) b)
Para cualquier entero positivo n, (n)= (n-1)!
c)
(0.5) =
√ ᴨ
Función de densidad Gamma Una v.a.X, tiene distribución gamma si su función de densidad de probabilidad es:
1/ F(x) = (α) , para x>0,
con α, β>0
= 0, en otro caso. Teorema. Si X es una variable aleatoria que se distribuye como una Gamma con parámetros α, y
β, entonces la media, la varianza y la función generatriz de
momentos son: a)
µ=
b)
2
c)
αβ
2 .= αβ
)-α ; Para
Mx(t) = (1-t β
t< 1/β
Ejemplo. Sea X uma variable aleatoria con función de distribución Gamma estándar (β=
1), con parámetro α=3, calcular: 17
a)
La probabilidad de que X este entre 4 y 5
b)
La probabilidad de que X sea mayor que 4.
Ejemplo. Supongamos que el consumo de electricidad X en Kw-hora, sigue una distribución gamma con parámetro dr forma
α= 3, y
parámetro de escala β= 3, encontrar:
a) b)
La media y la varianza de X La probabilidad de que cierto día el consumo de electricidad sea mayor que 15 kw-hora
c)
La probabilidad de que el consumo de electricidad sea de cuando menos 20 kw-hora.
18
MODELO NORMAL GENERAL El Modelo normal es la más importante en probabilidad y estadística. Muchas poblaciones numéricas tienen distribuciones que se pueden ajustar con mucha aproximación mediante una curva normal apropiada. Así por ejemplo:
-
Errores de medición en experimentos científicos Mediciones de inteligencia y aptitud Numerosas medidas con fines de control y calidad de la producción Indicadores económicos
Aun cuando la variable sea discreta, la curva normal proporciona con frecuencia una aproximación excelente. Además cuando las variables individuales no están normalmente distribuidas, en condiciones apropiadas las sumas y promedios de las variables tendrán aproximadamente una distribución normal
Definición. Una v.a.c X se dice que está distribuida normalmente, con med ia μ, y varianza σ²>0, si su función de densidad de probabilidad, está dado por :
f ( x)
1 e
( x ) 2 /( 2 2 )
2
; - < x < +
Donde: f(x): función de probabilidad normal general X : Variable normal general , : Media y desviación estándar (parámetros de la distribución) π : 3.14259 e : 2.71828
NOTACION: X
N (μ, σ²), se lee: "la variable aleatoria X se distribuye normalmente con media μ, y varianza σ 2.
Curva normal general
________________________________ -3
1.
-2
-
+
+2
+3
A partir de su gráfica y del análisis de su función de densidad, la curva normal tiene las siguientes propiedades: Es simétrica con respecto al eje vertical X = , ya que f(x) sólo depende de x mediante la expresión (x-)2, luego, f(+x) = f( -x) 19
2.
Tiene valor máximo en X = , (su moda). Este valor máximo es: 1 f ( x) 2 Tiene el eje X como una asíntota horizontal, ya que Lim f(x) = 0 y lím f(x)= 0 x - x +
3.
4.
Tiene dos puntos de inflexión en X = - , y X = + , por tanto, es cóncava hacia abajo en el intervalo: - < X < + , y cóncava hacia arriba en cualquier otro punto.
5.
El área total que encierra la curva y el eje X es igual a 1. x
6.
La función de distribución acumulada denotada por: F(x) = P(X
f ( x)dx
= Area bajo la curva f(x) en el intervalo - < X < x. V(X) = 2 .
7.
La variable aleatoria X tiene: E(X) = ,
8.
Si X tiene distribución normal general N( , 2 ), entonces la variable aleatoria Z = (x - )/, tiene distribución normal estándar N ( 0, 1). Por tanto la variable normal estándar tiene media 0 y varianza igual a 1.
9.
Si X1, X2, . . ., Xk, son variables independientes con distribución normal general con parámetros 1, 2, . . ., k y 1, 2, . . ., k, respectivamente, k
entonces la variable Y =
Xi ,
tiene distribución normal, con parámetros:
i 1 k
k
= i , y 2 =
1
2
i
, respectivamente.
1
MODELO NORMAL ESTANDAR. Si Z es una v.a.c. con distribución N( 0, 1), con rango Rz = { z / - < Z <+ }, entonces Z tiene distribución normal estándar o típica y su f.d.p. es:
1
f (z) =
2
e
( z 2 / 2 )
; -
Curva normal estándar 20
________________________________ -3
-2
-1
0
+1
+2
+3
Generalmente ésta es una distribución de referencia, que la utilizaremos para obtener información para cualquier distribución normal general.
Nota. La curva normal estándar es utilizada para calcular áreas bajo una curva normal general, teniendo en cuenta que tiene parámetros fijos: = 0 y = 1. La dificultad para realizar cálculos bajo la curva normal general, una vez que se tiene una variable normal general X, esta es estandarizada o transformada a una variable Z, y luego usando un software o tablas elaboradas para la distribución normal estándar se realiza el cálculo de probabilidades, es decir, el cálculo de áreas bajo la curva normal estándar y éstas serán equivalentes a las de la curva normal general. Cálculo de áreas bajo la curva normal estándar o típica: A. Sea Z una v.a.c. con distribución N(0,1). Hallar. 1. P( 0< Z < 1.42) 2. P( -0.73 < Z < 0)
5. P(-1.79 < Z < -0.54) 6. P ( Z 1.13 )
3. P(-1.37 < Z < 2.01)
7. P (
Z
0.5 )
4. P(0.65 < Z <1.26 ) 1.
P(0 < Z < 1.42) es igual al área bajo la curva normal estándar entre 0 y 1.42. O sea que en la tabla, buscar hacia abajo en la primera columna hasta llegar a 1.4, y luego continuar a la derecha hasta la columna 2. El elemento es 0.4222. Por consiguiente, P(0 < Z <1.42) = 0.4222 = 42.22%
2. Por simetría, P(-0.73 < Z < 0) = P (0 < Z < 0.73) = 0.2673 = 26.73% 3. P(- 1.37 < Z < 2.01) = P(-1.37 < Z <0) + P(0 < Z < 2.01) = 0.4147 + 0.4778 = 0.8295 4. P(0.65 < Z < 1.26) = P(0 < Z <1.26 ) - P( 0 < Z < 0.65) = 0.3962 – 0.2422 = 0.1540 5. P(-1.79 < Z < -0.54) = P ( 0.54 < Z < 1.79) = P(0 < Z <1.79) – P(0 < Z < 0.54) = 0.4633 – 0.2054 = 0.2579
21
6. P( Z 1.13) = P( Z 0) – P(0 < Z <1.13) = 0.5000 – 0.3708 = 0.1292 7. P (
Z
0.5 ) = P ( - 0.5 Z 0.5 ) = 2 P ( 0 Z 0.5 ) = 2 ( 0.1915) = 0.3830
B. Sea Z una variable aleatoria con distribución normal estándar. Determinar el valor de Z si: 1. P( 0 < Z
P(0 < Z < z) = P ( Z < z ) – 0.5 = 0.7967 - 0.5000 = 0.2967. Así de la tabla obtenemos para Z = 0.83
3.
P (0 < Z < z) = P(0 < Z < 2) – P( z < Z < 2 ) = 0.4772 – 0.1000 = 0.3772 De la tabla obtenemos par Z = 1.161 ( por interpolación lineal) o simplemente Z = 1.16
APLICACIONES DEL MODELO NORMAL 1. La cantidad de agua destilada surtida por cierta máquina está normalmente distribuida con valor medio de 64 onzas y desviación estándar de 0.78 onzas. a. Cuál es la probabilidad de que la cantidad surtida por la máquina esté entre 63 y 65 onzas b. ¿Qué capacidad del recipiente “c” asegurará que ocurra un sobre flujo 0.5% de las veces?.
Solución Si X denota la cantidad distribuida
N ( 64, 0.6084 )
a. P( 63 < X < 65), estandarizando la variable X, se tiene 63 64 65 64 P ( Z ) = P ( -1.28 < Z < 1.28) = 2 p (0 < Z <1.28 ) = 2 (0.3997)= 0.78 0.78 0.7994 a. la condición deseada es que P(x > c) = 0.005, esto es equivalente a P(X < c) = 0.995. Entonces c es el 99.5 percentil de la distribución normal estándar con = 64 y = 0.78. La P( 0 < Z < z ) = 0.495, entonces z = 2.578, pero z= (c- 64)/0.78 = 2.58, despejando el valor de “c”, se tendría: c = 64 + 2.58*0.78 = 66 onzas. 2. La resistencia a la compresión de 200 probetas de cierto material de construcción, está distribuido aproximadamente con distribución normal, con = 100 kg/ cm 2 y = 15 kg/ cm 2 22
a.
Cuál es la probabilidad de que una probeta seleccionado al azar tenga una resistencia de por lo menos 125 kg/cm2? b. Qué porcentaje de probetas tienen una resistencia entre 70 y 130 kg/ cm 2 ? c. Cuál es la resistencia mínima arriba de la cual se encuentra el 20% de probetas con mayor resistencia? d. Cuál es la resistencia debajo de la cual se encuentra el 10% de probetas con menor resistencia? Solución
a.
Sea X = Resistencia kg/cm2 N ( 100, 225 ), entonces: P(X 125 ) = P ( Z 1.67 ) = 0.5 – P(0 < Z < 1.67) = 0.0475 = 4.75%
b. P(70 < X < 130) = P( -2 < Z < 2 ) = 2 P(0 < Z < 2 ) = 2( 0.47725) = 0.9545 = 95.45% c.
P( X x ), aquí x = P80. Por tanto P( Z z ) = 0.20, equivalentemente, se tiene que P(0 < Z < z ) = 0.30 De la tabla se obtiene por interpolación: z = 0.525, entonces: X = 100 + 0.525 (15) = 107.88 puntos Por lo tanto: El quinto superior se encuentra en el intervalo: <107.88 , > c. La resistencia debajo de la cual se halla el 10% de probetas es P 10 = x, entonces P ( X x) = 0.10, equivalentemente se tiene P( Z z ) = 0.10, esta relación se puede expresar, también de la siguiente manera a fín de poder utilizar la tabla de valores estándar. P ( 0 Z z) = 0.40, de la tabla se obtiene aproximadamente z= -1.28, por lo tanto X = 100 + (-1.28)(15) = 80.8 puntos. Entonces la resistencia debajo de la cual se encuentra el 10% de probetas con menor resistencia es 80.8 kg/cm 2
23
DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se distribuye en forma log normal. Esta distribución es muy usada para el calculo de valores extremos por ejemplo Qmax, Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia). Tiene la ventaja que X>0 y que la transformación Log tiende a reducir la asimetría positiva ya que al sacar logaritmos se reducen en mayor proporción los datos mayores que los menores. Limitaciones: tiene solamente dos parámetros, y requiere que los logaritmos de la variables estén centrados en la media Función de densidad:
y = ln x donde, y : media de los logaritmos
de la población (parámetro escalar), estimado Desviación estándar de los logaritmos de la población, estimado s y. Estimación de parámetros:
PARAMETROS
Parámetros Soporte pdf
cdf
24
y
:
Media Mediana
eμ
Moda
Varianza
Asimetría
Curtose
Entropía
Factor de frecuencia:
Puede trabajarse en el campo original y en el campo transformado. 1. Campo transformado: Si se trabaja en el campo transformado se trabaja con la media y la desviación estándar de los logaritmos, así: Ln(XTr ) = xTr +KSy de donde, XTr = eln (xTr ) con K con variable normal estandarizada para el Tr dado, x y media de los logaritmos y S y es la desviación estándar de los logaritmos. 2. Si se trabaja con los X sin transformar el K se calcula como
K es la variable normal estandarizada para el Tr dado, es el coeficiente de variación, x media de los datos originales y s desviación estándar de los datos originales. Limites de confianza:
En el campo transformado. 25
en donde, n numero de datos, Se error estándar, K T variable normal estandarizada.
EJEMPLO: En un río se tienen 30 años de registros de Qmáximos instantáneos anuales con x= 15 m3/s, S = 5 m 3/s (media y desviación estándar para los datos originales). x y=2.655, sy = 0.324 (media y desviación estándar de los datos transformados). Encontrar el caudal para un periodo de retorno de 100 años y los limites de confianza para un = 5%. Calcular la probabilidad de que un caudal de 42.5 m 3/s no sea igualado o excedido P(Q 4.25). Solución: n=30 x= 15 m3/s xy=2.655 3 s = 5 m /s sy = 0.324 En el campo original
= 5/15 = 0.33 K = F-1(1-1/Tr) = F-1(1-1/100) = F-1(0.99) de la tabla de la normal se obtiene KT=2.33
K T = 3.06 QTr = 15 + 5 * 3.028 QTr = 30.14 m 3/s En el campo transformado se tiene que: LnQTr100 = 2.655 + 2.33*0.324 LnQTr100 = 3.40992 QTr100 = Exp (3.40992) Q Tr100 = 30.26 m3/s Limites de confianza 26
Ln (QTr) t(1-) Se
= 1.93
t(1-) = t(0.95) = 1.645 (Leído de la tabla de la normal) Ln(30.28) (1.645 ) (0.11) 3.41 0.18095 [3.22905 [e3.22905 [25.26
3.59095] e3.59095 ] 36.29]
Intervalos de confianza para Q Tr100
b) Calcular la probabilidad de que un caudal de 45 m 3/s no se igualado o excedido P(Q 4.25). Ln(42.5) = 3.75 t = (3.75 - 2.655)/0.324 F(3.38) = 0.9996 Leído de la tabla de la normal P(Q 4.25) = 99.9%
DISTRIBUCION GUMBEL O EXTREMA TIPO I Una familia importante de distribuciones usadas en el análisis de frecuencia hidrológico es la distribución general de valores extremos, la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequías (máximos y mínimos). Función de densidad:
En donde y son los parámetros de la distribución.
27
Estimación de parámetros
donde
son la media y la desviación estándar estimadas con la muestra.
Factor de frecuencia:
Donde Tr es el periodo de retorno. Para la distribución Gumbel se tiene que el caudal para un período de retorno de 2.33 años es igual a la media de los caudales máximos. Limites de confianza
K T es el factor de frecuencia y t (1-) es la variable normal estandarizada para una probabilidad de no excedencia de 1- .
EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 años de periodo de retorno y los intervalos de confianza. x= 15 m 3/s, s = 5 m3/s QTr100 = x + K T s
K T = 3.14 QTr100 = 15 + 3.14*5 QTr100 = 30.7 m3/s Intervalos de confianza t(1-) = t(0.95) = 1.645 (Leído de la tabla de la normal) = 3.93
28
Xt t(1-) Se 30.7 m3/s (1.64) (3.58) [24.83 m3/s
36.58 m3/s]
Intervalo de confianza para QTr100
DISTRIBUCION GAMMA DE TRES PARÁMETROS O PEARSON TIPO 3 Esta distribución ha sido una de las mas utilizadas en hidrología. Como la mayoría de las variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la distribución de frecuencia de variables tales como crecientes máximas anuales, Caudales mínimos, Volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres parámetros. Función de densidad:
donde, x0 x para 0 x x0 para 0 y son los parámetros de escala y forma, respectivamente , y x 0 es el parámetro de localización.
3.4.2 Estimación de parámetros:
Cs es el coeficiente de asimetría, respectivamente.
son la media y la desviación estándar de la muestra
Factor de frecuencia:
donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.
29
3.4.4 Intervalos de confianza:
Xt t(1-) Se
Donde S es la desviación estándar de la muestra, n es el número de datos y se encuentra tabulado en función de Cs y Tr.
EJEMPLO: Se tiene una estación con 30 años de registros de caudales máximos instantáneos con Media de 4144 pie 3/s y desviación estándar de 3311 pie 3/s. Si el coeficiente de asimetría de los caudales es de 1.981 pie 3/s cual es caudal para un periodo de retorno de 100 años y su intervalo de confianza. QTr100 = X+ SK K es F(1.981, 100) de tablas se obtiene K=3.595 (1.9,100) = 3.553 (2.0,100) = 3.605 QTr100 = 4144+ (3.595) (3311) QTr100 = 16050 pie 3/s Intervalos de confianza Xt t(1-) Se
= F(1.981,100)
de tablas se obtiene =8.4922
(1.9,100) = 8.2196 (2.0,100) = 8.5562
Se = 5133.56 pie 3/s t(1-) = t(0.95) = 1.645 (Leído de la tabla de la normal) 16050 (5133.56) (1.645) [7605.29 pie3/s
24494.71pie 3/s]
Intervalos de confianza para QTr100
DISTRIBUCIÓN LOG GAMMA O LOGPEARSON DE 3 PARÁMETROS Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson tipo III, se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo III. Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia de Caudales máximos. Esta se trabaja igual que para la Pearson Tipo III pero con X y y Sy como la media y desviación estándar de los logaritmos de la variable original X.
30
Función de densidad:
donde, y0 y para 0 y y0 para 0 y son los parámetros de escala y forma, respectivamente , y y 0 es el parámetro de localización.
Estimación de parámetros:
Cs es el coeficiente de asimetría, logaritmos de la muestra respectivamente.
son la media y la desviación estándar de los
Factor de frecuencia:
donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra. Intervalos de confianza:
Xt t(1-) Se
Donde Sy es la desviación estándar de los logaritmos de la muestra, n es el número de datos y se encuentra tabulado en función de Cs y Tr.
31
EJERCICIOS 1.
Si X --->B(n, p),tal que E(X)=20 y V(X)=4, determinar:
a).
El valor de "n" y "p". b). p(X<=20) c).p(Y<=3/25), si Y=X/n.
2.
Un fabricante de piezas de motores garantiza que una caja de dichas piezas contendrá como máximo 2 piezas defectuosas. Si la caja contiene 20 piezas, y la experiencia ha demostrado que ese proceso de fabricación produce 5% de piezas defectuosas, ¿Cuál es la probabilidad de que una caja satizfaga la garantía?.
3.
¿Cuántas pruebas independientes hay que realizar con la probabilidad de que el suceso aparezca en cada prueba igual a 0.4, para que el número más probable de apariciones del suceso en estas pruebas sea igual a 25 ?.
4.
Un dispositivo está compuesto por 1000 elementos que trabajan independientemente uno del otro. La probabilidad de falla de cualquier elemento durante el tiempo T es igual a 0.002.Hallar la probabilidad de que durante el tiempo "T" fallen exactamente 3 elementos.
5.
Supóngase que la probabilidad de que un artículo producido por una máquina especial sea defectuoso es igual a 0.2. Si 10 artículos producidos, se seleccionan al azar.¿Cuál es la probabilidad de que no se encuentre más de un artículo defectuoso?.[Use la distrib. Binomial y la de Poisson, compare los resultados?
6.
La probabilidad de que un experimento tenga un resultado exitoso es 0.75. El experimento habrá de repetirse hasta que ocurran 5 resultados exitosos. ¿ Cuál es el número esperado de repeticiones necesarias ?. ¿ Cuál es la varianza ?.
7.
El tiempo transcurrido hasta la falla para un cinescopio de televisión se estima que se distribuye exponencialmente con media de tres años. Una compañía ofrece un seguro para este cinescopio para los primeros cinco años de uso. ¿En qué porcentaje de las pólizas, tendrá la compañía que pagar reclamaciones ?.
8.
Establezca las condiciones bajo las cuales: Modelo binomial converge al modelo de Poisson; el M. binomial converge a la normal; el M. Poisson converge a la normal.
9.
Supóngase que Xt, el número de partículas emitidas en T horas por una fuente radiactiva, tiene distribución de poisson con parámetro 20t. ¿Cuál es la probabilidad de que exactamente 5 partículas sean emitidas durante un período de 15 minutos?.
10.
Se han fabricado 20 probetas de un material particular, de las cuales por experiencia se sabe que el 20% fallan a una tensión determinada. Se selecciona aleatoriamente (con reemplazo) cada probeta para someterlo a ensayo hasta encontrar la primera probeta que falla. Calcular la probabilidad de que sean necesarios 5 ensayos Calcular la probabilidad de que por lo menos 5 ensayos sean necesarios.
a. b. 11. a. b. 12. a. b. 13.
Supóngase que en un lote grande que contiene T ítems manufacturado 30% son defectuosos y el resto buenos. Suponga que se seleccionan 10 ítems en forma aleatoria y sin reemplazo del lote de T ítems. Determine una expresión para calcular la probabilidad de que exactamente "x" ítems sean defectuosos y 10-x sean buenos. Determine una expresión exacta para la probabilidad de que a lo más se ha obtenido un ítem defectuoso. Supóngase que el número de cierto tipo de accidentes en una fábrica se puede representar por un proceso de Poisson, con un promedio de 2 accidentes por semana. ¿Cuál es la probabilidad de que: El tiempo entre un accidente y el siguiente sea mayor de 3 días?. El tiempo de un accidente al tercero sea mayor de una semana ?. En un proyecto de construcción se midió la resistencia al esfuerzo cortante de 50 probetas del terreno, observándose los siguientes valores (en KN/m²): 32
a. b. c. d. e. f.
g. h. i. j. k.
2450 3300 3400 3650 3800 2650 3150 3100 3500 2850 3050 4300 3300 3300 3150 2100 3300 3650 3150 3550 2900 3250 3000 3400 3750 3900 3600 3150 3600 3000 4200 3700 3050 3300 2350 4150 2950 3200 3900 3200 3450 2500 3050 2650 3050 2800 2700 3450 3400 3200. Agrupe estas resistencias en una distribución de frecuencias con una amplitud de clase de 250 kN/m², empezando con 2000 kN/m². Trace un histograma y un polígono de frecuencias, en base a estas gráficas decida si la distribución empírica se aproxima a una normal Calcule la media, la σ y el Coefic. variación. Qué grado de preci sión tiene la media ?. ¿Cuál es la amplitud de variación de los datos anteriores? Encuentre el valor de la Moda y la mediana de la distribución. En base a estas medidas determine aprox. el tipo de asimetría. Mediante una gráfica de frecuencia acumulada relativa en un papel de probabilidad normal, verifique si la distribución de los datos es aproximadamente normal. suponiendo que la distribución es normal, encuentre la resistencia al esfuerzo cortante mínima que se puede usar en el diseño, dando por hecho que existe un riesgo definido de que 1% de las muestras de prueba presentaran una resistencia menor que dicho mínimo. Señale si alguna de las 50 probetas cae por debajo de esta resistencia. Obtenga las ecuaciones correspondientes a la curva de probabilidad normal y a la de frecuencias normal para los datos dados. Trace la curva de probabilidad normal. Estime la probabilidad de que el resultado de una prueba aleatoria tenga una desviación respecto de la media que caiga entre -200 y + 500 kN/m². Estime la probabilidad de que la media de 1 muestra de 36 probetas de terreno provenientes del mismo lugar exceda de 3500 kN/m². Encuentre los límites de la media de una muestra de 36 probetas de terreno al nivel de significación del 1 y 5%. ¿Qué tamaño debería tener una muestra en pruebas futuras a fín de que la probabilidad de la media muestral esté en error en mas de 400 kN/m² no sea mayor de 0.1 ?.
14.
La vida o duración de cierto tipo de pila seca se distribuye normalmente con media 500 días y desviación típica de 50 días. ¿Qué fracción de estas baterías puede esperarse que dure más de 580 días ? ¿Qué % puede esperarse que falle antes de 450 días ?.
15.
La resistencia eléctrica media de unas piezas metálicas es de 503 ohmios y su varianza vale 100. Suponiendo que su distribución es normal. Calcular: La proporción de piezas de resistencia exterior al intervalo [485, 520] ohmios. Los límites de las resistencias entre las cuales se encontrarán el 95%, el 99%, el 99.8%. La varianza que se debería tener para que con unas tolerancias de fabricación 500 ± 10 los desechos no sobrepasasen el 3 por 1000. La media y al varianza de las resistencias que se obtendrían empalmando en serie dos piezas.
a. b. c. d. 16.
Cierto tipo de transistor deberá utilizarse en cierta aplicación durante 50 h. Se dispone de dos marcas de transistores, una que tiene una distribución de duración N(40,36) y la otra con una distribución de duración N(48,9) ¿ Qué transistor deberá preferirse en esta aplicación ?.
17.
Un proceso de producción produce artículos, de los cuales el 10% son defectuosos. Diariamente se selecciona una muestra aleatoria de 200 artículos y se cuenta el número de defectuosos, denotada por X. Utilizando la aproximación normal a la binomial obténgase: p(X < 20) b) p(X=15) c) p( 15< X < 25) d) p(X=25)
a) 18.
La vida en años de un cierto tipo de componente de un sistema tiene distribución exponencial con parámetro 1/10. Si en un sistema diferente se instalan 4 de estas componentes. ¿cuál es la probabilidad de que al menos 3 de ellos continúen funcionando al término de 10 años ?.
19.
Se sabe que la vida de bombillas eléctricas es una variable aleatoria distribuida normalmente con media desconocida μ y desviación estándar 200 horas. El valor de un lote de 1000 bombillas es $(1000)(1/5000)μ. Un posible co mprador propone tomar una muestra aleatoria de n bombillas y pagar al
productor $(1000)(1/5000)x por el lote de 1000 bombillas. ¿Cuál debe ser n para la probabilidad de que el comprador no sobrepague ni subpague al productor en más de $ 20, sea de .95 ?. 33