4. Variables aleatorias y distribución de probabilidad. Sergio Vázquez Razo.
4.1 Introducción.
Se han considerado considerado las distribuciones distribuciones de frecuencias frecuencias de conjuntos conjuntos de datos, y los fundamentos fundamentos de probabilidades. Ahora se combinaran estas ideas para elaborar distribuciones de probabilidad, las cuales cuales se asemejan asemejan a las distribucion distribuciones es de frecuencias, frecuencias, la diferencia diferencia básica entre entre estos dos dos tipos de distribucione distribucioness es el uso de la variable variable aleatoria aleatoria o las medidas de ciertas ciertas magnitudes. Estas medidas se repre represen senta tann medi median ante te varia variabl bles es alea aleato tori rias as discr discret etas as o cont contin inua uas. s. La vari variab able le alea aleato tori riaa de una distribución de probabilidad corresponde a la variable de respuesta de una distribución de frecuencias. 4.2 Variables aleatorias.
Al describir el espacio muestral de un experimento, no se específica que un resultado individual necesar necesariam iament entee tiene tiene que ser un número. número. Por ejempl ejemplo, o, al clasif clasifica icarr un artícu artículo lo manufac manufactura turado do simplemente podríamos usar las categorías "defectuoso" y "no defectuoso". En otro caso, para observar la temperatura durante un período de 24 horas sencillamente podríamos mantener un registro de la curva curva trazada trazada por el termóg termógrafo rafo.. Sin embargo embargo,, en muchas muchas situaci situaciones ones experimen experimental tales es vamos vamos a interesarnos en medir algo y anotarlo como un número. Aún en los casos citados anteriormente podremos asignar un número a cada uno de los resultados (no numéricos) del experimento. Por ejemplo, puede asignar el valor 1 a artículos artículos no defectuosos y el valor cero a los defectuosos. Pudimos anotar la temperatura máxima del día, o la mínima, o el promedio de las temperaturas máxima y mínima. Se ha definido un experimento como el proceso que culmina con la toma de una medición (o una observación). La mayoría de los experimentos producen una medición numérica que desde luego varía al considerar distintos puntos muéstrales y esta variación es aleatoria. La medición es llamada una variable aleatoria X, que el hecho de que tome un valor particular es en sí mismo un evento aleatorio. Así en muchas situaciones experimentales deseamos asignar un número real x a cada uno de los elementos s del espacio muestral S. Esto es, x = X(s) es el valor de una función X del espacio muestral a los números reales. Por ejemplo si se lleva a cabo un experimento aleatorio y ocurre el evento correspondiente a un número a, entonces se dice que, en esta prueba, la variable aleatoria X correspondiente a ese experimento ha tomado el valor a. También se dice que se ha observado el valor X = a. En lugar de “el evento correspondiente a un número a” se dice, más brevemente, “el evento X = a”, De acuerdo a esto damos la siguiente definición: Sea un experimento y S el espacio muestral asociado asociado con el experimento. experimento. Una función X que asigna a cada uno de los elementos s S, un número real X(s), se llama variable aleatoria. Una varia variable ble aleato aleatori ria a es una fun funció ción n de valor valores es reale realess cuyo cuyo domin dominio io es un espac espacio io muestral.
1
Una variable aleatoria aleatoria discreta es aquella que toma, a lo más, una cantidad numerable de valores distintos, el espacio muestral de un experimento probabilístico.
Una variable aleatoria continua es aquella que puede tomar cualquier valor de entre todos los contenidos en un intervalo. La term termin inol ologí ogíaa ante anteri rior or es algo algo desaf desafort ortuna unada da,, pero pero como como es tan tan universalmente aceptada, nosotros no nos apartaremos de ella. Es claro que X es una función y todavía la llamamos variable aleatoria. (b) Resulta que no toda función que se conciba puede ser considerada como una variable aleatoria. Una exigencia (aunque no la más general) es que para todo número real x el suceso {X(s) = x} y para todo intervalo I, el suceso {X(s) ∈ I} tiene probabilidades bien definidas y consecuentes con los axiomas básicos. (c) En algunos casos el resultado s del espacio muestral es ya la característica numérica que queremos anotar. Sencillamente tomemos X(s) = s, la función de identidad. (d) En la mayoría de las discusiones de variables aleatorias que siguen, no necesitamos indicar la naturaleza funcional de X. Generalmente nos interesamos en los valores posibles de X, en vez de indagar de donde provienen esos valores. Por ejemplo, supongamos que lanzamos dos monedas y consideremos el espacio muestral asociado con este experimento. Observacione Observaciones: s: (a)
Eje. Sea el experimento aleatorio de lanzar tres monedas. Los resultados posibles son: S = {(a, a, a), (a, a, s), (a, s, a), (s, a, a), (a, s, s), (s, a, s), (s, s, a), (s, s, s)} Se puede definir, la variable aleatoria: X: Número de águilas al tirar las tres monedas. La variable aleatoria x asigna un número real a cada elemento de S: X(a, a, a) = 3, X(a, a, s) = X(a, s, a)=X(s, a, a) = 2, X(a, s, s) = X(s, a, s)=X(s, s, a) = 1, X(s, s, s) = 0 El conjunto de los posibles valores de X es {0, 1, 2, 3}.
S = espacio muestral de ε
R X = valores posibles de X (recorrido) 2
Una variable aleatoria aleatoria discreta es aquella que toma, a lo más, una cantidad numerable de valores distintos, el espacio muestral de un experimento probabilístico.
Una variable aleatoria continua es aquella que puede tomar cualquier valor de entre todos los contenidos en un intervalo. La term termin inol ologí ogíaa ante anteri rior or es algo algo desaf desafort ortuna unada da,, pero pero como como es tan tan universalmente aceptada, nosotros no nos apartaremos de ella. Es claro que X es una función y todavía la llamamos variable aleatoria. (b) Resulta que no toda función que se conciba puede ser considerada como una variable aleatoria. Una exigencia (aunque no la más general) es que para todo número real x el suceso {X(s) = x} y para todo intervalo I, el suceso {X(s) ∈ I} tiene probabilidades bien definidas y consecuentes con los axiomas básicos. (c) En algunos casos el resultado s del espacio muestral es ya la característica numérica que queremos anotar. Sencillamente tomemos X(s) = s, la función de identidad. (d) En la mayoría de las discusiones de variables aleatorias que siguen, no necesitamos indicar la naturaleza funcional de X. Generalmente nos interesamos en los valores posibles de X, en vez de indagar de donde provienen esos valores. Por ejemplo, supongamos que lanzamos dos monedas y consideremos el espacio muestral asociado con este experimento. Observacione Observaciones: s: (a)
Eje. Sea el experimento aleatorio de lanzar tres monedas. Los resultados posibles son: S = {(a, a, a), (a, a, s), (a, s, a), (s, a, a), (a, s, s), (s, a, s), (s, s, a), (s, s, s)} Se puede definir, la variable aleatoria: X: Número de águilas al tirar las tres monedas. La variable aleatoria x asigna un número real a cada elemento de S: X(a, a, a) = 3, X(a, a, s) = X(a, s, a)=X(s, a, a) = 2, X(a, s, s) = X(s, a, s)=X(s, s, a) = 1, X(s, s, s) = 0 El conjunto de los posibles valores de X es {0, 1, 2, 3}.
S = espacio muestral de ε
R X = valores posibles de X (recorrido) 2
El espacio R X, el conjunto de todos los valores posibles de X, se llama algunas veces el recorrido. En ciertos sentidos podemos considerar a R X como otro espacio muestral. El espacio muestral (original) S corresponde a los resultados no numéricos (posiblemente) del experimento, mientras que R X es el espacio muestral asociado con la variable aleatoria X, que representa la característica que puede ser de interés. Si X(s) = s, tenemos S = R X. (e) Es muy importante comprender que una exigencia básica de una función (uni-variada): a cada s ∈ S le corresponde exactamente un valor X(s). Valores diferentes de s pueden dar el mismo valor de X. Por ejemplo en la ilustración anterior encontramos que X(a, s) = X(s, a) = 1. Concepción de una variable aleatoria X: (a) Realizamos el experimento
ε que tiene como resultado s ∈ S. Luego evaluamos en número
X(s). (b) Efectuamos ε , y obtenemos el resultado s, e inmediatamente calculamos X(s). El número X(s) se considera entonces como el resultado obtenido en el experimento.
Teniendo en cuenta que los valores de una variable aleatoria quedan determinados por el resultado de un experimento aleatorio, es posible asignar probabilidad a cada uno de ellos en el caso de las variables aleatorias discretas o bien definir una función para evaluar la probabilidad en intervalos en el caso de las continuas. Así como nos interesamos por los sucesos asociados con el espacio muestral S, también será necesario tratar suceso con respecto a la variable aleatoria X, esto es, subconjunto del recorrido R X. Muy a menudo ciertos sucesos asociados con S están "relacionados" con sucesos asociados con R X de la manera siguiente. Sea ε un experimento y S su espacio muestral. Sea X una variable aleatoria definida en S y sea R X su recorrido. Sea B un suceso respecto a R X, esto es, B ⊂ R X. Supongamos que A se define A = {s ∈ S | X(s) ∈ B}
3
Fig. 4.1 A consta de todos los resultados en S para los cuales X(s) ∈ B. En este caso decimos que A y B son sucesos equivalentes Para denotar las variables aleatorias se emplea mayúsculas, como X, y minúsculas como x, para representar valores particulares que puede tomar una variable aleatoria. Por ejemplo, supongamos que X denota cualquiera de los seis valores posibles que pueden observarse en la cara superior al lanzar un dado. El número que se observa, después de arrojar el dado, se representará mediante el símbolo x. Observe que X es una variable aleatoria, pero el valor específico observado, x, no es de naturaleza aleatoria. La expresión (X = x) puede leerse: el conjunto de todos los puntos de S asignados al valor x mediante la variable aleatoria. La probabilidad de que X adopte el valor x, P(X=x), se define como la suma de las probabilidades de los puntos muestrales de S asignados al valor x. La probabilidad correspondiente de un valor observado x en un experimento se denota por P(X = x) = P(x) o bien F(x) donde X denota el valor abstracto o general, mientras que x denota un valor específico o concreto. De manera semejante, la probabilidad del evento X toma cualquier valor en el intervalo a < X < b Se denota por P(a < X< b). La probabilidad del evento X
≤c
( X T o m a c u a l q u i e r v a l o r q u e sea menor
o i g u a l a c )
se denota por P(X ≤c ) y la probabilidad del evento X > c(X toma cualquier valor mayor que c) Se denota por P(X>c). Los dos últimos eventos son mutuamente exclusivos. De donde P ( X ≤c ) + P ( X > c ) = P ( − ∞
y 4
P ( X >c ) =1 − P ( X ≤c )
P(X
Por ejemplo, si X es el número que queda arriba al lanzar un dado perfecto, P(X = 1) = 1/6, = 2) = 1/6, etc., P(1
P (1 ≤ X
≤2) =1 / 3, P (0 ≤ X ≤3.2) =1 / 2, P ( X >4) =1 / 3, P ( X ≤0.5) =0, e t c.
Eje. Consideremos el lanzamiento de dos monedas. En este caso S = {a a, s a, a s, s s}. Sea X el número de águilas obtenidas. En este caso R X = {0, 1, 2}. Sea B = {1}. Puesto que X(a s) = X{a s} = 1 si sólo si X(s) = 1, tenemos que A = {a s, s a} es equivalente a B. Sea B un suceso en el recorrido R X. Definimos entonces P(B) como sigue: P(B) = P(A),
en donde A = {s ∈ S | X(s) ∈ B}
O sea, definimos P(B) igual a la probabilidad del suceso A ⊂ S, que es equivalente a B. Eje. Si las monedas consideradas en el ejemplo anterior son "normales", tenemos P(a s) = P(s a) = 1/4. Por tanto P(a s, s a) = 1/4 + 1/4 = 1/2. Puesto que el suceso {X = 1} es equivalente al suceso {a s, s a}, tenemos que P(X=1) = P(a s, s a) = 1/2. En este sentido se inducen las probabilidades asociadas con suceso R X. 4.3 Funciones de una variable aleatoria.
Sea X una variable aleatoria discreta y sea x i uno de los valores que toma dicha variable, la probabilidad de que la variable tome dicho valor se denota por P(X = xi) = pi. Eje. Sea la variable aleatoria X: Número de aguilas al tirar dos monedas, que toma los valores {0, 1, 2}. Entonces: P(X=0) = P(s, s) = ¼ P(X=1) = P{(s ,a) (a, s)} = ½ P(X=2) = P(a, a) = ¼
Se llama función de masa o función de probabilidad puntual de una variable aleatoria discreta a la función que asigna a cada valor de la variable aleatoria la probabilidad con que lo toma. X P(x)
0 ¼
1 ½
2 ¼
5
Para N = 12 monedas xi 0 1 2 3 4 5 6 7 8 9 10 11 12
f(xi) 0.00024414 0.00292969 0.01611328 0.05371094 0.12084961 0.19335994 0.22558594 0.19335938 0.12084961 0.05371094 0.01611328 0.00292969 0.00024414
La función f(x) que suministra esta gráfica es
12 x f ( x) = 212
Eje. El supervisor de una planta de manufactura tiene a tres hombres y tres mujeres a su cargo. Debe elegir dos trabajadores para una tarea especial. Como no desea actuar con prejuicio en la selección del personal, decide elegir dos trabajadores al azar. Si X es el número de mujeres en el grupo elegido, determine la distribución de probabilidad para X. 6 El supervisor puede elegir dos trabajadores de seis de 2 = 15 maneras. En consecuencia, S contiene 15 puntos muestrales, que suponemos tiene la misma probabilidad, puesto que se aplicó un 6
= 1 / 15 para i = 1, 2, ..., 15. Los valores de X con probabilidad 3 3 diferente de cero son 0, 1 y 2. El número de formas de elegir X = 0 mujeres es 0 = 1 ⋅ 3 = 3 puntos 2 muestrales, ya que el supervisor debe seleccionar cero trabajadores de las tres mujeres y dos de los tres hombres, por lo que
muestreo aleatorio. Así,
P ( E i )
3 3 2 0 = p (0) = P ( X = 0) = 15
Asimismo
3 3 1 1 p (1) = P ( X = 1) = =
9
15 15 3 3
2 0 = p(2) = P ( X = 2) = 15
3 15
3 15
=
=
=
1 5
3 5 1 5
La distribución de probabilidad es x 0 1 2
P(x) 1/5 3/5 1/5
El método más conveniente para representar distribuciones de probabilidad discreta es por medio de una fórmula. En este caso para p(x) puede escribirse de la siguiente manera: 3 3 2 − x x , x = 0,1,2 p ( x) = 6 2 Si hay N sujetos en total, de los cuales k son de una clase y se toman n de ellos, entonces:
k N − k n − x x , p( x) = N n
x
= 0,1,2,.., n
7
Si x1, x2, .... son los valores que toma una variable aleatoria X se verifica: 1) P(X = xi) ≥ 0. 2) ∑ P(X = xi) = 1 Si se conoce la función de probabilidad de una variable aleatoria discreta, X entonces fácilmente puede calcularse la probabilidad P ( a < X ≤ b) correspondiente a cualquier intervalo a < X < b . En efecto P ( a
∑ f ( x
< X ≤b) =
j
)=
a < x j ≤b
∑ p
j
a < x j ≤b
Esta es la suma de todas las probabilidades f(x j) = P J, para la cual las x j se encuentran en ese intervalo. Se expresa esto diciendo que la función de probabilidad f(x) determina la distribución de probabilidad o, brevemente, la distribución de la variable aleatoria X en una forma única. Si X es cualquier variable aleatoria, no necesariamente discreta, entonces, para cualquier número real x, existe la probabilidad P(X ≤x) correspondiente a X
≤x (X toma cualquier valor menor que x o igual a x.)
Evidentemente, P(X ≤x) depende de la elección de x; es una función de, que se llama función de distribución de X y se denota por F(x), De donde F ( x ) = P ( X
≤ x)
Dado que para cualquier a y b > a se tiene P ( a
< X ≤ b) = P ( X ≤ b) − P ( X ≤ a ),
se concluye que P (a
< X ≤b) = F (b) − F (a )
Esto indica que la función de distribución determina la distribución de X de modo único y puede usarse para calcular probabilidades. Supóngase que X es una variable discreta. Entonces puede representarse la función de distribución F(x) en términos de la función de probabilidad f(x). En efecto, si a = - ∞ y b = x, se tiene F ( x ) =
∑ f ( x
j
)
x j ≤ x
Esta indica la probabilidad de que la variable aleatoria tome valores menores o iguales que un valor x dado. Por este motivo, también se la conoce con el nombre de función de distribución acumulada. Para el lanzamiento de N monedas la función de distribución de probabilidad es 8
xi 0 1 2 3 4 5 6 7 8 9 10 11 12
f(xi) 0.00024414 0.00292969 0.01611328 0.05371094 0.12084961 0.19335994 0.22558594 0.19335938 0.12084961 0.05371094 0.01611328 0.00292969 0.00024414
F(xi) 0.00024414 0.00311738 0.01928711 0.07299805 0.19384766 0.38720703 0.61279297 0.80615234 0.92700195 0.98071289 0.99682617 0.99975586 1
Y su representación gráfica
¿Cuál es la probabilidad de que aparezcan a lo sumo 6 aguilas? P ( x
≤ 6) = F (6) = 0.612793968
¿Cuál es la probabilidad de que aparezcan entre 4 y 8 aguilas? P ( 4
≤ x ≤ 8) = p( x ≤ 8) − p( x ≤ 4) + p ( x = 4) = F (8) − F ( 4) + p ( x = 4) = 0.927001953 − 0.193847656 + 0.120849609 = 0.854003906
Ejemplos de funciones de probabilidad discretas. Función de probabilidad f(x) de la variable aleatoria X = número obtenido al lanzar una vez un dado perfecto. En efecto f(x) = 1/6 cuando x = 1, 2, ..., 6. f ( x)
si x =(1,2,3,.., 6) 1/ 6 = 0 en cualquier otro caso
9
Eje. Determine la función de probabilidad f(x) y función de distribución F(x) de la variable aleatoria X = suma de los dos números obtenidos al lanzar una vez dos dados no cargados. Debido a que existen 36 posibilidades igualmente probables, cada uno de los cuales tiene, por tanto, la probabilidad 1/36; se tiene X = 2 para solamente un resultado, a saber, (1,1); se tiene X = 3 en el caso de dos resultados (1,2) y (2,1), etc. La función f(x) y F(x) tiene los valores x f(x) F(x)
2 1/36 1/36
3 2/36 3/36
4 3/36 6/36
5 6 7 8 9 10 11 12 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 36/36
Eje. Se lanzan 3 monedas. Analícese la variable aleatoria X = número de águilas. El espacio muestral consta de 8 elementos: (a, a, a) (a, s, s)
(a, a, s) (s, a, s)
(a, s, a) (s, s, a) (s, s, s)
(s, a, a)
cada uno de los cuales tiene la misma probabilidad 1/8. Los números posibles de águilas son x1 = 0, x2 = 1, x3 = 2, x4 = 3.
10
Los valores de la función de probabilidad y de la función de distribución están dados en la siguiente tabla: X f F
0 1/8 1/8
1 3/8 1/2
2 3/8 7/8
3 1/8 1
Obsérvese, que los valores de f están dados por: f ( x)
3 3 ( = 1 / 2) x
x
= 0,1,2,3
3 x n −x = ( p) (q ) x donde p = 1 / 2, q = 1 − p
f ( x)
Podemos establecer F(x) como sigue; 0 1 / 8 F ( x) = 4 / 8 7 / 8 1
<0 0 ≤ x < 1 1 ≤ x < 2 2 ≤ x < 3 x ≥ 3 x
Eje. Supóngase que los artículos que salen de una línea de producción se clasifican como defectuosos (D) o no defectuosos (N). Supongamos que se eligen al azar tres artículos de la producción de un día y se clasifican de acuerdo con este esquema. El espacio muestral para este experimento, digamos S, puede describirse así: S = {DDD, DDN, DND, NDD, NND, NDN, DNN, NNN} Supongamos que con probabilidad de 0.2 un artículo es defectuoso y por lo tanto con probabilidad 0.8 un artículo no es defectuoso. Supongamos que esas probabilidades son iguales para cada artículo al menos durante nuestro estudio. Finalmente supongamos que la clasificación de cualquier artículo particular es independiente de la clasificación de cualquier otro artículo. Usando estas suposiciones, se deduce que las probabilidades asociadas con los diversos resultados del espacio muestral S son 11
(0.2)3, (0.8)(0.2)2, (0.8)(0.2)2, (0.8)(0.2)2, (0.2)(0.8)2, (0.2)(0.8)2, (0.2)(0.8)2, (0.8)3 Corrientemente nuestro interés no se enfoca hacia los resultados individuales de S; si no que, simplemente, deseamos saber cuántos artículos defectuosos se encuentran (sin considerar el orden en que ocurrieron). Es decir, deseamos considerar la variable aleatoria X que asigna a cada uno de los resultados s, el número de artículos defectuosos encontrados en S. Por tanto el conjunto de valores posibles de X es {0, 1, 2, 3}. Podemos obtener la distribución de probabilidades para X, p(xi) = P(X=xi) como sigue: X =0 X=1 X =2 X=3 Por lo tanto
sí y sólo si ocurre NNN; sí y sólo si ocurre DNN, NDN, o NND; sí y sólo si ocurre DDN, DND, o NDD; sí y sólo si ocurre DDD.
P(0) = P(X = 0) = (0.8) 3, P(2) = P(X = 2) = 3(0.2)2(0.8),
p(1) = P(X = 1) = 3(0.2)(0.8)2 p(3) = P(X = 3) = (0.2)3
Podemos escribir esto como sigue: f ( x )
3 x = (.2) (.8) 3 − x x
f ( x)
n x n − x = ( p) ( q ) x
En general,
Nótese que la suma de estas probabilidades es igual a 1, porque la suma puede escribirse (0.8 + 0.2)3. Y una gráfica posible para sería de la forma
4.4 Variables aleatorias continuas y sus distribuciones de probabilidad.
Supongamos que el recorrido de X está formado por un gran número de valores, por ejemplo todos los valores x en el intervalo 0 ≤ x ≤ 1 de la forma 0; 0.01; 0.02; ....; 0.98; 0.99; 1.00. Con cada uno de esos valores está asociado un número no negativo p(x i) = P(Xi = xi), i = 1,2,..., cuya suma es igual a 1. Esta situación se representa geométricamente en la figura 4.2 12
Fig. 4.2 Hemos señalado antes que podría ser matemáticamente más fácil idealizar la anterior descripción probabilística de X al suponer que X puede tomar todos los valores posibles, 0 ≤ x ≤ 1 . Si hacemos esto, ¿qué le sucede a las probabilidades puntuales p(xi)? Puesto que los valores posibles de X no son contables, no podemos hablar realmente del i-ésimo valor de X y por lo tanto p(xi) pierde significado. Lo que se hace es sustituir la función p, definida sólo para x 1, x2, ..., por una función f definida para todos los valores de x, 0 ≤ x ≤ 1 . Las propiedades de la probabilidad se sustituyen por f(x) ≥ 0 y 1
∫ f ( x )dx 0
=1 .
Se dice que X es una variable aleatoria continua si existe una función f, llamada función de densidad de probabilidad (fdp) de X, que satisface las siguientes condiciones: ( a ) f ( x) ≥0 (b)
para todo x
∞
∫ f ( x)dx =1 −∞
( c) Para cualquier
a, b, tal que
− ∞ < a < b < +∞, tenemos
P ( a
b
≤ X ≤ b) =∫ a f ( x) dx
Las funciones de densidad de probabilidad se obtienen de más mediciones pudiéndose reducir la longitud de dichos intervalos. La forma del histograma cambiaría un poco, sobre todo tornándose cada vez menos irregular al ir aumentando el número de mediciones. Cuando éstas fuesen muy grandes en número y los intervalos muy pequeños en longitud, el histograma aparecería para todo propósito como una curva continua. Para una variable continua la frecuencia relativa asociada a una clase particular de una población, es la fracción de mediciones de la población que corresponden a ese intervalo de clase, y es también la probabilidad de que una medición extraída de esa población caiga en la mencionada clase. Si se ajusta el histograma de frecuencias relativas para que el área total bajo la curva que lo describe valga 1, las áreas bajo dicha curva sobre distintos intervalos corresponden a las probabilidades de dichos intervalos.
13
Fig. 4.3 La densidad de probabilidad f(x) La figura 4.3 muestra la densidad de probabilidad que varía con x, se puede representar por una fórmula matemática f(x), esta nos proporciona un modelo matemático para el histograma de frecuencias relativas. El área total bajo la curva figura 4.3 es 1. El área bajo la curva sobre un intervalo dado, es la probabilidad de ese intervalo. Así la probabilidad de que a < x < b es el área bajo la función de densidad entre los puntos a y b. La función de densidad permite calcular la probabilidad de cualquier intervalo: P ( a
b
f ( x) dx ≤ x ≤ b) = ∫ a
Una consecuencia de la descripción probabilística de X para cualquier valor especifico de X, x f ( x ) dx = 0. Este resultado puede parecer muy por ejemplo xo es que tenemos P ( X = xo ) = ∫ x contrario a nuestra intuición. Debemos establecer, sin embargo, que si permitimos que X tome todos los valores en un intervalo, entonces la probabilidad cero no es equivalente con la imposibilidad. Por tanto, en el caso continuo, P(A) = 0 no implica A = Ø, el conjunto vacío. Para decirlo de un modo más informal, consideremos que elegimos un punto al azar en el segmento {x | 0 ≤ x ≤ 2 }. Aunque quisiéramos estar de acuerdo (como un objetivo matemático) conque cada punto concebible del segmento pudiese ser el resultado de nuestro experimento, nos sorprenderíamos mucho si en realidad escogiéramos precisamente el punto medio del segmento, o cualquier otro punto específico de ese elemento. Cuando indicamos esto en un lenguaje matemático preciso, decimos que el suceso tiene “probabilidad 0”. o
o
Supóngase que se ha llevado a cabo un experimento con objeto de medir la vida útil de 50 baterías de determinado tipo, seleccionadas de entre una población. Vida útil de las baterías (cientos de horas): 0.406 2.563 0.685 0.511 8.233 1.507 1.514 0.294 3.214 0.761
2.343 0.023 1.401 0.225 2.920 4.025 0.333 3.323 7.514 0.836
0.538 3.334 0.234 2.325 1.064 1.064 1.624 0.774 0.334 0.968
5.088 3.491 1.458 2.291 3.810 3.246 2.634 2.330 1.849 4.490
5.587 1.267 0.517 1.702 4.778 2.782 1.725 6.426 2.230 0.186 14
Histogram 16
12 y c n e u q e r f
8
4
0 -1
1
3
5
7
9
11
vida
Fig. 4.4 El histograma de frecuencia relativa para estos datos muestra con claridad que la mayor parte de las vidas útiles están cerca de cero, y que la frecuencia disminuye con mucha uniformidad cuando se pasa a las vidas útiles mayores. En este caso, el 32% de las 50 observaciones caen dentro del primer subintervalo y otro 22% dentro del segundo. Hay una disminución en la frecuencia cuando se avanza hacia otros subintervalos, hasta que el último (de 8 a 9) contenga sólo una observación. Este histograma de frecuencia relativa de la muestra no sólo permite retratar el comportamiento de la muestra, sino que da idea de algún modelo probabilistico posible de la variable aleatoria X. Dicho histograma se ve como si se pudiera representar con mucha aproximación mediante una curva exponencial negativa. La función especial f ( x)
= 1 e −x / 2 2
se representa en el histograma figura 4.4 y parece que se ajusta razonablemente bien a los datos. Así, se podría tomar esta función como modelo matemático del comportamiento de la variable aleatoria X. Nótese que el área bajo f(x) es igual a uno. Si uno desea usar en el futuro una batería de este tipo, quizá deseara conocer la probabilidad de que dure más de cuatrocientas horas. Esta probabilidad se puede calcular aproximadamente mediante el área bajo la curva a la derecha del valor 4; es decir, ∞1
∫ 2 e
−x / 2
4
dx
= 0.135
Nótese que este resultado es bastante cercano a la fracción observada de la muestra con duración mayor que 4, o sea, (8/50 = 0.16). Uno podría sugerir que, como ya se sabe que la fracción es 0.16, no se necesita en realidad el modelo. Pero hay otras preguntas para las cuales el modelo daría respuestas más satisfactorias que las que se podrían obtener por otros medios. Por ejemplo, supóngase que se desea conocer la probabilidad de que X sea mayor que 9. Entonces, el modelo sugiere la respuesta ∞1
∫ 2 e 9
−x / 2
dx
= 0.111
15
mientras que la muestra no indica que haya observaciones mayores que 9. El ejemplo anterior es un modelo simple. ¿Por qué seleccionar la función exponencial como modelo en este caso? ¿No funcionarían algunas otras igualmente bien? La selección de un modelo es un problema fundamental por lo que se usa bastante espacio en las secciones posteriores en investigar las razones teóricas y prácticas de esas selecciones. Eje. Acerca de la variable aleatoria X del ejemplo de las vidas útiles y que tiene asociada una función de densidad de probabilidad de la forma:
1 e − x / 2 f ( x) = 2 0
x
>0
c.o. p
Calcule la probabilidad de que la vida útil de una batería determinada de este tipo sea menor que 200 o mayor que 400 horas. Sean A el evento que consiste en que X es menor que 2 y B el evento X es mayor que 4. Entonces, como A y B son mutuamente excluyente P ( A ∪ B)
= P ( A) + P ( B) ∞1
2
= = ∫ 0 (1 / 2)e − x / 2 dx + ∫ 4 2 e − x / 2 dx
= (1 − e −1 ) + (e −2 ) = 1 − 0.368 + 0.135 = 0.767
Eje. Calcule la probabilidad de que una batería de este tipo dure más de 300 horas dado que ya ha estado en uso durante más de 200 horas.
(
P X > 3 | X
> 2) =
( > 3) P ( X > 2) P X
Porque la intersección de los eventos (X>3) y (X>2) es el evento (X>3). Entonces ∞
( > 3) ∫ (1 / 2) exp( − x / 2)dx e− P ( X > 3 | X > 2) = = ∞ = − P ( X > 2 ) ∫ (1/ 2) exp( − x / 2)dx e P X
3/ 2
3
1
= e−1 / 2 = 0.606
2
Eje. Sea X la duración (en horas) de cierto tipo de bombilla eléctrica. Supóngase que la variable aleatoria X es continua (Fig. 4.5). Sea la fdp dada por
Evalúe la constante a.
a / x3 f ( x) = 0
150 0 < x < 2500 c.o. p
De la condición
16
∞
∫
2500
∫
f ( x ) dx =
−∞
1500
a / x 3 dx =1
obtenemos a = 7,031,250.
Fig. 4.5 4.5 Función de distribución acumulativa.
La Función de Distribución acumulativa F de una variable aleatoria X es una función definida para cada número real que hace corresponder a cada x la probabilidad de que la variable aleatoria tome un valor menor o igual que él. (a) Si X es una variable aleatoria discreta F ( x )
=∑ p ( x j ) j
en donde la suma se toma sobre todos los índices j que satisfacen (b) Si X es una variable aleatoria continua con fdp f. x
∫
F ( x ) =
x j ≤ x
f ( s )ds
−∞
Tal como está definida, se trata de una función no decreciente que verifica: lím F ( x) x→∞
lím F ( x) = 0
=1
x → −∞
La función de distribución acumulativa es importante por varias razones. Esto es particularmente cierto cuando tratamos con una variable aleatoria continua, porque en este caso no podemos estudiar la conducta probabilística de X al calcular P(X = x). Esa probabilidad es siempre igual a cero en el caso continuo. Sin embargo, podemos inquirir acerca de P ( X ≤ x ) y, como se demuestra en el siguiente teorema, obtener la fdp de X. Teorema. (a) Sea F la fda de una variable aleatoria continua con fdp f. Luego f ( x ) =
para toda x en la cual F es diferenciable.
d dx
F ( x )
17
(b) Sea X una variable aleatoria discreta con valores posibles x1, x2, ..., y supongamos que es posible rotular esos valores de modo que x1
tiene:
Eje. En el caso tratado, en el que se considera X: Número de águilas al tirar dos monedas, se 0 1 / 4 F ( x ) = 3 / 4 1
x < 0
0 ≤ x < 1 1 ≤ x < 2 x
≥2
Eje. Si X es una variable aleatoria continua con función de densidad de probabilidad dada por 3 x 2 f ( x) = 0
0 ≤ x
≤1
c.o. p.
Encuentre F(x) y grafique f(x) y F(x). La gráfica de f(x) es
Como F ( x)
x
= ∫ f (t )dt −∞
tenemos, ∞ para x < 0 0 ∫ − ∞0dt x = 0 x F ( x) = ∫ 0dt + ∫ 3t 2 dt = 0 + t 3 = x 3 , para 0 < x < 1 0 −∞ 0 0 1 x 1 2 3 + + = + + 0 = 1 para 1 < x 0 dt 3 t dt 0 dt 0 t ∫ − ∞ ∫ 0 ∫ 1 0
18
Eje. Supongamos que X es una variable aleatoria continua con fdp 0 < x
2 x f ( x) = 0
<1
c.o. p
Por lo tanto la fda F está dada por
0 x 2 F ( x) = ∫ 2 sds = x 0 1
si x ≤ 0
< x ≤ 1 si x >1 si 0
Fig. 4.6 Eje. Calcular el valor de a para que sea función de densidad la función definida por: 0, f ( x) = ax + 0.5, 0,
<0 si 0 ≤ x ≤ 4 si x > 4 si x
Asimismo determine la función de distribución. 4
∞
4
∫ f ( x)dx = ∫ ( ax + 0.5) dx −∞
a
0
x 2 = a + 0.5 x = 8a + 2 = 1 2 0
= −1 8
La función de distribución es: 19
F ( x)
x x 1 = ∫ 0 f (t )dt = ∫ 0 − x + 0.5 dt 8 x t 2 = − 1 + 0.5t = − 1 x 2 + 0.5 x 16 82 0
0, 1 2 F ( x) = − x + 0.5 x, 16 1,
si x < 0 si 0 ≤ x ≤ 4 si x > 4
Eje. Supongamos que una variable aleatoria continua tiene fda F dada por
0 − x 1 −e
F ( x ) =
≤0 x > 0
x
Entonces F´(x) = e-x para x>0, y así la fdp f es dada por e− x f ( x) = 0
x
≥0
cualquier otro valor
4.6 Esperanza matemática.
El concepto de esperanza matemática se origino en relación con los juegos de azar. El valor promedio de una variable aleatoria es conocido como el valor esperado (o esperanza matemática) de la variable aleatoria en consideración. Eje. Sea x el número de águilas resultantes al lanzar dos monedas, cuyas distribuciones se identifican de la tabla x P(x)
0 ¼
1 ½
2 ¼
donde 0 es: s-s 1 es: a-s, s-a 2 es: a-a Supongamos que se repite el experimento un número muy grande de veces, por ejemplo 4 000 000, intuitivamente se esperaría observar 1 millón de veces el 0, 2 millones de veces el 1 y 1 millón de veces el 2. El valor promedio sería entonces, suma
de valores n
=
( 0)( 1,000 ,000 ) +(1)( 2,000 ,000 ) +( 2)( 1,000 ,000 ) 4,000 ,000
=( 0)( 1 / 4) +(1)( 1 / 2) +( 2 )( 1 / 4) =1
20
Recordando que la media de una distribución de frecuencias es x
=
1 n
∑ x f ( x j
j j
)=
∑ x
j
( f / n ) j
y la probabilidad de un evento es la frecuencia relativa esperada de su ocurrencia. De modo que P(x) = f/n, entonces; E ( x ) = x
=∑ x j P ( x j ) j
Esta ecuación significa simplemente que el valor esperado de la v.a. X es el producto de cada valor de xi por la probabilidad de que X asuma este valor xi y sumados para todos los valores de xi en el conjunto X. Para una variable aleatoria continua, ∞
∫
E ( x ) =
xf xf ( x )
−∞
siempre que exista. Nótese que si P(x) proporciona una descripción precisa de las frecuencias relativas de la población real de las mediciones, entonces E(x) = µ , la media de la población. Eje. Si se tiene uno de 10000 boletos de una rifa en la cual el premio mayor es un reloj fino valuado en $4800, suponga que el costo del boleto es de $15, ¿cuál es la esperanza de obtener el premio? Una verdadera esperanza matemática debe tomar en cuenta el costo incurrido en el boleto, que se pierden, se gane o no se gane el premio. Distribución de probabilidad para X: Ganancia (xi) 478 5 -15 E ( x) = x =
Probabilidad (pi) 1/10000 9999/10000
∑ x P ( x ) j
j
j
9999 ) + (−15 )( ) 10000 10000
= (4785 )(
1
= −$14 .52
El riesgo de que pierda dinero es altísimo, aunque si gana el rendimiento es enorme. La gente que participa en estos esquemas esperando altísimos (desproporcionados) rendimientos, son amantes del riesgo. Eje. Sea V la velocidad del viento (kph) y supongamos que V está distribuida uniformemente en el intervalo [0, 10]. La presión, W (lb/pie2), sobre la superficie del ala de un aeroplano está dada por la relación: W = 0.003V2. Para encontrar el valor esperado de W, E(W), procedemos como: 21
10
∫
E (W ) =
0
0.003 V 2 f (V )dV
10
=∫ 0
0.003 v 2
1 10
dv
=0.1 lb / pie 2
Eje. Eje. En much muchos os probl problem emas as nos nos inte intere resa sa sólo sólo la magn magnit itud ud de una una vari variab able le alea aleato tori riaa sin sin consideración a su signo algebraico. Es decir, nos interesa |X|. Supongamos que X es una variable aleatoria continua con la siguiente fdp:
e x f ( x) = 2− x e 2
si x ≤ 0 si x > 0
Sea y = |X|. Para obtener E(Y) debemos proceder como sigue: ∞
∫
E (Y ) =
| x | f ( x )dx
−∞
∞ 0 1 −x x = ( − x )e dx + ∫ ( x )e dx = 1 [1 +1] =1 ∫ 2 − ∞ 0 2
Eje. En los concursos para obtención de contratos, es usual que los contratistas sometan los precios precios de sus proyectos proyectos si sus expectativas, expectativas, tomando tomando en cuenta el tipo de proyecto proyecto y al resto de los participantes, les indican que sus ganancias estarán por encima de cierta cantidad. Suponga que un contratista considera un proyecto en el cuál ganará 50,000 pesos si le es otorgado. El costo de la preparación del proyecto, si lo somete, es de 5,000 pesos y el propio contratista piensa que la probabilidad en esas circunstancias, de que gane el concurso es de 0.4. Finalmente, el contratista ha decidido decidido someter propuesta para proyectos cuya ganancia esperada sea de por lo menos 12,000 pesos. ¿Debe someter propuesta en este proyecto? La ganancia x del contratista puede tomar cualquiera de los valores: x = -$5,000, si pierde; o si lo gana x = $45,000. Las probabilidades de estos valores son 0.6 y 0.4 respectivamente. La distribución de probabilidad de su ganancia x se muestra en la tabla siguiente; x P(x)
-$5,000.00 0.6
$45,000.00 0.4
La ganancia esperada es E(x) =
∑
x P(x) = (-$5,000)(0.6) + ($45,000)(0.4) = $15,000.00
Como E(x) = $15,000.00 excede a $12,000.00, el contratista debe someter su propuesta. Eje. Considere el problema de determinar la prima anual para un seguro de daños de automóvil de $100,000 pesos. La póliza cubre un tipo de eventos que por experiencia previa se sabe que ocurre a 3 por cada 5,000 automovilistas cada año. Sea x la ganancia anual de la compañía resultante de la venta de una póliza y sea C la cantidad (desconocida) que representa al valor de la prima anual. Se desea calcular C de modo que la ganancia esperada E(x) sea 0. En otras palabras se desea calcular C para no ganar ni perder. Al valor calculado, desde luego, la compañía agregará los gastos administrativos correspondientes y un margen de utilidad. 22
Se ha supuesto que la ganancia esperada E(x) depende de C, y utilizando este hecho sólo se requiere encontrar C de manera que esta ganancia esperada sea 0, o sea E(x) =
∑ x P(x) = 0
El primer paso para encontrar la solución es el de determinar los valores que la ganancia x puede tomar y después determinar P(x). Si el evento que cubre la póliza no ocurre en el año, la compañía gana x = C pesos. Si el evento ocurre, la ganancia será negativa, esto es será de hecho una pérdida; x = C - 100,000 pesos. Las probabilidades asociadas a estos dos valores de x son 4997/5000 y 3/5000 respectivamente. La distribución de probabilidad de la ganancia se muestra en la tabla. x, ganancia p(x)
C 4997/5000
-(100,000-C) -(100,000- C) 3/5000
Igualando el valor esperado de x a cero y resolviendo para C se tiene E(x) =
∑
x P(x) = C(4997/5000) + [-(100,000-C)](3/5000) = 0 C = $60.00
Lo anterior quiere decir que si la compañía cobra una prima anual de 60 pesos, entonces su ganancia promedio sobre un número grande de pólizas similares será cero. La prima final que la compañía debe cobrar será $60.00 más los gastos administrativos y la utilidad. La esperanza de una función aleatoria. Sea X una variable aleatoria discreta con función de probabilidad p(x) y sea g(X) una función del valor real de X, entonces la siguiente expresión da el valor esperado de g(X): E [ g ( X )]
= ∑ g ( x) p( x) x
Dem. Si X toma un número finito de valores x1 , x 2 ,..., x n . Como es posible que la función g(x) no establezca una correspondencia biunívoca (uno a uno), supongamos que g(X) adopta los valores g 1 , g 2 ,..., g n (donde m ≤ n ). Se infiere que g(X) es una variable aleatoria tal que para i = 1,2,..,m,
P g [ X ( ) = g i ] =
∑ p x( ) = p *(g )
j t o ld xa a j st sa ql eu s e g x( j )= g i
i
Por consiguiente,
23
m
[
E g ( X )
g p * ( g ]= ∑ i
i
)
i= 1
= g i ∑ i= 1 to d a s g ( x m
j
m
= ∑
p ( x ∑ la s x j ta le s )= g j
g p ( y ∑ i
i= 1 to d a s la s x j ta le s g ( x j ) = g j
j
)
q u e
j
)
q u e
n
= g ( x j ) p ( x j ) ∑ j = 1
Para una función continua: E [ g ( X )] =
∞
∫ g ( x) f ( x)dx −∞
Eje. Un vendedor minorista de un producto derivado del petróleo vende una cantidad aleatoria, X, cada día. Suponga que X, medida en miles de galones, tiene una función de densidad de probabilidad
3 x 2 , f ( x) = 8 0,
0 ≤ x ≤ 2 c.o. p
Las utilidades del minorista ascienden a 100 dólares por cada 1000 galones vendidos (10 centavos por galón) si X ≤ 1 , y a $40 más por cada 1000 galones (4 centavos más por galón) si X > 1. Calcule las ganancias esperadas por el minorista un día cualquiera. Si g(X) es la ganancia del minorista, entonces g ( X )
0 ≤ X ≤ 1
100 X = 140 X
1 < X ≤ 2
Deseamos calcular la ganancia esperada; por lo tanto, el valor esperado es de E [ g ( X ) ]
∞
= ∫ −∞ g ( x) f ( x) dx 1 2 3 140 x x 2 dx = ∫ 0 100 x 3 x 2 dx + ∫ 1 8 8
= 300 x 4 (8)( 4)
1
0
+ 420 x 4 (8)( 4)
2
1
= 300 32
(1) +
420 (15 ) 321
= 206 .25
Así el vendedor puede esperar utilidades de $206.25 por la venta diaria de su producto. Propiedades del valor esperado.
1. Si X = C en donde C es una constante, entonces E(X) = C o E [cg ( X ) ] = cE [ g ( X ) ] .
24
2. Supongamos que C es una constante y X es una variable aleatoria. Entonces E(CX) = C E(X). 3. Sean X y Y dos variables aleatorias cualquiera. Entonces E(X + Y) = E(X) + E(Y). 4. Sean X y Y variables aleatorias independientes. Entonces E(XY) = E(X) E(Y). Demostración:
∑kx f ( x ) =k ∑ x f ( x ) =k E ( X ) E ( X + k ) = ∑( x + k ) f ( x ) =∑ x f ( x ) + ∑kf ( x ) = E ( X ) + k E ( X +Y ) =∑ x f ( x ) + ∑ y f ( y ) = E ( X ) + E (Y ) E ( XY ) = ∑ ∑ x y f ( x ) g ( y ) =∑ x f ( x ) ∑ y g ( y ) = E ( X ) E (Y ) E ( kX ) =
i
i
i
i
i
i
i
i
i
j
i
i
i
i
i
i
j
i
i , j
i
i
j
j
j
La mediana τ de una distribución continua F(x) es aquel valor que verifica:
{
} = P { X > τ } = 12
P X < τ
La moda, se define como el valor x para el que f(x) o P(xi) toman el valor máximo. Eje- Dos urnas contienen, cada una, bolitas numeradas del 1 a 10. Se saca una bolita de cada urna y se suman los números obtenidos, ¿cuál es el valor medio de la suma? Si anotamos todas las combinaciones posibles, obtenemos la tabla siguiente:
Urna 1 1 1 1 1 1 1 1 1 1 1 2 2 2 …. 10 10
Urna 2 1 2 3 4 5 6 7 8 9 10 1 2 3 …. 9 10
Suma 2 3 4 5 6 7 8 9 10 11 3 4 5 …. 19 20 25
Suma, X 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Frec. 1 2 3 4 5 6 7 8 9 10 9 8 7 6 5 4 3 2 1
P(X) 1/100 2/100 3/100 4/100 5/100 6/100 7/100 8/100 9/100 10/100 9/100 8/100 7/100 6/100 5/100 4/100 3/100 2/100 1/100 ∑
XP(X) 2/100 6/100 12/100 20/100 30/100 42/100 56/100 72/100 90/100 110/100 108/100 104/100 98/100 90/100 80/100 68/100 54/100 38/100 20/100 1100/100=11
Si X e Y son las variables aleatorias que expresan el número sacado de cada urna, Es E(X) = E(Y) = (1/10)(1+2+…+10) = 11/2 y por tanto la solución es E[X+Y] = 11. Eje. Dos urnas contienen, cada una, 5 bolitas numeradas del 1 al 5. Si se saca una bolita de cada urna y se multiplican los números obtenidos, ¿cuál es el valor medio de este producto? Si anotamos todas las combinaciones posibles, obtenemos la tabla siguiente: Urna 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4
Urna 2 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1
Producto 1 2 3 4 5 2 4 6 8 10 3 6 9 12 15 4 26
4 4 4 4 5 5 5 5 5 x 1 2 3 4 5 6 8 9 10 12 15 16 20 25
2 3 4 5 1 2 3 4 5 frec 1 2 2 3 2 2 2 1 2 2 2 1 2 1 25
8 12 16 20 5 10 15 20 25 P(x) 1/25 2/25 2/25 3/25 2/25 2/25 2/25 1/25 2/25 2/25 2/25 1/25 2/25 1/25 ∑
xP(x) 1/25 4/25 6/25 12/25 10/25 12/25 16/25 9/25 20/25 24/25 30/25 16/25 40/25 25/25 225/25=9
Como las variables aleatorias X e Y que representan los números sacados de cada urna, son independientes, y E(X) = E(Y) = (1/5)(1+2+…+5) = 3, resulta E(XY) = 9. Eje. Una urna contiene 5 bolitas numeradas del 1 a 5. Se sacan dos bolitas al azar y se multiplican los números obtenidos. ¿Cuál es el valor medio del producto? Ahora las variables X e Y son dependientes y por tanto se tiene que hacer el cálculo directo. Los casos posibles son (1, 2), (1, 3), …, (4, 5), y de cada uno de ellos la probabilidad es 1/10.
27
1 −2 −2 1 −3 −3 1 −4 −4 1 −5 −5 2 −1 −2 2 −3 −6 2 −4 −8 2 −5 −10 3 −1 −3 3 −2 −6 3 −4 −12 3 −5 −15 4 −1 −4 4 −2 −8 4 −3 −12 4 −5 −20 5 −1 −5
E ( XY ) =
∑XYP ( XY )
1 −2 ⇒2 1 −3 ⇒3 1 −4 ⇒4 1 −5 ⇒5 2 −3 ⇒6 2 −4 ⇒8 2 −5 ⇒10 3 −4 ⇒12 3 −5 ⇒15 4 −5 ⇒20
∑85
5 −2 −10 5 −3 −15 5 −4 −20
Por tanto, E(XY) = 8.5. Lo que resulta diferente del problema anterior.
4.7 La varianza de una variable aleatoria .
El valor esperado de una variable aleatoria es una medida de tendencia central de su distribución de probabilidad del mismo modos que x es también una medida de tendencia central del histograma de frecuencias relativas de una muestra. El término “valor esperado” tiene una interpretación intuitiva en el sentido de que se espera que los valores de x se observen cerca del “centro” de la distribución de probabilidad. Al igual que x proporciona una descripción sólo parcial del correspondiente histograma de frecuencias relativas de la muestra, el valor esperado µ sólo da una descripción parcial del comportamiento de la variable aleatoria. Para una descripción más adecuada se requiere una medida de dispersión de la distribución de probabilidad P(x). Para ilustrar este hecho, supongamos que como administrador de una clínica de salud, debe decidir el número de vacunas contra el tétano que hay que mantener constantemente almacenadas. Más aún suponga que el abastecimiento de vacunas debe ser suficiente para satisfacer tres días de demanda y que la distribución de probabilidad para esta demanda x, de tres días es
28
Fig. 4.7 Distribución de probabilidad de x Puede observarse en la figura 4.7 que la demanda esperada µ no proporciona información sobre el número máximo de vacunas que podrían ser requeridas durante el periodo. Se requiere, entonces un valor para x, por ejemplo xa, a la derecha de la gráfica de P(x) tal que la probabilidad de que la demanda exceda a xa sea suficientemente pequeña. El encontrar el valor xa de vacunas que deben mantenerse almacenadas sería relativamente sencillo si se conociese P(x), ya que podría ir evaluando P(x ≥ xa) para valores cada vez más grandes de xa hasta lograr que dicha probabilidad fuese suficientemente pequeña. Si P(x) no es conocida, una medida de su dispersión podría satisfacernos. Esta medida permitirá encontrar aproximadamente el valor xa. Sea x una variable aleatoria discreta con distribución de probabilidad P(x) y valor esperado E(x) = µ . La varianza de la distribución de probabilidad P(x) (o de la variable aleatoria x) es, V ( X ) = σ
2
= E ( xi − µ ) 2 = ∑ ( xi − µ ) 2 P ( xi )
en donde la suma se extiende sobre todos los valores de la variable aleatoria x. o
= E [ X − E ( X )]2 2 g ( X ) = ( X − µ ) 2 E [( X − µ ) ] = V ( X )
V ( X )
Asimismo = E [ X − E ( X ) ]2 = E [ X 2 + 2 XE ( X ) + ( E [ X ]) 2 ] = E ( X 2 ) − E ( X ) E ( X ) + ( E [ X ]) 2 = E ( X 2 ) − [ E ( X ) ]2
V ( X )
La desviación estándar de una variable aleatoria es la raíz cuadrada de su varianza. Para una distribución continua: 29
σ 2
∞
= ∫ −∞ ( x − µ ) 2 f ( x ) dx
Eje. Encuentre la varianza de la población asociada al ejemplo del lanzamiento de dos monedas. El valor esperado de x en este ejemplo se encontró ser igual a 1. La varianza es igual al valor esperado de (x - µ )2 , esto es E (x - µ )2 =
∑
(x - µ )2 P(x)
= (0-1)2 P(0) + (1-1)2 P(1) + (2-1)2 P(2) = (1)(1/4) + (0)(1/2) + (1)(1/4) = ½ std. = √1/2 = 0.707 Eje. En un estudio sobre la movilidad de los ejecutivos en el área de compras, se encontró que la distribución que se describe a continuación con suficiente aproximación a la distribución de probabilidad de x, los números de compañías en las que un ejecutivo actualmente empleado ha prestado sus servicios como jefe de compras. x P(x)
1 0.52
2 0.22
3 0.19
4 0.04
0.03
5
Encuentre la media y la desviación estándar de x. La media es igual a E(x) = ∑ x P(x) = (1)(0.52) + (2)(0.22) + (3)(0.19) + (4)(0.04) + (5)(0.03) = 1.84 La varianza es igual al valor esperado de (x - µ )2, esto es
σ2 = E(x - µ )2
= (1-1.84)2(0.52) + (2-1.84)2(0.22) + (3-1.84)2(0.19) + (4-1.84)2(0.04) + (5-1.84)2(0.03) = 1.1144
La desviación estándar de la distribución es
σ = √ 1.1144 = 1.055 La media µ = 1.84 y la desviación estándar σ = 1.055 se pueden utilizar junto con el teorema de Tchebysheff para describir la distribución de probabilidad del número de compañías en las que un ejecutivo actualmente empleado ha prestado sus servicios en el área de compras. Eje. El gerente de una planta industrial planea adquirir una nueva máquina del tipo A o B. Si t denota el número de horas de funcionamiento diario, y el número de reparaciones diarias X1 que se tienen que hacer a una máquina del tipo A es una variable aleatoria con una media y una varianza iguales a 0.10t. La cantidad de reparaciones diarias X2 que requiere una máquina del tipo B constituye una variable aleatoria con una media y una varianza iguales a 0.12t. El costo diario de operación de la 30
máquina tipo A es de C A (t ) = 10t + 30 X 12 , el de la tipo B es de C B (t ) = 8t + 30 X 22 . Suponga que las reparaciones toman un mínimo de tiempo, y que cada noche las máquinas se alternan de tal manera que funcionen como nuevas al comienzo del siguiente día ¿Cuál de ellas reduce al mínimo el costo diario esperado si un día laboral consta de a) 10 horas y b) 20 horas? El costo diario esperado para la máquina A es de:
[
E C A (t )
] = E [10t + 30 X ] = 10t + 30 E ( X ) = 10t + 30{V ( X ) + [ E ( X )] } = 10t + 30[0.1t + (0.1t ) ] 2 1
2 1
2
1
2
1
= 13t + 0.3t 2 De la misma manera: E [ C B (t )]
= E [8t + 30 X 22 ] = 8t + 30 E ( X 22 ) = 8t + 30{V ( X 2 ) + [ E ( X 2 )] 2 } = 8t + 30[0.12t + (0.12t ) 2 ] = 11.6t + 0.432t 2
Por lo tanto, para a) donde t = 10 E [ C A (10)]
= 160
y
E [ C B (10)]
= 159.2
= 380
y
E [ C B (20)]
= 404.8
Para el inciso b) donde t = 20, E [ C A (20)]
En resumen, las máquinas tipo B son más económicas en periodos cortos debido a su reducido costo de operación por hora. Sin embargo, en periodos largos son más económicas las tipo A, ya que tienden a requerir reparaciones con menos frecuencia. Eje. Cien empleados de una empresa tienen salarios anuales cuyo promedio es 22, desviación estándar 3, y mediana 20. Con ayuda del teorema de Tchebyshev, válido para datos de muestras, determinar un intervalo que contenga por lo menos el 75% de los salarios. ¿Qué interpretación se puede dar a la media del salario? El teorema de Tchebyshev establece que por lo menos (1 – 1/k 2) de las mediciones deben estar dentro de k desviaciones estándar de su promedio. Para k = 2, 1 – 1/k 2 = 1 – ¼ = ¾ o 75%. Ahora bien, x = 22 y s = 3; y x ± 2s da como resultado 22 ± 6. Al menos, el 75% de los sueldos deben estar entre 16 y 28 inclusive. La mediana de 20 nos dice que el 50% de los sueldos debe ser menor que 20. Con estos datos se podría deducir que de los 100 originales hay muchos salarios, pero no más del 50%, en el intervalo de 16 a 20.
31
Eje. Un proveedor de petróleo tiene un tanque de 200 galones lleno al principio de cada semana. Sus demandas semanales tienen un comportamiento de frecuencia relativa que aumenta constantemente hasta llegar a 100 galones, y a continuación permanece igual entre 100 y 200 galones. Si X representa la demanda semanal en cientos de galones, suponer que las frecuencias relativas de la demanda se modelan en forma adecuada mediante: 0 x f ( x) = 1 / 2 0
<0 0 ≤ x ≤ 1 1 < x ≤ 2 x > 2 x
Calcular F(b) para esta variable aleatoria. Usar F(b) para calcular la probabilidad de que la demanda sea mayor de 150 galones en determinada semana. si x < 0
0 b xdx = b2 / 2 b ∫ F (b) = ∫ f ( x)dx = b− ∞ −∞ ∫ 1 (1/ 2)dx = 1/ 2 (b − 1) 1 F (b)
1/ 2 + (b −1) / 2 = b / 2 = 1
si 0 ≤ x ≤ 1 si1 ≤ x ≤ 2 si x > 2
1
>2
La gráfica de esta función es una línea continua, aun cuando f(b) tenga dos discontinuidades. La probabilidad de que la demanda supere los 150 galones es P(X >1.5) = 1 – P(X≤ 1.5) = 1 – F(1.5) = 1 – 1.5/2 = 0.25 Eje. Sea X el porcentaje del tiempo que trabaja un torno en un taller de maquinaria, de una semana de trabajo de 40 horas, que es el tiempo que debería trabajar el torno. Supóngase que X tiene una función de densidad de probabilidad dada por
32
3 x2 f ( x) = 0
0 ≤ x
≤1
c.o. p
Calcular el promedio y la varianza de X. E ( x )
∞
1
= ∫ −∞ xf ( x) dx = ∫ 0 x (3 x 2 ) dx = 0.75
Así, en promedio, el torno se usa el 75% del tiempo. E ( x 2 )
Entonces
V ( x)
= ∫ −∞ x 2 f ( x)dx = ∫ 0 x 2 (3 x 2 )dx = 2 = 0.60 ∞
1
5
= E ( x 2 ) − µ 2 = 0.60 − (0.75 ) 2 = 0.0375
Eje. La cantidad semanal Y invertida en sustancias químicas en una empresa tiene una media de $445 y una varianza de $236. ¿Dentro de qué intervalo se debe esperar que queden los costos semanales de productos químicos cuando menos el 75% de las veces? Para determinar un intervalo que garantice contener cuando menos el 75% de la masa de probabilidad para Y, se obtiene 1 – 1/k 2 = 0.75;
k=2
Así, el intervalo µ - 2σ a µ + 2σ contendrá por lo menos el 75% de la probabilidad. Este intervalo está dado por 445 ± 2 236 = 445 ± 30.62. Eje. La oficina meteorológica clasifica el tipo de cielo que es visible en relación con los grados de nubosidad. Se usa una escala con 11 categorías: 0, 1, 2, ..., 10, en donde 0 representa un cielo perfectamente claro, 10 representa un cielo completamente cubierto, mientras que los otros valores representan diversas condiciones intermedias. Supongamos que tal clasificación se hace en una estación meteorológica determinada en un día y hora determinados. Sea X la variable aleatoria que toma uno de los 11 valores anteriores. Supongamos que la distribución de probabilidades de X es po = p10 = 0.05; p1 = p2 = p8 = p9 = 0.15 p3 = p4 = p5 = p6 = p7 = 0.06 Por tanto
E(X) = 1(0.15) + 2(0.15) + 3(0.06) + 4(0.06) + 5(0.06) +6(0.06) + 7(0.06) + 8(0.15) + 9(0.15) + 10(0.05) = 5.0 E(X2) = 1(0.15) + 4(0.15) + 9(0.06) + 16(0.06) + 25(0.06) +36(0.06) + 49(0.06) + 64(0.15) + 81(0.15) + 100(0.05) = 35.6 V(X) = E(X2) – (E(X))2 = 35.6 – 25 = 10.6
33
Eje. Supongamos que X es una variable aleatoria continua con fdp 1 + x 1 − x
f ( x) =
−1 ≤ x ≤ 0 0 ≤ x ≤ 1
Debido a la simetría de la fdp, E(X) = 0. Más aún, E ( X 2 )
0
1
=∫ x 2 (1 + x) dx + ∫ x 2 (1 − x) dx =1 / 6 −1 0
por lo tanto V(X) = 1/6. Propiedades de la varianza de una variable aleatoria.
1. Si C es una constante, V(X + C) = V(X) 2. Si C es una constante, V(CX) = C2V(X) 3. Sean X1, X2, ..., Xn n variables aleatorias independientes. Entonces
V(X1 + X2 + ... + Xn) = V(X1) + V(X2) + .... + V(Xn)
4. Sea X una variable aleatoria con varianza finita. Luego para cualquier número real a, V(X) = E[(X – a)2] – [E(X) – a]2 Demostración:
34
=∑( xi +k ) 2 f ( xi ) − µ X 2 +k =∑ xi 2 f ( xi ) +2k ∑ xi f ( xi ) +k 2 ∑ f ( xi ) −( µ X +k ) 2 =∑ xi 2 f ( xi ) +2k µ X +k 2 −( µ X 2 +2k µ X +k 2 ) =∑ xi f ( xi ) − µ X 2 =V ( X )
V ( X +k )
∑(kx ) f ( x ) − µ =k ∑ x f ( x ) −(k µ ) =k ∑ x f ( x ) −k µ =k ( ∑ x f ( x ) − µ ) =k V ( X ) V ( X +Y ) =∑( x + y ) h( x , y ) − µ =∑ x h( x , y ) +2∑ x y h( x , y ) +∑ y h( x , y ) −( µ + µ ) = ∑ x f ( x ) +2∑ x f ( x )∑ y g ( y ) + ∑ y g ( y ) − µ − 2 µ µ − µ =∑ x f ( x ) − µ +∑ y g ( y ) − µ = V ( X ) +V (Y ) V ( kX ) =
2
i
i
2
2
2
i
i
2 kX
2
2 X
2
2
j
i
i
X
2
i
2
i
2
i
2 X
i
2
2 X +Y
j
i , j
2
2
i
i
j
i
i , j
j
i
j
2
j
i , j
i
X
2
i
i
i
i
j
i
2
i
j
j
j
j
2 X
j
X
Y
2 Y
j
2
2 X
i
Y
i, j
2
i
i
j
j
2 Y
j
Para dos variables aleatorias X e Y no necesariamente independientes: σ 2 ( X + Y )
= σ 2 ( X ) + σ 2 (Y ) + 2 cov( X , Y )
Se llama covarianza de dos variables aleatorias X e Y a la expresión cov( X , Y ) = E { ( X − µ X )(Y − µ Y )}
= ∑ ( xi − µ X )( y j − µ Y ) P ( xi , y j ) i , j
Otra
forma
de
la
covarianza, E { ( X − µ X )(Y − µ Y )} = E { XY − µ X Y − µ Y X + µ x µ Y } , es cov( X , Y )
que
se
obtiene
desarrollando
= E ( XY ) − E ( X ) E (Y )
De aquí se deduce que, en el caso de variables aleatorias dependientes E ( XY )
= E ( X ) E (Y ) + cov( X , Y )
El término covarianza hace referencia a una variación conjunta de las variables que entran en juego. Que dos variables varíen de forma conjunta significa que las variaciones que experimenta cualquiera de ellas son parejas o solidarias con las variaciones que experimenta la otra. En particular, si X e Y son independientes, se verifica cov( X , Y )
=0
4.8 Transformación de variables.
35
Suponer que se transforman las mediciones x1, x2, ..., xn, a otras mediciones y1, y2, ..., yn mediante yi = a xi + b Si x1, ..., xn tienen el promedio x y la variancia s2x entonces es fácil demostrar que y1, ..., yn tienen promedio y y variancia s2y dados por y
= a x + b
y por s2y = a2 s2x Eje. Es importante para una estructura sencilla de un andamio de acero, estudiar el aumento de la longitud de los miembros que trabajan a tensión bajo carga. Para una carga de 2,000 Kg., diez miembros iguales que trabajan a tensión mostraron aumentos de longitud como sigue (mediciones en centímetros): 2.5
2.2
3.0
2.1
2.7
2.5
2.8
1.9
2.2
2.6
(a) Calcular la media y la desviación estándar de esas mediciones. (b) Suponer que las mediciones se hubieran tomados en metros, y no en centímetros. Determinar el promedio y la desviación estándar de las mediciones correspondientes en metros. El promedio es x = 1/10 (2.5 + 2.2 + ... + 2.6) = 2.45
y la variancia es 2 1 1 1 2 2 = ∑ ( x − x ) = ∑ x − ∑ x n =1 n − 1 =1 n − 1 =1 = 1 61.09 − 1 ( 24.5) 2 = 0.1183 9 10 n
n
2 x −
s
i
i
i
y
n
i
i
i
sx = 0.34 Si yi representa la medición correspondiente en metros, entonces
Se infiere que
yi = 0.01xi 10
10
∑ y = ∑0.01 x i
i =1
y
i
i =1
10
= 0.01∑xi i =1
= ( 0.01 ) x =0.01 ( 2.45 ) = 0.0245 36
y 2
s y =
2
1 10
( 0.0 x1 − 0.0 x1 ) ∑ 9 i
=
1= 1
1 10
(0.0 1) ( x − x ) ∑ 9 2
i
2
= (0.0 1)
i= 1
2
1 10
( x − x ) ∑ 9 i
2
2 2
= (0.0 1) s x
i= 1
sy = (0.01)sx = (0.01)(0.34) = 0.0034. 4.9 Momentos de una variable aleatoria.
Los parámetros µ y σ son medidas numéricas descriptivas importantes que localizan el centro y describen la dispersión relacionada con los valores de una variable aleatoria X. Sin embargo, no proporcionan una representación única de la distribución X. Muchas distribuciones distintas poseen las mismas mismas medias medias y desviac desviacion iones es estánd estándar. ar. Ahora Ahora analiz analizarem aremos os un conjun conjunto to de medias numérica numéricass descriptivas que (por lo menos en condiciones generales) determinan de forma única a p(x). Se llaman momentos a las esperanzas de algunos tipos importantes de funciones. El nombre viene debido a cierta analogía con los momentos en física, suponiendo que las cantidades de f(x) fuesen masas discretas de puntos que actúan de manera perpendicular al eje X se ha introducido en probabilidad y estadística el término momento. Sea X una variable aleatoria y sea Y = g(X) otra variable aleatoria función de X. Se calcula la esperanza o valor esperado de Y como E (Y )
E (Y )
= E [ g ( X ) ] = ∑ g ( xi ) P ( xi )
si si X es discreta
∞
f ( x) f ( x) dx = E [ g ( X )] = ∫ −∞
si si X es continua
Tiene especial interés el caso en que g(x) = xk , para k = 1, 2, 3, ..... El r-ésimo momento inicial (también llamado r-ésimo momento aleatorio alrededor del origen) de la variable aleatoria X, representado por µ r , es el valor esperado de Xr , es decir, µ r = E ( X r , r ∈ N. Evidentemente, el primer momento inicial de una variable aleatoria es su media o valor esperado, esto es: µ r = E ( X ) = µ . El r-ésimo momento central central (o momento alrededor de la media) de una variable aleatoria X, representado por µ
r
* , se define como sigue: µ r * = E ( X − µ )
r
En particular σ 2 = µ * . 2 Existe también el llamado r-ésimo momento absoluto, aunque es poco común, el cual es igual al résimo momento inicial de la variable aleatoria h(X) = |X|. Los momentos centrales pueden expresare en términos de los momentos iniciales (o del origen) mediante la siguiente relación 37
µ r *
r k = ∑(−1) k µ µ r −k , k
k = 0,1,2,...
Si el primer momento central existe, debe ser necesariamente cero µ 1* = 0 ; por otra parte, el segundo momento central de una variable aleatoria X se denomina varianza (si es que existe), y se denota por V ( X ) = σ 2 = E [( X − µ ) 2 ] . La raíz cuadrada no negativa de la varianza se llama desviación estándar . Es muy fácil probar que, tanto para una variable aleatoria discreta como para una continua, se cumple la relación: σ 2 = µ 2 * = µ 2 − µ 2
esto es: E ( X − µ )
2
= σ 2 = E ( X 2 ) − µ 2
Lo anterior se generaliza como sigue:
[( ) ] = E ( X ) − 3 µ E ( X ) + 2 µ E [( X − µ ) ] = E ( X ) − 4 µ E ( X ) + 6 µ E ( X ) − 3 µ E X − µ
3
3
2
3
4
4
3
2
2
4
y así sucesivamente. Una condición necesaria, pero no suficiente, para que la gráfica de una función de densidad de probabilidad sea simétrica con respecto a la perpendicular del eje X trazada en la media, es que el tercer momento central sea cero. En otras palabras, si la gráfica de f(x) es simétrica con respecto a la media, entonces µ 3* = 0 , pero lo recíproco no siempre es verdad. Cuando la gráfica de f(x) no es simétrica con respecto a la media, entonces se llama sesgada. Si X es una variable aleatoria, entonces el sesgo (o asimetría) de X se denota por cualquiera de los símbolos siguiente: α 3 = γ , β3 Y se define en términos del tercer momento central: α 3 = γ =
1 σ
3
*
3
E ( X − µ ) =
µ 3 σ
3
Si γ = 0, la gráfica de f(x) es perfectamente simétrica respecto de la media, si γ es positiva, la gráfica presenta una especie de cola alargada del lado derecho; mientras que si γ es negativa, entonces la gráfica presenta una cola notoria del lado izquierdo. El motivo para definir el sesgo mediante γ , en lugar de hacerlo directamente con µ 3* estriba en que γ es independiente de las unidades de medición, mientras que el tercer momento central µ 3* no lo es.
38
En particular, γ 1 se llama tipificación de la variable X, γ 3 es el sesgo, α4 = κ es el Kurtossis (o exceso) α 4
1
= κ =
σ
4
*
4
E ( X − µ )
=
µ 4 σ
4
La magnitud κ = α4 proporciona un indicador de qué tan “picuda” es la gráfica de la función de densidad f(x). Mientras mayor sea la cantidad, tanto más picuda o pronunciada será la cresta en la gráfica de f(x). Es pertinente señalar, sin embargo, que la Kurtossis de una distribución es poco usual, por considerarse que la interpretación que se tiene de ella es vaga y de valor dudoso. Eje. El diámetro (en centímetros) de unos balines metálicos para uso industrial, es una variable aleatoria continua x, cuya función de densidad esta dada por: f ( x)
a) b) c) d) e)
2cx − cx 2 − 0.99 c = 0,
0.9
< x < 1.1
c.o. p.
Obtenga Obtenga el valo valorr de la la const constant antee c. La me media. Halle Halle la varia varianza nza y la desvi desviaci ación ón estánd estándar. ar. Mediana. La moda.
a) 1.1
∫ c(2 x − x
2
− 0.99 ) dx = 1
0. 9
1 .1
∫
c ( 2 x − x 2
− 0.99 ) dx = 1 ∴c[ x 2 −
0. 9
(1.1) 3 c[(1.1) − 3 .0013333 c = 1 2
c
b)
x 3
3
− 0.99 x]10..19 = 1
( 0 .9 ) 3 − 0.99 (12 .1) − (0.9) + 3 2
+ 0.99 (0.9)] = 1
= 750
1. 1
1. 1
1 .1
∫
µ = c x( 2 x − x 0 .9
2
− 0.99 ) dx = c ∫ ( 2 x − x − 0.99 x) dx 2
3
0. 9
2(1.1) (1.1) 0.99 (1.1) 2 2 ( 0. 9 ) 3 (0 . 9 ) 4 = 750 − − − + 4 2 3 4 3 µ = 1 3
4
2 x 3 x 4 0.99 x 2 = 750 − − 3 4 2 0.9 2 0.99 (0.9 ) + =1 2
c)
39
1.1
2
σ
= ∫ x f ( x)dx − µ = c ∫ (2 x − x − 0.99 x 2
2
3
4
2
) dx
− µ
2
2(1.1) 4 (1.1)5 0.99 (1.1)3 2(0.9) 4 (0.9)5 = 750 − − − + 5 3 4 5 4 σ 2 = 2−3 2−3
σ =
d) x
me
= c ∫ ( 2 x − x − 0.99 ) dx 2
0.9
igualamos
2 x 4 x5 0.99 x3 = c − − − µ 2 5 3 0.9 4 0.99 (0.9)3 + −1 3
= 0.04472 x
t 3 = c ∫ ( 2t − t − 0.99 ) dt = 750 t 2 − − 0.99 t ) 3 0.9 0. 9 x
=1 / 2
∴ x
2
−
x 3
3
− 0.99 x +
soluciones
97 300
=0
:
= 0.8267 x2 = 1 x3 = 1.173 x1
Con estos resultados podemos observar que x 1 y x3 no pueden ser considerados dado que se encuentran fuera de los limites señalados y por lo tanto la solución es: me = 1 e) = c( 2 x − x 2 − 0 .99 ) = 0 f ´( x ) = c[ 2 − 2 x] = 0 2 − 2 x = x = 1 mo = 1 f ( x )
Una gráfica de esta función
y
=1500 x − 750 x 2 − 742 .5 es: grafica de y=1500x-750x2-742.5
8 7 6 5
y
4 3 2 1 0 0.9
0.95
1
1.05
1.1
1.15
x
40
Teorema de Chébyshev.
En el siglo XIX, el matemático ruso Pafnuty L. Chébyshev (1821-1894) obtuvo una importante desigualdad que asegura lo menos que puede valer la probabilidad de que una variable aleatoria cualquiera (discreta o continua) asuma un valor dentro de k desviaciones estándar alrededor de la media ( k > 1). Aunque la garantía mínima propuesta por Chébyshev no siempre es precisa al compararla con el valor verdadero, la ventaja de este teorema es su gran generalidad, pues es aplicable a cualquier variable aleatoria con cualquier distribución de probabilidad, ya sea discreta o continua, y generalmente es útil cuando la distribución de probabilidad es desconocida. El teorema de Tchebysheff. Dados un número k, y un conjunto de observaciones x1, x 2, ...., xn, al menos (1 - 1/k 2) de las observaciones caen dentro de k desviaciones estándar de la media. La probabilidad de que cualquier variable aleatoria X tome un valor dentro de k desviaciones estándar de la media es al menos 1 – 1/k 2. Es decir. P ( µ − k σ < X < µ + k σ ) ≥1 −
1 2
k
P ( X − µ
o
≤ k σ ) ≤
1 k 2
Dem. Por la definición de varianza de X podemos escribir σ 2 = E ( X − µ ) 2 +∞
2 =∫ ( x − µ ) f ( x)dx −∞
µ −k σ
=∫ −∞
µ +k σ
µ −k σ
≥∫ −∞
∞
2 2 + ∫ ( x − µ ) f ( x)dx +∫ ( x − µ ) f ( x )dx µ −k σ µ +k σ
2 ( x − µ ) f ( x)dx
∞
( x − µ )2 f ( x )dx +∫ µ +k σ
( x − µ ) 2 f ( x )dx
debido a que la segunda de las tres integrales es no negativa. Ahora bien, como
cualquier
( x − µ ) 2
( − x( − µ ) ≤ k σ ≤ x( − µ ) x ≥ µ + k σ − x + µ ≤ k σ − x ≤ k σ − µ x ≥ µ − k σ
x
≥ µ + k σ o x ≤ µ − k σ ,
x − µ ≥ k σ
tenemos
para
que
≥ k 2σ 2 en ambas integrales. Se sigue que 2
σ
−k σ
≥ ∫ −∞ µ
k 2σ 2 f ( x )dx
∞
+ ∫ +k µ
k 2σ 2 f ( x )dx
σ
y que µ −k σ
∫
−∞
f ( x ) dx
∞
+ ∫ f ( x ) dx ≤ µ +k σ
1 k 2
41
De aquí P ( µ − k σ < X < µ + k σ )
µ + k σ
= ∫ f ( x)dx ≥1 − µ − k σ
1 k 2
.
El teorema de Tchebysheff se refiere a cualquier conjunto de observaciones, por lo tanto se puede aplicar tanto a una muestra como a la población independientemente de que el histograma de probabilidades tenga o no forma de campana. Los resultados del teorema son muy conservativos en el sentido de que la probabilidad real de que X se localice en el intervalo µ ± k σ por lo común rebasa la cota o límite inferior par la probabilidad, 1 −
1 2
k
, por una cantidad considerable.
Eje. La cantidad de clientes que llega cada día aun mostrador, X, observada por un periodo prolongado tiene una media de 20 y una desviación estándar de 2. Se desconoce la distribución de probabilidad ¿Qué se puede decir de la probabilidad de que, mañana, X esté entre 16 y 24? Deseamos calcular P (16 < X < 24 ) , del teorema de Chebyshev, sabemos que, para cualquier k ≥ 0 , P ( µ − k σ < X < µ + k σ ) ≥1 − µ + k σ = 24
si k = 2. Por lo tanto,
1 2
k
, Como
P (16 < X < 24) = P [ ( µ − 2σ )
µ = 20
y
σ = 2 ,
se infiere que
< X < ( µ + 2σ ) ] ≥ 1 −
1 2
2
=
µ − k σ = 16
y
3 4
En otras palabras, la cantidad total de clientes que llegará mañana estará entre 16 y 24 con una probabilidad al menos de ¾. Eje. La función de distribución acumulada exponencial es F ( x)
0 = − x 1− e
<0 si x ≥ 0 si x
La función de distribución de probabilidades es f(x) = e-x, x ≥ 0. Así, para esta distribución ∞
µ 1
= ∫ 0 xe − x dx = 1
µ 2
= ∫ 0 x 2 e − x dx = 2
µ 3
= ∫ 0 x 3e − x dx = 6
µ 4
= ∫ 0 x 4 e − x dx = 24
∞
∞
∞
Por consiguiente
42
= µ 2 − µ 12 = 1
V ( X )
σ = 1
= µ 4 − 4 µ 3 µ 1 + 6 µ 2 µ 12 − 3 µ 14 = 24 − (4)(6)(1) + 6( 2)(1) − 3 = 9 α 4 = 9.
µ 4*
Eje. Suponga que los editores de la revista Playboy desean aumentar sus suscriptores. Para ello, envían cartas (o mensajes por e-mail) a un número aleatorio de personas, invitándolas a suscribirse con ciertas ventajas. De las personas que reciben esa correspondencia, un gran número ni siquiera la leen y la tiran a la basura, pero otros la leen y responden. Supongamos que la proporción de personas que responden a la invitación (0 = 0%, 1 = 100%) es una variable aleatoria (continua) X, cuya función de densidad de probabilidad está dada por:
2( x + 2) , f ( x) = 5 0,
si 0 ≤ x
≤1
c.o. p
a) Verifique que, en efecto, f(x) es una función de densidad de probabilidad. b) Encuentre la distribución acumulada de probabilidad F(x). c) Calcule la probabilidad de que entre 30 y 60% de personas que reciben la correspondencia, la respondan. d) Encuentre el porcentaje esperado (media) de personas que responderán a la invitación. e) Determine la varianza y la desviación estándar de la variable aleatoria X. f) Calcule el coeficiente de sesgo. 2( x +2)
∞
1
−∞
0
∫ f ( x)dx = ∫ F ( x)
x
x
f (t )dt = ∫ = ∫ −∞ 0
F ( 0.6) − F ( 0.3)
dx
5
2 x
2
= 5 2
2(t +2) 5
dt
1
2 1 +2 x +2 =1 = 5 2 0 2 t
2
= 5 2
x
2 x 2 +4 x 2 x 2 x , +2t = + = 5 0 5 5
x ∈[0,1]
= 0.552 −.258 = 0.294
µ = E ( X ) =
2
∞
2
1
1
∫ xf ( x)dx = 5 ∫ x( x +2)dx = 5 ∫ ( x −∞
0
2
0
+2 x)dx
1
x 3 2 1 8 ≈53 .3% = + x 2 = +1 = 5 3 15 0 5 3 2
σ =V ( X ) = 2
=
∞
∫ x
2
2
−∞
( x 5 ∫ 1
0
3
f ( x )dx
− µ =
+2 x ) − 2
2
64 225
=
2 5
1
∫ x 0
37 450
2
2
( x +2)dx
8 − 15
≈ 0.08222
La desviación estándar es, σ =
37 450
≈ 0.286744 43
* 3
µ
= E [( X − µ )
3
=− luego γ = α 3
=
3
] = ∫ −∞ ( x − µ ) f ( x)dx = 5 ∫ 0 x − 158 ( x + 2)dx ∞
11 3375
µ 3* σ 3
2
3
1
≈ −0.003259 ;
=−
968 50653
=−
22
2
37
37
≈ −0.13824
De antemano sabíamos que el sesgo debe ser negativo, ya que se trata de una línea recta con pendiente positiva y, por tanto, la cola de la gráfica aparece pronunciada en el lado izquierdo. Eje. Un padre le da a su hijo una cantidad variable de dinero diario para sus gastos en la escuela. Suponga que el señor deja el asunto al azar; en cada uno de tres papeles pequeños escribe “20 pesos”, en cada uno de otros cinco papeles anota “10 pesos” y en cada uno de otros siete papeles escribe “5 pesos”. Dobla los 15 papeles y los mete en un frasco. Su hijo debe sacar al azar cuatro papeles del frasco cada mañana (sin reposición) y le dará la cantidad que sumen ese día para sus gastos en la escuela. Si T es la variable aleatoria que representan el total de dinero que el niño se lleva cada día a la escuela: a) b) c) d) e)
Halle la distribución de probabilidad de T en forma de una tabla. Calcule la media o valor esperado de T. Encuentre la varianza y la desviación estándar. Haga el dibujo de un histograma que represente la distribución de probabilidad de T. Averigüe qué tan útil puede ser la desigualdad de Chébyshev para estimar la probabilidad mínima de que el niño se llevará más de $20, pero menos de $55. (Sugerencia: tome el intervalo desde 25 hasta 52.333).
Es fácil convencerse de que existen 14 combinaciones de monedas (ver tabla adjunta),
1 2 3 4 5 6 7 8 9 10 11 12 13 14
$20 (3) 0 0 0 0 1 0 1 1 1 2 2 2 3 3
$10 (5) 0 1 2 3 0 4 1 2 3 0 1 2 0 1
$5 (7) 4 3 2 1 3 0 2 1 0 2 1 0 1 0
t($) 20 25 30 35 35 40 40 45 50 50 55 60 65 70
f(t) 1/39 5/39 2/13 2/39 1/13 1/273 3/13 2/13 2/91 3/65 1/13 2/91 1/195 1/273
pero sólo 11 sumas distintas de dinero que el niño puede llevarse ello se debe a que hay tres sumas de dinero ($35, $40, $50) que pueden obtenerse de dos maneras distintas. 44
Tenemos que calcular las probabilidades respectivas en esas 11 cantidades, usando la fórmula para ensayos sin reposición. Por ejemplo, la probabilidad de que se lleve 35 pesos está dada por: 3 5 7 3 5 7 0 3 1 + 1 0 3 = 2 + 1 = 5 39 13 39 15 15 4 4
De esta manera encontramos, uno por uno, los valores de f(t) para cada uno de los 11 números posibles de la variable aleatoria T, que representa el total de dinero que se lleva el niño cada día. Por tanto, la distribución de probabilidad de la variable aleatoria T es la siguiente: ti pi
20 1/39
25 5/39
30 2/13
35 5/39
40 45 64/27 2/13 3
50 55 31/45 1/13 5
60 2/91
65 70 1/195 1/273
Podemos obtener la media o valor esperado de: 1 + 25 5 + 30 2 + 35 5 + 40 64 + 45 2 + 50 31 + 55 1 39 39 13 39 273 13 455 13 2 1 + 70 1 = 116 ≈ 38.6667 + 60 + 65 91 195 273 3
µ = 20
Esto significa que, en promedio, el niño se lleva a la escuela aproximadamente $38.70. La varianza es el segundo momento central de orden 2: 2
2
σ
2
2
2
116 1 116 5 116 2 116 5 = 20 − + 25 − + 30 − + 35 − + 3 39 3 39 3 13 3 39 2 2 2 2 40 − 116 64 + 45 − 116 2 + 50 − 116 31 + 55 − 116 1 + 3 273 3 13 3 455 3 13 2 2 2 60 − 116 2 + 65 − 116 1 + 70 − 116 1 = 6248 ≈ 99.1746 3 91 3 195 3 273 63
Por consiguiente, la desviación estándar es: σ =
6248 63
≈ 9.958645 ≈ $10.
Una desviación estándar de casi $10 es considerable. ¿Qué significa? Significa que existe bastante dispersión de los valores de T alrededor de la media, es decir, que las cantidades que el niño se lleva en realidad a la escuela son bastante heterogéneas. El histograma es.
45
Barchart for Col_2 0.24 0.2
y c n e u q e r f
0.16 0.12 0.08 0.04 0 20
25
30
35
40
45
50
55
60
65
70
El teorema de Chébyshev proporciona la garantía de que para cualquier k > 1 ocurre que P ( µ − k σ < X < µ + k σ )
≥ 1−
1 2
k
. Empero, para variables aleatorias discretas, la desigualdad de
Chébyshev sólo es aplicable en casos excepcionales, porque deberíamos tener mucha suerte para que ambos µ − k σ y µ + k σ estuviesen en el dominio de definición de X. En este caso, es fácil convencerse de que ningún valor de k > 0 produce el efecto deseado, porque si hubiese números naturales n, m tales que µ − k σ = n , y µ + k σ = m , necesariamente se llegaría a 116 116 232 = −n ⇒m +n = m− , lo cual es imposible. Además, la condición k > 1 nos obliga a tomar 3
3
3
n < 28.67 y m > 48.67. Mediante el intervalo 25 < X < 52 1/3 como una aproximación del intervalo 20 < X < 55, entonces sí es posible emplear la desigualdad de Chébyshev. Tenemos así dos ecuaciones de primer grado: 116 3
− k
6248 63
116
= 25;
3
+ k
6248 63
1
157
3
3
= 52 =
Resolviendo cada una de estas ecuaciones, obtenemos, como era de esperarse, el mismo valor: k =
41
1562
2
7
lo cual significa que, en efecto, el intervalo tiene su centro en la media. Por tanto, la estimación mínima, según el teorema de Chébyshev, es: 1−
1 k 2
= 1−
6248 11767
=
5519 11767
≈ 0.4690
Para obtener el valor exacto, se calcula primero la distribución acumulada de probabilidad F(x) mediante una tabla y se evalúa F(50) – F(25). Eje. En la teoría de fiabilidad de los dispositivos automáticos, la fiabilidad de un elemento o de un sistema se caracteriza por la llamada intensidad media de fallos λ (t), la cual representa una función de tiempo tal, que siendo multiplicada por dt, ofrece (con exactitud de infinitesimales de orden superior) la probabilidad condicional del fallo del elemento en el intervalo de tiempo (t, t + dt), 46
suponiendo que hasta el momento t el elemento funcionaba normalmente. Conociendo la función λ(t), se puede hallar la ley de distribución de la duración de servicio. Para hallar la ley de distribución de la duración de servicio del elemento T, examinemos dos acontecimientos: A (buen funcionamiento del elemento hasta el momento t) y B (fallo del elemento en el intervalo de tiempo (t, t + dt)). Es evidente que el acontecimiento B no puede suceder sino junto con el acontecimiento A, porque el elemento puede fallar en el intervalo de tiempo (t, t + dt) solamente en el caso de funcionar bien hasta el momento t. Por eso P(B) = P(A∩B), y basándonos en el principio de multiplicación de probabilidades, podemos escribir P ( B )
= P ( A) P ( B | A)
Designemos las funciones incógnitas de distribución y la densidad de probabilidad de la duración de servicio del elemento T por F(t) y f(t) respectivamente.La probabilidad del acontecimiento B es igual, con exactitud hasta infinitesimales de segundo orden, al elemento de probabilidad correspondiente: P ( B )
= P (t < T < t + dt ) = f (t ) dt = F (t )dt
La probabilidad del acontecimiento A se expresa por medio de la función de distribución de la duración de servicio del elemento T. P ( A)
= P (T ≥ t ) =1 − P (T < t ) =1 − F (t )
Por fin, la probabilidad condicional P(B|A) se expresa por la intensidad media de fallos del elemento λ(t): P ( B | A)
= λ (t ) dt
Sustituyendo las expresiones obtenidas, obtendremos después de dividir ambos miembros por dt, la ecuación diferencial para la función de distribución F(t): F ′(t )
= [1 − F (t )]λ (t )
Dado que la duración de servicio del elemento no puede ser negativa, el acontecimiento T < 0 es imposible y, por lo tanto F(0) = 0. Integrando la ecuación anterior, con la condición inicial de que F(0) = 0, hallamos la función de distribución de la duración de servicio del elemento: F (t )
t
λ ( t ) dt =1 −e ∫
−
0
De aquí, por derivación, hallamos la densidad de probabilidad de la duración de servicio del elemento: t
∫ f (t ) =λ (t )e
− λ ( t ) dt 0
En el caso particular, de que la intensidad de fallos F (t )
= 1 − eλ t
λ (t )
f (t )
= λ sea constante, se tiene
= λ e−λ t 47
De este modo, siendo constante la intensidad de fallos λ, la duración de servicio de un elemento está subordinada a la ley exponencial de distribución, lo que explica el gran papel que dicha ley desempeña en la teoría de fiabilidad de los sistemas automáticos. Eje. Para los mismos datos del ejemplo anterior, hallar la probabilidad condicional de que el elemento falle en el intervalo de tiempo (t1, t2) suponiendo que funcione bien hasta el momento t1. Examinemos dos acontecimientos: A (el funcionamiento normal del elemento hasta el momento t1, y B (el fallo del elemento en el intervalo de tiempo (t1, t2)). De = P (t 1 < T < t 2 ) = F (t 2 ) − F (t 1 ) P ( A) = P (T ≥ t 1 ) = 1 − P (T < t 1 ) = 1 − F (t 1 ) P ( B)
Sustituyendo estas expresiones en P ( B ) = P ( A) P ( B | A) y tomando en cuenta que en el caso dado el acontecimiento B no puede producirse sino junto con el acontecimiento A, hallaremos la probabilidad buscada de que falle el elemento en el intervalo de tiempo (t1, t 2) a condición de que hasta el momento t1 haya funcionado bien: P ( B | A)
= P ( A ∩ B) = P ( B) = F (t 2 ) − F (t 1 ) P ( A) P ( A) 1 − F (t 1 )
Sustituyendo aquí F(t), obteniendo t 2
∫ P ( B | A) =1 − e −
t 1
λ ( t ) dt
En el caso particular, en que la intensidad de fallos λ es constante, se tiene P ( B)
= e−λ t − e−λ t 1
2
y P ( B | A)
= 1 − e− λ (
t 2 − t 1 )
Eje. En el problema de detección de la señal en los ruidos, la amplitud de la señal útil U es de ordinario una magnitud aleatoria que puede tomar cualquier valor, tanto positivo como negativo. La amplitud de la señal U es igual a cero cuando la señal no está presente y se recibe sólo ruido. Si, la probabilidad de la presencia de la señal es igual a p, entonces, la probabilidad de la ausencia de la señal, es decir, la probabilidad del valor cero de su amplitud es igual a q = 1- p. De este modo, la amplitud de la señal U no es más que una magnitud aleatoria de tipo mixto con valores posibles que llenan continuamente todo el eje numérico y con un valor posible cero exclusivo que tiene la probabilidad q. En las figuras a y b se muestran los gráficos de la función de distribución F(u) y de la densidad de probabilidad f(u) de la amplitud de la señal útil en el problema de detección.
48
4.10 La función generadora de momentos.
La función generadora de momentos m(t) para una variable aleatoria X se define como tX m(t ) = E e . Decimos que existe una función generadora de momentos para X si hay una constante positiva b tal que m(t) es finita para t ≤b .
( )
e
tx
¿Por qué E (etX ) se llama función generadora de momentos de X? : La expansión por series de nos da e
tx
( tx ) = 1 + tx +
2
2!
( tx ) +
3
3!
+ ....
Entonces, si suponemos que µ k es finita para k = 1,2,3,…, obtenemos:
( ) = ∑e
E e
tx
x
tx
( tx ) 2 ( tx ) 3 + + .. p( x) p( x) = ∑1 + tx + 2! 3! x
= ∑ p( x) + ∑ xp ( x) + x
x
2
= 1 + t µ 1 + t
3
µ 2 2!
+ t
µ 3 3!
t 2
t 3
∑ x p( x) + 3! ∑ x p( x) + ... 2! 2
x
3
x
+ ...
Este razonamiento implica un intercambio de sumatorias que se justifica si existe m(t). Así,
( ) es una función de todos los momentos
E e
tx
En particular, µ k es el coeficiente de
t k k !
µ k
respecto al origen para k = 1,2, 3,….
.
La función generadora de momentos tiene dos aplicaciones importantes. Primero, si pudiérarmos calcular E (etx ) , podríamos determinar cualquiera de los momentos de X. Teorema. Si existe m(t), entonces, para cualquier entero positivo k, d k m(t ) dt k
= m ( k ) (0) = µ k t =0
Dem. Como 49
m(t )
= E (etx ) = 1 + t µ 1 +
2
3
t
t
+
µ 2 2!
3!
+ ...
µ 3
Se deduce que 2t 3t 2 m (t ) = µ 1 + µ 2 + µ 3 +... 2! 3! 2t 3t 2 ( 2) m (t ) = µ 2 + µ 3 + µ 4 +... 2 4! .. (1)
m
( k )
2t (t ) = µ k + µ k +1 2!
3t 2 + µ k +2 3!
+...
Si hacemos t = 0
= µ 1 m( 2 ) (0) = µ 2 m
(1)
(0)
. m( k ) (0)
= µ k
Eje. Determine la función generadora de momentos m(t) para una variable aleatoria de Poisson con media λ. m(t )
= E (e ) = ∑e tx
tx
∞
p ( x )
= ∑e
tx
x =0
x
λ x e −λ λ !
(λ e ) e − λ = e ∑(λ e ) =∑ x! x! ∞
t x
x =0
t X
∞
−λ
X =0
De
∑ (λ e ) = e t x
∞
x!
X =0
Multiplicando y dividiendo entre
eλ e
t
λ E T
,
m(t )
=e
−λ
e
λ e t
∞
∑
(λ e )
x =0
t x
e−
λ e t
x!
La cantidad dentro del signo de sumatoria es la función de probabilidad de una variable aleatoria de Poisson con media λ et ., De ahí que:
∑
p( x)
= 1,
y
m(t )
= e− λ eλ e (1) = eλ ( e −1) t
t
x
Eje. Emplea la función generadora de momentos del ejemplo anterior para determinar la media y la varianza de la variable aleatoria de Poisson. 50
De m(1) (t ) ( 2)
m
=
(t ) =
d dt
(e ( − ) ) = e ( λ e t 1
d 2 2
dt
(e ( − ) ) = λ e t 1
λ e t −
d dt
1
)
µ = m(1) (0) = λ
λ et
( t −1 ) eλ e λ et
= eλ ( e
t − 1
) λ t 2 ( e)
+ eλ ( e
t − 1
) λ t e
µ 2
= m( 2) (0) = λ 2 + λ
Pero ϖ 2 = E ( X 2 ) − µ 2 = µ 2 − µ 2 = λ 2 + λ − λ 2 = λ . La segunda y principal aplicación de una función generadora de momentos consiste en demostrar que una variable aleatoria posee una distribución de probabilidad particular p(x). Si m(t) existe para una distribución de probabilidad p(x), entonces es única. Asimismo, si las funciones generadoras de momentos de dos variables aleatorias X e Y son iguales (para toda t
0), entonces X e Y deben tener la misma distribución de probabilidades. De esto inferimos que si podemos reconocer la función generadora de momentos de una variable aleatoria X que corresponde a una distribución específica, entonces X debe poseer la misma distribución. En resumen, una función generadora de momentos es un artificio matemático que a veces –no siempre- proporciona una manera sencilla de determinar momentos relacionados con variables aleatorias. Lo más importante es que se puede utilizar para establecer la equivalencia de dos distribuciones de probabilidad. Eje. Supongamos que X es una variable aleatoria con la función generadora de momentos 3.2 ( e −1) ¿Cuál es la distribución de X? m(t ) = e t
Una función generadora de una variable aleatoria de Poisson tiene la forma m(t 9 = eλ (e −1) . Así que la función generadora de momentos de X es exactamente igual a la de Poisson con λ = 3.2 . Puesto que las funciones generadoras de momentos son únicas, X debe tener una distribución de Poisson con media de 3.2. t
Eje. Si X tiene una función continua de distribución de probabilidades
1 f ( x) = b − a 0
si a ≤ x ≤ b, a < b c.o
Entonces M (t )
=
1
b
e b − a ∫ a
tx
dx
=
[e t (b − a ) 1
tb
−e ta
]
Es una función diferenciable de t, para toda t, -∞
0 ≤ x < ∞
c.o
0 < λ < ∞
51
Entonces M (t )
∞
= λ ∫ 0 etx −λ x dx =
λ λ − t
t < λ
Esta función generadora de momentos sólo existe cuando t < λ. 4.11 Error Cuadrático medio y error absoluto medio de una predicción.
Si X es una variable aleatoria continua con valor esperado E(X) = µ y varianza V(X) = σ2, se pueden llevar a cabo experimentos para ver hasta qué punto los valores observados en la práctica concuerdan con las predicciones. Al hacer una predicción, se procura elegir un número d, de manera que el valor esperado del cuadrado del error X – d sea el mínimo posible. Se toma el cuadrado para eliminar los signos negativos; de lo contrario, algunas diferencias darían valores negativos y otros valores positivos, cancelándose unas con otras. Esto conduce a lo siguiente. Definición. Si x es una predicción teórica de la variable aleatoria X con media µ y varianza σ2, entonces E [( X − x) 2 ] = E ( X 2 ) − 2 xµ + x 2 se denomina error cuadrático medio de la predicción x y se abrevia ECM(x). Viene siendo el momento ordinario de segundo orden alrededor del punto x. Fácilmente se determina que el valor mínimo de la función así definida ocurre para x = µ. La demostración para el caso continuo, por ejemplo, sería tomando la derivada de esa función e igualando a cero, en cuyo caso quedaría -2µ + 2x = 0 ⇒x = µ. Como la segunda derivada es 2 > 0, se deduce que ECM(x) alcanza su mínimo para x = µ, y ese valor mínimo es justamente ECM( µ) = V(X) = σ2. De aquí el siguiente resultado importante. Proposición. El error cuadrático medio (ECM) para una predicción x de la variable aleatoria X alcanza siempre su mínimo para x = µ, y su valor es σ2. Se ha mencionado que elevar las diferencias al cuadrado evita que las diferencias negativas se neutralicen con las positivas. Otra alternativa sería tomar los valores absolutos de las diferencias, en lugar de sus cuadrados. De este modo, al hacer una predicción, también sería posible elegir el valor x = d, de manera que el valor esperado de |X – d| fuese el mínimo. Esto conlleva a lo siguiente, Definición. Para una predicción teórica x de una variable aleatoria X, el número llama error absoluto medio de la predicción (EAM(x)).
(
E | X − x |
)
se
Así como el ECM alcanza su mínimo para la media, se puede demostrar que el EAM alcanza su mínimo para la mediana Teorema. Si me es la mediana de la variable aleatoria X, entonces el error absoluto media EAM(x) es una función que alcanza su valor mínimo sí y sólo sí x = me En efecto, suponga primeramente que d es una predicción del valor de X tal que d ≥ me, Entonces:
52
E ( | X − d |) − E ( | X − me |) me
∞
= ∫ −∞[ E ( | x − d |) − E ( | x − me |) ] f ( x)dx ∞
d
= ∫ −∞ ( d − me ) f ( x) dx + ∫ m ( d + me − 2 x) f ( x)dx + ∫ d ( me − d ) f ( x) dx ≥ e
me
∞
d
≥ ∫ −∞ ( d − me ) f ( x) dx + ∫ m ( me − d ) f ( x) dx + ∫ d ( me − d ) f ( x) dx e
= ( d − me )[ P ( X ≤ me ) − P ( X > me )] Sin embargo, por definición de mediana,
P ( X ≤ m e ) ≥
1 2
≥ P ( X > m e ) , lo que implica que la
parte entre corchetes es no negativa. Además d − me ≥ 0 , por hipótesis. Luego, E ( | X − d |) − E ( | X − me |) ≥ 0 , esto es E ( | X − d |) ≥ E ( | X − m e |) . De manera análoga se procede para el caso en que d < me. De aquí que para el valor d = me el error absoluto EAM (d ) = E (| X − d |) es mínimo.
Ejemplos:
Eje. ¿Cuál es la probabilidad de que una v.a. X con distribución de Cauchy, es decir, con función de densidad f ( x)
= π −1[1 + ( x − θ ) 2 ]
−1
simétrica en torno a θ = 0 tome valores en el intervalo (-1, 1]? ¿En el (-1, 1)? La variable aleatoria X tiene densidad: f ( x)
=
1
1
x 1 + x 2
la probabilidad de que X ∈ (-1, 1] se obtiene por tanto integrando dicha función de densidad entre los límites correspondientes: P (−1 < X ≤ 1)
=
1
π
1
1
∫ 1 + x −1
2
dx
1
1
π
2
= [ tan−1 (1) − tan−1(−1)] =
La probabilidad del intervalo (-1, 1) es la misma que la de (-1, 1], un punto tiene probabilidad cero en cualquier distribución continua.
53
Eje. Se distribuye una unidad de probabilidad de modo uniforme en un círculo de radio r. ¿Cuál es la función de distribución de la v.a. D = “distancia al centro” de un punto tomado al azar? El círculo de radio r tiene un área total de π r 2 , y la función de densidad dentro de él es por tanto π −1r −2 . La probabilidad correspondiente a cualquier porción del círculo será así (Area• π −1r −2 ). La distribución buscada es entonces: 0 2 f D ( d ) = π d / π r 2 1
si d ≤ 0
< d ≤ r si 1 < d si 0
Eje. Supongamos que el intervalo de tiempo en minutos entre sucesivas pasadas de autobuses por una parada sigue una distribución exponencial (es decir, F X ( x) = 1 − e−λ x ) de parámetro λ = 0.5. Si un viajero llega en el momento justo en que un autobús abandona la parada, ¿cuál es la probabilidad de que haya de esperar más de tres minutos? ¿Más de cinco minutos? Si acontece que tras llevar esperando cinco minutos aparece un segundo viajero y se entera por el anterior de que en los últimos cinco minutos no ha pasado ningún autobús, ¿cuál es la probabilidad de que el segundo pasajero haya de esperar más de tres minutos? Sea T el intervalo de tiempo entre autobuses. Entonces, P (T
≤ t ) = 1 − e −0.5t
Por consiguiente: P (T
> 3) =1 − P (T ≤ 3) =1 −(1 −e−0.5*3 ) =1 −(1 −e −1.5 ) = e −1.5 = 0.22313
y del mismo modo: P (T
> 5) = e −0.5*5 = e −2.5 = 0.08208
La probabilidad de que el segundo viajero haya de esperar todavía más de tres minutos sabiendo que han pasado ya cinco desde que partió el último autobús es: P (T > 8 | T > 5)
= P (T > 8 ∩ T > 5) P (T > 5) − 0.5*8 = P (T > 8) = e− 0.5*5 = e− 0.5*3 = 0.22313 P (T > 5) e
El saber cuánto tiempo lleva sin pasar el autobús no aporta ninguna información acerca de lo que puede todavía tardar en pasar. Esta es una propiedad de la distribución exponencial; se dice por eso que no tiene memoria.
54
Eje. Sean X1, ..., X5 variables aleatorias generadas mediante el lanzamiento de cinco dados perfectos. Sea X = max{X1, ..., X5}. ¿Cuál es la función de distribución de X? ¿Coincide con la de cualquiera de las variables aleatorias X1, ..., X5 consideradas? La variable aleatoria X puede tomar valores enteros entre 1 y 6. La probabilidad de que X tome el valor x es la probabilidad de que todas las variables aleatorias X1, ..., X5 tomen valores entre 1 y x y no todas tomen valores entre 1 y (x – 1). Por tanto, P ( X
5
5
=1)= P i =1 X i ≤1 − P i =1 X i <1 5
1 = =0.0001286 6
P ( X
5
5
=2)= P i =1 X i ≤2 − P i =1 X i <2 5
5
2 1 = − =0.003987 6 6
y análogamente se obtienen los restantes valores de la función de cuantía: P X (3)
= 0.02713
P X (4)
= 0.10043
P X (5)
= 0.27019
P x (6)
= 0.59812
La función de distribución se obtiene sumando la de cuantía para cada Xi: P X i ( k )
= 1 / 6, ( k = 1,..., 6),
y x
F X i ( x )
= ∑ P X ( k ) k =1
i
Eje. Una v.a. X sigue una distribución especificada así: 0 0. 1 F X ( x) = 0.6 0.9 1
<0 si 0 ≤ x < 1 si 1 ≤ x < 2 si 2 ≤ x < 3 si 3 ≤ x si x
Halle: i) La función de cuantía de X. ii) La probabilidad de que X tome valores en los siguientes intervalos: (0,3], (1,2], (1,2), [ 2,3).
iii) P { X ∈ (0,2] | X > 1} Llamamos función de cuantía de una distribución discreta a: 55
P x ( x)
= F X ( x) − F X ( x −)
es decir, PX(x) es el salto de la función de distribución en el punto x. i)
la función de cuantía es igual al salto de FX(x) en los puntos 0, 1, 2 y 3. Y de acuerdo con la especificación de FX(x) tenemos que P x ( 0)
= 0.1,
P x (1)
= 0.5,
P X ( 2)
= 0.3,
P X (3)
= 0 .1
ii) P {( 0,3]}
= P {0 < X ≤ 3} = F X (3) − F X (0) = 1 − 0.1 = 0.9
P {(1,2]}
= P {1 < X ≤ 2} = F X ( 2) − F X (1) = 0.9 − 0.6 = 0.3
P {(1,2)}
= P {1 < X 2} = P {1 < X ≤ 2} − P { X = 2} = F X ( 2) − F X (1) − P X ( 2) = 0.9 − 0.6 − 0.3 = 0
= P {2 < X ≤ 3} + P { X = 2} − P { X = 3} = F X (3) − F X ( 2) − P X ( 2) − P x (3) = 1 − 0 .9 + 0 . 3 − 0 .1 = 0 .3
P {[ 2,3)}
iii) P { X ∈ (0,2] | X > 1}
= =
P { X ∈ (1,2]} P { X > 1} F X (2) − F X (1) 1 − F X (1)
=
0.9 − 0.6 1 − 0.6
=
3 4
Eje. Dada una muestra aleatoria simple X1, ..., Xn procedente de una distribución con media µ y varianza σ 2 , hállese la media y varianza de X = ( X 1 + ... + X n ) / n. Tomando valor medio de
X
tenemos:
E ( X )
= E X 1 + ... + X n n = E [ X 1 ] / n + ... + E [ X n ] / n = µ / n +... + µ / n = µ
Análogamente, tomando varianzas:
56
V [ X ]
X + ... + X n = V 1 n = V [ X 1 ] / n 2 +... +V [ X n ] / n 2 = σ 2 / n 2 +... +σ 2 / n 2 = σ 2 / n
Eje. Una emisión de bonos a un año tiene un interés del 5%. Además, la cuarta parte de los bonos, seleccionada por sorteo, recibe una prima del 25% de su valor nominal. ¿Cuál es el rendimiento esperado de un bono? Si se hubiera de invertir una cantidad muy grande de dinero, ¿qué sería preferible: invertir en los bonos indicados, o en otros al mismo plazo con un rendimiento del 11%? (se supone que el riesgo, liquidez, y demás factores distintos de la rentabilidad son idénticos en ambos casos.) Si llamamos X e Y a los rendimientos totales respectivos de ambos tipos de bonos (expresados en %) tenemos que: E [ X ] E [Y ]
=1(0.05 ) +
1 * 0.25 4
= 0.1125
= 0.11
El primer bono es preferible si se invierte mucho dinero, es decir, se compra multitud de bonos. Obsérvese que solo en este caso podremos comparar ambas opciones de inversión en términos de su rendimiento medio. Si solo se puede comprar un bono de la primera clase, no tendría sentido pensar en un rendimiento del 11.25%; obtendríamos el 5% o el 30%. Un inversor averso al riesgo preferirá el segundo tipo de bono (con el que sabe que obtendrá un 11% seguro). Un inversor proclive al riesgo preferirá el segundo tipo de bono (con el que puede obtener una ganancia tan alta como el 30%, aunque con gran probabilidad acabe percibiendo solo el 5%). Eje. Consideremos una variable aleatoria X cuya función de cuantía viene especificada mediante la siguiente tabla:
(m − c) X = m ( m + c)
2
con probabilid ad c / 2 con probabilid ad 1 − c
2
con probabilid ad c 2 / 2
Compruébese que para una variable aleatoria como X la desigualdad de Chebysheff es una igualdad. La varianza de X se calcula. Por simetría, la media es m, y: σ 2
c 2 2 c 2 4 = E [( X − m)2 ] = c 2 + c = c 2 2
La desigualdad de Chebysheff establece que:
57
{
}≤
P | X − m |≥ k σ
1 k
2
Substituyendo σ por c2 y k por 1/c obtenemos:
P | X − m |≥
1 c
c
2
≤ c2
Pero esta relación se verifica con igualdad, pues de la especificación de la distribución de X se deduce que el lado izquierdo es precisamente c2. El ejemplo anterior es interesante porque pone de manifiesto que la desigualdad de Chebysheff no puede ser mejorada sin imponer condiciones adicionales a la variable aleatoria X. Eje. Compruébese que la distribución de Cauchy
[
= π −1 1 + x2
f ( x)
]
−1
− ∞ < x < ∞
,
carece de momentos. Basta comprobar que: µ k
∞
∞
= E [ X ] = ∫ −∞ x f ( x )dx = ∫ −∞ k
k
1
x k
π 1 + x 2
dx
diverge si k ≥ 1. Esto es fácil de ver ; si x > 1, 1 + x2 < 2x2 y por tanto: 1
π
∞
x k
−∞ 1
+ x2
∫
dx
≥
1
∞
π
∫
x k
−∞ 2 x 2
dx
la integral del lado derecho se ve sin dificultad que diverge siempre que k ≥ 1. Obsérvese que la carencia de media –y de todos los momentos de orden superior- se produce a pesar de la forma simétrica en torno al origen de la función de densidad, lo que sugerirá µ = 0. Eje. Calcúlese la media y varianza de una v.a. con distribución exponencial de parámetro λ: F ( x)
λ > 0.
0 = −λ x 1 − e
<0 si 0 ≤ x < ∞
si x
La función de densidad de X se obtiene derivando: f ( x)
= λ e−λ x ,
(0
≤ x < ∞)
El cálculo directo de media y varianza es: 58
∞
σ 2
1
∫ xλ e = λ = ∫ ( x − µ ) λ e
µ =
−λ x
0
∞
2
−λ x
0
dx
=
1 λ 2
Eje. Considérese la distribución exponencial. ¿Coincide la media con la mediana? La mediana τ de una distribución continua F(x) es aquel valor que verifica:
} = P { X > τ } = 12
{
P X < τ
En el caso que nos ocupa, ha de suceder que: F (τ )
= 1 − e−λ τ =
⇒ e−λ τ =
1 2
1 2
1 ⇒ −λ τ = ln 2
⇒ τ =
Como quiera que µ =
1
λ
ln 2
λ
y ln 2 = 0.6931, la mediana siempre será inferior a la media en el caso de una
distribución exponencial. Eje. Muéstrese que la varianza es el mínimo momento de segundo orden (es decir, σ 2
= E [ X − µ ] 2 ≤ E [ X − c ]2
para cualquier otro c ≠µ .)
[
E X − c
]
= E [ X − µ + µ − c] 2 = E [ X − µ ] 2 + E [ µ − c] 2 + 2 E [ ( X − µ )(c − µ )] = σ 2 + ( µ − c)2 + 0 = σ 2 + ( µ − c)2
2
ya que
[
E ( X − µ )(c − µ )
] = (c − µ ) E [ X − µ ] = 0
De lo anterior se deduce, habida cuenta de que ( c − µ ) 2 ≥ 0, que E [ X − c] 2 ≥ c 2 .
59
Eje. Una variable aleatoria R toma el valor r con la probabilidad k αr , r = 0, 1, 2, ..., l. Encontrar k y P ( R ≤ l −1) . l
Sea
P ( r )
= k α .
Ahora
r
bien
∑ P (r ) = k (1 − α
l +1
) /(1 − α ) = 1 .
De
donde
0
l +1
k = (1 −α ) /(1 −α
)
y P ( R ≤ l − 1)
l l −1 = ∑ P (r ) = 1 − α l +1 = 1 − P ( R = l ) 1 − α 0
Eje. Una variable aleatoria X, que toma valores en (0, a), tiene la función de distribución kx2, 1 0 a) . 2
Sea F(x) = kx2, F(a) = ka2 = 1 y, por tanto, k = 1/a2. f ( x)
= x 2 / a 2 a2
a = 4 = 1 2 a 2 4 1 1 3 P X > a = 1 − F a = 2 2 4 F
Eje. Una variable aleatoria X tiene la función de densidad de probabilidad f(x) = 2x, 0
0.5
.
Ahora F ( x) = ∫ 0 2tdt = x 2 y F(x) = 0.25 da x = 0.5. De donde x0.25 = 0.5. F(x) = 0.5 da x 0.5 =
Eje. Encontrar la tasa específica de falla por desgaste cuando f (t ) = λ e −λ t , 1 − F (t )
t > 0 .
∞
− t − t = ∫ e λ dt = e λ . De donde r(t ) = λ. t
Notar que r(t) es independiente de t cuando f (t ) = λ e −λ t , . En un caso concreto esto significaría que la variable aleatoria T corresponde a artículos que no “se desgastan”. Eje. Una variable aleatoria T tiene la fdp f(t), t≥ 0. Su tasa específica de falla por desgaste r(t) = t. Encontrar f(t) y P (T ≤ t 0 ) . Ahora
t
1
∫ r (u)du = 2 t 0
2
. De donde F (t ) =1 − e −t
2
/2
, de modo que f (t ) = F ´(t ) = te −t
2
/2
. 60
2 0
También P (T ≤ t 0 ) = F (t 0 ) = 1 − e −t
/2
Eje. Una prueba de resistencia para un alambre consiste en doblarlo y desdoblarlo hasta que se rompe. Considerando el doblarlo y el desdoblarlo como dos operaciones, la probabilidad de que el alambre se rompa en la r-ésima operación es (1-p)pr-.1, de donde r = 1, 2, ... y 0 < p < 1. Hallar P ( R = n | R ≥ n − 1) .
(
n− 2
P R
≥ n − 1) = 1 − ∑ (1 − p) p r −1 = p n − 2 r =1
De donde
(
P R
= n | R ≥ n −1) =
(1 − p) p n −1 p n −2
= (1 − p ) p
Notar que éste es un análogo discreto par los artículos que “no se desgastan”, para los que −λ x , x > 0 . f ( x) = λ e Eje. Se ha diseñado un aparato para medir la resistencia de los sujetos. En términos de las unidades calibradas en el aparato, la resistencia S de una raza dada de adultos varones puede tomarse como una variable aleatoria con la función de densidad de probabilidad λ e −λ s , s > 0, λ > 0. Para una tarea determinada, se requiere un hombre fuerte que tenga una resistencia de por lo menos s0 y cada uno de los hombres seleccionados al azar se someterá a una prueba hasta encontrar el hombre fuerte que se necesita. Determinar la probabilidad de que se pongan a prueba exactamente n hombres. La probabilidad de que un hombre puesto a prueba al azar sea el hombre fuerte requerido es ∫ s λ e −λ s ds = e −λ s . Para que el n-ésimo hombre sea el primer hombre fuerte, todos los (n-1) hombres anteriores deben haber sido “no fuertes”. Ya que la probabilidad de que un hombre puesto a prueba al azar no sea fuerte es 1 − e −λ s , la probabilidad requerida es ∞
0
0
0
(1 − e − ) − e − λ s0 n 1
λ s0
Eje. El tiempo de falla de un sistema tiene la función de densidad de probabilidad f(t), t > 0. La falla sólo puede detectarse inspeccionando el sistema en los tiempos x1, x2, x3, ..., xi, ... Estos tiempos de inspección son tales que P[el sistema falle en (xi-1, xi)| el sistema haya funcionado en xi-1] = p, para i 0 1, 2, 3, ...; x 0 = 0. Calcular el i-ésimo tiempo de inspección x i en términos de p. Demostrar que si la función de tasa falla es monótona creciente, entonces los intervalos entre los tiempos sucesivos de inspección forman una sucesión decreciente. La condición sobre los tiempos de inspección xi significa que
61
F ( xi +1 ) − F ( xi )
1 − F ( xi )
= p,
i
= 1,2,3,...
de modo que F(xi+1) = p + qF(xi), donde q = 1- p. La substitución repetida da F ( xi +1 )
= p + pq + pq 2 + ... + pq i −1 + q i [ p + qF ( x0 )] = 1 − q i +1 , para x0 = 0 da F ( x0 ) = 0
de donde se hallaría xi a partir de xi = F-1(1-qi). Sea di = xi – x i-1 de manera que di > 0. Ahora se desea demostrar que di >di+1, i = 1, 2, 3, .... Sea S(t) = 1 – F(t) y r(t) = f(t)/S(t) una función monótona creciente. Ahora se tiene xi
∫
r (t )dt
xi −d i
xi +d i
< ∫ x
r (t )dt
i
Usando la substitución u = S(t) al integrar r(t), se obtiene S ( xi
+ d ) i
S ( xi )
<
S ( xi ) S ( xi
− d ) i
Si se resta una a ambos miembros de esta desigualdad se tiene como resultado F ( xi
+ d i ) − F ( xi ) F ( xi ) − F ( xi −1 ) F ( xi +1 ) − F ( xi ) > = p = 1 − F ( xi ) 1 − F ( xi −1 ) 1 − F ( xi )
De donde F(xi + di) > F(xi+1), de modo que xi + di > xi+1; es decir, di > di+1. Eje. La probabilidad condicional P(A|x) de un evento A, está disponible dado que una variable aleatoria X ha tomado el valor x. Encontrar P(A). Suponer que X es discreta y sus valores posibles son x i, i = 1, 2, 3, ... y P(X=x i) P(xi). Los eventos A∩xi son mutuamente exclusivos, de modo que P ( A)
= ∑ P ( A ∩ xi ) = ∑ P ( A | xi ) P ( xi ) i
i
Si X es continua con la función de densidad de probabilidad f(x), se tiene P ( A)
∞
P ( A | x) f ( x)dx = ∫ −∞
Eje. En un experimento, el número de pruebas, R, que se llevarán a cabo es una variable aleatoria con P(R = r) = θ(1- θ)r-1, r = 1, 2, 3, ... La probabilidad de que el experimento resulte socialmente útil, dado que se llevaron a cabo r prueba, es
λ r e −λ r !
. Calcular dicha probabilidad. 62
Sea A el evento en que se logra el resultado socialmente útil, de manera que P ( A | r ) = λ r e −λ / r ! ∞
P ( A)
= ∑(λ r e −λ / r !)θ (1 −θ ) r −1 1
[
]
= θ e −λ e λ (1−θ ) −1 /(1 −θ ) = θ (e −λθ − e −λ ) /(1 −θ ) Eje. Hay que ajustar una máquina para que produzca un lote grande de piezas. Para un ajuste dado, cada una de las piezas producidas por la máquina tiene una probabilidad constante p de salir defectuosa; sin embargo, el proceso de ajuste es tal que esta probabilidad varía de ajuste a ajuste y puede tomarse como una variable aleatoria con la función de densidad de probabilidad (1-p)m(m+1), 0
1
1
+ = ∫ P ( A | p) f ( p )dp = k (m +1) ∫ p(1 − p) m 2 dp 0 0
= k (m +1) /( m +3)( m +4)
Eje. En la tabla se da la distribución de probabilidad de una variable aleatoria R. Calcular E(R +2R)/(R+1). 2
r 0 P(R = r) 0.1
1 0.3
2 0.1
3 0.2
4 0.2
5 0.1
R 2 + 2 R 5 r 2 + 2r E = ∑ P (r ) = 3.01 R +1 r =0 r + 1
Eje. Se lanza una moneda hasta lograr un águila. Pedro recibirá $2r si la primera águila aparece en el r-ésimo lanzamiento. Calcular la ganancia que espera Pedro. Al alterar las reglas Pedro recibirá $2r para r ≤ 20 pero recibirá $220 para r ≥ 21; calcular la ganancia que espera Pedro. r
1 Sea P(r) = P(primera águila en el r-ésimo lanzamiento). Por tanto, P (r ) = y 2
63
∞
E ( ganancia )
= ∑2 r =1
r
r
1 2
la cual es infinita. Con las reglas alteradas, E ( ganancia ) =
r
20
∑= 2 r 1
r
r
1 + 2 20 ∞ 1 = 21 ∑ 2 21 2
Es interesante notar que la esperanza de la ganancia de Pedro es pequeña, pues está limitada, a pesar de que este límite es muy grande. Eje. Un buen modelo para explicar que una característica de calidad de determinado producto manufacturado varía de artículo a artículo es una variable aleatoria X con la fdp proporcional a x, en el intervalo 0 l, donde 0
λ
∫ Kxdx 0
(
S = C 2
=1 da K = 2 / λ 2 . Ahora bien, la utilidad esperada S está dada
− aλ − b ) ∫ l 2 x / λ 2 dx − (aλ + b) ∫ 0 2 x / λ 2 dx λ
l
= C 2 (1 − l 2 / λ 2 ) − aλ − b dS/dλ = 0 da λ = ( a / 2C 2 l 2 ) −1 / 3 . Notar que máximo.
V(R).
2
2
d S / d λ
= −6C 2 / λ 4 < 0 , de modo que se ha encontrado un
Eje. Una variable aleatoria R toma el valor r con probabilidad ar, r = 1, 2, ..., l. Hallar E(R) y l
∑ ar = al (l + 1) / 2 = 1 da a = 2 / l (l +1) . De aquí que 1
E ( R) =
l
= 1 al (l + 1)(2l + 1) = (2l + 1) / 3
∑ ar
2
6
1
E ( R ) = 2
l
∑ ar
3
= al 2 (l + 1) 2 / 4 = l (l + 1) / 2
1
de modo que V ( R)
= l (l + 1) / 2 − (2l + 1) 2 / 9 =
1 18
(l 2
+ l − 2) 64
Eje. Una variable aleatoria X tiene la función de densidad de probabilidad f ( x) = kx θ , 0
θ
∫ kx 0
θ
dx
= k θ θ +1 /(θ +1) = 1 da E ( X )
k = (θ +1) / θ θ +1 .
De aquí que
θ
= ∫ k θ θ +1 dx = θ (θ +1) /(θ + 2) 0
E ( X 2 )
θ
= ∫ kx θ +2 dx = (θ +1)θ 2 /(θ + 3) 0
de manera que V ( X )
= E ( X 2 ) − [ E ( X )] 2 = θ 2 (θ + 1) /(θ + 2) 2 (θ + 3)
Eje. Una variable aleatoria X tiene la fdp f(x) = 1/2a, -a
a
x / 2 a dx = 0 . De donde = ∫ −a
µ r
= E ( X
r
)
=
x
r +1
2a( r +1)
a
, de modo que µ r = 0 si r −a
es impar. Esta es una reflexión de la simetría de f(x). El coeficiente de asimetría es cero. Ahora bien, µ 2
=
a
2 r
2r
+ 1 , r = 1, 2, 3, ... De aquí que el coeficiente de kurtosis es µ 4 / µ 22 = 9 / 5
Eje. Una variable aleatoria X tiene la fdp, f ( x) =1 / 2a , donde –a
(
P X
> 1.5a /
3
) = P ( X > 0.866 a ) = 2 P ( X > 0.866 a )
a partir de la simetría
= 0.134
La desigualdad de Chebyshev da
(
P X
≥1.5a /
3
) ≤ (1 / 1.15 )
2
= 0.444
De donde esta cota superior es más bien amplia en relación con la probabilidad exacta calculada a partir de un conocimiento completo de la función de densidad. Eje. El nivel de ruido X de cierto aparato electrónico, varía de aparato a aparato. Un modelo adecuado para esta variación es decir que X es una variable aleatoria con la fdp f ( x) = 2 xe −x , x > 0. Si X > c, donde c es una constante especificada, se dice que el aparato es de calidad grado II; en caso 2
65
contrario, se dice que el aparato es de calidad grado I. Una máquina automática clasifica estos aparatos como de grado I o grado II. Se selecciona al azar un aparato de grado II. Calcular la probabilidad de que su nivel de ruido sea mayor que 1.5c. Sea g(x) la fdp del nivel de ruido de los aparatos de grado II, de modo que x ≤ c
0 g ( x) = 2 xe − x 1 − F (c) , 2
x
Ahora F ( x ) = ∫ 0 2te −t
2
dt
x > c
2
=1 − e − x . Esto conduce a
P = P(aparato de grado II que tiene X > 1.5c) =
∞
∫
1.5 c
g ( x)dx
∞
= ∫ 1.5 c
2 xe − x e
2
= e −1.25c
dx
−t
2
2
Eje. Si para el aparato electrónico del problema anterior, la media y la variancia del grado i se dan como µi y σ i2 , i = 1,2, encontrar la media y la variancia de X. Ahora µ 1
Esto da
c
∫ 2 x 0
2
x 2
c − dx
(
= 1 − e −c
2
=
1
c
1 − e −c
2
∫ 0
2
2 x 2 e − x dx
)µ . De modo semejante, ∫ 2 ∞
1
c
µ =
∞
∫ 2 x e 2
− x 2
0
dx
= µ 1 + e −c
2
x 2
x 2 e − dx
( µ
2
= e −c
2
µ 2
, de manera que
− µ 1 )
Para calcular la variancia de X, se explota el resultado V(X) = E(X2) – [E(X)]2. para los aparatos de grado I se tiene E ( X | X < c) 2
= σ 12 + µ 12 =
1 1− e
c
−c 2
∫ 0
3 2 x e
− x 2
dx
Por tanto, c
∫ 2 x e
− x 2
dx
= (1 − e −c
∫ 2 x e
− x 2
dx
3
0
2
)(σ 12
+ µ 12 )
De modo semejante, ∞
c
3
= e −c
2
(σ 22
+ µ 22 )
De donde 66
E ( X ) = 2
∫
∞
0
3
2 x e
− x 2
dx =
c
∫ 0
3
2 x e
− x 2
dx +
∞
∫ c
3
2 x e
− x 2
dx
= σ 12 + µ 12 + e −c (σ 22 − σ 12 + µ 22 − µ 12 ) −c −2c 2 2 2 2 V ( X ) = E ( X ) − µ = E ( X ) − [ µ 1 + 2 µ 1e ( µ 2 − µ 1 ) + e ( µ 2 − µ 1 ) 2 ] = σ 12 + e −c [σ 22 − σ 12 + (1 − e −c )( µ 2 − µ 1 ) 2 ] 2
2
2
2
2
Nota: Suponer que el nivel de ruido X tiene una distribución arbitraria y que las proporciones de aparatos de calidad grado I y grado II son p y q, respectivamente (p+q = 1). Si las medias y las variancias del nivel de ruido de los dos grados son µ1, σ 12 y µ2, σ 22 , la media ya la variancia de X las proporciona µ = p µ 1 + q µ 2 σ 2
= pσ 12 + qσ 22 + pq( µ 1 − µ 2 ) 2
Suponga que el director del personal de una empresa desea seleccionar a 3 de 5 candidatos para tres puestos de entrenamiento gerencial y que todos los candidatos tienen la misma oportunidad de ser seleccionados. Tres de los candidatos son de un determinado partido político finalmente seleccionados; esto es y = 1, 2 o 3. Encuentre la distribución de probabilidad para y. ¿Cuál es la probabilidad de que seleccionen por lo menos a dos de los tres miembros del partido político? Y=
numero de candidatos finalmente seleccionados de un mismo partido. 5! = = 10 3!2! C 23C 12 = 3 ⋅ 2 = 6 C 35
y 1 p(y) 3/10
2 6/10
3 1/10
P(A) = Probabilidad de que al menos dos de los miembros sean seleccionados. P(A) = p(y = 2)+ p(y = 3) = 6/10+1/10 = 7/10 Una variable aleatoria X tiene la función de densidad de probabilidad ce − x . Encuentre las variables apropiadas de c, suponiendo 0 ≤ X < ∞. Encuentre la media y la varianza de la función de densidad de probabilidad de X.
∞
∫ x ⋅e 0
-x
dx
→1
67
∞
∫ x
2
0
⋅ e -x dx →2
1 ∞
La variable c se calcula considerando la probabilidad, como sigue
∫
c e −x dx
= 1 , por lo tanto:
0
c =1
La media se determina por medio de la siguiente expresión: ∞
∫
µ = 1* x e − x dx 0
los cálculos realizados en MATHCAD arrojan un resultado para la expresión anterior de: µ = 1 La varianza es: σ
2
∞
= 1* ∫ x 2 ⋅ e − x dx 0
=1 Considere las tres funciones dadas a continuación. Determine cuales funciones son de distribución (FDC). 2
σ
Por definición, una función es FDC si cumple con lo siguiente: 1) f x ( x) ≥ 0 para toda x ∈ en R x 2) f x ( x ) dx = 1
∫
R x
3) f x ( x) es un tramo continuo 4) F x ( x) = 0 si x no esta en el rango R x F x ( x) = 1 − ce − x a. 0
d dx ∞
1 − e − x
∫ 1 − e
− x
dx
0
3. Se observa en la grafica de la función la continuidad de f(x).
d d 1+ dx dx ∞
∫ e 0
− e-x → exp(-x) -x
dx
→1
68
4. Para cualquier otro valor no incluido en el rango de R x
e − x 0 ≤ x < ∞ b) G x ( x ) = x < 0 0
= { 0 < x < ∞} la función Fx vale cero.
d -x e → − exp( - x ) dx ∞
∫ - exp(-x)dx → -1 0
1. f x ( x )
=
d − x e dx
La función no es una FDC, dado que no cumple con lo estipulado de que, f x ( x) ≥ 0 para 0 ≤ x < ∞ . Al evaluar f(x) en el rango dado, siempre se obtendrán valores negativos.
2. f x ( x ) =
∞
∫ − e
− x
dx
0
Al integrar la función en los limites especificados se obtiene un valor negativo (-1), por lo tanto no cumple con lo estipulado de que :
∫ f ( x)dx = 1 x
R x
En este caso la función no es de distribución continua.
e x − ∞ < x ≤ ∞ c) H x ( x) = x > 0 0
d dx
ex
→ exp(x) 0 x
∫ e dx → 1 -∞
1. f x ( x )
=
d − x e dx
Se tiene solo valores mayores o iguales a cero para esta función. 69
0
2. f x ( x)
= ∫ − e −x dx ∞
Al evaluar la función en los limites se obtiene la unidad lo que viene a comprobar al punto 2 antes mencionado.
cero.
3.
Se observa en la grafica de la función la continuidad de f(x).
4.
Para cualquier otro valor no incluido en el rango de R x = { - ∞ < x ≤ 0} la función F x vale
3-7 Se tiene una función de distribución de probabilidad discreta si X es una variable aleatoria discreta, asociando un numero p x ( xi ) ≥ 0 = p x ( x = x) con cada resultado xi, en R x para i = 1, 2, 3, ...,n,..., donde los números p x ( xi ) satisfacen. 1 p x ( xi ) ≥ 0 para todo i x P ( xi ) = 1 2 i =1 x
∑
1 3 x = 0 a) P x ( x) = 2 3 x = 1 0 de otro modo La función cumple con los dos aspectos anteriormente señalados, ya que la suma de las probabilidades dan como resultado la unidad, así mismo, se tiene que la probabilidad individual de X, es mayor que cero, por tanto se trata de una función de probabilidad discreta. (1)
1 1 x 1 5− x x= 0 , 1 , 2 , 35, x 3 3 P x ( x) = 0 o t r om o d o
70
x
5- x
2 1 combin(5, x) ⋅ ⋅ = 1 ∑ 3 3 x =0 5
(1) Según el punto 2 de la definición la suma de las probabilidades debe ser igual a la unidad, lo cual queda demostrado. La probabilidad individual de X i es mayor que cero en cada caso, por tanto se trata de una función de distribución de probabilidad discreta. 3-9 El gerente de un almacén de ropa de hombres esta interesado en el inventario de trajes, que en ese momento es de 30 (todas las tallas), el numero de trajes vendidos a partir de ahora hasta el final de la temporada se distribuye como
e− 2 02 0 x x! f x ( x ) = 0
x = 0,1,2,3,...
o t r om o d o
Encuentre la probabilidad de que le queden trajes sin vender al final de la temporada. La probabilidad de que queden trajes sin vender, se determina según la expresión: F x ( xi )
= P x ( X ≤ xi ) =
∑ xP ( x) x
X ≤ xi
29
∑ xe x =1
- 20
⋅
20 x x!
= 0.978
se tiene entonces que P x ( X ≤ xi ) = 0.978 3-11Considere la siguiente función de densidad de probabilidad:
kx f x ( x ) = k ( 4 − x) 0
0 ≤ x < 2 2 ≤ x ≤ 4 otro caso
a) Encuentre el valor de k para el cuál f es una función de densidad de probabilidad. b) Encuentre la media y la varianza de X . c) Encuentre la función de distribución acumulativa. a)
Como 71
∫ f ( x)dx = 1 c ∫ f ( x ) dx = 1 x
R x
x
R x
1 4
por lo tanto c es igual a b)
c*4 =1
La media se determina por la siguiente expresión ∞
∫
µ = x ⋅ f x ( x) dx −∞
El cálculo de la media µ se realiza por medio del MATHCAD, dando como resultado µ = 2 La varianza se determina por la siguiente expresión σ
2
=
∞
∫ x ⋅ f ( x)dx x
−∞
El calculo de la varianza σ 2 al igual que la media se realiza por medio del mismo programa obteniendo como resultado: σ 2 c)
=2 3
La función de distribución acumulativa es:
F x ( x ) = 0
para x < 0
11 1 1 F x ( x ) = x dx = x 2 para 0 ≤ x ≤ 1 40 8 0
∫
F x ( x) =
1
2
4 ∫
x dx
0
1 8
x 2
2 0
=
1 8
x 2 para 0 ≤ x < 2
2 4 1 2 2 1 1 1 1 1 ∫ x dx + ∫ x(4 − x)dx = x + 4 x − x 2 = + 4 x − x 2 − 6 8 0 4 4 0 2 2 2 4 2 2 F x ( x) = 1 para x ≥ 1
F x ( x) =
1
=
para 2 ≤ x < 4
3-13 La gerente de un taller de reparaciones no conoce la distribución de probabilidad del tiempo que se requiere para completar un trabajo. Sin embargo, de acuerdo con el desempeño pasado, ella ha podido estimar la media y la varianza como 14 días y 2 (días)2, respectivamente. Encuentre un 72
intervalo en el intervalo en el que la probabilidad de que un trabajo se determine durante ese tiempo sea de 0.75. La desigualdad de Chebyshev parte del hecho, que se requiere de un conocimiento mínimo de la distribución de X . Solo se debe conocer µ y σ 2 , la siguiente expresión muestra el intervalo en el que la probabilidad es 0.75, P x ( µ − k σ < x < µ + k σ ) ≥ 1 −
1 k 2
Para determinar el valor de K se toma en consideración el valor de la probabilidad 0.75, esto es: 1−
1 k 2
k =
= 0.75 1 =2 0.25
El intervalo será entonces: µ = ± k σ
sustituyendo los valores de µ , σ 2 y k
[14 − 2
2 ,14 + 2 2 ]
3-15 Una variable aleatoria discreta X tiene la función de probabilidad: px (x), donde
1 x k p x ( x) = 2 0
x = 0,1,2,3 otro caso
a) Determine k. b) Encuentre la media y la varianza de X. c) Encuentre la función de distribución acumulativa, F x(x). a)
como p x ( X ≤ xi ) =
∑ p ( x) = 1
x = xi
x
∑ p ( x) = 1 k ∑ p ( x) = 1 k
x = xi
x = xi
x
x
73
x
∑x=1 12 → 78 x 8 3 1 11 ⋅ x ⋅ → 7 ∑ 2 7 x =1 2 x 8 3 2 1 11 26 ⋅ x ⋅ − → 7 ∑ 2 7 49 x =1 3
por lo tanto k es igual a
8 ⋅ 5 → .57142857142857142855 7 8 1 1 6 ⋅ + → 7 2 2 7 2
8 1 1 1 + + = 1 7 2 2 2 2
3
8 7
b)
La media se determina por la siguiente expresión µ =
∑ x p ( x ) i
x
i
i
El cálculo de la media µ se realiza por medio del MATHCAD, dando como resultado µ =
11 7
La varianza se determina por la siguiente expresión σ 2
= ∑ x 2i p x ( xi ) i
El calculo de la varianza σ 2 al igual que la media se realiza por medio del mismo programa obteniendo como resultado: σ 2
= 26 49
c) La función de distribución acumulativa es:
F x ( x ) = 0 para x < 1 1
F x ( x ) =
8 1
= 0.571
7 2
para 1 ≤ x < 2
8 1
2 1 F x ( x ) = + = 0.857 para 2 ≤ x < 3 7 2 2 1 2 3 8 1 1 1 F x ( x ) = + + = 1 para x ≥ 3 7 2 2 2 1
74
3.17 El servicio postal requiere, en promedio, 2 días para entregar una carta en la ciudad. La varianza se estima como 0.4(día)2. Si un ejecutivo desea que el 99 por ciento de sus cartas se entreguen a tiempo, ¿con cuanta anticipación las debe depositar en el correo? Por la desigualdad de Chebyshev
La probabilidad de que cualquier variable aleatoria X asuma un valor dentro de k desviaciones estándar de la media es al menos 1-1/k 2. 1−
1 k 2
k =
= 0.99 −
1 = 10 0.99 − 1
P x ( µ − k σ < x < µ + k σ )
Los días requeridos para que las cartas se entreguen a tiempo son: µ + k σ = 2 + 10 0.4
= 8.32 dias
3-19 Demuestre que la función de probabilidad para la suma de los valores obtenidos al lanzar dos dados puede escribirse como
xi − 1 36 ( ) P x = 13 − x x i i 36
xi
= 2,3,...,6
xi
= 7,8,...,12
La función de probabilidad de la variable aleatoria X , se puede determinar por medio de la expresión F x ( xi ) = P x ( X ≤ xi )
= ∑ P x ( x) x ≤ xi
Por definición se tiene que la suma de las probabilidades de un evento es igual a uno, para demostrar que la función de probabilidad dada es la suma de los valores obtenidos al lanzar dos dados, se calculara con la ayuda del MATHCAD.
∑ P ( x) = 1
x ≤ xi
6
( x - 1) →5 12 x = 2 36
∑
12
x
∑ (1336- x) → 127 x =7
5 7 + →1 12 12
para comprobar que las funciones dadas funcionan para sus limites respectivos, y por ende validar el resultado anterior se procede a determinar las probabilidades individuales de: - Probabilidad de que al lanzar dos dados la suma de ellos de un dos es: 75
2
∑ (x36-1) → 361 x =2
-Probabilidad de que al lanzar dos dados la suma de ellos de un siete es: 7
∑ (1336- x) → 16 x =7
Lo que demuestra que las funciones dadas con sus limites respectivos si generan las probabilidades del evento. 3-21 Una variable continua X tiene una función de densidad.
2 x f x ( x) = 9 0
0 < x < 3 otro modo
a) Desarrolle la FDC para X. b) Determine la media de la varianza de X. a)
Desarrollo de la FDC para X F x ( x ) = 0
para x < 0
3
2 x x 2 F x ( x ) = dx = 9 9 0
∫
para 0 ≤ x < 3 3
∞
2 x x 2 F x ( x ) = dx = =1 9 9 −∞ 0
∫
para x ≥ 3
b)
La media se determina por la siguiente expresión ∞
∫
µ = x ⋅ f x ( x)dx −∞
∫ x 2 ⋅ x9 dx → 2 3
0
3 2 x 2 1 dx − 2 → ∫ 0 x ⋅ 2 ⋅ 9 2 El cálculo de la media µ se realiza por medio del MATHCAD, dando como resultado µ = 2 76
La varianza se determina por la siguiente expresión σ
2
=
∞
∫ x ⋅ f ( x)dx 2
x
−∞
El cálculo de la varianza σ 2 al igual que la media se realiza por medio del mismo programa obteniendo como resultado: 1 σ 2 = 2 5.2 Identifique las variables aleatorias siguientes como discretas o continuas: a. La duración de una bombilla eléctrica observada en un experimento b. Las ventas brutas de un supermercado en un día determinado c. El valor comercial de determinados bonos listados en la Bolsa en un día particular d. El punto de fatiga, Kg. por cm 2, de un cable de acero de 2 cm. de diámetro e. La demanda diaria de energía eléctrica en una determinada ciudad a. La duración de una bombilla es una función del tiempo por lo que siendo este continuo, este será una variable continua b. Las ventas son cantidades enteras, no hay fracciones enteras a considerar, por lo que esta es una variable discreta c. El valor comercial es una cantidad entera, por lo que es una variable discreta d. Siendo esta una magnitud física esta es una medición continua hasta cierto rango o límite, por lo que dentro de este rango se puede considerar como una variable continua. e. La corriente también es una magnitud física, por lo que también es una variable continua 5.3 Suponga que un estudio ya realizado muestra que en determinado sector de una ciudad, sólo el 20% de los clientes de un supermercado se toman la molestia de leer los precios unitarios de los artículos antes de tomar la decisión de comprarlos. Si n=2 clientes entran a ese supermercado, calcule la distribución de probabilidad de y, el número de clientes de la muestra que leen los precios unitarios para hacer una mejor compra. Sugerencia: Denote por F al evento de que un cliente no lea los precios. Se sigue entonces que p(0)= probabilidad de que ninguno de los 2 clientes lean las etiquetas = P(F)P(F) = (.8)2 Probabilidad de que el cliente no lea la etiqueta = 0.80 Probabilidad de que el cliente lea la etiqueta = 0.20 Sea n = 2 clientes, y F = 0-80 probabilidad de que un cliente no lea la etiqueta, para n = 2 clientes, tenemos el siguiente espacio muestral: Espacio Muestral
Cliente 1
Cliente 2
E1 E2 E3 E4
No leyó No leyó Leyó Leyó
No leyó Leyó No leyó Leyó
p (E)
y
.8 x .8 = .64 0 .8 x .2 = .16 1 .2 x .8 = .16 1 .2 x .2 = .04 2
Distribución de la Probabilidad 77
y 0 1 2
Puntos Muestrales E1 E2 • E 3 E4
p (y) .64 .32 .04 1.00
Como para un cliente que lee los precios la probabilidad es del 20%, para dos es de 4%, y para un mayor número la probabilidad va disminuyendo, el número de clientes que leen los precios para hacer una mejor compra es de 1. Histograma de probabilidad de y:
P (y)
0.32 0.04
0
1
2
y
5.7 En la mayoría de las dependencias gubernamentales, el otorgamiento de contratos se hace con base en un concurso. Suponga que la experiencia que se tiene en cierta dependencia gubernamental, muestra que determinado contratista gana, en promedio, 3 de cada 5 concursos en los que compite. Denote por y el número de concursos en los que este contratista compite antes de ganar un contrato y suponga que los resultados de cada concurso son independientes entre si. a) Encuentre p (1), p (2) y p (3). b) Exhiba una fórmula para p (y), y= 1, 2, 3,4,… c) Grafique p (y). Como gana 3 de cada 5 concursos, la probabilidad de que gane uno es de: p (A) = p (1) = 3/5 = 0.6 La probabilidad de que no se gane un concurso de cada cinco es de: P (B) = 2/5 = 0.4 Como y es el número de concurso en que se compite antes de ganar uno, si se compite dos veces, quiere decir que ya perdió el primero y ganará el segundo concurso. Como los eventos son independientes entonces: p (2) = (0.4) (0.6) = 0.24 78
Si compite en y=3 concursos antes de ganar uno, su probabilidad es: P (3) = (0.4) (0.4) (0.6) = 0.096 Y así sucesivamente, tenemos que para y=n concursos antes de que gane el primero, la probabilidad es: n-1 p (n) = (0.4)
(0.6)
P (y)
0
1
2
3
y
5.8 Suponga que las ventas (y) de carburantes hechas por un determinado concesionario tienen una distribución de probabilidad uniforme, como la mostrada en la figura 5.5. Debido a las limitaciones físicas del equipo, la venta diaria no puede ser inferior a 10,000 litros o superior a 50,000 litros. Utilice la información de la figura 5.5 para encontrar la probabilidad de que el concesionario venda las siguientes cantidades en un día cualquiera. a. Por lo menos 40,000 litros b. Entre 20,000 y 30,000 litros Como la distribución es uniforme. Tenemos que encontrar el valor de la función de distribución de probabilidad. p (10,000
Por lo tanto.
50,000
∫
ky
10,000
50,000 10,000
f(y) dy
50,000
=∫ kdy 10,000
= k (50,000 - 10,000)
= =
40,000 k 1.
K =
1/40,000. 79
Ahora
50,000
p(40,000
40,000
=
50,000
=ky
k dy
50,000 - 40,000 40,000
40,000
=
1 4
b. 30,000
p(20,000
20,000
=
k dy
30,000
=ky
30,000 - 20,000 40,000
20,000
=
1 4
k
10,000 20,000 30,000 40,000 50,000 5.10 Suponga que y representa el número de fallas mecánicas diarias que ocurren en la planta procesadora de alimentos. Suponga además, que la distribución de probabilidad de y (que resultó d un análisis de la experiencia previa) es la siguiente:
p (y)
y
0
1
2
.35
.35
.25
.05
3
Encuentre el valor esperado de y. Construya una gráfica de la distribución de probabilidad e identifique con ella a μ. El valor esperado es: y E (y) = ∑ p (yi) y i = (0) (.35) + (1) (.35) + (2) (.25) + (3) (.05) = 1.00
Como la esperanza es una medida de tendencia central se espera que E (y)=μ
0.35 P (y) 80
0.25
0.05
0
1
2
3
y
5.13 Dado que la agricultura es una actividad con cierto grado de incertidumbre debido a los temporales, muchos agricultores aseguran sus cosechas contra granizo, heladas y lluvias excesivas. Siguiendo los pasos del ejemplo 5.3 para determinar la prima de seguros, encuentre la prima anual necesaria para un protección de 200,000.00 dólares en lo que se valúa un cosecha de trigo. Los actuarios han sugerido que las posibilidades de destrucción por el temporal de la cosecha son 1 en 50. Sea y la ganancia anual de la compañía de seguros y sea c la cantidad que representa al valor de la prima de seguro. Se desea calcular c de modo que la ganancia esperada E (y) sea 0. o sea: E (y) =
yp (y)
= 0
El primer paso para encontrar la solución en el de determinar los valores que la ganancia y puede tomar y después determinar p (y). Si el evento que cubre la póliza no ocurre en el año. La compañía gana y=C dólares. Si el evento ocurre, la ganancia será negativa; esto es será una pérdida: y=C 200,000.00 dólares. Las probabilidades asociadas a estos dos eventos son: Y, ganancia P (y)
C 49/50
(200,000 - C 1/50-
Igualando el valor esperado de y a cero y resolviendo para C se tiene: E (y) = yp (y) = 49/50 C - 1/50 (200,000 - C) C - 4,000 = 0 C = 4,000 dólares Lo anterior quiere decir que si la compañía cobra una prima anual de 4,000 dólares, entonces su ganancia promedio sobre un número grande de póliza similar será cero. 5.14 Ya que se ha visto como calcular la desviación estándar de una variante aleatoria, reconsidere el ejercicio 5.10 que por conveniencia se escribe a continuación: Sea y el número de faltas de máquina diarias que ocurren en una planta procesadora de alimentos, y suponga que la tabla que sigue proporciona su distribución de probabilidad. Y P (y)
0 .35
1 .35
2 .25
3 .05 81
Encuentre el valor esperado y la varianza de y. construya una gráfica de la distribución de probabilida probabilidad. d. ¿Cuál es es la probabili probabilidad dad de que y caiga a más de tres desviaciones estándar de su media? ¿Cuál será para más de dos desviaciones estándar? y E (y) = μ = ∑ p (yi) y i
б2 = = = б = 2
= 0 (0.35) + 1 (.35) + 2 (.25) + 3 (.05) = 1.0. y E (y - μ)2 = ∑ p(yi) - μ)2 p (yi) y i (0 - 1) (0.35) + (1 - 1) (0.35) + (2 - 1) (0.25) + (3 - 1) (0.05) 0.35 + 0.25 + 0.2 0.8 ; б = 0.8944
P (y) 0.356 0.25
0.05
0
1
2
3
y
¿Cuál es la probabilidad de que y caiga a más de tres desviaciones estándar de su media? Como la medida es: μ = 1, y μ + 3 б = 1 + 3 ( 0.8944) = 3.6833 Por lo que: p (y>3.6833) = 0
Ya que esta fuera de nuestra tabla
¿Cuál será para más de dos desviaciones estándar?: μ + 2 б = 1 + 2(0.8944) = 2.79 y
p (y>2.79) = 0.05
82
5.20.- Simule el experimento descrito en el ejercicio 5.18 marcando 5 piezas de cartón o monedas de manera que 3 representen a las acciones ordinarias y 2 a las preferentes. Póngalas en un sombrero, agítelo y seleccione tres, anotando y. Regrese las piezas o monedas al sombrero y de nuevo agítelo y extraiga otras tres, etc. Repita la selección y registro de y 100 veces. Construya un histograma de frecuencias para esta muestra y compárela con el histograma de probabilidad que obtuvo en el ejercicio 5.18. Si en lugar de basar el histograma de frecuencias en n = 100 observaciones, lo hubieran basado en n = 100,000 ¿Cómo se compararía con el histograma de probabilidad? y 0 1 P(y) 6 69
2 30
Y = Numero de años que dura de moda un vestido
1 + 2 3 + 3 4 + 4 4 = 35 = 2.916 ∑ 12 12 12 12 12 y =1 4 1 4 2 2 σ = E ( y − µ ) = ∑ ( y − µ ) 2 p ( y ) = (1 − 2.9167) 2 + (4 − 2.9167) 2 = 0.9097 12 12 y =1
µ = E ( y ) =
4
yp( y ) = 1
5.23 Construya un histograma de probabilidad para y. Calcule σ y encuentre la probabilidad de que X caiga a no mas de dos desviaciones estándar (2 σ ) de la media µ . ¿Esta esto de acuerdo con el teorema de Tchibyshef? ¿Caracterizan µ y σ a p(x)? σ = 0.9535
2σ = 1.9076 ( µ ± 2σ ) = ( 2.916 ± 1.908) = (1.008,4.824) Probabilidad de que y caiga a no mas de 2 desviaciones estándar = 11/12 Teorema de Tchebyshef Al menos (1-1/4) = 3/4 caen dentro de 2 desviaciones estándar. Como 11/12 de las observaciones caen dentro de 2 desviaciones estándar, el teorema de Tchebyshef si_se cumple.
83
y 1 2 3 p(y) 1/2 1/4 ¼ 5.24 Refiérase al ejercicio 5.18. Encuentre el valor esperado y la varianza de y. Se hizo la simulación del ejercicio 5.20, calcule de ahí y′ , s2 para las 100 mediciones. Compare esos valores con el valor esperado y la varianza de y. E ( y ) =
= 1.2 ∑ yp( y) = 0 101 + 1 106 + 2 103 = 12 10 2
y = 0
σ
2
= E ( y − µ ) = ∑ ( y − µ ) 2 p( y ) = (0 − 1.2) 2 1 + (1 − 1.2) 2 6 + (2 − 1.2) 2 3 = 0.36 10 10 10 y =0 2
2
5.25 Refiérase al ejercicio 5.24. Calcule σ y encuentre la probabilidad de que y caiga a no mas de 2 σ de µ ¿Caracterizan µ y σ a p(y)? ¿Qué proporción de las 100 mediciones caen a no mas de 2 σ de y?
= σ 2 = 0.6 µ = 1.2 ( µ ± 2σ ) = (1.2 ±1.2 ) = ( 0,2.4 ) p ( µ ± 2σ ) = 1 1 1 − 2 donde k = 2 k 1 3 3 al menos de la muestra 1 − 2 = 4 2 4 σ 2
caen dentro, si se cumple el teorema de Tchebyshef f.
No caracterizan, el 100% de las mediciones caen dentro.
5.27 Una agencia de suscripciones por correo maneja suscripciones por uno, dos y tres años con probabilidades 12 , 14 , 14 respectivamente. Si por cada año de suscripción la agencia recibe un dólar de comisión, ¿Cuál es la comisión esperada por suscripción? E ( y ) =
3
1 + 2 1 + 3 1 = 7 2 4 4 4
∑
y =1
yp( y ) = 1
Se esperan 1.75 dólares de comisión por suscripción. 5.28 Un cliente potencial para una paliza de seguro contra incendio de 20,000.00 dólares tiene su resistencia en una área que de acuerdo a la experiencia pasada puede tener un incendio que represente una perdida total en un año determinado con probabilidad 0.001. Si se ignora todas las otras perdidas parciales, ¿Qué prima anual se le debería de cobrar para que la compañía y el cliente salgan empatados? Y = Perdida y
1
0.5
84
p(y)
0.001
0.01
Póliza por 20,000 E ( y ) =
2
∑ yp( y) = 1(0.001) + 0.5(0.01) = 0.006
y =1
Prima anual = (0.005)(20000)=120 Note por X la cantidad de tiempo para el que un libro, disponible durante 2hrs, en la biblioteca de una universidad, se lo lleva prestado un estudiante seleccionando al azar y suponga que X tiene una función de densidad.
0.5 x f ( x ) = 0
0≤X≤2 otro caso
Calcule las siguientes probabilidades: 1
∫
a) p( x ≤ 1) = 0.5 x dx = 0
0.5 2 1 0.5 x = = 0.25 2 0 2
1.5
∫
b) p(0.5 ≤ x ≤ 1.5) = 0.5 x dx = 0.5 2
∫
c) p(1.5 ≤ x) = 0.5 x dx = 1.5
0.5 2 1.5 x = 0.5625 − 0.0625 = 0.5 2 0.5
0.5 2 2 x = 1 − 0.5625 = 0.4375 2 1.5
Suponga que la distancia X entre un blanco puntual y un disparo dirigido al punto, en un juego de tiro al blanco accionado por monedas, es una υ a con pdf.
0.75(1 − x 2 ) f ( x ) = 0
-1 ≤ X ≤ 1 otro caso
a) Trace la grafica de f(x).
85
b) Calcule P(X > 0) 1
x 3 2 p ( x > 0) = ∫ 0.75(1 − x ) dx = 0.75 x − = 0.5 3 0 0 1
c) Calcule P(0.5 < X < 0.5) 0.5
∫
p (0.5 < x < 0.5) =
(
3 0.75(1 − x )dx = 0.75 x − x 2
− 0.5
0.5
3
)−
0.5
= 0.6875
d) Calcule P(X > -0.25 o X > 0.25) p ( x < 0.25) =
1
∫
(
3 0.75(1 − x ) dx = 0.75 x − x 2
0.25
3
)
1 0.25
= 0.3164
Un maestro universitario nunca termina su clase antes que suene la campana, y siempre termina su clase a menos de 1min después que suena la campana. Sea X= el tiempo que transcurre entre la campana y el tiempo de la clase y suponga que la pdf de x es
kx 2 f ( x ) = 0
0 ≤ x ≤1 otro caso
a) Encuentre el valor de k; (Sugerencia: el área total bajo la grafica de ½ min. de f(x) es 1) ∞
∫
f ( x) dx = 1
-∞
1
∫
kx dx = 2
0
kx 3
3
1
k
3
0
− 0 = 1∴ k = 1
b) ¿Cuál es la probabilidad de que la clase termine a menos de ½ min. de que suene la campana? c) 1
2
1
p ( x ≤ 1 ) = 3 x 2 dx = x 3 2 = 0.125 2 0
∫ 0
86
d) ¿Cuál es la probabilidad de que la clase continué entre 15 y 30 seg., después de que suene la campana? p (0.25 ≤ x ≤ 0.5) =
0.5
0.5
∫
3 x 2 dx = x 3 0.25 = (0.5)3 − (0.25)3 = 0.125 − 0.015625 = 0.109375
0.25
e) ¿Cuál es la probabilidad de que la clase continué por lo menos 4 seg., después que suene la campana? p ( x ≥ 0.67 )
1
1
= ∫ 3 x 2 dx = x 3 0.66 = 0.70459 0.66
tabla:
760. Sea X una variable aleatoria discreta con distribución de probabilidad dad por la siguiente xi 2 3 4 5 pi 0. 0. 0. 0.11 2 4 3 a) Obtenga la función de distribución acumulativa de la variable x. b) Calcule P(x < 3.5) y P(3 ≤ x < 4.5).
a)
0.2 F(x)= 0.6 0.9 1
0≤ x<2 2≤ x<3 3≤ x<4 4≤ x<5
b) P(x < 3.5)= F(3.5) – 0= 0.9 P(3 ≤ x < 4.5)= F(4.5) – F(3)=1 – 0.9= 0.1 761. Sea F(x) la función de distribución acumulada de la variable aleatoria discreta X dada por la siguiente tabla: (-∞ ,2] F(x 0 ) x
(2,3] 0.4
(3,5 (5, ] ∞) 0.5 1
Encuentre la función de densidad de f(x) si x toma sólo los valores –2, 3 y 5. 87
P(x = -2)= F(-2) – 0= 0.4 – 0= 0.4 P(x = 3)= F(3) – F(2)= 0.5 – 0.4= 0.1 P(x = 5)= F(5) – F(3)= 1 – 0.5= 0.5
∴
xi -2 3 5 pi 0. 0. 0.5 4 1
762. Sea X una variable aleatoria discreta con una distribución dada por la siguiente tabla: x -2 2 4 p 0. 0. 0.2 5 3 Calcule la media, mediana, varianza, y desviación estándar. = (−2)( 0.5) +(2)( 0.3) +(4)( 0.2) = 0.4 Me = ( −2,2) 2 V ( x) = ∑( x − µ ) p ( x) = (−2 −0.4) 2 (0.5) +(2 −0.4) 2 (0.3) +( 4 −0.4) 2 (0.2) = 6.24 σ = V ( x ) = 2.5 E ( x)
763. Sea {Pn} la sucesión infinita de la forma pqk-1 , k ∈ N donde 0
tabla:
764. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la siguiente xi 0 1 2 5 pi 0. 0. 0. 0.2 1 4 3 Calcule el coeficiente de sesgo. 765. Calcule el coeficiente de sesgo para la siguiente distribución (ensayos sin reposición):
para: x= 0, 1, ..... ,n; n ≤ N, x ≤ k; n-x ≤ N-k
k N − k x n − x f ( x) = ; N n
88
γ =
µ 3 µ 2 µ 2
=
=
npq (1 − 2 p)( N − n)( N − 2n)( N − 1) N −1
( N −1)( N − 2)npq ( N − n) npq N − n
1 − 2 p N − 2n N −1 . . N − n npq N − 2
donde
p
=
k N
;q
= 1 − p
766. Sea X una variable aleatoria discreta con una distribución de probabilidad dada por la siguiente tabla: x -5 -2 0 1 3 8 p 0. 0. 0. 0. a 0.1 1 2 1 2 a) Calcule la constante a. b) Encuentre F(x). c) Calcule P(x=1), P(x = 1), P(x = 2), P(x < 3), P(x ≥ 0), P(-2 ≤ x < 3) a)
∑ p( x) =1 b)
= 0.1 + 0.2 + 0.1 + 0.2 + a + 0.1= 1 = a = 1 – 0.7= 0.3 0 -∞ < x ≤ 5 0.1 -5 < x ≤ -2 F(x)= 0.3 -2 < x ≤ 0 0.4 0
c) P(x = 1)= F(3) – F(2)= 0.3 – 0.1= 0.2 P(x = 2)= F(4) – F(3)= 0.4 0.4= 0 P(x < 3)= F(3) – 0= 0.6 P(x ≥ 0)= 1 - F(0)= 0.7 P(-2 ≤ x ≤ 3)= F(3) – F(-2)= 0.6 – 0.1= 0.5 767. Sea F(x) la función de distribución acumulada de la variable discreta X dada por la siguiente tabla : (-∞ ,2] F(x 0 ) x
(2,1] 0.2
(1,3 (3, ] ∞) 0.8 1 89
Dado que x sólo toma los valores –2, 1 y 3. Encuentre la función de densidad x. P(x = -2)= F(-2) – 0= 0.2 P(x = 1)= F(1) – F(-2)= 0.8 – 0.2= 0.6 P(x = 3)= F(3) – F(1)= 1 - 0.8= 0.2
∴
x -2 1 3 p 0. 0. 0.2 2 6
768. Exprese las siguientes probabilidades usando la función de distribución acumulada F(x). a) P ( x ≤ b) = F(b) – 0=F(b) b) P ( x ≥ b) =1 – F(b) c) P (a < x ≤ b) = F(b) – F(a) d) P ( a ≤ x ≤ b) = F(b) – F(a) e) P (a < x < b) = F(b) – F(a) 769. Encuentre la función de densidad de la variable aleatoria discreta X, si se sabe que x1 < x2 y R=0.2, E(x)=3 V(x)=4. x x1 x2 p 0. a V ( x) = E ( x ) − µ 2 4 =9 − µ a= 1 – 0.2= 0.8 µ =5 x x1 x2 p 0. 0.8 2 2
2
2
V ( x) =
2 x − µ ) p ( x) ( ∑
4 = ( x1 − 5 )2 (0.2) + ( x2 − 5 ) 2 (0.8) 2
2
4 = 0.2 x1 − 0.4 5 x1 + 1 + 0.8 x2 − 1.6 5 x2 + 4 2
2
0.2 x1 − 0.4 5 x1 + 0.8 x2 − 1.6 5 x2 + 1 = 0 ∗ 1
= 0.2 x1 + 0.8 x2 = 3 15 = x1 + 4 x2 x1 = 15 − 4 x2 ∗ 2 E ( x)
sustituyen
do
90
0 = 0.2(15 − 4 x2 ) 2
− 0.4 5 (15 − 4 x2 ) + 0.8 x2 2 −1.6 2 4 x2 − 24 x2 + 46 − 6 5 = 0 2 4 x2 − 24 x2 + 32 .58 = 0 x2 = 4 x2 = 2
5 x2
+1
sustituyen do
= 15 − 4(4) = −1 x1 = 15 − 8 = 7 x1
Dado que x2 debe ser mayor que x1 x1= -1; x2=4 x -1 4 p 0. 0.8 2
∴
770. Encuentre los valores de k para los cuales asume valores positivos la función de densidad siguiente: k N − k x n − k f ( x) = N
x=0, ....... , n ; (n ≤ N : x ≤ k : n-x ≤ N-k)
n
max {0, n + k - N}≤ X ≤ min {n, k}
771. En una urna hay x bolas blancas, x 2 rojas, x3 negras, donde x1, x2 y x 3 son las raíces de la ecuación x3 −12 x 2 + 44 x − 48 = 0 y x1 < x2 < x3. De la urna se sacan tres veces (con reposición) dos bolas. Calcule el valor esperado de la variable aleatoria x, la cual representa el número de intentos en los cuales aparecen bolas del mismo color. Raíces: x1=2 x2=4 x3=6 E(x)=2(1/6) + 4(1/3) + 6(1/2)= 1/3 + 4/3 + 3 =
x 2 4 6 p 1/ 1/ 1/2 6 3 14 3
91
772. Tenemos do urnas, de las cuales la primera contiene n bolas blancas y 2n bolas negras, y la segunda contiene 2n bolas blancas y n negras. Se escoge al azar una urna y de ella se saca una bola. Si la bola es blanca, se saca de la misma urna (sin reemplazo) otra bola y, en caso contrario, se saca una bola de la otra urna. Sea X una variable aleatoria que representa el número de bolas blancas extraídas ¿para qué valor de n se cumple E(x)<1?
773. Sea X una variable aleatoria discreta cuya distribución de probabilidad es: x 3 5 x3 p P1 0. 0.2 3 Calcule p1 y x3 si se sabe que E(x)=5.
∑ p( x) = p + 0.3 + 0.2 =1 1
p1 = 1 − 0.5 = 0.5 E ( x ) = 3(0.5) + 5(0.3) + x3 (0.2) = 5 5 −3 = 10 x3 = 0 .2
774. Sea X una variable aleatoria discreta con la siguiente distribución de probabilidad: xi x1 x2 3 pi 0. 0. P3 4 3 Calcule p3, x1 y x2, si se sabe que E(x)=1.9 y V(x)=0.69.
∑ p( x) = 0.4 + 0.3 + p
3
p3
=1
= 1 − 0.7 = 0.3
= 0.4 x1 + 0.3 x2 + 0.9 =1 .9 0.4 x1 + 0.3 x2 = 1; x1 = 2.5 − 0.75 x2
E ( x )
V ( x )
= ∑( x − µ )2 p ( x)
( x1 −1.9) 2 (0.4) + ( x2
−1.9) 2 (0.3) + (3 −1.9) 2 (0.3) = 0.69 2 2 0.4 x1 −1.52 x1 +1.444 + 0.3 x2 −1.14 x2 +1.083 + 0.363 = 0.69 2 2 0.4 x1 −1.52 x1 + 0.3 x2 −1.14 x2 + 2.2 = 0 sustutuyen do
92
0.4(2.5 − 0.75 x2 ) 2
−1.52 (2.5 − 0.75 x2 ) + 0.3 x2 2 −1.14 x2 + 2.2 = 0 2 2 2.5 −1.5 x2 + 0.225 x2 − 3.8 + 1.14 x2 + 0.3 x2 −1.14 x2 + 2.2 = 0 2 0.525 x2 −1.5 x2 + 0.9 = 0 x2 = 2 x2
=
6 7
sustituyen do x1 x1
= 2.5 − 0.75 ( 2) = 1 3 6 13 = 2.5 − = 4 7 7
xi 1 pi 0. 4 xi 13/ 7 pi 0.4
2 3 0. 0.3 3 6/ 3 7 0.3 0.3
775. Sea X una v. a. Discreta con la distribución de probabilidad es: Calcule E(X) y verifique que: a) E ( x ) =
∑ xP ( x) = (−3)( 0.2) +(−1)( 0.1) +(0)( 0.4) +(1)( 0.2) +(2)( 0.1) = −0.3
E (3 x −1) =[3( −3) −1]( 0.2) +[3( −1) −1]( 0.1) +[3(0) −1]( 0.4) +[3(1) −1]( 0.2) +[3( 2) −1]( 0.1)
= −1.9 3 E ( x ) −1 = 3( −0.3) −1 = −1.9 b) E ( 2 x +1) =[ 2( −3) +1]( 0.2) +[ 2( −1) +1]( 0.1) +[ 2(0) +1]( 0.4) +[ 2(1) +1]( 0.2) +[ 2( 2) +1]( 0.1)
= 0 .4 2 E ( x ) +1 = 2( −0.3) +1 = 0.4
c) E ( x −2) 2 = ( −3 −2) 2 (0.2) +( −1 −2) 2 (0.1) +(0 −2) 2 (0.4) +(1 −2) 2 (0.2) +( 2 −2) 2 (0.1) = 7.7 E ( x 2 ) −[ E ( x )] 2 = ( −3) 2 (0.2) +( −1) 2 (0.1) +(0) 2 (0.4) +(1) 2 (0.2) +( 2) 2 (0.1) −( −0.3) 2 = 2.01
779. En la lotería hay 12 boletos, entre los cuales cinco ganan. Se sacan seis boletos. ¿Cuál es el dominio de la función f(x) = donde r es el valor esperado de la variable aleatoria X que denota el número de boletos ganadores?
93
D om inio =
lo g2 | x − r |≥ 0 | x − r |> 0
E ( x ) = r = 0 *
= 0+
C 67C 00 12 16
C
+ 1*
C 57C 15 12 16
C
+ 2*
105 700 1050 420 35
+
+
+
+
C 47C 25 12 16
C
=
+ 3*
C 37C 35 12 16
C
+ 4*
C 27C 45 12 16
C
+ 5*
C 17C 55 C 1162
5
924 924 924 924 924 2 3 7 x ∈ − ∞ , U ,+ ∞ 2 2 780. De un conjunto Z = se sacan, con reemplazo , cinco números. Sea X la variable aleatoria que denota el número de valores negativos extraídos. ¿Cuál es la media de la variable aleatoria X ?
2 x3 − 5 x2 − 3 x ≥ 0 z = 3 x − 2 x3 + 5 x2 1 z ∈ − ,0, 3} 2 781. Sea X una variable aleatoria con función de densidad. a) Determine el valor de la constante a. b) Calcule P(1< X < 2). 3
f ( x )
= ∫ a(3 x − x 2 ) =1 0
3
3ax 2 ax 3 2 − 3 =1 0 27 a −9 a 2 9a = 2 a
=1
2 x 2 x 2 P (1 ≤ x ≤ 2) = ∫ 3 − 9 dx 1 2 x 2 2 x3 13 = − = 27 3 27 1 P (1 ≤ x ≤ 2) = 13 27 2
=2 9
94
782. Sea X una variable aleatoria con función de densidad:
a)
b)
π
f ( x) =
a
∫
a2
−π
− x 2
dx
=1
x = asen θ
= a cos θ a 2 − x 2 = a cos θ
dx
π
a
∫ d θ =1
−π
a(θ ) = 1 a
x asen = 1 a a −1 a −1 − a asen − asen =1 a a π −π = 1 a − 2 2 −1
∫ < < = − π =− =
1 a= π
P a
x
1
a a
a a
2
x s e n aa s e n P a x a
x ad
2
x
2
2
− − 1
2
1
1
( 1 )
2
1
s e n
1
1 2
1 3
1 3
783. Sea X una variable aleatoria con función de densidad: a) Determine el valor de a. b) Calcule F(x). π
f ( x )
= ∫ asenxdx =1 0
− a cos x0π =1 − a( −1) + z (1) =1 a + a =1 a
=1
2
95
0 x f ( x) = 1 ∫ s e n x d x 2 0 1 x
∫
1 s e n x d =x − 1 c o xs x 0 2 2 0
− 12 c o xs + 12 0 1 f ( x) = (1 − c o xs ) 2 1 784. Sea X una variable aleatoria con la siguiente fundón de distribución acumulativa: a) P (a < x < b)
= F (b) − F (a) P (1 < x < 2.5) = F (2.5) − F (1) = (2.5 − 2)2 − 0 = 0.25 P (1 < x < 2.5) = 0.25 b) P (2.5 < x < 3.5)
= F (3.5) − F (2.5)
= 1 − (2.5 − 2)2 = 0.75 P (2.5 < x < 3.5) = 0.75 c) f ( x)
2( x − 2) = 0
785. Sea X una variable aleatoria con función de densidad: 96
π π E ( x) = ∫ 0.5 xsenxdx = 0.5− x cos x + ∫ cos xdx = 0.5[ − π cos π + sen π + 0 cos 0 − sen 0] = 0.5(π ) = 2 0 0 π π π 2 1 1 2 π 2 V ( x) = ∫ 0.5 xsenxdx − = − x cos x + 2∫ x cos xdx − 20 4 2 0 4 π
= 0.5[− π
2
cos π + 2π sen π + 2 cos π − 2 cos 0
σ = V ( x)
π 2 4
=
]−
π 2 4
= −2
− 2 = 0.683
786. Sea X una variable aleatoria con función de densidad: a) 2
f ( x)
= ∫ a(4 x − x3 )dx = 1 0
2
2 x 4 a 2 x − =1 4 0 a(8 − 4) = 1 a
=
1 4
b) E ( x) E ( x) V ( x)
=
1 4
1 4 x3
2
∫ x(4 x − x ) = 4 3
0
=
16
=
1
3
2
1 32 32 1 64 − = − = 5 0 4 3 5 4 15 x
5
15 4
2
256
1
∫ x (4 x − x )dx − 225 = 4 x 2
3
0
σ = V ( x)
=
44 225
4
2
256 1 64 256 4 256 44 − − = 16 − − = − = 6 0 225 4 6 225 3 225 225 x
6
= 0.4422
787. Sea X una variable aleatoria con función de densidad: Calcule la mediana de la variable X.
97
P ( x
< me ) = 12 me
P ( x
∫ ( x − x 4 )dx = 12
< a) =
3
0
=
me
me me
2
2 4
−
me
4
16
=
1 2
− 8me 2 + 8 = 0 = 1.126
788. Sea X una variable aleatoria con función de densidad. a) a ( x − 2)( 4 − x)
= a( − x 2 + 6 x −8)
4
f ( x)
= a ∫ ( − x 2 + 6 x −8) dx = 1 2
4
x 3 + 3 x 2 −8 x = 1 a − 3 2 4 a =1 3 a
=
3 4
b) d dx
3 − x 2 + 6 x −8 = 0 4
(
3 9 x + = 0 2 2 mod a = x = 3
)
−
= mediana
789. Sea X una variable aleatoria con función de densidad:
98
a) ∞
f ( x)
= k ∫ e−λ x dx = − 0
−
k ∞ e
λ
k
λ
+
k
e
0
λ
[e ] λ k
−λ x ∞ 0
=1
=1
=1
k = λ b) ∞
E ( x)
= λ ∫ xe
−λ x
dx
= − xe
∞
+ ∫ e
−λ x
0
µ 3 µ 3
∞
−λ x
0
dx
1 1 1 = − xe −λ x − e−λ x = e0 = λ λ 0 λ
837. Calcule el tercer momento inicial de la v.a. X con f. d. p. : 2 2 2 x7 3 x 6 3 x5 x 4 209 3 3 6 5 4 3 = 4∫ x ( x −1) dx = 4∫ ( x − 3 x + 3 x − x ) dx = 4 − + − = 4 6 5 4 1 140 7 1 1 =
209 35
790. Sea X una variable aleatoria con función de densidad: f ( x) = 7e-x para x≥0 0 para las demás x Calcule P(0.15 < X < 0.6) 0.6
∫ 7e
−7 x
dx
=−
0.15
f(x) = a) b) c)
∫ ax
7e du = −e 7 ∫ u
−7 x
= −0.0149 + 0.3449 = 0.33
a
2
2
dx
0
+ ∫ a(2 − x) 2 dx = 1 1
2/3ª = 1; 1
b) α1 =
b
791. Sea X una v.a. con función de densidad dada por: ax2 para 0≤x<1 2 a(2-x) para 1≤x<2 0 para las demás x Determine el valor de la constante a. Calcule los cuatro primeros momentos centrales de l variable aleatoria X. Calcule la desviación típica y los coeficientes de sesgo y kurtosis.
1
a)
1
a = 2/3
3 x 3 dx 20
∫
2
+ 3 x(2 − x) 2 dx 21
∫
=1
99
1
α2 = α3 =
3 4 x dx 20
∫
3
2
+ 3 x 2 ( 2 − x) 2 dx 21
∫
1
2
3
x dx + ∫ x (2 − x) dx = 1.3 2∫ 2 5
3
0
2
1
1
α4 =
= 1.1
3 x 6 dx 20
∫
2
3 + x 4 ( 2 − x) 2 dx 21
∫
= 1.628
μ1 = 0 μ2 = 1.1 – (1)2 = 0.1 μ3 = 1.3 – 3(1)(1.1) + 2(1)2 = 0 μ4 = 1.628 – 4(1)(1.3) + 6(1)2(1.1) – 3(1.628) = 0.028 c) Desviación típica σ = μ1/2 = 0.3162 Sesgo γ = μ3/σ3 = 0 kurtosis k = μ4/σ4 792. Sea X una variable aleatoria con función de densidad: x para 0≤x<1 f(x) = 2-x para 1≤x<2 0 para las demás x a) Calcule los cuatro primeros momentos centrales de la variable aleatoria X. b) Calcule los coeficientes de sesgo y kurtosis. 1
a) α1 =
2
∫ x dx + ∫ x(2 − x)dx = 1 2
0
1
1
α2 =
2
∫
x 3 dx
0
1
1
α3 =
2
∫ x dx + ∫ x (2 − x)dx = 1.5 4
0
3
1
1
α4 =
+ ∫ x 2 ( 2 − x)dx = 1.166
2
∫ x dx + ∫ x 5
0
4
( 2 − x)dx
= 2.066
1
μ1 = 0 μ2 = 1.166 – 1 = 0.166 μ3 = 1.5 – 3(1)(1.166) + 2(1) = 0.002 μ4 = 2.066 – 4(1)(1.5) + 6(1)(1.166) – 3(1) = 0.062 b) Sesgo kurtosis
γ=0 k = -0.74
793. Sea X una variable aleatoria con función de densidad f(x)= λe-x para x E R. a) Determine el valor de λ. b) Calcule el coeficiente de kurtosis. 794. La función de densidad para una variable aleatoria X es: 100
x 2 2 x exp − λ λ
f(x) =
para x>0
0 para las demás x a) Determine la función de distribución acumulativa F(x). b) Calcule la mediana. a) F(x) =
0
x
2
para x≤0 t 2 x 2 − dt 1 exp = − λ λ
∫ λ 0
t exp −
para x>0
b) F(me) = 0.5, me 2 1 1 − exp − λ = 2
exp − me
=
me
2
λ
1 = 2
λ ln 2
795. Demuestre que no existe la media para la distribución con la función de densidad dada por: λ
1
f(x) = π * 2 2 , λ + ( x − µ )
donde λ>0 ∞
Para λ=1, μ=0, se verifica si la integral ∞
Pero
xdx
∫ 1 + x
2
=
0
1 2
1 xdx π −∞1 + x 2
∫
converge,
[ln(1 + x )]∞ = ∞ ; entonces E(x) no existe. 2
0
796. Sea X una variable aleatoria con función de densidad: f(x) = xe-x para x≥0 0 para las demás x a) Determine la función de distribución acumulativa. b) Calcule P(x≥2). a) F(x) = 0 1-e-x(1+x) ∞
b)
∫
xe
2
f(x) = a) b) c)
−x
dx
=−
para x≤0 para x>0 3 e2
797. Sea X una variable aleatoria con función de densidad: ksenx para 0≤x≤π 0 para las demás x Determine el valor de k. Calcule P(x<1/3π). Obtenga F(x).
101
π
a)
∫
=1
1
= −0.25 + 0.50 = 0.25
k senxdx
k=½
0
π
b)
3
∫ 2 senxdx 0
c) 0 F(x) = ½(1-cosx) 1
para x≤0 para 0 π
798. Sea X una v.a con función de densidad: x para 0≤x<1 f(x) = 2-x para 1≤x<2 0 para las demás x a) Calcule la función de distribución acumulativa F(x). b) Calcule la probabilidad del evento A de que la variable aleatoria X tome, en dos experimentos independientes, por lo menos una vez, valores del intervalo [1,2] a) 0 F(x) = 1/2x2 2x – 1/2x2 – 1 1
para x≤0 para 02
2
1
b) P(1≤x<2) = ∫ (2 − x)dx = , entonces 2
1
0
2
2 1 1 3 P(A) = 1 - = 0 2 2 4
799. En una ciudad, la temperatura medida en un día especial es una variable aleatoria T, cuya f.d.p. está dada por f(t) = 1/2e-t. a) Obtenga la función de distribución acumulativa F(x). b) Calcule P(T<2). .a) F(t) = 1/2et para t≤0 -t 1 – 1/2e para t>0 b) P(T<2) = 1-e-2 800. La función de distribución acumulativa de la variable aleatoria X está dada por: x 1 − 1 t 2 dt exp F(x) = ∫ 2 , obtenga la función de densidad. 2π −∞ f(x) =
1 2 exp − x 2π 2 1
102
801. a) Calcule a, de manera que la función: 0 para x≤1 F(x) = 2(1 – 1/x) para 1a sea la función de distribución acumulativa de la variable aleatoria X. b) Calcule P(-1≤X≤1.5). 802. Sea X una variable aleatoria con función de densidad: f(x) = 3x2 para 0≤x≤1 0 para las demás x Calcule la media y mediana de la variable aleatoria X.
803. Sea X una variable aleatoria con función de densidad: f(x) = ¾(1-x2) para x≤1 0 para las demás x Calcule la media, moda, mediana y el tercer momento central de la variable aleatoria X.
804. Sea X una variable aleatoria con función de densidad f(x) = Calcule la moda y la mediana de la variable aleatoria X.
2
1
π e x
+ e − x
,
805. Calcule la moda y la mediana para la función de distribución de densidad:
f(x)=
ak (x - xo)a-1 [1 + k(x – xo)a]2 0
para xo < x<∞ para las demás x
donde a, k son constantes tales que k>0, a>1. d ak (x - xo)a-1 =0 ; x =xo+[1/k(2a-1)] 1/a. dx [1 + k(x – xo)a]2
806. Calcule la moda, la mediana y la media para la f.d.p.: 103
f(x)=
¼ senx
para 0
0
para las demás x
d ¼ senx =0 ; -1/4cosx=0 ; x=cos-10 ; x=90 dx ∫¼ senx =-2/4 cosx =1/2; cosx =-1; x=180 ∫x¼ senx =1/4 ∫xsenx ; x=180
807. calcule la moda y el tercer momento inicial para la variable aleatoria X con función de densidad:
f(x)=
exp (-1/X) n!Xn+2 0
d℮(-1/x) ; ℮x-2xn+2 =n + 2 ; x = n!x(n+2) ℮x-1xn+1
para x>0
para n =3,4,…
para las demás x.
1 n+2
808. Calcule la mediana, la media y la varianza para la variable aleatoria X con función de densidad:
f(x)=
1 2X2
0
para x >1
para las demás x. 104
μ=∫x/2x2= ∫1/2x=[ ln2x]01= no existe v(x)=∫x2/2x2 –μ2= no existe ∫ 1/2x2 =-x-1/2=1/2; x=-1
809. Calcule el coeficiente de sesgo y de curtosis para la f.d.p.: f(x)=
6x(1-x)
para 0
0
para las demás x.
μ= ∫ x6x(1-x)=1/2 v(x)= ∫x26x(1-x)-(1/2) 2=1/20 ∫x36x(1-x) -3∫x6x(1-x)∫x26x(1-x)+2[∫x6x(1-x)] 3 = Y= 0 (1/20)3 k= ∫x46x(1-x) -4∫x6x(1-x) ∫x26x(1-x) +6[∫x6x(1-x)]2∫x26x(1-x) -3[∫x6x(1-x)]4 (1/20)4
=2.16
810. Sea X1 una variable aleatoria con función de densidad: 1/6(x-2) f(x)=
para -2
-1/12(x-4)
para 0
0
para las demás x.
y X2 con la función de densidad:
g(x)=
1/12(x-2)
para -2
-1/6(x-4)
para 2
0
para las demás x.
105
Calcule los coeficientes de sesgo para f(x) y g(x), y compare los resultados obtenidos.
811. Calcule la media, la varianza y el coeficiente de curtosis para las siguientes distribuciones: ¾(2x-x2)
a) f(x)=
0
para 0
μ=∫x¾(2x-x2)=1; v(x)= ∫x2 ¾(2x-x2)- μ2=1/5 k = ∫x4¾(2x-x2) -4∫x¾(2x-x2) ∫x2¾(2x-x2) +6[∫x¾(2x-x2)]2∫x2¾(2x-x2) -3[∫x¾(2x-x2)]4 ; (√1/5)4 4 b) f(x)= exp(- x-1 / 10 ) 2 10
k = 15/7
Compare los resultados obtenidos. 812. La variable aleatoria X tiene la distribución acumulada dad por:
F(x)=
0
para x<1
(x-1)/2
para 1
1
para x>3
σ=v(x)2= ∫x2(x-1)/2 – [∫x(x-1)/2]2=3/9 σ=0.5773 Calcule la desviación típica de la variable X.
813. Exprese el tercer momento central de la variable aleatoria X por sus momentos iniciales. μ3=E(x- μ)3=E(x3-3x2 μ+3x μ2- μ3)=E(x3)-3E(x2)E(μ)+2E(μ)3= μ3=α3-3α1α2+2α13 814. Exprese el tercer momento inicial de la variable aleatoria X por sus momentos centrales. α3= μ3 + 3α1α2-2α13= μ3 + 3 μ 1(μ2 +μ12) -2 μ 13 α3= μ3 + 3 μ 1μ2 + μ 13
106
815. Aplicando la propiedad de la media: E(x)= E(X-a) + a, calcule la media de la variable aleatoria X cuya función de densidad es: f(x)=
7(x-1)6
para 0
0
para las demás x.
E(x)=∫x[7(x-1)6]=1/8
816. El tiempo T (en minutos) entre llegadas consecutivas de dos taxis en cierto punto de una variable aleatoria con función de distribución acumulada dada por: 1-exp(-1/3t) F(t)=
para t>0
0
para las demás t.
a) Calcule P(1
0
para t>0 para las demás t.
c) Calcule E(T) y V(T). E(T)=∫t[1-exp(-1/3t)]dt=3 V(T)=∫t2[1-exp(-1/3t)]-9=9
817. Sea X una variable aleatoria con función de densidad: f(x)=
axe-4x2 0
para x>0 para las demás x.
a) Determine el valor de la constante a. b) Calcule E(X) y V(X). 107
818. Aplicando la formula μ3=α3-3 α1α2+2 α13, calcule el coeficiente de sesgo para la distribución dad por la siguiente función de densidad:
f(x)=
1 xn-1 exp (-x/λ) para x>0 λ n(n-1)! 0
para las demás x.
819. Calcule la moda y la media de la variable aleatoria X con función de densidad dada por: f(x)=
(4 / π )x2exp(-x2) 0
para x>0 para las demás x.
d(4 / √ π )x2exp(-x2) =0 ; x=1;moda=1 dx E(x)=∫x(4 / √ π )x2exp(-x2)=2/√n 836. Demuestre que: V(X)=E(X-c)2-[c-E(X)]2 V(X)= E[X-E(X)]2= E[(X-c)+(c-E(X))]2= E[(X-c)2+2(X-c)(c-E(X))+(c-E(X)) 2]= E(X-c)2-2(cE(X))E(c-X)+(c-E(X))2= E(X-c)2-[c-E(X)]2 750.-
Se lanza una moneda una sola vez. Denotemos x a la variable aleatoria discreta que representa el número de águilas que salen. a) Obtenga la distribución de probabilidad de la variable aleatoria x. b) Determine la media y la varianza de x. Para el inciso (a) xi pi µ =
0 1 1/2 1/2
n
∑ XiPi = (0)(1/ 2) + (1)(1/ 2) = 1/ 2 i =1
108
La media σ 2
= ∑ ( Xi − µ ) 2 Pi = (0 − 1 / 2) 21 / 2 + (1 −1 / 2) 21 / 2 =1 / 8 + 1 / 8 = 2 / 8 =1 / 4 La varianza
751.- Considere una variable aleatoria x continua, cuya función de densidad de probabilidad es:
2 cos 2x para 0 ≤ x < π/2
f(x) = a) b) c) d) e)
0 en cualquier otro caso. Verifique que en efecto es una función de densidad de probabilidad. Calcule la media y la varianza. Obtenga la función de distribución acumulada F(X). Determine la media. Determine la moda. π/4
a)
π / 4
∫ 2 cos 2 xdx = 2 ∫ cos 2 xdx = 0
2 sen 2 x
0
2
π / 4 0
= sen (2)(π / 4) − sen (0) = 1 por lo tanto es
una función de densidad La media
∫
µ = x 2 cos 2 xdx
b)
π / 4 0
la varianza =
cos udu
=
1
1
u cos udu = [ cos u + usenu ] 2 ∫ 2
=
1 2
=1 / 2[cos 2(π / 4) + 2(π / 4) sen 2(π / 4) − cos( 0) ] = −1 / 2 + π / 4
π / 4
π / 4
π / 4
u2
∫ x f ( x)dx − µ = ∫ x 2 cos 2 xdx = ∫ 4 cos udu − µ =1/ 4 ∫ u 2
−∞
π / 4 0
π − 2 4
∞
σ
2
[cos 2 x + 2 xsen 2 x] =
2
u
= ∫ x cos udu = ∫
2
2
0
2
0
2
cos udu
− µ 2
0
= 1 / 4[2ucsu + (u 2 − 2) senu ]0 − µ 2 = 1 / 4[4 x cos 2 x + (4 x 2 − 2) sen 2 x]0 − µ 2 = π / 4
π / 4
π − 3 4
c) La función de distribución acumulada esta dada por: 0 f(x)= sen 2 x 1
para para para
<0 0 ≤ x ≤π / 4 x >π / 4 x
109
d) La media sen π/6 = ½
sen2x= ½
e) Para la moda f(x) = 2cos2x f´(x) = 0 f´(x) = (-2sen2x)(2) La única solución en el intervalo [0,π/4] es X = 0 f´´(x) = -8cos2x f´´(0) = -8<0 Por lo tanto f(x) es cóncava hacia abajo en x = 0 por lo que x = 0 es el valor máximo dentro del intervalo: De ahí que la moda es igual a 0.
752.-
Halle la función de densidad de probabilidad f(x) de una variable aleatoria continúa X, dado que su función de distribución acumulada esta dada por: 0 F ( x) = senx 1
<0 0 ≤ x ≤ π π x >
para
x
para para
2
∞
F ( x)
=
∫ f ( x)dx
−∞ ∞
senx
=
∫ f ( x)dx
−∞ ∞
senx
∫ f ( x)dx
= −∞
dx f ( x)
dx = cos x
f ( x)
cos x = 0
= f ( x)
0 ≤ x
≤ π
otro
753.- Sea x una variable aleatoria continua con función de densidad de probabilidad dada por:
f(X) =
x/2 para 0 ≤ x ≤ 2 0 en cualquier otro caso 110
Obtenga la media, varianza, desviación típica, moda y mediana de la variable aleatoria x. 2
a) µ =
x 2
∫ 2
1 x 3
dx =
2 3
0
2
b)
= ∫ x
2
σ
3
2
0
dx − µ 2
2 0
=
=x
x3
6
4
8
2 0
2 0
=
4 3
=2 9
2
c) σ =
3
d) f(x) = x/2 f´(x) = x2/4 = 0
mo = 2
e) x
2
t
t
∫ 2dt = 4
x
0
=
x
0
me = x 2
=
4
x =
tabla:
1 2
2
4
igualamos
entonces
2
756.-Sea
X una variable aleatoria discreta con distribución de probabilidad dad por la siguiente
Xi Pi
-2 1/8
-1 1/8
0 1/2
4 3/16
6 1/16
Calcule la media, la varianza y desviación estándar para la variable x. µ =
n
∑ x p i =1
σ
2
i
i
1 1 1 3 1 3 = (−2) + (−1) + (0) + (4) + (6) = 8 8 2 16 16 4
= ∑ ( xi − µ )
2
2
pi
2
2
2
2
3 1 3 1 3 1 3 3 3 1 = 2 − + − 1 − + 0 − + 4 − + 6 − 4 8 4 2 4 16 4 16 4 8
= 85 16
σ =
85 16
= 2.3048
111
757.-Sea
tabla:
X una variable aleatoria discreta con distribución de probabilidad dad por la siguiente Xi Pi
-2 1/2
0 1/4
X3 P3
12 1/16
Si se sabe que E(x)=5/4, calcule X3 y P3 P(x) = 100 % i P(x) = P(1)+P(2)+P(3)+P(4) 1=1/2 + 1/4 + P(3) + 1/6 P(3) = 1 – ½ - ¼ -1/6 = 3/16 P3 = 3/16
5 1 + (0) 1 + ( x ) 3 + (12) 1 = = − ( 2 ) 3 i i 4 2 4 16 16 i =1 5 3 3 = −1 + x3 + 4 16 4 3 3 5 x3 = + 1 − 4 16 4 3 3 x3 = 16 2
µ =
n
∑ x p
3 2
x3
=
x3
=8
tabla:
3 16
=8
758.- Sea X una variable aleatoria discreta con distribución de probabilidad dad por la siguiente
Xi Pi
1 0.5
X2 0.25
5 0.1
10 0.1
20 Pi
a) Calcular x2 y p5, si se sabe que E(x2)=37 y x1 < x2 < x3 < x4.
b) Calcule la media la varianza y desviación estándar para la variable X.
112
a)
=100 % =| 1 P ( x) = P (1) + P ( 2) + P (3) + P ( 4) + P (5) 1 = 0.5 + 0.25 + 0.1 + 0.1 + P 5 P 5 = 1 − 0.5 − 0.25 − 0.1 − 0.1 = 0.05 P 5 = 0.05 P ( x)
n
= ∑ xi2 pi
2
E ( x )
i =1
=1 (0.5) + x 22 (0.25 ) + 5 2 (0.1) +10 2 ( 0.1) + 20 2 (0.05 ) 37 = 0.5 + 0.25 x 22 + 2.5 +10 + 20 = 0.25 x 22 + 33 37 − 33 =16 x 22 = 2
37
0.25
=4
x 2 b)
µ =
n
∑ x p i
i
=1(0.5) + 4(0.25 ) + 5(0.1) +10 (0.1) + 20 (0.05 ) = 0.5 +1 + 0.5 +1 +1 = 4
i =1
µ = 4
σ 2
n
= ∑( x − µ ) 2 pi = E ( x 2 ) − µ 2 = 37 − 4 2 = 21 i =1
2
σ
= 21
σ =
21
= 4.5825
759.-
En una lotería se venden 200 boletos, de los cuales 2 son ganadores de 1000, ocho de 500, diez de 200, doce de 100 y sesenta de 10. Sea x una variable aleatoria que representa la ganancia de un jugador. a) Encuentre la distribución de probabilidad de la variable x. b) Obtenga la función de distribución acumulada de la variable x. c) Calcule la media, varianza y desviación estándar de la variable x. 200
Boletos
2………$1000 8………$500 10……..$200 12……..$100 60……..$10 108……$no ganan a) Xi
0
10
100
200
500
1000 113
Pi
0.54
0.3
0.06
0.05
0.04
0.01
b)
0 0.5 0.8 F ( x) = 0.9 0.95 0.99 1
si si si si si si si
≤0 0 < x ≤10 10 < x ≤ 100 100 < x ≤ 200 200 < x ≤ 500 500 < x ≤1000 x > 1000 x
c)
µ =
n
∑ x p i =1
σ 2
i
i
= ( 0)( 0.54 ) + (10 )( 0.3) + (0.06 )(100 ) + (0.05 )( 200 ) + (0.04 )( 200 ) + (0.01 )(1000 ) = 37
= ∑( xi − µ ) 2 pi = (0 − 37 ) 2 (0.54 ) + (10 − 37 ) 2 ( 0.3) + (100 − 37 ) 2 (0.06 ) + ( 200 − 37 ) 2 (0.05 ) i
+ (500 − 37 ) 2 (0.04 ) + (1000 − 37 ) 2 (0.01 ) = 20318 σ = σ 2
tabla:
=
20318 .2
.24
=142 .542
760.- Sea X una variable aleatoria discreta con distribución de probabilidad dad por la siguiente
Xi P1
2 0.2
3 0.4
4 0.3
5 0.1
a) Obtenga la función de distribución acumulada de la variable X. b) Calcule P(x < 3.5) y P(3 ≤ x < 4.5) a) F(x) = P(X ≤ x)= ∑ Py F(x) = P(2) = 0.2 F(x) = P(2) + P(3) = 0.6 F(x) = P(2) + P(3) + P(4) = 0.9 F(x) = P(2) + P(3) + P(4) + P(5) = 1
114
<0 2 ≤ x < 3 3 ≤ x < 4 4 ≤ x < 5 5 ≤ x
0 0.2 F ( x) = 0.6 0.9 1
x
b) P(x < 3.5) = 0.6 P(3 ≤ x < 4.5) = F(4.5) – F(3) = 0.9 - 0.6 = 0.3 764.
Sea x una variable aleatoria discreta con distribución de proporcionalidad dada por la siguiente tabla. xi pi
0 0.1
1 0.4
2 0.3
5 0.2
Calcule el coeficiente de sesgo. solucion :
µ =
n
∑( x p ) = (0)(0.1) + (1)(0.4) + (2)(0.3) + (5)(0.2) = 2 i
i
i =1
σ 2
= ∑( xi − µ ) 2 pi = (0 − 2) 2 (0.1) + (1 − 2) 2 (0.4) + ( 2 − 2) 2 (0.3) + (5 − 2) 2 (0.2) = 2.6 i
σ =
2 .6
= 1.612
sesgo
α 3
=
( x / 2 − µ ) 3 σ 3
3 [ ((0 +1 + 2 + 5) / 2) − 2) ] = = 1.909 3
(1.612 )
772.- Tenemos dos urnas, de las cuales la primera contiene n bolas blancas y 2n bolas negras, y
la segunda contiene 2n bolas blancas y n bolas negras. Se escoge al azar una urna 7y de ella se saca una bola. Si es blanca, se saca de la misma urna(sin reemplazo) otra bola y en caso contrario se saca una bola de la otra urna. Sea x una variable que representa el número de bolas blancas extraídas. ¿Para que valor de n se cumple E(x) < 1? Xi Pi
0 2/9
1 (27n-5)/(18(3n-1))
2 (5n-3)/(6n(3n-1))
115
5n −3 27 n − 5 10 n − 6 2 + (1) 27 n − 5 + ( 2) = + 9 18 (3n −1) 6n(3n −1) 18 (3n −1) 6 n(3n −1) 27 n 2 − 5 n + 30 n −18 27 n 2 + 25 n −18 = = 18 n(3n −1) 18 n(3n −1)
µ = ( 0)
E ( x )
=
57 n − 23 18 (3n −1)
<1
Para n = 1 822.- Según la
propiedad de la varianza para la cual v(x) = v(x-a) donde a = constante, calcula la varianza de la variable aleatoria x cuya función de densidad esta dada por. f(X) =
1/24 (x-1)4 exp[-(x-1)] para x >1 0 para las demás x. ∞
µ =
x
∫ 24 ( x −1)
4
e (1− x ) dx
=6
1
∞
2
σ
x 2
= ∫ 1
24
( x − 1) 4 e (1− x ) dx − µ 2
= 41 − (6) 2 = 5
Nota: Para resolver estas integrales se utilizo el Matlab
840.- Dada la v.a continúa x con función de probabilidad
senx 2 f ( x) = 0
si otra
0
≤ x ≤ π parte
Halle µ y σ 2
116
∞
π
∫
xsex
∫
µ = xf ( x)dx = −∞
2
0
π
2 ∫
xsexdx
=
0
1
π
2 ∫
usenudu
=
0
1
[ senx − x cos x] 2
π 0
π [ sen π − π cos π − sen 0 + 0 cos 0] = 2 2
1
=
∞ 2
σ
=
∫ x f ( x)dx − µ 2
2
=
−∞
=
=
dx
1
1 2
[2 xsex + (2 − x
π 2 = 4
2
cos x
1
π
]
π 2 − 4
π 2 x senxdx − 20 4 π 0
∫
2
=
=
π
π 2 u sendx − 20 4
1
∫
2
π 2 [2π sen π + (2 − π ) cos π − 2(0) sen 0 − (2 − 0) cos 0] − 2 4
1
2
−2
841.- Si
la f.d.p de una v.a.c es: c(4 x − x 3 ) f ( x) = 0
Halle a) El valor de c. b) µ y σ f ( x)
0 ≤ x
si otro
≤2
caso
= c(4 x − x 3 ) 2
∫
c ( 4 x − x ) dx 3
2 x 4 24 (0 ) 4 2 2 = c 2 x − = c 2(2) − − 2(0) + = 4c 4 0 4 4
igualamos
4c c
=1
=
1 4
b) 2
4 x 3 x 5 1 4(2) 3 2 5 16 − = − = 0.0666 = µ = ∫ xf ( x) dx = c ∫ ( 4 x − x ) dx = c 5 0 4 3 5 15 3 0 0 2 2 2 2 1 4 x 6 16 1 4 2 6 16 44 2 3 5 2 − = (2) − − = σ = c ∫ (4 x − x ) dx − µ = x − 4 6 0 15 4 6 15 225 0 2
2
2
σ =
4
44 225
Dada la variable aleatoria continua x, cuya f.d.p es f(x) = ∝ exp[2x-x2] , ∝ > 0, x E R. Encuentre la moda sin necesidad de calcular el valor de la constante ∝. 842.-
Para encontrar la moda derivamos la función de densidad e igualamos a cero para obtener así abscisas críticas. Cualquier abscisa crítica pude ser evaluada en la segunda derivada ya que si resulta
117
un número negativo, abra un máximo y si es positivo abra un mínimo y por lo tanto el valor de X que de un máximo es la moda. f ´( x)
(1 − x)e 1 − x x
2
= 2α (1 − x)e 2 x − x = 0 2 x − x 2
=0
=0
=1 2
= −2α e 2 x − x +4α (1 − x)e 2 x − x f ´´(1) = −2α e +4α (0)e = −2α e ∴ mo =1 f ´´( x)
2
843.- Una función importante es la llamada función de error erf(x) =
2
x
∫ e π
−t 2
dt
0
Esta función es impar, ya que erf(-x)=-erf(x). Si x x → +− ∞, erf ( x)tiemde → +− 1, respectiva mente . A demás es continua y erf(0)=0. Use esta información y haga
∫
esp ( − x ) dx
= ∫ e −x
2
dx
=
π erf ( x ),
2
para calcular:
∞
a)
∫ exp( − x
2
) dx
−∞ ∞
x 2 b) ∫ exp dx − 2 −∞
)
solución: a) ∞
∫
e − x dx 2
= 1.7724 ≈
π
= 2.506 ≈
2π
−∞
b) ∞
∫
e
2
− x2
dx
−∞
NOTA: Para resolver estas integrales se utilizo el matlab x
845.-
Exprese erf(
x
) mediante la integral de tipo
∫ φ (t )dt . [sugerencia: haga t = t(u) = u2 0
en la integral
2
x
e π ∫
−u 2
du ]
0
118
Solución:
=
erf ( x )
2
π
x
∫ e
−u 2
du
=
0
2
π
t ( x )
e−
∫ 2
t ( 0 )
t
t
dt
=
1
x
e−
∫
π 0
x
t
t
dt
= ∫ φ (t )dt 0
∴ φ (t )
=
e −t
π t
x 2 849.- Sea X una v.a. continua con f.d.p. f(x) = c exp. − 2 a) Determine el valor de la constante c. b) Determine P (-a < X < a) en términos de la función erf. 3 2 , 2
c) Exprese la f.d.a. F(x) en términos de la función erf, y obtenga entonces F (2) y F
dado que: erf (
2
) = 0.9545 y erf (1.5) = 0.9661 (correcto a cuatro dígitos decimales).
Para (a) ∞
∫ ce
x 2
−
2
∞
= c ∫ e
dx
0
1 =c
c
=
x 2
−
2
=c
dx
2π
0
2π
1 2π
Para (b) P ( −a < x < a)
=
1
a
∫
2π − a
e
− x
2
2
a 2
dx = erf
Para (c) F ( x)
=
F (2)
=
1
x
t 2 − 2 e dt
∫
2π −∞
1 2
1 = 1 + erf 2
; 2
x
[1 − erf 2 ] = 0.97725 119
3 2 1 = [1 + erf (1.5) ] = 0.98305 2 2
F
850.- Considere
la v.a.c. X, con f.d.p. f(x) =
c
1 + x2
, x ∈ R.
a) Obtenga el valor de la constante c. b) Determine la f.d.p. F(x). c) Demuestre que no existe valor esperado para esta variable aleatoria. Para (a) ∞
∞
∞
∞ x = c 1 tan −1 dx = c ∫ = c tan −1 x −∞ = c tan −1 ∞ − c tan −1 ( − ∞) = c tan −1 ∞ ∫ 2 2 1 −∞ 1 −∞1 + x −∞1 + x π π π π = c − − = c + = cπ 2 2 2 2
c
dx
[
]
1 = cπ c
=
1 π
Para (b) F ( x)
x
x
−∞
−∞
=
x
c
x
dt
∫ f (t )dt = ∫ 1 + t dt = c ∫ 1 + t 2
2
−∞
x 1 t = c tan −1 = c[ tan −1 t ] −∞ = c tan −1 x − c tan −1 ( − ∞) 1 −∞ 1
π π 1 1 1 = ctan −1 x − − = tan −1 x + = + tan −1 x 2 2 π 2 π Para (c) ∞
∞
∞ ∞ ∞ c xdx c 2 xdx c du c c ∞ 2 ∞ [ µ = ∫ xf ( x)dx = ∫ x [ ] = = = = = + dx c Lnu Ln ( x )] −∞ 1 − ∞ 2 2 2 ∫ ∫ ∫ u 2 2 2 2 + + + x x x 1 1 1 −∞ −∞ −∞ −∞ −∞
u = 1 + x2 du = 2xdx 1
=
c
2
[ Ln(1 + ∞ ) − Ln(1 + ( − ∞) )] = c [ ∞ − ∞] = π 2 [ ∞] = 2
2
2
1 2π
[ ∞] =
1 2π
[ ∞] = ∞ = ∞ 2π
1
851.- Dada la v.a.c. X con f.d.p.:
120
2(1 – x) si 0 < x < 1
f (x) =
0
en otro caso µ 3
Halle el coeficiente de sesgo γ = ∞
µ = E ( X )
=
σ
3
.
1
∫ xf ( x)dx = 2∫ x(1 − x)dx = 2∫ ( x − x
−∞
1
1
0
2
)dx
0
x 2 x 3 1 1 0 0 1 1 = 2 − = 2 − − − = 2 − 2 3 2 3 2 3 2 3 0
3 − 2 1 = 2 = 2 = 0.3333 6 6
µ 3
∞
1
∫ ( x − µ ) f ( x)dx = ∫ ( x − 0.3333 ) [ 2(1 − x )]dx = µ − 3 µ µ + 2µ
= E [( X − µ ) ] = 3
3
3
3
−∞ 1
= ∫ x
µ 3
3
(
2
3 1
0
1
)
2 1 − x dx
0
− 3(0.3333 ) ∫ x 2 2(1 − x )dx + 2( 0.3333 ) 3 0
1
= 2∫ ( x − x 3
µ 3
1
1
4
0
)dx − 2( 0.9999 ) ∫ ( x
2
− x 3 )dx + 0.074051
0
1
1
µ 3
x 4 x 5 x 3 x 4 = 2 − −1.9998 − + 0.0740518 = 0.5 − 0.4 − 0.6666 + 0.49995 + 0.0740518 4 5 0 3 4 0
µ 3
= 0.0074018 ∞
2
σ
= V ( X ) =
1
∫ x f ( x)dx − µ = ∫ x 2(1 − x )dx − ( 0.3333 ) 2
2
−∞
2
1
2
0
= 2∫ ( x 2 − x 3 )dx − ( 0.1111 ) 0
1
2
σ
x 3 x 4 = 2 − − 0.1111 = 0.6666 − 0.5 − 0.1111 = 0.0555 3 4 0
σ = 0.235584379 σ 3
γ =
= ( 0.235584379 µ 3 σ 3
=
)
= 0.013074932
0.0074018 0.013074932
852.- Sea
a
0
2
= 0.566106
la v.a.c. X con f.d.p.:
a
f(x) =
3
− x 2
Si x< a si x≥ a 121
Halle: a) el valor de a. a b) P < X < a 2 Para (a) a
a
a
∫
a
a
a
du
u x = a sen −1 = a sen −1 a −a a −a
x
dt
0 t x x = a sen −1 = asen −1 − asen −1 = asen −1 a 0 a a a
= a ∫ 2 2 2 − x −a −a −a a − u u=x du = dx a a = asen −1 − asen −1 − = asen −1 (1) − asen −1 ( −1) = 90a − ( − 90) a = 90 a + 90a = 180 a a a a
− x 2
2
dx
= a ∫
dx
a
2
1 = 180 a a
=
1 180
= 0.005555
Para (b) x
x
F(X)= ∫ f (t )dt = ∫ ∞
0
a a2
− t 2
dt = a
∫ 0
a2
− t 2
x
a a a 1 −1 a −1 2 F ( a ) − F = asen − asen = asen−1 (1) − asen −1 = 90a − 30a = 60a = 60 = a 2 a 2a 180 1 = 1 = 0.3333 3
853.- Sea X una v.a.c. con f.d.p. dada por:
x −
f(x) =
x 3
4
0
Si 0 ≤ x ≤ 2 en otro caso
Halle la mediana (me). F(X) =
1 2
122
x
x x s 3 4 s − s 3 1 1 4 s 2 s 4 3 ( ) − = = − = F ( X ) = ∫ f ( s )ds = ∫ s ds ds s s ds 4 2 − 4 = ∫ ∫ 4 4 4 4 0 −∞ 0 0 0 x
x
x
2 4 2 4 2 4 = 4 s − s = x − x = 8 x − x 16 4( 2) 16 0 2 16
8 x 2
− x 4
16 8 x 2
=
1 2
1 − x 4 = 16 2
8 x 2 − x 4 = 8 4 2 x − 8 x + 8 = 0 si w = x 2 w 2 − 8w + 8 = 0 w=
− ( − 8) ± ( − 8) 2 − 4(1)( 8)
()
21
Sustituyendo x 2 x
=4±2
=±
= x2 =
x1
x 2
= 8±
32 2
=
8±
( )
2 16 2
= 8± 4 2
2
= 4±2
2
por w
2
4 ±2 2
4 +2 2 4 −2 2
= 2.6131 = 1.0823
El valor que cae dentro del intervalo [0,2] es 1.0823=
4 −2 2
= x2 que es igual a la mediana.
m = 1.0823 e
Suponga que X y Y son dos variables aleatorias tales que E(X) = 5, E (Y) = 3. Si Z = X + 2Y, obtenga E (Z). 854.-
E (Z) = E(X + 2Y) = E(X) + E (2Y) = E(X) + 2E (Y) = 5 + 2(3) = 5 + 6 = 11 855.- Dado que E(X) = 2, E(Y) = 6, y suponiendo que Z = 3X + 4Y, halle E(Z).
123
Z = 3X + 4Y E (Z) = E (3X + 4Y) = E (3X) + E (4Y) = 3E(X) + 4E (Y) = 3(2) + 4(6) = 6 + 24 = 30
856.- Si X es una variable aleatoria discreta que solo puede tomar los valores X 1 = -1, X2 = 0 y X3 =1, con probabilidades de p 1, p2 y p3, respectivamente, y si se sabe además que E(X) = 0.1; E(X2) = 0.9, encuentre los valores de p 1, p2 y p3.
xi -1 0 pi p p2 1
1 P3
E(X) = μ = 0.1 E(X2) = σ2 = 0.9 p1 + p2 + p3 = 1 (-1)p1 + (0)p2 + (1)p3 = 0.1 = E(X) (-1)2 p1 + (0)2 p2 + (1)2 p3 = 0.9 = E(X2)
(1) (2) (3)
t 1 1 1 1 1 1 1 1 1 0 −1 − 0.1 1 0 −1 − 0.1 R + R R − R R − R R − R → 0 1 2 1.1 → 0 1 2 1.1 → 0 1 2 1.1 → −1 0 1 0.1 1 0 1 0.9 1 0 1 0.9 1 0 1 0.9 0 0 2 1 1 0 −1 − 0.1 R 1 0 −1 − 0.1 1 0 0 0.4 2 R + R → 0 1 0 0.1 → 0 1 0 0.1 0 1 0 0.1 0 0 2 1 0 0 1 0.5 0 0 1 0.5 p1 0.4 P = p 2 = 0.1 p 0.5 3 2
1
1
2
3
1
2
3
3
1
3
entonces p1
= 0.4, p 2 = 0.1, p3 = 0.5 857.-Una variable aleatoria discreta X tiene la siguiente distribución de probabilidad:
xi pi
4 6 x3 0.5 0.3 p3
Si se sabe que E(X) = 8, halle x3 y p3. 124
=100 % =1 P ( x ) = P (1) + P ( 2 ) + P (3 ) 1 = 0 .5 + 0.3 + P (3) P ( 3) =1 − 0 .5 − 0 .3 P ( 3) = 0.2 P ( x )
µ = E ( X )
n
= ∑ xi pi i =1
= 4( 0.5 ) + 6( 0.3) + x3 ( 0.2) 8 = 2 +1.8 + 0 .2 x3 0 .2 x3 = 8 − 2 −1.8 = 4.2 8
4 .2 0.2
x 3
=
x 3
= 21
858.- Sea
X una variable aleatoria discreta con la siguiente distribución de probabilidad: xi 1 2 3 pi p1 p2 p3
Si se sabe que E(X) = 2.3; E(X2) = 5.9, determine los valores de p1, p2 y p3. (4) (5) (6)
p1 + p2 + p3 = 1 (1)p1 + (2)p2 + (3)p3 = 2.3 = E(X) (1)2 p1 + (2)2 p2 + (3)2 p3 = 5.9 =E(X2)
125
1 1 1 1 1 1 1 1 1 0 −1 − 0.3 R + R R − R R − R 3 2.3 → 0 1 2 1.3 → 0 1 2 1.3 → 0 1 2 1.3 1 4 9 5.9 0 3 8 4.9 0 3 8 4.9 9 5.9 1 0 −1 − 0.3 1 0 − 1 − 0.3 2 0 0 0.4 R R − R 2 R + R 2 R −3 R → 0 1 2 1.3 → 0 1 0 0.3 → 0 1 0 0.3 → 0 0 2 1 0 0 2 0 0 2 1 1 1 0 0 0.2 R 1 0 0 0.2 2 → 0 1 0 0.3 0 1 0 0.3 0 0 2 1 0 0 1 0.5 p1 0.2 P = p 2 = 0.3 p 0.5 3 1 1 1 2 1 4
1 1
2
3
1
1
1
2
1
3
2
2
3
1
3
3
Entonces : p1
= 0.2, p 2 = 0.3, p3 = 0.5
Un lote de 10 potentes computadoras nuevas fue adquirido para los investigadores del instituto de Astronomía de la UNAM. De esas maquinas, 7 son Silicón Graphics y 3 son Power Mac. Se escoge un conjunto de dos computadoras al azar del lote, para asignarlas a dos nuevos profesores. Halle el número esperado de Power Mac en ese conjunto. 859.-
P (P.M.) =
3 10
µ = E ( X ) =
= Pi
n
∑ x p i =1
µ =
i
i
3 6 3 = 2 = = 10 10 5
3 5
Si las variables aleatorias X1, X2,......Xn toman solo valores positivos, son independientes y además están igualmente distribuidas, demuestre que: 860.-
E X 1
1 = , ( i = 1,2,..., n ) + X 2 + .... X n n X i
Definimos las variables aleatorias Y1, Y2,…, Yn como sigue: Y 1
=
X 1 X 1
+ X 2 + ... + X n
, Y 2
=
X 2 X 1
+ X 2 + ... + X n
,..., Y n
=
X n X 1
+ X 2 + ... + X n
Las variables Xi (i = 1,…n) están igualmente distribuidas. Se tiene que E (Y1) = E (Y2) =…=E (Yn) Además: 126
Y 1
+ Y 2 + ... + Y n =
+ X 2 + ... + X n =1 X 1 + X 2 + ... + X n X 1
Luego, E (Y1 +Y2 +…+ Yn) = E (1) = 1. Por consiguiente, E (Y1) + E (Y2) +…+ E (Yn) = nE (Yi) = 1, 1 es decir, E (Y i ) = . n
Suponga que se tienen siete variables aleatorias X1, X2,........ X7, las cuales solo toman valores positivos, además de que son independientes y están igualmente distribuidas. Obtenga el valor esperado de la variable aleatoria Z definida como sigue: 861.-
Z =
+ X 2 + X 3 X 1 + X 2 + ... + X 7 X 1
donde X 1
= X 2 + = X 3 = X 4 = X 5 = X 6 = X 7 = ( X i > 0)
para X i
=2
tenemos Z = Z =
2+2+2 2+ 2+2+2+2+2+ 2 3
=
6 14
=3 7
7
Se tienen dos variables aleatorias independientes X, Y. Si Var (X) = 5 y Var (Y) = 6, halle la varianza de la variable aleatoria Z = 3X + 2Y. 862.-
Var(X2) = c Var (Z) = Var (3X + 2Y) = Var (3X) + Var (2Y) = 9Var(X) + 4Var (Y) Var (Z) = 9(5) + 4(6) = 45 + 24 = 69 Var (Z) = 69 Si X es una variable aleatoria discreta que solo puede tomar dos valores: x1 y x2, cada uno de ellos con idéntica probabilidad, encuentre la varianza de X. 863.-
xi pi
1 2 1/2 1/2
127
σ 2
∑= x p = (1) 12 + ( 2) 12 = 0.5 +1.5 = 32 = V ( X ) = ∑( x − µ ) p
σ 2
= (1 −1.5) 2 (1) + ( 2 −1.5) 2 ( 2) = ( − 0.5) 2 + ( 0.5) 2 ( 2 ) = 0.25 + 0.5 =
σ 2
=
µ = E ( X ) =
n
i
i
i 1
2
i
i
3 4
3 4
Suponga que X y Y son variables aleatorias, tales que E(X) = a, E (Y) = b, Var (X) = σ , Var (Y) = σ 22 . Demuestre que Var (XY) = σ 12σ 22 + b 2σ 12 + a 2σ 22 . 864.-
2 1
Tenemos: Var (XY) = E [(XY)2] – [E (XY)]2. Pero, E [(XY)2] = E(X2) E (Y2). Puesto que X2 y Y2 son variables aleatorias independientes, si X y Y lo son. Por otra parte, [E (XY)]2 = [E(X) E (Y)]2 = a2 b2. Además: σ 12
De aquí que, E ( X 2 ) = a 2 + σ 12 ,
= E ( X 2 ) − a 2 y
E (Y ) = b 2
2
2
σ 2
= E (Y 2 ) − b 2 .
+ σ 22 .
Así que finalmente, se obtiene: Var ( XY ) = (a
2
+ σ 12 )(b 2 + σ 22 ) − a 2b 2 = σ 12σ 22 + b 2σ 12 + a 2σ 22
Si X es una variable aleatoria con media E(X) =µ, entonces para cualquier c ≠ µ se verifica que µ2 = E [(X -µ)2] < E [(X – c)2]. Demuestre esta interesante propiedad. A los momentos alrededor de cualquier punto distinto del origen (y de la media) se le suele llamar momentos ordinarios. De acuerdo con esta desigualdad, entonces el momento central de orden dos es el menor de todos los momentos ordinarios de segundo orden (incluyendo el momento inicial de segundo orden). Esto es otra forma de expresar el hecho de que la media es el valor que minimiza el error cuadrático medio. 865.-
E [(X – c)2] = E [(X – μ + μ – c)2] = E [(X – μ)2 + 2(X – μ) (μ – c) + (μ – c) 2] = E [(X –μ)2] + 2(μ –c) E [(X – μ)] + (μ – c)2. Sin embargo, E [(X – μ)] = 0. En consecuencia, queda probado que E [(X – c)2] = E [(X – μ)2] + (μ – c)2 = μ2 + (μ –c)2. De aquí que μ2 < E [(X –c)2]. Incidentalmente, si se hace c = 0, entonces se tiene una relación ya conocida: μ2´ = μ2 + μ2, esto es: Var (X) = E(X2) – [E(X)]2.
128
Una variable aleatoria X tiene media igual a 12 y varianza igual a 9. Estime el valor mínimo con la desigualdad de Chebyshev, de P (3 < X < 21). 866.-
μ- kσ = 12 – 3k = 3 μ + kσ = 12 + 3k = 21 En ambos casos se obtiene k = 3. De aquí que, P (μ – kσ < X < μ + kσ) = P (3 < X < 21) ≥ 1 867.-
entonces
1 2
k
=8 9
Una forma alternativa (y equivalente) del Teorema de Chébyshev establece que si k > 0,
P (| X − µ |< k ) ≥ 1 −
σ
2
2
k
. Dada una v. a. X en la que
σ 2 ( x)
= 0.004 , use esta forma de la
desigualdad de Chébyshev para proporcionar una cota inferior de P (| X − E ( x) |< 0.2) Solución: Datos del problema X
Desarrollo P (| X − e( X ) |< 0.2) ≥1 −
= σ 2 = 0.004
Desigualda d P (| X − µ |< k ) ≥ 1 − k = 0.2, P (| X − e( X ) |< 0.2)
σ 2 2
k
σ 2 ( 0 .2 ) 2
σ 2 ( 0 .2 ) 2 (0.004 ) P (| X − e( X ) |< 0.2) =1 − (0.04 ) P (| X − e( X ) |< 0.2)
=1 −
Su cota inferior es: ∴ P ( X − E ( x) |<0.2) =0.9
Para cualquier k > 0, un< tercera forma alternativa (y también equivalente) de la desigualdad de Chébyshev consiste en expresar la desigualdad: 868.-
P (| X − µ |≥ k ) ≤
σ
2
2
k { x ∈ R | X − µ |< k } y { x ∈ R | X − µ |≥ k }
Esto es fácil de probar, toda vez que los conjuntos forma una partición de R y tienen, por tanto, probabilidades complementarias. Para una v. a. X cualquiera (discreta o continua), use esta forma de la desigualdad de Chébyshev para estimar una cota inferior de la probabilidad de que X se desvíe de su valor esperado en no menos de dos desviaciones estándar. Un complejo dispositivo electrónico de una sonda espacial, fabricada por los ingenieros de la NASA, está compuesto de diez elementos que trabajan de manera independiente. La probabilidad de falla de cada elemento en el tiempo T es igual a 0.05. Mediante la desigualdad de Chébyshev, proporcione una cota inferior de la probabilidad de que el valor absoluto de la diferencia entre el número de elementos que fallan y el promedio (esperanza matemática) de falla en el tiempo T sea de: 869.-
a) Menos de 2 129
b) No menos de 2 Datos del problema
Desarrollo
n x n − x p q < 2) = ∑ x 0 p =0.05 10 10 1 10 −1 q =0.95 P ( X a < 2) = ( 0 . 05 ) * ( 0 . 95 ) (0.05 ) 2 * (0.95 )10 −2 + 1 2 n =10 P ( X a < 2) = 0.3898 + 0.5 = 0.8898 X a < 2 10 n x n − x X b ≥ 2 b) P ( X a ≥ 2) =1 − ∑ x p q 2 10 10 1 10 −1 ( 0 . 05 ) * ( 0 . 95 ) (0 .05 ) 2 * (0.95 )10 −2 P ( X a ≥ 2) =1 − + 1 2 P ( X a < 2) = 0.6102 − 0.5 = 0.11024 ∴ P ( X a < 2) = 0.8898 Su cota inferior es: P ( X b ≥ 2) = 0.11024 2
a ) P ( X a
870.- Una v. a. discreta X tiene la siguiente distribución de probabilidad:
xi pi
0.3 0.6 0.2 0.8
Aplique la desigualdad de Chébyshev para dar una cota inferior de P (| X − E ( x) |< 0.2 ) Datos del problema
Desarrollo µ = E ( x )
= 0.3 * 0.2 + 0.6 * 0.8 µ = E ( x ) = 0.54 σ 2 = ( 0.3 − 0.54 ) 2 ( 0.2) + (0.6 − 0.54 ) 2 ( 0.8) σ 2 = 0.0144 2
xi pi
0.3 0.6 0.2 0.8
P (| X
− E ( x ) |< 0.2) ≥1 − σ 2
P (| X
− 0.54 |< 0.2) =1 − 0.0144
P (| X
− 0.54 |< 0.2) = 0.64
k
0.04 P (| X − 0.54 |< 0.2) = 1 − 0.36
Su cota inferior es:
∴ P (|
X − 0.54 |< 0.2)
= 0.64
871.- Suponga la v. a. discreta X tiene la siguiente distribución de probabilidad:
xi pi
0.1 0.4 0.6 0.2 0.3 0.58
Proporcione una cota inferior de P (| X − E ( x) |<
10 ) , mediante la desigualdad de Chébyshev. 5
130
Datos del problema
Desarrollo µ = E ( x)
P (| X − E ( x) |<
10 5
) ≥1 −
σ 2 k 2
=0.1* 0.2 +0.4 * 0.3 +0.6 * 0.5 µ = E ( x) = 0.44 σ 2 = (0.1 −0.44 ) 2 (0.2) +(0.4 −0.44 ) 2 (0.3) +(0.6 −0.44 ) 2 σ 2 = 0.0364 P (| X −0.44 |<
10
P (| X −0.44 |<
10
P (| X −0.44 |<
10
Su cota inferior es: ∴ P (| X − 0.44 |<
10 ) 5
5 5 5
0.0364
)
=1 −
)
=1 −0.091
)
=0.909
0.4
= 0.909
872.- Una v. a. continua X tiene la siguiente función de distribución acumulada:
Determinar P (0
0 F ( x) = 3 / 4( x + 1) 1
Datos del problema
≤ −1 si −1 < x ≤ 1 / 3 six > 1 / 3 six
Desarrollo
=1/ 3) =1 P ( X = 0) = (3 / 4(( 0) +1) =3 / 4 P (0 < X <1/ 3) =1 −3 / 4 P (0 < X <1/ 3) =1/ 4 P ( X
0 F ( x) = 3 / 4( x + 1) 1 P ( 0 < X <1 / 3)
≤ si −1 < x six > 1 six
Su probabilidad es: ∴ P (0 < X <1 / 3) =1 / 4
Si la v. a. c. X tiene la f. d. a. F ( x) =1 / 2 +1 / π * tg −1 ( x), X ∈ R) (tomando el valor principal de tg −1 ( x) ), determine P (0 < X <1) 873.-
Desarrollo Datos del problema
131
Tomando solamente el valor principal de tg −1 ( x ) , para así obtener: =1) =1 / π * tg −1 (1) =1 / π * π / 4 =1 / 4 P ( X = 0) =1 / π * tg −1 (0) = 0 P (0 < X <1) =1 / 4 − 0 P (0 < X <1) =1 / 4 P ( X
F ( x) =1 / 2 +1 / π * tg −1 ( x), X ∈ P (0 < X <1)
Su probabilidad es: ∴ P (0 < X <1) =1 / 4
874.- La v. a. c. X tiene f. d. a. dada por: 0 F ( x) = 1 / 2 + 1 / π * sen −1 ( x / 2) 1
Determine P(-1
Datos del problema
≤ −2 − 2 < x ≤ 2 x > 2
parax
Desarrollo
= −1) =1 / 2 +1 / π * sen −1 ( −1 / 2) =1 / 3 P ( X =1) =1 / 2 +1 / π * sen −1 (1 / 2) = 2 / 3 P ( −1 < X < 1) = 2 / 3 −1 / 3 P ( −1 < X < 1) = 1 / 3 P ( X
0 −1 F ( x) = 1 / 2 + 1 / π * sen ( x / 2) 1 P ( −1 < X
<1)
Su probabilidad es: ∴ P ( −1 < X <1) =1 / 3
875.- Una v. a. c. X tiene la siguiente f. d. a.:
0 1 F ( x) = x − 1 2 1
parax ≤ 2 2 < x ≤ 4
x > 4
Encuentre la probabilidad de que X asuma un valor: 132
a) b) c) d)
menor que 1/5 menor que 3 no menor que 3 no menor que 5 Datos del problema
Desarrollo
≤1/ 5) =0 b) P ( X ≤3) =1 / 2(3) −1 P ( X ≤3) =0 c) P (3 ≤ X ≤ 4) =1 −1 / 2 P (3 ≤ X ≤ 4) =1 / 2 d ) P (5 ≤ X ≤6) =1 −1 P (5 ≤ X ≤ 6) = 0 a ) P ( X
0 1 F ( x) = x − 1 2 1
parax ≤ 2 2 < x ≤ 4
x > 4
≤1 / 5) P ( X ≤3) P (3 ≤ X ≤ 4) P (5 ≤ X ≤6) P ( X
∴ P ( X ≤1/ 5) = 0 P ( X ≤3) = 0 Su probabilidades son: P (3 ≤ X ≤ 4) =1/ 2 P (5 ≤ X ≤ 6) = 0 876.- Una v. a. c. X, definida para toda x ∈ R 4α f ( x) = x . Determine el valor constante de α . e + e − x
Datos del problema 4α f ( x ) = x e + e − x
De la definición de una f. d. p.
Desarrollo ∞
∫ e
4α
+ e − x
x
−∞
∞
4α
∫ e
x
−∞ ∞
∫
f ( x ) dx
−∞
=1
tiene la f. d. de probabilidad dada por
dx
dx
+ e − x
=1 =1
La evolución obtenida de la integral es: 4α [tg −1 (e x )] −∞ ∞=1 4α [π / 2] =1
Despejando α obtenemos: α =
1 2π
133
La constante es:
∴α =
1 2π
877.- La v. a .c. X tiene f. d. p. definida por: f ( x)
Halle el valor de la constante c. Datos del problema f ( x)
csen 2 x = 0
0 < x < π / 2
csen 2 x = 0
c.o. p.
Desarrollo
0 < x < π / 2 c.o. p.
De la definición de una f. d. p.
π / 2
∫ csen 2 xdx =1 0
π / 2
∫ sen 2 xdx =1
c
0
La evolución obtenida de la integral es: c [ −cos 2 x ] π / 20 =1
∞
∫
f ( x ) dx
=1
−∞
2 c
2
[1 +1] =1
Despejando c obtenemos: c =1 La constante es: ∴c =1
878.- Una v. a. c. X tiene f. d. p. definida por:
Determine el valor de la constante k.
ktg −1 x 0 < x <1 f ( x) = c.o. p. 0
Datos del problema
Desarrollo 1
ktg −1 x 0 < x <1 f ( x) = c.o. p. 0
∫ ktg
−1
=1
−
=1
xdx
0
1
∫
k tg 1 xdx
De la definición de una f. d. p. ∞
∫ f ( x)dx =1
0
La evolución obtenida de la integral es: ln( x 2 +1) 1 k [ xtg −1 − ] 0 =1 2
−∞
k [
π ln( 2) − ] =1 4 2
Despejando k obtenemos: π − 2 ln( 2) k = ≈ 0.438825 4
134
La constante es:
∴k ≈ 0.438825
789.- Una v. a. c. V tiene la siguiente f. d. p.:
1 v 2 f (v) = k 1 − 2 c 0
si | v |< c
c.o. p.
Donde c es una constante positiva fija. Determine: a) b) c) d) e)
El valor de la constante k para que, en efecto, f(v) sea una densidad de probabilidad. Halle el valor esperado de la v. a. V. La varianza de v. a. V. Calcule la f. d. a. F (v). Encuentre P(0 < V < c/2) f) Si W = 2mv 2 donde m > 0 es una constante, determine el valor esperado de la v. a. W. Datos del problema
Desarrollo c
1 v 2 f (v) = k 1 − 2 c 0 W = 2mv
si | v |< c
c.o. p.
2
De la definición de una f. d. p. ∞
∫
f ( x ) dx
−∞
1 a) k −c
∫
dv
=1 v 2 1− c 2 La evolución obtenida de la integral es: 1 1 | c | * sen −1 (| | *v −cc = 1 k c −1 k [c * sen | 1 / c | *c] − [| c | * sen −1 | 1 / c | v] Despejando k obtenemos: k = cπ
=1
c
b) µ = E (v) =
v
∫
dv
v 2 −c cπ 1 − c 2 La evolución obtenida de la integral es:
[
]
1 | c | c 2 − v 2 −cc cπ 1 µ = E (v ) = − | c | c2 − c2 cπ µ = E (v ) = 0
µ = E (v ) =
{ [ c
2
c)σ
= V (v) = ∫
] − [− | c |
v2
c2
− c 2 ]}
dv
v 2 c La evolución obtenida de la integral es: −c
cπ 1 −
2
135
σ 2
= V (v) =
[(c sen | 1 / c | v) − v 2π
c2
− v 2 ] −cc
σ 2
= V (v) =
{[(c sen | 1 / c | c) − v 2π
c2
− c 2 ] − [(c 2
σ
2
c
2
c
2
c2
= V (v) =
2
v
c) F (v) =
1
∫
dv
v 2 −c cπ 1 − c 2 La evolución obtenida de la integral es: t 1 v −1 1 c * cπ + 2 sen | | *v −c 2π c 1 1 c * cπ + 2 sen −1 | 1 −1 1 c * cπ + 2 sen | | *v − 2π c c 2π F (v) =
1 2
+
1 v sen −1 π c
Obtenemos que la f. p. a. es:
1 + 1 sen −1 v c 2 π
F (v) =
e)
P (0 < V <
c
2
| v |< c
)
Evaluamos la f. p. a. en los intervalos que nos indica la probabilidad que nos interesa: P (V = 0) = 1 / 2 P (V =
c
2
) = 2/3
c ) = 2 / 3 −1 / 2 = 1 / 6 2 c ) = 1/ 6 2 que W = 2mv 2 obtenemos
P (0 < V < P (0 < V <
Debido a esperanza de W es:
que la
c
f ) E (W )
= 2 ∫ v 3 mdv 0
La evolución obtenida de la integral es: E (W )
= 2 mv 4 4
c 0
Obteniendo así que E(W) es: E (W )
= 1 mc 4 2
La constante es: ∴k = cπ La esperanza matemática es: ∴ µ = E (v ) = 0
136
La varianza es: ∴σ 2
= V (v) = c
2
2
1 + 1 sen −1 v c 2 π
La f. p .a. es: F (v) =
| v |< c
c
La probabilidad es: P (0 < V < ) = 1 / 6 2 1 4 La esperanza de W es: E (W ) = mc 2
Los profesores de una Universidad de México tienen dificultades en encontrar un sitio desocupado para estacionar su automóvil dentro del campus, de modo que estacionan el auto en lugares diferentes cada día. Suponga que para cierto profesor de probabilidad y estadística de ese campus, el tiempo (en min.) que tarda en recorrer caminando la distancia desde donde le haya tocado dejar su automóvil hasta su salón de clases, es una v. a. c. X con f. d. p. dada por: 880.-
5120( x − 1) f ( x) = (4 x − 3)6 0
para
x ≥ 1
para
x ≤ 1
Calcule (si existe): a) El tiempo esperado en llegar a su salón de clases desde donde haya dejado su automóvil b) La moda c) La media d) Desviación estándar e) Dibuje un croquis aproximado de la grafica de f(x), donde x se mide en min. Datos del problema
5120( x − 1) f ( x ) = (4 x − 3)6 0
Desarrollo ∞
para
∫
x a) E ( x) = x 1
para
x La evolución obtenida de la integral es:
Ecuaciones que utilizaremos: E ( X ) V ( X )
= =
∞
∫ x * f ( x)dx
−∞ ∞
∫ ( x
2
* f ( x)dx ) − E ( x 2
−∞ x
me
=
∫
f (t )dt
−∞
mo
=
d dx
=1
2
( f ( x) ) = 0
5120 ( x −1) dx (4 x − 3) 6
−8(160 x 2 −180 x + 27 ) E ( x ) = 3( 4 x −3) 5 E ( x ) ≈18 .667 min
∞ 1
5120 ( x −1) 6 dx (4 x − 3) De la cual obtenemos: b)
d
−5120 (20 x − 21) =0 ( 4 x − 3) 7 −5120 ( 20 x) −5120 ( −21) = 0 107520 102400 m o =1.05
x
=
x
c)
me
=
1
∫ f (t )dt = 2
−∞
137
De la evaluación se obtiene: x 5120 (t − 1) F ( x) = ∫ dt (4t − 3) 6 1 16( 20 x −19 ) F ( x) = 16 − (4 x − 3) 5 x 16 (20t −19) 1 = me = ∫ 16 − dt (4t − 3)5 2 1 8(10 x − 9) + 16 x − 56 = 1 me = 4 3(4 x − 3) 3 2 Obtenemos los ceros de la ecuación anterior obteniendo: me
=1.12284 ∞
d )
V ( x)
= ∫ x2 1
5120 ( x −1) ( 4 x − 3) 6
dx
La evolución obtenida de la integral es: − (1920 x 3 − 2720 x 2 +1020 x −153 ) V ( x) = 3( 4 x − 3) 5 V ( x) ≈ 22 .33 min −18 .667 min σ ≈ 1.9139 e) El croquis de f(x)
∞ 1
La esperanza es: E ( x ) ≈18 .667 min La moda es: m o =1.05 La media es: me =1.12284 La desviación estándar es: σ ≈ 4.72582
881.- Con referencia al
probl. 880, calcule:
a) La f. d. a. F(x) b) La probabilidad de que el profesor tarda más de 2 min. en llegar a su salón de clases, desde el sitio donde haya dejado su automóvil. c) La probabilidad de que tarde más de 2 min. pero menos de 3, en llegar a su salón de clases desde el punto donde haya estacionado su automóvil Datos del problema
Desarrollo
138
5120( x − 1) f ( x) = (4 x − 3) 6 0
x
para
x a) F ( x) =
5120 ( x −1)
∫ (4 x − 3)
6
dx
1
x La evolución obtenida de la integral es: 16(20 x − 19) x F ( x) = 16 − 1 De la definición de una f. d. p. (4 x − 3) 5 para
16 − 16(20 x − 19) F ( x) = (4 x − 3) 5 0
x
F ( x)
= ∫ f (t )dt −∞
> 2) P (2 ≤ X ≤ 3) P ( X
b)
P ( X
P ( X
> 2) =16 −
para
x ≥ 1
para
x ≤ 1
16 ( 20 ( 2) −19 ) ( 4( 2) −3) 5
> 2) =15 .8925
) = 16 − 16 ( 20 (3) −19 − 16 5 − ( 4 ( 3 ) 3 ) P ( 2 ≤ X ≤ 3) = 15 .9889 −15 .8925 P ( 2 ≤ X ≤ 3) = 0.09642 c)
P ( 2 ≤ X ≤ 3)
16 − 16(20 x − 19) 5 La f. d. a. es: F ( x) = (4 x − 3) 0
para
x ≥ 1
para
x ≤ 1
La probabilidad es: P ( X > 2) =15 .8925 La probabilidad es: P ( 2 ≤ X ≤ 3) = 0.09642 882.-Sea X la v. a. c. con f. a. p. dada por:
1 2 F ( x) = 1 0 Determine la mediana o mediana de X, si es que hay Datos del problema
1 2 F ( x) = 1 0
0 ≤ x ≤ 1
2.5 ≤ x ≤ 3 c.o. p.
Desarrollo x
F ( x)
2.5 ≤ x ≤ 3 c.o. p.
0 ≤ x ≤ 1
= ∫ 12 dt = 0
me
=
x 2
=
2
= ∫ 1dt =
1
= x −2.5 =
1
F ( x)
2.5
x
me
=
1
∫ f (t )dt = 2
me
2
1
x
De la definición de una f. d. p.
1
2 2
−∞
Obtenemos los cero de la ec. Obtenida anteriormente: 139
me me
=1 =3
Existen una infinidad de medias, solo se expresan algunas de las que existen entre x ∈[1, 2.5] es adecuada para ser me de X estos intervalos que existen entre ∀
883.-
Si X es una v. a. c. con función generatriz de momento
t ∈8 − ∞, ∞) ,
determine el valor esperado y la varianza de X
Datos del problema ψ (t ) =
ψ (t ) =
3 t 1 −t e + e , 4 4
para
Desarrollo
3 t 1 −t e + e 4 4
3 et + 1 e−t t =0 4 dt 4 Forma general para obtener los 1 3 µ 1, = et − e−t t =0 momentos normales de X: 4 4 r
µ r ,
=
d
dt r
M x (t ) t =0
1
d
µ
=
µ 1,
= −
µ 1,
= E ( x) = 1
, 1
1
3 4
1 4 2
3 et + 1 e −t t =0 4 dt 4 1 3 µ 2, = et + e −t t =0 4 4 2
d
µ 2,
=
µ 2,
= +
µ 2,
= V ( x) = µ 2, − ( µ 1, )
2
3 4
1 4
2
2
µ
1 = V ( x) = 1 − 2
µ 2,
= V ( x) =
, 2
,
La esperanza es: µ 1
3 4
= E ( x) = 1
2 3 , La varianzaza es: µ 2 = V ( x) = 4
Si la media, varianza y función generatriz de momentos de una v. a. X están dadas, ∞ , ∞), y si Y es otra v. a. cuya función generatriz de respectivamente, por µ , σ 2 ,ψ 1 (t ) , para t ∈(− momentos está dada por ψ 2 (t ) = e c (ψ −1) , − ∞ < t < ∞ , donde c es una constante positiva, exprese la media y la varianza de Y en términos de la media y la varianza de X. 884.-
1
140
Datos del problema , ψ (t ) = µ 1
Desarrollo ψ 2 (t ) = e c ( µ −1)
(t ) = σ 2 1 ,,
ψ
ψ 2 (t ) = e
c (ψ 1 −1)
µ 1,
= M x (t ) t =0
µ 1,
=
d 1 1
dt
(e
c ( µ −1)
)=
t 0
=c Forma general para obtener los ψ 1,(t ) = µµ 1, momentos normales de X: ψ 1,(t ) = µ c r d µ r , = r M x (t ) t =0 ψ 2 (t ) = e c ( µ −1) dt µ 2, = M x (t ) t =0 µ 1,
, 2
µ
=
d 2 2
dt
(e
c ( µ −1)
)
t =0
= c2 ψ .,1(t ) = c 2σ 2 − (c µ ) 2 ψ .,1(t ) = c 2 (σ 2 − µ 2 ) µ 2,
La esperanza es: ψ 1,(t ) = µ c La varianzaza es: ψ .,1(t ) = c 2 (σ 2
− µ 2 )
887.- Si la v. a. c. X tiene f. d. p. dada por : cx 2e−bx f ( x) = 0
0
≤ x < ∞ x
<0
donde b es un parámetro positivo: a) Encuentre el valor de la constante c b) Calcule P(0
cx 2e−bx f ( x) = 0
Desarrollo 0
≤ x < ∞ x
<0
∞
a)
f ( x)
= ∫ cx 2e−bxdx = 1 0
La evolución obtenida de la integral es:
De la definición de una f. d. p.
141
∞
− c(b 2 x 2 + 2bx + 2)e −bx
∫ f ( x)dx =1
b
−∞
=
0
∫ f (t )dt
b3
−∞
P ( 0
=1
[− c(2)e ] = 1 0−
x
F ( x )
∞ 0
3
≤ X ≤1 / b)
c=
b3
2 ∞
b) F ( x) =
b3
∫ 2 x e 2
−bx
dx
0
(2ebx − b 2 x 2 − 2bx − 2)e −bx F ( x) = 2 0 P (0 ≤ X ≤ 1/ b) ≈ 0.080301 La constante c es: c =
b
0 ≤ x < ∞ x < 0
3
2 La probabilidad es: P (0 ≤ X ≤1 / b)
≈ 0.080301
Eje. Supóngase que un fabricante produce cierto tipo de aceite lubricante que pierde alguno de sus atributos especiales si no se usa dentro de cierto periodo de tiempo. Sea X el número de unidades de aceite pedidas al fabricante durante cada año. (Una unidad es igual a 1000 galones) Supongamos que X es una variable aleatoria continua, distribuida uniformemente en [2, 4]. Por lo tanto la fdp tiene la forma, 1 f ( x) = 2 0
2 ≤ x
≤4
cualquier otro valor
Supongamos que por cada una de las unidades vendidas se obtiene una utilidad de $300, mientras que cada una de las unidades no vendidas (durante un año determinado) produce una pérdida de $100, ya que una unidad no utilizada tendrá que ser descartada. Suponiendo que el fabricante debe decidir pocos meses antes del comienzo de cada año cuánto producirá, y que decide fabricar Y unidades (Y no es una variable aleatoria, está especificada por el fabricante) Sea Z la utilidad por año. Aquí Z es evidentemente una variable aleatoria puesto que es una función de la variable aleatoria X. Específicamente, Z = H(X) en donde 300 Y 300 X +( −100 )( Y − X ),
H ( X ) =
≥ Y , X < Y .
si X si
A fin de obtener E(Z), tenemos de ∞
∫ −∞ H ( x ) f ( x )dx
E ( Z ) =
=
1 2
4
∫ H ( x )dx 2
142