´ Area de Ciencia Cie nciass B´ asicas asi cas
ESPECIALIZACION EN ESTADISTICA APLICADA Universidad del Norte
Gu´ıa resumida sobre
M´ etodos Estad´ısticos Teor Teor´ıa y pr´ pr ´ actica
´ s Solano Dr. rer. nat nat Humberto Humberto LLinas a Profesor de la Universidad del Norte
Barranquilla - Colombia 2005
Contenido
1 Estad´ıstica descriptiva 1.1 Introd Introducc ucci´ i´ on . . . . . . . . . 1.2 Medidas estad´ısticas . . . . . 1.3 An´ali a lisis sis expl exploorato atorio rio de dato datoss Ejercicios . . . . . . . . . . . .
. . . .
4 4 6 9 11
. . . . .
20 20 20 22 27 27
3 Distribuciones de probabilidad 3.1 Variables aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . 3.2 Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31 31 32 33
4 Distribuciones especiales 4.1 La distri distribuc buci´ i´ on uniforme (discreta) . . . . . . . . . . . . . . . . . . . . 4.2 La distri distribuc buci´ i´ on binomial . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 La distri distribuc buci´ i´ on de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 La distri distribuc buci´ i´ on hiper pergeom´etrica . . . . . . . . . . . . . . . . . . . . . . 4.5 4.5 Las Las dis distr trib ibuc ucio ione ness bin binom omia iall neg negat ativ ivaa y geo geom m´etri e trica ca . . . . . . . . . . . . 4.6 La distri distribuc buci´ i´ o n uniforme (continua) . . . . . . . . . . . . . . . . . . . . on 4.7 La distri distribuc buci´ i´ on normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.8 Las Las dis distrib tribuc ucio ion nes gamm gammaa y expo xponenc nencia iall . . . . . . . . . . . . . . . . . 4.9 Resu Resum men de las dist distri ribu buci cion onees espe especciale ialess . . . . . . . . . . . . . . . . .
36 36 36 37 39 41 42 42 45 48
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
2 Probabilidad 2.1 2.1 Expe Experi rime ment ntos os,, esp espac acio ioss mue muest stra rale less y even evento toss . . . 2.2 T´ecnicas de conteo . . . . . . . . . . . . . . . . 2.3 Introd Introducc ucci´ i´ o n a la probabilidad . . . . . . . . . . on 2.4 Independencia . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
CONTENIDO
2
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
5 Distribuciones conjuntas 5.1 Vectores aleatorios discretos . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Vectores aleatorios continuos . . . . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54 54 56 57
6 Distribuciones muestrales 6.1 Conceptos b´asicos . . . . . . . . . . 6.2 6.2 Dist Distri ribu buci cion ones es mues muestr tral ales es de algu alguno noss 6.3 Aplicaciones . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . .
. . . .
61 61 62 63 66
. . . . . .
71 71 72 72 74 77 78
. . . .
84 84 86 91 94
. . . . . . . . .
97 97 97 98 98 99 99 99 100 100
. . . . . .
101 101 102 103 103 104 105
. . . . . . . est estad ad´´ısti ıstico coss . . . . . . . . . . . . . .
. . . .
7 Intervalos de confianza 7.1 7.1 Esti Estima maci ci´´on . . . . . . . . . . . . . . . . . . . . . . 7.2 Intervalos de confianza . . . . . . . . . . . . . . . 7.3 7.3 Inte Interv rval alos os de confi confian anza za para para algu alguno noss pa par´ amet a metro ross . . 7.4 Aplicaciones . . . . . . . . . . . . . . . . . . . . . 7.5 Determ Determina inaci´ ci´ on on del tama˜ n o de una muestra . . . . no Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . 8 Prue Prueba bass de de hip hip´ ´ otesis 8.1 Concep Conceptos tos de de la prue prueba ba de hip´ hip´otesis . . . . . . 8.2 8.2 Prue Prueba bass par paraa alg algun unos os par´ par´ amet a metro ross pobl poblac acio iona nale less 8.3 Aplicaciones . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . . . . . . . . . . . .
A Gu´ıa r´ apida para trabajar con Statgraphics A.1 A.1 An´ An´alis a lisis is de un solo solo conj conjun unto to de dato datoss . . . . . . . . . A.2 An´ alisis alisis simult´ simult´ aneo aneo de dos dos o m´ m´as as conjunt conjuntos os de datos A.3 Gr´ aficos aficos de dispersi´on . . . . . . . . . . . . . . . . . A.4 Diagramas Diagramas de prese presentaci ntaci´´on . . . . . . . . . . . . . . A.5 A.5 Variab riable less num num´´eric e ricas as mult multid idim imen ensi sion onal ales es . . . . . . . . A.6 Distribuciones de probabilidad . . . . . . . . . . . . A.7 Inf Inferen erenccias ias bas basadas adas en una una so sola mues muestr traa . . . . . . . A.8 Inferencias basadas en dos muestras . . . . . . . . . A.9 Bondad de ajuste . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
B Gu´ıa r´ apida para trabajar con SPSS B.1 Definic Definici´ i´ o n de las variables . . . . . . . . . . . . . . . . . . . . . . . on B.1.1 Transfor ransformaci´ maci´ o n de una variable . . . . . . . . . . . . . . . . on B.1.2 B.1.2 Recodifi Recodificac caci´ i´ on de una Variable . . . . . . . . . . . . . . . . B.1.3 Filtrado de datos . . . . . . . . . . . . . . . . . . . . . . . B.2 An´ali a lisis sis expl exploorato atorio rio de dato datoss . . . . . . . . . . . . . . . . . . . . . B.3 B.3 Infe Infere renc ncia ia sob sobre una una o m´ as a s pobl poblac acio ione ness . . . . . . . . . . . . . . . . C Uso de la calculadora en la estad´ıstica
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
106
Contenido
D Ap´ endice de tablas D.1 La funci´ on de distribuci´o n binomial . . . . . . . . . . . . . . . . . . . . D.2 La funci´ on de distribuci´o n de Poisson . . . . . . . . . . . . . . . . . . . D.3 La funci´ on de distribuci´o n n o r m a l . . . . . . . . . . . . . . . . . . . . . D.4 La funci´ on gamma incompleta . . . . . . . . . . . . . . . . . . . . . . D.5 Valores cr´ıticos para la distribuci´on t de Student . . . . . . . . . . . . . D.6 Valores cr´ıticos para la distribuci´o n chi-cuadrada . . . . . . . . . . . . . D.7 Valores cr´ıticos para la distribuci´on F . . . . . . . . . . . . . . . . . . . D.8 Algunos n´ umeros aleatorios uniformemente distribuidos . . . . . . . . .
3
108 108 110 112 114 115 116 118 122
Bibliograf´ıa & Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
CAP´ITULO
1
Estad´ıstica descriptiva
1.1
Introducci´ on
e usted necesita conocer estad´ıstica? 1. ¿Por qu´ Tres razones fundamentales: (a) Presentar y describir la informaci´on en forma adecuada. (b) Inferir conclusiones sobre poblaciones grandes bas´ andose solamente en la informaci´on obtenida de subconjuntos de ellas. (c) Utilizar modelos para obtener pron´ osticos confiables. 2. T´erminos Poblaci´on, muestra, datos, par´ametro, estad´ıstico, Censo.
etodos estad´ısticos . 3. M´ M´etdos estad´ısticos = estad´ıstica descriptiva + estad´ıstica inferencial. on de datos. 4. Organizaci´ Por el tipo de dato, de acuerdo a escalas de medidas, mediante tablas y mediante representaciones gr´aficas. on de datos de acuerdo al tipo . 5. Organizaci´ Existen dos tipos de datos: categ´ oricos (o cualitativos) y num´ericos (cuantitativos). Estos u ´ltimos se clasifican a su vez en discretos y continuos. on de datos de acuerdo a escalas de medidas . 6. Organizaci´ ´s [11] o Weimer [23] para Nominal, ordinal, de intervalo y de raz´on. Ver LLina mayores detalles. on de datos mediante tablas . 7. Organizaci´ Se necesita concepto: Frecuencias absoluta, relativa, acumulada y acumulada relativa. Dos tipos de tablas:
1.1 Introducci´on
5
(a) Tablas de frecuencias agrupadas . Tablas con datos + frecuencias. Ejemplo 1.1.1 La tabla de frecuencias (no agrupada) para el conjunto de datos 3 5 7 6 4 3 7 6 6 7 5 7 es Dato Frecuencia
3 2
4 1
5 2
6 3
7 4 ◭
(b) Tablas de frecuencias no agrupadas . Intervalos de clase, l´ımites de clase, fronteras de clase, Marcas de clase, amplitud w . Para hallar n´umero de clases c : Regla de Sturges ( c = (3, 3) log n + 1) o c = n.
√
Ejemplo 1.1.2 (Datos con un solo lugar decimal) Forme una distribuci´on de frecuencias considerando los siguientes datos: 8,9 6,8
10,2 9,5
11,5 11,5
7,8 11,2
10,0 14,9
12,2 7,5
13,5 10,0
14,1 6,0
10,0 15,8
12,2 11,5
SOLUCION: Paso 1. Paso 2. Paso 3. Paso 4.
El rango R es 9,8. Por regla de Sturges, c = 5 (aproximar al entero m´as cercano). = 2 (aproximar al entero siguiente). w = R c Como la unidad de medida es 0,1 (por tener los datos un s´ olo lugar decimal) y como el “punto medio” de cada unidad de medida es 0,05, entonces, Frontera inf. de primera clase = dato menor − 0,05 = 5, 95. En consecuencia, la tabla es
Clase 5,95 - 7,95 7,95 - 9,95 9,95 - 11,95 11,95 - 13,95 13,95 - 15,95
Cuenta |||| || ||||| ||| ||| |||
Frecuencia 4 2 8 3 3
Marcas de clase X 6,95 8,95 10,95 12,95 14,95
on de datos mediante representaciones gr´ aficas . 8. Organizaci´ Hay gr´aficas de varios tipos, entre los cuales se encuentran los siguientes: el diagrama circular o de pastel, el pictograma, el diagrama de barras, el diagrama de caja y bigote, el histograma, el pol´ıgono (de frecuencia o de frecuencias relativas), la ojiva (o pol´ıgono de frecuencias acumuladas o pol´ıgono de frecuencias relativas acumuladas) y el diagrama de tallo y hojas.
1.2 Medidas estad´ısticas
6
9. Histograma
) 40 ) % % n n30 e e ( ( . . l l e20 e r r . . c c e10 r e F r F
20
. . 16 m m u u c c 12 a a . . c8 c e e r r F F 4
0 5 ,95
7, 95
9, 95
11, 95
1 3, 95
15 ,95
0 5, 95
7, 95
Fronteras Fronteras
(a) Histograma de frecuencias relativas
9, 95
11, 95
13 ,95
15 ,95
Fronteras Fronteras
(b) Histograma de frecuencias acumuladas
10. Pol´ıgono y ojiva .
8
20
. m .16 u m c u12 c a . a . c c 8 e e r r F F 4
s a i s6 c a i n e c n 4 u e c u c e e r r F 2 F 0 4,95
0 6,95
8,95 10,95 12,95 14,95 16,95 Marcas de Marcas declase clase
(c) Pol´ıgono de frecuencias
1.2
5, 95
7, 95
9, 95
11, 95
13 ,95
15 ,95
Fronteras superiores Fronteras superiores
(d) Ojiva
Medidas estad´ısticas
1. Medidas de tendencia central o de centralizaci´on. La media aritm´etica (ponderada), la mediana, la moda, el rango medio (promedio de los datos mayor y menor), la media geom´ etrica, la media arm´onica y la media ´ s [11] se hace una descripci´ cuadr´atica. En LLina on completa de estas medidas.
on relativa. 2. Medidas de colocaci´on o de posici´ ´s [11] se hace una descripci´on La mediana, los percentiles, deciles y . En LLina completa de estas medidas. 3. Medidas de dispersi´on o de variabilidad. El rango (diferencia entre datos mayor y menor), el rango intercuartil (diferencia entre el tercer y el primer cuartil), la varianza, la desviaci´on est´andar y el coeficiente de varianci´on de Pearson (desviaci´on est´andar dividida entre la media, multiplicada por 100 por ciento). En LLin´as [11] se explican con detalles todas estas medidas.
1.2 Medidas estad´ısticas
7
4. Aplicaciones de la desviaci´on est´andar poblacional . Se utilizan dos reglas: alida para cualquier poblaci´ on). (a) Regla de Tchebychev (v´ 2 Por lo menos el 100(1 − 1/k )% de los valores de la poblaci´on se encuentran en el intervalo [µ − kσ; µ + kσ ].
1,5 k 2 100(1 − 1/k )% 55,6%
2 75%
2,5 84%
3 88,9%
3,5 91,18%
4 93,7%
alida s´ olo para poblaciones de forma acampanada) . (b) Regla emp´ırica (v´ El 68% de los datos de la poblaci´on se encuentran en [µ − σ; µ + σ ] y el 95% de los datos en [µ − 2σ; µ + 2σ ]. Ejemplo 1.2.1 Un inspector de control de calidad selecciona aleatoriamente 14 clavos de una caja de 100 clavos de 1 pulgada (una pulg.=2,54 cm). Las longitudes, en cm, son 2, 54
2, 55
2, 50
2, 60
2, 51
2, 52
2, 70
2, 40
2, 36
2, 53
2, 54
2, 52
2, 51
2, 55.
±
Si el inspector decide excluir los clavos que est´an fuera del intervalo x 2s, entonces, a lo m´as el 25% estar´an fuera del intervalo. ¿Se verifica la regla de Tchebychev? ◭
5. Coeficiente de variaci´on de Pearson. CV =
desviaci´ on est´andar de los datos media aritm´etica de los datos
·
100%.
Ejemplo 1.2.2 Los siguientes datos representan el promedio de millas por gal´ on diario por cinco d´ıas para un determinado auto: 20, 25, 30, 15, 35. Por consiguiente, el tama˜ no relativo de la “dispersi´on media alrededor de la media” con relaci´o n a la media es 31,6%. ◭ Ejemplo 1.2.3 El gerente de operaciones de un servicio de paqueter´ıa desea adquirir una nueva flota de autos. Cuando los paquetes se guardan con eficiencia en el interior de los autos (durante la preparaci´on de las entregas), se deben considerar dos restricciones principales: el peso (en libras) y el volumen (en pies c´ubicos) de cada paquete. Ahora, en una muestra de 200 paquetes, el peso promedio es 26 libras con una desviaci´on est´ andar de 3,9 libras. Adem´as, el volumen promedio de cada paquete es 8,8 pies c´ubicos con una desviaci´ on est´ andar de 2,2 pies c´ ubicos. Por consiguiente, con relaci´on a la media, el volumen de un paquete es mucho m´as variable que su peso. ¿Por qu´e? ◭ Ejemplo 1.2.4 Un inversionista potencial piensa adquirir acciones en una de dos compa˜ n´ıas A o B, listadas en la Bolsa de Valores de Nueva York. Si ninguna de las compa˜ n´ıas ofrece dividendos a sus clientes y ambas tienen igual clasificaci´ on (seg´ un varios servicios de inversi´on) en t´erminos de crecimiento potencial, el posible inversionista quiz´ as considere la volatilidad (variabilidad) de ambas acciones para ayudar en la decisi´on de inversi´on. En los u ´ltimos meses, el precio promedio de las acciones en la compa˜ n´ıa A fue de 50 d´olares con una desviaci´on est´ andar de 10 d´olares. Adem´as, durante el mismo periodo, el precio promedio de las acciones en la compa˜ n´ıa B fue de 12 d´olares con una desviaci´on est´ andar de 4 d´olares. Entonces, en relaci´on con la media, el precio de las acciones B es mucho m´as variable que el de las acciones A. ◭
1.2 Medidas estad´ısticas
8
6. Medidas de formas . Coeficiente de sesgo y medida de curtosis. 7. Simetr´ıa y asimetr´ıa . Una distribuci´on de frecuencias ser´a sim´etrica o asim´etrica seg´un lo sea su representaci´ on gr´afica.1 Si una distribuc´on no es sim´ etrica, se dice que es asim´ etrica a la derecha (positi2 vamente) o a la izquierda (negativamente). En la figura 1.1 se ilustra el caso en que la distribuci´on de frecuencias tiene una sola moda.
(e) Distribuci´on sim´etrica
(f) Distribuci´on asim´etrica a la derecha
(g) Distribuci´on asim´etrica a la izquierda
Fig. 1.1: Comparaci´ on de tres distribuciones unimodales cuya forma difiere.
8. Coeficiente de sesgo Ap. Se define como: Ap =
Media aritm´etica − Moda . Desviaci´ on est´andar
Cuando Ap = 0, se dice que la distibuci´on es sim´etrica; cuando Ap < 0, se dice que la distribuci´o n es sesgada negativamente o a la izquierda y 1 2
En cualquier distribuci´ on sim´ etrica, la media coincide con la mediana. En las medidas asim´etricas unimodales la mediana est´a entre la media y la moda.
1.3 An´ alisis exploratorio de datos
9
cuando Ap > 0, se dice que la distribuci´on es sesgada positivamente o a la derecha.
on emp´ırica entre media, mediana y moda . 9. Relaci´ Para distribuciones campanoides, unimodales y moderadamente asim´ etricas se cumple aproximadamente la relaci´on emp´ırica Media − Moda
≈
3(Media aritm´etica − Mediana),
Con lo anterior, el coeficiente de asimetr´ıa de Pearson la podemos calcular tambi´en a trav´es de la f´ormula Ap =
etica − Mediana) 3(Media aritm´ Desviaci´ on est´andar
.
10. Medidas de curtosis o apuntamiento . Se aplican a distribuciones campaniformes, es decir, unimodales sim´ etricas o con ligera asimetr´ıa.
1.3
An´ alisis exploratorio de datos
Muchos autores presentan el diagrama de tallo y hoja como t´ ecnica del an´ alisis exumeros y construir un ploratorio de datos. Consiste en desarrollar un resumen de cinco n´ diagrama de caja y bigotes . 1. Resumen de cinco n´umeros . Consiste en cinco cantidades que se emplean para resumir los datos: valor m´ınimo, primer cuartil (Q1), Mediana (Q2), tercer cuartil (Q3) y valor m´aximo. 2. Situaciones para reconocer la simetr´ıa de los datos . Si la distribuci´ on es sim´etrica:
• La distancia de Q a la mediana es igual a la distancia de la mediana a Q . • La distancia del valor m´ınimo a Q es igual a la distancia de Q al valor 1
3
1
3
m´aximo.
• La mediana y el rango medio son iguales.
(Estas medidas son iguales a la
media de los datos.)
3. Situaciones para reconocer la no simetr´ıa de los datos . Si la distribuci´on no es sim´etrica:
• En las distribuciones sesgadas a la derecha, la distancia de Q al valor m´aximo 3
excede la distancia del valor m´ınimo a Q1. Adem´ as, la mediana es menor que el rango medio.
• En las distribuciones sesgadas a la izquierda, la distancia del valor m´ınimo a
Q1 excede la distancia de Q3 al valor m´ aximo. Adem´ as, el rango medio es
menor que la mediana.
1.3 An´ alisis exploratorio de datos
10
Diagrama de caja y bigotes Mediana Valor atípico (moderado) 1,5 R.I
1,5 R.I
+
+
Valores atípicos (extremos)
Media
3 R.I
2200 2,200
Primer 2400 2,400 Tercer 2600 2,600 cuartil cuartil
+
2800 2,800
3000 3,000
Salarios mensuales
Fig. 1.2: Diagrama de caja y bigotes
4. Diagrama de caja y bigotes . (R.I. significa el rango intercuartil, los segmentos horzontales son los llamados bigotes y los valores que est´an por fuera de los bigotes se llaman valores at´ıpicos).
ultiples (o comparativos) . 5. Diagramas de cajas m´ La figura 1.3 contiene los diagramas de caja de las calificaciones en un examen de matem´ aticas para quince estudiantes de primer curso de primaria, quince de segundo y quince de tercero.
Primero
Segundo
Tercero 40
50
60
70
80
90
100
Calificaciones
Calificaciones
Fig. 1.3: Diagrama de caja y bigotes de las calificaciones en un examen
En el diagrama puede apreciarse que no hay valores at´ıpicos en ninguno de los tres grupos. Los estudiantes del tercer curso consiguieron la mejor mediana, pero sus calificaciones tienen una variabilidad considerablemente mayor que la de los otros grupos. Otro hecho que llama la atenci´on es la gran cantidad de calificaciones
Cap. 1. Ejercicios
11
bajas obtenidas por los estudiantes de primer curso. Finalmente, podemos afirmar que las distribuciones de frecuencias de los tres conjuntos de datos est´an sesgadas a la izquierda.
Ejercicios 1. Diga si la afirmaci´ on dada es verdadera o falsa. Justifique siempre su respuesta. En caso que sea falso, d´e un contraejemplo. (a) Si la desviaci´ on est´andar de un conjunto de datos es 0, entonces, los datos son iguales. (b) No existen datos de tal forma que sean iguales el rango y la varianza. (c) Existen datos con desviaci´ on est´andar negativa. (d) En una distribuci´ on sim´etrica, la media, la mediana y la moda son iguales. (e) La desviaci´ on est´andar est´a dada por las mismas unidades que la media. (f) Toda informaci´ on num´erica proporciona datos cuantitativos. (g) Toda informaci´ on no num´erica ofrece datos cuantitativos. (h) Cuando todos los datos son categ´ o ricos, la moda es la u ´nica medida de tendencia central que se puede utilizar. (i) Si el primer cuartil en el primer examen de estad´ıstica fue de 3,0, entonces, este valor indica que el 25% de los estudiantes ganaron el examen. 2. Clasifique los datos siguientes en cuantitativos (num´ericos) y cualitativos (categ´ oricos). En caso de ser num´erico, como discretos o continuos: (a) Estaturas en cent´ımetros de cuatro jugadores de f´utbol. (b) Las temperaturas promedios diarias en el ´ultimo mes. (c) Clasificaci´ on ´etnica de 30 empleados. (d) N´ umeros telef´onicos de ciertas personas. (e) Distancia (en metros) recorrido por un atleta en una temporada. (f) Peso perdido (en kilogramos) por 10 personas debido a una dieta. (g) Fecha de cumplea˜ nos de determinadas personas. (h) Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato. 3. Se clasific´o a los estudiantes de un programa universitario de acuerdo a con el semestre que cursa y su preferencia deportiva. Los resultados est´an registrados en la siguiente tabla. F´utbol Beisbol Voleivol Basqu´etbol Nataci´on
Primero 15 12 5 26 7
Segundo 14 22 5 7 8
Tercero 5 6 9 6 4
Cuarto 9 6 5 7 2
(a) ¿Qu´ e porcentaje de los estudiantes de primer semestre prefieren el f´utbol? (b) ¿Qu´ e porcentaje de los aficionados a la nataci´on son de segundo semestre? (c) ¿Qu´ e porcentaje del total de los estudiantes prefieren el basqu´etbol? (d) ¿Qu´ e porcentaje de los estudiantes son de cuarto semestre?
Cap. 1. Ejercicios
12
(e) ¿Qu´ e porcentaje del total de estudiantes son de tercer o cuarto semestre? (f) ¿Qu´ e porcentaje prefiere la nataci´on, el voleibol o el beisbol? 4. Los siguientes datos representan las cuentas telef´ onicas mensuales, en miles de pesos, de 25 residentes de un peque˜no pueblo: 21,48 20,35 26,83
21,15 30,22 30,96
25,12 25,49 33,38
23,47 20,80 20,77
27,81 23,83 19,98
19,80 25,35 35,87
36,05 23,48 22,02
28,50 25,81
26,66 21,07
(a) ¿Qu´ e porcentaje del grupo pag´o m´as de 21.000 pesos? (b) ¿Qu´e porcentaje pag´o m´as de 22.000 pesos pero menos de 27.000 pesos? 5. Los datos que se indican a continuaci´ on representan el costo (en miles de pesos) de la energ´ıa el´ectrica durante un determinado mes del a˜no para una muestra aleatoria de 50 apartamentos en cierta ciudad importante: 128 153 135 111 143
144 197 191 148 187
168 127 137 213 166
109 82 129 130 139
167 96 158 165 149
141 171 108 157 95
149 202 119 185 163
206 178 183 90 150
175 147 151 116 154
123 102 114 172 130
(a) Obtenga una tabla de frecuencias con 7 intervalos de clase. (b) Grafique el correspondiente histograma de frecuencias, el pol´ıgono de frecuencias relativas y la ojiva con frecuencias acumuladas relativas. (c) ¿Alrededor de qu´e cantidad parece concentrarse el costo mensual de energ´ıa el´ectrica? (d) Seg´ un su opini´on, ¿cu´al de las gr´aficas representa mejor la distribuci´on de los costos de energ´ıa el´ectrica? 6. Responda las siguientes preguntas. Justifique sus respuestas. (a) ¿Qu´e escala de medida se requiere para la mediana? ¿Y para la moda? (b) ¿En qu´e condiciones coinciden la media, la mediana y la moda de una muestra? (c) ¿En qu´e caso ser´ a demasiado grande la diferencia entre la media y la mediana? 7. Una empresa de servicio el´ ectrico de una ciudad le realiza la lectura del contador de luz a un usuario, obteniendo los siguientes datos: Fecha Agosto 27 Agosto 30 Septiembre 4
Lectura 00553 Kwh 00571 Kwh 00605 Kwh
El recibo de pago le lleg´o al usuario con lectura de 00638 Kwh, realizada el 9 de septiembre, pero la empresa no dej´o constancia de lectura, hecho que motiv´o el reclamo del usuario alegando que le estaban cobrando de m´as. ¿Tiene la raz´on el usuario? Explique. 8. Los neum´aticos de cierta marca tiene una duraci´on de vida con media de 29.000 kil´ometros y desviaci´on t´ıpica de 3.000 kil´ometros. (a) Encontrar un intervalo en el que se pueda garantizar que se encuentra por lo menos el 75 % de los tiempos de vida de los neum´aticos de esta marca.
Cap. 1. Ejercicios
13
(b) Usando la regla imp´ırica y suponiendo que la poblaci´ on tiene forma acampanada, encontrar un intervalo en el cual se estime que se encuentra aproximadamente el 95 % de los tiempos de vida de los neum´aticos de esta marca. 9. Los valores de presi´on sangu´ınea se reportan a veces a los 5 mm Hg m´as cercanos (100, 105, 110, etc.). Suponga que los valores reales de presi´on sangu´ınea para nueve individuos seleccionados al azar son: 130,0
113,7
122,0
108,3
131,5
133,2
118,6
127,4
138,4
(a) ¿Cu´ al es la mediana de los valores reportados de presi´on sangu´ınea? (b) Suponga que la presi´ on del octavo individuo es 127,6 en lugar de 127,4 (un peque˜no cambio en su valor). ¿C´ omo afectar´ıa esto a la mediana de los valores reportados? ¿Qu´ e dice esto sobre la sensibilidad de la mediana para redondear o agrupar los datos? 10. La propagaci´ on de grietas por fatiga en diversas partes de aeronaves ha sido objeto de profundo estudio en a˜nos recientes. Los datos que aparecen a continuaci´ on constan de 4 tiempo de propagaci´on (horas de vuelo/ 10 ) para llegar a un tama˜ no de grieta dado en agujeros sujetadores que se usan en aeronaves militares: 0,915 1,132
0,937 1,140
0,983 1,153
1,007 1,253
0,736 1,394
0,863 1,011
0,865 1,064
0,913 1,109
(a) Calcule los valores de la media y mediana muestrales. (b) ¿En cu´anto se puede reducir la observaci´on muestral m´as grande, sin afectar el valor de la mediana? 11. Una manifestaci´ on interesante de la variaci´on surge cuando se efect´uan los an´alisis de emisi´ on de gases en los veh´ıculos automotores. Los requisitos de costo y tiempo del procedimiento federal de prueba (PFT) en cierto pais evitan la difusi´on de su uso en los programas de inspecci´on vehicular. Como resultado, muchas agencias han desarrollado an´alisis menos costosos y m´as r´apidos con la esperanza de reproducir los resultados. Seg´un un art´ıculo de una prestigiosa revista, se dice que la eceptaci´ on del PFT como patr´ on de excelencia ha conducido a la creencia de que las mediciones repetidas en el mismo veh´ıculo dar´an resultados id´enticos (o casi). Los autores del art´ıculo aplicaron el PFT a siete veh´ıculos caracterizados como “grandes emisores”. Los resultados de uno de esos veh´ıculos son los siguientes: HC (g/mi) CO (g/mi)
32,2 232
32,5 236
13,8 118
18,3 149
(a) Calcule las desviaciones est´andar muestrales de las observaciones de HC y CO. ¿Parece justificada la creencia general? (b) Compare los coeficientes de variaci´ on de cada conjunto de datos para determinar cu´ales presentan mayor o menor variaci´on. 12. Un taller de mec´anica acepta una orden por 10.000 ruedas de 2 pulgadas de di´ametro. Las especificaciones de tama˜no del producto podr´an ser mantenidas s´olo si el di´ametro medio es de 2 pulgadas y la desviaci´on est´andar es muy peque˜na. En este caso, ¿cu´al es el margen de tolerancia permitido para la desviaci´on est´andar? 13. A continuaci´ on se presentan algunas medidas estad´ısticas (mediana, primer y tercer cuartil) y una tabla de frecuencia agrupada, para las edades de un grupo de personas que hay en una sala de concierto. A partir de estos datos, responder las preguntas que aparecen abajo. Mediana = 20, primer cuartil = 17,5 y tercer cuartil = 23.
Cap. 1. Ejercicios
14
Edades 11,5 - 14,5 14,5 - 17,5 17,5 - 20,5 20,5 - 23,5 23,5 - 26,5 26,5 - 29,5
Frecuencia 2 8 11 10 8 1
Frecuencia relativa 0,0500 0,2000 0,2750 0,2500 0,2000 0,0250
Frecuencia acumulada 2 10 21 31 39 40
Frec. acum. relativa 0,0500 0,2500 0,5250 0,7750 0,9750 1,0000
(a) ¿Cu´ al era el n´umero exacto de personas que hab´ıan en la sala del concierto? (b) ¿Cu´ al es la media aproximada de las personas que asistieron al concierto? (c) ¿Qu´ e edad tienen el 77,5% de las personas? (d) ¿Qu´ e porcentaje de personas tienen una edad entre 11,5 y 20,5? (e) ¿Qu´ e porcentaje de personas tienen una edad mayor de 23,5? (f) ¿Cu´ antas personas tienen una edad entre 17,5 y 20,5? (g) ¿Cu´ antas personas tienen una edad mayor que 14,5? (h) ¿Qu´e interpretaci´on tiene el valor de la mediana y el de los cuartiles? 14. Los siguientes datos representan los rendimientos porcentuales anuales en cuentas de mercado de dinero de una muestra de 15 bancos comerciales en el ´area metropolitana de una ciudad a una determinada fecha: Nombre del Banco Banco su cuenta The Bank Mein Bank Your Bank El Banco del pueblo Aero Bank Union Bank Bank del cliente
Rendimiento 3,10 2,63 2,79 3,25 1,90 2,79 2,90 2,73
Nombre del banco Banco el Pais Banco la Clave Banco del Norte Banco del Sur Banco Nacional Nuestro Banco Banco el dinero
Rendimiento 2,28 3,01 2,53 2,00 3,05 2,02 3,05
(a) Proporcione el resumen de cinco n´umeros. (b) Construya el diagrama de caja y bigotes y describa la forma. (c) Si alguien le dijera:“los rendimientos del mercado de dinero no var´ıan mucho de un banco a otro”, con base en estos datos, ¿qu´e dir´ıa? 15. Una de las metas de toda administraci´ o n es ganar lo m´as posible en relaci´o n con el capital invertido en la empresa. Una medida del ´exito en alcanzarla es el retorno sobre la aportaci´on, que es la relaci´on de la ganancia neta entre el valor de las acciones. A continuaci´on se muestran los porcentajes de ganancia sobre las acciones para 25 empresas. 11,4 5,1 16,6
15,8 17,3 5,0
52,7 31,1 30,3
17,3 6,2 12,8
12,3 19,2 12,2
9,0 14,7 14,5
19,6 9,6 9,2
22,9 8,6
41,6 11,2
Forme el resumen de cinco n´umeros, trace un diagrama de caja y bigotes y determine si hay valores at´ıpicos. ¿C´omo podr´ıa un analista financiero usar esta informaci´ on? 16. Considere la variable anchura que contiene el conjunto de datos que encontramos en el archivo calles.sf3 y que corresponde al ancho de 112 calles de Madrid (Espa˜na).
Cap. 1. Ejercicios
15
(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera inferior sea 0 y la ´ultima frontera superior sea 40. A partir de ella, responda las siguientes preguntas: i. ii. iii. iv. v. vi.
¿Cu´antas calles tienen un ancho entre 5 y 25 kil´ometros? ¿Qu´ e porcentaje de calles tienen un ancho entre 10 y 30 kil´ometros? ¿Cu´antas calles tienen un ancho mayor de 20 kil´ometros? ¿Qu´ e porcentaje de calles tienen un ancho mayor 25 kil´ometros? ¿Cu´antas calles tienen un ancho menor de 15 kil´ometros? ¿Qu´ e porcentaje de calles tienen un ancho menor de 35 kil´ometros?
(b) Con 8 clases (en donde la primera frontera inferior sea 0 y la u ´ltima frontera superior sea 40), construir los histogramas de frecuencias absolutas y de frecuencias absolutas acumuladas, los pol´ıgonos de frecuencia y de frecuencias relativas y las ojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir de estos gr´aficos, responda las siguientes preguntas: i. ii. iii. iv.
¿Aproximadamente cu´ antas calles tienen un ancho mayor que 16,9 kil´ometros? ¿Aproximadamente cu´ antas calles tienen un ancho menor que 12,5 kil´ometros? ¿Qu´ e porcentaje aproximado de calles tienen un ancho mayor de 7,7 kil´ometros? ¿Qu´ e porcentaje aproximado de calles tienen un ancho menor de 13,8 kil´ometros?
(c) Estudie la simetr´ıa de la distribuci´on de los datos. (d) ¿Existen valores at´ıpicos? ¿Cu´antos? ¿Cu´ales? (e) ¿Existe alguna transformaci´ on que mejora la simetr´ıa? ¿Y la presencia de valores at´ıpicos? Indique en caso positivo la transformaci´ on seleccionada. 17. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millas por gal´on) de 154 modelos de autom´oviles sacados al mercado entre los a˜nos 1978 y 1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses (origen=3). Tambi´en aparecen los respectivos cilindrajes de los autos, las potencias, etc.
(a) Construya un diagrama de caja y bigotes para los datos de la distancia recorrida y a partir de ´el, responda las siguientes preguntas: ¿Entre cu´ales valores var´ıa la distancia recorrida? ¿Cu´anto recorre el 50% central de los autos? ¿Hay valores at´ıpicos? ¿Es sim´etrica o asim´etrica la distribuci´on de los datos? En caso de ser asim´etrica, ¿es asim´etrica a la izquierda o a la derecha? ¿Cu´ales son los valores de la media y de la mediana? (b) Estudie el grado de simetr´ıa de los datos de la distancia recorrida de cuatro maneras diferentes (compare sus respuestas): i. Utilizando las medidas estad´ısticas (media, mediana, moda, sesgo, etc. ) ii. Construyendo un histograma de frecuencias con 5 clases. iii. Construyendo un un histograma con 13 clases. ¿Porqu´e este histograma resulta m´as adecuado que el que construy´o con 5 clases? iv. Construyendo un gr´afico de simetr´ıa con la opci´on graphical options . . . symmetry plot de Statgraphics. 18. Se han medido los di´ametros (en mil´ımetros) de 50 tornillos y se han obtenido los resultados que mostramos en el archivo tornillos.sf3.
(a) Forme la tabla de frecuencias con 6 clases para los datos y, a partir de ella, responda las siguientes preguntas: i. ¿Cu´antos tornillos tienen un di´ametro entre 29 y 32 mil´ımetros?
Cap. 1. Ejercicios
ii. iii. iv. v. vi.
16
¿Qu´e porcentaje de tornillos tienen un di´ametro entre 30 y 34 mil´ımetros? ¿Cu´antos tornillos tienen un di´ametro mayor de 32 mil´ımetros? ¿Qu´e porcentaje de tornillos tienen un di´ametro mayor 34 mil´ımetros? ¿Cu´antos tornillos tienen un di´ametro menor de 31 mil´ımetros? ¿Qu´e porcentaje de tornillos tienen un di´ametro menor de 33 mil´ımetros?
(b) Con 6 clases, construir los histogramas de frecuencias absolutas y de frecuencias absolutas acumuladas, los pol´ıgonos de frecuencia y de frecuencias relativas y las ojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir de estos gr´aficos, responda las siguientes preguntas: i. ¿Aproximadamente cu´antos tornillos tienen un di´ametro mayor que 34,4 mil´ımetros? ii. ¿Aproximadamente cu´antos tornillos tienen un di´ametro menor que 32,2 mil´ımetros? iii. ¿Qu´e porcentaje aproximado de tornillos tienen un di´ ametro mayor de 31,6 mil´ımetros? iv. ¿Cu´antos tornillos tienen un di´ametro menor de 32,8 mil´ımetros? (c) Estudie la simetr´ıa de la distribuci´on de los datos. 19. Los datos del archivo fotocopia.sf3 muestran el gasto en fotocopias (en miles de pesos) de 70 estudiantes universitarios durante un determinado a˜no.
(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera inferior sea 0 y la ´ultima frontera superior sea $ 1.400.000. A partir de ella, responda las siguientes preguntas: i. ¿Cu´ antos estudiantes han gastando entre $ 175.000 y $ 525.00 en el a˜no? ii. ¿Qu´e porcentaje de estudiantes han gastando entre $ 700.000 y $ 1.225.000 en el a˜ no? iii. ¿Cu´antos estudiantes han gastando m´as de $ 1.050.000 en el a˜no? iv. ¿Qu´ e porcentaje de estudiantes han gastando m´as de $ 350.000 en el a˜no? v. ¿Cu´ antos estudiantes han gastando menos de $ 875.000 en el a˜no? vi. ¿Qu´e porcentaje de estudiantes han gastando menos de $ 525.000 en el a˜no? (b) Con 8 clases (en donde la primera frontera inferior sea 0 y la u ´ltima frontera superior sea $ 1.400.000), construir los histogramas de frecuencias absolutas y de frecuencias absolutas acumuladas, los pol´ıgonos de frecuencia y de frecuencias relativas y las ojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir de estos gr´aficos, responda las siguientes preguntas: i. ¿Aproximadamente cu´antos estudiantes han gastando m´as de $ 767.810 en el a˜ no? ii. ¿Aproximadamente cu´ antos estudiantes han gastando menos de $ 391.821 en el a˜ no? iii. ¿Qu´ e porcentaje aproximado de estudiantes han gastando m´as de $ 601.583 en el a˜ no? iv. ¿Cu´ antos estudiantes han gastando menos de $ 1.104.220 en el a˜no? (c) Estudie la simetr´ıa de la distribuci´on de los datos. (d) ¿Existen valores at´ıpicos? ¿Cu´antos? ¿Cu´ales? (e) Realice una transformaci´ on logar´ıtmica de los datos e interprete los resultados. Comente las diferencias con los datos sin transformar. 20. En el archivo de datos doscientos.sf3 proporcionamos las sesenta y nueve mejores marcas de todos los tiempos en la prueba de 200 metros lisos masculinos (las marcas se dan en segundos), as´ı como el nombre del atleta y la fecha en que se consigui´o la marca.
Cap. 1. Ejercicios
17
(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera inferior sea 19,2 segundos y la ´ultima frontera superior sea 20,2 segundos. A partir de ella, responda las siguientes preguntas: i. ii. iii. iv. v. vi.
¿Cu´antos atletas han recorrido entre 19,325 y 19,7 segundos? ¿Qu´ e porcentaje de atletas han recorrido entre 19,45 y 19,95 segundos? ¿Cu´antos atletas han recorrido m´as de 19,7 segundos? ¿Qu´ e porcentaje de atletas han recorrido m´as de 19,45 segundos? ¿Cu´antos atletas han recorrido menos de 19,95 segundos? ¿Qu´ e porcentaje de atletas han recorrido menos de 19,825 segundos?
(b) Con 8 clases (en donde la primera frontera inferior sea 19,2 segundos y la ´ultima frontera superior sea 20,2 segundos.), construir los histogramas de frecuencias absolutas y de frecuencias absolutas acumuladas, los pol´ıgonos de frecuencia y de frecuencias relativas y las ojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir de estos gr´aficos, responda las siguientes preguntas: i. ii. iii. iv.
¿Aproximadamente cu´antos atletas han recorrido m´as de 19,818 segundos? ¿Qu´ e porcentaje aproximado de atletas han recorrido m´as de 19,845 segundos? ¿Qu´ e porcentaje aproximado de atletas han recorrido m´as de 19,782 segundos? ¿Aproximadamente cu´ antos atletas han recorrido menos de 20,03 segundos?
(c) Estudie la simetr´ıa de la distribuci´on de los datos. (d) ¿Se detecta algo peculiar en la distribuci´ on de estos datos? (e) ¿Se detecta alg´ un valor potencialmente at´ıpico? ¿Cu´al es? 21. En el archivo de datos Cavendish.sf3 presentamos 29 medidas de la densidad de la tierra obtenidas por Henry Cavendish en 1798 empleando una balanza de torsi´on. La densidad de la tierra se proporciona como un m´ultiplo de la densidad del agua.
(a) Utilice los diagramas de tallo y hojas y de cajas para determinar si existe alg´ un valor at´ıpico. (b) Proponga, razonando la respuesta, un valor para la densidad de la tierra. 22. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millas por gal´on) de 154 modelos de autom´oviles sacados al mercado entre los a˜nos 1978 y 1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses (origen=3). Tambi´en aparecen los respectivos cilindrajes de los autos, las potencias, etc.
(a) Considere por separado los conjuntos de distancias recorridas de los modelos de cada uno de los cinco a˜nos. i. Analice gr´afica y num´ericamente cada uno de estos conjuntos. ii. Utilizando la opci´ on Plot . . . Exploratory Plots . . . Multiple Box-and-Whishker Plot . . . Data=distancia . . . Level codes=year . . . obtenga los diagramas de cajas (m´ ultiples) de los cinco conjuntos de distancias recorridas con respecto a cada uno de los a˜ nos. ¿Qu´ e se observa? ¿Conoce alguna raz´on que pueda explicar lo que resulta de los an´alisis num´ericos y de la observaci´on de los diagramas de cajas? (b) Ahora, construya el diagrama de caja m´ ultiple de la distancia recorrida de los autom´ oviles seg´un su cilindrada. i. Teniendo en cuenta cada uno de los diagramas, responda las preguntas formuladas en la parte (a).
Cap. 1. Ejercicios
18
ii. Compare entre s´ı los distintos diagramas y responda las siguientes preguntas: ¿D´onde es m´as fuerte la asimetr´ıa? ¿D´onde es menor? ¿D´onde no existe? ¿Var´ıa bastante los valores de la media y de la mediana para los diferentes grupos? (c) Construya el diagrama de caja m´ ultiple de la potencia de los autom´oviles seg´un su origen y responda las preguntas formuladas en el inciso anterior. 23. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligencia realizados a parejas de gemelos monozig´oticos. Los gemelos monozig´oticos se forman por la divisi´o n en dos de un mismo ´ovulo ya fecundado y, por tanto, tienen la misma carga gen´etica. Al mismo tiempo, por razones obvias, es muy frecuente que compartan el entorno vital y es dif´ıcil separar ambos factores. En el conjunto de datos, los datos de la columna A corresponden al gemelo criado por sus padres naturales, los de la columna B al criado por un familiar u otra persona. Mediante la opci´on Compare . . . Two Samples . . . Two Sample Comparison . . . Sample 1=A . . . Sample 2=B . . . Ok , resuelva lo siguiente:
(a) Compare la simetr´ıa de los datos de la columna A y B. (b) Construya un diagrama de caja m´ ultiple para los datos de la columna A y B y describa sus interesantes propiedades. (c) ¿C´omo interpreta el coeficiente de variaci´on de ambos conjuntos de datos? 24. En 1893 Lord Rayleigh investig´o la densidad del nitr´ogeno empleando en su obtenci´on distintas fuentes. Previamente hab´ıa comprobado la gran discrepancia existente entre la densidad del nitr´ogeno producido tras la eliminaci´on del ox´ıgeno del aire y el nitr´ogeno producido por la descomposici´on de ciertos compuestos qu´ımicos. Los datos del archivo o a Lord Rayleigh a inRayleigh.sf3 muestran esta diferencia de forma clara. Esto llev´ vestigar detenidamente la composici´on del aire libre de ox´ıgeno y al descubrimiento de un nuevo elemento gaseoso, el arg´on.
(a) Analice num´erica y gr´aficamente estos datos. Preste especial atenci´on a los diagramas de tallo y hojas y al diagrama de cajas. ¿Hay alguna peculiaridad de la poblaci´on de pesos que se manifieste en un diagrama y no en el otro? (b) Realice diagramas de cajas dividiendo los datos en los pesos obtenidos a partir de aire y los obtenidos a partir de compuestos qu´ımicos del nitr´ogeno. ¿Qu´e se observa? 25. Una de las medidas de seguridad de los reactores nucleares frente a desajustes en el proceso de generaci´on de energ´ıa o de extracci´on de ´esta es el disparo del reactor. Esta medida consiste en la detenci´on del proceso de fusi´on mediante la inserci´on en el n´ucleo del reactor de venenos neutr´onicos. El n´umero de disparos no previstos de un reactor en un periodo es un indicador de problemas de comportamiento y de fiabilidad en la planta. En el archivo de datos disparos.sf3 proporcionamos, para dos a˜nos diferentes (1984 y 1993), el n´umero de disparos no previstos en sesenta y seis reactores nucleares de los Estados Unidos de Norteam´erica.
(a) Analice num´erica y gr´ aficamente, por separado, el n´umero de disparos de reactor en cada uno de los dos a˜nos considerados. (b) Compare gr´ aficamente las distribuciones de ambas variables ¿Se aprecian diferencias importantes entre ellas? ¿Qu´ e conclusiones le merece esta comparaci´on? 26. Sea una variable X que presenta los valorees x 1 , x 2 , x 3 , x4 , x5 con frecuencias absolutas n1 = 1 , n2 = 2 , n3 = 8 , n4 = 5 y n5 = 6 .
(a) Representar la variable X mediante digramas de barras horizontales. (b) Hacer la representaci´ on con barras horizontales apiladas.
Cap. 1. Ejercicios
19
(c) Representar la variable X mediante digramas de barras verticales. (d) Representar la variable X mediante un diagrama de barras varticales con la l´ınea base situada a la altura del punto 4. (e) Representar la variable X mediante un diagrama de barras horizontales con rect´angulos de error representados por l´ıneas y definidos por la variable Y cuyos valores son 1,5; 2,5; 3,5; 3 y 2. on activa elaborada por una empresa referente al cuarto trimestre 27. La encuesta de poblaci´ de 1.970 presenta para el n´umero de activos por ramas los siguientes datos: RAMA DE ACTIVIDAD Agricultura, caza y pesca Fabriles Construcci´on Comercio Transporte Otros servicios
MILES DE ACTIVOS 3706,3 3437,8 1096,3 1388,3 648,7 2454,8
(a) Realizar un gr´afico de sectores con porcentajes del n´umero de activos por ramas. (b) Realizar el gr´afico conlas etiquetas de las ramas de actividad sobre los sectores. (c) Desplazar el sector relativo a la rama con menor n´umero de activos.
CAP´ITULO
2
Probabilidad
2.1
Experimentos, espacios muestrales y eventos
1. Experimentos determin´ısticos y aleatorios. (a) Experimento: cualquier acci´on que genera observaciones. (b) Experimento determin´ıstico: al repetirse bajo las mismas condiciones, genera siempre los mismos resultados (como, por ejmplo, las leyes f´ısicas). ´ stico): Al repertirse bajo las mismas (c) Experimento aleatorio (o estoca condiciones, no genera siempre los mismos resultados.
2. Espacio muestral, evento y evento elemental . (a) Espacio muestral Ω: Conjunto de todos los posibles resultados de un experimento aleatorio. (b) Evento: cualquier subconjunto de Ω. (c) Evento elemental: evento con un solo elemento.
2.2
T´ ecnicas de conteo
Conteo por enumeraci´on de elementos, conteo a trav´es de diagramas de ´arbol, teorema fundamental del conteo, principio de adici´on, conteo de permutaciones y el conteo de combinaciones.
on. 1. Permutaci´ Arreglo ordenado de una cantidad finita de objetos distintos. 2. Situaciones especiales (relacionadas con permutaciones) .
• Permutaciones sin repetici´on de n objetos tomados todos a la vez. • Permutaciones sin repetici´on de n objetos tomados de k en k ( k ≤ n).
2.2 T´ecnicas de conteo
21
• Permutaciones circulares. • Permutaciones con repetici´on de n objetos tomados de k en k (k es cualquier n´ umero natural).
• Permutaciones de n objetos de los cuales hay n
1 de
un primer tipo, n2 de un segundo tipo, . . ., n k de un k -´esimo tipo, donde n1 + n2 + + nk = n .
···
• Maneras de hacer una partici´on de un conjunto. S´ olo ilustraremos la primera.
3. Permutaciones sin repetici´on de n objetos tomados todos a la vez . El n´ umero de permutaciones de un conjunto de n elementos distintos es igual 1 a (n − 1) n, siendo 0! := 1 . n! := 1 2
· ···
·
Ejemplo 2.2.1 Suponga que una empresa dispone de ocho m´aquinas atornilladoras y de ocho espacios en el ´area de producci´on. Entonces, hay 8! = 40.320 maneras de ordenar las ocho m´aquinas en los ocho espacios disponibles. ◭
on. 4. Combinaci´ Cualquier escogencia de k objetos de un conjunto de n objetos distintos, sin importar el orden en que los k objetos son escogidos (una combinaci´on puede ser con repetici´on o sin repetici´on). ormula para calcular el n´ umero de combinaciones . 5. F´ El n´ umero de combinaciones de k objetos seleccionados, sin repetici´ o n, de un 2 conjunto de n elementos, es
n n! := , siendo k k !(n − k )!
n := 1. 0
Y el n´umero de combinaciones de k objetos seleccionados con repetici´on, de un conjunto de n elementos, es
(n + k − 1)! n + k − 1 = , siendo k k !(n − 1)!
n := 1. 0
Ejemplo 2.2.2 (Combinaciones tomadas de 2 en 2, sin repetici´ on) Hay 10 posibles formas de escoger dos letras de un total de 5, cuando el orden no importa y la selecci´ on es sin repetici´on. ◭ Ejemplo 2.2.3 (Combinaciones tomadas de 2 en 2, con repetici´ on) Hay 15 posibles formas de escoger dos letras de un total de 5, cuando el orden no importa y la selecci´ on es con repetici´on. ◭ 1
El s´ımbolo “!” se conoce con el nombre de factorial. Cuando escribamos, por ejemplo, 5! leeremos “5 factorial”. Algunos valores factoriales son los siguientes: 1! = 1 , 2
Los n´ umeros
2! = 2 · 1 = 2,
n k
3! = 3 · 2 · 1 = 6,
4! = 4 · 3 · 2 · 1 = 24 ,
se conocen con el nombre de coeficiente binomial .
etc.
2.3 Introducci´on a la probabilidad
2.3
22
Introducci´ on a la probabilidad
En general, hay 4 formas de calcular o estimar la probabilidad, a saber, mediante los siguientes m´etodos (que se relacionan todos entre s´ı): axiom´atico, de la frecuencia relativa, cl´asico y subjetivo. S´ olo explicaremos brevemente los m´etodos emp´ırico y cl´asico. 6. Propiedades de la probabilidad .
∅
(a) P( ) = 0 y P(Ω) = 1 . (b) Si los eventos A, B y C son mutuamente excluyentes,3 entonces, P(A C) = P(A) + P(B) + P(C).
∪B∪
(c) P(A) = 1 − P(A), siendo A el complemento de A.
≤ P(A) ≤ 1. (e) P(A) = P(A ∩ B) + P(A ∩ B).
(d) 0
´ n para 2 eventos o fo ´ rmula de Silvester: (f) Teorema de adicio
P(A
∪ B) = P(A) + P(B) − P(A ∩ B).
´ n para 3 eventos o fo ´ rmula de Silvester: (g) Teorema de adicio
∪∪
∩
∩
∩
∩∩
P(A B C) = P(A)+P(B)+P(C)−P(A B)−P(A C)−P(B C)+P(A B C).
etodo emp´ırico . 7. M´ Utiliza datos que se han observado emp´ıricamente, registra la frecuencia con que ha ocurrido alg´un evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con base en estos datos hist´oricos. 8. Frecuencia relativa de un evento . Supongamos que un experimento aleatorio se repite n veces y que un evento A asociado con estas n repeticiones ocurre exactamente k veces. Entonces, la k frecuencia relativa del evento A es fn = n . Ejemplo 2.3.1 La tabla 2.1 muestra experimentos hechos por tres investigadores: Obs´ ervese que en cada una de las investigaciones, la frecuencia relativa del n´umero de caras es aproximadamente 0,5, que es la probabilidad de obtener una cara. ◭
9. Probabilidad emp´ırica. Sea A un evento asociado con un experimento. Entonces, la probabilidad P(A) es aproximadamente igual a la frecuencia relativa de A si efectuamos el experimento muchas veces. Al usar esta definici´on, tener en cuenta:
• Esta probabilidad es solo una estimaci´on del valor real. 3
Es decir, todas las posibles intersecciones son vac´ıas.
2.3 Introducci´on a la probabilidad
Hecho por Buffon K. Pearson K. Pearson
23
N´ umero de Lanzamientos 4.040 12.000 24.000
Frecuencia relativa de caras 0,5069 0,5016 0,5005
N´ u mero de caras 2.048 6.019 12.012
Fig. 2.1: Lanzamientos de una moneda realizada por 3 investigadores
• A mayor n´umero de experimentos mejor ser´a la estimaci´on. • Los experimentos deben repetirse siempre bajo las mismas condiciones. asica) un evento elemental . 10. Probabilidad (cl´ Sea Ω un espacio muestral finito y no vac´ıo. Entonces, P(evento elemental) =
1
N´ umero de elementos de Ω
.
(2.1)
Ejemplo 2.3.2 Consideremos el experimento de lanzar una moneda. Entonces, la probabilidad de obtener cara, simbolizado por P (C), y la de obtener sello, simbolizado por P(S), est´ a dado por P (C) = P (S) = 12 = 0, 5. Estas probabilidades las interpretamos de la siguiente manera: En un gran n´umero de lanzamientos aparecer´a una cara aproximadamente en la mitad de los lanzamientos y sello en la otra mitad. O tambi´en podemos decir: si la moneda se lanza repetidamente, entonces, el 50% (que resulta de multiplicar 0,5 por 100) de las veces resultar´a cara y en el otro 50%, sello. ◭
asica) de un evento . 11. Probabilidad (cl´ Sea Ω finito, no vac´ıo y supongamos que (2.1) se cumple para cada evento elemental de Ω. Entonces, para cada evento A de Ω, tenemos P(A) =
N´umero de elementos de A . N´umero de elementos de Ω
(2.2)
Ejemplo 2.3.3 Dos dados no falsos se lanzan. Sea B el evento de obtener por lo menos un 11. Entonces, la probabilidad de que la suma sea por lo menos un 11 es 3 1 . P(B) = 36 = 12 Ejemplo 2.3.4 En la primera ´epoca del desarrollo de un yacimiento de petr´oleo, una empresa estim´o en 0,1 la probabilidad de que las reservas econ´omicamente recuperables excedieran los 2.000 millones de barriles. La probabilidad de que las reservas excediesen los 1.000 millones de barriles se estim´o en 0,5. Dada esta informaci´ on, la probabilidad estimada de que las reservas se encuentren entre 1.000 y 2.000 millones de barriles es 0, 5 − 0, 1 = 0, 4. ◭ Ejemplo 2.3.5 Un estante tiene 6 libros de matem´aticas y 4 de f´ısica. Si todos los libros de matem´aticas son diferentes y los libros de f´ısica tambi´ en, entonces, la probabilidad de que 3 libros determinados de matem´ aticas est´en juntos es P (A) = 8! 3! ◭ = 0, 0666. 10!
2.3 Introducci´on a la probabilidad
24
Ejemplo 2.3.6 Una caja de doce lapiceros tiene dos que est´an defectuosos. Se extraen tres lapiceros sin reemplazo. Entonces, la probabilidad de que dos salgan defec10 tuosos es P(A) = 220 ◭ = 0, 045.
12. Probabilidad condicional de A dado B. P A∩B) Se define como P(A/B) = (P(B si P(B) > 0. ) Ejemplo 2.3.7 Una persona lanza una moneda tres veces. Entonces, la probabilidad de obtener 3 caras dado que sali´o por lo menos una cara es 1/8 ◭ = 17 . 7/8
on para 2 eventos . 13. Teorema de multiplicaci´ Si A y B son dos eventos de un espacio muestral Ω = entonces,
∅ y si P(B ∩ A) > 0,
P(B
∩ A)
= P(B/A) P(A)
o por P(B
∩ A)
= P(A/B) P(B).
Ejemplo 2.3.8 Supongamos que una caja tiene diez bolas, de los cuales tres est´an defectuosas. Se sacan dos bolas, una detr´ as de la otra y sin reemplazo. Sean A el evento “la primera bola sacada est´a defectuosa” y B el evento “la segunda bola sacada est´ a defectuosa”. Entonces, la probabilidad de sacar una bola defectuosa seguida de otra defectuosa es P (A
∩ B)
= P (A) P (B/A) =
3 10
· 29 .
◭
on para 3 eventos . 14. Teorema de multiplicaci´ Si P(A1 A3) > 0, entonces,
∩···∩
P(A1
∩···∩A ) 3
·
·
= P(A1) P(A2/A1) P(A3/A1
∩ A ). 2
Como podemos observar claramente, en este teorema hemos considerando que A 1 es el evento que primero sucede, luego sucede A 2 ; posteriormente, A 3 .
Ejemplo 2.3.9 Una caja contiene 6 fichas rojas, 4 blancas y 5 azules. Halle la probabilidad de que se extraigan en el orden roja (R), blanca (B) y azul (A) si las fichas no se reemplazan es P (R B A) = 0, 044. ◭
∩ ∩
15. Teorema de la probabilidad total . Si los eventos A 1, A2, . . ., An forman una partici´on4 de un espacio muestral Ω y si P(Ai) > 0 para todo i = 1, . . . , n, entonces, para cada evento B de Ω , se tiene que P(B) = P(B/A1) P(A1) + P(B/A2) P(A2) +
··· + P(B/A
n) P(An).
Ejemplo 2.3.10 La caja I contiene 3 fichas rojas(R) y 2 azules (A), en tanto que la caja II contiene 2 fichas rojas y 8 azules. Se lanza una moneda no falsa de tal forma que si cae cara, entonces, se saca una ficha de la caja I y, por el contrario, si cae sello, se saca una ficha de la caja II. Supongamos que quien lanza la moneda no revela si resulta cara o sello (de tal forma que la caja de la cual se sac´o una ficha no se revela). 4
Es decir, todas las p osibles intersecciones son vac´ıas y la uni´ on de todos los eventos son iguales a Ω .
2.3 Introducci´on a la probabilidad
25
Fig. 2.2: Diagrama para la situaci´ on del ejemplo 2.3.10 Entonces, la probabilidad de haber sacado una ficha roja es P(R) = P (R/I) P (I) + P (R/II) P (II) = 0,4.
◭
Ejemplo 2.3.11 Un editor env´ıa propaganda de un libro de estad´ıstica al 70% de aquellos profesores que est´an a cargo de esa materia. El 40% de aquellos que recibieron la propaganda se decidieron a utilizar el libro, inclusive, el 20% de los que no recibieron la propaganda tambi´en utilizar´ an el libro. Entonces, la probabilidad de utilizar el libro es 0,34 (se aplica el teorema de la probabilidad; tambi´ en se puede calcular la probabilidad con ayuda del diagrama de a´rbol que aparece en la figura 2.3).
Fig. 2.3: Diagrama para la situaci´ on del ejemplo 2.3.11 ◭
16. Regla o teorema de Bayes . Sea A1, A2, . . . , An una partici´on5 de un espacio muestral Ω. Entonces, para cada evento B con P(B) > 0 y para todo k = 1, . . . , n, se tiene P(Ak/B) =
P(B/Ak) P(Ak) P(B/A1) P(A1) + P(B/A2) P(A2) +
··· + P(B/A
n) P(An)
.
Para poder aplicar la regla de Bayes, recomendamos dibujar siempre un diagrama de ´arbol. 5
Es decir, todas las p osibles intersecciones son vac´ıas y la uni´ on de todos los eventos son iguales a Ω .
2.3 Introducci´on a la probabilidad
26
Ejemplo 2.3.12 Considere la situaci´on del ejemplo 2.3.10. Entonces, la probabilidad de haber escogido la caja I (es decir, que el resultado de la moneda sea cara) es P (R/I) P (I) P(I/R) = = P(R/I) P (I) + P(R/II) P(II)
3 5 3 5
·
1 2
·
+
1 2 1 5
·
1 2
=
3 = 0, 75. 4
◭
Ejemplo 2.3.13 Un analista de bolsa examina las perspectivas de las acciones de un gran n´ umero de compa˜ n´ıas. Cuando se investig´o el comportamiento de estas acciones un a˜ no antes, se descubri´o que el 15% experimentaron un crecimiento superior al de la media, el 40% inferior y el 45% restante se mantuvieron alrededor de la media. El 30% de los valores que crecieron por encima de la media fueron clasificados como “buenas adquisiciones” por el analista, al igual que el 15% de las que crecieron alrededor de la media y el 20% de las que tuvieron un crecimiento inferior. Al aplicar el teorema de Bayes, la probabilidad de que un valor clasificado como “buena adquisici´on” por el analista crezca por encima de la media del mercado es igual a 0,3658. ◭ Ejemplo 2.3.14 En cierta ciudad, aproximadamente el 10% de los habitantes est´a afectado por una rara enfermedad (A), para la cual se ha desarrollado una prueba de diagn´ ostico. A trav´es de esta prueba se ha determinado que el 85 % de los individuos que padecen la enfermedad, presentan un resultado positivo (B), mientras que el 20% de los individuos sin la enfermedad muestran un resultado de prueba positivo. Supongamos que se hace una prueba en un individuo seleccionado al azar. Todas las probabilidades mencionadas en el problema se pueden identificar en el siguiente diagrama de ´arbol que se muestra en la figura 2.4.
Fig. 2.4: Diagrama de ´arbol para los datos del ejemplo 2.3.12. (a) La probabilidad de que el resultado sea positivo es P (B) = P (A) P(B/A) + P (A) P (B/A) = 0, 085 + 0,18 = 0, 265.
(b) Si el resultado es positivo, entonces, la probabilidad de que el individuo tenga
2.4 Independencia
27
la enfermedad es (por el teorema de Bayes):
∩
P (A B) 0, 085 = = 0, 3207. P (B) 0, 265
P (A/B) =
2.4
◭
Independencia
1. Independencia . A, B son (estoc´ asticamente) independientes, si y s´olo si P(A/B) = P(A) y son dependientes en cualquier otro caso. Es decir, el evento A es independiente del evento B si la probabilidad de A no se ve afectada por la ocurrencia o no de B.
on para eventos independientes . 2. Teorema de multiplicaci´ Dos eventos A, B de un espacio muestral Ω = son independientes si y s´olo si
∅
P(A
∩ B)
= P(A)P(B).
3. Teorema de independencia . Sean A , B eventos de un espacio muestral Ω = . Entonces, las siguientes cuatro proposiciones son equivalentes:
∅
(a) A y B son independientes.
(b) A y B son independientes.
(c) A y B son independientes.
(d) A y B son independientes.
Ejercicios 1. Una universidad realiza tres tipos de pruebas a 100 aspirantes y obtiene los siguientes resultados: 2 fracasaron en las tres pruebas; 7, en la primera y en la segunda; 8, en la segunda y en la tercera; 10, en la primera y en la tercera; 25, en la primera; 30, en la segunda; 25, en la tercera. Determine el n´umero de aspirantes que conforman los siguientes eventos: (a) Fracasaron exactamente en una prueba. (b) Aprobaron las tres pruebas. (c) Fracasaron en la primera y en la tercera, pero no en la segunda. (d) Fracasaron en la segunda y en la tercera, pero no en la primera. (e) Fracasaron en al menos una prueba. (f) Aprobaron al menos una prueba (g) Aprobaron la segunda o la tercera, pero no la primera. 2. Un equipo de f´utbol ha determinado contratar un futbolista de talla internacional para el pr´ oximo campeonato. Sean A , B y C eventos que representan el hecho de que el futbolista contratado ha jugado en el Real Madrid, en el Milan y en el Bayern de Munich, respectivamente. Utilice las operaciones de uni´on, intersecci´on y complemento para describir, en t´erminos de A, B y C, dibuje un diagrama de Venn y sombree la regi´on correspondiente a cada uno. (a) Por lo menos el futbolista ha jugado en uno de los tres equipos mencionados anteriormente.
Cap. 2. Ejercicios
28
(b) El futbolista ha jugado en los tres equipos mencionados anteriormente. (c) El futbolista ha jugado en el Real Madrid y no en el Milan. (d) El futbolista s´ olo ha jugado en el Bayern de Munich. (e) El futbolista ha jugado exactamente en uno de los tres equipos mencionados anteriormente. 3. Los estudiantes de un curso de estad´ıstica se clasifican como estudiantes de administraci´ on, econom´ıa o ingenier´ıa; como repitente o no repitente y tambi´en como hombre o mujer. Encuentre el n´umero total de clasificaciones posibles para los estudiantes de dicho curso. 4. Supongamos que 7 personas se quieren organizar en una fila. ¿De cu´antas maneras diferentes pueden hacerlo? 5. La mayor accionista de una determinada empresa decide que en el futuro se divida el presupuesto de publicidad entre tres agencias. Seis son las agencias que se est´ an considerando para este trabajo. ¿Cu´antas son las posibles elecciones de tres agencias? 6. Las placas para autos en Barranquilla antes ten´ıan dos letras y cuatro n´umeros. El sistema de nomenclatura cambi´o y ahora son de tres letras y tres n´umeros. Con el sistema actual, ¿aument´o o disminuy´o el n´umero de placas que se pueden emitir? ¿En qu´e porcentaje? 7. En una comunidad el 30% de las personas son fumadoras, 55% son bebedoras y 20% tanto fumadoras como bebedoras. Calcule la probabilidad de que una persona elegida al azar (a) fume pero no beba, (b) ni fume ni beba, (c) fume o no beba. Interprete siempre sus resultados. 8. Para un control de calidad se seleccionan aleatoriamente dos abanicos sin reemplazo de un lote. Si uno de los dos abanicos est´a defectuoso, todo el lote se rechaza. Si una muestra de 200 abanicos contiene cinco defectuosos calcule la probabilidad de que la muestra sea rechazada. 9. La siguiente tabla recoge las proporciones de adultos en cierta ciudad, clasificadas en aquellos que fuma o no fuman y aquellos que tiene problemas de salud. Problemas S´ı No
Fuman 0,15 0,18
No fuman 0,09 0,58
(a) ¿Cu´ al es la probabilidad de que un adulto de esta poblaci´on elegido al azar tenga problemas de salud? (b) ¿Cu´ al es la probabilidad de que un adulto de esta poblaci´on elegido fume? (c) ¿Cu´ al es la probabilidad de que un adulto de esta poblaci´on elegido al azar que no fume tenga problemas de salud? 10. En cierta empresa, 31% de los empleados son europeos, 42% son asi´ aticos y 27% son latinoamericanos. De los empleados europeos, 34% son mujeres; de los asi´aticos, 42% son mujeres; mientras que de los latinoamericanos, 72% son mujeres. (a) ¿Cu´ al es la probabilidad de que un empleado seleccionado al azar sea una (mujer) europea? ¿(Hombre) asi´atico? (b) ¿Cu´ al es la probabilidad de que un empleado seleccionado al azar sea una mujer? ¿Hombre? (c) Si un empleado seleccionado al azar es una mujer, ¿cu´al es la probabilidad de que sea europea? ¿Asi´atica? ¿Latinoamericana?
Cap. 2. Ejercicios
29
(d) Repita el inciso anterior, teniendo en cuenta que el empleado seleccionado sea un hombre. 11. Una empresa fabrica computadores, cuyo disco duro tienen capacidad de 20 GB y otros con capacidad de 30 GB. En el mes anterior, 35% de los computadores vendidos han sido los que tienen disco duro de 20 GB. De los compradores de computadores con disco duro de 20 GB, 45% compran los que tienen una memoria RAM de 356 MB, mientras que el 30% de los compradores de computadores con disco duro de 30 GB tambi´en lo hacen as´ı. Si sabemos que un comprador seleccionado al azar ha comprado un computador con memoria RAM de 356 MB, ¿cu´ al es la probabilidad de que tenga un computador con disco duro de 30 GB? 12. Una prestigiosa Universidad de Barranquilla utiliza tres hoteles locales para proporcionar hospedaje nocturno a sus profesores invitados. Supongamos que a 25% de los profesores se les asignan habitaciones en el Hotel Las Nieves, al 45% en el Hotel El Mar y al 30% en el Hotel San Felipe. Si hay una decorado especial en 3% de la habitaciones del Hotel Las Nieves, 5% del Hotel El Mar y en 8%de las habitaciones del Hotel San Felipe, ¿cu´al es la probabilidad de que (a) a un cliente se le asigne una habitaci´ on con decorado especial? (b) a una persona con una habitaci´ on que tiene un decorado especial se le haya acomodado en el Hotel El Mar? 13. Una emisora de bonos municipales tiene tres categor´ıas de clasificaci´ o n (A, B y C). Suponga que el a˜ no pasado, de los bonos municipales que se emitieron en cierto pais, 70% tuvieron clasificaci´on A, 20% clasificaci´on B y 10% clasificaci´on C. De los bonos municipales con clasificaci´on A, 50% fueron emitidos en ciudades, 40% en suburbios y 10% en ´areas rurales. De los bonos municipales con clasificaci´on B , 60% fueron emitidos en ciudades, 20% en suburbios y 20% en ´areas rurales. De los bonos municipales con clasificaci´ on C , 90% fueron emitidos en ciudades, 5% en suburbios y 5% en ´areas rurales. (a) ¿Qu´e proporci´on de bonos municipales emiten las ciudades? ¿Los suburbios? ¿Las ´areas rurales? (b) Si una ciudad emitiera un nuevo bono municipal, ¿cu´ al seria la probabilidad de que tuviera clasificaci´on A? 14. Se les pregunt´ o a los suscriptores de un peri´odico local si le´ıan regularmente, ocasionalmente o nunca la secci´on de deportes y, tambi´en, si hab´ıan practicado f´utbol durante el a˜ no anterior. La proporciones obtenidas en la encuesta figuran en la siguiente tabla. F´u tbol S´ı No
Lee regularmente 0,21 0,10
Lee ocasionalmente 0,16 0,04
Nunca lee 0,31 0,18
(a) ¿Cu´ al es la probabilidad de que un suscriptor elegido al azar nunca lea la secci´on de deportes? (b) ¿Cu´ al es la probabilidad de que un suscriptor elegido al azar haya jugado f´utbol durante el a˜no pasado? (c) ¿Cu´ al es la probabilidad de que un suscriptor que nunca lea la secci´on de deportes haya jugado f´ utbol durante el a˜no pasado? (d) ¿Cu´ al es la probabilidad de que un suscriptor que ha jugado f´utbol durante el a˜no pasado nunca lea la secci´on de deportes? (e) ¿Cu´ al es la probabilidad de que un suscriptor que no lea regularmente la secci´on de deportes haya jugado f´utbol durante el a˜no pasado?
Cap. 2. Ejercicios
30
15. Suponga que las proporciones de fenotipos sangu´ıneos en determinada poblaci´on son los siguientes: A : 35%, B : 28%, AB : 13% y O : 24%. Supongamos que los fenotipos de dos personas seleccionadas al azar son independientes entre s´ı. ¿Cu´al es la probabilidad de que ambos fenotipos sean O ? 16. Se clasifican muestras de hule de espuma de tres proveedores de acuerdo a si cumplen o no con las especificaciones. Los resultados de 100 muestras se resumen a continuaci´on: Proveedor 1 2 3
S´ı cumple 17 18 50
No cumple 3 10 2
Si A denota el evento de que una muestra es del proveedor 1 y si B denota el evento de que una muestra cumple con las especificaciones, determine si A y B son independientes. ¿Son independientes A y B? 17. Se seleccion´o una muestra de 570 encuestados en una cierta ciudad para recoger informaci´ on acerca del comportamiento de los consumidores. Entre las preguntas estaba: “¿Disfruta usted comprando ropa?” De 270 hombres, 165 respondieron que s´ı. De 300 mujeres, 224 respondieron que s´ı. (a) Suponga que el participante elegido es mujer. ¿Cu´ al es la probabilidad de que no disfrute comprando ropa? (b) Suponga que el participante elegido disfruta comprando la ropa. ¿Cu´ al es la probabilidad de que la persona sea hombre? (c) Los eventos disfrutar comprando ropa y sexo del participante, ¿son estad´ısticamente independientes? Explique. 18. Una compa˜ n´ıa de seguros estima que el 30% de los accidentes de autom´ovil son debidos al estado de embriaguez del conductor y que el 20% provocan heridos. Adem´as, el 40% de los accidentes que dan lugar a heridos son debidos al estado de embriaguez del conductor (a) ¿Cu´ al es la probabilidad de que un accidente elegido al azar haya sido causado por el estado de embriaguez del conductor y haya dado lugar a heridos? (b) ¿ Son los sucesos debido al estado de embriaguez del conductor” y “da lugar a heridos” independientes? (c) Si un accidente elegido al azar es causado por el estado de embriaguez del conductor, ¿cu´ al es la probabilidad de que haya dado lugar a heridos? (d) ¿Cu´ al es la probabilidad de que un accidente elegido al azar haya sido provocado por el estado de embriaguez del conductor y no haya dado lugar a heridos?
CAP´ITULO
3
Distribuciones de probabilidad
3.1
Variables aleatorias discretas
1. Variable aleatoria. R. Se clasifica en discreta o continua. X : Ω
−
→
2. Variable aleatoria discreta. Tiene una cantidad o finita o (infinita) enumerable de valores.
on de probabilidad f de X. 3. Funci´ [0, 1 ] tal que Una funci´on f : R
−
→ f(x) =
P(X = x), si x = x 1, x2, . . .; de otra forma. 0,
Es claro que: (a) f(x) ≥ 0 para todo valor x real. (b)
f(x) = 1 .
x∈R
(c) La gr´ afica de f es un histograma de probabilidad.
on de distribuci´on acumulada de X. 4. Funci´ [0, 1 ] definida por Una funci´on F : R
−
→
F(t) = P(X
≤ t)
5. Propiedades de F. (a) 0
≤ F(t) ≤ 1.
(b) F es creciente y escalonada. (c) F(− ) = 1 y F( ) = 0 .
∞
∞
=
x; x t
≤
f(x),
para todo t real.
3.2 Variables aleatorias continuas
32
6. Comentarios generales. = a)) no siempre es cero. (a) P(X = a
≤ b) b ) = F( F (b) − F(a). = F( (c) P(a ≤ X ≤ b) b ) F (b) − F(a). = P( b ) P (a < X ≤ b) b ). (d) P(a ≤ X ≤ b) (b) P(a < X
omo omo se calcula f a partir de F? 7. ¿C´ Si a − es el valor val or m´aximo axi mo posib p osible le de d e X que es estrictamente menor que a , entonces, f(a) = F(a) − F(a−)
8. Esperanza y varianza.
E(X) =
·
xk f(xk),
k
V (X) =
(xk − µ )2 f(xk).
·
k
9. Propiedades de la esperanza y varianza. aE(X) + b. (a) E(aX + b) = aE(
(b) V (aX + b) = a2V (X).
2
(c) V (X) = E(X2) − E(X) .
3.2
Variables ariables aleatorias aleatorias contin continuas uas
1. Variable aleatoria. : Ω R. Se clasifica en discreta o continua. X : Ω
−
→
2. Variable aleatoria continua. Tiene una cantidad infinita no enumerable de valores.
on on de densidad f de X. 3. Funci´ [0, ) que cumple las dos condiciones: Una funci´on on f : R
−
→ ∞ b
(a) P(a
≤ X ≤ b) b ) =
f(x) dx, para todo a y b reales.
a
(b) El ´area area bajo toda la gr´afica afica de f es 1, es decir,
∞ ∞
f(x) dx = dx = 1 .
−
La gr´ afica afica de f es una curva.
on on de distribuci´on on acumulada de X. 4. Funci´ [0, 1 ] definida por Una funci´on on F : R
−
→
F(t) = P(X
t
≤ t) t )
=
f(x) dx,
−
∞
para todo t real.
Cap. 3. Ejercicios
33
5. Propiedades de F. (a) 0
≤ F( F (t) ≤ 1 .
(b) F es creciente creciente y continua. continua. (c) F(− ) = 1 y F( ) = 0 .
∞
∞
6. Comentarios generales. = a)) siempre es cero. (a) P(X = a
≤ b) b ) = F( F (b) − F(a). (c) P(a ≤ X ≤ b) b ) = F( F (b) − F(a). (d) P(a ≤ X ≤ b) b ) = P( P (a < X ≤ b) b ) = P( P (a ≤ X < b) = P( P (a < X < b) b). (b) P(a < X
omo omo se calcula f a partir de F? 7. ¿C´ f(x) = F ′ (x), para todo valor de x en donde exista la derivada. 8. Esperanza y varianza. E(X) =
∞ · ∞
x f(x) dx,
−
V ( X) =
∞ ∞
(x − µ )2 f(x) dx.
−
·
9. Propiedades de la esperanza y varianza. Las mismas que en el caso discreto.
Ejercicios 1. ¿Son las siguientes siguientes afirmaciones afirmaciones verdaderas verdaderas o falsas? Justifique Justifique cada respuesta. respuesta. (a) Toda variable variable aleatoria aleatoria es un n´umero. umero. (b) Si f es la funci´on on de probabilidad de una variable aleatoria discreta X y 0 es un posible valor de X , entonces, f (0) = 0 . (c) Para Para cualquier variable variable aleatoria aleatoria discreta discreta X se cumple que P(X = 1 ) = 1 , en donde 1 es un posible valor de X. (d) Si F es la funci´on on de distribuci´on on acumulada de una variable aleatoria X discreta, entonces, F es una funci´on on escalonada. (e) Si X es una variable aleatoria discreta con funci´on on de distribuci´on on acumulada F, entonces, se cumple que P(3 X < 5) = F (5) − F(3).
≤
(f) Si f es la funci´on on de densidad de una variable aleatoria continua X , entonces, f(x) = umero umero real x. P(X = x ), para todo n´ (g) Para Para cualquier variable variable aleatoria aleatoria continua X se cumple que P (X = 1 ) = 1 . (h) Si F es la funci´on on de distribuci´on on acumulada de una variable aleatoria X continua, entonces, F es una funci´on on escalonada (i) Si X es una variable aleatoria continua con funci´on on de distribuci´on on acumulada F, entonces, se cumple que P ( 4 X < 8) = F (8) − F( 4).
≤
(j) Si X es cualquier variable aleatoria y si la variable aleatoria X + 4 tiene esperanza 1, entonces, la esperanza de X es 5.
Cap. 3. Ejercicios
34
2. Una pizzer´ pizzer´ıa, que atiende pedidos por correo, tiene cinco l´ıneas telef´onicas onicas.. Sea X la variable aleatoria que representa al n´umero umero de l´ıneas en uso en un momento moment o espec´ıfico. ıfico. Supongamos que la funci´on on de probabilidad f de X est´a dada en la siguiente tabla: Valor x de X f(x)
0 0,20
1 0,25
2 0,10
3 0,15
4 0,09
5 0,21
Calcule la probabilidad de cada uno de los siguientes eventos: (a) A = “a lo sumo 2 l´ıneas est´an an en uso”. (b) B = “menos “men os de 4 l´ıneas ıne as est´an an en uso”. uso ”. (c) C = “por lo menos 3 l´ıneas ıneas est´an an en uso”. (d) D = “entre 2 y 4 (ambos inclusive) l´ıneas est´an an en uso”. (e) E = “entre 2 y 5 (ambos inclusive) l´ıneas ıneas no est´an an en uso”. (f) (f ) F = “por lo menos 3 l´ıneas no est´an an en uso”. 3. La funci funci´´on on de probabilidad de la variable aleatoria X que representa al n´umero umero de imperfecciones fecciones por 4 metros metros de un papel especial especial en rollos rollos continuos continuos de ancho uniforme, uniforme, est´ a dada por x 0 0,21 f(x) 0,
1 0,28
2 0,10
3 0,25
4 0,16
Determine Determine la funci´ funci´on on de distribuci´on on acumulada de X y repr r epres´ es´ente en tela la gr´afica afi came ment nte. e. 4. Una fabrica fabricante nte de lapice lapiceros ros tiene un progr programa ama de contro controll de calida calidad d que incluye incluye la inspecci´on on de lapiceros recibidos para revisar que no tengan defectos. Supongamos que, en cierto d´ d´ıa, ´el el recibe recib e lapiceros la piceros en lotes de cinco y se seleccionan dos lapiceros de un lote para inspeccionarlos. Podemos representar los posibles resultados del proceso de selecci´on por pares. pares. Por Por ejempl ejemplo, o, el par par (3, 4) representa la selecci´on on de los lapiceros 3 y 4 para inspeccionarlos. (a) Haga una lista de los resultados resultados diferentes. diferentes. (b) Suponga Supongamos mos que los lapice lapiceros ros 3 y 4 son los ´unicos unicos defectuosos de un lote de cinco y se van a escoger dos lapiceros al azar. Defina la variable aleatoria X como el n´umero umero de de lapiceros lapiceros defectuosos defectuosos observado entre los inspeccionado inspeccionados. s. Encuentre Encuentre la funci´ funci´on on de probabilid probabilidad ad de X . (c) Encuentre Encuentre la funci´ funci´ on on de distribuci´on on acumulada acumulada F de X y repr r epres´ es´ente en tela la gr´afica afi camen mente te.. 5. Al invertir en unas acciones acciones particular particulares, es, una persona puede tener una ganancia en un a˜no no de $8.000.000 con probabilidad de 0,4 o tener una p´erdida erdida de $2.000 con probabilidad de 0,6. ¿Cu´ al al es la ganancia esperada de esta persona? p ersona? Interprete su respuesta. 6. El n´ numero u´mero total de horas, medidas en unidades de 10 horas, que una familia utiliza una lavadora en un per p er´´ıodo de 6 meses es una variable continua X con funci´on on de densidad
si 0 < x < 1, 2 − x si 1 x < 2, de otro modo. 0,
x,
f(x) =
≤
(a) Haga Haga un bosquejo bosquejo de la gr´ afica afica de f. (b) ¿Cu´ ¿Cual a´l es la proba probabil bilidad idad de que en un per´ per´ıodo de 6 meses, meses, una famili familiaa utilic utilicee su lavadora menos de 15 horas? ¿Entre 5 y 12 horas?
Cap. 3. Ejercicios
35
7. Suponga que la temperatura de reacci´ on (en grados cent´ıgrados) de cierto proceso qu´ımico es una variable aleatoria continua X con funci´on de densidad f(x) =
1 − x, 0,
si − k x k, de otra manera.
≤ ≤
(a) Halle el valor de k para que f sea en realidad una densidad y, luego, trace la gr´afica de f . (b) Calcule la probabilidad de que la temperatura de reacci´ on sea estrictamente positiva. (c) Calcule la probabilidad de que la temperatura de reacci´ on se encuentre entre 0 y 1/2 grados cent´ıgrados. (d) Calcule probabilidad de que la temperatura de reacci´ on sea menor que −1/4 grados cent´ıgrados o mayor que 1/4 grados cent´ıgrados. 8. Un maestro universitario nunca termina su clase antes de que suene la campana y siempre termina su clase por lo menos 2 minutos despu´es de que suena la campana. Sea X el tiempo (en minutos) que transcurre entre la campana y el t´ermino de la clase, y suponga que la funci´on de densidad de X es f(x) =
kx2 , 0,
si 0 x 2, de otra manera.
≤ ≤
(a) Encuentre el valor de k y luego grafique f . (b) ¿Cu´ al es la probabilidad de que la clase termine por lo menos 1 minuto despu´es de que suene la campana? (c) ¿Cu´ al es la probabilidad de que la clase contin´ue entre 60 y 90 segundos despu´ es de que suene la campana? (d) ¿Cu´ al es la probabilidad de que la clase contin´ue por lo menos 90 segundos despu´ es de que suene la campana? 9. Un vendedor recibe un salario anual de 12.000.000 de pesos, m´a s un 5% del valor de las ventas que realiza. Las ventas anuales pueden representarse mediante una variable aleatoria con media 20.000.000 de pesos y desviaci´on t´ıpica de 2.000.000 de pesos. Halle la media y la desviaci´on del ingreso anual de este vendedor.
CAP´ITULO
4
Distribuciones especiales
1. Distribuciones especiales discretas : Uniforme discreta, de Bernoulli, binomial, de Poisson, hipergeom´ etrica, binomial negativa, geom´etrica, etc. 2. Distribuciones especiales continuas : Uniforme continua, normal, gamma, exponencial, t de Student, Chi-cuadrada, F de Weibull, etc.
4.1
La distribuci´ on uniforme (discreta)
on. 1. Definici´ Una variable aleatoria discreta X con los valores enteros sobre el intervalo [a, b ] ´ n uniforme discreta sobre el conjunto de los n´umeros entiene distribucio 1 teros que est´an en el intervalo [a, b ], cuando se tiene que P(X = x) = b−a +1 , para todo x entero que est´a en el intervalo [a, b ]. Adem´as, E(X) =
4.2
a+b 2
y
V (X) =
(b − a + 1)2 − 1 . 12
La distribuci´ on binomial
1. Experimento de Bernoulli . Aqu´el con s´olo dos resultados posibles: “´ exito” y “fracaso” y en donde un ´exito ocurre con probabilidad p, siendo 0 < p < 1. 2. Experimento binomial . Es un experimento de Bernoulli que se ejecuta n veces, de tal manera que las diferentes ejecuciones se efect´uen independientemente unas de las otras.
on binomial. 3. Distribuci´ Si se realiza n veces un experimento de Bernoulli con probabilidad de ´exito p y si
4.3 La distribuci´on de Poisson
37
X denota al n´ umero total de ´exitos obtenidos, entonces, la probabilidad de que se obtengan k ´exitos es P(X = k ) =
n k
pk (1 − p)n−k,
k = 0 , 1, 2 , . . . , n.
´n La correspondiente distribuci´on de X se conoce con el nombre de distribucio binomial con par´ametros n y p. Adem´ as, E(X) = np y V (X) = np(1 − p).
Fig. 4.1: Distribuci´on binomial para varios n pero fijo np = 3 . Ejemplo 4.2.1 Una moneda no falsa es lanzada 10 veces. Consideraremos el evento “cara” como un ´exito y “sello” como un fracaso. Es claro que p = 0, 5, n = 10 y las condiciones b´asicas que caracterizan a la distribuci´on binomial se satisfacen. Por consiguiente, (a) La probabilidad de tener ´exito exactamente 7 veces es 0,1172. (b) La probabilidad de tener a lo m´ as 7 ´exitos es 0,945. (c) La probabilidad de tener por lo menos 3 ´exitos es 0,945 y la probabilidad de ning´ un ´exito es 9.766 10−4 .
×
4.3
La distribuci´ on de Poisson
1. Experimento y proceso de Poisson . Consideremos las siguientes variables aleatorias: (a) El n´umero de part´ıculas emitidas por cierta sustancia radioactiva en un determinado lapso de tiempo. (b) El n´ umero de llamadas que llegan a una central telef´onica en cierto intervalo de tiempo.
4.3 La distribuci´on de Poisson
38
(c) El n´ umero de ´ordenes de devoluci´on de piezas que recibe una empresa en una semana. (d) El n´umero de veces que falla una pieza de un equipo durante un per´ıodo de tres meses. (e) El n´umero de huelgas anuales en un empresa. Cada una de estas variables aleatorias est´ a asociada a unos procesos llamados procesos de Poisson .
on de Poisson. 2. Distribuci´ Consideremos un proceso de Poisson con par´ametro λ > 0 (es decir, λ es el n´umero promedio de ocurrencias por unidad de tiempo) y sea X el “n´umero de eventos que ocurren en un intervalo de tiempo [0, t ]”. Entonces, la probabilidad de que ocurran k eventos en el intervalo [0, t ] est´a dada por P(X = k ) =
1 −λ k e λ , k !
k = 0 , 1, 2 , 3, . . . .
siendo e la base del logaritmo natural. La correspondiente distribuci´on de X se ´ n de Poisson con par´ conoce con el nombre de distribucio ametro λ. E(X) = V (X) = λ .
Fig. 4.2: Distribuciones de Poisson para varios valores del par´ametro λ. Ejemplo 4.3.1 Los s´ abados por la ma˜ nana, los clientes entran en una peque˜ na tienda de un centro comercial suburbano a una tasa esperada de 0,50 por minuto. Halle la probabilidad de que el n´ umero de clientes que entran en un intervalo espec´ıfico de 10 minutos es (a) 3, (b) a lo m´as 3. SOLUCION: Las hip´ otesis del proceso de Poisson parecen ser razonables en este contexto. Damos por sentado que los clientes no llegan en grupos (o podemos contar al grupo entero como un solo cliente) y que la entrada de un cliente no aumenta ni disminuye la
4.4 La distribuci´on hipergeom´etrica
39
probabilidad de que llegue otro. Para obtener λ , observamos que auna tasa media de 0,50 por minuto durante un periodo de 10 minutos, podemos esperar λ = (0,50)(10) = umero de clientes que entran 5 entradas. Sea X la variable aleatoria que representa al n´ en un intervalo espec´ıfico de 10 minutos. Por tanto, (a) P (X = 3) = 0, 1403 y (b) ◭ P(X 3 ) = 0, 2650.
≤
Ejemplo 4.3.2 La distribuci´on de Poisson ha resultado ser muy ´util en problemas de l´ıneas de espera o colas. Los clientes llegan a una m´ aquina fotocopiadora a una tasa media de 2 cada 5 minutos. En la pr´ actica, se pueden representar los procesos de llegada de esta clase mediante una distribuci´on de Poisson. Asumiendo que ´este es el caso, (a) La probabilidad de que no haya llegadas en un per´ıodo de cinco minutos es 0,135. (b) La probabilidad de que haya 1 llegada es 0,271. (c) La probabilidad de que haya estrictamente m´ as de dos llegadas es 0,323.
◭
on de la binomial a la Poisson . 3. Teorema de aproximaci´ Sea X una variable aleatoria binomial con par´ ametros n y p. Si n es grande (n 100), p peque˜na ( p 0,01) y np tiene un tama˜no moderado (np 20), entonces, la distribuci´on binomial con par´ametros n y p puede aproximarse bien por la distribuci´on de Poisson con par´ametro λ = np . Es decir, bajo estas condiciones se cumple que
≥
≤
b(k ; n; p)
≤
≈
p(k ; np),
k = 0, 1, 2, 3, . . .
≈
P(k ; np),
k = 0 , 1, 2 , 3, . . . .
o, que es equivalente, B(k ; n; p)
Ejemplo 4.3.3 Una cierta compa˜ n´ıa electr´onica produce 15.000 unidades de un tipo especial de tubo al vac´ıo. Se ha observado que, en promedio, 3 tubos de 300 son defectuosos. La compa˜ n´ıa empaca los tubos en cajas de 600. ¿Cu´ al es la probabilidad de que en una caja de 600 tubos hayan (a) 5 tubos defectuosos, (b) por lo menos 3 defectuosos y (c) a lo m´as 1 defectuoso? SOLUCION: Sea X la variable aleatoria que representa al n´umero de tubos defectuosos. Entonces, ametros n = 600 y p = 0,01. Aplicando el teorema X es una variable binomial con par´ de aproximaci´on, tenemos (a) P (X = 5 )0, 161, (b) P(X 3 ) = 0, 938 y (c) P (X 1 ) = ◭ 0, 017.
≥
4.4
≤
La distribuci´ on hipergeom´ etrica
etrico . 1. Experimento hipergeom´ etrico con par´ametros n, M y N En general, un experimento hipergeom´ est´a basado en las siguientes suposiciones (v´ease la figura 4.3):
(H1) La poblaci´ on o conjunto donde deba hacerse el muestreo es una poblaci´on finita con N elementos.
4.4 La distribuci´on hipergeom´etrica
40
(H2) Cada elemento de la poblaci´ on puede ser caracterizado como un ´exito o un fracaso. (H3) Hay M ´exitos en la poblaci´on. (H4) Se elige una muestra sin reemplazo de n individuos, de tal forma que sea igualmente probable seleccionar cada subconjunto de tama˜no n.
Fig. 4.3: Esquema gr´afico de un experimento hipergeom´etrico
on hipergeom´ etrica. 2. Distribuci´ Sea X el n´ umero de ´exitos obtenidos en una muestra escogida al azar al realizar un experimento hipergeom´etrico con par´ametros n, M y N. Entonces, la probabilidad de elegir de manera exacta k ´exitos en n intentos est´a dada por P(X = k ) =
M k
N−M n−k N n
,
donde k = 0, 1 , 2, . . . , n
y n
≤ N. (4.1)
´n La correspondiente distribuci´on de X se conoce con el nombre de distribucio hipergeom´ etrica con par´ametros n, M y N.
M E(X) = n N
·
y
V (X) =
· · · N−n N−1
n
M N
Las distribuciones binomial e hipergeom´ etrica coinciden cuando
1−
M N
.
n N
≤ 0,05.
Ejemplo 4.4.1 Una cantidad de 8 componentes el´ectricas est´an sujetas a un control de calidad. Fue encontrado que 3 de las componentes no estaban defectuosas y las componentes que quedaban s´ı lo estaban. Si una muestra aleatoria de 3 componentes son escogidas de este lote, ¿cu´al es la probabilidad de que (a) exactamente 2 de ellas est´en defectuosas?, (b) a lo m´ as 1 de ellas est´e defectuosa? SOLUCION: Sea X la variable aleatoria que representa al n´umero de componentes defectuosas. Aplicando la distribuci´on hipergeom´etrica con par´ametros n = 3, N = 8 y M = 3, tenemos que (a) P (X = 2 ) = 0, 26786 y (b) P (X 1 ) = 0, 714286. ◭
≤
Ejemplo 4.4.2 Una compa˜ n´ıa recibe un pedido de 20 art´ıculos. Dado que la inspecci´on de cada art´ıculo es cara, se sigue la pol´ıtica de analizar una muestra de 6 art´ıculos de cada env´ıo (seleccionada sin reemplazo y sin orden), aceptando la remesa si no hay m´ as de un art´ıculo defectuoso en la muestra. Entonces, la probabilidad de que sea aceptado un pedido con cinco art´ıculos defectuosos es de 0,516. ◭
4.5 Las distribuciones binomial negativa y geom´etrica
4.5
41
Las distribuciones binomial negativa y geom´ etrica
1. Experimento binomial negativo . Un experimento binomial negativo con par´ametros r y p est´a caracterizado por las siguientes condiciones: (BN1) El experimento consta de una serie de experimentos de Bernoulli y que son independientes entre s´ı. (BN2) La probabilidad de ´exito p de cada experimento de Bernoulli es siempre la misma. (BN3) El experimento contin´ ua hasta que un total de r ´exitos se haya observado, siendo r un entero no negativo dado.
on binomial negativa. 2. Distribuci´ Sea X el n´umero de fracasos que preceden al r-´esimo ´exito en un experimento binomial negativo con par´ametros r y p. Entonces, la probabilidad de que hayan k fracasos antes del r-´esimo ´exito est´a dada por P(X = k ) =
k + r − 1 pr (1 − p)k, r−1
k = 0, 1 , 2, . . . .
´n La correspondiente distribuci´on de X se conoce con el nombre de distribucio binomial negativa con par´ ametros r y p. Adem´as,
E(X) =
r(1 − p) p
y
V (X) =
r(1 − p) . p2
Ejemplo 4.5.1 Una pareja desea tener exactamente dos ni˜ nas en su familia. Tendr´an hijos (ni˜ nos y ni˜ nas) hasta que se satisfaga esta condici´ on. Suponga que la probabilidad de que el hijo que nazca var´on es igual a 0,5 y que X es la variable aleatoria que representa a “n´ umero de varones que nacen antes de que nazca la segunda hembra”. Entonces, (a) La probabilidad de que la familia tenga k hijos varones es P (X = k ) = (k + 1) (0, 5)k+2 . (b) La probabilidad de que la familia tenga a lo m´ as 4 hijos es P (X 2 ) = 0, 688. (c) Se esperar´ıa esta familia tenga E(X) = 2 varones. (d) Se esperar´ıa que esta familia tenga E (X + 2) = 4 hijos.
≤
◭
on geom´ etrica . 3. Distribuci´ Caso especial de la distribuci´on binomial negativa con par´ ametros r = 1 y p. Sea X el n´ umero de fracasos que preceden al primer ´exito en un experimento binomial negativo con par´ametros 1 y p. Entonces, la probabilidad de que haya k fracasos antes del primer ´exito est´a dada por P(X = k ) = bn(k ; 1, p) = p (1 − p)k,
k = 0, 1 , 2, . . . .
´n La correspondiente distribuci´on de X se conoce con el nombre de distribucio 1−p 1−p geom´ etrica con par´ametros p. Adem´ as, E(X) = p y V (X) = p2 .
4.6 La distribuci´on uniforme (continua)
4.6
42
La distribuci´ on uniforme (continua)
on. 1. Definici´ ´ n uniforme con los par´ametros Una variable aleatoria continua X tiene distribucio a y b con a < b si posee la densidad f(x) =
1 b−a ,
≤ ≤
si a x b, de otro modo.
0,
La media y la varianza de X vienen dadas, respectivamente, por (a − b)2 V (X) = . 12
a+b E(X) = , 2
4.7
La distribuci´ on normal
1. Densidad con par´ametros µ Est´a dada por ϕ(x) =
√
2
∈Ry σ
1
2πσ2
−
e
> 0.
(x− µ )2 2σ 2
,
para todo x
∈ R.
La funci´on de distribuci´on acumulada normal la simbolizaremos por Φ. 2. Propiedades de la distribuci´on normal. (a) Si X es normal con µ y σ2, entonces, E(X) = µ y V (X) = σ 2. (b) Hay toda una familia de distribuciones normales. Cada distribuci´ on normal espec´ıfica se distingue por µ y σ (comp´arese con la figura 4.4). (c) En la figura 4.4 podemos observar que: i. La densidad normal es creciente para x < µ y decreciente para x > µ . Es decir, el punto m´as alto de la densidad normal se obtiene cuando x = µ (v´ease la figura 4.4a,b). ii. La densidad normal es sim´ etrica con respecto a µ . iii. Las colas, es decir, los extremos o los lados de la densidad normal se prolongan al infinito en ambas direcciones y nunca tocan el eje horizontal (v´ease la figura 4.4a,b). iv. La desviaci´ on est´andar σ determina el ancho de la curva. (d) La media, la mediana y la moda son todas iguales (v´ease la figura 4.4a). (e) En la figura 4.4c) ilustramos la gr´afica de la distribuci´on acumulada normal para σ1 < σ2.
on normal est´ andar . 3. La distribuci´ Aquella con esperanza 0 y varianza 1. andar . 4. Propiedades de la distribuci´on normal est´
4.7 La distribuci´on normal
43
(a) ϕ con σ = 1 y µ = −3, 0 y 3.
(b) ϕ con µ = 0 y σ = 0, 3, 1 y 3.
(c) Φ con σ 1 < σ 2 .
Fig. 4.4: Gr´aficas de ϕ y Φ para diferentes valores de los par´ametros µ y σ.
• Sim´etrica con respecto a 0. • De la figura 4.5: El ´area de la regi´on I es igual al ´area de la regi´on II. on a la distribuci´on normal est´ andar . 5. Conversi´ Sea X una variable aleatoria que tiene distribuci´on normal con par´ametros µ y σ 2. Entonces, (a) La variable Z =
Z−µ σ
tiene distribuci´ on normal est´andar.
(b) Para todo a real, se cumple que P(X
≤ a) = P
≤ Z
a−µ σ
.
Ejemplo 4.7.1 Una compa˜ n´ıa fabrica focos con vida media de 500 horas y desviaci´ on est´ andar de 100. Si se supone que los tiempos de vida ´util de los focos se distribuyen normalmente, esto es que los tiempos de vida forman una distribuci´on normal, entonces, la probabilidad de que cierta cantidad de focos duren entre 650 y 780 horas es aproximadamente 0,0642. ◭
on de la binomial a la normal . 6. Teorema de aproximaci´ Consideremos un experimento binomial con par´ ametros n y p. Entonces, si (a) on binomial se puede n 30 o (b) np 5 y n(1 − p) 5 , entonces, la distribuci´
≥
≥
≥
4.7 La distribuci´on normal
44
Fig. 4.5: Las ´areas de las regiones I y II son iguales en la distibuci´on normal est´andar
aproximar a la distribuci´on normal con µ = np y σ2 = np(1 − p). Si X es una variable aleatoria que tiene distribuci´on binomial con par´ametros n y p , entonces, P(X
≤ k )
= B(k ; n; p)
≈
Φ
k + 0, 5 − np np(1 − p)
.
Ejemplo 4.7.2 Un fabricante sabe por experiencia que, de 17.000 productos, el 4% es rechazado por defectos. Si un nuevo lote de 800 unidades se van a inspeccionar, entonces, la probabilidad aproximada de que menos de 35 unidades sean rechazadas es aproximadamente 0,6736. ◭
7. Las medidas de curtosis y la distribuci´on normal. Con la curtosis se estudia la deformaci´on, en sentido vertical, respecto a la normal, de una distribuci´on (v´ease la figura 4.6).
(a) Platic´ urtica.
(b) Mesoc´ urtica.
(c) Liptoc´ urtica.
Fig. 4.6: Diversos tipos de curvas clasificadas de acuerdo a su apuntamiento.
8. Medidas de curtosis . Sea X una variable aleatoria continua o discreta. Entonces, el coeficiente de curtosis de X se define como la diferencia de la divisi´on de la cuarta potencia de la esperanza de la variable X − E(X) y el cuadrado de la varianza de X y 3, es decir, κ =
E [X − E(X)]4 [V (X)]2
− 3.
4.8 Las distribuciones gamma y exponencial
45
De igual manera, el coeficiente de curtosis de un conjunto de datos x 1, . . ., xn con frecuencias f1, . . . , fn se define como la diferencia de la divisi´on entre la media aritm´etica de los datos (x1 − x)4, . . ., (xn − x)4 y el cuadrado de la varianza de los datos originales. Es decir, κ =
f1(x1 − x)4 +
4 n(xn − x) /N
··· + f
(Varianza de los datos x1, . . ., xn)2
− 3,
···
+ f n. El coeficiente de curtosis estandarizado, siendo N := f1 + simbolizado por κs se define como el cociente entre el coeficiente de curtosis κ y la raiz cuadrada de 6/N. Es decir, κs =
κ
6/N
.
Una distribuci´ on es mesoc´ urtica (apuntamiento igual al de la normal ) cuando κ = 0 ; es leptoc´ urtica (apuntamiento mayor que el de la normal) si κ > 0 y es platic´ urtica (apuntamiento menor que el de la normal) si κ < 0.
4.8
Las distribuciones gamma y exponencial
on gamma y sus propiedades . 1. La funci´ ´ n gamma Γ : (0, ) R se define como La funcio Γ (α ) :=
∞ ∞ −→
e−t tα−1 dt,
para todo α > 0.
0
2. Propiedades de la funci´on gamma. (a) Para cualquier α > 0, se cumple que Γ (α + 1) = αΓ (α ). (b) Para cualquier n´ umero natural n, tenemos que Γ (n) = (n − 1)!. (c) Γ 12 = π .
√
on gamma. 3. La distribuci´ ´ n gamma con par´ Una variable aleatoria X tiene distribucio ametros α > 0 y β > 0 si su funci´on de densidad est´ a dada por f(x; α ; β) =:
1 βα Γ (α)
xα−1 e−x/β para x > 0
de otra manera.
0,
´ n gamma Cuando β = 1 , la distribuci´on se conoce con el nombre de distribucio ´ndar. Adem´ esta as, E(X) = αβ y V (X) = αβ 2.
on gamma incompleta. 4. La distribuci´ Sea X una variable aleatoria que tiene distribuci´on gamma est´andar con par´ametro ´ n gamma incompleta on F recibe el nombre de funcio α . La siguiente funci´ t
F(t; α ) =
1 e −x xα−1 dx, Γ (α )
0
x > 0,
4.8 Las distribuciones gamma y exponencial
46
(a) α = 1 , 2 , 3 y β = 1 .
(b) α = 2 y β = 2,1, 21 .
Fig. 4.7: Densidad f de la distribuci´on gamma para diferentes valores de α y β. Hay tablas muy completas para la funci´on gamma incompleta. En el ap´ endice presentamos una peque˜ na tabulaci´ on de esta funci´ on para α = 1 , 2 , . . . , 1 0 y x = 1 , 2 , . . . , 1 5 (v´ease la tabla D.4 del ap´endice).
alculo de probabilidades a partir de la gamma . 5. C´ Ejemplo 4.8.1 Suponga que el tiempo de reacci´on X a cierto est´ımulo en un individuo seleccionado al azar tiene distribuci´on gamma est´ andar con par´ametro α = 2 . Sea F la funci´ on gamma incompleta de X. Teniendo en cuenta la tabla D.4 del ap´endice, entonces, la probabilidad de el tiempo de reacci´on se encuentre entre 3 y 5 (ambos inclusive) es P (3 X 5 ) = F (5; 2) − F(3; 2) = 0, 159. ◭
≤ ≤
La funci´on gamma incompleta tambi´en la podemos utilizar para calcular probabilidades en las que aparezcan distribuciones gamma que no sean est´ andar.
4.8 Las distribuciones gamma y exponencial
47
Sea X una variable aleatoria que tiene distribuci´ on gamma con par´ ametros α y β. Si F es la funci´ on gamma incompleta de una variable aleatoria gamma est´ andar con par´ ametro α , entonces, para todo t > 0, se cumple que t ; α . P(X t) = F β Teorema 4.8.2
≤
Ejemplo 4.8.3 Suponga que el tiempo X de supervivencia en semanas de un rat´on macho seleccionado al azar y expuesto a 240 rads de radiaci´on gamma tiene una distribuci´ on gamma con α = 8 y β = 15 . Determine la probabilidad de que un rat´on sobreviva (a) entre 60 y 120 semanas y (b) por lo menos 30 semanas. SOLUCION: Sea F la funci´on gamma incompleta de una variable aleatoria gamma est´ andar con par´ ametro α = 8 . Entonces, la probabilidad de que un rat´on sobreviva entre 60 y 120 semanas es
≤ X ≤ 120)
P (60
= F
120 ;8 15
− F
60 ;8 15
= 0, 496.
◭
ametro λ > 0. 6. La densidad exponencial con par´ Est´a dada por 0, para x < 0, f(x; λ) = λe−λx, para x 0.
≥
La distribuci´on exponencial es un caso especial de la distribuci´on gamma en la que 1 α = 1 y β se ha reemplazado por 1/λ. En este caso, E(X) = λ y V (X) = λ12 .
Fig. 4.8: Distribuci´on exponencial para β = 2,1, 21 , siendo β = 1/λ. Ejemplo 4.8.4 El tiempo de atenci´on al cliente en un servicio de informaci´o n de una biblioteca sigue una distribuci´ on exponecial, con un tiempo de servicio medio de 5 minutos. Entonces, la probabilidad de que una consulta de un cliente dure m´ as de 10 minutos es 0,135335. ◭
4.9 Resumen de las distribuciones especiales
4.9
48
Resumen de las distribuciones especiales
En las tablas 4.1 y 4.2 (al final de este cap´ıtulo) presentamos un resumen de las distribuciones continuas y discretas, respectivamente, m´as importantes. NOMBRE
FUNCION 1 , f(x) = b− a a
Uniforme Normal
f(x) =
2πσ2
f(x) = x f(x) =
√ 1
(x− µ )2 2σ 2
µ
e
− x2
∈R
xα−1 e−x/β,
√ ,
Γ ( n nπ 2 )
an :=
σ2
0
1
,
x
n 2
αβ
αβ2
1 λ
1 λ2
n
∈N
0,
n , n−2
n
∈R n>0
≥ 2
n
≥ 3
n
2n
n , n−2
2n2 (m+n−2) , m(n−2)2 (n−4)
, x>0
m −1
an x 2 (n+mx)( m + n ) /2
n Γ ( m + mm/2 nn/2 2 )
Γ ( m Γ n 2 ) ( 2 )
β>0 λ>0
1 n −1 −x/2 2 , e an x
f(x) =
µ
∈ R,
α > 0,
−(n+1)/2
x2 n
1 Γ ( n + 2 )
an := 2 n/2Γ
a+b 2
,
Chi-cuadrada
V (X) (a−b)2 12
2
2π
1 βα Γ (α)
E(X)
σ2 > 0
∈R
f(x) = a n 1 + an :=
F de Fisher
,e
a
x>0 f(x) = λe −λx, x>0
Exponencial
t de Student
−
√ 1 x
Normal est´ andar Gamma
PARAMETROS
m, n
∈N
, x>0
Tabla 4.1: Resumen de distribuciones continuas
n
≥ 3
n
≥ 5
Cap. 4. Ejercicios
49
Ejercicios 1. Con el prop´ osito de establecer el grado de aceptaci´on de su producto, una empresa selecciona una muestra de 1.000 consumidores de una poblaci´on de 1.000.000, de forma tal que cada uno de los elementos de la poblaci´ on tiene la misma probabilidad de ser seleccionado. A cada consumidor seleccionado se le pregunta si prefiere el producto producido por esta empresa o no. ¿Es este un experimento binomial? Explique su respuesta. 2. Un fabricante de celulares, desea controlar la calidad de su producto y rechazar cualquier lote en el que la proporci´on de celulares defectuosos sea demasiado alta. Con este fin, de cada lote grande (digamos, 20.000 celulares) selecciona y prueba 25. Si por lo menos 3 de ´estos est´an defectuosos, todo el lote ser´a rechazado. (a) ¿Cu´ al es la probabilidad de que un lote sea rechazado si 5% de los celulares est´an defectuosos? (b) ¿Cu´ al es la probabilidad de que un lote sea rechazado si 10% de los celulares est´ an defectuosos? (c) ¿Cu´ al es la probabilidad de que un lote sea rechazado si 30% de los celulares est´ an defectuosos? 3. Una empresa se dedica a la instalaci´ on de nuevos paquetes computacionales. Se ha comprobado que en el 10% de 250 instalaciones es necesario volver para realizar algunas modificaciones. En una semana determinada se realizaron 10 instalaciones. Asumir independencia en los resultados de esas instalaciones. (a) ¿Cu´al es la probabilidad de que sea necesario volver en cinco casos? (b) ¿Cu´ al es la probabilidad de que no sea necesario volver en ninguno los casos? (c) ¿Cu´ al es la probabilidad de que sea necesario volver en m´as de un caso? 4. En un lote de 1.000 bombillas fabricadas por una compa˜ n´ıa, 10 son defectuosas. Utilice la aproximaci´on de la distribuci´on binomial por la de Poisson para calcular la probabilidad de que en una muestra de 20 bombillas, (a) 2, (b) 0, (c) por lo menos 3 sean defectuosas. 5. En cierto estudio se reporta que de cada 100 personas, una fuma. Consideremos una muestra aleatoria de 2.000 personas. (a) ¿Cu´al es la distribuci´on aproximada del n´umero de quienes fuman? (b) Utiliza la aproximaci´ on de la parte (a) para calcular la probabilidad aproximada de que entre 8 y 20 (ambos inclusive) personas fumen. (c) Utiliza nuevamente la aproximaci´ on de la parte (a) para calcular la probabilidad aproximada de que estrictamente entre 12 y 30 personas fumen. 6. Suponga que los buses llegan a cierto terminal de transporte, seg´ un un proceso de Poisson, con tasa α = 8 buses por hora, de modo que el n´umero de llegadas por un periodo de t horas es una variable aleatoria de Poisson con par´ametro λ = 8t . (a) ¿Cu´ al es la probabilidad de que exactamente 5 buses peque˜nos lleguen durante un per´ıodo de una hora? ¿Por lo menos 5? ¿A lo m´as 10? (b) ¿Cu´ ales son el valor esperado y la desviaci´on est´andar del n´umero de buses que llegan durante un per´ıodo de 90 minutos? (c) ¿Cu´ al es la probabilidad de que por lo menos 20 buses lleguen durante un per´ıodo de 2 horas y media? ¿De que a lo sumo 10 lleguen durante este per´ıodo?
Cap. 4. Ejercicios
50
7. Un fabricante de computadores se preocupa por el mal funcionamiento de cierto programa estad´ıstico en un modelo en particular. El mal funcionamiento puede producir en raras ocasiones un bloqueo en el sistema operativo. Suponga que la distribuci´on del n´ umero de computadores por a˜no que tienen un mal funcionamiento del paquete estad´ıstico es la de Poisson con λ = 5 . (a) ¿Cu´ al es la probabilidad de que a lo m´as dos computadores por a˜no tenga un bloqueo en el sistema operativo? (b) ¿Cu´ al es la probabilidad de que m´as de un computador por a˜no tenga un bloqueo en el sistema operativo? 8. Una empresa recibe un pedido de 1.000 art´ıculos. Se analiza una muestra aleatoria de 15 art´ıculos y se acepta el pedido si menos de tres resultan defectuosos. ¿Cu´a l es la probabilidad de aceptar un env´ıo que contenga un 5% de art´ıculos defectuosos? 9. Cada uno de los 13 computadores de cierta marca ha sido devuelto a un proveedor debido al mal funcionamiento de ciertos programas bajo un determinado sistema operativo. Supongamos que 7 de estos 13 tienen problemas con la memoria RAM y los otros 6 tienen problemas con los ejecutables EXE. Si se examinan al azar y sin reemplazo 6 de estos computadores, ¿cu´al es la probabilidad de que (a) exactamente 3, (b) a lo m´as 2, (c) estrictamente entre 2 y 5 computadores tengan problemas con la memoria RAM? 10. Una determinada empresa est´a interesada en evaluar su procedimiento de inspecci´on actual en embarques de 50 art´ıculos id´enticos. El procedimiento es tomar una muestra de cinco y pasar el embarque si no se encuentra m´as de dos defectuosos. ¿Qu´e proporci´on del 20% de embarques defectuosos se aceptar´a? 11. El 10% de los motores armados en una f´ abrica de montaje est´ an defectuosos. Si se seleccionan en forma aleatoria uno por uno y se prueba, calcule la probabilidad de localizar el tercer motor sin defecto (a) en el quinto ensayo,(b) en el quinto ensayo o antes. 12. De acuerdo con un estudio geol´ ogico, en un pozo de exploraci´on petrolera hay 0,2 de probabilidad de encontrar petr´oleo. Calcule la probabilidad de localizar petr´oleo por primera vez en el tercer pozo que se perfore. 13. Se sabe que en cierto proceso de fabricaci´on, en promedio, uno de cada 100 art´ıculos est´a defectuoso. ¿Cu´al es la probabilidad de que el sexto art´ıculo que se inspecciona sea el primer defectuoso que se encuentra. 14. Suponga que el tiempo de reacci´on X (en minutos) a cierto medicamento tiene una distribuci´ on uniforme continua en el intervalo [−5, 5 ]. Calcule la probabilidad de que la temperatura de reacci´on (a) sea estrictamente menor que 0 (b) se encuentre entre − 2, 5 y 2, 5. (c) se encuentre entre k y k + 4 si k satisface − 5 < k < k + 4 < 5. 15. El tiempo X (minutos) para que un profesor prepare un cuestionario tiene una distribuci´on uniforme continua en el intervalo [20, 40 ]. (a) Escriba la funci´ on de densidad, la funci´ on de distribuci´on acumulada y trace sus respectivas gr´aficas. (b) ¿Cu´al es la probabilidad de que el tiempo de preparaci´ on exceda a 35 minutos? (c) ¿Cu´ al es la probabilidad de que el tiempo de preparaci´on se encuentre a 2 minutos del tiempo medio?
Cap. 4. Ejercicios
51
(d) Para cualquier k tal que 25 < k < k + 2 < 35, ¿cu´ al es la probabilidad de que el tiempo de preparaci´on est´e entre k y k + 2 minutos? 16. Se regula una m´ aquina despachadora de caf´ e para que sirva un promedio de 200 mililitros por vaso. Si la cantidad de bebida se distribuye normalmente con una desviaci´ on est´andar de 15 mililitros, (a) ¿qu´e fracci´on de los vasos contendr´an m´as de 191 mililitros? (b) ¿Cu´ al es la probabilidad de que un vaso contenga entre 209 y 224 mililitros? (c) ¿Cu´ antos vasos probablemente se derramar´an si se utilizan vasos de 230 mililitros para las siguientes 1.000 bebidas? (d) ¿Por debajo de qu´e valor obtendremos un 25% de las bebidas m´as peque˜ nas? 17. La vida promedio de cierta maquinaria el´ectrica es 10 a˜nos con una desviaci´on est´andar de dos a˜ nos. El fabricante reemplaza gratis todas las maquinarias que fallen dentro del tiempo de garant´ıa. Si est´a dispuesto a reemplazar s´olo 3% de las maquinarias que fallan y si la duraci´on de una maquinaria sigue una distribuci´on normal, ¿de qu´e duraci´on debe ser la garant´ıa que ofrezca? 18. Los coeficientes de inteligencia de 600 aspirantes a cierta beca escolar en una universidad extranjera se distribuyen aproximadamente normal con media de 115 y desviaci´on est´andar de 12. Si la universidad requiere un coeficiente de inteligencia de al menos 95, ¿cu´ antos de estos aspirantes ser´an rechazados sobre esta base sin importar sus otras calificaciones? 19. Suponga que 90% de todas los trabajadores que hay en una determinada empresa no fuman. Considere una muestra aleatoria de 200 trabajadores y represente con X a la cantidad de trabajadores que fuman. ¿Cu´ al es la probabilidad aproximada de que X (a) sea a lo sumo 30? (b) sea m´as de 30? (c) est´e entre 15 (inclusive) y 25 (no inclusive)? 20. Suponga que s´ olo 80% de todos las personas mayores de 18 a˜nos que viven en cierto pueblo cerca del mar saben nadar. Se selecciona al azar una muestra de 200 personas mayores de 18 a˜nos del pueblo. ¿Cu´al es la probabilidad de que (a) entre 50 y 100 (ambos inclusive) de las personas mayores de 18 a˜nos del pueblo no sepan nadar? (b) menos de 140 de las personas mayores de 18 a˜nos del pueblo sepan nadar? ¿Y m´as de 150? 21. Suponga que el tiempo (en horas) tomado por una cocinea para preparar una deliciosa comida es una variable aleatoria X que tiene una distribuci´on gamma con par´ametros al es la probabilidad de que tarde (a) a lo sumo 1 hora, (b) por lo α = 2 y β = 1/2 . ¿Cu´ menos 2 horas,(c) entre 0,5 y 1,5 horas para preparar la comida? 22. Un reconocido cient´ıfico ha determinado que el tiempo de supervivencia (en semanas) de un animal cuando se le somete a cierta exposici´on de radiaci´on gamma tiene una distribuci´ on gamma con α = 5 y β = 10 . (a) ¿Cu´ al es el tiempo medio de supervivencia de un animal seleccionado al azar del tipo que se utiliz´o en el experimento? (b) ¿Cu´ al es la desviaci´on est´andar del tiempo de supervivencia? (c) ¿Cu´ al es la probabilidad de que un animal sobreviva m´as de 30 semanas? 23. El tiempo de respuesta de una computadora es una aplicaci´ on importante de las distribuciones gamma y exponencial. Suponga que un estudio de cierto sistema de computadoras revela que el tiempo de respuesta en segundos tiene una distribuci´on exponencial con una media de tres segundos. ¿Cu´al es la probabilidad de que el tiempo de respuesta (a) exceda 5 segundos, (b) no exceda 10 segundos?
Cap. 4. Ejercicios
52
24. Suponga que la vida de cierto tipo de bater´ıa tiene una tasa de falla constante anunciada de 0,01 por hora y que tiene distribuci´on exponencial. (a) ¿Cu´ al es el tiempo medio de falla? (b) ¿Cu´ al es la probabilidad de que pasen 300 horas antes de que se observen dos fallas? on Plot . . .Probability Distributions . . .Binomial de Statgraphics, realizar: 25. Utilizando la opci´ (a) Los ejemplos 3.5.4 y 3.5.6 de [11]. (b) Los ejercicios 37, 39 (partes b y c), 43 (partes a,b,c y d) y 51 de [11]. on Plot . . .Probability Distributions . . .Poisson de Statgraphics, realizar 26. Utilizando la opci´ los ejemplos 3.6.2, 3.6.3, 3.6.4, 3.6.5, 3.6.9 y 3.6.10 de [11]. on Plot . . .Probability Distributions . . .Poisson de Statgraphics, realizar 27. Utilizando la opci´ los ejercicios 53, 55, 57, 61 (incisos a y c) y 63 de [11]. on Plot . . .Probability Distributions . . .Hypergeometric de Statgraphics, 28. Utilizando la opci´ realizar: (a) Los ejemplos 3.7.1, 3.7.3, 3.7.4 y 3.7.5 de [11]. (b) Los ejercicios 65, 67, 69, 73 y 77 (inciso b) de [11]. on Plot . . .Probability Distributions . . .Negative Binomial de Statgraphics, 29. Utilizando la opci´ realizar: (a) El ejemplo 3.8.2 (incisos b y c) de [11]. (b) Los ejercicios 80 y 84 de [11]. on Plot . . .Probability Distributions . . .Geometric de Statgraphics, reali 30. Utilizando la opci´ zar: (a) El ejemplo 3.8.6 (incisos a,b) de [11]. (b) Los ejercicios 81, 85, 87 y 89 de [11]. on Plot . . .Probability Distributions . . .Uniform de Statgraphics, realizar: 31. Utilizando la opci´ (a) Los ejemplos 4.3.2 y 4.3.3 de [11]. (b) Los ejercicios 24, 25 (inciso b), 26 y 28 (incisos a y b) de [11]. on Plot . . .Probability Distributions . . .Normal de Statgraphics, realizar: 32. Utilizando la opci´ (a) Los ejemplos 4.4.2, 4.4.4, 4.4.6 y 4.4.7 de [11]. (b) Los ejercicios 30 (incisos a, b, c y d), 32 (incisos b y c), 35, 36 y 41 (incisos a y b) de [11]. on Plot . . .Probability Distributions . . .Gamma de Statgraphics, realizar: 33. Utilizando la opci´ (a) Los ejemplos 4.5.8 y 4.5.12 de [11]. (b) Los ejercicios 50, 51, 53 y 55 (inciso c) de [11]. on Plot . . .Probability Distributions . . .Exponential de Statgraphics, re 34. Utilizando la opci´ alizar: (a) Los ejemplos 4.5.15 y 4.5.16 de [11]. (b) Los ejercicios 57, 58, 59 (inciso b), 60, 61 y 63 (inciso b) de [11].
NOMBRE
FUNCION
Uniforme
f(xk) =
PARAMETROS
1 , n
x1 < x2 <
k = 1, 2, . . . , n
De dos puntos Bernoulli Binomial Poisson Hipergeom´etrica Binomial negativa Geom´etrica
f(x1) = p , f(x2) = 1 − p f(0) = p , f(1) = 1 − p k (1 − p)n−k f(k ) = n k p k = 0, 1, 2, . . . , n f(k ) = k1! e−λ λk k = 0, 1 , 2, 3, . . . N−M (M k ) ( n − k ) N (n) k N0, k n , k M
n
∈
f(k ) =
≤ k+r−1 r−1
≤
pr (1 − p)k
k = 0, 1, 2, . . . f(k ) = p (1 − p)k
··· < x
n
∈N
1 n
n
1 n
xk
k=1
1 −n
n
x2k−
k=1 n
2
xk
k=1
x1 < x2 0
x1 p + x2(1 − p)
(x1 − x2)2 p(1 − p)
p
p(1 − p)
0
0
np
np(1 − p)
λ
λ
∈
M
V (X)
E(X)
C a p . 4 . E j e r c i c i o s
∈ N , N ∈ N, n ∈ N n ≤ M ≤ N 0
n
·
M N
r > 0,
r(1−p) p
0
1−p p
· · · N−n N−1
n
M N
1−
M N
r(1−p) p2 1−p p2
k = 0, 1 , 2, . . .
Tabla 4.2: Resumen de distribuciones dicretas
5 3
CAP´ ITULO
5
Distribuciones conjuntas
5.1
Vectores aleatorios discretos
1. Vectores aleatorios. Vectores (es decir, tuplas ordenadas), digamos, de la forma (X1 , X2 , . . . , Xn ) cuyas componentes X1 , X2 , . . ., Xn son variables aleatorias. Pueden ser discretos, continuos o mixtos. 2. Vectores aleatorios discretos. Si todas las componentes del vector son discretas. 3. Funci´ on de probabilidad conjunta f de (X, Y ). Una funci´on f : R2 [0, 1 ] tal que
−
→
para todo i, j = 1,2,. . ..
f(xi , yk ) := P (X = x i , Y = y k ), Es claro que:
(a) f(xi , yk ) ≥ 0 para todo valor x i de X y para todo valor y k de Y . (b)
i
f(xi , yk ) = 1 .
k
4. Funci´ on de distribuci´ on acumulada de X. 2 Una funci´on F : R [0, 1 ] definida por
−
→
≤ x, Y ≤ y)
F(x, y) = P(X
=
f(xi , yk ).
xi con yk con xi ≤x yk ≤y
para todo x y y reales. 5. Funci´ on de probabilidad marginal. (a) De la variable X : fX (xi ) := P(X = x i ) =
k
f(xi , yk ),
para todo i = 1, 2 , . . ..
5.1 Vectores aleatorios discretos
55
(b) De la variable Y : fY ( yk ) := P(Y = y k ) =
para todo k = 1, 2,. ...
f(xi , yk )
i
6. Funci´ on de dist. acumulada marginal.
≤ t)
FX (t) := P(X
:=
fX (xi ),
≤ t)
FY (t) := P (Y
xi ≤t
:=
fY ( yk ).
yk ≤t
7. Funci´ on de probabilidad condicional de Y , dado X = x . h ( y/x) =
8. Independencia. X y Y independientes
f(x, y) , fX (x)
para todo y real.
f(x, y) = fX (x) fY ( y).
⇐⇒
9. Covarianza de X y Y . Si X y Y tienen varianza finita, entonces, Cov(X, Y ) := E [X − E(X)][Y − E(Y )]
= E(XY ) − E(X)E(Y ).
10. Coeficiente de correlaci´ on de X y Y . Si X y Y tienen varianza finita y positiva, entonces, Corr(X, Y ) :=
11. Propiedades. (a) X, Y independientes
Cov(X, Y ) = 0 .
(b) X, Y independientes
Corr(X, Y ) = 0 .
(c) −1
⇒⇒ ≤ ⇐⇒
≤ Corr(X, Y )
Cov(X, Y )
V (X) V (Y )
.
(Rec´ıproco no es cierto) (Rec´ıproco no es cierto)
1 .
(d) Corr(X, Y ) = 1 ´o −1
existen m, r reales con m = 0 , tales que Y = mX + r.
12. Esperanza y varianza condicional de Y dado que X = x . E(Y/X = x ) =
y h ( y/x),
V (Y/X = x ) =
y
( y − E(Y/X = x )
y
13. Propiedades de la esperanza y de la varianza condicional .
(a) E(Y) = E E(Y/X) .
(b) V (Y/X) = E Y − E(Y/X) (c) E V (Y/X)
2
2
= E(Y 2 /X) − E(Y/X) .
= E(Y 2 ) − E [E(Y/X)]2 .
(d) V E(Y/X) = E [E(Y/X)]2 − [E(Y )]2 . (e) V (Y ) = E V (Y/X) − V E(Y/X) .
2
h ( y/x).
5.2 Vectores aleatorios continuos
5.2
56
Vectores aleatorios continuos
1. Vector aleatorio. Vectores (es decir, tuplas ordenadas), digamos, de la forma (X1 , X2 , . . . , Xn ) cuyas componentes X1 , X2 , . . ., Xn son variables aleatorias. Pueden ser discretos, continuos o mixtos. 2. Vectores aleatorios continuos. Si todas las componentes del vector son continuas. 3. Funci´ on de densidad conjunta f de (X, Y ). Una funci´on f : R2 [0, ) que cumple las dos condiciones:
−
→ ∞
(a) P(a
bd
≤ X ≤ b, c ≤ Y ≤ d)
=
f(x, y) dxdy.
ac
(b) El volumen bajo toda la superficie de f es 1, es decir,
∞ ∞ ∞∞
−
4. Funci´ on de distribuci´ on acumulada de X. Una funci´on F : R2 [0, 1 ] definida por
−
→
t
≤ s, Y ≤ t)
F(s, t) = P (X
f(x, y) dxdy = 1 .
−
s
=
f(x, y) dx dy,
−
−
∞∞
para todo s y t reales. 5. Funci´ on de densidad marginal. (a) De la variable X : fX (x) :=
∞ ∞ ∞ ∞
f(x, y) dy,
para todo x real.
f(x, y) dx,
para todo y real.
−
(b) De la variable Y : fY ( y) :=
−
6. Funci´ on de dist. acumulada marginal. t
≤ t)
FX (t) := P(X
:=
t
fX (x) dx,
≤ t)
FY (t) := P (Y
−
∞
7. Funci´ on de probabilidad condicional de Y , dado X = x . h ( y/x) =
8. Independencia. Igual que en el caso discreto. 9. Covarianza de X y Y . Igual que en el caso discreto.
f(x, y) , fX (x)
para todo y real.
=
fY ( y) dy.
−
∞
Cap. 5. Ejercicios
57
10. Coeficiente de correlaci´ on de X y Y . Igual que en el caso discreto. 11. Propiedades. Igual que en el caso discreto. 12. Esperanza y varianza condicional de Y dado que X = x . E(Y/X = x ) =
∞ ∞
y h ( y/x) dy,
V ( Y/X = x ) =
−
∞ ∞
y − E(Y/X = x )
−
2
h ( y/x) dy.
13. Propiedades de la esperanza y de la varianza condicional . Las mismas que en el caso discreto.
Ejercicios 1. Un investigador sospecha que en cierto pa´ıs, el n´umero diario de cigarrillos que fuman los estudiantes durante la semana de ex´ amenes finales (variable X) puede depender del n´umero de ex´amenes que el estudiante debe realizar en el d´ıa (variable Y ) . La tabla de abajo muestra las probabilidades conjuntas estimadas en un estudio: f(x, y) X = 0
1 2 3
Y = 0
0,09 0,06 0,14 0, 04
1 0,07 0,01 0,03 0,04
2 0,01 0,07 0,06 0,04
3 0,06 0,07 0,07 0,14
(a) Halle la funci´ on de probabilidad marginal de X y la de Y . (b) ¿Cu´ al es la probabilidad que un estudiante seleccionado al azar fume por lo menos 2 cigarrillos y tenga que hacer 3 ex´amenes en un d´ıa? 2. Un agente inmobiliario est´a interesado en averiguar cu´al es la relaci´on entre el n´umero de l´ıneas de un anuncio en prensa sobre un apartamento y el volumen de demanda de informaci´ on por parte de posibles inquilinos. Representemos el volumen de demanda mediante la variable aleatoria X, que toma el valor 0 si despierta poco inter´es, 1 para un inter´ es moderado, y 2 si despierta un fuerte inter´ es. Sea Y la variable aleatoria que representa al n´umero de l´ıneas del anuncio. El agente estima que la funci´on de probabilidad conjunta es la que aparece en la tabla de abajo. f(x, y) Y = 3 X = 0 0 ,08
1 2
0,13 0,10
4 0,07 0,22 0,15
5 0,04 0,10 0,11
(a) Si F es la funci´on acumulada conjunta de X y Y , halle F (1, 4) e interprete el resultado. (b) Halle la funci´ on de probabilidad marginal de Y y, con ello, halle la probabilidad de que Y = 5 . 3. Una vinater´ıa cuenta con instalaciones para atender a clientes que llegan en autom´ ovil y a quienes llegan caminando. En un d´ıa seleccionado aleatoriamente, sean X y Y , respectivamente, los per´ıodos de tiempo que se utilizan para cada caso. La funci´on de densidad conjunta de X y Y es f(x, y) =
2 (x 3
0,
+ 2y),
si 0 x 1 , 0 de otro modo.
≤ ≤
≤ y ≤ 1,
Cap. 5. Ejercicios
58
(a) Verifique si f satisface las propiedades de una funci´on de densidad conjunta. (b) Halle la funci´ on de densidad marginal de X y y la de Y . 4. Un centro de servicios trabaja con dos l´ıneas. En un d´ıa seleccionado al azar, sean X y Y las respectivas proporciones de tiempo de que la primera y segunda l´ıneas est´en en uso. Suponga que X y Y tienen funci´on de densidad conjunta f(x, y) =
3 (x2 2
+ y2 ),
0,
≤ ≤
si 0 x 1 y 0 de otro modo.
≤ y ≤ 1.
(a) Determine la probabilidad de que ninguna l´ınea est´ e ocupada m´as de la mitad del tiempo. (b) Calcule la probabilidad de que la primera l´ınea est´e ocupada m´ as del 65% del tiempo. 5. Sean X y Y dos variables aleatorias continuas con funci´on de densidad conjunta f(x, y) =
k (6 − x − y), 0,
si 0 < x < 2 y 2 < y < 4, de otro modo.
Halle el valor de k y encuentre P (1 < Y < 3/X = 2 ). 6. La tabla siguiente muestra, para los poseedores de entre una y tres tarjetas de cr´edito, las probabilidades conjuntas del n´umero de tarjetas de que dispone (variable X ) y el n´umero de compras a cr´edito realizadas durante una semana (variable Y ). f(x, y) Y = 1
2 3
Y = 0
0,03 0,08 0,13
1 0,07 0,03 0,02
2 0,04 0,09 0,07
3 0,06 0,07 0,08
4 0,10 0,08 0,05
(a) Para una persona elegida aleatoriamente de este grupo, ¿cu´al es la funci´on de probabilidad del n´ umero de compras semanales? (b) Para una persona de este grupo que posea tres tarjetas, ¿cu´al es la funci´on de probabilidad del n´ umero de compras semanales? (c) ¿Son estad´ısticamente independientes el n´umero de tarjetas disponibles y el n´umero de compras realizadas? 7. Sea X el tiempo de reacci´on (en segundos) de un producto a cierto estimulante y Y la temperatura, en grados celsius, a la que la reacci´on comienza a suceder. Estas dos variables aleatorias tienen la funci´on de densidad conjunta f(x, y) =
kxy, 0,
si 0 < x < 1 y 0 < y < 1. de otro modo,
(a) Halle el valor de k . (b) Encuentre la densidad marginal de X y la de Y . (c) Encuentre la funci´ on de distribuci´on acumulada de Y . (d) Encuentre la probabilidad de que la pieza 2 tenga una duraci´ on de vida entre 0,5 y 3 a˜ nos. (e) ¿Son X y Y son independientes?
Cap. 5. Ejercicios
59
8. Mar´ıa y Josefa, dos distinguidas profesoras entregan sus ex´amenes finales a la secretaria de matem´aticas para que sean pasados al computador. Sea X = n´umero de errores en la escritura del examen de la profesora Mar´ıa y Y el n´ umero de errores en el de la profesora Josefa. Suponga que X y Y son independientes y que cada una tiene distribuci´o n de Poisson con par´ametro 2. (a) ¿Cu´ al es la funci´on de probabilidad conjunta de X y Y ? (b) ¿Cu´ al es la probabilidad de que a lo sumo se cometa en total un error en ambos ex´amenes? 9. Una p ersona tiene dos bater´ıas para un reloj en particular. Sean X y Y las variables aleatorias que representan a las duraci´on de la primera y segunda bater´ıas, respectivamente (ambas en horas). Adem´ as, X y Y son independientes y cada una tiene una distribuci´on exponencial con par´ametro 1. (a) ¿Cu´ al es la funci´on de probabilidad conjunta de X y Y ? (b) ¿Cu´ al es la probabilidad de que cada bater´ıa dure a lo sumo 20 horas? (c) ¿Cu´ al es la probabilidad que la duraci´on total de las dos bater´ıas sea a lo sumo 30 horas? (d) ¿Cu´ al es la probabilidad que la duraci´on total de las dos bater´ıas est´e entre 20 y 30 horas? 10. Sean X y Y variables aleatorias que denotan las longitudes de dos dimensiones de una pieza maquinada, respectivamente. Si X y Y son independientes y, adem´as, la distribuci´on de X es normal con media 10,5 mil´ımetros y varianza 0,0025 mil´ımetros cuadrados, y la distribuci´o n de Y es normal con media 3,2 mil´ımetros y varianza 0,0036 mil´ımetros cuadrados, determine la probabilidad de que (a) 10, 4 < X < 10, 6, (b) 3, 15 < Y < 3, 25. 11. Sea X el n´umero de veces en que cierta secretaria se levanta de su puesto para ir al ba˜no: 1, 2 ´o 3 veces en una hora dada. Sea Y el n´umero de veces en que el jefe le llama la atenci´ on a la secretaria. Supongamos que la funci´ on de probabilidad conjunta de X y Y est´ a dada por f(x, y)
Y=1 2 3
X = 1
0,01 0,10 0,07
2 0,09 0,06 0,10
3 0,05 0,18 0,34
(a) Encuentre la funci´ on de probabilidad marginal de X y la de Y . (b) ¿Son X y Y independientes? (c) Encuentre P(Y = 2/X = 3 ) e interprete su valor. (d) Encuentre la covarianza de las variables X y Y . 12. Una profesora ha realizado un examen parcial que tiene dos partes. Para un estudiante seleccionado al azar, sea X el n´umero de puntos ganados en la primera parte, Y el n´umero de puntos ganados en la segunda parte y suponga que la funci´on de probabilidad conjunta de X y Y est´a dada por f(x, y) X = 0
1,5 2,5
Y = 0 1,0
0,06 0,15 0,14
0,02 0,10 0,01
2,0 0,04 0,01 0,10
2,5 0,02 0,20 0,15
Cap. 5. Ejercicios
60
(a) Si la nota final del examen parcial es el n´ umero total de puntos ganado en las dos partes, ¿cu´al es la nota final esperada por el estudiante? (b) Si se registra el m´aximo de las dos calificaciones, ¿cu´al es la nota final esperada por el estudiante? (c) Calcule la covarianza y el coeficiente de correlaci´on para X y Y . 13. De una caja que contiene 3 focos rojos y 4 focos amarillos se selecciona una muestra aleatoria de 2 focos sin reemplazo y al mismo tiempo. Si X es el n´umero de focos rojos y Y el de focos amarillos en la muestra, encuentre: (a) La funci´ on de distribuci´on conjunta de X y Y . (b) P(X + Y 1 ) e interprete este valor.
≤
(c) La funci´ on de probabilidad condicional de Y , sabiendo que X = 2 . (d) La probabilidad de que Y = 0 , sabiendo que X = 2 . (e) Encuentre la covarianza de las variables X y Y . 14. Si X y Y son variables aleatorias independientes con densidades marginales fX (x) =
8 , 3x3
0,
si 1 < x < 2 . de otro modo,
y
fY ( y) =
2y , 3
0,
si 1 < y < 2. de otro modo,
respectivamente, encuentre el coeficiente de correlaci´on de X. on Plot . . .Probability Distributions de Statgraphics, realizar los ejercicios 15. Utilizando la opci´ 8 (inciso b), 9 (incisos b, c y d) y 10. esimas de 16. Suponga que X 1 , X 2 y X 3 son variables aleatorias representan el espesor (en mil´ mil´ımetro) de un sustrato, una capa activa y una capa de recubrimiento de un producto qu´ımico. Suponga que X1 , X2 y X3 son independientes y que tienen una distribuci´on normal con medias µ 1 = 10.000, µ 2 = 1.000, µ 3 = 80 y desviaciones est´andar σ 1 = 250 , σ2 = 20 y σ3 = 4 , respectivamente. Las especificaciones para el espesor del sustrato, la capa activa y la capa de recubrimiento deben estar son 9.200 < x 1 < 10.800, 950 < x2 < 1.050 y 75 < x3 < 85, respectivamente. (a) Utilizando la opci´ on Plot . . .Probability Distributions de Statgraphics, determine qu´e proporci´ on de los productos qu´ımicos cumple con todas las especificaciones. (b) ¿Cu´ al de los tres espesores es el que tiene la menor probabilidad de cumplir con las especificaciones? 17. Cierta f´abrica manufacturera tiene tres departamentos de producci´on independientes (y s´olo tres). Las toneladas de producto obtenidas en un d´ıa determinado en el primer departamento siguen una distribuci´on gamma de par´ametros α = 2 y β = 1 , las obtenidas en el segundo departamento siguen una gamma con α = 3 y β = 1 las obtenidas en el tercer departamento siguen una gamma con α = 4 y β = 1 . Utilice la opci´on Plot . . .Probability Distributions de Statgraphics para calcular la probabilidad de que la f´abrica produzca en un d´ıa determinado m´as de 4 toneladas de producto en total.
CAP´ ITULO
6
Distribuciones muestrales
6.1
Conceptos b´ asicos
1. T´ ecnicas de muestreo aleatorio . Muestreo aleatorio simple, muestreo estratificado, muestreo por conglomerados y muestreo sistem´ atico. S´olo se tratar´ a el muestreo aleatorio simple. 2. Muestreo aleatorio simple. Un procedimiento de muestreo aleatorio simple es aquel en el que todas las posibles muestras del mismo tama˜no tienen la misma probabilidad de ser escogidas. A las muestras obtenidas por procedimientos de este tipo se las denomina muestras aleatorias simples. Este m´etodo se usa con tanta frecuencia que, en muchos casos, el adjetivo “simple ” se elimina de ambos t´ erminos definidos anteriormente.
Ejemplo 6.1.1 Se asume que una cadena nacional de comidas r´apidas desea seleccionar aleatoriamente 5 de los 10 estados de un pa´ıs para tomar muestras sobre el gusto de los consumidores. Una muestra aleatoria simple garantizar´ a que las 10 = 252 5 muestras de tama˜ no 5 tengan la misma probabilidad de ser utilizada en el estudio. En este caso, la probabilidad de escoger una muestra aleatoria simple de tama˜ no 5 ser´ a 0,00397 y la probabilidad de escoger una muestra aleatoria simple de tama˜ no 7 ser´ a 0,00833. ◭.
3. Tablas de n´ umeros aleatorios. ´ meros aleatorios consiste en una tabla de n´ Una tabla de nu umeros que se hace y se presenta en tal forma que cada uno de los n´umeros 0 a 9 aparecen en ella con una frecuencia aproximadamente igual. Es decir, cada uno de estos n´umeros aparecen en la tabla con la misma probabilidad. 4. Estad´ısticos y distribuciones muestrales . Supongamos que se ha extra´ıdo una muestra aleatoria de una poblaci´ on y que se desea hacer inferencia sobre ciertas caracter´ısticas de la distribuci´on de la poblaci´o n. Esta inferencia estar´ a basada en alg´un estad´ıstico muestral, es decir, en alguna funci´on particular de la informaci´on muestral.
6.2 Distribuciones muestrales de algunos estad´ısticos
62
Matem´aticamente, un estad´ıstico muestral puede definirse de la siguiente manera: Sean X1 , . . . , X n variables aleatorias de tal forma que el vector aleatorio (X1 , . . . , X n ) conforme una muestra aleatoria extraida de alguna poblaci´ on. Entonces, un estad´ıstico muestral para esta muestra es un func´ıon que depende s´ olo de las variables aleatorias X 1 , . . . , Xn .
5. Ejemplos t´ıpicos de estad´ısticos . La media muestral, la mediana muestral, la moda muestral, el rango muestral, la varianza muestral, la desviaci´ on est´andar muestral y la proporci´on muestral, entre otros. 6. Distribuci´ on muestral. ´ n muestral, La distribuci´on de un estad´ıstico muestral recibe el nombre de distribucio ´ n en el muestreo y se define como la distribuci´on de probabilidades de o distribucio los valores que puede tomar el estad´ıstico a lo largo de todas las posibles muestras con el mismo n´umero de observaciones que pueden ser extra´ıdas de la poblaci´on.
6.2
Distribuciones muestrales de algunos estad´ısticos
Al final de este cap´ıtulo se presentan unas tablas que ilustran la forma de las distribuciones muestrales de algunos estad´ısticos. Algunos comentarios:
• •
En la tabla 6.1 aparece un resumen acerca de la distribuci´on muestral de la media muestral. En la tabla 6.2 aparece un resumen de la distribuci´ on muestral de la diferencias de medias muestrales (muestras independientes).
• Al definir X −X =: X y al considerar el problema de determinar la distribuci´on muestral de 1
2
X para el caso en que las muestras sean dependientes o pareadas, los diferentes supuestos
que se deben tener en cuenta coinciden con los que aparecen en la tabla 6.1.
• En la tabla 6.3 aparece un resumen de la distribuci´on muestral de la proporci´on muestral y de la diferencia de proporciones muestrales.
• En la tabla 6.4 aparece un resumen de la distribuci´on muestral de la varianza muestral y
de la raz´on de varianzas muestrales. Importante, tener en cuenta que, para la distribuci´on chi-cuadrada con ν grados de libertad se cumple que, si ν > 40, entonces,
≈
χ2α,ν
ν
2 1− + z α 9ν
2 9ν
3
.
6.3 Aplicaciones
6.3
63
Aplicaciones
Ejemplo 6.3.1 Supongamos que el incremento porcentual de los salarios de los funcionarios de todas las corporaciones medianas se distribuye siguiendo una normal con media 12,2% y desviaci´ on t´ıpica 3, 6%. Se toma una muestra aleatoria de nueve observaciones de esta poblaci´on de incrementos porcentuales de salario. ¿Cu´ al es la probabilidad de que la media muestral sea mayor del 10%? SOLUCION: Como no conocemos el tama˜ no de la poblaci´on, supondremos que esta es infinita. Tenemos que µ = 12, 2, σ = 3, 6 y n = 9 . Entonces, P (X > 10) = 1 − P(Z
≤ −1,83)
= 0, 9664.
◭
Ejemplo 6.3.2 Una empresa emplea 1.500 personas. La cantidad promedio gastada, durante un a˜ no determinado, en servicios m´edicos personales por empleado fue de 2.575 d´olares y la desviaci´ on t´ıpica de 525 d´olares. ¿Cu´al es la probabilidad de que una muestra aleatoria de 100 empleados (seleccionados sin reemplazo) arroje una media comprendida entre 2.500 y 2.700 d´ olares? SOLUCION: Tenemos que N = 1.500, µ = 2.575, σ = 525 y n = 100 . Teniendo en cuenta que la poblaci´on dada es finita y que la varianza poblacional se conoce, entonces, la probabilidad requerida es P (2.500 < X < 2.700 ) = P(Z < 2,46) − P (Z < − 1,48) = 0, 9237.
◭
Ejemplo 6.3.3 Suponga que de una poblaci´on normal con media 20 se toma una muestra de tama˜ no 16. Si la desviaci´on est´ andar muestral es 4, encuentre la probabilidad de que la media muestral sea estrictamente mayor que 21,753. SOLUCION: Tenemos que µ = 20, s = 4 y n = 16. Debido a que la poblaci´ on es normal con varianza desconocida y a que n < 30, entonces, la distribuci´on muestral de la media muestral es la t de Student con n − 1 = 15 grados de libertad. Entonces, la pobabilidad pedida ser´a P(X > 21, 753) = P(t15 > 1,753) = 0,05 = 5%.
◭
Ejemplo 6.3.4 Se toma una muestra de 250 casas de una poblaci´on de edificios antiguos para estimar la proporci´on de casas de este tipo cuya instalaci´on el´ectrica resulta insegura. Supongamos que, de hecho, el 30% de todos los edificios de esta poblaci´ on tienen una instalaci´ on insegura. Hallar la probabilidad de que la proporci´on de edificios de la muestra con instalaci´on insegura est´e entre 0,25 y 0,35. SOLUCION: Tenemos que p = 0,30 y n = 250 . Por consiguiente, la probabilidad requerida es P (0,25 < p < 0,35) = P(Z < 1,72) − P(Z < − 1,72) = 0, 9146.
◭
Ejemplo 6.3.5 Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto pais difieren en sus opiniones sobre la promulgaci´on de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos est´an a favor de la pena de muerte, mientras que s´olo el 10% de las mujeres adultas lo est´an. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres, su opini´on sobre la promulgaci´on de la pena de muerte para personas culpables de asesinato, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de mujeres. SOLUCION:
6.3 Aplicaciones
64
Representemos con p1 el porcentaje de hombres a favor de la pena de muerte y con p2 el de mujeres. Por lo tanto, la probabilidad pedida ser´a a
≥ 0,03)
P( p1 − p2
≥ 0,25)
= P (Z
4013. 3. = 0, 401
◭
Ejemplo 6.3.6 La tabla de abajo recoge los datos de consumo consumo de gasolina gasolina correspondien correspondiente te a una muestra aleatoria de 8 autom´oviles oviles norteamericano norteamericanoss de dos modelos diferentes. diferentes. Se formaron pares con las dos muestras y cada elemento de un determinado par fue conducido por la misma ruta y por el mismo piloto. xi (auto A) yi (auto B)
19,4 19,6
18,8 17,5
20,6 18,4
17,6 17,5
19,2 18,0
20,9 20,0
18,3 18,8
20,4 19,2
(a) Determine Determine la media media y la desviaci´ desviacion o´n muestral de las diferencias en el consumo de gasolina. (b) Suponiendo Suponiendo que la distribuci´ distribuci´ on de las diferencias poblacionales es normal con media on -0,807, encuentre la probabilidad de que el consumo promedio de gasolina del auto A sea mayor que el del auto B. SOLUCION: (a) Haciendo Haciendo d d i = x i − yi , tenemos que d d = 0, 77 775 5 y sd = 0, 90 903 3. (b) Tenemos enemos que µ A − µ B = −0, 807 variables es que represen representan tan al 807. Sean XA y XB las variabl consumo consumo promedio de gasolina gasolina de los autos A y B, respectivamen respectivamente. te. Nos piden calcular Hagamos os D = X A − X B . Entonces Entonces,, P(XA > XB ) o, que es lo mismo, P(XA − XB > 0). Hagam teniendo en cuenta la tabla t de Student (con grados de libertad) encontramos t n − 1 = 7 que P (D > 0) = P(t > 2, 364 3645 5) = 0, 025 025..
◭
Ejemplo 6.3.7 En un estudio estudio para comparar comparar los pesos p esos promedios promedios de ni˜ nos y ni˜ nas de sexto grado en una escuela de instrucci´on on media, se usar´a una muestra muestra aleatoria aleatoria de 20 ni˜ nos y otra igual de 25 ni˜ nas. Se sabe que, tanto para ni˜ nos y ni˜ nas, los pesos siguen una distribuci´on on normal. El promedio de los pesos de todos lo ni˜ nos de sexto grado de esa escuela es de 100 libras libras y su desviaci´ desviaci´ on on est´andar andar es de 14,142, mientras que el promedio de los pesos de todas las ni˜ nas del sexto grado es de 85 libras y su desviaci´on on est´ andar andar es de 12,247. Encuentr Encuentre e la probabilidad de que el promedio de los pesos de los 20 ni˜ nos sea al menos 20 libras m´as as grande que el de los de las 25 ni˜ nas. SOLUCION: Supongamos Supongamos que X1 representa el promedio de los pesos de 20 ni˜ nos y X2 , el promedio de los pesos de una muestra de 25 ni˜ nas. Nos piden calcular calcular P (X1 − X2 > 20). Como Como las dos dos poblaciones en cuesti´ on son normales y con varianzas conocidas, entonces, on P(X1 − X2 > 20) = P (Z
≥ 1,25)
1056. 6. = 0, 105
◭
Ejemplo 6.3.8 Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de respuesta de las ratas a determinado est´ est´ımulo, se est´ an comparando en un experimento an de laboratorio. laboratorio. El experimentador experimentador supone que las respectivas respectivas poblaciones poblaciones de los tiempos de respuesta al est´ est´ımulo est´ an an distri distribui buidos dos normalme normalmente nte y tienen tienen varian varianzas zas iguales. iguales. Se administra la droga A a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento, la reducci´on on promedio promedio de tiempo de respuesta respuesta al est´ est´ımulo ımulo por parte de las ratas que est´ an an recibiendo la droga A es 30,45 milisegundos con una desviaci´on on t´ıpica de 5 milisegundos. Los datos correspondien correspondientes tes a la droga B son 24,9 y 6 milisegundos. milisegundos. ¿Cu´ al al es la probabilidad de que la diferencia entre la reducci´on on promedio promedio de tiempo de respuesta respuesta al est´ est´ımulo ımulo por
6.3 Aplicaciones
65
parte de las ratas que est´ an recibiendo la droga A y la reducci´on an on promedio de tiempo de respuesta respuesta al est´ est´ımulo ımulo por parte de las ratas que est´ an recibiendo la droga B sea menor o an igual a la que se observ´o en el experimento? experimento? Suponga que no hay diferencia diferencia alguna entre las dos drogas con respecto a la reducci´on on promedio en tiempos de respuestas y que las drogas son igualmente efectivas. SOLUCION: Sean XA y X on on promedio promed io de tiempo tie mpo de respuest r espuesta a al est´ımulo ımulo por p or parte de d e las ratas XB la reducci´ que est´an an recibiendo recibiendo la droga A y la droga B, respectiv respectivamen amente. te. Como las dos poblaciones poblaciones en cuesti´ on son normales y los tama˜ on nos de las muestras son grandes (observe que los tama˜ nos de ambas muestras son mayores o iguales que 30), entonces, P (XA − XB
≤ 5,55)
≤ 1,31)
= P (Z
≈ 0, 904 9049. 9.
=
◭
Ejemplo 6.3.9 Repita el ejemplo ejemplo 6.3.8, pero ahora suponiend suponiendoo que las poblaci poblacione oness no tienen tienen distribuci´ distribuci´ o n normal y que los tama˜ on nos muest muestral rales es son menore menoress que 30, digamo digamos s nA = 12 y nB = 13 . SOLUCION: Como las dos poblaciones en cuesti´on o n son normales y los tama˜ nos de las muestras son peque˜ nas (obs´ ervese ervese que los tama˜ nos muestrales muestrales son estrictame estrictamente nte menores que 30), entonces:
• La distribuci´on on muestral de X
A
− X B es aproximadamente la t de Student con 23
grados grados de libertad. libertad.
• Debido a que no hay diferencia alguna entre las dos drogas con respecto a la reducci´on on
promedio en tiemp os de respuestas y que las drogas son igualmente efectivas, entonces, on muestral de X µ A = µ B . Por consiguiente, la media de la distribuci´on X A − XB es 0. 2
• La varianza muestral combinada s
es 30,74.
Por consiguiente,
≤ 5,55)
P (XA − XB
= P(t
≤ 2, 5)
= 0, 01 01..
◭
Ejemplo 6.3.10 Repita el ejemplo 6.3.8, pero ahora suponiendo que las poblaciones no tienen distribuci´on on normal, que los tama˜ nos muestrales muestrales son menores menores que 30 (digamos (digamos n n A = 12 y nB = 13 ) y que las varianzas poblacionales son diferentes. SOLUCION: En este caso:
• La distribuci´on on muestral de X
A
− X B es aproximadamente la t de Student con 23
grados grados de libertad. libertad.
• De nuevo, la media de la distribuci´on on muestral de X
A −
XB es 0.
Por consiguiente,
≤ 5,55)
P (XA − XB
= P(t
≤ 2,52) ≈ 0, 01 01..
◭
Ejemplo 6.3.11 En una prueba sobre la efectividad de dos tipos de p´ıldoras ıldoras para dormir, A y B, se utilizar´an an dos grupos independientes independientes de personas personas con insomnio. A un grupo de tama˜ no 61 se le administrar´a la p´ıldora A y al otro grupo, de tama˜ no 41, se le administrar´a a la B, registr´andose andose el n´ umero umero de horas de sue˜ no de cada individuo participante en el estudio. Suponiendo que el n´ umero umero de hora de sue˜ no de quienes qui enes usan usa n cada tipo ti po de p´ıldora se s e distribuye distri buye 2 2 normalemente y que σA = σB , entonces, la probabilidad de que la raz´on on de las varianzas muestrales de A y B sea mayor que 1,64 est´a dada por
2 P (sA /s2B > 1,64) = P F(60 60,, 40) > 1,64
05.. = 0, 05
◭
Cap. 6. Ejercicios
66
Ejercicios 1. Un fabricante fabricante declara declara que la duraci´ duraci´on on de las buj´ buj´ıas que ´el el fabrica sigue una distribuci´on on normal con una media de 36.000 kil´ometros ometros y una desviaci´on on est´andar andar de 4.000 kil´ometros. ometros. Para una muestra aleatoria de dieciseis buj´ıas, ıas, se obtuvo una duraci´ on on media de 34.500 kil´ ometros. ometros. Si la afirmaci´on on del fabricante es correcta, ¿cu´al al es la probabilidad de obtener una media muestral tan peque˜na na como ´esta esta o menor? 2. Los tiempos requeridos requeridos para que unos trabajadore trabajadoress terminen terminen cierta labor, se distribuyen distribuyen normalmente con media de 30 minutos y una desviaci´on est´andar andar de 9 minutos. Si de la planta de trabajadores se toma una muestra aleatoria de 25, encuentre la probabilidad de que la media del tiemp o requerido para concluir la tarea en la muestra, est´e entre 28 y 33 minutos. 3. Un estudio estudio de tr´ ansito ansito revela que el n´umero umero promedio de ocupantes de un auto es 1,75. En una muestra de 50 autos con desviaci´on on est´ andar andar 0,65, seleccionada de una poblaci´on on normal, encuentre la probabilidad de que el n´umero umero promedio de ocupantes sea mayor que 2. 4. Una muestra aleatoria aleatoria de seis autos de un determinado determinado modelo consumen consumen las siguientes siguientes cantidades en kil´ometros ometros por litro: 18, 6
18, 4
19, 2
20, 8
19, 4
20, 5. 5.
Determ Determine ine la proba probabil bilidad idad de que el consum consumoo de gasoli gasolina na medio medio muestr muestral al de los autom´oviles oviles de este modelo sea menor que 17,6 kil´ometros por litro, suponiendo que la distribuci´ on on de la poblaci´on on es normal con media 17. 5. Se desea estudiar estudiar una muestra muestra de 20 personas personas para saber la proporci´ proporci´on on de ellas que tienen m´as as de 40 a˜nos. nos. Sabiend Sabiendoo que la proporci proporci´´on on en la poblaci´on on es del 40%, ¿cu´ al al es la probabilidad de que la proporci´on on en la muestra sea menor del 50%? 6. Hallar Hallar la probabilid probabilidad ad de que en 200 lanzamientos lanzamientos de una moneda no falsa, el n´umero umero de caras est´e comprendido en el 40% y el 60%. 7. Se identificaron identificaron dos poblaciones poblaciones de alumnos de ´ultimo ultimo a˜no no de un colegio. La variable de inter´ int er´es es en la l a invest inv estiga igaci´ ci´on on consist´ consist´ıa en los puntajes obtenidos en una prueba de rendimiento en estad´ estad´ıstica que hicieron hicieron los estudiantes estudiantes de las dos poblaciones. poblaciones. Los investigadores investigadores supon´ supon´ıan que los puntajes puntajes de las dos poblaciones poblaciones estaban distribuidos distribuidos normalment normalmentee con las siguientes medias y varianzas: µ 1 = 50, σ21 = 40, µ 2 = 40, σ22 = 60. Una muest muestra ra aleatoria de tama˜no no n1 = 10 se saca de la poblaci´on o n 1 y una de tama˜no no n2 = 12 de poblaci´on on 2. ¿Cu´al al es la probabilidad de que la l a diferencia d iferencia entre las medias muestrales est´ e entre 5 y 15? 8. Suponga que dos drogas drogas A y B, de las que se dice que reducen reducen el tiempo de respuesta respuesta de las ratas a determinado est´ est´ımulo, se est´ an an comparando en un experimento de laboratorio. El experimentador supone que las respectivas poblaciones de los tiempos de respuesta al est´ est´ımulo est´an an distribuidos normalmente y tienen varianzas iguales. Se administra la droga A a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento, la reducci´on promedio de tiempo de respuesta al est´ est´ımulo por parte de las ratas que est´an an recibiendo la droga A es 30,45 milisegundos con una desviaci´on t´ıpica de 5 milisegundos. Los datos correspondientes a la droga B son 24,9 y 6 milisegundos. ¿Cu´al es la probabilidad de que la diferencia entre la reducci´on on promedio de tiempo tiemp o de respuesta al est´ est´ımulo por p or parte de las ratas rata s que est´ an an recibiendo la droga A y la reducci´on on promedio de tiempo de respuesta al est´ımulo ımulo por p or parte de las ratas rat as que est´ an an recibiendo la droga B sea menor o igual a la que se observ´o en el experim experiment ento? o? Suponga Suponga que no hay difere diferenci nciaa alguna alguna entre las dos drogas con respecto a la reducci´on on promedio en tiempos de respuestas y que las drogas son igualmente efectivas.
¿FORMA DE LA POBLACION? 1. 2.
¿ES σ2 CONOCIDA? Si
Normal No
3.
4. 5.
No normal o desconocida
Si
6. No 7.
˜ DE ¿TAMANO LA MUESTRA? No importa
¿DISTRIBUCION MUESTRAL? Normal
Z =
Grande (n 30 ) Peque˜ no (n < 30)
Normal
Z =
t de Student, ν = n − 1
t =
x−µ s/ n
grados de libertad Normal
Z =
x−µ σ/ n
Callej´ on sin salida Normal
Z =
x−µ s/ n
≥
Grande (n 30 ) Peque˜ no (n < 30) Grande (n 30 ) Peque˜ no (n < 30)
≥ ≥
´ t? ¿Z O
C a p . 6 . E j e r c i c i o s
x−µ σ/ n x−µ σ/ n
√ √
√
√
√
Callej´ on sin salida
Tabla 6.1: Resumen de la distribuci´on muestral de la media muestral
6 7
¿FORMA DE AMBAS POBLACIONES? 1.
No normal
¿SON σ21 y σ22 ¿SON σ21 y σ22 CONOCIDAS? IGUALES? Si
˜ ¿TAMANO DE AMBAS MUESTRAS?
¿DISTRIBUCION MUESTRAL?
Grandes
Normal
No importa (n1
2.
No
No importa
Si
No importa
Z =
2
Grandes
(n1 3.
≥ 30, n ≥ 30)
´ t? ¿Z O
Normal
≥ 30, n ≥ 30)
Z =
2
No importa
Normal
Z =
Normal 4.
Si
Peque˜ no
t de Student con
t =
No
5.
No
(n1 < 30, n2 < 30)
ν = n 1 + n2 − 2
Peque˜ no
grados de libertad t de Student con
(n1 < 30, n2 < 30)
ν =
s 2 1 n1
s2
+ n2
( s 2 /n 1 ) 2 1 n1 −1
2
+
s2 =
(X1 −X2 )−(µ1 −µ2 )
σ2 1 n1
σ2
+ n2
C a p . 6 . E j e r c i c i o s
2
(X1 −X2 )−(µ1 −µ2 ) s2 1 n1
s2
+ n2
2
(X1 −X2 )−(µ1 −µ2 ) σ2 1 n1
σ2
+ n2
2
(x1 −x2 )−(µ1 −µ2 ) s 2 n1
2
s +n
,
2
(n1 −1)s21 +(n2 −1)s22 n1 +n2 −2
2
( s 2 /n 2 ) 2 2 n2 −1
t =
(redondear al en(tero m´as cercano)
(x1 −x2 )−(µ1 −µ2 )
s 2 1 n1
s2
+ n2
2
Tabla 6.2: Resumen de la distribuci´on muestral de la diferencias de medias muestrales 6 8
C a p . 6 . E j e r c i c i o s
¿ESTADISTICO? 1. 2. 3. 4.
Proporci´ on muestral Diferencia de proporciones muestrales
¿SUPUESTO?
¿DISTRIBUCION MUESTRAL? Normal n 30 Normal np 5 , n(1 − p) 5 Normal n1 30 , n2 30 Normal n1 p1 5 , n1(1 − p1) 5 , n2 p2 5 , n2(1 − p2) 5
≥ ≥ ≥ ≥
≥
≥
≥ ≥ ≥
¿Z? Z = Z =
p−p
p (1− p ) n
(p1 −p2 ) − (p1 −p2 )
p1 (1 − p1 ) p (1 − p ) + 2 n 2 n1 2
Tabla 6.3: Resumen de la distribuci´on muestral de la proporci´on muestral y de la diferencia de proporciones muestrales
6 9
C a p . 6 . E j e r c i c i o s
¿ESTADISTICO? 1.
Varianza muestral
¿FORMA DE LA POBLACION? Normal
¿DISTRIBUCION MUESTRAL? Chi-cuadrada con ν = n − 1
´ F? ¿ χ2 O
χ2 =
grados de libertad 2.
Raz´ on de
Ambas
F de Fisher con
varianzas muestrales
normales
ν1 = n 1 − 1, ν2 = n 2 − 1
grados de libertad
F =
(n−1)s2 σ2 s2 /σ2 1 1 s2 /σ2 2 2
Regla: F1−α(a, b) =
1 Fα (b,a)
Tabla 6.4: Resumen de la distribuci´on muestral de la varianza muestral y de la raz´on de varianzas muestrales
7 0
CAP´ ITULO
7
Intervalos de confianza
7.1
Estimaci´ on
1. T´ erminos b´asicos . ´ n estad´ıstica es el proceso mediante el cual intentamos determinar (a) La estimacio el valor de un par´ametro de la poblaci´on, sin hacer un censo, a partir de la informaci´on de una muestra. ´ n es el valor num´erico que creemos que tiene el par´ (b) Una estimacio ametro.
(c) el estimador es el estad´ıstico de la muestra, utilizada para hacer una estimaci´on. (d) Un estimador puntual de un par´ametro poblacional es una funci´on de la muestra que da como resultado un ´unico valor. ´ n puntual (e) Un valor en particular de un estimador puntual se llama una estimacio del par´ametro.
2. Pautas para escoger un estimador. (a) Insesgamiento . θ es un estimador insesgado de θ, si E(θ) = θ. Evidentemente, si E(θ) = θ, el estimador se dice que es sesgado. LLamaremos sesgo a la diferencia entre la media del estimador θ y el par´ametro θ, es decir,
Sesgo ( θ) = E (θ) − θ.
La media, la varianza y la proporci´on muestrales son estimadores insesgados de los correspondientes par´ametros poblacionales, pero la desviaci´on t´ıpica muestral no es un estimador insesgado de la desviaci´on t´ıpica poblacional. (b) Eficiencia. Sean θ1 y θ2 dos estimadores insesgados de θ, obtenidos en muestras del mismo ´ s eficiente que θ2 si V (θ1 ) < V (θ2 ). tama˜ no. Entonces, θ1 es ma
Al tomar muestras de una poblaci´on de una poblaci´on normal, la media muestral es m´as eficiente que la mediana.
7.2 Intervalos de confianza
72
(c) Estimador insesgado de m´ınima varianza. Si θ es un estimador insesgado de θ y no hay ning´un otro estimador insesgado que tenga menor varianza, entonces, se dice que θ es el estimador insesgado de m´ınima varianza de θ. Algunos ejemplos de estimadores insesgados de m´ınima varianza son:
i. La media muestral cuando la muestra proviene de una distribuci´ on normal. ii. La varianza muestral cuando la muestra proviene de una una distribuci´ on normal. iii. La proporci´on muestral binomial. (d) Consistencia. Un estimador puntual θ de θ es consistente para θ si sus valores tienden a acercarse al par´ametro poblacional θ conforme se incrementa el tama˜no de la muestra. De otro modo, el estimador se llama inconsitente.
Al muestrear de una poblaci´on normal, la desviaci´on t´ıpica muestral es consistente para la desviaci´on t´ıpica poblacional (esto tambi´en es cierto para el caso de la media y la varianza para sus correspondientes par´ametros poblacionales). Tambi´en la proporci´ on muestral es consistente para la proporci´on poblacional.
7.2
Intervalos de confianza
1. Estimador y estimaci´ on por intervalos. (a) Un estimador por intervalos de un par´ ametro poblacional es una regla (basada en la informaci´on muestral) para determinar un rango, o un intervalo, en el cual posiblemente se encuentre dicho par´ametro. ´ n por intervalos. (b) La estimaci´ on correspondiente se denomina estimacio
2. Intervalo de confianza. Sea θ un par´ametro desconocido. Supongamos que con ayuda de la informaci´on muestral, podemos encontrar dos variables aleatorias U y V , con U menor que V , tales que P(U < θ < V ) = 1 − α , para un α ( 0, 1). Entonces,
∈
(a) La fracci´ on 1 − α recibe el nombre de grado de confianza , α se llama nivel de significancia y el intervalo de U hasta V es un estimador por intervalos de θ del (1 − α )100%. (b) Si u y v representan a un valor particular de U y V , respectivamente, entonces, el intervalo de u a v de denomina intervalo de confianza del (1 − α )100% para θ . Si se extraen muestras aleatorias de la poblaci´on un n´umero elevado de veces, el par´ametro estar´a contenido en un ( 1 − α )100% de los intervalos calculados de este modo. El intervalo de confianza obtenido de esta manera se escribe u < θ < v.
7.3
Intervalos de confianza para algunos par´ ametros
Al final de este cap´ıtulo se presentan unas tablas que ilustran la forma de los intervalos de confianza para algunos par´ ametros. Algunos comentarios:
• En la tabla 7.1 aparece un resumen acerca los intervalos de confianza para la media poblacional.
• En la tabla 7.2 aparece un resumen acerca los intervalos de confianza para la diferencias de medias poblacionales (muestras independientes).
7.3 Intervalos de confianza para algunos par´ametros
•
73
Los diferentes supuestos que se deben tener en cuenta para poder determinar el intervalo de confianza para el correspondiente par´ametro poblacional (para el caso en que las muestras escogidas sean dependientes o pareadas) coinciden con los que aparecen en la tabla 7.1.
• En la tabla 7.3 aparece un resumen acerca los intervalos de confianza para la proporci´on poblacional y para la diferencia de proporciones poblacionales.
•
En la tabla 7.4 aparece un resumen acerca los intervalos de confianza para varianza poblacional y para la raz´on de varianzas poblacionales. Importante, tener en cuenta que, para la distribuci´on chi-cuadrada con ν grados de libertad se cumple que, si ν > 40, entonces,
≈
χ2α,ν
ν
2 1− + z α 9ν
2 9ν
3
.
7.4 Aplicaciones
7.4
74
Aplicaciones
Ejemplo 7.4.1 Un fabricante produce bolsas de az´ ucar refinado. El peso del contenido de estas bolsas tiene una distribuci´ on normal con desviaci´on t´ıpica 15 gramos. Los contenidos de una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos. Calcular un intervalo de confianza del 95% para el verdadero peso medio de todas las bolsas de az´ucar producidas por el fabricante. SOLUCION: Dado que buscamos un intervalo de confianza del 95%, tenemos que 1 − α = 95%, por lo que α = 5 % = 0,05. Debido a que Z α/2 = Z 0,025 = 1,96, el intervalo de confianza del 95% para la media poblacional µ es 94, 14 < µ < 105, 88.
Con esto podemos concluir que, con una confianza del 95%, el verdadero peso medio de todas las bolsas de az´ ucar producidas por el fabricante se encuentra entre 94,12 y 105,88 gramos. ◭ Ejemplo 7.4.2 Una muestra aleatoria de seis autos colombianos de un determinado modelo consumen las siguientes cantidades en kil´ometros por litro: 18,6; 18, 4; 19,2; 20,8; 19,4 y 20,5. Calcule un intervalo de confianza del 90% para el consumo de gasolina medio poblacional de los autos de este modelo, suponiendo que la distribuci´on de la poblaci´on en cuesti´ on es normal. SOLUCION: En este caso, n = 7 , x = 19, 48 y s = 0,98 kil´ ometros por litro y tα/2 = t 0,05 = 2, 015 con n − 1 = 6 grados de libertad. Entonces, el intervalo buscado ser´a 18, 67 < µ < 20, 29.
Por lo tanto, con una confianza del 95%, podemos afirmar que el consumo de gasolina medio poblacional se encuentra entre 18,67 y 20,29 kil´ ometros por litro. ◭ Ejemplo 7.4.3 En una muestra aleatoria de 85 soportes para la pieza de un motor de autom´ ovil, 10 tienen un peque˜ no defecto. Calcule un intervalo de confianza del 95% para la proporci´on p de piezas de motor en la poblaci´on que tienen un peque˜ no defecto. SOLUCION: Debido a que n = 85, entonces, una estimaci´ on puntual de la proporci´ o n de piezas de 10 motor en la poblaci´on que tienen un peque˜ no defecto es p = 85 = 0,12. Debido a que Zα/2 = Z 0,025 = 1,96, entonces, un intervalo de confianza para p es 0,05 < µ < 0, 19.
Es decir, con una confianza del 95%, podemos afirmar que la verdadera proporci´on de piezas de motor en la poblaci´on que tienen un peque˜ no defecto est´a entre el 5% y el 19%. ◭ Ejemplo 7.4.4 Consid´ erese el proceso de fabricaci´on de soportes para piezas de motores descrito en el ejemplo 7.4.3. Sup´ ongase que se hace una modificaci´on al proceso de acabado de la superficie y que, de manera subsecuente, se toma una segunda muestra aleatoria de 85 ejes. Si el n´ umero de soportes defectuosos en esta segunda muestra es 8, calcule un intervalo de confianza del 95% para la diferencia en la proporci´on de los soportes defectuosos producidos por ambos procesos. SOLUCION: En este caso, tenemos que n1 = 85,
p1 =
10 = 0, 12, 85
n2 = 85,
p2 =
8 = 0, 09. 85
7.4 Aplicaciones
75
Debido a que Zα/2 = Z 0,025 = 1,96, entonces, un intervalo de confianza para la diferencia entre las proporciones poblacionales p 1 − p2 es −0,06 < p1 − p2 < 0, 12.
Ese intervalo de confianza incluye al cero, as´ı que, con base en los datos muestrales, parece poco probable que los cambios hechos en el proceso de acabado de la superficie hayan reducido el n´ umero de soportes defectuosos para piezas producidos por el proceso. ◭ Ejemplo 7.4.5 Para una muestra aleatoria de 321 fumadores, el n´umero medio de horas de absentismo laboral al mes fue de 3,01 y la desviaci´on t´ıpica muestral fue de 1,09 horas al mes. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el n´ umero medio de horas fue de 2,88 y la desviaci´on t´ıpica muestral fue de 1,01 horas al mes. Calcular un intervalo de confianza del 99% para la diferencia entre las dos medias poblacionales. SOLUCION: Dado que los tama˜ nos muestrales son grandes, podemos utilizar las varianzas muestrales en lugar de las varianzas poblacionales desconocidas. Tenemos: n1 = 321 , n2 = 94 ,
x1 =3,01, x2 =2,88,
s1 = 1,09; s2 = 1,01
y para un intervalo de confianza del 95%, se tiene que Zα/2 = Z0,025 = 1,96. Por consiguiente, el intervalo es −0,11 < µ 1 − µ 2 < 0,37.
Dado que el cero est´a dentro del intervalo de confianza, no hay suficiente evidencia en los datos como para rechazar la idea de que ambas poblaciones tienen la misma media. ◭ Ejemplo 7.4.6 En un estudio sobre los efectos de la planificaci´on en el rendimiento financiero de los bancos, se extrajo una muestra aleatoria de seis instituciones financieras que contaban con un sistema de planificaci´on formal, y se comprob´o que el porcentaje medio anual de crecimiento de los ingresos netos en dicha muestra era de 9,972 con una desviaci´on t´ıpica de 7,470. La media de dicho crecimiento en otra muestra aleatoria independiente de nueve bancos que no recurr´ıan a la planificaci´on fue de 2,098 con una desviaci´on t´ıpica de 10,834. Suponiendo que las dos poblaciones son normales y tienen la misma varianza, calcular un intervalo de confianza del 90% para la diferencia de medias. SOLUCION: Los datos muestrales son n1 = 6 , n2 = 9 ,
x1 = 9, 972, x2 = 2, 098,
s1 = 7, 470; s2 = 10, 834.
Debido a que el valor de la varianza muestral combinada es s2 = 93,7 y a que tα/2 = t0,05 = 1, 771 con 13 grados de libertad, entonces, el intervalo de confianza del 90% para la diferencia de los incrementos medios porcentuales es −1,161 < µ 1 − µ 2 < 16, 909.
El intervalo incluye el cero, lo cual sugiere que no existe evidencia suficiente en la muestra como para rechazar la idea de la igualdad de medias entre ambas poblaciones. ◭ Ejemplo 7.4.7 El departamento de zoolog´ıa de cierto instituto llev´o a cabo un estudio para estimar la diferencia en la cantidad de cierta sustancia qu´ımica medida en dos estaciones diferentes de un r´ıo. La sustancia se mide en miligramos por litro. Se reunieron 15 muestras
7.4 Aplicaciones
76
de la estaci´on 1 y 12 muestras de la estaci´on 2. Las 15 muestras de la estaci´ on 1 tuvieron un contenido promedio de sustancia qu´ımica de 3,84 miligramos por litro y una desviaci´ on est´andar de 3,07 miligramos por litro, mientras que las 12 muestras de la estaci´on 2 tuvieron un contenido promedio de 1,49 miligramos por litro y una desviaci´ on est´ andar de 0,80 miligramos por litro. Encuentre un intervalo de confianza del 95% para la diferencia en el contenido promedio real de sutancia en estas dos estaciones. Suponga que las observaciones vienen de poblaciones normalmente distribuidas con varianzas diferentes. SOLUCION: Tenemos que n1 = 15,
x1 = 3, 84,
s1 = 3, 07,
n2 = 12,
x2 = 1, 49,
s2 = 0, 80.
Como las varianzas poblacionales se suponen diferentes, s´olo podemos encontrar un intervalo de confianza de 95% aproximado basado en la distribuci´on t de Student con 16 grados de libertad. Debido a que tα/2 = t 0,025 = 2, 120 para ν = 16 grados de libertad, entonces, el intervalo buscado es 0,60 < µ 1 − µ 2 < 4, 10.
Por ello tenemos una confianza del 95% de que el intervalo de 0,60 a 4,10 miligramos por litro contiene la diferencia de los contenidos promedio reales de sustancia para estos dos lugares. Como el 0 no est´a incluido en el intervalo, podemos afirmar que estos dos contenidos promedios son diferentes. ◭ Ejemplo 7.4.8 Una muestra aleatoria de tabletas para el dolor de estom´ago tiene una desviaci´ on t´ıpica de 0,8% en la concentraci´ on del ingrediente activo. Hallar un intervalo de confianza del 90% para la varianza y para la desviaci´on poblacional. SOLUCION: Tenemos que n = 15 y s = 0, 8. Debido a que χ2α = χ 20,05 = 23, 68 y χ21− α = χ 20,95 = 6,57 2 2 con 14 grados de libertad, el intervalo de confianza del 90% para la varianza poblacional viene dado por 0,378 < σ2 < 1, 364.
Por consiguiente, con una confianza del 90%, la varianza poblacional de la concentraci´on del ingreso activo est´a entre 0,378 y 1,364. Dado que la desviaci´ on t´ıpica es igual a la ra´ız cuadrada, podemos obtener un intervalo de confianza del 90% para la desviaci´on t´ıpica poblacional tomando ra´ıces cuadradas. El resultado es 0, 61 < σ < 1, 17.
Por tanto, nuestro intervalo de confianza del 90% para la desviaci´on t´ıpica poblacional de la concentraci´on porcentual del ingrediente activo de estas tabletas va del 61% al 1,17%. ◭ Ejemplo 7.4.9 En el ejemplo 7.4.7 se construy´o un intervalo de confianza para la diferencia en el contenido medio de sustancia qu´ımica, que se mide en miligramos por litro, en dos estaciones sobre un r´ıo mediante la suposici´on de que poblaciones en cuesti´on son normales con varianzas diferentes. Justifique esta suposici´on mediante la construcci´on de un intervalo de confianza del 98% para σ1 /σ2 , donde σ1 y σ2 son las desviaciones poblacionales del contenido de sustancia qu´ımica en las estaciones 1 y 2, respectivamente. SOLUCION: Del ejemplo 7.4.7 se tiene que n1 = 15,
x1 = 3, 84,
s1 = 3, 07,
n2 = 12,
x2 = 1, 49,
s2 = 0, 80.
Para un intervalo de confianza del 98%, α = 0,02. Por tanto, al interpolar en la tabla de la distribuci´on F que aparece en el ap´ endice, encontramos que F0,01 (14, 11) 4,30 y
≈
7.5 Determinaci´on del tama˜ no de una muestra
F0,01 (11, 14)
77
≈ 3,87. Por tanto, el intervalo de confianza del 98% para σ /σ 1
1, 851 <
2
es
σ1 < 7, 549. σ2
Como este intervalo no permite la posibilidad de que σ 1 /σ2 sea igual a 1, es correcto suponer que σ1 = σ 2 o σ21 = σ 22 en el ejemplo 7.4.7 ◭
7.5
Determinaci´ on del tama˜ no de una muestra
1. Tama˜ no muestral de los intervalos de confianza para la media . Si se utiliza x como una estimaci´o n de µ , entonces, se puede tener una confianza de (1 − α )100% de que el error |x − µ | no exceder´a una cantidad espec´ıfica e cuando el tama˜no de la muestra es (redondear al entero m´as cercano):
Zα/2 σ
n =
e
2
.
Cuando σ 2 sea desconocida, se toma una muestra preliminar de tama˜ no n ≥ 30 , se calcula la desviaci´ on muestral s (para proporcionar una estimaci´ on de la desviaci´ on poblacional σ) y se reemplaza σ p or s .
Ejemplo 7.5.1 La longitud de barras de metal producidas por una cadena es una variable aleatoria con distribuci´on normal y desviaci´on est´ andar 1,8 mil´ımetros. Bas´andose en una muestra aleatoria de 9 observaciones, se calcu´o el siguiente intervalo del 99% para la longitud media poblacional:
≤ µ ≤ 197, 75.
194, 65
Supongamos que un director de producci´on cree que el intervalo es demasiado amplio, y exige un intervalo con el mismo nivel de confianza, pero cuya longitud a cada lado de la media muestral no sea superior a 0,5 mil´ımetros. ¿Cu´ antas observaciones debe tener la muestra para construir tal intervalo? SOLUCION: Tenemos que e = 0,50, σ = 1, 8 y Zα/2 = Z 0,005 = 2, 575. Por tanto, para satisfacer la petici´on del director, se necesita una muestra aleatoria de al menos 86 observaciones. Este gran incremento en el tama˜ no muestral representa el costo adicional de conseguir una mayor precisi´on en la estimaci´on de la verdadera media, reflejada en un intervalo de confianza m´as corto. ◭ 2. Tama˜ no de la muestra para estimar proporciones poblacionales. Si se utiliza p como una estimaci´o n de p, entonces, se puede tener una confianza de (1 − α )100% de que el error | p − p | no exceder´a una cantidad espec´ıfica e cuando el tama˜no de la muestra es n =
Z2α/2 p(1 − p) e2
.
Si p es desconocida, hecemos p = 0, 5. Ejemplo 7.5.2 Sup´ ongase que, basado en 142 observaciones, se ha construido el siguietne intervalo de confianza del 95% para la proporci´on de directores de recursos humanos que consideraban que el expediente acad´emico era muy importante en la evaluaci´on de un candidato: 0, 533
≤ p ≤ 0, 693.
Cap. 7. Ejercicios
78
Supongamos ahora que queremos construir un intervalo de confianza del 95% cuya longitud a cada lado de la proporci´on muestral no sea superior a 0,06. ¿Cu´ antas observaciones necesitamos? SOLUCION: Tenemos que e = 0,06 y Zα/2 = Z 0,025 = 1,95. Debido a que desconocemos la estimaci´ on p de p , hacemos p = 0, 5 y, con ello, podemos concluir que un n´umero m´ınimo de 267 observaciones garantiza un intervalo de confianza con la longitud exigida. ◭
Ejercicios 1. Un bi´ologo desea hacer una estimaci´on con un intervalo de confianza del 95% de la cantidad promedio de agua que consume cierta especie animal en condiciones experimentales. De alguna manera, el investigador logra determinar que la poblaci´on de valores de consumo diario de agua est´a distribuida normalmente. Una muestra aleatoria de 36 animales arroja una media de 16,5 gramos con una desviaci´on est´andar de 2 gramos. 2. esuelva nuevamente el ejercicio 1 pero utilizando un grado de confianza del 99%. Compare los resultados encontrados en ambos ejercicios. 3. Los contenidos de 7 recipientes similares de ´acido sulf´urico son 9,8; 10,2; 10,4; 9,8; 10,0; 10,2 y 9,6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los recipientes, suponiendo que la poblaci´on de valores tiene distribuci´on normal. 4. Las empresas de b´ usqueda de ejecutivos se especializan en ayudar a las empresas a ubicar y asegurar talento para la alta gerencia. Tales firmas son responsables de la ubicaci´on de muchos de los mejores directores ejecutivos de la naci´on. Una reconocida revista report´o que “uno de cada cuatro directores ejecutivos es una persona con m´as de 35 a˜ nos de edad”. Si en una muestra aleatoria de 350 comp˜n´ıas de cierto pais, 77 tienen directores ejecutivos con m´as de 35 a˜nos de edad, ¿un intervalo de confianza del 99% apoyar´ıa la afirmaci´on? 5. Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de estad´ıstica de sexo masculino y femenino. De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un m´ aximo de 6 a˜nos. De 141 mujeres encuestadas, 73 ten´ıan esta esperanza. Hallar un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales. 6. Se llevan a cabo pruebas de resistencia a la tensi´on sobre dos diferentes clases de tubos de aluminios utilizados en la fabricaci´on de alas de aeroplanos comerciales. Los datos obtenidos son como se muestran a continuaci´on: Clase de tubo Tubo 1: Tubo 2:
Tama˜ n o de la muestra n1 = 10 , n2 = 12 ,
Media de la resistencia a la tensi´ on (kg/mm2 ) x1 = 87, 6, x2 = 74, 5,
Desviaci´ on est´andar (kg/mm2 ) s1 = 1,09; s2 = 1, 5
Si µ 1 y µ 2 representan los promedios verdaderos de las resistencias a la tensi´on para las dos clases de tubos, encuentre un intervalo de confianza del 90% para la diferencia de las medias µ 1 − µ 2 . 7. Un bi´ologo deseaba estudiar los efectos de ciertas drogas sobre el consumo de agua en una especie particular de animales de laboratorio. La droga A que contiene un agente que produce sed, se administr´o a una muestra aleatoria simple de nA = 25 animales. La droga B que no contiene tal agente, se administr´o a una muestra aleatoria independiente de nB = 22 animales similares. El bi´ ologo registr´o la cantidad de agua consumida por cada animal durante un periodo de tiempo determinado despu´es de la administraci´on de
Cap. 7. Ejercicios
79
las drogas. Las cantidades promedio de agua consumida por animal en cada uno de los dos grupos fueron respectivamente de x A = 50 mililitros (ml) y x B = 25 ml y las desviaciones t´ıpicas de sA = 5, 3 ml y de sB = 5, 6 ml. Construya un intervalo de confianza del 95% para µ 1 − µ 2 suponiendo que las poblaciones en cuesti´on son normales con varianzas iguales. 8. Un fabricante de detergente l´ıquido est´ a interesado en la uniformidad de la m´aquina utilizando para llenar las botellas. De manera espec´ıfica, es deseable que la desviaci´ on est´ andar σ del proceso de llenado sea menor que 0,5 onzas de l´ıquido. De otro modo, existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente. Sup´ongase que la distribuci´on del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral s2 = 0, 00153 (onzas de fluido)2 . Calcule un intervalo de confianza del 90% para σ. 9. Una compa˜ n´ıa fabrica propulsores para uso en motores de turbina. Una de las operaciones consiste en esmerilar el terminado de una superficie particular con una aleaci´on de titanio. Pueden emplearse dos procesos de esmerilado, y ambos pueden producir partes que tienen la misma rigurosidad superficial promedio. Al ingeniero de manufactura le gustar´ıa seleccionar el proceso que tenga la menor variabilidad en la rigurosidad de la superficie. Para ello toma una muestra de n 1 = 12 partes del primer proceso, la cual tiene una desviaci´on est´ andar muestral de s 1 = 5, 1 micropulgadas, y una muestra aleatoria de n 2 = 15 partes del segundo proceso, la cual tiene una desviaci´on est´andar muestral de s2 = 4, 7 micropulgadas. Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas σ 21 /σ22 . Sup´ongase que los dos procesos son independientes y que la rigurosidad de la superficie est´a distribuida normalmente.
¿FORMA DE LA POBLACION? 1. 2.
¿ES σ2 CONOCIDA? Si
Normal No
3.
4. 5.
No normal o desconocida
Si
6. No 7.
˜ DE ¿TAMANO LA MUESTRA? No importa Grande (n 30 ) Peque˜ no (n < 30)
≥
Grande (n 30 ) Peque˜ no (n < 30) Grande (n 30 ) Peque˜ no (n < 30)
≥ ≥
¿DISTRIBUCION MUESTRAL? Normal Normal t de Student, ν = n − 1
¿INTERVALO DE CONFIANZA?
C a p . 7 . E j e r c i c i o s
σ σ x − Zα/2 √ < µ < x + Zα/2 √ n n s s x − Zα/2 √ < µ < x + Zα/2 √ n n
s s x − tα/2 √ < µ < x + tα/2 √ n n
grados de libertad Normal
σ σ x − Zα/2 √ < µ < x + Zα/2 √ n n
Callej´ on sin salida Normal
s s x − Zα/2 √ < µ < x + Zα/2 √ n n
Callej´ on sin salida
Tabla 7.1: Resumen acerca los intervalos de confianza para la media poblacional
8 0
1.
¿FORMA DE AMBAS POBLACIONES?
¿σ21 y σ22 CONOCIDAS?
No normal
Si
2.
¿σ21 y σ22 IGUALES?
˜ ¿TAMANO DE AMBAS MUESTRAS?
¿DISTRIBUCION MUESTRAL?
Grandes
Normal
No importa (n1
No
No importa
3.
Si
No importa
(x1 − x2) − Zα/2
≥ 30, n ≥ 30)
σ2 1 n1
+
Normal
(x1 − x2) − Zα/2
≥ 30, n ≥ 30)
s2 1 n1
+
No importa
Normal
(x1 − x2) − Zα/2
σ2 1 n1
+
s2 2 n2
σ2 2 n2
< (x1 − x2) + Zα/2
4.
Si No
Peque˜ no
t de Student con
(n1 < 30, n2 < 30)
ν = n 1 + n2 − 2
(x1 − x2) − tα/2
s2 n1
+
s2 =
No
Peque˜ no (n1 < 30, n2 < 30)
t de Student con ν =
s 2 1 n1
s2
+ n2
( s 2 /n 1 ) 2 1 n1 − 1
2
2
( s 2 /n 2 ) 2 2 + n 2 −1
(redondear al en(tero m´as cercano)
s2 n2
σ2 1 n1
+
σ2 2 n2
< µ 1 − µ 2 < s2 1 n1
+
s2 2 n2
< µ 1 − µ 2 < σ2 1 n1
+
σ2 2 n2
< µ 1 − µ 2 < s2 n1
< (x1 − x2) + tα/2
grados de libertad
< µ 1 − µ 2 <
< (x1 − x2) + Zα/2
2
Normal
5.
σ2 2 n2
< (x1 − x2) + Zα/2
2
Grandes (n1
¿INTERVALO DE CONFIANZA?
C a p . 7 . E j e r c i c i o s
+
s2 , n2
(n1 −1)s21 +(n2 −1)s22 n1 +n2 −2
(x1 − x2) − tα/2
s2 1 n1
+
s2 2 n2
< µ 1 − µ 2 <
< (x1 − x2) + tα/2
s2 1 n1
+
s2 2 n2
Tabla 7.2: Resumen acerca los intervalos de confianza para la diferencias de medias poblacionales 8 1
C a p . 7 . E j e r c i c i o s
¿ESTADISTICO? 1. 2. 3.
4.
Proporci´ on muestral Diferencia de proporciones muestrales
¿SUPUESTOS?
≥ ≥ ≥ ≥ n ≥ 30
n 30 np 5 , n(1 − p) 5 n1 30 ,
¿DISTR. MUESTRAL? Normal Normal Normal
≥ 5, n (1 − p ) ≥ 5 , n p ≥ 5 , n (1 − p ) ≥ 5 1
1
p(1−p) n
( p1 − p2) − Zα/2
2
n1 p1
p − Zα/2
¿INTERVALO DE CONFIANZA?
Normal
< p < p + Zα/2
p1 (1−p1 ) n1
+
p2 (1−p2 ) n2
< ( p1 − p2) + Zα/2
p1 (1−p1 ) n1
+
p(1−p) n
< p1 − p2 < p2 (1−p2 ) n2
2 2
2
2
Tabla 7.3: Resumen acerca los intervalos de confianza para la proporci´on poblacional y para la diferencia de proporciones poblacionales
8 2
C a p . 7 . E j e r c i c i o s
¿ESTADISTICO? 1.
Varianza muestral
¿FORMA DE LA POBLACION? Normal
¿DISTRIBUCION MUESTRAL? Chi-cuadrada con
¿INTERVALO DE CONFIANZA? (n−1)s2 χ2α
ν = n − 1
Raz´ on de varianzas muestrales
Ambas normales
F de Fisher con ν1 = n 1 − 1, ν2 = n 2 − 1
grados de libertad
s2 1 s2 2
·
1 F α ( ν1 ,ν2 ) 2
(n−1)s2 χ2 α 1−
2
grados de libertad 2.
< σ2 <
<
σ2 1 σ2
<
s2 1 s2 2
·F
2
α 2
( ν2, ν1)
Regla: F1−α(a, b) =
1 Fα (b,a)
Tabla 7.4: Resumen acerca los intervalos de confianza para varianza poblacional y para la raz´on de varianzas poblacionales
8 3
CAP´ ITULO
8
Pruebas de hip´ otesis
8.1
Conceptos de la prueba de hip´ otesis
1. Hip´ otesis estad´ısticas. ´ tesis estad´ıstica: afirmaci´ (a) hipo o n sobre uno o m´as par´ametros de una o m´as poblaciones. ´ tesis nula H0 : la hip´ (b) la hipo otesis que se debe comprobar. ´ tesis alternativa H1 : se establece como el “complemento” de H0 . (c) La hipo
2. Comentarios. (a) H0 siempre se refiere a un valor espec´ıfico del par´ ametro de poblaci´on (como, por ejemplo, µ ), no al estad´ıstico muestral (como X). (b) H0 siempre debe contener un signo igual respecto al valor especificado del par´ametro poblacional (por ejemplo,1 H0 : µ = 36 , H 0 : µ 36 o H0 : µ 36 ).
≤
≥
(c) H1 nunca debe contener un signo igual respecto al valor especificado de par´ametro de poblaci´on (por ejemplo, H0 : µ = 36 , H0 : µ < 36 o H0 : µ > 36 ).
3. Errores de tipo I y de tipo II . Decisi´ o n sobre
Aceptar H0 Rechazar H0
H0
H0 es
verdadera
Decisi´on correcta 1 − α se llama grado de confianza Error de tipo I α se llama nivel de significancia
H0 es
falsa
Error de tipo II Probabilidad = β Decisi´on correcta 1 − β se llama potencia
Fig. 8.1: Errores de tipo I y II y sus correspondientes probabilidades
1
En general, si θ es un par´ ametro poblacional y si k es cualquier n´ umero real, entonces, la hip´ otesis alternativa H1 : θ otesis alternativas = k se llama alternativa bilateral y las hip´ H1 : θ < k y H 1 : θ > k , alternativas unilaterales.
8.1 Conceptos de la prueba de hip´otesis
85
4. Estad´ıstico de prueba y regi´ on cr´ıtica. Un estad´ıstico de prueba es un estad´ıstico (es decir, una funci´on que s´olo depende de la informaci´on muestral) que se utiliza para determinar si se rechaza, o no, la hip´otesis nula. ´ n cr´ıtica es el conjunto de todos los valores del estad´ıstico de prueba para los La regio cuales la hip´otesis nula ser´a rechazada. Entonces, la hip´ otesis nula ser´ a rechazada si y s´olo si el valor observado o calculado del estad´ıstico de prueba se ubica en la regi´ on de rechazo.
5. Valor P o p-valor . El p-valor o valor p es el m´ınimo nivel de significancia bajo la cual H0 es rechazada. Tenemos que
≤ α
(a) P-valor
(b) P-valor > α
⇒⇒
Rechazar H 0 al nivel α . No rechazar H 0 al nivel α .
6. Comentarios acerca de los t´ erminos “aceptar” y “rechazar”. Al “aceptar” una hip´otesis nula, no estamos asegurando necesariamente que haya mucho en su favor. Una afirmaci´ on m´as precisa, aunque m´as pedante, sobre la situaci´on puede ser “los datos disponibles no proporcionan suficiente evidencia para rechazar la hip´ otesis nula, dado que queremos fijar en α la probabilidad de rechazar una hip´ otesis nula que es cierta”. Por esta raz´on, algunos autores prefieren la frase “no se rechaza la hip´otesis nula” en lugar de “se acepta la hip´otesis nula”. Nosotros seguiremos usando “aceptar” como una manera eficiente de expresar esta idea, pero es importante tener en cuenta la interpretaci´on de la frase. La situaci´on es muy similar a la de un tribunal de justicia, donde el acusado, al prinicipio, goza de la presunci´on de inocencia, y la acusaci´on debe presentar evidencia contraria lo suficientemente clara como para conseguir un veredicto de culpabilidad. En el contexto de la prueba de hip´otesis cl´asica, la hip´otesis nula se considera cierta inicialmente. La tarea de persuadirnos de lo contrario corresponde a los datos de la muestra.
8.2 Pruebas para algunos par´ametros poblacionales
8.2
86
Pruebas para algunos par´ ametros poblacionales CONTRASTES PARA LA MEDIA POBLACIONAL
1. Tener en cuenta los supuestos de la tabla relacionada con distribuci´ on muestral de medias. 2. Las distribuciones a utilizar ser´an la normal o la t de Student con ν = n − 1 grados de libertad. 3. La regi´ on cr´ıtica es la regi´on sombreada que aparece en la figura 8.2. 4. A los valores a , b, c y d que aparecen en la figura 8.2 se les llamar´a valores cr´ıticos.
¿HIPOTESIS NULA?
≥ ≤
1. 2. 3.
H0 : µ k H0 : µ k H0 : µ = k
¿HIPOTESIS ALTERNATIVA? H1 : µ < k H1 : µ > k H1 : µ = k
¿REGION C RITICA? Figura 8.2(a) Figura 8.2(b) Figura 8.2(c)
¿VALOR CRITICO? a = −Zα ´o a = −tα b = Z α ´o b = t α c = −Zα/2 y d = Z α/2 o´ c = −tα/2 y d = −tα/2
Tabla 8.1: Resumen acerca contrastes relacionadas con la media poblacional
0,4
0,4
0,4
0,3
0,3
0,3
0,2
0,2
0,2
0,1
0,1
0
-5
-3
-1
a
1
3
(a) H 1 : µ < k
5
0
0,1
-5
-3
-1
1
b
3
(b) H 1 : µ > k
5
0
-5
-3
-1 c d1
3
5
(c) H 1 : µ = k
Fig. 8.2: Regi´ on cr´ıtica para diferentes pruebas relacionadas con medias
8.2 Pruebas para algunos par´ametros poblacionales
87
CONTRASTES PARA LA DIFERENCIA DE MEDIAS POBLACIONALES (MUESTRAS INDEPENDIENTES) 1. Tener en cuenta los supuestos de la tabla relacionada con distribuci´ on muestral de diferencia de medias. 2. Utilizaremos la normal o la t de Student (los grados de libertad dependen de la situaci”on que tengamos en el problema). 3. La regi´ on cr´ıtica es la regi´on sombreada que aparece en la figura 8.3. 4. A los valores a , b, c y d que aparecen en la figura 8.3 se les llamar´a valores cr´ıticos.
1. 2. 3.
¿HIPOTESIS NULA?
¿HIPOTESIS ALTERNATIVA?
≥ ≤
H1 : µ 1 − µ 2 < k H1 : µ 1 − µ 2 > k H1 : µ 1 − µ 2 = k
H0 : µ 1 − µ 2 k H0 : µ 1 − µ 2 k H0 : µ 1 − µ 2 = k
¿REGION CRITICA? Figura 8.3(a) Figura 8.3(b) Figura 8.3(c)
¿VALOR CRITICO? a = −Zα ´o a = −tα b = Z α ´o b = t α c = −Zα/2 y d = Z α/2 o´ c = −tα/2 y d = −tα/2
Tabla 8.2: Resumen acerca contrastes relacionadas con la media poblacional
0,4
0,4
0,4
0,3
0,3
0,3
0,2
0,2
0,2
0,1
0,1
0
-5
-3
-1
a
1
3
5
(a) H 1 : µ 1 − µ 2 < k
0
0,1
-5
-3
-1
1
b
3
5
(b) H 1 : µ 1 − µ 2 > k
0
-5
-3
-1 c d1
3
5
(c) H 1 : µ 1 − µ 2 = k
Fig. 8.3: Regi´ on cr´ıtica para diferentes pruebas relacionadas con medias poblacionales
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES (MUESTRAS DEPENDIENTES O PAREADAS)
Al definir X1 − X 2 =: X y al considerar el problema de determinar la distribuci´on muestral de X, los diferentes supuestos que se deben tener en cuenta, coinciden con los que aparecen en la tabla 6.1 y los contrstes son los mismos que los que ilustran en la tabla 8.2.
8.2 Pruebas para algunos par´ametros poblacionales
88
INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL 1. Tener en cuenta los supuestos de la tabla relacionada con distribuci´on muestral de proporciones muestrales. 2. La distribuci´ on a utilizar ser´a la normal. 3. La regi´ on cr´ıtica es la regi´on sombreada que aparece en la figura 8.4. 4. A los valores a , b, c y d que aparecen en la figura 8.4 se les llamar´a valores cr´ıticos.
¿HIPOTESIS NULA?
≥ ≤
1. 2. 3.
H0 : p k H0 : p k H0 : p = k
¿HIPOTESIS ALTERNATIVA? H1 : p < k H1 : p > k H1 : p = k
¿REGION CRITICA? Figura 8.4(a) Figura 8.4(b) Figura 8.4(c)
¿VALOR CRITICO? a = −Zα b = Z α c = −Zα/2 y d = Z α/2
Tabla 8.3: Resumen acerca contrastes relacionadas con la proporci´on poblacional
0,4
0,4
0,4
0,3
0,3
0,3
0,2
0,2
0,2
0,1
0,1
0,1
0
0
-5
-3
-1
a
1
3
(a) H 1 : p < k
5
-5
-3
-1
1
b
3
(b) H 1 : p > k
5
0
-5
-3
-1 c d1
3
5
= k (c) H 1 : p
Fig. 8.4: Regi´ on cr´ıtica para diferentes pruebas relacionadas con proporciones poblacionales INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES 1. Tener en cuenta los supuestos de la tabla relacionada con distribuci´ on muestral de diferencia de proporciones muestrales. 2. La distribuci´ on a utilizar ser´a la normal. 3. La regi´ on cr´ıtica es la regi´on sombreada que aparece en la figura 8.7. 4. A los valores a , b, c y d que aparecen en la figura 8.7 se les llamar´a valores cr´ıticos.
8.2 Pruebas para algunos par´ametros poblacionales
1. 2. 3.
¿HIPOTESIS NULA?
¿HIPOTESIS ALTERNATIVA?
≥ ≤
H1 : p 1 − p2 < k H1 : p 1 − p2 > k H1 : p 1 − p2 = k
H0 : p 1 − p2 k H0 : p 1 − p2 k H0 : p 1 − p2 = k
89
¿REGION CRITICA? Figura 8.7(a) Figura 8.7(b) Figura 8.7(c)
¿VALOR CRITICO? a = −Zα b = Z α c = −Zα/2 y d = Z α/2
Tabla 8.4: Resumen acerca contrastes relacionadas con la diferencia de proporciones poblacionales
0,4
0,4
0,4
0,3
0,3
0,3
0,2
0,2
0,2
0,1
0,1
0
-5
-3
-1
a
1
3
0
5
(a) H 1 : p 1 − p 2 < k
0,1
-5
-3
-1
1
b
3
0
5
(b) H 1 : p 1 − p 2 > k
-5
-3
-1 c d1
3
5
(c) H 1 : p 1 − p 2 = k
Fig. 8.5: Regi´on cr´ıtica para diferentes pruebas relacionadas con diferencia de proporciones poblacionales
CONTRASTES PARA LA VARIANZA POBLACIONAL 1. Tener en cuenta los supuestos de la tabla relacionada con distribuci´ on muestral de la varianza muestral 2. La distribuci´ on a utilizar ser´ a la chi-cuadrada con ν = n − 1 grados de libertad. 3. La regi´ on cr´ıtica es la regi´on sombreada que aparece en la figura 8.6. 4. A los valores a , b, c y d que aparecen en la figura 8.6 se les llamar´a valores cr´ıticos. 5. Es importante tener en cuenta que, para la distribuci´ on chi-cuadrada con ν grados de libertad se cumple que, si ν > 40, entonces,
≈
χ2α,ν
1. 2. 3.
ν
¿HIPOTESIS NULA?
¿HIPOTESIS ALTERNATIVA?
H0 : σ 2 k H0 : σ 2 k H0 : σ 2 = k
H1 : σ 2 < k H1 : σ 2 > k H1 : σ 2 = k
≥ ≤
2 + z α 1− 9ν
2 9ν
¿REGION CRITICA? Figura 8.6(a) Figura 8.6(b) Figura 8.6(c)
3
.
¿VALOR CRITICO? a = χ 21−α b = b = χ 2α c = χ 21−(α/2) y d = χ 2α/2
Tabla 8.5: Resumen para pruebas relacionadas con la varianza poblacional
8.2 Pruebas para algunos par´ametros poblacionales
90
0,4
0,4
0,4
0,3
0,3
0,3
0,2
0,2
0,2
0,1
0,1
0,1
0
0
-5
-3
-1
a
1
3
5
(a) H 1 : σ 2 < k
-5
-3
-1
1
b
3
5
0
(b) H 1 : σ 2 > k
-5
-3
-1 c d1
3
5
= k (c) H 1 : σ 2
Fig. 8.6: Regi´on cr´ıtica para pruebas relacionadas con la varianza poblacional
CONTRASTES PARA LA RAZON DE VARIANZAS POBLACIONALES 1. Tener en cuenta los supuestos de la tabla relacionada con distribuci´ on muestral de la raz´on de varainzas muestrales. 2. La distribuci´ on a utilizar ser´a la F de Fisher con ν1 = n1 − 1 y ν2 = n2 − 1 grados de libertad. 3. La regi´ on cr´ıtica es la regi´on sombreada que aparece en la figura 8.7. 4. A los valores a , b, c y d que aparecen en la figura 8.7 se les llamar´a valores cr´ıticos.
¿HIPOTESIS NULA?
¿HIPOTESIS ALTERNATIVA?
H0 : σ 21 σ 22 H0 : σ 21 σ 22 H0 : σ 21 = σ 22
H1 : σ 21 < σ22 H1 : σ 21 > σ22 H1 : σ 21 = σ 22
≥ ≤
1. 2. 3.
¿REGION CRITICA? Figura 8.7(a) Figura 8.7(b) Figura 8.7(c)
¿VALOR CRITICO? a = F 1−α b = F α c = F 1−(α/2) y d = F α/2
Tabla 8.6: Resumen de pruebas relacionadas con raz´on de varianzas
0,4
0,4
0,4
0,3
0,3
0,3
0,2
0,2
0,2
0,1
0,1
0,1
0
0
-5
-3
-1
a
1
3
5
(a) H 1 : σ 21 < σ22
-5
-3
-1
1
b
3
5
(b) H 1 : σ 21 > σ22
0
-5
-3
-1 c d1
3
5
= σ 22 (c) H 1 : σ 21
Fig. 8.7: Regi´on cr´ıtica para pruebas relacionadas con raz´on de varianzas
8.3 Aplicaciones
8.3
91
Aplicaciones
Ejemplo 8.3.1 Como parte de un proceso de ensamblaje, se usa un taladro para hacer agujeros en una l´amina de metal. Cuando el taladro funciona adecuadamente, los di´ ametros de estos agujeros tienen una distribuci´on normal con media de 2 cent´ımetros y desviaci´ on t´ıpica de 0,06 cent´ımetros. Peri´odicamente, se miden los di´ametros de una muestra aleatoria de agujeros para controlar que el taladro funciona adecuadamente. Asumamos que la desviaci´ on t´ıpica no var´ıa. Una muestra aleatoria de nueve medidas da un di´ ametro medio de 1,95 cent´ımetros. Probar la hip´otesis de que la media poblacional es 2 cent´ımetros frente a la alternativa de que no es as´ı. Use un nivel de significancia de 0,05. SOLUCION: Sea µ el di´ametro medio poblacional (en cent´ımetros). Entonces, queremos contrastar las hip´ otesis H0 : µ = 2 versus H1 : µ = 2.
Tenemos que la poblaci´on es normal, σ = 0,06 (conocida), n = 6 y x = 1,95. El valor del estad´ıstico de prueba est´a dado por Z = −2,50 y para una prueba al nivel del 5%, tenemos que α = 0,05 y Zα/2 = Z0,025 = 1,96. Entonces, se rechaza la hip´ otesis nula al nivel de significancia del 5%. ◭ Ejemplo 8.3.2 De una muestra aleatoria de 802 clientes de supermercados, suponga que 378 pagaron sus art´ıculos con tarjetas de cr´ edito. Contrastar el nivel del 10%, la hip´ otesis nula de que al menos la mitad de los compradores pagan sus art´ıculos con t´ arjetas de cr´edito frente a la alternativa de que la proporci´on poblacional es menor de la mitad. SOLUCION: Sea p la proporci´on poblacional de compradores que pagan sus art´ıculos con tarjetas de cr´edito. Queremos probar la hip´otesis
≥ 0,50 versus H : p < 0, 50. = 0,50, n = 802 ( ≥ 30), p = 378/802 = 0, 471. El valor del estad´ıstico H0 : p
1
Tenemos que p0 de prueba es Z = −1,64. Para una prueba al nivel del 10%, tenemos que α = 0,10 y Zα = Z 0,10 = 1,28. Entonces, se rechaza la hip´otesis nula al nivel de significancia del 10%. ◭
Ejemplo 8.3.3 Un rector de cierta universidad afirma que la proporci´on de hombres que tienen auto en el campus es mayor a la proporci´on de mujeres que tienen auto en el campus. Un profesor de estad´ıstica se interesa en la afirmaci´ on y entrevista aleatoriamente a 100 hombres y a 100 mujeres. Encuentra que 34 hombres y 27 mujeres tienen autos en el campus. ¿Puede concluirse con un nivel del 5% que la afirmaci´on del rector es falsa? SOLUCION: Sean p1 y p2 las proporciones poblacionales de hombres y mujeres, respectivamente, que tienen auto en el campus. Entonces, queremos contrastar la hip´otesis nula
≤ 0
H0 : p 1 − p2
versus
H1 : p 1 − p2 > 0.
Los datos muestrales son n1 = 100,
p1 =
34 = 0, 34, 100
n2 = 100,
p2 =
27 = 0, 27. 100
Con estos valores, el estimador com´un bajo la hip´otesis nula es p0 = 0, 305 y el estad´ıstico de prueba est´a dado por Z = 1, 075. Para una prueba al nivel del 5%, tenemos que α = 0,05 y Zα = Z 0,05 = 1,64. Entonces, al nivel de significancia del 5%, no se rechaza la hip´ otesis nula de que la proporci´on de hombres que tienen auto en el campus es menor o igual a la proporci´on de mujeres que tienen auto en el campus. Es decir, los datos muestran que la afirmaci´ on del rector es falsa. ◭
8.3 Aplicaciones
92
Ejemplo 8.3.4 En un establecimiento escolar suburbano, se seleccion´o al azr una muestra aleatoria de 25 alumnos de quinto grado (grupo 1) de una poblacion de estudiantes perteneciente a familias en que ambos padres trabajan. Se seleccion´ o tambi´en una muestra aleatoria al azar de 15 estudiantes (grupo 2) del mismo grado y establecimiento escolar entre aquellos estudiantes que pertenecen a familias en que solamente el padre trabaja. El an´alisis de los puntajes de rendimiento escolar (en escala de 1 a 100) de los dos grupos dio los siguientes resultados: un puntaje promedio de 78 para el grupo 1 y de 85 para el grupo 2. La experiencia muestra que las poblaciones de puntajes para ambos grupos est´an distribuidas en forma aproximadamente normal, con varianzas de σ21 = 81 y σ22 = 25. Utilizando un nivel de significancia del 5% y con base en estos datos, determinar si se puede concluir que la media de la poblaci´ on de la que se seleccion´o el grupo 1 es inferior a la media de la poblaci´on de la que se seleccion´o el grupo 2. SOLUCION: Sean µ 1 y µ 2 las respectivas medias poblacionales de puntajes promedios. Al plantear las hip´ otesis del problema, obtenemos
≥
H0 : µ 1 µ 2 H1 : µ 1 < µ 2
≥
o su equivalente H0 : µ 1 − µ 2 0 ; o su equivalente H1 : µ 1 − µ 2 < 0.
Ahora, tenemos que n1 = 25 , n2 = 15 ,
x1 = 78 , x2 = 85 ,
σ21 = 78 ; σ22 = 85 .
El valor del estad´ıstico de prueba est´ a dado por Z = −3,16. Para una prueba al nivel del 5%, tenemos que α = 0,05 y Zα = Z 0,05 = 1,64. Entonces, se rechaza la hip´ otesis nula al nivel de significancia del 5%. Por lo tanto, se concluye que en ese establecimiento escolar, los puntajes promedios generales de rendimiento de los estudiantes de quinto grado que pertenecen a familias en que ambos padres trabajan son inferiores a los de los estudiantes que pertenecen a familias en que solamente el padre trabaja. ◭ Ejemplo 8.3.5 Se llev´o a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminados diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una m´aquina para medir el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observ´ o la profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado) de 85 unidades con una desviaci´on est´andar muestral de 4, mientras que las muestras del material 2 dieron un promedio de 81 y una desviaci´ on est´ andar muestral de 5. ¿Puede concluirse en el nivel de significancia del 5% que el deterioro abrasivo del material 1 excede al del material 2 por m´as de 2 unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales. SOLUCION: Sean µ 1 y µ 2 las respectivas medias poblacionales para las piezas de los materiales 1 y 2. Queremos contrastar la hip´otesis H0 : µ 1 − µ 2 = 0
versus
H1 : µ 1 − µ 2 > 0.
Tenemos que n1 = 12 , n2 = 10 ,
x1 = 85 , x2 = 81 ,
s1 = 4 ; s2 = 5 .
La varianza poblacional com´un se estima como s 2 = 20, 05. Adem´ as, el valor del estad´ıstico de prueba est´a dado por t = 1,04. Para una prueba al nivel del 5%, tenemos que α = 0,05 y tα = t 0,05 = 1, 725 con 20 grados de libertad. Entonces, no puede rechazarse la hip´otesis nula de igualdad de medias frente a la alternativa unilateral al nivel del 5%. Por lo tanto, no se est´a en condiciones de concluir que el deterioro abrasivo del material 1 excede al del material 2 por m´ as de dos unidades. ◭
8.3 Aplicaciones
93
Ejemplo 8.3.6 El departamento de zoolog´ıa de cierto instituto llev´o a cabo un estudio para estimar la diferencia en la cantidad de cierta sustancia qu´ımica medida en dos estaciones diferentes de un r´ıo. La sustancia se mide en miligramos por litro. Se reunieron 15 muestras de la estaci´on 1 y 12 muestras de la estaci´on 2. Las 15 muestras de la estaci´ on 1 tuvieron un contenido promedio de sustancia qu´ımica de 3,84 miligramos por litro y una desviaci´ on est´andar de 3,07 miligramos por litro, mientras que las 12 muestras de la estaci´on 2 tuvieron un contenido promedio de 1,49 miligramos por litro y una desviaci´ on est´ andar de 0,80 miligramos por litro. Al nivel del 5% determine si los contenidos promedios reales de sutancia en estas dos estaciones son diferentes. Suponga que las observaciones vienen de poblaciones normalmente distribuidas con varianzas diferentes. SOLUCION: Sean µ 1 y µ 2 las respectivas medias poblacionales para contenidos promedios reales de sutancia en las dos estaciones. Queremos contrastar la hip´otesis H0 : µ 1 − µ 2 = 0
versus
H1 : µ 1 − µ 2 = 0.
Tenemos que n1 = 15,
x1 = 3, 84,
s1 = 3, 07,
n2 = 12,
x2 = 1, 49,
s2 = 0, 80.
El valor del estad´ıstico de prueba est´a dado por t = 2, 846. Para una prueba al nivel del 5%, tenemos que α = 0,05 y tα/2 = t 0,025 = 2, 120 con 16 grados de libertad. Entonces, puede rechazarse la hip´otesis nula de igualdad de medias frente a la alternativa bilateral al nivel del 5%. Por lo tanto, podemos concluir que los contenidos promedio reales de sustancia para estos dos lugares son diferentes (comp´arese este resultado con el obtenido en el ejemplo ◭ 7.4.7). Ejemplo 8.3.7 Con el fin de cumplir las normas establecidas, es importante que la varianza en el porcentaje de impurezas de unas remesas de productos qu´ımicos no supere el 4%. Una muestra aleatoria de 20 env´ıos dio una varianza muestral de 5,62 en el porcentaje de impureza. Al nivel del 10%, contrastar la hip´ otesis nula de que la varianza de la poblaci´on no es mayor que 4. Sup´ ongase que la distribuci´on de la poblaci´on es normal. SOLUCION: Sea σ2 la varianza poblacional de la concentraci´on de impureza. Queremos contrastar la hip´ otesis H0 : σ 4 versus H1 : σ > 4.
≤
Tenemos que s2 = 5,62, n = 20 y σ20 = 4. El valor del estad´ıstico de prueba est´ a dado por χ2 = 26, 695. Para una prueba al nivel del 10%, tenemos que α = 0,10 y χ2α (19) = otesis χ20,10 (19) = 27, 20 con 19 grados de libertad. Entonces, no puede rechazarse la hip´ nula al nivel del 10%. Por lo tanto, los datos no contienen una evidencia particularmente importante contra la hip´ otesis de que la varianza poblacional del porcentaje de impureza no es mayor que 4. ◭ Ejemplo 8.3.8 Se compararon las varianzas de los vencimientos de dos tipos de bonos. Para una muestra aleatoria de 17 bonos del primer tipo, la varianza de los vencimientos (en a˜ nos al cuadrado) fue de 123,35. Para una muestra aleatoria independiente de 11 bonos del segundo tipo, la varianza de los vencimientos fue de 8,02. Al nivel del 2%, determinar si las dos varianzas poblacionales son diferentes. Asuma que las dos poblaciones tienen distribuci´ on normal. SOLUCION: Sean σ 21 y σ 22 las respectivas varianzas poblacionales. Queremos contrastar la hip´otesis H0 : σ 21 = σ 22
versus
H1 : σ 21 = σ 22 .
Cap. 8. Ejercicios
94
Para este ejemplo, n1 = 17,
s21 = 123,35,
n2 = 11,
s22 = 8, 02.
El valor del estad´ıstico de prueba est´ a dado por F = 15, 38. Para una prueba al nivel del 2%, tenemos que α = 0,02 e, interpolando, Fα/2 (16, 10) = F0,01 (16, 10) = 4,53 con otesis nula al nivel del 5%. ν1 16 y ν2 = 10 grados de libertad. Podemos rechazar la hip´ Por consiguiente, hay abrumadora evidencia de que las varianzas en los vencimientos son diferentes para estos dos tipos de bonos. ◭
Ejercicios 1. Una muestra aleatoria de 100 muertes registradas en cierto pa´ıs durante el a˜no pasado mostr´ o una vida promedio de 71,8 a˜nos. Suponiendo una desviaci´on est´andar poblacional de 8,9 a˜nos, ¿parecer´ıa esto indicar que la vida promedio hoy en d´ıa es mayor que 70 a˜nos? Utilice un nivel de significancia del 5%. 2. Un doctor afirma que el 12% de todas las citas son canceladas durante un periodo de seis semanas. Se sabe que fueron canceladas 21 de las 200 citas del doctor. Haga una prueba con un nivel de significancia del 5% para determinar si la verdadera proporci´on de todas las citas que son canceladas es diferente del 12%. 3. De una muestra aleatoria de 203 anuncios publicados en revistas colombianas, 52 eran de deportes. De una muestra aleatoria independiente de 270 anuncios publicados en revistas brasileras, 56 eran de deportes. Usando un nivel del 5%, constrastar frente a una alternativa bilateral, la hip´ otesis nula de que las proporciones de anuncios c´omicos de las revistas colombianas y americanas son iguales. 4. Se llev´ o a cabo un estudio entre expertos matem´aticos para conocer su opini´on sobre las mujeres matem´aticas. Se les pidi´o que evaluaran en una escala de 1 (totalmente en desacuerdo) a 5 (totalmente de acuerdo) la afirmaci´on: “Las mujeres matem´aticas tienen la misma oferta de trabajo que los hombres”. Para una muestra aleatoria de 186 hombres de esta profesi´on, la respuesta media fue de 4.059 con una desviaci´on t´ıpica de 0,839. Para una muestra aleatoria independiente de 172 mujeres matem´aticas, la respuesta media fue 3.680 con una desviaci´on t´ıpica de 0,966. Utilize un nivel de significancia del 5% para contrastar la hip´otesis nula de que las dos medias poblacionales son iguales frente a la alternativa de que la verdadera media es mayor para los hombres. 5. Se llev´o a cabo un estudio que pretend´ıa valorar el efecto de la presencia de un moderador sobre el n´umero de ideas generadas por un grupo. Se observaron cuatro miembros, con y sin moderadores. Para una muestra aleatoria de cuatro grupos con moderador, el n´umero medio de ideas generadas por grupo fue de 78, con una desviaci´on t´ıpica de 24,4. Para una muestra aleatoria independiente de cuatro grupos sin moderardor, el n´umero medio de ideas generadas por grupo fue de 63,5, con una desviaci´on t´ıpica de 20,2. Asumiendo que las distribuciones poblacionales son normales con igual varianza, contrastar la hip´otesis nula de que las medias poblacionales son iguales frente a la alternativa de que la verdadera media es mayor para los grupos con moderador. Use un nivel de significancia del 10%. 6. La varianza calculada de los puntajes en lectura de los estudiantes de tercer grado del sistema escolar A, obtenidos durante 10 a˜n os, es 1,44. Una muestra aleatoria de 21 estudiantes de tercer grado de otro sistema escolar (B) con quienes se practic´o la misma prueba de lectura, arroj´o una varianza de s 2 = 1,05. ¿Proporcionan estos datos evidencia suficiente como para concluir, al nivel de significancia 0,05, que los puntajes de los alumnos de tercer grado del sistema B son menos variables de que los de los estudiantes del sistema A? Sup´onga que los puntajes de los estudiantes de tercer del sistema B est´an normalmente distribuidos.
Cap. 8. Ejercicios
95
7. Al probar la diferencia en el desgaste abrasivo de los dos materiales en el ejemplo 8.3.5, se asumi´o que las varianzas poblacionales desconocidas eran iguales. ¿Es esta justificaci´ on correcta? Utilice un nivel de significancia del 10%. 8. En 1879, A.A. Michelson hizo 100 determinaciones de la velocidad de la luz en el aire empleando una modificaci´on del m´etodo propuesto por el f´ısico franc´es Foucault. Los datos estan en miles de km/s. Los datos est´ an recogidos en la primera columna del archivo luz.sf . Suponiendo que los datos corresponden a una distribuci´on normal, (a) estimar la media y la desviaci´ on t´ıpica de la distribuci´on. (b) Obtener un intervalo de confianza del 95% para la media y la desviaci´ on t´ıpica de la distribuci´ on. (c) Contrastar2 la hip´ otesis nula H 0 : µ = 299.782, 5Km/s frente a H1 : µ = 299.782, 5 con α = 0,05.
9. En 1879, el f´ısico norteamericano Albert A. Michelson tom´o 100 medidas de la velocidad de la luz en el aire empleando una modificaci´on del m´etodo propuesto por el f´ısico franc´es Foucault. Las medidas que tom´ o se proporcionan en la primera columna del archivo luz.sf3 (en miles de km/s). (a) Analice num´erica y gr´ aficamente estos datos. Genere el histograma, el diagrama de cajas y el diagrama de tallo y hojas y proporcione los principales estad´ısticos que caracterizan a este conjunto de datos. (b) Contraste la normalidad de los datos gr´aficamente (gr´afico probabilista normal). (c) Admitiendo que estos datos proceden de una distribuci´ on normal proporcione los valores de los estimadores de la misma por el m´etodo de m´axima verosimilitud. 10. Simon Newcomb midi´o el tiempo que una se˜nal luminosa tardaba en recorrer una distancia de 7.400 metros. Los datos se proporcionan en nanosegundos (hay 109 nanosegundos en un segundo) y est´an recogidos en la segunda columna del archivo luz.sf3. (a) Analice num´erica y gr´aficamente estos datos. ¿Se detecta alg´un valor at´ıpico mediante los diagramas de cajas y de tallo y hojas? (b) Transforme estos datos a velocidades y anal´ıcelos ¿Se detecta alg´ un valor at´ıpico mediante los diagramas de cajas y de tallo y hojas? (c) Si hubiere valores at´ıpicos elim´ınelos del an´alisis y compruebe la normalidad de los datos restantes mediante diferentes gr´aficos. (d) Admitiendo que estos datos proceden de una distribuci´on normal, proporcione los valores de los estimadores de la misma por el m´etodo de m´axima verosimilitud. (e) Compare gr´ aficamente los datos de la velocidad de la luz de Newcomb y de Michelson (diagramas de cajas e histogramas). 11. Se ha registrado el n´ umero de ni˜nas en familias de 12 hijos nacidas entre 1879 y 1936 para unas comunidades de granjeros que habitaban en los Estados Unidos de Norteam´erica y Canad´a. Los datos se muestran en el archivo demografia.sf3. (a) Analice num´erica y gr´aficamente estos datos. Admitiendo equiprobabilidad de nacimiento de ni˜ no y ni˜ na en cualquier embarazo ¿qu´e tip o de distribuci´on deber´ıan seguir estos datos? (b) Estime la fracci´ on media de ni˜nas en ese tipo de familias. 2
Actualmente se toma 299.792,5 km/s como la velocidad de la luz en el vac´ıo.
Cap. 8. Ejercicios
96
12. Los circuitos integrados se construyen sobre obleas de silicio, que son discos de 20 cm de di´ ametro y muy poco espesor (entre 200-300 micras). En una de las etapas iniciales de fabricaci´ on se toman obleas de silicio y se introducen en una esmeriladora (grinder) hasta conseguir el espesor deseado. En el archivo obleas.sf3 se presentan 150 medidas de espesor de obleas de silicio, que corresponden a una planta holandesa de fabricaci´on de circuitos integrados de Philips. El espesor deseado es 245 micras. Realizar la estimaci´ on puntual y obtener los intervalos de confianza para la media y la desviaci´on t´ıpica (α = 0,01) suponiendo distribucion normal. Contrastar la hipotesis nula H0 : µ = 245 micras frente a H 1 : µ = 245 con α = 0,05.
13. Los laboratorios Merck llevaron a cabo un experimento para evaluar el efecto de un nuevo medicamento. Se inyect´o a diecinueve ratas de pantano una dosis de 12,5 mg de la droga. Se eligieron al azar, de la camada de cada una de estas ratas, un macho y una hembra para tirarlos a una piscina. Cada rata era colocada en un extremo de la piscina y se la dejaba nadar hasta que escapaba por el otro extremo. Si no consegu´ıa escapar al cabo de un cierto tiempo se le daba otra oportunidad. El experimento se repet´ıa hasta que la rata consegu´ıa escapar tres veces. El archivo de datos merck.sf3 presenta el n´umero de pruebas necesarias para que cada animal consiguiese los tres ´exitos. ¿Hay evidencia de diferencias en el n´umero de intentos que necesitan machos y hembras para superar la prueba? 14. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligencia realizados a parejas de gemelos monozig´oticos. Los gemelos monozig´oticos se forman por la divisi´o n en dos de un mismo ´ovulo ya fecundado y, por tanto, tienen la misma carga gen´etica. Al mismo tiempo, por razones obvias, es muy frecuente que compartan el entorno vital y es dif´ıcil separar ambos factores. En el conjunto de datos, los datos de la columna A corresponden al gemelo criado por sus padres naturales, los de la columna B al criado por un familiar u otra persona. (a) Analice num´erica y gr´aficamente, por separado, los datos correspondientes a cada uno de estos dos tipos de gemelos. (b) Calcule el coeficiente de correlaci´on entre los cocientes de inteligencia de ambos tipos de gemelos. (c) Estudie si existen diferencias significativas entre los promedios de inteligencia de ambos tipos de gemelos. 15. El Insitol es un alcohol c´ıclico de estructura compleja que se utiliza para combatir la depresi´ on. Tambi´en se ha utilizado en investigaci´on psiqui´atrica contra el p´anico. Para probar esta teor´ıa se ha realizado un estudio doblemente ciego placebo con 21 pacientes a los que se hab´ıa diagnosticado p´anico. Los pacientes apuntaban en un diario sus ataques de p´anico. En el archivo insitol.sf3 se muestran los datos correspondientes a una semana durante la cual se les hab´ıa administrado una dosis de placebo y otra semana en la cual se les hab´ıa administrado Insitol. Estudie si el uso de Insitol reduce significativamente el n´umero de ataques de p´anico. 16. Se ha investigado la relaci´ on entre la temperatura media del aire y la temperatura de la ´ envoltura de gusanos en el Artico. En diferentes d´ıas se han tomado las temperaturas medias del aire y dentro de la envoltura de estos gusanos (grados cent´ıgrados). Los datos del archivo gusanos.sf3 indican que la temperatura del gusano dentro de la envoltura es superior a la temperatura del aire exterior. (a) Estime la diferencia media entre las temperaturas de la envoltura y del aire exterior. (b) Contraste si la temperatura dentro de la envoltura es superior en al menos cuatro grados cent´ıgrados a la temperatura media del aire.
A Gu´ıa r´ apida para trabajar con Statgraphics
A.1
An´ alisis de un solo conjunto de datos
1. Abrir el archivo de datos calles.sf3. 2. Seleccionamos Describe . . . Numeric Data . . . One-Variable Analysis . 3. Elegimos Data = Longitud y pulsamos la opci´on OK . 4. Sale la llamada ventana del an´alisis . Los ´ıconos principales de esta ventana son:
• Input dialog (´ıcono de di´alogos ):
para seleccionar o cambiar variables dentro del
archivo y an´alisis seleccionado.
• Tabular options (´ıcono de opciones tabulares ):
medidas estad´ısticas, percentiles,
tablas de frecuencia, inferencias, etc.
• Graphical options (´ıcono de opciones gr´aficas ): diagramas de dispersi´on, histogramas, etc.
• Save results (´ıcono de salvar resultados ): permite salvar los resultados del an´alisis. 5. Transformaci´ on de una variable:1 OneVariable Analysis , activar el bot´on Transform y, en Operators , elegir logaritmo .
A.2
An´ alisis simult´ aneo de dos o m´ as conjuntos de datos
1. Compare . . . Two Samples . . . Two Sample Comparison . . . 2. Para obtener diagramas de cajas m´ ultiples: Compare . . . Multiple Samples . . . MultipleSample Comparison . . . Multiple Data Columns . . . Ok . . . Samples= (en esta ´ultima opci´on mencionar los datos que queremos comparar) 3. Para obtener diagramas de cajas m´ ultiples: Plot . . . Exploratory Plots . . . Multiple Boxand-Whishker Plot . . . Data=distancia . . . Level codes=year . . . 1
Por ejemplo, si quisi´ eramos trabajar con el logaritmo de la variable escribimos LOG(longitud) en vez de longitud
A.3 Gr´aficos de dispersi´on
A.3
98
Gr´ aficos de dispersi´ on
Con la opci´on Plot . . .Scatterplots se pueden realizar: 1. Gr´aficos univariantes (Univariate Plot ). Por ejemplo, abrir archivo de datos autos.sf3 y utilizar la variable mpg . 2. Gr´aficos bidimensionales X-Y simples (X-Y plot ) y m´ ultiples (Multiple X-Y Plot ) . Por ejemplo, abrir archivo de datos autos.sf3 y hacer Y=mpg y X=potencia. Sobre la gr´afica, pulsar bot´on derecho del rat´on y elegir Pane options . Aparece una pantalla con varios campos. Elegir Point Codes=model . 3. Gr´aficos tridimensionales X -Y -Z simples (X-Y -Z plot ) y m´ ultiples (Multiple X-Y -Z Plot ). Por ejemplo, abrir archivo de datos autos.sf3 y hacer X=accel , Y=cilindro , Z=price . Sobre la zona gr´afica: bot´on derecho, Pane options , Point Codes=origin. 4. Gr´aficos de matriz (Matriz Plot ). 5. Gr´aficos en coordenadas polares (Polar Coordinates Plot ).
A.4
Diagramas de presentaci´ on
Con la opci´on Plot . . .Business Charts se pueden realizar (abrir siempre el archivo autos.sf3): 1. Gr´aficos de barras simples (Barchart ). Por ejemplo, realizar un gr´ afico de barras para la variable origin del archivo autos.sf3, que contiene el pa´ıs de origen de los autos. Los valores de la variable origin son 1 para los autos norteamericanos, 2 para autos europeos y 3 para autos japoneses. En esta opci´on sale, entre otros, el campo Counts (Frecuencias) que permite introducir la variable que contiene las frecuencias absolutas de los valores de la variable a graficar. Como las frecuencias absolutas de de los valores de la variable origin son: 85 para autos norteamericanos, 26 para autos europeos y 44 para autos japoneses, entonces, por esta raz´on, debemos escribir en este campo join3(85;26;44). Adem´as, el campo Labels (Etiquetas) permite introducir el nombre de la variable que contiene las etiquetas a utilizar para cada barra del gr´afico. Como las etiquetas de los valores de la variable origin est´an contenidas carmakers , que son America, Europe y Japan, hacemos Labels=carmakers . 2. Gr´aficos de barras m´ultiples (Multiple Barchart ). Por ejemplo, realizaremos un gr´afico de barras dobles para las variables origin y year del archivo autos.sf3, que contienen el pa´ıs de origen de los autos y el a˜no de construcci´on, respectivamente. Los valores de la variable year son los intervalos 1978, [1979,1980] y [1981,1982]. Aparecen, entre otros, los siguientes campos:
• Columns (Columnas): En este campo se introducen las variables que contienen las
frecuencias absolutas de los valores de las variables a graficar, o una expresi´o n de Statgtraphics que contiene operadores y que genera sus valores. Como las frecuencias absolutas de de los valores de la variable origin son: 85 para autos norteamericanos, 26 para autos europeos y 44 para autos japoneses, y como las frecuencias absolutas de los valores de la variable year son: 36 para 1978, 58 para [1979,1980] y 61 para [1981,1982], entonces, por esta raz´on, debemos escribir en este campo join3(85;26;44) y join3(36;58;61).
• Labels (Etiquetas): Hacemos Labels=carmakers . 3. Gr´aficos de sectores (Piechart ). Por ejemplo, realizaremos un gr´afico de sectores para la variable origin del archivo autos.sf3, que contienen el pa´ıs de origen de los autos y el a˜no de construcci´on, respectivamente. Los valores de la variable origin son 1 para los autos
A.5 Variables num´ericas multidimensionales
99
norteamericanos, 2 para autos europeos y 3 para autos japoneses. Aparecen, entre otros, los siguientes campos:
• Counts (Frecuencias): En este campo se introducen las variables que contienen las
•
frecuencias absolutas de los valores de las variables a graficar, o una expresi´o n de Statgtraphics que contiene operadores y que genera sus valores. Como las frecuencias absolutas de de los valores de la variable origin son: 85 para autos norteamericanos, 26 para autos europeos y 44 para autos japoneses, entonces, por esta raz´on, debemos escribir en este campo join3(85;26;44). Labels (Etiquetas): En este campo se debe introducir el nombre de la variable que contiene las etiquetas a utilizar para cada grupo de barras del gr´afico. Como las etiquetas de los valores de la variable origin est´an contenidas carmakers , que son America, Europe y Japan, hacemos Labels=carmakers .
4. Gr´aficos de componentes de l´ıneas (Component Line Chart ) 5. Gr´aficos de escogencias alta y baja (High-Low-Chose Chart ).
A.5
Variables num´ ericas multidimensionales
Seleccione la siguiente secuencia de opciones: Describe . . .Numeric Data. . .Multiple-Variable alogo en cuyo Analysis y aparecen todas las variables del archivo. Aparece una ventana de di´ campo Data introducimos la variables origin, price y year . Luego, pulsamos el bot´on OK.
A.6
Distribuciones de probabilidad
Plot . . . Probability Distributions . Escogemos la distribuci´o n deseada. Los valores de los par´ ametros que definen la distribuci´on (est´ an fijados por defecto por el programa) los podemos modificar si pulsamos el bot´on derecho del rat´on y escogemos la opci´on Analysis Options .
A.7
Inferencias basadas en una sola muestra
1. Se escoge Describe . . . Numeric Data . . . One Variable Analysis . Elegimos la variable que va a ser objeto del an´alisis y pulsar OK . Al pulsar el ´ıcono Tabular options aparecen, entre otros:
• Confidence Intervals .
•
Calcula intervalos para la media (Confidence Interval for Mean) y la desviaci´on t´ıpica (Confidence Interval for Standard Deviation) de la distribuci´on. Pulsando el bot´on derecho del rat´on y escogiendo Pane Options se puede modificar el nivel de confianza (Confidence Level ) y el tipo de intervalo (Interval Type ). Hypothesis Testing Se realizan los contrastes de la media y de la desviaci´on t´ıpica. Pulsando el bot´ on derecho del rat´on y escogiendo Pane options se pueden modificar el valor del par´ametro para la hip´otesis nula (por ejemplo Mean = µ 0 ), del nivel de significancia α (Alpha) y de la hip´otesis alternativa:
2. C´alculo de la curva de potencia. Describe . . . Hypothesis Test . . . Normal Mean y en Null Hypothesis se elige el valor de la media bajo la hip´otesis nula. En la casilla Sample Sigma se escoge el valor de la desviaci´on t´ıpica de la poblaci´on. El tama˜ no de muestra se fija a trav´ es de Sample Size . Seleccionando el ´ıcono de gr´aficos se selecciona la ´unica gr´afica posible (curva de potencia - Power Curve ) y se pulsa OK .
A.8 Inferencias basadas en dos muestras
A.8
100
Inferencias basadas en dos muestras
1. Elegir Compare . . . Two Samples , en donde aparecen cuatro (4) opciones: Two Sample Comparison, Paired-Sample Comparison, Hypotesis Tests , Sample-Size Determination. 2. Cuando seleccionamos Two Sample Comparison 2 el programa pide al usuario que especifique las dos columnas de datos a comparar (Sample 1 y Sample 2 ). Seleccionando Tabular options aparece, entre otros:
• Comparison of Means : Intervalo de confianza para la diferencia de medias y contraste de igualdad de medias.
• Comparison of Standard Deviations :
Intervalo de confianza para el cociente de varianzas y contraste de igualdad de varianzas.
• Kolmogorov-Smirnov Test :
Prueba de hip´ otesis para saber si las distribuciones de ambas muestras son id´enticas.
A.9
Bondad de ajuste
1. Se selecciona Describe . . . Distribution Fitting . . .Uncensured Data. Al pulsar OK se obtiene, entre otras, la salida de las contrastes de bondad de ajuste. 2. Si, estando situados sobre esta salida, pulsamos el bot´ on derecho del rat´on y elegimos la opci´on Analysis Options del men´u emergente resultante, obtenemos la caja de di´alogo Probability Distributios Options , que presenta todas las posibles distribuciones a considerar para el ajuste (observamos que por defecto el ajuste se realiza a una distribuci´on normal). 3. Tambi´en aparecen los siguientes campos:
• Number of Trials (n´umero de ensayos).
Se rellena con el n´umero de tiradas cuando la distribuci´on elegida para el ajuste es binomial;
• Number of Successes (n´umero de eventos).
Se rellena con el n´umero de ´exitos cuando la distribuci´on elegida es una binomial negativa.
• Population Size (tama˜no de la poblaci´on).
Se rellena con el tama˜n o de la poblaci´on cuando la distribuci´on elegida es una hipergeom´etrica.
4. La opci´on tabular Tests for Normality : realiza los contrastes de normalidad. 5. Opci´on tabular Goodness-of-Fit Tests : realiza los contrastes de la bondad de ajuste de los datos a una distribuci´on dada.
2
El procedimiento es id´ entico cuando seleccionamos la opci´ on Paired-Sample Comparison
B Gu´ Gu ´ıa r´ apida apid a para para trab traba a jar jar con con SPSS
B.1
Defini efinicci´ on on de las variables
Para Para definir cada variable variable hay dos procedimien procedimientos: tos:
• Hacer doble clic sobre el encabezamiento de la variable o na vista de variables . • Seleccionar, en la parte inferior, la pesta˜na vista Cuando se hace esto, observamos que hay una fila para cada variable del conjunto de datos y que existen 10 columnas: Nombre , Tipo , Anchura, Anchura, Decimales , Etiqueta, Etiqueta, Valores , Perdidos , Columnas , Alineaci´ on y Medida. Medida. La definic definici´ i´ on de una variable se basa en las opciones que se on ofrecen en esa ventana: 1. Asignar un nombre a cada variable , cumpliendo las siguientes reglas:
• Nombres con no m´asas de 8 caracteres (el primero debe ser una letra o @). • No utilizar s´ımbolos como &, /, $, etc. • No utilizar nunca espacios en blanco. utilizar expresiones expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, • No utilizar o WITH.
2. Asignar un tipo a cada variable , indicando el m´aximo aximo n´ umero umero de d´ıgitos que deseamos para anotar las observaciones de la variable y el tipo de la variable con la que vamos a trabajar (al (alfan fanum´ um´erica eri ca,, fecha, fecha, moneda o num´ nu m´eric er icaa) indicando en este caso el n´umero umero de cifras decimales con que queremos que aparezca en el editor. SPSS permite trabajar con los siguientes tipos de variables: erico est´andar. andar. • Num´ Num ´eric er icas as :: formato num´erico on cada tres posiciones. Un punto para la parte decimal. • Coma: Coma: comas de separaci´on • Punto : al contrario que el anterior. Cie nt´ıfica ıfic a: uso de la E para exponente. • Notaci´ on Cient´ • Cadena: Cadena: variable variabl e alfanum´ alf anum´erica erica (de m´as as de 8 caracteres caract eres se s e considera cons idera larga).
B.1 Definici´ Definici´ on de las variables
10 2
an los formatos de fecha de fecha,, d´ • Adem´asas est´an olar y moneda personalizada. personalizada. Si no escogemos el tipo, el sistema lo asigna autom´aticamente, aticamente, siendo el formato por defecto: Num´ N um´erica er ica 8.2 8. 2 que significa: significa: Anchura: Anchura: 8 y Decimales: Decimales: 2; es decir, una amplitud amplitud de columna de 8 espacios, siendo los 2 ´ultimos para los decimales. decimales. 3. Asignar una Etiqueta a cada variable de variable de no m´as as de 120 caracteres (entre 30 y 40 es el valor recomendado) que nos permita tener m´ as as informaci´ on on sobre esa variable. 4. Asignar Valores Valores : se trata trata de asigna asignarr etiq etique uetas tas a los los valo valores res de cada cada vari variab able le.. No es obligatorio, obliga torio, pero s´ı muy m uy util ´util en algunos casos. 5. Definir Perdidos : permite definir definir los valores valores de los datos especificad especificados os como como perdido perdidoss Perdidos : permite por el usuar usuario. io. Sit´ uese en el campo correspondiente a Perdidos uese Perdidos de cualquier variable y pulse sobre sobre el recuadro recuadro coloreado, coloreado, aparece: aparece: Los c´odigos odigos asignados a los valores ausentes deben de ser coherentes con el tipo de variables declarado: num´ ericos ericos para las num´ ericas ericas y alfanum´ al fanum´ericos ericos para las l as alfanum´ alfanu m´ericas ericas (m´aximo aximo 9 caracteres). carac teres). Se pueden p ueden introducir intro ducir hasta 3 valor valores es perdido perdidoss (indivi (individua duales les)) de tipo discreto discreto,, un rango rango de valor valores es perdido perdidoss o un rango m´as as un valor de tipo discreto. S´olo olo pueden especificarse rangos para las variables num´ ericas. ericas. Estos valores ausentes a usentes son denominados por p or SPSS “valores ausentes definidos por el usuario” (user-defined (user-defined missing values ), ), a diferencia de los definidos por el sistema (system-missing values o sysmis ). ) . Esto Estoss ultimos u´ltimos corresponden a los que establece el sistema para los espacios en blanco y caracteres ilegales que puedan haber en el archivo de datos. Aparecen en los listados representados por comas. 6. Definir Columnas : consis consiste te en especifi especifica carr la amplitud amplitud de la columna. columna. Podemo Podemoss hacerl hacerloo tambi´en en desde el propio archivo de datos. 7. Definir Alineaci´ on: on: selecciona seleccionarr la justificaci´ justificaci´ on de las entradas de la columna: Izquierda, on Izquierda, Derecha y Centrado . 8. Especificar medida. medida. Se puede seleccionar uno de los tres niveles de medida:
• Escala: Escala: los valores de datos son num´ericos ericos en una escala de intervalo. Las variables de escala e scala deben debe n ser s er num´ n um´ericas. ericas.
• Ordinal : Ordinal : los valores de datos representan categor´ categor´ıas con un cierto orden intr´ınseco ınseco
(bajo, medio, alto; totalmente de acuerdo, de acuerdo, en desacuerdo). Las variables ordinales ordinales pueden ser de cadena o valores valores num´ericos. ericos. Notar Notar que para variables variables de cadena ordinales, se asume que el orden alfab´etico etico de los valores de cadena indica el orden correcto de las categor´ categor´ıas; en el caso de bajo, medio y alto el orden ser´ ser´ıa alto, bajo y medio (orden que no es correcto), por lo que es m´as fiable utilizar c´odigos odigos num´ ericos ericos para representar datos ordinales que usar etiquetas de estos c´odigos.
categor´ıas sin un cierto orden intr´ınseco. ınseco. • Nominal : los valores de datos representan categor´
Las variables nominales pueden ser de cadena o valores num´ericos ericos que representan categor´ categor´ıas diferentes, diferen tes, por ejemplo 1 = Hombre y 2 = Mujer .
B.1.1 B.1.1
Tran ransfor sformac maci´ i´ on on de una variable
Elegimos Transformar Elegimos Transformar . . . Calcular , y realizamos los siguientes pasos: 1. Asignar un nombre y un tipo tip o (por (p or defecto ser´a num´erica) erica) a la nueva variable en el cuadro de texto de la Variable la Variable de destino . 2. Definir Definir la expresi´ expresi´ on on num´erica erica que va a permitir p ermitir calcular los valores de la misma. Para ello utilizaremos los nombres de las variables del archivo (podemos escribirlos o seleccionarlos del listado listado que aparece), aparece), constantes, constantes, operadores operadores y funciones. funciones. 3. Pulsa Pulsarr Aceptar .
B.1 Definici´ Definici´ on de las variables
10 3
Para construir estas expresiones pueden usarse operadores op eradores aritm´eticos eticos como +, −, *, /, ** y funciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN, ABS, MOD10, TRUNC, RND, entre otras:
• MOD10 (Resto resultante de dividir entre 10). umero). • TRUNC (Parte entera de un n´umero). as cercano). cercano). • RND (Redondeo al entero m´as Pulsando el bot´on on derecho sobre le nombre de la funci´on, aparece su descripci´on. on. El argumento de las funciones funciones debe ir entre par´ entesis. entesis. Existen Existen funciones funciones particula particulares res como UNIFORM UNIFORM y NORMAL, que se utilizan para la generaci´on on de variables variables aleatorias. aleatorias. Son de bastante utilidad en estudios de simulaci´on. on. Es importante tener cuidado con el orden de utilizaci´on de los operadores y no olvidar que los valores antiguos pierden su vigencia al recodificar una variable sobre el mismo nombre. El bot´on on SI . . . permite realizar modificaciones similares, pero sujetas a que se verifique una condici´on on l´ogica. ogica. Se incluir´an an aquellos casos que verifiquen la condici´on. on. Los que no la cumplan pasar´ an a ser valores ausentes definidos por el sistema. an Una expresi´on on l´ ogica ogica es una expresi´on on que puede ser evaluada como verdadera o falsa en funci´on on de los valores valores de las variables variables en ella relacionadas relacionadas.. El nexo de las variables variables son los operadores operadores de relaci´on: on: = , >= , <= , < , > , ~= . Es posible p osible formar formar expresione expresioness complejas, complejas, utilizando los operadores l´ogicos: ogicos: AND (&), OR ( | ), NOT (~ (~).
B.1. B.1.2 2
Recod Recodifi ifica caci´ ci´ on on de una Variable
A partir de una variable podemos crear otra cuyos valores sean una recodificaci´on de los de la primera. primera. Esta recodificaci´ recodificaci´ on podemos hacerla tanto en la misma variable como en variables on diferentes. Para ello, seleccionaremos Transformar . . . Recodificar . . . En distintas variables . Se abre una ventana en la que deberemos asignar un nombre (y una etiqueta si queremos) a la nueva variable.1
B.1. B.1.3 3
Filtr Filtrad ado o de de dat datos os
El programa SPSS permite seleccionar determinados casos para un pr´oximo proceso, bien temporalmente o de forma permanente, sobre la base de un criterio l´ogico o de una decisi´on on aleatoria. Para ello seleccionaremos el men´u Datos . . . Seleccionar casos . La selecci´on on de individuos puede ser temporal (filtrados (filtrados ) o permanente (eliminados (eliminados ). ). En la selecci´on on permanente permanente eliminamos eliminamos del archivo activo los individuos deseados, mientras que en la temporal, la selecci´on es recuperable (los (los casos son filtrad filtrados) os).. En esta ultima ´ultima situaci´on, on, los individuos (casos) del archivo que no satisfacen la condici´on on aparecer´ an an marcados como excluidos mediante una l´ınea que cruza en diagonal su n´umero umero de fila. Aparece tambi´en en una variable llamada filter $ que el sistema crea para controlar el filtrado de datos. Especificaciones:
• Todos los casos : casos : indica que quiere procesar todos los casos del archivo de datos de trabajo. quiere procesar procesar s´olo olo los casos que satisfagan una • Si se satisface la condici´ on: on: indica que quiere
condici´on on l´ogica. ogica. Para Para especificar especificar o cambiar cambiar la condici´ condici´ on, on, pulse en Si . Esta Esta alternati alternativa va crea la variable filter variable filter $, que el sistema crea para controlar el filtrado de datos.
1
Cuidado!, si se selecciona . . . borrar´ as as la variable original.
B.2 An´alisis exploratorio de datos
104
• Muestra aleatoria de casos : indica que queremos seleccionar los casos de forma aleatoria
para su procesamiento. Si ha tecleado las especificaciones de muestreo, ´estas aparecer´ an junto al bot´ on de comando Muestra. Si no, o si quiere cambiarlas, pulse en Muestra(v´ease m´as adelante). Esta alternativa tambi´en crea la variable filter $.
• Bas´ andose en el rango del tiempo o de los casos : permite seleccionar los casos deseados siempre que sean consecutivos.
• Usar variable de filtro :
indica que quiere utilizar los valores de una variable num´erica existente para controlar el filtrado de casos. Seleccione la variable de la lista de la izquierda. Los casos cuyo valor sea 0, o ausentes, en la variable de filtro se excluyen del an´alisis.
B.2
An´ alisis exploratorio de datos
Primero abrir el archivo de datos. 1. Tablas de frecuencias: Analizar . . . Estad´ısticos descriptivos . . . Frecuencias . SPSS tambi´en cuenta con el men´u alternativo Analizar . . . Tablas personalizadas que posibilita alterar el formato del resultado. 2. Estad´ısticos: Analizar . . . Estad´ısticos descriptivos . . . Descriptivos donde hay que seleccionar la variable o variables de inter´es y despu´es Opciones para escoger los estad´ısticos que interesan. Sin embargo con este men´u no se pueden obtener los percentiles. Para obtenerlos hay que usar Analizar . . . Estad´ısticos descriptivos . . . Frecuencias y entrar en la opci´on Estad´ısticos en donde se seleccionan los percentiles deseados. 3. Gr´aficos de sectores: Gr´aficos . . . Sectores y seleccionaremos una o varias variables apareciendo un cuadro de di´alogo, cuyas opciones pasamos a comentar: (a) Res´ afico en el que cada sector correumenes para grupos de casos : Genera un gr´ sponde a un valor de la variable seleccionada. El tama˜ no del sector se determina por la opci´on Los sectores representan, esta opci´on aparece en el cuadro de di´alogo que surge despu´es de pulsar el bot´on Definir del cuadro anterior. Tambi´ en es posible que los sectores representen otra cosa, como la media de los valores de otra variable, el valor m´aximo, etc.; esto se consigue con la opci´on Otra funci´ on resumen. Se puede tambi´en editar el gr´afico haciendo doble clic sobre ´el, con posibilidad de cambiar colores, tramas, desgajar sectores, etc. (b) Res´ umenes para distintas variables . Permite que los sectores representen variables en lugar de grupos de casos. Cada sector representa una funci´on de una determinada variable (por ejemplo, la suma de los valores de sus casos). (c) Valores individuales de los casos . Se resume una ´unica variable, los casos ya son valores agrupados de la variable. Cada sector representa el valor de un caso individual. Con Gr´aficos . . . Interactivos . . . Sectores podemos obtener representaciones con efectos m´as llamativos. 4. Diagramas de barras: Gr´ aficos . . . Barras y Gr´aficos . . . Interactivos . . . Barras . 5. Histogramas: Gr´aficos . . . Histograma o Gr´aficos . . . Interactivos . . . Histograma. 6. Gr´ aficos de tallo y hojas: Analizar . . . Estad´ısticos descriptivos . . . Explorar . 7. Diagramas de caja: Gr´aficos . . . Diagrama de cajas . 8. Diagramas de dispersi´ aficos . . . dispersi´ on . . . simple o Gr´aficos . . . Interactivos on: Gr´ on, en donde aparece un cuadro de di´alogo en el que se puede . . . Diagrama de dispersi´ elegir qu´e variable ocupar´a el eje X y qu´e otra el eje Y .
B.3 Inferencia sobre una o m´as poblaciones
B.3
105
Inferencia sobre una o m´ as poblaciones
Primero abrir el archivo de datos. 1. An´ alisis de una muestra: Analizar . . . Comparar medias . . . Prueba T para una muestra. Aparece una pantalla en cuyo campo Contrastar Variables introducimos las varaibles que queremos contrastar. En esta ventana, seleccione Opciones , para introducir el grado de confianza deseado (por defecto es del 95%). Al final se pulsa Aceptar . 2. An´ alisis de dos muestras emparejadas o relacionadas (Prueba T para muestras relacionadas). Para efectuar la prueba T para muestras relacionadas se necesita una columna en los datos para cada una de las variables a comparar. Seleccionamos Analizar . . . Comparar medias . . . Prueba T para muestras relacionadas . Aparece la ventana en donde seleccionamos las variables en cuya comparaci´on estamos interesados. Al hacer la primera selecci´on en la columna de variables, esta aparece en el recuadro selecciones actuales como variable 1, y al realizar la segunda selecci´on aparecer´a como variable 2 . En ese momento, ya seleccionadas las dos, es cuando las podemos introducir en la columna variables relacionadas. Se pulsa Aceptar . 3. An´ alisis de dos muestras independientes (Prueba T para muestras independientes). El programa necesita una columna en el editor de datos que contenga los valores de la variable cuyas medias en las dos poblaciones se desea comparar, y otra que indica la poblaci´on o grupo a que pertenece cada individuo. A continuaci´on, seleccionamos Analizar . . . Comparar medias . . . Prueba T para muestras independientes . Aparece una ventana en donde, en primer lugar seleccionamos una variable num´erica y con el puntero la situamos en la ventana de Contrastar variables . A continuaci´ on, seleccionamos una ´unica variable de agrupaci´on y pulsamos Definir grupos . En esta ventana debemos especificar los dos grupos de la variable de contraste, eligiendo entre:
• Usar valores especificados . Escribimos un valor para el Grupo 1 y otro para el Grupo 2. Los casos con otros valores quedar´an excluidos.
• Punto de corte .
Escribimos un n´ umero que divida los valores de la variable de agrupaci´ on en dos conjuntos.
Si la variable de agrupaci´on es de cadena corta, por ejemplo, SI y NO , podemos escribir una cadena para el Grupo 1 y otra para el Grupo 2. Los casos con otras cadenas quedar´an excluidos del an´alisis. Una vez completada la ventana y tras pulsar Continuar , volvemos a la ventana de Prueba T para muestras independientes . Pulsando el bot´ on Opciones podemos introducir un valor entre 1 y 99 para el coeficiente de confianza de un intervalo, cuyo valor por defecto es del 95%. Tras pulsar el bot´on Aceptar . 4. Pruebas de normalidad. Analizar . . . Estad´ısticos descriptivos . . . Explorar . Aparece la ventana Explorar . En el caso de una muestra situamos la variable en la ventana Dependientes , y dejamos Factores en blanco. Para dos muestras independientes, situamos la variable a contrastar en la ventana Dependientes , y la variable que forma los grupos en la de Factores. Para dos muestras emparejadas situamos una variable con la diferencia de las dos originales en la ventana Dependientes , y dejamos Factores en blanco. A continuaci´on, debemos pulsar el bot´on Gr´aficos y en la nueva ventana escoger la opci´on de Histograma y activar la opci´on de Gr´aficos con pruebas de normalidad .
C Uso de la calculadora en la estad´ıstica
Las explicaciones las basaremos en la utilizaci´on de las calculadoras Casio fx-82MS, fx-83MS, fx-85MS, fx-270MS, fx-300MS y fx-350MS.
C´ alculos estad´ısticos Para realizar c´alculos estad´ısticos en la calculadora, tenga en cuenta los siguientes comentarios:
• Utilice mode 2 para ingresar el modo estad´ıstico SD . • Utilice shift clr 1 = para borrar la memoria. • Ingrese los datos usando la secuencia de tecla siguiente:
dt . • Tenga en cuenta la tabla siguiente para los c´alculos que se necesiten: Para llamar este tipo de valor:
2
x x n x σn σn−1
Ejemplo C.0.1 Calcule n , 55, 53, 53, 54 y 52. SOLUCION:
x,
Realice esta operaci´ on: shift
s-sum
1
shift
s-sum
2
shift
s-sum
3
shift
s-var
1
shift
s-var
2
shift
s-var
3
x2 , x, σ n y σn−1 para los datos siguientes: 55, 54, 51,
• Primero, ingresamos al modo SD con las teclas mode 2 . • Luego, borramos la memoria con la secuencia de teclas shift clr • Posteriormente, ingresamos los datos: 55 dt 54 dt 51 dt 55 dt 54 dt 52 dt
• Por u´ltimo, calculamos las medidas estad´ısticas pedidas:
1
=
.
53 dt 53 dt
107
Suma de los cuadrados de los valores x2 = 22.805 Suma de valores x = 427 N´umero de datos n = 8 Media aritm´etica x = 53, 375 Desviaci´ on est´ andar poblacional σn = 1, 316956719 Desviaci´ on est´ andar muestral σ n−1 = 1, 407885953
shift
s-sum
1
=
shift
s-sum
2
=
shift
s-sum
3
=
shift
s-var
1
=
shift
s-var
2
=
shift
s-var
3
= ◭
Precauciones con el ingreso de datos
• dt dt ingresa el mismo dato dos veces. • Tambi´en puede ingresar m´ultiples entradas del mismo dato usando
shift
; .
Por ejem-
plo, para ingresar el dato 110 diez veces presiones 110 shift ; 10 dt .
•
Mientras ingresa datos o despu´es de completar el ingreso de datos, puede usar las teclas es de los datos que ha ingresado. △ y ∇ para ir visualizando a trav´
• Si ingresa m´ultiples ingresos del mismo dato usando
para especificar la frecuencia de datos (n´umero de ´ıtemes de datos) como se describe anteriormente, pasando a trav´ es de los datos muetra el ´ıtem de dato y una pantalla separada para la frecuencia de datos (freq).
•
shift
;
Los datos visualizados pueden editarse, si as´ı lo desea. Ingrese el valor nuevo y presione la tecla = para reemplazar el valor antiguo por el valor nuevo. Esto tambi´ en significa que si desea realizar alguna otra operaci´on (c´alculo, llamada de resultados de c´alculos estad´ısticos, etc.), siempre deber´a presionar primero la tecla ac para salir de la presentaci´on de datos.
• Presionando la tecla
dt en
lugar de = despu´es de cambiar un valor sobre la presentaci´on, registra el valor que ha ingresado como un elemento de dato nuevo, y deja el valor antiguo tal como est´a.
• Puede borrar el valor del dato visualizado usando
△ y ∇ , y luego presionando shift
cl .
Borrando un valor de dato ocasiona que todos los valores siguientes se desplacen hacia arriba.
•
Despu´ es de ingresar los datos en el modo SD, no podr´a visualizar o editar m´ as los datos ´ıtemes de datos individuales, despu´es de cambiar a otro modo.
D Ap´ endice de tablas
D.1
La funci´ on de distribuci´ on binomial
La funci´on tabulada es la funci´on de distribuci´on acumulada
n
B(k ; n, p) =
k=0
n k p (1 − p)n−k k
para n = 5 , 10, 15, 20 y 25.
(a) Tabla binomial para n = 5 p k
0,05
0,10
0,20
0,25
0,30
0,40
0,50
0,60
0,70
0,75
0,80
0,90
0,95
0 1 2 3 4 5
0,774 0,977 0,999 1,000 1,000 1,000
0,590 0,919 0,991 1,000 1,000 1,000
0,328 0,737 0,942 0,993 0,999 1,000
0,237 0,633 0,896 0,984 0,999 1,000
0,168 0,528 0,837 0,969 0,998 1,000
0,078 0,337 0,683 0,913 0,990 1,000
0,031 0,188 0,500 0,812 0,969 1,000
0,010 0,087 0,317 0,663 0,922 1,000
0,002 0,031 0,163 0,472 0,832 1,000
0,001 0,016 0,104 0,367 0,763 1,000
0,000 0,007 0,058 0,263 0,672 1,000
0,000 0,000 0,009 0,081 0,410 1,000
0,000 0,000 0,001 0,023 0,226 1,000
(b) Probabilidades binomiales acumuladas para n = 10 p k 0 1 2 3 4
0,05 0,599 0,914 0,988 0,999 1,000
0,10 0,349 0,736 0,930 0,987 0,998
0,20 0,107 0,376 0,678 0,879 0,967
0,25 0,056 0,244 0,526 0,776 0,922
0,30 0,028 0,149 0,383 0,650 0,850
0,40 0,006 0,046 0,167 0,382 0,633
0,50 0,001 0,011 0,055 0,172 0,377
0,60 0,000 0,002 0,012 0,055 0,166
0,70 0,000 0,000 0,002 0,011 0,047
0,75 0,000 0,000 0,000 0,004 0,020
0,80 0,000 0,000 0,000 0,001 0,006
0,90 0,000 0,000 0,000 0,000 0,000
0,95 0,000 0,000 0,000 0,000 0,000
5 6 7 8 9
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,994 0,999 1,000 1,000 1,000
0,980 0,996 1,000 1,000 1,000
0,953 0,989 0,998 1,000 1,000
0,834 0,945 0,988 0,998 1,000
0,623 0,828 0,945 0,989 0,999
0,367 0,618 0,833 0,954 0,994
0,150 0,350 0,617 0,851 0,972
0,078 0,224 0,474 0,756 0,944
0,033 0,121 0,322 0,624 0,893
0,002 0,013 0,070 0,264 0,651
0,000 0,001 0,012 0,086 0,401
D.1 La funci´on de distribuci´on binomial
109
(c) Probabilidades binomiales acumuladas para n = 15 p k 0 1 2 3 4
0,05 0,463 0,829 0,964 0,995 0,999
0,10 0,206 0,549 0,816 0,944 0,987
0,20 0,305 0,167 0,398 0,648 0,836
0,25 0,013 0,080 0,236 0,461 0,686
0,30 0,005 0,035 0,127 0,297 0,515
0,40 0,000 0,005 0,027 0,091 0,217
0,50 0,000 0,000 0,004 0,018 0,059
0,60 0,000 0,000 0,000 0,002 0,009
0,70 0,000 0,000 0,000 0,000 0,001
0,75 0,000 0,000 0,000 0,000 0,000
0,80 0,000 0,000 0,000 0,000 0,000
0,90 0,000 0,000 0,000 0,000 0,000
0,95 0,000 0,000 0,000 0,000 0,000
5 6 7 8 9
1,000 1,000 1,000 1,000 1,000
0,998 1,000 1,000 1,000 1,000
0,939 0,982 0,996 0,999 1,000
0,852 0,943 0,983 0,996 0,999
0,722 0,869 0,950 0,985 0,996
0,403 0,610 0,787 0,905 0,966
0,151 0,304 0,500 0,696 0,849
0,034 0,095 0,213 0,390 0,597
0,004 0,015 0,050 0,131 0,278
0,001 0,004 0,017 0,057 0,148
0,000 0,001 0,004 0,018 0,061
0,000 0,000 0,000 0,000 0,002
0,000 0,000 0,000 0,000 0,000
10 11 12 13 14
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,999 1,000 1,000 1,000 1,000
0,991 0,998 1,000 1,000 1,000
0,941 0,982 0,996 1,000 1,000
0,783 0,909 0,973 0,995 1,000
0,485 0,703 0,873 0,965 0,995
0,314 0,539 0,764 0,920 0,987
0,164 0,352 0,602 0,833 0,965
0,013 0,056 0,184 0,451 0,794
0,000 0,005 0,036 0,171 0,537
(d) Probabilidades binomiales acumuladas para n = 20 p k 0 1 2 3 4
0,05 0,358 0,736 0,925 0,984 0,997
0,10 0,122 0,392 0,677 0,867 0,957
0,20 0,012 0,069 0,206 0,411 0,630
0,25 0,003 0,024 0,091 0,225 0,415
0,30 0,001 0,008 0,035 0,107 0,238
0,40 0,000 0,001 0,004 0,016 0,051
0,50 0,000 0,000 0,000 0,001 0,006
0,60 0,000 0,000 0,000 0,000 0,000
0,70 0,000 0,000 0,000 0,000 0,000
0,75 0,000 0,000 0,000 0,000 0,000
0,80 0,000 0,000 0,000 0,000 0,000
0,90 0,000 0,000 0,000 0,000 0,000
0,95 0,000 0,000 0,000 0,000 0,000
5 6 7 8 9
1,000 1,000 1,000 1,000 1,000
0,989 0,998 1,000 1,000 1,000
0,804 0,913 0,968 0,990 0,997
0,617 0,786 0,898 0,959 0,986
0,416 0,608 0,772 0,887 0,952
0,126 0,250 0,416 0,596 0,755
0,021 0,058 0,132 0,252 0,412
0,002 0,006 0,021 0,057 0,128
0,000 0,000 0,001 0,005 0,017
0,000 0,000 0,000 0,001 0,004
0,000 0,000 0,000 0,000 0,001
0,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
10 11 12 13 14
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,999 1,000 1,000 1,000 1,000
0,996 0,999 1,000 1,000 1,000
0,983 0,995 0,999 1,000 1,000
0,872 0,943 0,979 0,994 0,998
0,588 0,748 0,868 0,942 0,979
0,245 0,404 0,584 0,750 0,874
0,048 0,113 0,228 0,392 0,584
0,014 0,041 0,102 0,214 0,383
0,003 0,010 0,032 0,087 0,196
0,000 0,000 0,000 0,002 0,011
0,000 0,000 0,000 0,000 0,000
15 16 17 18 19
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,994 0,999 1,000 1,000 1,000
0,949 0,984 0,996 0,999 1,000
0,762 0,893 0,965 0,992 0,999
0,585 0,775 0,909 0,976 0,997
0,370 0,589 0,794 0,931 0,988
0,043 0,133 0,323 0,608 0,878
0,003 0,016 0,075 0,264 0,642
D.2 La funci´on de distribuci´on de Poisson
110
(e) Probabilidades binomiales acumuladas para n = 25 p k 0 1 2 3 4
0,05 0,277 0,642 0,873 0,966 0,993
0,10 0,072 0,271 0,537 0,764 0,902
0,20 0,004 0,027 0,098 0,234 0,421
0,25 0,001 0,007 0,032 0,096 0,214
0,30 0,000 0,002 0,009 0,033 0,090
0,40 0,000 0,000 0,000 0,002 0,009
0,50 0,000 0,000 0,000 0,000 0,000
0,60 0,000 0,000 0,000 0,000 0,000
0,70 0,000 0,000 0,000 0,000 0,000
0,75 0,000 0,000 0,000 0,000 0,000
0,80 0,000 0,000 0,000 0,000 0,000
0,90 0,000 0,000 0,000 0,000 0,000
0,95 0,000 0,000 0,000 0,000 0,000
5 6 7 8 9
0,999 1,000 1,000 1,000 1,000
0,967 0,991 0,998 1,000 1,000
0,617 0,780 0,891 0,953 0,983
0,378 0,561 0,727 0,851 0,929
0,193 0,341 0,512 0,677 0,811
0,029 0,074 0,154 0,274 0,425
0,002 0,007 0,022 0,054 0,115
0,000 0,000 0,001 0,004 0,013
0,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
10 11 12 13 14
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,994 0,998 1,000 1,000 1,000
0,970 0,980 0,997 0,999 1,000
0,902 0,956 0,983 0,994 0,998
0,586 0,732 0,846 0,922 0,966
0,212 0,345 0,500 0,655 0,788
0,034 0,078 0,154 0,268 0,414
0,002 0,006 0,017 0,044 0,098
0,000 0,001 0,003 0,020 0,030
0,000 0,000 0,000 0,002 0,006
0,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
15 16 17 18 19
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,987 0,996 0,999 1,000 1,000
0,885 0,946 0,978 0,993 0,998
0,575 0,726 0,846 0,926 0,971
0,189 0,323 0,488 0,659 0,807
0,071 0,149 0,273 0,439 0,622
0,017 0,047 0,109 0,220 0,383
0,000 0,000 0,002 0,009 0,033
0,000 0,000 0,000 0,000 0,001
20 21 22 23 24
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,991 0,998 1,000 1,000 1,000
0,910 0,967 0,991 0,998 1,000
0,786 0,904 0,968 0,993 0,999
0,579 0,766 0,902 0,973 0,996
0,098 0,236 0,463 0,729 0,928
0,007 0,034 0,127 0,358 0,723
D.2
La funci´ on de distribuci´ on de Poisson
La funci´on tabulada es la funci´on de distribuci´on acumulada
n
P (k ; λ) =
k=0
n λk −λ e k k !
para algunos valores de λ .
(a) Tabla de Poisson para λ
≤ 1
λ k 0 1 2 3
0,1 0,905 0,995 1,000 1,000
0,2 0,819 0,982 0,999 1,000
0,3 0,741 0,963 0,996 1,000
0,4 0,670 0,938 0,992 0,999
0,5 0,607 0,910 0,986 0,998
0,6 0,549 0,878 0,977 0,997
0,7 0,497 0,844 0,966 0,994
0,8 0,449 0,809 0,953 0,991
0,9 0,407 0,772 0,937 0,987
1 0,368 0,736 0,920 0,981
4 5 6
1,000 1,000 1,000
1,000 1,000 1,000
1,000 1,000 1,000
1,000 1,000 1,000
1,000 1,000 1,000
1,000 1,000 1,000
0,999 1,000 1,000
0,999 1,000 1,000
0,998 1,000 1,000
0,996 0,999 1,000
D.2 La funci´on de distribuci´on de Poisson
(b) Tabla de Poisson para 2
111
≤ λ ≤ 20 λ
k 0 1 2 3 4
2 0,135 0,406 0,677 0,857 0,947
3 0,050 0,199 0,423 0,647 0,815
4 0,018 0,092 0,238 0,433 0,629
5 0,007 0,040 0,125 0,265 0,440
6 0,002 0,017 0,062 0,151 0,285
7 0,001 0,007 0,030 0,082 0,173
8 0,000 0,003 0,014 0,042 0,100
9 0,000 0,001 0,006 0,021 0,055
10 0,000 0,000 0,003 0,010 0,029
15 0,000 0,000 0,000 0,000 0,001
20 0,000 0,000 0,000 0,000 0,000
5 6 7 8 9
0,983 0,995 0,999 1,000 1,000
0,916 0,966 0,988 0,996 0,999
0,785 0,889 0,949 0,979 0,992
0,616 0,762 0,867 0,932 0,968
0,446 0,606 0,744 0,847 0,916
0,301 0,450 0,599 0,729 0,830
0,191 0,313 0,453 0,593 0,717
0,116 0,207 0,324 0,456 0,587
0,067 0,130 0,220 0,333 0,458
0,003 0,008 0,018 0,037 0,070
0,000 0,000 0,001 0,002 0,005
10 11 12 13 14
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,997 0,999 1,000 1,000 1,000
0,986 0,995 0,998 0,999 1,000
0,957 0,980 0,991 0,996 0,999
0,901 0,947 0,973 0,987 0,994
0,816 0,888 0,936 0,966 0,983
0,706 0,803 0,876 0,926 0,959
0,583 0,697 0,792 0,864 0,917
0,118 0,185 0,268 0,363 0,466
0,011 0,021 0,039 0,066 0,105
15 16 17 18 19
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,999 1,000 1,000 1,000 1,000
0,998 0,999 1,000 1,000 1,000
0,992 0,996 0,998 0,999 1,000
0,978 0,989 0,995 0,998 0,999
0,951 0,973 0,986 0,993 0,997
0,568 0,664 0,749 0,819 0,875
0,157 0,221 0,297 0,381 0,470
20 21 22 23 24
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000 1,000
0,998 0,999 1,000 1,000 1,000
0,917 0,947 0,967 0,981 0,989
0,559 0,644 0,721 0,787 0,843
25 26 27 28
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
0,994 0,998 1,000 1,000
0,970 0,980 0,997 0,999
0,902 0,956 0,983 0,994
0,586 0,732 0,846 0,922
0,212 0,345 0,500 0,655
0,034 0,078 0,154 0,268
0,994 0,997 0,998 0,999
0,888 0,922 0,948 0,966
29 30 31 32
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
0,998 1,000 1,000 1,000
0,966 0,987 0,996 0,999
0,788 0,885 0,946 0,978
0,414 0,575 0,726 0,846
1,000 1,000 1,000 1,000
0,978 0,987 0,992 0,995
33 34 35 36
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
1,000 1,000 1,000 1,000
0,993 0,998 1,000 1,000
0,926 0,971 0,991 0,998
1,000 1,000 1,000 1,000
0,997 0,999 0,999 1,000
D.3 La funci´on de distribuci´on normal
D.3
112
La funci´ on de distribuci´ on normal z
La funci´on tabulada es la funci´on Φ(z ) =
∞
2
e−t
/2
dt. Observe que Φ(z ) es la probabilidad
−
de que una variable aleatoria Z , distribuida normalmente con media 0 y varianza 1, sea menor o igual a z . Es decir, Φ (z ) = P (Z z ).
≤
(a) Areas de curva normal est´ andar para valores negativos de Z z - 3,4 - 3,3 - 3,2 - 3.1 - 3,0
0,00 0,0003 0,0005 0,0007 0,0010 0,0013
0,01 0,0003 0,0005 0,0007 0,0009 0,0013
0,02 0,0003 0,0005 0,0006 0,0009 0,0013
0,03 0,0003 0,0004 0,0006 0,0009 0,0012
0,04 0,0003 0,0004 0,0006 0,0008 0,0012
0,05 0,000 3 0,000 4 0,000 6 0,000 8 0,001 1
0,06 0,0003 0,0004 0,0006 0,0008 0,0011
0,07 0,0003 0,0004 0,0005 0,0008 0,0011
0,08 0,0 003 0,0 004 0,0 005 0,0 007 0,0 010
0,09 0,00 03 0,00 04 0,00 05 0,00 07 0,00 10
- 2,9 - 2,8 - 2,7 - 2,6 - 2,5
0,0019 0,0026 0,0035 0,0047 0,0062
0,0018 0,0025 0,0034 0,0045 0,0060
0,0017 0,0024 0,0033 0,0044 0,0059
0,0017 0,0023 0,0032 0,0043 0,0057
0,0016 0,0023 0,0031 0,0041 0,0055
0,001 6 0,002 2 0,003 0 0,004 0 0,005 4
0,0015 0,0021 0,0029 0,0039 0,0052
0,0015 0,0021 0,0028 0,0038 0,0051
0,0 014 0,0 020 0,0 027 0,0 037 0,0 049
0,00 14 0,00 19 0,00 26 0,00 36 0,00 48
- 2,4 - 2,3 - 2,2 - 2,1 - 2,0
0,0082 0,0107 0,0139 0,0179 0,0228
0,0080 0,0104 0,0136 0,0174 0,0222
0,0078 0,0102 0,0132 0,0170 0,0217
0,0075 0,0099 0,0129 0,0166 0,0212
0,0073 0,0096 0,0125 0,0162 0,0207
0,007 1 0,009 4 0,012 2 0,015 8 0,020 2
0,0069 0,0091 0,0119 0,0154 0,0197
0,0068 0,0089 0,0116 0,0150 0,0192
0,0 066 0,0 087 0,0 113 0,0 146 0,0 188
0,00 64 0,00 84 0,01 10 0,01 43 0,01 83
- 1,9 - 1,8 - 1,7 - 1,6 - 1,5
0,0287 0,0359 0,0446 0,0548 0,0668
0,0281 0,0352 0,0436 0,0537 0,0655
0,0274 0,0344 0,0427 0,0526 0,0643
0,0268 0,0336 0,0418 0,0516 0,0630
0,0262 0,0329 0,0409 0,0505 0,0618
0,025 6 0,032 2 0,040 1 0,049 5 0,060 6
0,0250 0,0314 0,0392 0,0485 0,0594
0,0244 0,0307 0,0384 0,0475 0,0582
0,0 239 0,0 301 0,0 375 0,0 465 0,0 571
0,02 33 0,02 94 0,03 67 0,04 55 0,05 59
- 1,4 - 1,3 - 1,2 - 1,1 - 1,0
0,0808 0,0968 0,1151 0,1357 0,1587
0,0793 0,0951 0,1131 0,1335 0,1562
0,0778 0,0934 0,1112 0,1314 0,1539
0,0764 0,0918 0,1093 0,1292 0,1515
0,0749 0,0901 0,1075 0,1271 0,1492
0,073 5 0,088 5 0,105 6 0,125 1 0,146 9
0,0722 0,0869 0,1038 0,1230 0,1446
0,0708 0,0853 0,1020 0,1210 0,1423
0,0 694 0,0 838 0,1 003 0,1 190 0,1 401
0,06 81 0,08 23 0,09 85 0,11 70 0,13 79
- 0,9 - 0,8 - 0,7 - 0,6 - 0,5
0,1841 0,2119 0,2420 0,2743 0,3085
0,1814 0,2090 0,2389 0,2709 0,3050
0,1788 0,2061 0,2358 0,2676 0,3015
0,1762 0,2033 0,2327 0,2643 0,2981
0,1736 0,2005 0,2296 0,2611 0,2946
0,171 1 0,197 7 0,226 6 0,257 8 0,291 2
0,1685 0,1949 0,2236 0,2546 0,2877
0,1660 0,1922 0,2206 0,2514 0,2843
0,1 635 0,1 894 0,2 177 0,2 483 0,2 810
0,16 11 0,18 67 0,21 48 0,24 51 0,27 76
- 0,4 - 0,3 - 0,2 - 0,1 - 0,0
0,3446 0,3821 0,4207 0,4602 0,5000
0,3409 0,3783 0,4168 0,4562 0,4960
0,3372 0,3745 0,4129 0,4522 0,4920
0,3336 0,3707 0,4009 0,4483 0,4880
0,3300 0,3669 0,4052 0,4443 0,4840
0,326 4 0,363 2 0,401 3 0,440 4 0,480 1
0,3228 0,3594 0,3974 0,4364 0,4761
0,3192 0,3557 0,3936 0,4325 0,4721
0,3 156 0,3 520 0,3 897 0,4 286 0,4 681
0,31 21 0,34 83 0,38 59 0,42 47 0,46 41
D.3 La funci´on de distribuci´on normal
113
(b) Areas de curva normal est´ andar para valores positivos de Z z
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0 0,1 0,2 0,3 0,4
0,5000 0,5398 0,5793 0,6179 0,6554
0,5040 0,5438 0,5832 0,6217 0,6591
0,5080 0,5478 0,5871 0,6255 0,6628
0,5120 0,5517 0,5910 0,6293 0,6664
0,5160 0,5557 0,5948 0,6331 0,6700
0,5199 0,5596 0,5987 0,6368 0,6736
0,5239 0,5636 0,6026 0,6406 0,6772
0,5279 0,5675 0,6064 0,6443 0,6808
0,5319 0,5714 0,6103 0,6480 0,6844
0,5359 0,5753 0,6141 0,6517 0,6879
0,5 0,6 0,7 0,8 0,9
0,6915 0,7257 0,7580 0,7881 0,8159
0,6950 0,7291 0,7611 0,7910 0,8186
0,6985 0,7324 0,7642 0,7939 0,8212
0,7019 0,7357 0,7673 0,7967 0,8238
0,7054 0,7389 0,7704 0,7995 0,8264
0,7088 0,7422 0,7734 0,8023 0,8289
0,7123 0,7454 0,7764 0,8051 0,8315
0,7157 0,7486 0,7794 0,8078 0,8340
0,7190 0,7517 0,7823 0,8106 0,8365
0,7224 0,7549 0,7852 0,8133 0,8389
1,0 1,1 1,2 1,3 1,4
0,8413 0,8643 0,8849 0,9032 0,9192
0,8438 0,8665 0,8869 0,9049 0,9207
0,8461 0,8686 0,8888 0,9066 0,9222
0,8485 0,8708 0,8907 0,9082 0,9236
0,8508 0,8729 0,8925 0,9099 0,9251
0,8531 0,8749 0,8944 0,9115 0,9265
0,8554 0,8770 0,8962 0,9131 0,9278
0,8577 0,8790 0,8980 0,9147 0,9292
0,8599 0,8810 0,8997 0,9162 0,9306
0,8621 0,8830 0,9015 0,9177 0,9319
1,5 1,6 1,7 1,8 1,9
0,9332 0,9452 0,9554 0,9641 0,9713
0,9345 0,9463 0,9564 0,9649 0,9719
0,9357 0,9474 0,9573 0,9656 0,9726
0,9370 0,9484 0,9582 0,9664 0,9732
0,9382 0,9495 0,9591 0,9671 0,9738
0,9394 0,9505 0,9599 0,9678 0,9744
0,9406 0,9515 0,9608 0,9686 0,9750
0,9418 0,9525 0,9616 0,9693 0,9756
0,9429 0,9535 0,9625 0,9699 0,9761
0,9441 0,9545 0,9633 0,9706 0,9767
2,0 2,1 2,2 2,3 2,4
0,9772 0,9821 0,9861 0,9893 0,9918
0,9778 0,9826 0,9864 0,9896 0,9920
0,9783 0,9830 0,9868 0,9898 0,9922
0,9788 0,9834 0,9871 0,9901 0,9925
0,9793 0,9838 0,9875 0,9904 0,9927
0,9798 0,9842 0,9878 0,9906 0,9929
0,9803 0,9846 0,9881 0,9909 0,9931
0,9808 0,9850 0,9884 0,9911 0,9932
0,9812 0,9854 0,9887 0,9913 0,9934
0,9817 0,9857 0,9890 0,9916 0,9936
2,5 2,6 2,7 2,8 2,9
0,9938 0,9953 0,9965 0,9974 0,9981
0,9940 0,9955 0,9966 0,9975 0,9982
0,9941 0,9956 0,9967 0,9976 0,9982
0,9943 0,9957 0,9968 0,9977 0,9983
0,9945 0,9959 0,9969 0,9977 0,9984
0,9946 0,9960 0,9970 0,9978 0,9984
0,9948 0,9961 0,9971 0,9979 0,9985
0,9948 0,9961 0,9971 0,9979 0,9985
0,9951 0,9963 0,9973 0,9980 0,9986
0,9952 0,9964 0,9974 0,9981 0,9986
3,0 3,1 3,2 3,3 3,4
0,9987 0,9990 0,9993 0,9995 0,9997
0,9987 0,9991 0,9993 0,9995 0,9997
0,9987 0,9991 0,9994 0,9995 0,9997
0,9988 0,9991 0,9994 0,9996 0,9997
0,9988 0,9992 0,9994 0,9996 0,9997
0,9989 0,9992 0,9994 0,9996 0,9997
0,9989 0,9992 0,9994 0,9996 0,9997
0,9989 0,9992 0,9994 0,9996 0,9997
0,9990 0,9993 0,9995 0,9996 0,9997
0,9990 0,9993 0,9995 0,9997 0,9998
D.4 La funci´on gamma incompleta
D.4
114
La funci´ on gamma incompleta
La funci´on tabulada es t
F(t; α ) =
1 e −x xα−1 dx, Γ (α )
x > 0,
0
α t 1 2 3
1 0,632 0,865 0,950
2 0,264 0,594 0,801
3 0,080 0,323 0,577
4 0,019 0,143 0,353
5 0,004 0,053 0,185
6 0,001 0,017 0,084
7 0,000 0,005 0,034
8 0,000 0,001 0,012
9 0,000 0,003 0,004
10 0,000 0,000 0,001
4 5 6
0,982 0,993 0,998
0,908 0,960 0,983
0,762 0,875 0,938
0,567 0,735 0,849
0,371 0,560 0,715
0,215 0,384 0,554
0,111 0,238 0,394
0,051 0,133 0,256
0,021 0,068 0,153
0,008 0,032 0,084
7 8 9
0,999 1,000 1,000
0,993 0,997 0,999
0,970 0,986 0,994
0,918 0,958 0,979
0,827 0,900 0,945
0,699 0,809 0,884
0,550 0,687 0,793
0,401 0,547 0,676
0,271 0,407 0,544
0,170 0,283 0,413
10 11 12
1,000 1,000 1,000
1,000 1,000 1,000
0,997 0,999 1,000
0,990 0,995 0,998
0,971 0,985 0,992
0,993 0,962 0,980
0,870 0,921 0,954
0,780 0,857 0,911
0,667 0,768 0,845
0,542 0,659 0,758
13 14 15
1,000 1,000 1,000
1,000 1,000 1,000
1,000 1,000 1,000
0,999 1,000 1,000
0,996 0,998 0,999
0,989 0,994 0,997
0,974 0,986 0,992
0,946 0,968 0,982
0,900 0,938 0,963
0,834 0,891 0,930
D.5 Valores cr´ıticos para la distribuci´on t de Student
D.5
115
Valores cr´ıticos para la distribuci´ on t de Student
Para ν > 120, tenemos que t α ( ν)
≈ z . α
0,4 0,3 0,2 0,1 α
0 -5
-3
-1
t
1
3
5
α
α ν
0,10
0,05
0,025
0,01
0,005
0,001
0,0005
1 2 3 4 5
3,078 1,886 1,638 1,533 1,476
6,314 2,920 2,353 2,132 2,015
12,706 4,303 3,182 2,776 2,571
31,821 6,965 4,541 3,747 3,365
63,657 9,925 5,841 4,604 4,032
318,31 22,326 10,213 7,173 5,893
636,620 31,598 12,924 8,610 6,869
6 7 8 9 10
1,440 1,415 1,397 1,383 1,372
1,943 1,895 1,860 1.833 1,812
2,447 2,365 2,306 2,262 2,228
3,143 2,998 2,896 2,821 2,764
3,707 3,499 3,355 3,250 3,169
5,208 4,785 4,501 4,297 4,144
5,959 5,408 5,041 4,781 4,587
11 12 13 14 15
1,363 1,356 1,350 1,345 1,341
1,796 1,782 1,771 1,761 1,753
2,201 2,179 2,160 2,145 2,131
2,718 2,681 2,650 2,624 2,602
3,106 3,055 3,012 2,977 2,947
4,025 3,930 3,852 3,787 3,733
4,437 4,318 4,221 4,140 4,073
16 17 18 19 20
1,337 1,333 1,330 1,328 1,325
1,746 1,740 1,734 1,729 1,725
2,120 2,110 2,101 2,093 2,086
2,583 2,567 2,552 2,539 2,528
2,921 2,898 2,878 2,861 2,845
3,686 3,646 3,610 3,579 3,552
4,015 3,965 3,922 3,883 3,850
21 22 23 24 25
1,323 1,321 1,319 1,318 1,316
1,721 1,717 1,714 1,711 1,708
2,080 2,074 2,069 2,064 2,060
2,518 2,508 2,500 2,492 2,485
2,831 2,819 2,807 2,797 2,787
3,527 3,505 3,485 3,467 3,450
3,819 3,795 3,767 3,745 3,725
26 27 28 29 30
1,315 1,314 1,313 1,311 1,310
1,706 1,703 1,701 1,699 1,697
2,056 2,052 2,048 2,045 2,042
2,479 2,473 2,467 2,462 2,457
2,779 2,771 2,763 2,756 2,750
3,435 3,421 3,408 3,396 3,385
3,707 3,690 3,674 3,659 3,646
32 34 36 38 40
1,309 1,307 1,306 1,304 1,303
1,694 1,691 1,688 1,686 1,684
2,037 2,032 2,028 2,024 2,021
2,449 2,441 2,434 2,429 2,423
2,738 2,728 2,719 2,712 2,704
3,365 3,348 3,333 3,319 3,307
3,622 3,601 3,582 3,566 3,551
50 60 120
1,299 1,296 1,282 1,282
1,676 1.671 1,658 1,645
2,009 2,000 1,980 1,960
2,403 2,390 2,358 2,326
2,678 2,660 2,617 2,576
3,262 3,232 3,160 3,090
3,496 3,460 3,373 3,291
∞
(= z)
D.6 Valores cr´ıticos para la distribuci´on chi-cuadrada
D.6
116
Valores cr´ıticos para la distribuci´ on chi-cuadrada 0,4 0,3 0,2 0,1 α
0 -5
-3
-1
12
X
3
5
α
(a) Valores cr´ıticos χ2α( ν) α ν
0,995
0,99
0,98
0,975
0,95
0,90
0,80
0,75
0,70
0,50
1 2 3 4 5
0,000 0,010 0,0717 0,207 0,412
0,000 0,0201 0,115 0,297 0,554
0,000 0,0404 0,185 0,429 0,752
0,001 0,0506 0,216 0,484 0,831
0,00393 0,103 0,352 0,711 1,145
0,0158 0,211 0,584 1,064 1,610
0,0642 0,446 1,005 1,649 2,343
0,102 0,575 1,213 1,923 2,675
0,148 0,713 1,424 2,195 3,000
0,4550 1,386 2,366 3,357 4,351
6 7 8 9 10
0,676 0,989 1,344 1,735 2,156
0,872 1,239 1,646 2,088 2,558
1,134 1,564 2,032 2,532 3,059
1,237 1,690 2,180 2,700 3,247
1,635 2,167 2,733 3,325 3,940
2,204 2,833 3,490 4,168 4,865
3,070 3,822 4,594 5,380 6,179
3,455 4,255 5,071 5,899 6,737
3,828 4,671 5,527 6,393 7,267
5,348 6,346 7,344 8,343 9,342
11 12 13 14 15
2,603 3,074 3,565 4,075 4,601
3,053 3,571 4,107 4,660 5,229
3,609 4,178 4,765 5,368 5,985
3,816 4,404 5,009 5,629 6,262
4,575 5,226 5,892 6,571 7,261
5,578 6,304 7,042 7,790 8,547
6,989 7,807 8,634 9,467 10,307
7,584 8,438 9,299 10,165 11,036
8,148 9,034 9,926 10,821 11,721
10,341 11,340 12,340 13,339 14,339
16 17 18 19 20
5,142 5,697 6,844 6,844 7,434
5,812 6,408 7,633 7,633 8,260
6,614 7,255 8,567 8,567 9,237
6,908 7,564 8,907 8,907 9,591
7,962 8,672 10,117 10,117 10,851
9,312 10,085 11,651 11,651 12,443
11,152 12,002 13,716 13,716 14,578
11,912 12,792 14,562 14,562 15,452
12,624 13,531 15,352 15,352 16,266
15,338 16,338 18,338 18,338 19,337
21 22 23 24 25
8,034 8,643 9,260 9,886 10,520
8,897 9,542 10,196 10,856 11,524
9,915 10,600 11,293 11,992 12,692
10,283 10,982 11,688 12,401 13,120
11,591 12,338 13,091 13,848 14,611
13,240 14,041 14,848 15,659 16,473
15,445 16,314 17,187 18,062 18,940
16,344 17,240 18,137 19,037 19,939
17,182 18,101 19,021 19,943 20,867
20,337 21,337 22,337 23,337 24,337
26 27 28 29 30
11,160 11,808 12,461 13,121 13,787
12,198 12,879 13,565 14,256 14,953
13,409 14,125 14,847 15,574 16,306
13,844 14,573 15,308 16,047 16,791
15,379 16,151 16,928 17,708 18,493
17,292 18,114 18,939 19,768 20,599
19,820 20,703 21,588 22,475 23,364
20,843 21,749 22,657 23,567 24,478
21,792 22,719 23,647 24,577 25,508
25,336 26,336 27,336 28,336 29,336
31 32 33 34 35
14,457 15,134 15,815 16,501 17,191
15,655 16,362 17,073 17,789 18,508
17,538 18,291 19,046 19,806 20,569
19,280 20,072 20,866 21,664 22,465
21,433 22,271 23,110 23,952 24,796
36 37 38 39 40
17,887 18,584 19,289 19,994 20,706
19,233 19,960 20,691 21,425 22,164
21,336 22,105 22,878 23,654 24,433
23,269 24,075 24,884 25695 26,509
25,643 26,492 27,343 28,196 29,050
D.6 Valores cr´ıticos para la distribuci´on chi-cuadrada
117
(b) Valores cr´ıticos χ2α( ν) (continuaci´ on) α ν
0,30
0,25
0,20
0,10
0,05
0,025
0,02
0,01
0,005
0,001
1 2 3 4 5
1,074 2,408 3,665 4,878 6,064
1,323 2,773 4,108 5,385 6,626
1,642 3,219 4,642 5,989 7,289
2,706 4,605 6,251 5,779 9,236
3,841 5,991 7,815 9,488 11,070
5,024 7,378 9,348 11,143 12,832
5,412 7,824 9,837 11,668 13,388
6,635 9,210 11,345 13,277 15,086
7,879 10,597 12,838 14,860 16,750
10,827 13,815 16,268 18,465 20,517
6 7 8 9 10
7,231 8,383 9,524 10,656 11,781
7,841 9,037 10,219 11,389 12,549
8,558 9,803 11,030 12,242 13,442
10,645 12,017 13,362 14,684 15,987
12,592 14,067 15,507 16,919 18,307
14,449 16,013 17,535 19,023 20,483
15,033 16,622 18,168 19,679 21,161
16,812 18,475 20,090 21,666 23,209
18,548 20,278 21,955 23,589 25,188
22,457 24,322 26,125 27,877 29,588
11 12 13 14 15
12,899 14,011 15,119 16,222 17,322
13,701 14,845 15,984 17,117 18,245
14,631 15,812 16,985 18,151 19,311
17,275 18,549 19,812 21,064 22,307
19,675 21,026 22,362 23,685 24,996
21,920 23,337 24,736 26,119 27,488
22,618 24,054 25,472 26,873 28,259
24,725 26,217 27,688 29,141 30,578
26,757 28,300 29,819 31,319 32,801
31,264 32,909 34,528 36,123 37,697
16 17 18 19 20
18,418 19,511 20,601 21,689 22,775
19,369 20,489 21,605 22,718 23,828
20,465 21,615 22,760 23,900 25,038
23,542 24,769 25,989 27,204 28,412
26,296 27,587 28,869 30,144 31,410
28,845 30,191 31,526 32,852 34,170
29,633 30,995 32,346 33,687 35,020
32,000 33,409 34,805 36,191 37,566
34,267 35,718 37,156 38,582 39,997
39,252 40,790 42,312 43,820 45,315
21 22 23 24 25
23,858 24,939 26,018 27,096 28,172
24,935 26,039 27,141 28,241 29,339
26,171 27,301 28,429 29,553 30,675
29,615 30,813 32,007 33,196 34,382
32,671 33,924 35,172 36,415 37,652
35,479 36,781 38,076 39,364 40,646
36343 37,659 38,968 40,270 41,566
38,932 40,289 41,638 42,980 44,314
41,401 42,796 44,181 45,558 46,928
46,797 48,268 49,728 51,179 52,620
26 27 28 29 30
29,246 30,319 31,391 32,461 33,530
30,434 31,528 32,620 33,711 34,800
31,795 32,912 34,027 35,139 36,250
35,563 36,741 37,916 39,087 40,256
38,885 40,113 41,337 42,557 43,773
41,923 43,194 44,461 45,722 46,979
42,856 44,140 45,419 46,693 47,962
45,642 46,963 48,278 49,588 50,892
48,290 49,645 50,993 52,336 53,672
54,052 55,476 56,893 58,302 59,703
31 32 33 34 35
41,422 42,585 43,745 44,903 46,059
44,985 46,194 47,400 48,602 49,802
48,231 49,480 50,724 51,966 53,203
52,190 53,486 54,774 56,061 57,340
55,000 56,328 57,646 58,964 60,272
36 37 38 39 40
47,212 48,363 49,513 50,660 51,805
50,998 52,192 53,384 54,572 55,758
54,437 55,667 56,896 58,119 59,342
58,619 59,891 61,162 62,426 63,691
61,581 62,880 64,181 65,473 66,766
D.7 Valores cr´ıticos para la distribuci´on F
D.7
118
Valores cr´ıticos para la distribuci´ on F
Siempre se cumple que Fα (a, b) =
1 . F1−α (b,a)
0,4 0,3 0,2 0,1 α
0 -5
-3
-1
1
f
3
5
α
(a) Valores cr´ıticos Fα( ν1, ν2) para α = 0,05 ν1 ν2
1
2
3
4
5
6
7
8
9
1 2 3
161,4 18,51 10,13
199,5 19,00 9,55
215,7 19,16 9,28
224,6 19,25 9,12
230,2 19,30 9,01
234,0 19,33 8,94
236,8 19,35 8,89
238,9 19,37 8,85
240,5 19,38 8,81
4 5 6
7,71 6,61 5,99
6,94 5,79 5,14
6,59 5,41 4,76
6,39 5,19 4,53
6,26 5,05 4,39
6,16 4,95 4,28
6,09 4,88 4,21
6,04 4,82 4,15
6,00 4,77 4,10
7 8 9
5,59 5,32 5,12
4,74 4,46 4,26
4,35 4,07 3,86
4,12 3,84 3,63
3,97 3,69 3,48
3,87 3,58 3,37
3,79 3,50 3,29
3,73 3,44 3,23
3,68 3,39 3,18
10 11 12
4,96 4,84 4,75
4,10 3,98 3,89
3,71 3,59 3,49
3,48 3,36 3,26
3,33 3,20 3,11
3,22 3,09 3,00
3,14 3,01 2,91
3,07 2,95 2,85
3,02 2,90 2,80
13 14 15
4,67 4,60 4,54
3,81 3,74 3,68
3,41 3,34 3,29
3,18 3,11 3,06
3,03 2,96 2,90
2,92 2,85 2,79
2,83 2,76 2,71
2,77 2,70 2,64
2,71 2,65 2,59
16 17 18
4,49 4,45 4,41
3,63 3,59 3,55
3,24 3,20 3,16
3,01 2,96 2,93
2,85 2,81 2,77
2,74 2,70 2,66
2,66 2,61 2,58
2,59 2,55 2,51
2,54 2,49 2,46
19 20 21
4,38 4,35 4,32
3,52 3,49 3,47
3,13 3,10 3,07
2,90 2,87 2,84
2,74 2,71 2,68
2,63 2,60 2,57
2,54 2,51 2,49
2,48 2,45 2,42
2,42 2,39 2,37
22 23 24
4,30 4,28 4,26
3,44 3,42 3,40
3,05 3,03 3,01
2,82 2,80 2,78
2,66 2,64 2,62
2,55 2,53 2,51
2,46 2,44 2,42
2,40 2,37 2,36
2,34 2,32 2,30
25 26 27
4,24 4,23 4,21
3,39 3,37 3,35
2,99 2,98 2,96
2,76 2,74 2,73
2,60 2,59 2,57
2,49 2,47 2,46
2,40 2,39 2,37
2,34 2,32 2,31
2,28 2,27 2,25
28 29 30
4,20 4,18 4,17
3,34 3,33 3,32
2,95 2,93 2,92
2,71 2,70 2,69
2,56 2,55 2,53
2,45 2,43 2,42
2,36 2,35 2,33
2,29 2,28 2,27
2,24 2,22 2,21
40 60
4,08 4,00
3,23 3,15
2,84 2,76
2,61 2,53
2,45 2,37
2,34 2,25
2,25 2,17
2,18 2,10
2,12 2,04
3,92 3,84
3,07 3,00
2,68 2,60
2,45 2,37
2,29 2,21
2,17 2,10
2,09 2,01
2,02 1,94
1,96 1,88
120
∞
D.7 Valores cr´ıticos para la distribuci´on F
119
(b) Valores cr´ıticos Fα( ν1, ν2) para α = 0,05 ν1 ν2
10
12
15
20
24
30
40
60
120
1 2 3
241,9 19,40 8,79
243,9 19,41 8,74
245,9 19,43 8,70
248,0 19,45 8,66
249,1 19,45 8,64
250,1 19,46 8,62
251,1 19,47 8,59
252,2 19,48 8,57
253,3 19,49 8,55
254,3 19,50 8,53
4 5 6
5,96 4,74 4,06
5,91 4,68 4,00
5,86 4,62 3,94
5,80 4,56 3,87
5,77 4,53 384
5,75 4,50 3,81
5,72 4,46 3,77
5,69 4,43 3,74
5,66 4,40 3,70
5,63 4,36 3,67
7 8 9
3,64 3,35 3,14
3,57 3,28 3,07
3,51 3,22 3,01
3,44 3,15 2,94
3,41 3,12 2,90
3,38 3,08 2,86
3,34 3,04 2,83
3,30 3,01 2,79
3,27 2,97 2,75
3,23 2,93 2,71
10 11 12
2,98 2,85 2,75
2,91 2,79 2,69
2,85 2,72 2,62
2,77 2,65 2,54
2,74 2,61 2,51
2,70 2,57 2,47
2,66 2,53 2,43
2,62 2,49 2,38
2,58 2,45 2,34
2,54 2,40 2,30
13 14 15
2,67 2,60 2,54
2,60 2,53 2,48
2,53 2,46 2,40
2,46 2,39 2,33
2,42 2,35 2,29
2,38 2,31 2,25
2,34 2,27 2,20
2,30 2,22 2,16
2,25 2,18 2,11
2,21 2,13 2,07
16 17 18
2,49 2,45 2,41
2,42 2,38 2,34
2,35 2,31 2,27
2,28 2,23 2,19
2,24 2,19 2,15
2,19 2,15 2,11
2,15 2,10 2,06
2,11 2,06 2,02
2,06 2,01 1,97
2,01 1,96 1,92
19 20 21
2,38 2,35 2,32
2,31 2,28 2,25
2,23 2,20 2,18
2,16 2,12 2,10
2,11 2,08 2,05
2,07 2,04 2,01
2,03 1,99 1,96
1,98 1,95 1,92
1,93 1,90 1,87
1,88 1,84 1,81
22 23 24
2,30 2,27 2,25
2,23 2,20 2,18
2,15 2,13 2,11
2,07 2,05 2,03
2,03 2,01 1,98
1,98 1,96 1,94
1,94 1,91 1,89
1,89 1,86 1,84
1,84 1,81 1,79
1,78 1,76 1,73
25 26 27
2,24 2,22 2,20
2,16 2,15 2,13
2,09 2,07 2,06
2,01 1,99 1,97
1,96 1,95 1,93
1,92 1,90 1,88
1,87 1,85 1,84
1,82 1,80 1,79
1,77 1,75 1,73
1,71 1,69 1,67
28 29 30
2,19 2,18 2,16
2,12 2,10 2,09
2,04 2,03 2,01
1,96 1,94 1,93
1,91 1,90 1,89
1,87 1,85 1,84
1,82 1,81 1,79
1,77 1,75 1,74
1,71 1,70 1,68
1,65 1,64 1,62
40 60
2,08 1,99
2,00 1,92
1,92 1,84
1,84 1,75
1,79 1,70
1,74 1,65
1,69 1,59
1,64 1,53
1,58 1,47
1,51 1,39
1,91 1,83
1,83 1,75
1,75 1,67
1,66 1,57
1,61 1,52
1,55 1,46
1,50 1,39
1,43 1,32
1,35 1,22
1,25 1,00
120
∞
∞
D.7 Valores cr´ıticos para la distribuci´on F
120
(c) Valores cr´ıticos Fα( ν1, ν2) para α = 0,01 ν1 ν2
1
2
3
4
5
6
7
8
9
1 2 3
4052 98,50 34,12
4999,5 99,00 30,82
5403 99,17 29,46
5625 99,25 28,71
5764 99,30 28,24
5859 99,33 27,91
5928 99,36 27,67
5981 99,37 27,49
6022 99,39 27,35
4 5 6
21,20 16,26 13,75
18,00 13,27 10,92
16,69 12,06 9,78
15,98 11,39 9,15
15,52 10,97 8,75
15,21 10,67 8,47
14,98 10,46 8,26
14,80 10,29 8,10
14,66 10,16 7,98
7 8 9
12,25 11,26 10,56
9,55 8,65 8,02
8,45 7,59 6,99
7,85 7,01 6,42
7,46 6,63 6,06
7,19 6,37 5,80
6,99 6,18 5,61
6,84 6,03 5,47
6,72 5,91 5,35
10 11 12
10,04 9,65 9,33
7,56 7,21 6,93
6,55 6,22 5,95
5,99 5,67 5,41
5,64 5,32 5,06
5,39 5,07 4,82
5,20 4,89 4,64
5,06 4,74 4,50
4,94 4,63 4,39
13 14 15
9,07 8,86 8,68
6,70 6,51 6,36
5,74 5,56 5,42
5,21 5,04 4,89
4,86 4,69 4,56
4,62 4,46 4,32
4,44 4,28 4,14
4,30 4,14 4,00
4,19 4,03 3,89
16 17 18
8,53 8,40 8,29
6,23 6,11 6,01
5,29 5,18 5,09
4,77 4,67 4,58
4,44 4,34 4,25
4,20 4,10 4,01
4,03 3,93 3,84
3,89 3,79 3,71
3,78 3,68 3,60
19 20 21
8,18 8,10 8,02
5,93 5,85 5,78
5,01 4,94 4,87
4,50 4,43 4,37
4,17 4,10 4,04
3,94 3,87 3,81
3,77 3,70 3,64
3,63 3,56 3,51
3,52 3,46 3,40
22 23 24
7,95 7,88 7,82
5,72 5,66 5,61
4,82 4,76 4,72
4,31 4,26 4,22
3,99 3,94 3,90
3,76 3,71 3,67
3,59 3,54 3,50
3,45 3,41 3,36
3,35 3,30 3,26
25 26 27
7,77 7,72 7,68
5,57 5,53 5,49
4,68 4,64 4,60
4,18 4,14 4,11
3,85 3,82 3,78
3,63 3,59 3,56
3,46 3,42 3,39
3,32 3,29 3,26
3,22 3,18 3,15
28 29 30
7,64 7,60 7,56
5,45 5,42 5,39
4,57 4,54 4,51
4,07 4,04 4,02
3,75 3,73 3,70
3,53 3,50 3,47
3,36 3,33 3,30
3,23 3,20 3,17
3,12 3,09 3,07
40 60
7,31 7,08
5,18 4,98
4,31 4,13
3,83 3,65
3,51 3,34
3,29 3,12
3,12 2,95
2,99 2,82
2,89 2,72
6,85 6,63
4,79 4,61
3,95 3,78
3,48 3,32
3,17 3,02
2,96 2,80
2,79 2,64
2,66 2,51
2,56 2,41
120
∞
D.7 Valores cr´ıticos para la distribuci´on F
121
(d) Valores cr´ıticos Fα( ν1, ν2) para α = 0,01 ν1 ν2
10
12
15
20
24
30
40
60
120
1 2 3
6056 99,40 27,23
6106 99,42 27,05
6157 99,43 26,87
6209 99,45 26,69
6235 99,46 26,60
6261 99,47 26,50
6287 99,47 26,41
6313 99,48 26,32
6339 99,49 26,22
6366 99,50 26,13
4 5 6
14,55 10,05 7,87
14,37 9,89 7,72
14,20 9,72 7,56
14,02 9,55 7,40
13,93 9,47 7,31
13,84 9,38 7,23
13,75 9,29 7,14
13,65 9,20 7,06
13,56 9,11 6,97
13,46 9,02 6,88
7 8 9
6,62 5,81 5,26
6,47 5,67 5,11
6,31 5,52 4,96
6,16 5,36 4,81
6,07 5,28 4,73
5,99 5,20 4,65
5,91 5,12 4,57
5,82 5,03 4,48
5,74 4,95 4,40
5,65 4,86 4,31
10 11 12
4,85 4,54 4,30
4,71 4,40 4,16
4,56 4,25 4,01
4,41 4,10 3,86
4,33 4,02 3,78
4,25 3,94 3,70
4,17 3,86 3,62
4,08 3,78 3,54
4,00 3,69 3,45
3,91 3,60 3,36
13 14 15
4,10 3,94 3,80
3,96 3,80 3,67
3,82 3,66 3,52
3,66 3,51 3,37
3,59 3,43 3,29
3,51 3,35 3,21
3,43 3,27 3,13
3,34 3,18 3,05
3,25 3,09 2,96
3,17 3,00 2,87
16 17 18
3,69 3,59 3,51
3,55 3,46 3,37
3,41 3,31 3,23
3,26 3,16 3,08
3,18 3,08 3,00
3,10 3,00 2,92
3,02 2,92 2,84
2,93 2,83 2,75
2,84 2,75 2,66
2,75 2,65 2,57
19 20 21
3,43 3,37 3,31
3,30 3,23 3,17
3,15 3,09 3,03
3,00 2,94 2,88
2,92 2,86 2,80
2,84 2,78 2,72
2,76 2,69 2,64
2,67 2,61 2,55
2,58 2,52 2,46
2,49 2,42 2,36
22 23 24
3,26 3,21 3,17
3,12 3,07 3,03
2,98 2,93 2,89
2,83 2,78 2,74
2,75 2,70 2,66
2,67 2,62 2,58
2,58 2,54 2,49
2,50 2,45 2,40
2,40 2,35 2,31
2,31 2,26 2,21
25 26 27
3,13 3,09 3,06
2,99 2,96 2,93
2,85 2,81 2,78
2,70 2,66 2,63
2,62 2,58 2,55
2,54 2,50 2,47
2,45 2,42 2,38
2,36 2,33 2,29
2,27 2,23 2,20
2,17 2,13 2,10
28 29 30
3,03 3,00 2,98
2,90 2,87 2,84
2,75 2,73 2,70
2,60 2,57 2,55
2,52 2,49 2,47
2,44 2,41 2,39
2,35 2,33 2,30
2,26 2,23 2,21
2,17 2,14 2,11
2,06 2,03 2,01
40 60
2,80 2,63
2,66 2,50
2,52 2,35
2,37 2,20
2,29 2,12
2,20 2,03
2,11 1,94
2,02 1,84
1,92 1,73
1,80 1,60
2,47 2,32
2,34 2,18
2,19 2,04
2,03 1,88
1,95 1,79
1,86 1,70
1,76 1,59
1,66 1,47
1,53 1,32
1,38 1,00
120
∞
∞
D.8 Algunos n´ umeros aleatorios uniformemente distribuidos
D.8
122
Algunos n´ umeros aleatorios uniformemente distribuidos 85387 84176 27258 99398
51571 03311 51746 46950
57714 16955 67223 19399
00512 59504 98182 65167
61319 54499 43166 35082
69143 32096 54297 30482
08881 79485 26830 86223
01400 98031 29842 41061
55061 99485 78016 21717
82977 16788 73127 48126
72752 69090 39620 81725
89364 93551 54988 49831
02150 11649 67846 35595
85418 54688 71845 29891
05420 57061 54000 46812
84341 77711 26134 57770
02395 24201 84526 03326
27655 16895 16619 31316
59457 64936 82573 75412
55438 62347 01737 80732
87968 07730 32825 34453
85157 01861 82100 05330
84752 40610 67406 40224
93777 73445 44156 04116
62772 70321 21531 24597
78961 26467 67186 93823
30750 53533 39945 28171
76089 20787 04189 47701
23340 46971 79798 77201
64637 29134 41087 68257
00830 24580 59578 75387
34235 05258 08535 24990
40671 37329 77107 12748
66042 59173 19838 71766
06341 62660 40651 17471
54437 72513 01749 15794
81649 82232 58893 68622
70494 49794 99115 59161
01883 36913 05212 14476
18350 05877 92309 75074
02465 49689 60958 79956
34977 08342 20236 98409
48319 81912 79424 79548
53026 92735 04055 39569
53691 30042 54955 83974
80594 47623 73342 43707
58805 60061 14040 77080
76961 69427 72431 08645
62665 21163 99469 20949
82855 68543 41044 56932
04316 78684 69235 81201
01206 28546 18535 04314
08715 06881 61904 92708
77713 66097 99246 44984
20572 53530 84050 83121
13912 42509 15270 33767
94324 54130 07751 56607
14656 30878 90410 46371
11979 77166 96675 20389
53258 98075 62870 08809
80336 65076 90879 50555
59638 87960 70970 84355
44368 92013 50789 97066
23433 60169 59973 82748
97794 49176 47771 98298
10343 50140 94567 14385
19235 39081 35590 82493
82633 04638 23462 40182
17186 96114 33993 20523
63902 63463 99899 69182
48658 26373 20878 20069
41921 19166 80883 60582
86514 88223 26027 55749
46786 32371 29101 88068
74097 11570 58382 48589
62825 62078 17109 01784
46457 92317 53511 42930
24428 13378 95536 40310
09245 05734 21759 34613
86069 71778 10630 97359
46819 83644 08636 92058
38577 04459 31363 38678
20520 73252 56033 12507
94145 58414 49076 90343
99405 94180 88908 17213
47064 09321 51318 24545
25248 59747 39104 66053
27289 07379 56556 76412
41289 56255 23112 29545
54972 45615 63317 89932
05038 41838 15564 74600
18443 68590 81618 40206
87138 93646 99186 15237
05076 82113 73113 37378
25660 25498 99344 96862
23414 33110 13213 78638
84837 15356 07235 14376
87132 81070 90064 46607
84405 84900 89150 55909
15346 42660 86359 46398
78275 30145 46944 85883
77017 71205 00097 21272
60310 10355 39161 89266
13499 18404 50139 94887
35268 85354 60458 00291
47790 22199 44649 70963
77475 90822 85537 28169
44345 35204 90017 95130
14615 47891 18157 27223
25231 69860 13856 35387
83606 66888 63673
98192 81818 73966
82194 52490 34036
26719 54272 44298
24499 70549 60652
28102 69235 05947
97769 79684 05833
98769 96412 37914
30757 65186 57021
81593 87974 58566
37944 93240 40189
16094 66855 76776
39797 29336 70842
63253 28345 32675
64103 71398 81647
32222 45118 75868
65925 01454 21288
64693 72128 12849
34048 09715 94990
75394 29454 21513
Bibliograf´ıa &Referencias
[1] Anderson, D.; Sweeney, D.; Williams, T., Estad´ıstica para administraci´ on y econom´ıa. International Thomson Editores, 1999. [2] Berk, K.; Carey, P., An´alisis de datos con Microsoft Excel . International Thomson Editores, 2001. [3] Berenson, M.; Levine, D.; Krehbiel, T., Estad´ıstica para administraci´ on. Prentice Hall, 2001. [4] Canavos, G,, Probabilidad y Estad´ıstica: Aplicaciones y M´ etodos . Mc Graw-Hill, 1988. [5] DeGroot, M., Probabilidad y Estad´ıstica. Addison-Wesley Iberoamericana, 1988. [6] Devore, J., Probabilidad y estad´ıstica para ingenier´ıa y ciencias . International Thomson Editores, 2001. [7] Freund. J., Estad´ıstica elemental . Prentice Hall, 1994. [8] Kreyszig, E., Introducci´ on a la estad´ıstica matem´atica: Principios y m´etodos . Ed. Limusa, 1991. [9] Levin, R.; Rubin, D., Estad´ıstica para Administraci´ on y Econom´ıa. Prentice Hall, 2004. [10] Lizasoain, L.; Joaristi, L., Gesti´ on y an´alisis de datos con SPSS . International Thomson Editores, 2003. ´ s, H.; Rojas, C., Estad´ıstica descriptiva y distribuciones de probabilidad . Ediciones [11] LLina Uninorte, 2005. ´ s, H., Gu´ıa resumida sobre M´ [12] LLina etodos Estad´ısticos: Teor´ıa y p´actica. Notas de clases para la Especializaci´on en Estad´ıstica Aplicada, 2005.
[13] Milton, S.; Arnold, J., Probabilidad y estad´ıstica con aplicaciones para ingenier´ıa y ciencias computacionales . Mc Graw-Hill, 2003. [14] Montgomery, D.; Runger, G. , Probabilidad y estad´ıstica aplicadas a la ingenier´ıa. Ed. Limusa, 2002. [15] Newbold, P., Estad´ıstica para los Negocios y la Econom´ıa. Prentice Hall, 1998. [16] P´ actica con Statgraphics . Prentice Hall, 2002. erez, C., Estad´ıstica pr´