Universidad Peruana de Ciencias Aplicadas
Pruebas de hipótesis para dos varianzas poblacionales. Ejemplo. Un investigador desea verificar si existe evidencia de una diferencia en las varianzas de las resistencias entre dos tipos de material para embalaje. La descripción de las lecturas en pielibra de la resistencia al impacto de los dos tipos de embalaje se muestra a continuación. Características Media Varianza Observaciones
Embalaje A 1,2367 0,0042 9
Embalaje B 0,9778 0,0024 9
A partir de los datos obtenidos compruebe la hipótesis y concluya con 5% de nivel de significación. Asuma poblaciones normales con varianzas iguales. Solución. Sean X1: Resistencia al impacto (embalaje A) X1 ~ N( µ 1 , σ 12 ) X2: Resistencia al impacto (embalaje B) X2 ~ N( µ 2 , σ 22 ) 1. Planteo de hipótesis. ⎧⎪H 0 : σ 12 = σ 22 ⎨ ⎪⎩H 1 : σ 12 ≠ σ 22
2. Nivel de significación. α = 0.05 3. Prueba estadística S2 1 Fc = 12 • 2 ~ f ( n1 −1, n 2 −1) S 2 σ1 σ 22 4. Supuestos. ; Poblaciones normales. ; Muestras tomadas al azar. 5. Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo. Áreas Criterios 0.025
0.226
0.025
Si 0.226 ≤ fc ≤ 4.43 No se rechaza H0 Si fc < 0.226 o fc > 4.43 Se rechaza H0
4.43
Separata de Estadística para Economistas
56
Universidad Peruana de Ciencias Aplicadas
6.
Cálculos
7. Conclusiones. Con 5% de nivel de significación la información muestral es insuficiente para rechazar que las varianzas de las resistencias son iguales.
(0.0042) = 1.75 Fc = (0.0024)
Pruebas de hipótesis para dos medias poblacionales. Muestras independientes
Ejemplo. Un investigador desea verificar si existe evidencia de una diferencia en la resistencia promedio entre dos tipos de material para embalaje. La descripción de las lecturas en pielibra de la resistencia al impacto de los dos tipos de embalaje se muestra a continuación. Características Media Varianza Observaciones
Embalaje A 1,2367 0,0042 9
Embalaje B 0,9778 0,0024 9
A partir de los datos obtenidos compruebe la hipótesis y concluya con 5% de nivel de significación. Asuma poblaciones normales con varianzas iguales. Solución. Sean X1: Resistencia al impacto (embalaje A) X1 ~ N( µ 1 , σ 12 ) X2: Resistencia al impacto (embalaje B) X2 ~ N( µ 2 , σ 22 ) 1. Planteo de hipótesis. ⎧H 0 : µ 1 = µ 2 ⎨ ⎩H 1 : µ 1 ≠ µ 2 2. Nivel de significación. α = 0.05 3. Prueba estadística _
tc =
_
( x1 − x 2 ) − (µ1 − µ 2 ) ⎛1 1 ⎞ S ⎜⎜ + ⎟⎟ ⎝ n1 n 2 ⎠
~ t ( n1 + n 2 − 2)
2 p
2 2 donde: S2p = (n1 − 1)s1 + (n 2 − 1)s 2 n1 + n 2 − 2
4. Supuestos. ; Poblaciones normales. ; Muestras tomadas al azar. Separata de Estadística para Economistas
57
Universidad Peruana de Ciencias Aplicadas
5. Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo. Áreas Criterios 0.025
Si -2.120 ≤ tc ≤ 2.120 No se rechaza H0 Si tc < -2.120 o tc > 2.120 Se rechaza H0
0.025 0.95 -2.120
t(16, 0.025) = 2.120
6. Cálculos tc =
(1.2367 − 0.9778) − (0) ⎛1 1⎞ 0.0033⎜ + ⎟ ⎝9 9⎠
= 9.561
7. Conclusiones. Con 5% de nivel de significación la información muestral es suficiente para rechazar que las resistencias promedios de los dos tipos de embalaje son iguales.
Muestras relacionadas
Ejemplo Un gimnasio afirma que un nuevo programa de ejercicio reducirá la medida de la cintura de una persona en promedio dos centímetros en un período de cinco días. Las medidas de cinturas de seis hombres que participaron en este programa de ejercicios se registraron antes y después del período de cinco días en la siguiente tabla:
Medida de cintura antes Medida de cintura después
1 90,4 91,7
2 95,5 93,9
Hombres 3 4 98,7 115,9 97,4 112,8
5 104,0 101,3
6 85,6 84,0
¿La afirmación del gimnasio es válida al nivel de significación de 5%? Suponga que la distribución de las diferencias de medidas de cintura antes y después del programa es aproximadamente normal. Solución. Sean X1: Medida de cintura antes (cm.) X2: Medida de cintura después (cm.) 1. Planteo de hipótesis. ⎧H 0 : D = 2 ⎨ ⎩H 1 : D ≠ 2
Separata de Estadística para Economistas
58
Universidad Peruana de Ciencias Aplicadas
2. Nivel de significación. α = 0.05 3. Prueba estadística d−D ~ t (n −1) tc = Sd / n 4. Supuestos. ; Las diferencias tienen distribución normal. 5. Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo. Áreas
Criterios
0.025
0.025
Si -2.57 ≤ tc ≤ 2.57 No se rechaza H0 Si tc < -2.57 o tc > 2.57 Se rechaza H0
0.95 -2.57
2.57
6. Cálculos
tc =
1 .5 − 2
= −0.794
1.543 / 6
7. Conclusiones. Con 5% de nivel de significación la información recogida resulta insuficiente para contradecir lo que afirma el gimnasio.
Prueba de hipótesis para dos proporciones poblacionales. En una prueba de calidad de dos comerciales de televisión se pasó cada uno en un área de prueba seis veces, durante un período de una semana. La semana siguiente se llevó a cabo una encuesta telefónica para identificar a quienes habían visto esos comerciales. A las personas que los vieron se les pidió definieran el principal mensaje en ellos. Se obtuvieron los siguientes resultados: Comercial Personas que lo vieron A 150 B 200
Personas que recordaron el mensaje principal 63 60
Use α = 0.05 para probar la hipótesis que no hay diferencia en las proporciones que recuerdan los dos comerciales. Separata de Estadística para Economistas
59
Universidad Peruana de Ciencias Aplicadas
Solución. Sea p1: Proporción de personas que recordaron el mensaje principal del comercial A. Sea p2: Proporción de personas que recordaron el mensaje principal del comercial B. 1. Planteo de hipótesis. ⎧H 0 : p1 = p 2 ⎨ ⎩H1 : p1 ≠ p 2
2. Nivel de significación. α = 0.05 3. Prueba estadística Zc =
pˆ1 − pˆ 2 ⎛1 1 ⎞ ⎟ p (1 − p )⎜⎜ + ⎟ ⎝ n1 n 2 ⎠
~ N (0.1)
4. Supuestos. ; Muestra tomada al azar. ; Muestra grande. 5. Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo. Áreas Criterios 0.025
0.025 0.95 -1.96
6.
1.96
Cálculos Zc =
Si -1.96 ≤ Zc ≤ 1.96 No se rechaza H0 Si Zc < -1.96 o Zc > 1.96 Se rechaza H0
63 60 − 150 200 = 2.328 1 ⎞ ⎛ 1 + (0.351)(0.649)⎜ ⎟ ⎝ 150 200 ⎠
Separata de Estadística para Economistas
7.
Conclusiones. Con 5% de nivel de significación y a partir de la información muestral, hay diferencias significativas en las proporciones que recuerdan los dos comerciales.
60
Universidad Peruana de Ciencias Aplicadas
Ejercicios Propuestos 1) Se midió el número de ciclos hasta el colapso en vigas de concreto armado, tanto en el agua de mar como en el aire. Los resultados en miles fueron los siguientes: x s Agua de mar 774 633 477 268 407 576 659 963 193 550,000 243,141 Aire 734 571 520 792 773 276 411 500 672 583,222 175,121 ¿En el agua de mar en comparación con el aire, disminuye el número de ciclos antes del colapso? Asuma poblaciones normales. Use α = 0.05 . Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas
F Se han asumido varianzas iguales No se han asumido varianzas iguales
,787
Sig. ,388
Prueba T para la igualdad de medias
t
gl
Sig. (bilateral)
Diferenci a de medias
Error típ. de la diferencia
95% Intervalo de confianza para la diferencia Inferior
Superior
-,333
16
,744
-33,222
99,880
-244,959
178,515
-,333
14,54
,744
-33,222
99,880
-246,700
180,256
2) Se afirma que la resistencia del alambre A es mayor que la resistencia del alambre B. Un experimento sobre los alambres muestra los siguientes resultados (en ohmios): s x Alambre A 0,136 0,142 0,137 0,135 0,143 0,138 0,1385 0,0033 Alambre B 0,135 0,104 0,118 0,11 0,115 0,132 0,119 0,0122 Los datos recogidos apoyan la afirmación. Asuma poblaciones normales, use 5% de nivel de significación. 3) En un estudio realizado por el Departamento de Nutrición Humana y Alimentos se registraron los siguientes datos acerca de la comparación de residuos de ácido sórbico, en partes por millón, en jamón inmediatamente después de sumergirlo en una solución de ácido y después de 60 días de almacenamiento. Residuos de ácido sórbico en jamón Rebanada Antes del almacenamiento Después del almacenamiento di 1 224 116 108 2 270 96 174 3 400 239 161 4 444 329 115 5 590 437 153 6 660 597 63 7 1400 689 711 8 680 576 104 Se supone que las poblaciones se distribuyen normalmente, ¿hay suficiente evidencia, al nivel de significancia de 0.05, para decir que la duración del almacenamiento influye en las concentraciones residuales de ácido sórbico? Separata de Estadística para Economistas
61
Universidad Peruana de Ciencias Aplicadas Prueba de muestras relacionadas Diferencias relacionadas Error 95% Intervalo de confianza típ. de para la diferencia Desviación la típ. Inferior Superior media
Media antes - después
198,625
210,165
74,305
22,922
374,328
t
Sig. (bilateral)
gl
2,673
7
,032
4) Se utilizaron nueve sujetos en un experimento para determinar si una atmósfera que implica la exposición a monóxido de carbono tiene un impacto sobre la capacidad de respiración. Los sujetos se colocaron en cámaras de espiración, una de las cuales contenía una alta concentración de CO. Se realizaron varias mediciones de respiración para cada sujeto en cada cámara. Los sujetos se colocaron en las cámaras de respiración en una secuencia aleatoria. Los siguientes datos dan la frecuencia respiratoria en número de respiraciones por minuto. Sujeto
1
2
3
4
5
6
7
8
9
Con CO 30 45 26 25 34 51 46 32 30 Sin CO 30 40 25 23 30 49 41 35 28 Calcule un intervalo de confianza del 95%, se puede afirmar que un ambiente con CO influye sobre la capacidad de respiración. Asuma normalidad. 5) El empleo de equipo de cómputo en las empresas está creciendo con una rapidez vertiginosa. Un estudio reciente, en la que participaron 15 empresas del sector industrial, reveló que 184 de 616 adultos trabajan utilizando con regularidad una computadora personal, una microcomputadora, un terminal de computadora o un procesador de texto en su trabajo. a) ¿Son estas pruebas suficientes para llegar a la conclusión de que la porción de adultos que utilizan con regularidad equipo de cómputo en su trabajo excede 25% Pruebe con α = 0.03 . b) Se sabe que el número promedio de trabajadores por empresa es 720. Estime un intervalo de confianza del 95% para el total de trabajadores, de las 15 empresas, que utilizan con regularidad equipo de cómputo en su trabajo. c) Se seleccionó otra muestra de 450 adultos, de 10 empresas del sector salud, en la muestra se obtuvo que 105 adultos utilizan con regularidad una computadora persona, una microcomputadora, un terminal de computadora o un procesador de texto en su trabajo ¿Existe diferencias significativas entre los porcentajes de adultos, de las empresas del sector industrial y de salud, que utilizan algún equipo de cómputo en su trabajo? Use nivel de significación 0,05. 6) Se considera cierto cambio en un proceso de fabricación partes componentes. Se toma muestras de procedimiento existente y del nuevo para determinar si este tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos de procedimiento nuevo también lo son, al nivel de 5% de significación, ¿mejoró el proceso luego de los cambios?
Separata de Estadística para Economistas
62