PRUEBAS DE HIPOTESIS PARA LA PROPORCION Frecuentemente se desea estimar la proporción de elementos que tienen una característica determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza información cualitativa y se está interesado en verificar un supuesto acerca de la proporción poblacional de elementos que tienen determinada característica, es útil trabajar con la prueba de hipótesis para la proporción.
HIPÓTESIS Como en el caso de la media, se puede plantear uno de los siguientes tres tipos de hipótesis: - Prueba de hipótesis a dos colas H0 : = k H1 : k - Prueba de hipótesis a una cola superior H0 : = k
ó
H0 :
k
H1 : > k ó H 1 : > k - Prueba de hipótesis a una cola inferior H0 : = k
ó
H0 :
k
H1: < k ó H1 : < k Cuando se va a estimar una proporción el tamaño de la muestra (n) siempre debe ser mayor a 30, por lo tanto se tiene un solo caso. La estadística de trabajo a utilizar es la expresión (1.13):
(3.5)
REGLA DE DECISION Si se ha planteado la hipótesis alternativa como: H1:
k se tiene una prueba prueba de hipótesis hipótesis a dos colas, colas, por lo tanto, tanto, el el nivel nivel de
significanc significancia ia ( ) se divide en dos partes partes iguales, iguales, quedando quedando estos estos valores valores en los extremos de la distribución como se aprecia en la figura 3.1 y
perten pertenece ecen n a una distri distribuc bución ión normal normal estánd estándar. ar. Si el valor valor de la
estadística de trabajo (Zp) está está entr entre e y no se recha rechaza za la hipó hipóte tesi siss nula, en caso contrario se rechaza H 0 lo cual implica aceptar H1 . Es decir, si < Zp < no se rechaza H0 . - Si se ha planteado la hipótesis alternativa como: H1 : > k, se se tiene una prueba de hipótesis a una cola superior, quedando quedando el nivel de significancia ( ) en la parte superior de la distribución, vease figura 3.2
pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp ) es menor que
no se rechaza la hipótesis nula, en caso
contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Z p < se rechaza H0 . - Si se ha planteado la hipótesis alternativa como:
no
H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribución, vease figura 3.3 Z pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp ) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H 0 lo cual implica aceptar H1 . Es decir, si Z p > Z no se rechaza H0 .
EJEMPLO Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que suministra a una fábrica guardan las formas especificadas. Un exámen de 200 de esas piezas reveló que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el fabricante es cierto. Solución H0 :
0,9
H1 : < 0,9 Para realizar una prueba de hipótesis para la proporción se utiliza la expresión 3.5
Asumiendo una confiabilidad del 95 por ciento, el valor correspondiente a Z en la distribución normal es -1,64 Como puede observarse en la figura 3.7, el valor de la estadística de trabajo se encuentra en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 95 por ciento se concluye que la afirmación del fabricante no es cierta.
Figura 3.7 Regla de decisión para una prueba de hipótesis a una cola inferior
PRUEBA DE HIPOTESIS PARA DIFERENTES MEDIAS Se tienen dos poblaciones y se toman muestras aleatorias independientes de tamaños n 1 y n 2 , se puede comparar el comportamiento de dichas poblaciones a través de los promedios. Hipótesis Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hipótesis: - Prueba de hipótesis a dos colas H0 :
=
H1 :
ó ó
H0 : H1 :
-
=k k
- Prueba de hipótesis a una cola superior H0 :
=
ó
H0 :
-
k
H1 :
>
ó
H1 :
-
>k
- Prueba de hipótesis a una cola inferior
H0 :
=
ó
H0 :
-
k
H1 : < ó H1 : - < k La estadística de trabajo depende de las características de las poblaciones y del tamaño de las muestras. 3.6.1 . Prueba de hipótesis para la diferencia de medias, si las muestras se obtienen de poblaciones con distribución normal, con varianzas poblacionales conocidas , la estadística de trabajo es la expresión (1.10):
(3.9)
REGLA DE DECISION - Si se ha planteado la hipótesis alternativa como: H1 :
>
ó H1 :
-
> k se tiene una prueba de hipótesis a dos colas, por lo
tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.1 y
pertenecen a una distribución Normal estándar. Si el valor de la
estadística de trabajo está entre y no se rechaza la hipótesis nula, en caso contrario se rechaza H o lo cual implica aceptar H 1 . Es decir, - Si se ha planteado la hipótesis alternativa como: H1 :
>
ó H1 :
-
> k, se tiene una prueba de hipótesis a una cola
superior, quedando el nivel de significancia ( ) en la parte superior de la distribución, como se aprecia en la figura 3.2 pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo es menor que se acepta la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, - Si se ha planteado la hipótesis alternativa como: H1 :
<
ó H1 :
-
< k, se tiene una prueba de hipótesis a una cola
inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribución, como se aprecia en la figura 3.3
Z pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir,
EJEMPLO Un constructor está considerando dos lugares alternativos para construir un centro comercial. Como los ingresos de los hogares de la comunidad son una consideración importante en ésta selección, desea probar que el ingreso promedio de la primera comunidad excede al promedio de la segunda comunidad en cuando menos $1.500 diarios. Con la información de un censo realizado el año anterior sabe que la desviación estándar del ingreso diario de la primera comunidad es de $1.800 y la de la segunda es de $2.400 Para una muestra aleatoria de 30 hogares de la primera comunidad, encuentra que el ingreso diario promedio es de $35.500 y con una muestra de 40 hogares de la segunda comunidad el ingreso promedio diario es de $34.600. Pruebe la hipótesis con un nivel de confianza del 95 por ciento. Solución Se desea probar si la diferencia entre los ingresos de la comunidad 1 y la 2 es de $1.500 o más, por lo tanto: H0 :
-
1.500
H1 : - < 1.500 El tamaño de las muestras es grande y las varianzas poblacionales son conocidas, por consiguiente la estadística de trabajo a utilizar es la expresión 3.9
Para un nivel de confianza del 95 por ciento, en la tabla de la distribución normal se tiene un valor de Z de -1,64. Como puede observarse en la figura 3.13, la estadística de trabajo se ubica en la zona de aceptación de la hipótesis nula; por lo tanto, con una confiabilidad del 95 por ciento, la diferencia entre el ingreso promedio por hogar en las dos comunidades es mayor a $1.500 diarios.
Figura 3.13 Regla de decisión para una prueba de hipótesis a una cola inferior .
3.6.2 Prueba de hipótesis para la diferencia de medias si las muestras se obtienen de poblaciones con distribuciones diferentes a la normal, pero n1 30 y n2 30 y varianzas poblacionales desconocidas , la estadística de trabajo es igual al caso anterior, solo que se reemplaza la varianza poblacional por la muestral:
(3.10)
REGLA DE DECISIÓN La regla de decisión es la misma que en caso anterior y en todo caso, depende de la hipótesis alternativa. EJEMPLO Una muestra de 80 alambres de acero producidos por la fábrica A presenta una resistencia promedio a la ruptura de 1.230 lbs . con una desviación estándar de 120 lbs .. Una muestra de 100 alambres de acero producidos por la fábrica B presenta una resistencia promedio a la ruptura de 1.110 lbs . con una desviación estándar de 90 lbs .. Con base en ésta información pruebe si la resistencia promedio a la rotura de los alambres de acero de la marca A es significativamente mayor que la de los alambres de acero de la marca B. Asuma un nivel de confianza del 99 por ciento. Solución H0 : A = B H1 : A > B El tamaño de las muestras es grande, las varianzas poblacionales son desconocidas, por la tanto la estadística de trabajo a utilizar es la expresión 3.10
Con un nivel del confianza del 99 por ciento, en la tabla de la distribución normal el valor de Z es 2,33. como puede observarse en la figura 3.14, la estadística de trabajo está en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 99 por ciento se acepta que la resistencia promedio de los alambres de la marca A es significativamente mayor que la resistencia promedio de los alambres de la marca B.
Figura 3.14 Regla de decisión para una prueba de hipótesis a una cola superior
3.6.3 Prueba de hipótesis para la diferencia de medias si las muestras se obtienen de poblaciones con distribución normal, con varianzas poblacionales iguales pero desconocidas y n 1 <30 y n2 <30 , la estadística de trabajo es la expresión (1.11):
(3.
11) REGLA DE DECISIÓN La regla de decisión es la misma que en los casos anteriores, pero los valores de la tabla se hallan en una distribución t con (n1 +n2 -2) grados de libertad. Nota . Cuando se tienen muestras pequeñas y se va a realizar una prueba de hipótesis para la diferencia de medias, primero se debe probar si las varianzas poblacionales son iguales o diferentes, lo cual se hace con la
prueba de hipótesis para el cociente de varianzas. Si las varianzas son iguales se aplica el caso 3.6.3 y si son diferentes se aplica el caso 3.6.4. EJEMPLO Se desea probar si la cantidad promedio de cera superficial en el lado interno (I) de las bolsas de papel encerado es mayor que la cantidad promedio en el lado externo (E). Para tal efecto se tomó una muestra aleatoria de 25 bolsas, midiéndose la cantidad de cera en cada lado de esas bolsas, obteniéndose los siguientes resultados:
Con base en esta información cuál es su conclusión?. Asuma un nivel de confianza del 90 por ciento. Solución Con la información suministrada se obtienen los estimadores necesarios:
En consideración a que el tamaño de las muestras es pequeño, antes de realizar la prueba de hipótesis para la diferencia de medias, se debe probar si las varianzas poblacionales son iguales o diferentes. H0 :
/
=1
H1 : / 1 Para la estadística de trabajo se utiliza la expresión 3.8:
Con una confiabilidad del 90 por ciento, en la tabla de la distribución F con 24 grados de libertad en el numerador y 24 grados de libertad en el denominador, el valor de Z 0,05 es 0,505 y el valor de Z 0,95 es 1,98. como puede observarse en la figura 3.15, la estadística de trabajo cae en la zona de no rechazo de la hipótesis nula, por consiguiente las varianzas poblacionales son iguales.
Como las varianzas poblacionales son iguales, para realizar la prueba de hipótesis para la diferencia de medias se usa la expresión 3.11 H0 : I
E
H1 : I > E
Con una confiabilidad del 90 por ciento, en la tabla de la distribución t con 48 grados de libertad, el valor de Z es 1,3. Como puede observarse en la figura 3.16, la estadística de trabajo se encuentra en la zona de no rechazo de la hipótesis nula, por lo tanto, con una confiabilidad del 90 por ciento se concluye que la cantidad promedio de cera en el lado interno no es mayor que la cantidad promedio de cera en el lado externo.
Figura 3.16 Regla de decisión para una prueba de hipótesis a una cola superior
3.6.4 Prueba de hipótesis para la diferencia de medias si las muestras se obtienen de poblaciones con distribución normal, con varianzas poblacionales diferentes pero desconocidas y n1 <30 y n2 <30 , la estadística de trabajo es la expresión (1.12):
(3.12) REGLA DE DECISIÓN La regla de decisión es la misma que en los casos anteriores pero los valores de la tabla se hallan en una distribución t con k grados de libertad, siendo:
(3.13) EJEMPLO Un fabricante de bombillos sospecha que una de sus líneas de producción está produciendo bombillos con una duración promedio menor que la de otra línea. Para probar su sospecha toma una muestra aleatoria de 16 bombillos de la línea sospechosa (s) y 18 de la otra línea (c), obteniendo los siguientes resultados:
Con ésta información cuál es su conclusión si se asume un nivel de confianza del 90 por ciento. Solución Como el tamaño de las muestras es pequeño, para decidir cuál es la estadística de trabajo adecuada para la prueba de hipótesis de la diferencia de medias, primero se debe probar si las varianzas poblacionales son iguales o no. H0 :
/
=1
H1 : / 1 La estadística de trabajo es:
Con una confiabilidad del 90 por ciento, en la tabla de la distribución F con 15 grados de libertad en el numerador y 17 grados de libertad en el denominador, el valor de Z 0,05 es 0,43 y el valor de Z 0,95 es 2,31. como puede observarse en la figura 3.17, la estadística de trabajo cae en la zona de rechazo de la hipótesis nula, por consiguiente las varianzas poblacionales son diferentes.
Figura 3.17 Regla de decisión para una prueba de hipótesis a dos colas Considerando que las varianzas poblacionales son diferentes, la estadística de trabajo a utilizar para la prueba de hipótesis para la diferencia de medias es la expresión 3.12 H0 : S = C H1 : S < C La estadística de trabajo es:
Con la expresión 3.13 se calculan los grados de libertad de la distribución t
En la tabla de la distribución t, con 26 grados de libertad y una confiabilidad del 90 por ciento, el valor de Z es -1,315. Como se observa en la figura 3.18, la estadística de trabajo cae en la zona de no rechazo de la hipótesis nula, por lo tanto, con una confiabilidad del 90 por ciento se concluye que no hay diferencia en el promedio de producción de las dos líneas.
Figura 3.18 Regla de decisión para una prueba de hipótesis a una cola inferior