Capítulo 3 INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA El proceso de Inferencia Estaística permite extraer conclusiones científicamente científicamente válidas acerca de la población a partir de los resultados muéstrales (obtenidos a través de la estadística descriptiva).
El prop!sito e la inferencia estaística es reali"ar#
$ Esti%aci!n e &ar'%etros $ Co Cont ntra raste ste e e (ip! (ip!te tesi siss
Esti%aci!n e &ar'%etros &ar'%etros El método de estimación de un parámetro puede ser puntual o por intervalo.
Esti%aci!n puntual e ) En base al result resultado ado de la muestra muestra partic particular ular de tamaño tamaño n, una estimaci estimación ón puntual puntual de µ X sería el valor numérico que toma en dica muestra. En nuestro e!emplo, a partir de una muestra de n"#$ plancas de acero. %aríamos como X estimación del peso medio poblacional o teórico, " &'# .
Incon*eniente+s,# •
*a estimación puntual depende de la muestra particular que se obtena. Existe una incertidum incertidumbre bre total, total, acerca acerca de la proximidad proximidad (le!aní (le!anía) a) del valor valor puntual puntual a la • Existe media poblacional o teórica. +in embaro onocem onocemos os la distri distribuci bución ón de la medias medias muéstr muéstrale aless ba!o cierta ciertass condici condicione oness sob sobre re la población de partida.
DISTRI-UCIÓN DE LA .EDIA .UESTRAL a, Si asu%i%os /ue 0 1 N +)2 ,2 1 conocia *as (infinitas) medias muéstrales obtenidas con muestras de tamaño n se distribu-en sen una distribución normal (campana de /auss)0
X
→ N ( µ , σ X ) ⇔ Z =
X − µ σ X
→ N ($,')
σ X
%onde0
es el error típico o desviación estándar de la media muestral.
Esti%aci!n e &ar'%etros &ar'%etros El método de estimación de un parámetro puede ser puntual o por intervalo.
Esti%aci!n puntual e ) En base al result resultado ado de la muestra muestra partic particular ular de tamaño tamaño n, una estimaci estimación ón puntual puntual de µ X sería el valor numérico que toma en dica muestra. En nuestro e!emplo, a partir de una muestra de n"#$ plancas de acero. %aríamos como X estimación del peso medio poblacional o teórico, " &'# .
Incon*eniente+s,# •
*a estimación puntual depende de la muestra particular que se obtena. Existe una incertidum incertidumbre bre total, total, acerca acerca de la proximidad proximidad (le!aní (le!anía) a) del valor valor puntual puntual a la • Existe media poblacional o teórica. +in embaro onocem onocemos os la distri distribuci bución ón de la medias medias muéstr muéstrale aless ba!o cierta ciertass condici condicione oness sob sobre re la población de partida.
DISTRI-UCIÓN DE LA .EDIA .UESTRAL a, Si asu%i%os /ue 0 1 N +)2 ,2 1 conocia *as (infinitas) medias muéstrales obtenidas con muestras de tamaño n se distribu-en sen una distribución normal (campana de /auss)0
X
→ N ( µ , σ X ) ⇔ Z =
X − µ σ X
→ N ($,')
σ X
%onde0
es el error típico o desviación estándar de la media muestral.
4, Si asu%i%os /ue 0 1 N +)2 ,2 esconocia *as (infinitas) (infinitas) medias medias muéstrales muéstrales obtenidas obtenidas con muestras muestras de tamaño tamaño n se distribu-en distribu-en sen una distribución distribución t1student con n1' rados de libertad (l) X
→
N ( µ , s X )
⇔
T
=
X − µ s X
→
t n −'
S X
%onde0
es el error típico o desviación estándar de la media muestral.
5
Nota# +Error est'nar o Error típico e la %eia,
σ x
σ x
S x
=
σ
=
σ
=
σ conocida 2amaño 2amaño de población (3) demasiado rande o infinita.
n
n S n
N − n N − '
σ conocida 2amaño de población (3) conocido o finita.
σ
σ
≅ S
desconocida, entonces 2amaño 2amaño de población (3) demasiado rande o infinita.
S x
S
σ
N − n
≅ S
desconocida, entonces 2amaño de población (3) conocida o finita.
=
N − '
n
σ
Esti%aci!n por Inter*alo e confian"a para ) µ
+uponamos +uponamos que de una población población normal con media desconocida desconocida σ
- varian4a conocida
&
o descon desconoci ocida da
se extrae extrae una muestr muestraa de tamaño tamaño n, entonces de la distribución de la X
media muestral se obtiene que, lleva asociado un error error típico de dico estadístico de lo que a de tenerse en cuenta para valorar la precisión de una estimación puntual.
Iea X onstruir onstruir intervalos intervalos de confian4a, basado parámetro µ.
, que contena 5con alta probabilidad6 el
Caso I# 7 8 3 (µ, 9), 9 conocida El Intervalo de confianza confianza para µ es: X
− Z'−
α
on un nivel de confian4a del
:&
; σ X
' − α
≤µ≤
X
+ Z '−
α : &
; σ X
.
(µ, 9), 9 desconocida Caso II# 7 8 3 (µ, El intervalo de confianza confianza para µ es:
X
− t'−
α
: &< n −'
on un nivel de confian4a del
; S X
' − α
≤ µ ≤ X + t'−
.
Ta%a6o e %uestra
α : &< n
−' ; S X
+e puede determinar determinar que tan rande debe ser el tamaño de la muestra, n, de manera que si µ x se estima por , el error e esti%aci!n no sea ma-or que un valor dado e7 En efecto0 •
Z & α ; σ & n
'−
=
σ
&
e
+i la desviación estándar ( ) es descono desconocid cida, a, se estima estima por la desvia desviació ción n estándar muestral (+) allado a partir de una muestra piloto. 2amaño de población (3) conocida o finita
•
&
Z & α ;σ & ; N n=
'−
Z
&
'−
α
&
;σ
&
2amaño 2amaño de población pob lación (3) demasiado rande o infinita.
σ
+ e & ( N − ')
•
&
+i la desv desvia iaci ción ón está estánd ndar ar ( ) es desconocida, se estima por la desviación estándar muestral (+) allado a partir de una muestra piloto.
E8e%plo E8e%plo 9#
=na encuesta reali4ada a empleados de un sector dio como resultados que el tiempo medio de empleo era de #,> años con una desviación típica de ',& años. a) Estim Estimar ar,, al ?$@ de confian4a confian4a,, el tiempo tiempo medio de empleo empleo para para el sector sector,, suponien suponiendo do 3ormalidad. b) +i el maren de error ubiera sido de ' año Aqué rado de confian4ase tendríaB c) ACué ACué tama tamaño ño mu mues estr tral al es necesa necesari rio o si se quis quisie iera ra el mar maren en de erro errorr del del apart apartad ado o primero - el rado de confian4a del apartado seundoB
Soluci!n# a, Estimar, al ?$@ de confian4a, el tiempo medio de empleo para el sector, suponiendo 3ormalidad.
Datos# 70 2iempo de empleo supuestamente 3ormal 2amaño de muestra 0 n " empleados X 2iempo me medio de de em empleo 0 " #,> años σ
%esv %esvia iaci ción ón típi típica ca mu mues estr tral al onfian4a
0 + " ',& ',& años años ( desconocido) ' − α ⇒ α 0 " $,?$ " $,'$
En base a los datos corresponde al CASO II, donde su intervalo es0
X
− t'−
α
: &< n −'
; S X
≤ µ ≤ X + t'−
α : &< n
−' ; S X
Entonces0 S X
',E'' t'−α : &,n −' = t $,?#<&D =
X
" #,> Geempla4ando en la fórmula0 #,> H ','';$,&D #,> H $,D''
:2;;<
≤
µ
≤
≤
µ
≤
≤ µ ≤
=
S n
=
', &
= $,&D
(Fuscar tabla)
#,> I ','';$,&D
#,> I $,D''
=2>99
Interpretaci!n# El tiempo medio de empleo de todos los empleados del sector se estima en D,? a #, años, con una confian4a del ?$@.
Soluci!n#4, +i el maren de error ubiera sido de ' año Aqué rado de confian4a se tendríaB z'−α : & ; S X
Error de estimación0 e " z '−α : & ;
s n
'" z '−α : &
⇒
z '−α : & ;
', &
'"
= D,'E (Fuscando en la tabla estadística)
'−
α
&
= $,?????
⇒ α = $,$$$$& ' − α = $, ????K
Jor lo tanto el rado de confian4a es0
Soluci!n# c, ACué tamaño muestral es necesario si se quisiera el maren de error del apartado primero el rado de confian4a del apartado seundoB 2amaño de muestra con maren de error de $,D'' /rado de confian4a $,????K 3"2amaño de población de empleados desconocido de la entidad
Entonces la formula que le corresponde es0
Z & α ; S & n
=
'−
=
&
e&
n = 'D&,L
D, $? & ;', & & $, D''&
≈ 'D>
E8e%plo ?# El nmero de oras diarias que los empleados de cierta entidad bancaria de ámbito nacional traba!an delante del ordenador es una variable aleatoria normal con varian4a ',#. +e toma una muestra al a4ar de '$ empleados - se anota el nmero de oras que cierto día traba!aron con el ordenador0 L >,D #,L L,> L,D #,> #,D # #,& #,# a) %etermina el intervalo de confian4a al ?#@ para el nmero medio de oras diarias que se traba!a en el ordenador en esa entidad. Explica claramente el resultado comentando que sinifica el ?#@ de confian4a. b) ACué tamaño muestral es necesario si se quisiera el maren de error del apartado primero - el rado de confian4a de ?$@B
Soluci!n#a, Datos# 70 3mero de oras diarias variable 3ormal σ
⇒
&
σ
Marian4a poblacion 0 " ',# conocido %esviación estándar " ',& 2amaño de muestra 0 n " '$ empleados 3mero promedio de oras diarias se alla a partir de los valores numéricos reistrados de '$
∑ x
i
X =
los '$ empleados
0
onfian4a
0
'='
n
=
' − α
L + >, D + #, L + ... + #, # '$
" #,D' oras
⇒ α " $,?#
" $,$#
En base a los datos corresponde al CASO I, cu-o intervalo es0 X
− Z'−
α
:&
; σ X
≤µ≤
Z'−α : &
X
" #,D'
#,D' H ',?L;$,>K
X
+ Z '−
α : &
; σ X
σ X
= Z $,?E# = ',?L$
≤ µ ≤
(Fuscar tabla)
#,D' I ',?L;$,>K
=
σ
n
=
', & '$
= $,>KE
#,D' H $,#?
≤ µ ≤
#,D' I $,#?
≤ ≤ :2@=9 @29@< Interpretaci!n# El µ
nmero medio de oras diarias que traba!an delante del ordenador todos los empleados de cierta entidad bancaria se estima en D,L a L,&oras, con una confian4a del ?#@< el cual sinifica que de '$$ muestras de empleados seleccionados de toda la entidad bancaria, ?# de ellas estiman dico parámetro.
Soluci!n#4, Datos# Naren de error
0 e " $,#? σ
Marian4a poblacional
' − α
0
&
" ',#
⇒
α
onfian4a 0 " $,?$ " $,'$ 2amaño de la población 0 3 desconocido En base a los datos corresponde utili4ar la formula0 Z
&
'−
n
=
&
α
; σ
&
e
&
&
=
Z $,?#
;', #
$, E#?
&
=
', LD#& ;', # $, E#?
&
n = E, $# ≈ E
E8ercicios &ropuestos E8ercicio 9# *a duración aleatoria de las unidades producidas de un artículo, se distribu-e sen la le- normal, con desviación típica iual a seis minutos. Eleidas al a4ar cien unidades, resulto ser la duración media de 'D,># minutos. Elaborar el intervalo de confian4a del ??@ para la duración media de las unidades producidas.
E8ercicio ?# +e anali4an ? 4umos de fruta - se a obtenido un contenido medio de fruta de && m por '$$ cc de 4umo. *a varian4a poblacional es desconocida, por lo que se a calculado la cuasi desviación típica de la muestra que a resultado ser L,> m de fruta por cada '$$ cc de 4umo. +uponiendo que el contenido de fruta del 4umo es normal, estimar el contenido medio de fruta de los 4umos tanto puntualmente como por intervalos al ?#@ de confian4a.
E8ercicio 3# +e desea estimar el nmero medio de libros que los estudiantes de cierta titulación adquieren en el ltimo curso de sus estudios. +uponiendo conocida la dispersión (varian4a iual a >L) - siendo 3ormal el comportamiento de la variable,
a, Aqué tamaño muestral ace falta para alcan4ar un rado de confian4a del ?#@ un maren de error no superior a & unidadesB 4, Auál sería el tamaño muestral si queremos reducir el intervalo a la mitad sin perder fiabilidadB
E8ercicio :# Cueremos a!ustar una máquina de refrescos de modo que el promedio del líquido dispensado quede dentro de cierto rano. *a cantidad de líquido vertido por la máquina siue una distribución normal con desviación estándar $.'# decilitros. %eseamos que el valor estimado que se va-a a obtener comparado con el verdadero no sea superior a $.& decilitros con una confian4a del ?#@. A%e qué tamaño debemos escoer la muestraB
E8ercicio =#
Es necesario estimar entre '$$$$ establos, el nmero de vacas leceras por establo con un error de estimación de D - un nivel de confian4a del ?#@.+abemos que la varian4a es '$$$. Auántos establos deben visitarse para satisfacer estos requerimientosB
Inter*alo e Confian"a para la *arian"a La varianza como medida de dispersión es importante dado que nos ofrece una mejor visión de dispersión de datos. Nuevamente consideramos que la población sigue una distribución de probabilidad normal. Otro campo del conocimiento donde la varianza se ocupa en gran medida es en control de calidad; cuando un producto se elabora el área de control de calidad busca que los productos esté dentro de ciertos límites de tolerancia pero también que la variabilidad de un producto sea lo menor posible. &
σ
El Intervalo de confianza para la varianza poblacional ( ( n − ') s & & χ'−α : &
on un nivel de confian4a del
E8e%plo 9#
' − α
≤ σ ≤ &
) es:
( n − ') s & &
χ α : &
.
+e an recoido muestras de aire para estudiar su contaminación, obteniéndose las siuientes cantidades de impure4as en :m> &.&< '.K< >.'< &.$< &.D< &.$< &.'< '.& onstruir un intervalo de confian4a al ?K@ para la desviación estándar de impure4as contenidas en el aire.
Soluci!n# Datos# alculando la cantidad media de impure4as a partir de los valores numéricos '$
∑ x
i
X =
reistrados en las K muestras de aire
'='
n
=
&,& + ',K + >,'+ ... + ',& K
= &,'
0
alculando la varian4a muestral obtenido de los valore numéricos 0 n
&
S
=
∑ ( X i ='
i
− X ) &
n −'
&
=
&
( &, & − &,') + ( ',K − &,' ) + ... + (', & − &,' )
&
K −'
S &
" $,&KK onfian4a Entonces el intervalo es0 ( n − ') s & &
χ'−α : &
&, $'L 'K, DE#
≤σ ≤
≤ σ & ≤
&or lo tanto#
&
0
' − α
( n − ') s & &
χα : &
" $,?K
=
⇒
α
" $,$&
( K − ') ; $, &KK &
χ $,??
≤ σ & ≤
( K − ') ; $, &KK &
χ $,$'
&,$'L ', &>?
⇒
$,'$? ≤ σ &
≤ ', L&E
$, >>$ ≤ σ ≤ ', &E#
Interpretaci!n# *a variabilidad de impure4as con respecto a su media que contiene el m
aire se estima en $,'$? a ',L& .:
>
, con una confian4a del ?K@.
E8ercicios &ropuestos E8ercicio 9# +e sabe por experiencia que el tiempo que tarda el servicio de ca!a de una empresa prestadora del servicio de aua de una reión para atender a los clientes que llean a efectuar el pao mensual del servicio se distribu-e normalmente. +e pide estimar el intervalo de confian4a para la desviación estándar poblacional del
tiempo requerido para atender los paos que efectan los clientes, con un nivel de confian4a del ?#@, si para el efecto se tomó una muestra aleatoria de clientes que arro!ó una desviación estándar de '.K minutos.
E8ercicio ?# El tiempo que transcurre para los obreros de una ran compañía entre el momento del inreso a la planta - el momento en que están listos para recibir las orientaciones de su !efe inmediato, se distribu-e normalmente. =na muestra de &$ obreros arro!a una desviación estándar de >.# minutos. +e pide calcular el intervalo de confian4a del ??@ para la desviación estándar del tiempo transcurrido para todos los obreros de la compañía.
Inter*alo e Confian"a para la iferencia e %eias +
µ'
− µ &
,
+uponamos que se tiene dos poblaciones distribuidas normalmente con medias µ '
µ &
desconocidas , respectivamente. +e puede aplicar una prueba " o t de +tudent para comparar las medias de dicas poblaciones basándonos en dos muestras independientes n' X ' tomadas de ellas. *a primera muestra es de tamaño , con media - la seunda muestra X & n& es de tamaño , tiene media . %onde las varian4as poblacionales pueden ser conocidas & & & & & & σ ' σ & σ ' s' σ & s& ( ) o desconocidas ( ). O O
Caso I# Nuestras independientes, Marian4as poblacionales conocidas &
+
&
σ '
σ &
-
,
El inter*alo e confian"a es#
( X ' − X & ) − Z'−
α
σ X − X ' &
%onde0
=
:&
&
σ'
n'
; σ X − X ' &
+
&
σ &
n&
≤ µ' − µ& ≤ ( X ' − X & ) + Z '−
α : &
;σ X − X ' &
Caso IIA#
3ormal1Nuestras independientes, Marian4as poblacionales &
σ'
= σ &&
desconocidas pero iuales (
)
El inter*alo e confian"a es#
( X ' − X & ) − t'−
α
v
: &< v
≤ µ' − µ & ≤ ( X ' − X & ) + t'−
α : &< v
; S X − X ' &
= n' + n& − &
%onde0
S X' − X &
; S X − X ' &
es el rado de libertad.
( n' − ') ; s'& + ( n& − ') ; s&& '
=
n' + n&
Caso II-#
' + n n÷ ' &
−&
3ormal1Nuestras independientes, Marian4as poblacionales &
σ'
desconocidas - diferentes (
≠ σ && )
El inter*alo e confian"a es#
( X − X ) − t − '
&
' α : &
; S X − X '
&
≤ µ' − µ & ≤ ( X' − X & ) + t'−
α : &
; S X − X '
&
%onde0 &
S'& + S && n' n&÷ ν = −& & & & & S' S & n'÷ n÷& + n' + ' n& + ' Es el rado de libertad, que toma un valor numérico redondeado entero.
S X' − X &
=
s'& n'
+
s&& n&
E8e%plo 9# En el departamento de control de calidad de una empresa, se quiere determinar si a abido un descenso sinificativo de la calidad de su producto entre las producciones de dos semanas consecutivas a consecuencia de un incidente ocurrido durante el fin de semana. %eciden tomar una muestra de la producción de cada semana, si la calidad de cada artículo se mide en una escala de '$$, obtienen los resultados siuientes0 +emana '0 ?> KL ?$ ?$ ?D ?' ?& ?L +emana &0 ?> K ? ?$ KK K KD ?> onstru-e un intervalo de confian4a para la diferencia de medias al nivel de ?#@.Pnterpreta los resultados obtenidos.
Soluci!n# +uponiendo normalidad las producciones de las dos semanas ada semana son muestras independientes &
&
σ ' σ &
Marian4as poblacionales desconocidas ( Qora
,
)
C!%o sa4er si las *arian"as son iBuales o iferentes +e reali4a la prueba de omoeneidad de varian4as, que consiste en lo siuiente0
For%ular las ip!tesis Ripótesis nula Ripótesis alterna
H $ 0 σ '&
= σ &&
H ' 0 σ '&
≠ σ &&
# #
Fi8ar ni*el e siBnificancia = $,$#
α
Estaístico e prue4a máx ( s'& , s&& ) F = mín ( s'& , s&& )
Se%ana 9# alculo de la media '$
∑ x
?> + KL + ?$ + ... + ?L
i
X '
=
=
'='
n
= ?',#$
K
X ' = ?',#$
⇒
alculo de la varian4a n
& '
S
=
∑ ( X
i
− X ) &
&
=
i ='
n −'
&
( ?> − ?', #$ ) + ( KL − ?', #$ ) + ... + ( ?L − ?', #$ )
&
K −'
⇒
S '& = ?,'D>
⇒
S & = 'E,K>?
Se%ana ?# alculo de la media '$
∑ x
i
X &
=
=
'='
n
?> + KE + ?E + ... + ?> K
= K?,KK
K?,KK X & =
⇒
alculo de la varian4a n
S &
&
=
∑ ( X i ='
i
− X )&
&
=
n −'
&
( ?> − K?, KK ) + ( KE − K?, KK ) + ... + ( ?> − K?, KK ) K −'
Ree%pla"ano en el estaístico e prue4a F c
=
s&& & '
s
= 'E,K>? = ', ?#' ?,'D>
ReBiones críticas
&
&
52?55
:2<<
SG:1111111111111111111Sona111111111111111111 11111111Sona111111111 Qceptación Geca4o
*a 4ona de aceptación para un nivel de sinificación del #@ está delimitada por $,&$$ D,??$, correspondientes a las probabilidades α:& - (' 1 α:&) respectivamente.
Decisi!n omo
F c
" ',?#' se ubica en la 4ona de aceptación cu-o intervalo es ($,&$$< D,??) se H $
acepta
& & 0 σ' " σ&
*ueo se conclu-e que no a- diferencias entre las varian4as poblacionales, lo que indica el cumplimiento del supuesto de omoeneidad de varian4as
Entonces el inter*alo e confian"a para la iferencia e %eias es el CASO IIA#
( X ' − X & ) − t'−
α
: &< v
; S X − X ' &
≤ µ' − µ & ≤ ( X ' − X & ) + t'−
α : &< v
X ' − X &
%iferencia de medias muestrales oeficiente de confian4a
0
' − α
0
t'−α : &
⇒
" $,?#
v /rados de libertad
" ?',#$ H K?,KK " ',L&
=
0
" K I K H & " 'D
= t $,?E#<'D
( K − ') ;?,'D> + ( K − ') ;'E,K>? ' ' K+K−&
" $,$#
= n' + n& − &
" &,'D#
S X' − X &
α
K + K÷
; S X − X ' &
S X ' − X &
',K>L#
Geempla4ando en la formula del intervalo se tiene0
≤ µ' − µ & ≤ ',L& H &,'D#;',K>L#
$?239<
≤ µ' − µ & ≤
',L& I &,'D#;',K>L#
=2==<
Interpretaci!n# *a diferencia promedio de producciones de artículos en las dos semanas se estima entre 1&,>'? a #,##?, con una confian4a del ?#@. Esto sinifica que la producción promedio de artículos entre las dos semanas es iual.
E8ercicios &ropuestos E8ercicio 9# =n profesor de estadística reali4a un idéntico cuestionario a dos rupos de estudiantes de dos universidades diferentes de la misma ciudad. En una muestra aleatoria de ? estudiantes de la universidad Q, el promedio de notas fue de .# desviación estándar de $.D. En otra muestra aleatoria de ? estudiantes de la universidad F la media de las notas fue de L. - desviación estándar de $.L. alcular los límites de confian4a del ?#@ para la diferencia de medias de las notas entre las dos universidades. +e sabe que la escala de calificación es de $ a '$.
E8ercicio ?# +e quiere estimar la diferencia de los promedios de los salarios entre la industria metalmecánica - la industria de los muebles en una ciudad. Jara tal fin se toma una muestra aleatoria de &$$ operarios en la primera industria la cual arro!a un salario promedio de T#>#$$$ mensuales - desviación estándar de T'&K$$$, mientras que una muestra de '&$ operarios en la seunda industria arro!a un salario promedio de TD?&$$$ - desviación estándar de T#$$$. +e pide estimar el intervalo de confian4a para la diferencia de salarios entre las dos industrias con un nivel de confian4a del ?$@.
E8ercicio 3# En una compañía se quiere estimar la diferencia de los promedios de los rendimientos para producir cierta pie4a por parte de los obreros en dos turnos diferentes. Jara tal fin el Uefe de producción de la empresa toma muestras de >& obreros para el turno ' - encuentra que la media en la misma es de &$ minutos mientras que la desviación estándar es de &.K minutos. Jor otra parte tomó una muestra de ># obreros del turno & - encuentra que la media de la misma es de && minutos mientras que la desviación estándar es de '.? minutos. +e pide calcular el intervalo de confian4a de la diferencia de las medias de los rendimientos en los dos turnos con un nivel de confian4a del ?K@.
E8ercicio :# Jara comparar el contenido promedio de aceites de las semillas de dos variedades de maní, se diseña un ensa-o en el que para cada variedad se obtienen los contenidos de aceite de '$ bolsas de ' V de semillas de maní, extraídas aleatoriamente de distintos productores de semillas. *os resultados del ensa-o son los siuientes0
Gariea
n
X
s &
' &
'$ '$
'L$,D 'L#,L
L#,> L,?
Distri4uci!n e la proporci!n %uestral Mamos a considerar que tenemos una población de modo que en cada una de ellas p estudiamos una v.a. dicotómica (Fernoulli) de parámetro respectivo . %e la población n
vamos a extraer una muestra de tamaño Entonces,
.
n
X
= ∑ xi → B ( n, p ) i ='
pW =
x n
- la proporción de éxito en la muestra es *ueo se cumple0 µ pW
= E ( pW ) =
p
a) &
σ pW
= V ( pW ) =
p(' − p) n
b) c) +i el tamaño muestral n es rande, el 2eorema entral del *ímite nos aseura que0 z =
pW − p pq
→ N ($,')
n
Nota# +Error est'nar o Error típico e la proporci!n %uestral,
σ pW
σ pW
S pW
S pW
= =
p - q conocidos 2amaño de población (3) demasiado rande o infinita.
pq n
− n ÷ N − '
pq N n
=
WW pq n
=
WW pq n
p - q conocidos 2amaño de población (3) conocido o finita. p ≈ pW
q ≈ qW
p - q desconocidos, entonces 2amaño de población (3) demasiado rande o infinita. p ≅ pW
N − n ÷ N − '
q ≅ qW
p - q desconocidos, entonces 2amaño de población (3) conocida o finita.
Inter*alo e Confian"a para una &roporci!n En este caso, interesa construir un intervalo de confian4a para una proporción o un porcenta!e poblacional (por e!emplo, el porcenta!e de personas con ipertensión, fumadoras, etc.) %onde, p es el porcenta!e de personas u ob!etos con la característica de interés en la pW
población (o sea, es el parámetro de interés) -
es su estimador puntual muestral.
*ueo, procediendo en forma análoa al caso de la media, podemos construir un intervalo ' − α de confian4a para la proporción poblacional p, con una confian4a de .
W p
− Z'−
α
:&
; σ pW
≤
p
≤
W p
+ Z '−
α :
&
; σ pW
Done# pW =
x n
qW = ' − pW
E8e%plo 9#
=na compañía que fabrica pastelillo desea estimar la proporción de consumidores que prefieran su marca. *os aentes de la compañía observan a D#$
compradores, del nmero total observado >$$ compraron los pastelillos. alcule un intervalo de confian4a del ?#@ para la venta de la proporción de compradores que prefieren la marca de esta compañía.
Soluci!n# x0 3mero de consumidores que prefieren los pastelillos. n " D#$ tamaño de muestra rande x " >$$ son los que prefieren los pastelillos en la muestra x >$$ pW = = = $,LE n D#$ Es la proporción puntual muestral que prefieren los pastelillos qW = ' − pW = ' − $, LE = $, >> Es la proporción puntual muestral de los que no prefieren los pastelillos. α ' − α ⇒ oeficiente de confian4a " $,?# " $,$# Z'−α : & = Z $,?E# " ',?L W W $,LE;$,>> pq = = $,$&& σ pW = D#$ n Geempla4ando en el intervalo de confian4a se tiene0
W p
− Z '−
α
:&
; σ pW
≤
p
≤
W p
+ Z '−
α :
&
; σ pW
≤ p ≤
$,L H ',?L ; $,$&&
$,L I ',?L ; $,$&&
≤ p ≤
52@3
52>9
Interpretaci!n# *a proporción de pastelillos que prefieren la marca de la compañía por parte de los consumidores se estima entre $,L> a $,', con una confian4a del ?#@.
Ta%a6o e %uestra +e puede determinar que tan rande debe ser el tamaño de la muestra, n, de manera que si p pW se estima por , el error e esti%aci!n no sea ma-or que un valor dado e7 En efecto0
•
n=
Z'&−α : & ; pq e
•
&
•
•
Z'&−α : & ; pq ; N n= & Z'−α : & ; pq + e & ( N − ')
•
•
2amaño de población (3) demasiado rande o infinita. pW +i p - q son desconocidas, se estima por qW allados a partir de una muestra piloto. En ltimos de los casos si no se tiene ninuna información de p - q se asume el máximo rieso de p " $,# - q " $,#. 2amaño de población (3) conocida o finita pW +i p - q son desconocidas, se estima por qW allados a partir de una muestra piloto. En ltimos de los casos si no se tiene ninuna información de p - q se asume el máximo rieso de p " $,# - q " $,#.
E8ercicios &ropuestos E8ercicio 9# =na compañía quiere conocer la proporción de consumidores que
a)
c, ,
adquieren su producto. Encara a una empresa un estudio de mercado para obtener un intervalo de confian4a al ??@ de su proporción de clientes a partir de una muestra de tamaño '$$$. *os resultados muestral es arro!aron que D$ de los entrevistados eran clientes de su producto. E8ercicio ?# En un experimento para determinar la toxicidad de una sustancia se administra una dosis de esta a cada uno de >$$ cone!os, - se reistra el nmero de muertos, que resulta ser de '?&. alcule el estimador de p. 4, la probabilidad de que un cone!o eleido al a4ar muera a causa de una dosis de la sustancia. alcule la desviación estándar. onstru-a un intervalo de confian4a al ?K@.
Distri4uci!n e la iferencia e proporciones %uestrales
Mamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas p' p& estudiamos una v.a. dicotómica (Fernoulli) de parámetros respectivos . %e cada n' n& población vamos a extraer muestras de tamaño - . Entonces n x pW ' = ' X ' = x'i → B ( n' , p' ) n' i =' '
∑ n&
X &
= ∑ x&i → B ( n& , p& )
pW &
=
i ='
x& n&
*ueo se cumple0 µ pW − pW ' &
= E ( pW' − pW & ) =
p' − p &
a) &
σ pW − pW X' X&
= V ( pW' − pW & ) =
p'q' n'
+
p& q& n&
b) c) +i el tamaño muestral n es rande, el 2eorema entral del *ímite nos aseura que0 Z =
( pW' − pW & ) − ( p' − p& )
→
σ pW − pW ' &
3 ($,')
Inter*alo e Confian"a para la iferencia e os proporciones +i las muestras son suficientemente randes ocurre que una aproximación para un intervalo ' − α de confian4a al nivel para la diferencia de proporciones de dos poblaciones es0
p'
σ pW − pW ' &
=
−
p& W'qW' p n'
∈( +
W' p
−
W& ) p
± Z '−
α :
&
; σ pW' − pW &
W & q& p n&
%ónde0
E8e%plo 9# En un estudio sobre las relaciones prematrimoniales se encontró en la 4ona Q que, de &$$ personas, '&D estaban a favor - en la 4ona F, de &LL personas, '>> también lo
estaban. Estimar la diferencia de proporciones de ambas 4onas al ?$@ de confian4a comentando el resultado.
Soluci!n# Hona A x'
# 3mero de personas que están a favor de las relaciones prematrimoniales x'
" '&D n'
" &$$ '&D x pW' = ' = n' &$$
qW'
pW'
⇒
= ' − pW'
" $,L&
" $,>K
Hona x&
# 3mero de personas que están a favor de las relaciones prematrimoniales x&
" '>> n&
" &LL x '>> pW & = & = n& &LL
pW &
⇒
qW&
= ' − pW &
" $,#$ ' − α
⇒
α
" $,?$ Z'−α : &
" $,#$
" $,'$
= Z $,?# " ',LD#
σ pW − pW ' &
=
W'qW' p
n'
+
W & q& p
n&
=
$, L& ; $, >K &$$
+ $, #$ ; $, #$ &LL
=
σ pW − pW $,$DL '
&
Ree%pla"ano en la for%ula se tiene# W' − p W & ) ± Z '−α : & ; σ pW' − pW & p' − p & ∈ ( p
≤ p' − p& ≤ ($,L& H $,#$) H ',LD# ; $,$DL
525::
≤ p' − p& ≤
($,L& H $,#$) I ',LD# ; $,$DL
529<@
Interpretaci!n#
*a diferencia de proporciones de personas que están a favor de las relaciones prematrimoniales en las dos 4onas se estima entre $,$DD a $,'?L, con una confian4a del ?$@. Esto sinifica que la proporción de personas de la 4ona Q son las que están ma-ormente a favor de las relaciones prematrimoniales respecto a la 4ona F.
E8ercicios &ropuestos E8ercicio 9# +e está considerando cambiar el procedimiento de manufactura de partes. +e toman muestras del procedimiento actual así como del nuevo para determinar si este ltimo resulta me!or. +i # de '$$$ artículos del procedimiento actual presentaron defectos - lo mismo sucedió con K$ de $$ partes del nuevo, determine un intervalo de confian4a del ?$ @ para la verdadera diferencia de proporciones de partes defectuosas. E8ercicio ?# =n productor decide cultivar dos variedades de tomate, valencia perita. %e la variedad valencia planta &>$ semillas - de la variedad perita planta >#K. *ueo de tres semanas de cultivadas ambas variedades el productor recorre el campo - reistra que cantidad de semillas emerieron para cada variedad. *os resultados son los siuientes0
Gariea
Culti*aas
E%erBieron
Malenciano &>$ '&L Jerita >#K &?> a). Cue modelo teórico de probabilidad considera apropiado si la variable aleatoria es Ynumero de plantas que emerieron de una variedad en el total que se cultivo de la mismaYB Auales son los parámetros para cada una de las variedadesB b). Estime para cada variable la proporción de emerencia. c). onstru-a un intervalo de confian4a al ?# @ para la probabilidad de emerencia de las plantas de cada variedad e interprete en términos del problema d). Cue supuesto fue necesario para que el intervalo anterior sea validoB e). +i comparamos ambas variedades con el tomate americano que tiene una probabilidad de emerencia de $.L#, .que puede decir viendo los intervalos de confian4aB f). +i el productor quiere saber si el tomate valenciano tiene la misma probabilidad de emerencia que el tomate americano. Aual es el procedimiento a seuirB Explíquelo - conclu-a con el mismo.
Inferencia 4asaa en prue4as e ip!tesis para una os %uestras (ip!tesis Estaística es una afirmación, con!etura que se ace acerca de un parámetro poblacional. Tipos de Hipótesis Hipótesis nula, es l a afirmación que está establecida - que se espera sea reca4ada después de aplicar una prue4a estaística - se representa por Ho. Hipótesis alterna, es la afirmación que se espera sea aceptada después de aplicar una H ' prue4a estaística - se representa por .
Ni*el e siBnificaci!n2 representada por
α
, es la probabilidad de cometer error tipo I , por lo eneral se asume que tiene un valor de $,$# ó $,$'.
&rue4a estaística o Estaístico e prue4a2 es una fórmula, basada en la distribución del estimador puntual del parámetro que aparece en la ipótesis - que va a permitir tomar una decisión acerca de aceptar o reca4ar una ipótesis nula.
Contraste de Hipótesis para la media “µ !ormas de contraste de las
ip!tesis#
%epende del planteamiento de la ipótesis alterna
&rue4a 4ilateral
H $ 0 µ
= µ $
H ' 0 µ ≠ µ $
&rue4a unilateral superior
H $ 0 µ
= µ $
H ' 0 µ > µ $ α
!i"ar nivel de si#nificancia:
" $,$#< $,$' etc.
$eleccionar el estad%stico de prueba:
Caso I# 78 3 (µ, 9), 9 conocida
&rue4a unilateral inferior
H $ 0 µ
= µ $
H ' 0 µ > µ $
El estadístico de prueba es0
Z
=
X − µ σ X
→ N ($,')
Jrueba S1 3ormal estándar para una muestra. =sualmente la varian4a es desconocida
Caso II# 78 3 (µ, 9), 9 desconocida El estadístico de prueba es0
T
=
X
− µ
s X
→ t n −'
Jrueba 21 +tudent para una muestra con n 1 ' rados de libertad (l.) &e#iones Cr%ticas: %epende de las formas de contraste de las ipótesis.
ontraste Filateral
11 SG11 :1111111111111SQ11111111111111:11SG11
ontraste unilateral superior ontraste unilateral inferior
1111111111111111SQ111111111111111:1111SG1111
1111SG11111:1111111111111SQ1111111111111111
'ecisión:
Zorma 2abular +i el valor numérico del estadístico de prueba se ubica en la Sona de Qceptación (SQ) se H $ acepta la Ripótesis nula . +i el valor numérico del estadístico de prueba se ubica en la Sona de Geca4o (SG) se H $ reca4a la Ripótesis nula . Zorma Nétodo 5p6
α
+i el valor numérico de 5p6 es superior que el nivel de sinificancia fi!ado 5 6 se acepta H $ la Ripótesis nula . α
+i el valor numérico de 5p6 es inferior que el nivel de sinificancia fi!ado 5 H $ la Ripótesis nula .
6 se reca4a
E8e%plo 97
=n fabricante de lámparas eléctricas está ensa-ando un nuevo método de producción que se considerará aceptable si las lámparas obtenidas por este método dan luar a una población normal de duración media &D$$ oras, con una desviación típica iual a >$$. +e toma una muestra de '$$ lámparas producidas por este método - esta muestra tiene una duración media de &>&$ oras. A+e puede aceptar la ipótesis de valide4 del nuevo proceso de fabricación con un rieso iual o menor al #@B
Soluci!n# For%ulaci!n e (ip!tesis H o 0 µ = &D$$
H ' 0 µ ≠ &D$$
Ni*el e siBnificancia
= $,$#
α
Estaístico e &rue4a Caso I# 7 8 3 (µ, 9), 9 " >$$ conocida
Z =
X
− µ
σ X
=
X − µ σ
n *a población 3 de la producción de lámparas es desconocida, así que puede ser que sea demasiado rande.
Z =
X − µ σ
n
=
&>&$ − &D$$ >$$ '$$
Z = − &,LE
ReBiones críticas
11 SG11 :1111111111111111SQ111111111111111:111SG11
− Z $,?E#
Z $,?E#
1',?L
',?L
Decisi!n En vista que el valor del estadístico de prueba (S " 1&,L) es inferior que el valor tabular ( Z t H $ " 1',?L) ubicándose en la 4ona de reca4o, entonces se reca4a la ipótesis nula . Esto sinifica que el nuevo proceso de fabricación no es aceptable.
E8e%plo ?7 =n fabricante de aparatos de 2M afirma que se necesita a lo sumo $ microamperes de corriente para alcan4ar cierto rado de brillante4 con un tipo de televisor en particular. =na muestra de &$ aparatos de 2M produce un promedio muestral de corriente de ,> microemperes. %enotemos por m el verdadero promedio de corriente necesaria para alcan4ar la brillante4 deseada con aparatos de este tipo, - suponamos que m es la media de una población con s " '#. Jruebe al nivel de sinificación del &,#@ la ipótesis nula de que m es a lo sumo $ microamperes.
Soluci!n# For%ulaci!n e (ip!tesis H $ 0 µ ≤ $
H ' 0 µ > $
Ni*el e siBnificancia
= $,$
α
Estaístico e &rue4a σ
≈
s
Caso II# 7 8 3 (µ, 9), T
X =
− µ
s X
=
" '# desconocida
X − µ s n
T =
, > − $ '# &$
T = &,'EL
ReBiones críticas
1111111111111111SQ111111111111111:11111SG11111
t $,?E#<'? &,$?>
Decisi!n
T = &,'EL
%ado que el valor del estadístico de prueba (
, es superior que el valor tabular H $
(t " &,$?>) , entonces se ubica en la 4ona de reca4o, reca4ando la ipótesis nula demuestra que no se necesita a lo sumo $ micro amperes, en forma sinificativa.
. Esto
E8ercicios &ropuestos E8ercicio 9# *a tasa actual para producir fusibles de # amp en 3ear- Electric o. Es $ por ora. +e compró e instaló una máquina nueva que, sen el proveedor, aumentará la tasa de producción. =na muestra de &$ oras seleccionadas al a4ar el mes pasado indica que la producción media por ora en la nueva máquina es L, con desviación estándar de L por α = $,$# ora. on de nivel de sinificancia, AJuede 3ear- Electric concluir que la nueva máquina es más rápidaB E8ercicio ?# =n fabricante de lámparas eléctricas sostiene que la duración media de las mismas (oras) es en promedio superior a '>$$ . +e toma una muestra de ' lámparas siendo el resultado de la inspección el siuiente0 ?K$ ' >#$ ' $&$ ' 'D$ ' #&$ ' >?$ ' &$# ' 'K$ ?$ ' D&$ ' K#$ ' >$$ ' >$# ' $D$ ' $#$ ' #&$ ' >&$ Merificar el Ro del fabricante con un coeficiente de rieso del #@ (suponiendo la distribución normal).
E8ercicio 3# =na empresa desea concursar para anar un contrato con el obierno como proveedor de concreto< uno de los requisitos es la resistencia a la compresión del concreto a los &K días de aberse preparado la me4cla. *a empresa anadora dice que mantiene excelentes controles de calidad en su concreto - como tal a- una varian4a mu- ba!a en K f & cm D resistencias a la compresión, del orden de 'L
:
< pero al acerle en la =3QN unas & K f cm D
pruebas de resistencia se detecta una varian4a mas elevada de : a) Aa- evidencia estadística suficiente para considerar que el proveedor está mintiendo K f & cm D en realidad la desviación estándar es %PZEGE32E a 'L : B b) Gedacción de la prueba de ipótesis, indicando si debe ser prueba de una o dos colas para responder la preunta. E8ercicio :# =n vendedor de neumáticos dice que la vida media de sus neumáticos es de &K$$$ m. Qdmitiendo para la desviación típica el valor '>DK m. diseñar un test de ipótesis al ??@ de confian4a, basado en muestras de D$ elementos que permita contrastar la ipótesis nula de ser [ " &K$$$m usando como ipótesis alternativa [ \ &K$$$m E8ercicio =# +e pretende diseñar una prueba de ipótesis con una muestra de D automóviles para comprobar su capacidad de frenado. Jara ello se medirá en todos ellos la distancia de frenado si el automóvil parte de una velocidad inicial de '$$ m:. +e quiere saber si, tras un frena4o brusco, la distancia media recorrida antes de pararse es de ''$ metros. +e supone que la distancia de frenado siue una distribución normal con desviación típica conocida 9 " > m. +uponamos aora que emos reali4ado efectivamente la prueba a los D automóviles - emos obtenido las siuientes distancias de frenado. ?K '$& '$# ''> '&> '&L %istancias '# '$ '& K 'L '> !otal 3um. de autos "# A+e acepta la ipótesis de que la distancia media de frenado es de ''$ m, con un nivel de sinificación ] " $.$#B E8ercicio @# =n fabricante aseura que sus fusibles, con una sobrecara del &$@, se fundirán por promedio al cabo de '&.D$ min. =na muestra de &$ fusibles se sobrecara un &$@, obteniéndose una media de '$.L> - una cuasi desviación de &.DK min. Aonfirma la muestra la afirmación del fabricante para el promedioB
&rue4a e ip!tesis para la *arian"a La varianza como medida de dispersión es importante dado que nos ofrece una mejor visión de dispersión de datos. Nuevamente
consideramos que la población sigue una distribución de probabilidad normal. !ormulación de las
ip!tesis
%epende del planteamiento de la ipótesis alterna
&rue4a 4ilateral H $ 0 σ
&
=
H ' 0 σ &
&rue4a unilateral ereco
& σ $
H $ 0 σ
≠ σ $&
&
H ' 0 σ &
=
&rue4a unilateral inferior
& σ $
H $ 0 σ &
= σ $&
> σ $&
H ' 0 σ &
< σ $&
α
!i"ar nivel de si#nificancia:
" $,$#< $,$' etc.
Estad%stico de prueba:
+i 7 8 3 (µ, 9), 9 conocida El estadístico de prueba es0
χ
&
=
(n − ') s & σ
&
&
χ
Jrueba i cuadrado (
) para una muestra con n1' rados de libertad (l.)
ReBiones críticas %epende de las formas de contraste de las ipótesis. ontraste Filateral
111SG11:1111111111SQ111111111:11111111SG1111111111
'ecisión:
ontraste unilateral inferior
1111SG11:1111111111111111111SQ1111111111111111111111
ontraste unilateral superior
111111111111111111SQ111111111:1111111111SG1111111111
Zorma 2abular +i el valor numérico del estadístico de prueba se ubica en la Sona de Qceptación (SQ) se H $ acepta la Ripótesis nula . +i el valor numérico del estadístico de prueba se ubica en la Sona de Geca4o (SG) se H $ reca4a la Ripótesis nula .
E8e%plo 1$ %n negocio debe pagar &oras e'tra dada la demanda incierta de su producto por lo cual en promedio se pagan () &oras e'tra a la semana; el gerente de recursos &umanos considera que siempre se &a tenido una varianza de *( en las &oras e'tras demandadas. +i se toma una muestra de ,- semanas se obtiene una varianza muestral de *,. /etermine con alfa 0 ),) si la varianza poblacional de las &oras e'tras demandadas a la semana puede considerarse igual a *(.
Solución: Formulación de hipótesis H $ 0 σ &
=
H ' 0 σ &
≠
Nivel de signifcancia
= $,'$
α
Estadístico de prueba & χ $
=
( n − ') s & &
σ
&
χ $
9@2;@ ReBiones críticas
=
('L − ') ; &K,'
1111SG1111:111111111111111SQ111111111111:1111111111111SG1111111111111 &
&
χ $,$#<'#
χ $,?#<'#
>2?@9
?:2<<@
Decisi!n omo que el valor del estadístico de prueba se ubica entre los valores tabulares (,&L' &
χ $
" 'L,KL
≤
≤
&D,??L), es decir dentro de la 4ona de aceptación, entonces se acepta la H $ ipótesis nula . Efectivamente se puede concluir con una confian4a del ?$@ que la
varianza poblacional de las &oras e'tras demandadas a la semana es igual a *(.
E8ercicios propuestos E8ercicio '0 =n supervisor de control de calidad en una enlatadora sabe que la cantidad exacta en cada lata varía, pues a- ciertos factores imposibles de controlar que afectan a la cantidad de llenado. El llenado medio por lata es importante, pero iualmente importante es σ
&
σ
&
la variación de la cantidad de llenado. +i es rande, alunas latas contendrán mu poco, - otras, demasiado. Q fin de estimar la variación del llenado en la enlatadora, el supervisor escoe al a4ar '$ latas - pesa el contenido de cada una, obteniendo el siuiente pesa!e (en on4as)0 ,?L ,?$ ,?K K,$' ,? ,?L K,$> K,$& K,$D K,$& +upona que las aencias reuladoras especifican que la desviación estándar de la cantidad de llenado debe ser menor que $,' on4as. AEsta información proporciona pruebas suficientes de que la desviación estándar de las mediciones de llenado es menor que $,' on4as si el nivel de sinificación queda fi!ado en un #@B E8ercicio ?# +e supone que los diámetros de cierta marca de válvulas están distribuidos p! l "#"s & normalmente con una varian4a poblacional de $,& , pero se cree que ltimamente a aumentado. +e toma una muestra aleatoria de válvulas a las que se les mide su diámetro, obteniéndose los siuientes resultados en puladas0 #,# #,D #,D #,L #,K #,D #,# #,D #,L #, on ésta información pruebe si lo que se cree es cierto.
&rue4a e (ip!tesis para la iferencia e %eias +
µ' − µ &
,
+uponamos que se tiene dos poblaciones distribuidas normalmente con medias µ &
µ '
desconocidas , respectivamente. +e puede aplicar una prueba " o t de +tudent para comparar las medias de dicas poblaciones basándonos en dos muestras independientes n' X ' tomadas de ellas. *a primera muestra es de tamaño , con media - la seunda muestra X & n& es de tamaño , tiene media . %onde las varian4as poblacionales pueden ser conocidas & & & s' s&& σ ' σ & ( ) o desconocidas ( - ). !ormulación de las
ip!tesis para %uestras inepenientes
%epende del planteamiento de la ipótesis alterna
&rue4a 4ilateral
&rue4a unilateral superior
&rue4a unilateral inferior
H $ 0 µ'
= µ &
H $ 0 µ'
= µ &
H $ 0 µ'
H ' 0 µ'
≠ µ &
H ' 0 µ'
> µ &
H '
Fi8ar el ni*el e siBnificancia#
0 µ'
= µ & <
µ &
α
" $,$#< $,$' etc.
Estaístico e prue4a
Caso I# .uestras inepenientes2 Garian"as po4lacionales conocias + El estadístico de prueba es0 Z =
( X ' − X & ) − (µ' − µ & ) σ X − X ' &
σ X − X ' &
%onde0
=
→ N ($,') &
σ'
n'
+
&
σ &
n&
& σ '
& σ &
,
Caso IIA# Nor%al$.uestras inepenientes2 Garian"as po4lacionales iBuales + & & σ ' = σ & , esconocias El estadístico de prueba es0 T =
( X ' − X & ) − ( µ' − µ & )
S X
v
'
→
− X &
= n' + n& − &
%onde0
S X ' − X &
t n' + n& − &
es el rado de libertad.
=
( n' − ') ; s'& + ( n& − ') ; s&& ' n' + n&
' + n n÷ ' &
−&
Caso II-# Nor%al$.uestras inepenientes2 Garian"as po4lacionales iferentes + & & σ ' ≠ σ & , esconocias El estadístico de prueba es0 T =
( X ' − X & ) − ( µ' − µ & )
S X
'
→
− X &
t v
%onde0
S X' − X &
=
s'& n'
+
s&& n&
&
S'& + S && n' n&÷ −& ν = & & & & S' S & n'÷ n÷& + n' + ' n& + ' Es el rado de libertad, que toma un valor numérico redondeado entero. =sualmente las varian4as son desconocidas
ReBiones críticas ontraste Filateral
11 SG11 :1111111111111SQ11111111111111:11SG11
ontraste unilateral superior ontraste unilateral inferior
1111111111111111SQ111111111111111:1111SG1111
1111SG11111:1111111111111SQ1111111111111111
'ecisión:
Zorma 2abular +i el valor numérico del estadístico de prueba se ubica en la Sona de Qceptación (SQ) se H $ acepta la Ripótesis nula . +i el valor numérico del estadístico de prueba se ubica en la Sona de Geca4o (SG) se H $ reca4a la Ripótesis nula . Zorma Nétodo 5p6 α
+i el valor numérico de 5p6 es superior que el nivel de sinificancia fi!ado 5 6 se acepta H $ la Ripótesis nula . α
+i el valor numérico de 5p6 es inferior que el nivel de sinificancia fi!ado 5 6 se reca4a H $ la Ripótesis nula . Jara comparar el contenido promedio de aceites de las semillas de dos
E8e%plo 9#
variedades de maní, se plantean las ipótesis R$0 µ'" µ& vs. R'0 µ' ≠ µ& +e diseña un ensa-o en el que para cada variedad se obtienen los contenidos de aceite de '$ bolsas de ' V de semillas de maní, extraídas aleatoriamente de distintos productores de α
semillas. =sar " $,$#. *os resultados del ensa-o son los siuientes0
Gariea
n
X
s &
' &
'$ '$
'L$,D 'L#,L
L#,> L,?
Soluci!n#
+en los datos corresponden al Q+^ PP0 Nuestras independientes, varian4as &
σ '
&
σ &
poblacionales desconocidas ( , ). Qora el problema es< AC!%o sa4er si las *arian"as son iBuales o iferentes +uponiendo normalidad para las observaciones de las muestras, se reali4a la prueba de omoeneidad de varian4as, que consiste en lo siuiente0
For%ulaci!n e ip!tesis H $ 0 σ'&
= σ &&
H ' 0 σ'&
≠ σ &&
*s7
Ni*el e siBnificancia α
" $,$#.
Estaístico e prue4a F =
F =
s'& s&&
=
L#,> LE,?
L#,> LE,?
= $,?L
ReBiones críticas Distribución F de Snedecor
0.0 0.248
1.5
3.0
4.03
4.5
6.0
1SG1:11111111111111111111111111SQ1111111111111111111111111:11111111111SG11111111111111
Decisi!n# *a reión de aceptación para un nivel de sinificación del #@ está delimitada por $,&DK D,$>, correspondientes a las probabilidades α:& - (' 1 α:&) respectivamente.
omo Z " $,?L está en el intervalo ($,&DK< D,$>), es decir en la 4ona de aceptación, se H $ & & acepta 0 σ' " σ& , lo cual sinifica el cumplimiento del supuesto de omoeneidad de varian4as.
Entonces aplicare%os CASO IIA# &rue4a T para la iferencia e %eias con &
σ'
= σ &&
*arian"as po4lacionales +
) esconocias
Zormulación de ipótesis R 0µ "µ $ ' &
vs.
R 0µ ≠µ ' ' &
3ivel de sinificancia α
" $,$#. Estadístico de prueba
T =
&
s p
=
T =
( X ' − X & ) − ( µ' − µ & ) ' ' + ÷ S p& n ' n& ( '$ −') ;L#,> + ( '$ −') ;LE,? '$ + '$ − &
( 'L$, D − 'L#, L ) − ( $ )
' + ' LL,L ÷ '$ '$
Geiones críticas
& p
S
= LL,L
= − ', D&
=
( n' − ') S'&
+ (n& − ') S&& n' + n& − &
Distribución T de Student
-4.0
-2.7
-2.101
-1.3
0.0
1.3
2.7
4.0
2.101
111111111SG1111111:111111111111111111111SQ1111111111111111111:11111111SG111111111
Decisi!n *a reión de aceptación para un nivel de sinificación del #@ está delimitada por 1&,'$' &,'$', correspondientes a los probabilidades α:& - (' 1 α:&) respectivamente - 'K rados de libertad omo 2 " 1',D& está en el intervalo (1&,'$'< &,'$'), es decir en la 4ona de aceptación, se acepta R$0 µ'" µ& Entonces se conclu-e que no a- diferencias entre el contenido promedio de aceites de las semillas de dos variedades de maní.
E8e%plo ?7 =n constructor está considerando dos luares alternativos para construir un centro comercial. omo los inresos de los oares de la comunidad son una consideración importante en ésta selección, desea probar que el inreso promedio de la primera comunidad excede al promedio de la seunda comunidad en cuando menos T',# diarios. on la información de un censo reali4ado el año anterior sabe que la desviación estándar del inreso diario de la primera comunidad es de T',K - la de la seunda es de T&,D Jara una muestra aleatoria de >$ oares de la primera comunidad, encuentra que el inreso diario promedio es de T>#,# - con una muestra de D$ oares de la seunda comunidad el inreso promedio diario es de T>D,L. Jruebe la ipótesis con un nivel de confian4a del ?# por ciento.
Soluci!n# Datos &ri%era co%unia
SeBuna co%unia
σ '
σ &
" T ',K n'
" >$ X ' " T >#,#
For%ulaci!n e ip!tesis H $ 0µ' − µ & ≥ ',#
" T &,D n&
" D$ X &
" T >D,L
H ' 0 µ' − µ &
< ',#
Ni*el e siBnificancia α
" $,$#
Estaístico e prue4a +en los datos corresponden al Q+^ P0 Nuestras independientes con varian4as poblacionales conocidas. Entonces0 Z =
( X ' − X & ) − ( µ' − µ& ) σ X − X ' &
=
( X ' − X & ) − (µ' − µ & ) &
σ'
n'
Z =
+
n&
(>#, # − >D, L) − ', # ',K& >$
Z
&
σ &
+
&, D& D$
$ 929<=
ReBiones críticas
1111SG11111:1111111111111SQ11111111111111111
z '−α $
$92@:=
Decisi!n *a reión de aceptación para un nivel de sinificación del #@ está delimitada por 1',LD# I
∞
, correspondientes a la probabilidad (' 1 α).
omo S " 1','?# está en el intervalo (1 R$
∞
<1',LD#), es decir en la 4ona de eca4o, se reca4a
Entonces se conclu-e que el inreso promedio de la primera comunidad no excede al promedio de la seunda comunidad en cuando menos T',# diarios, con un nivel de confian4a del ?#@.
E8ercicios propuestos E8ercicios '. =n investiador desea averiuar si una industria está contaminando el aua de un arro-o al cual evacua sus efluentes. Q tal fin toma muestras de aua en dos sitios0 ') auas arriba del establecimiento - &) auas aba!o del mismo. *os siuientes son valores de concentración de uno de los metales pesados encontrados en cada sitio. Aguas arriba K '$ L D K K L
L # '& '&
? ? # ?
D K L #
'' ? '&
# K K
'& L '$
K '& L
? K '$
K K L L
'$ D K
'& L #
# ? ?
L D K
? ''
Aguas abajo ? '& ? 'D '& '> '& '#
K '$ '$ ''
'# '$ '& ?
'& '> ?
'$ '& '& '&
'& '$
'& '# '> 'D
'$ '' '#
'D ? '$ '>
'& ? ? '#
'> '& 'D '$
'$ K '$
'& '# '$
? '& '>
'& '$ '&
Aree =d. que existen diferencias en la concentración de este metal pesado entre uno - otro sitioB Evale su respuesta para un ] " $,$& E8ercicio ?7 =n fabricante que usa dos líneas de producción ' - & i4o un liero a!uste a la línea & con la esperan4a de reducir tanto la variabilidad como la cantidad promedio de impure4as en la sustancia química. Nuestras aleatorias en cada línea arro!aron las siuientes mediciones0 *ínea n Jromedio Marian4a ' 'L >,& ',$D & 'L >,$ $,#' A*os datos aportan suficiente evidencia para concluir que la cantidad promedio de impure4as de la línea ' es menor que la línea &B E8ercicio 37 =na muestra de K$ alambres de acero producidos por la fábrica Q presenta una resistencia promedio a la ruptura de '.&>$ lbs. con una desviación estándar de '&$ lbs =na muestra de '$$ alambres de acero producidos por la fábrica F presenta una resistencia promedio a la ruptura de '.''$ lbs . con una desviación estándar de ?$ lbs .. on base en ésta información pruebe si la resistencia promedio a la rotura de los alambres de acero de la marca Q es sinificativamente ma-or que la de los alambres de acero de la marca F. Qsuma un nivel de confian4a del ?? por ciento. E8ercicio :7 El !efe de personal de una ran empresa afirma que la diferencia de los promedios de anti_edad entre los obreras - obreros de la compañía es de >.# años. El presidente de la compañía considera que ésta diferencia es superior. Jara comprobar dica situación, se toma una muestra aleatoria de D$ obreras cu-o promedio de anti_edad es de '&.D años con desviación estándar de '.# años - de un rupo de D# obreros cu-o promedio de anti_edad es de K.> años con desviación estándar de '. años. omprobar la ipótesis con un nivel de sinificación del #@.
Caso III# Nor%al$ .uestras epenientes
*os datos se obtienen de muestras que están relacionadas, es decir, los resultados del primer rupo no son independientes de los del seundo. Jor e!emplo, esto ocurre cuando se mide el nivel de un metabolito en cada uno de los individuos de un rupo experimental antes - después de la administración de una droa. El ob!etivo es comprobar si la droa produce efectos en el nivel del metabolito *os pares de observaciones (antes - después) obtenidas en cada individuo no son independientes -a que el nivel posterior a la administración de la droa depende del nivel inicial.
E8e%plo Q32E+ K,L? ,'> ,? ,?> ,#? ,KL ?,$L ?,#?
%E+J=E+ ,&D ,'$ ,K$ ,?# ,#$ ,? ?,$$ ?,DK
%PZ ',D# $,$> 1$,$' 1$,$& $,$? $,$ $,$L $,''
For%ulaci!n e (ip!tesis &rue4a 4ilateral H $ 0 µ # " $
H ' 0 µ #
&rue4a unilateral inferior H $ 0 µ # " $
≠$
H ' 0 µ #
Fi8ar ni*el e siBnificancia α
" $,$#< $,$' etc.
Estaístico e prue4a T
=
( $ − µ # ) S # & n÷
` t n −'
<$
&rue4a unilateral superior H $ 0 µ # " $
H ' 0 µ #
>$
T
=
( $ − µ # ) = & S # n÷
$, && − $ $,#$
= '.&L
K
ReBiones críticas
11 SG11 :1111111111111SQ11111111111111:11SG11
t α : &
t '−α : &
1 1&,>L#
&,>L#
Zi!ando α " $.$#, la reión de aceptación es el intervalo (t :&" 1&,>L#, t'1 :& " &,>L#), α α con rados de libertad omo 2 " ',&L es menor que t'1 :&" &,>L#, se ubica en la 4ona de aceptación, por lo α
H $ 0 µ # " $ tanto se acepta +e conclu-e que la droa no causo efectos sinificativos, es decir que no existe diferencias observadas entre los niveles de metabolitos por uno u otro individuo en forma sinificativa.
&rue4a e ip!tesis para la proporci!n +e JKitos, e una sola po4laci!n Mamos a considerar que tenemos una población de modo que en cada una de ellas p
estudiamos una v.a. dicotómica (Fernoulli) de parámetro respectivo n
población vamos a extraer una muestra de tamaño Entonces,
. %e la
.
n
X
= ∑ xi → B ( n, p ) i ='
En este caso, interesa contrastar ipótesis para una proporción o un porcenta!e poblacional (por e!emplo, el porcenta!e de personas con ipertensión, fumadoras, etc.) +i el tamaño muestral n es rande, el 2eorema entral del *ímite nos aseura que0
pW → N p<
p (' − p) n
÷
^ bien0 z =
pW − p WW pq
→ N ($,')
n
%onde0 p es la proporción o el porcenta!e de personas u ob!etos con la característica de pW
interés en la población (o sea, es el parámetro de interés) puntual muestral.
es su estimador
For%ulaci!n e (ip!tesis Jrueba Filateral H $ 0 p = p$
Jrueba unilateral superior H $ 0 p = p$
H' 0 p ≠ p$
H' 0 p > p$
Fi8ar ni*el e siBnificancia α
" $,$#< $,$' etc.
Estaística e prue4a S
=
pW 1 p$
→
N ormal ( $ , ')
p q $ $
n
%onde0 q$ = ' − p$ p 0 Jroporción muestral de éxitos
ReBiones críticas
Jrueba unilateral inferior H $ 0 p = p$ H' 0 p < p$
ontraste Filateral
11 SG11 :1111111111111SQ11111111111111:11SG11
ontraste unilateral superior ontraste unilateral inferior
1111111111111111SQ111111111111111:1111SG1111
1111SG11111:11111111111111SQ1111111111111111
Decisi!n Zorma 2abular +i el valor numérico del estadístico de prueba se ubica en la Sona de Qceptación (SQ) se H $ acepta la Ripótesis nula . +i el valor numérico del estadístico de prueba se ubica en la Sona de Geca4o (SG) se H $ reca4a la Ripótesis nula .
Zorma Nétodo 5p6 α
+i el valor numérico de 5p6 es superior que el nivel de sinificancia fi!ado 5 6 se acepta H $ la Ripótesis nula . α
+i el valor numérico de 5p6 es inferior que el nivel de sinificancia fi!ado 5 H $ la Ripótesis nula .
E8e%plo 97
6 se reca4a
En una ran compañía, el 'K@ o más de los traba!adores están de acuerdo con un pro-ecto de le- que modifica el códio laboral Jeruano. *a erencia de la compañía selecciona una muestra aleatoria de '&$ traba!adores, donde el >$@ están de acuerdo con dico pro-ecto de le-. Aual es la conclusión del erenteB
Soluci!n# For%ulaci!n e ip!tesis H $ 0 p = $,'K
H' 0 p > $,'K
Ni*el e siBnificancia α
9
Estaístico e prue4a S
=
W 1 p$ p p$ q $
=
$,>$ − $,'K
n
$,'K;$,K& '&$
Z " >,D>
ReBiones críticas
111111111111111111SQ11111111111111:1111SG11111
z '−α
?233
Decisi!n
∞
z '−α
Zi!ando α " $.$', la reión de aceptación es el intervalo (1 < " &,>>) z '−α omo el estadístico de prueba S " >,D> es ma-or que " &,>>, es decir se ubica en la 4ona de reca4o, se reca4a R$ El erente conclu-e que efectivamente el 'K@ o más de los traba!adores están de acuerdo con un pro-ecto de le- que modifica el códio laboral Jeruano.
E8ercicios propuestos E8ercicio 97 +e conoce por experiencia que el 'D@ de la producción de cierto artículo resulta defectuosa. +e introducen alunos correctivos en el proceso - lueo mediante una muestra de >L$ artículos escoidos aleatoriamente, se encuentra que el '>.>>@ resultan defectuosos. omprobar si los cambios me!oraron la calidad con un nivel de sinificación del #@. E8ercicio ?7 =n propietario de un ran taller de reparación de artículos electrodomésticos, aseura que por lo menos en el >$@ de las reparaciones se acen posteriores reclamos. =no de sus empleados piensa que dica proporción es ma-or - para probarlo toma una muestra aleatoria de '&$ órdenes de reparación efectuadas anteriormente - encuentra que el >?.'@ de las mismas fueron ob!eto de reclamos. ACuién tiene la ra4ónB 3ivel de sinificación del '@.
E8ercicio 37 =na compañía estima que tiene una participación en el mercado de un K$@ para su producto estrella. Nediante una muestra aleatoria de D$$ posibles consumidores se encuentra que el #@ de los mismos consumen el referido producto. Aon un nivel de sinificación del '@, puede concluirse a través de los resultados que dica proporción es menorB
E8ercicio :7 +e quiere comprar una maquina troqueladora - se adquirirá si la proporción de pie4as defectuosas producidas por la máquina es '$@ o menos. +e examina una muestra aleatoria de D$ pie4as - se encuentra que .#@ resultaron defectuosas. Aon un nivel de sinificación del #@, puede concluirse que la máquina satisface los requerimientosB
&rue4a e ip!tesis para la iferencia entre las proporciones e os po4laciones Mamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas p&
p'
estudiamos una v.a. dicotómica (Fernoulli) de parámetros respectivos
X ' =
n'
∑x
'i
. %e
n&
n'
cada población vamos a extraer muestras de tamaño Entonces
-
-
.
→ B ( n' , p' )
i ='
n&
X &
= ∑ x&i → B ( n& , p& ) i ='
+i las muestras son suficientemente randes ocurre que una aproximación para la α
prueba de ipótesis al nivel de sinificancia 5 de dos poblaciones es0
6 para la diferencia de proporciones
For%ulaci!n e (ip!tesis Jrueba bilateral H $ 0 p' = p& H' 0 p'
≠ p&
Jrueba unilateral inferior H $ 0 p' = p& H' 0 p' < p&
Jrueba unilateral superior H $ 0 p' = p& H' 0 p'
> p&
Fi8ar ni*el e siBnificaci!n α
" $,$#< $,$' etc.
Estaística e prue4a S
=
p
=
W' 1 p W & )1(p' 1p& ) (p ' ' pq + ÷÷ n' n& W' n' p n'
→
N ormal ( $ , ')
+ n & pW & + n&
ReBiones críticas ontraste Filateral
11 SG11 :1111111111111SQ11111111111111:11SG11
ontraste unilateral superior ontraste unilateral inferior
1111111111111111SQ111111111111111:1111SG1111
1111SG11111:11111111111111SQ1111111111111111
Decisi!n Zorma 2abular +i el valor numérico del estadístico de prueba se ubica en la Sona de Qceptación (SQ) se H $ acepta la Ripótesis nula . +i el valor numérico del estadístico de prueba se ubica en la Sona de Geca4o (SG) se H $ reca4a la Ripótesis nula . Zorma Nétodo 5p6 α
+i el valor numérico de 5p6 es superior que el nivel de sinificancia fi!ado 5 6 se acepta H $ la Ripótesis nula . α
+i el valor numérico de 5p6 es inferior que el nivel de sinificancia fi!ado 5 H $ la Ripótesis nula .
6 se reca4a
E8e%plo '. =na firma distribu-e dos marcas de deterente. En una encuesta se encuentra que #L de &$$ amas de casa prefieren el deterente de la marca Q - que &? de '#$ amas de casa prefieren la marca F. A+e puede concluir al nivel de sinificación del #@ que la marca Q tiene ma-or preferencia que la marca FB
Soluci!n# .arca A
.arca -
X '
X &
0 3mero de amas de casa que prefieren deterente marca Q X '
0 3mero de amas de casa que prefieren deterente marca F X &
" #L
" &?
n'
pW'
n&
" &$$ X ' #L
=
n'
=
pW'
" $,&K
pW &
&$$
&?
n&
'#$
=
=
pW &
qW'
∧
" '#$ X &
" $,&
" $,'?
∧
qW&
For%ulaci!n e ip!tesis H $ 0 p'
= p&
H' 0 p'
> p&
Ni*el e siBnificancia α
=
Estaístico e prue4a S
=
W' 1 p W & )1(p' 1p & ) (p
pq
Z
'
n
+ '
'
÷ n&÷
=
($,&K− $,'?) −$
' + ' &$$ '#$÷
$,&D;$,EL
92<@
alculando W' n' p p = n'
+ n &pW & = &$$ ; $, &K + '#$ ; $,'? + n& &$$ + '#$
" $,K'
q
p
" $,&D
" $,L
ReBiones críticas
1111111111111111SQ111111111111111:11111SG1111
z '−α 92@:=
Decisi!n
∞
z '−α
Zi!ando α " $.$#, la reión de aceptación es el intervalo (1 < " ',LD#) z '−α omo el estadístico de prueba S " ',?L es ma-or que " ',LD#, es decir se ubica en la 4ona de reca4o, se reca4a R$ +e conclu-e que efectivamente la marca Q tiene ma-or preferencia que la marca F con un nivel de confian4a del ?#@.
E8ercicios propuestos E8ercicio 97 %os máquinas Q - F, producen un mismo artículo. *a máquina Q produce como término medio una proporción de 'D@ de artículos defectuosos, mientras que la máquina F, produce en término medio una proporción de &$@ de artículos defectuosos. +i se obtiene una muestra aleatoria de &$$ unidades del artículo que provenan de la máquina Q - una muestra aleatoria de '$$ unidades provenientes de la máquina F. %emostrar que la máquina F tena una proporción de defectuosos K@ o más que Q. +e supone que la población es infinita. E8ercicio ?7 +e seleccionó una muestra aleatoria de '$$ ombres - '$$ mu!eres de un departamento de olombia< se alló que de los ombres L$ estaban a favor de una le- de divorcio - de las mu!eres ## estaban a favor de dica le-. on base en ésta información, pruebe que la proporción de ombres que favorece ésta le- es ma-or que la proporción de mu!eres. Qsuma un nivel de confian4a del ?? por ciento. E8ercicio 37 *a maqueta del nuevo automóvil propuesto se mostró a dos rupos de '#$ personas cada uno. =n rupo constó de personas entre 'K - años de edad, - el otro de