UESTREO POR CONGLOMERADOS CONGLOMERADOS Una muestra por conglomerados es una muestra aleatoria en la cual cada unidad de muestreo es una colección (o conglomerado) de elementos. El muestreo por conglomerados es útil para obtener información en las siguientes situaciones: •
•
Es complicado disponer de una lista de los elementos de la población, mientras que es fácil lograr un marco que liste los conglomerados. (Alumnos que asisten a clase = elemento, aulas = conglomerados) El coste de obtención de las obseraciones es menor debido al agrupamiento de los elementos.
Formación de los conglomerados. conglomerados. Conglomerados y esraos. !o primero que debemos "acer es especificar los conglomerados conglomerados apropiados. #i los elementos dentro de un conglomerado presentan caracter$sticas similares, entonces tomar muc"as obseraciones dentro de un conglomerado ser$a un traba%o no productio. #in embargo, si los elementos de un conglomerado son diferentes entre s$, una muestra con pocos conglomerados recoger$a gran cantidad de información sobre un parámetro poblacional. &ótese que los estratos deben ser tan "omog'neos "omog'neos como sea posible, pero un estrato debe diferir tanto como se pueda de otro con respecto a la caracter$stica que está siendo medida. !os conglomerados, por otro lado, deben ser tan "eterog'neos dentro de ellos como sea posible un conglomerado conglomerado debe ser mu similar a otro para para que el muestreo muestreo por conglomerados est' indicado. Una e especificados los conglomerados, se selecciona una muestra aleatoria simple de conglomerados.
Esimación de la media! "ro"orción y oal "o#lacionales. *amos a utiliar la siguiente notación: & = conglomerados conglomerados en la población. población. n = conglomerados en la muestra. mi = elementos en el conglomerado i i= suma de las obseraciones obseraciones en el conglomerado i = elementos en la población (con frecuencia fr ecuencia es desconocido) desconocido) = elementos en la muestra
= tama+o medio de los conglomerados conglomerados de la población (con frecuencia es desconocido). = tama+o medio de los conglomerados de la muestra (se utilia para estimar
Esimación de la media. El estimador de la media poblacional es la media
,
!a media tiene la forma de un estimador de raón, por lo que la ariana estimada de toma la forma de la ariana de un estimador de raón.
E$em"lo %& #e dise+a una encuesta económica para estimar la cantidad media gastada en sericios por "ogar de una una ciudad formada por -.// "ogares. "ogares. #e selecciona una muestra aleatoria de - barrios de la ciudad de un total de /. !os entreistadores obtienen el gasto en sericios de cada "ogar en los barrios seleccionados0 seleccionados0 los gastos totales se muestran en esta tabla: 1arrio 5 7 •
&2 de "ogares 66 / -
3ant total 4ast #er 775/ 7-8/ 79-/
Estime la cantidad media de gastos en sericios por "ogar en la ciudad el l$mite para el error de estimación.
#!U3;<&:
yi mi 57566/ 59-9// 56-/8/ 95/9/
E$em"lo %' Un sociólogo quiere estimar el ingreso medio por persona en cierta ciudad peque+a donde no e>iste una lista disponible de adultos residentes. ?or esta raón para el dise+o de la encuesta utilia muestreo por conglomerados. #e diide la ciudad en bloques rectangulares el sociólogo decide que cada bloque rectangular a a ser considerado como un conglomerado. !os conglomerados son numerados del 5 al 956. El inestigador tiene tiempo dinero suficientes para "acer un muestreo de 76 conglomerados entreistar a cada "ogar dentro de cada uno. #e seleccionan aleatoriamente 76 conglomerados se realian las entreistas, obteni'ndose estos datos:
Estime el ingreso medio por persona en la ciudad estableca un l$mite para el error de estimación.
#!U3;<&:
E$em"lo %( En una peque+a ciudad se quiere estimar el promedio de personas interesados en contratar un plan se telefon$a celular en los "ogares de las diferentes mananas la información es obtenida mediante una encuesta. !os datos de la encuesta se encuentran en la tabla:
3alcular tambi'n la ariana el l$mite del error.
Esimador del Promedio
)arian*a del "romedio
L+mie del error
E$em"lo %, 3on el fin de determinar si es coneniente instalar una productora de ogurt en cierto poblado, se desean conocer el consumo mensual por persona al mes. @e un total de 57/ conglomerados detectados se establecieron conglomerados con los resultados que se muestran. Estimar la media, su interalo de confiana los tama+os adecuado de la muestra si el error má>imo es /,7.
E$em"lo %Un fabricante de sierras quiere estimar el coste medio de reparación mensual para las sierras que "a endido a ciertas industrias. El fabricante no puede obtener un coste de reparación para cada sierra, pero puede obtener la cantidad total gastada en reparación el número de sierras que tiene cada industria.
Entonces decide usar muestreo por conglomerados, con cada industria como un conglomerado. El fabricante selecciona una muestra aleatoria simple de 6 de 5// industrias a las que da sericio. !os datos sobre coste total de reparaciones por industria el número de sierras son:
Coso oal de N0 Sierras re"aración "ara el mes 5 6/ 7 55/ 55 7-/ 9 8 59/ 6 7 5/ Estime el coste medio de reparación por sierra para el mes pasado el l$mite para el error de estimación. nd/sri a
#!U3;<&: &=5//, n=6,
yi mi 56/ / 76-/ 7/ 57/ 9-/
Esimador de la "ro"orción #i la ariable que estamos estudiando es dicotómica, "ablaremos de la proporción poblacional p de la proporción muestral p . En este caso al número total de elementos en el conglomerado i que poseen la caracter$stica de inter's se nota como i a en lugar de i como es "abitual en ariables num'ricas. As$ tendremos que
#alo esta diferencia en la notación, todo lo anteriormente e>puesto para ariables num'ricas es álido para ariables dicotómicas.
E$em"lo %& En una ciudad se quiere estimar la proporción de "ogares interesados en contratar el sistema de teleisión digital, para lo cual se considera la ciudad diidida en 7// mananas de iiendas. #e e>trae una muestra piloto de 6 mananas se interroga a cada familia acerca de si estar$a interesada en contratar la teleisión digital. !os datos de la encuesta se encuentran en la tabla:
Man*a na
N0 1ogares en la man*ana
5 7 9 6
8 6
N0 1ogares ineresad os 7 7 -
Estime la proporción de "ogares interesados en contratar el sistema de teleisión digital. 3alcule el l$mite para el error de estimación. #!U3;<& Aunque en un caso de ariables dicotómicas como 'ste se suele usar en los te>tos la notación ai en lugar de i , utiliaremos esta última para unificar la notación a emplear en el muestreo por conglomerados
m 8 6 (-
yi 7 7 &(
mi ' 9 98 5 - 76 '--
yi ' 9 9 8 8 8 (-
yi mi 5 59 7 5 56 23
a4 E$em"lo %' Una industria está considerando la reisión de su pol$tica de %ubilación quiere estimar la proporción de empleados que apoan la nuea pol$tica. !a industria consta de 6 plantas. #e selecciona una muestra aleatoria simple de 6 plantas se obtienen las opiniones de los empleados en estas plantas a tra's de un cuestionario. !os resultados se presentan en esta tabla:
•
Plana
N0 de em"leados
5 7 9 6
65 7 98 5/5
N0 de em"leados 5/e a"oyan la n/e6a "oliica 97 69/ 96 -
Estime la proporción de empleados en la industria que apoan la nuea pol$tica de %ubilación estableca un l$mite para el error de estimación.
#!U3;<&: & = 6 n = 6
m 65 7 98 5/ 5 -
yi 97 69/ 96 -
mi ' 7/5 -99 79/5 6-78 5/7/5
yi ' 59 7/8 5// 7/76 -88
yi mi 7597 -7 58/ -76 --
79-
79-
5-5
5/-
E$em"lo %( En una peque+a ciudad se quiere estimar el promedio de personas interesados en contratar un plan se telefon$a celular en los "ogares de las diferentes mananas la información es obtenida mediante una encuesta. !os datos de la encuesta se encuentran en la tabla:
)arian*a de la "ro"orción
L+mie del error
E$em"lo %, En una planta productora de botes de ogurt se desea saber qu' proporción de los botes no tienen ?B recomendado. !a producción se llea a cabo a tra's de - máquinas, as$ que se decidió realiar la prueba por estratos. En la primera máquina, se una producción de 57// botes se muestrearon 590 en la segunda máquina de 5-// botes se muestrearon
56 en la tercera máquina, de 57// botes se muestrearon 59. 3ada que en un bote tiene un ?B diferente se marca con un 5. Encontrar el estimador de la proporción con su interalo de confiana al 86C el tama+o de la muestra necesario para tener un erro má>imo de /,5.
E$em"lo %Un periódico quiere estimar la proporción de otantes que apoan a cierto candidato A, en una elección estatal. Da que la selección entreista de una muestra aleatoria simple de otantes registrados es mu costosa, se utilia muestreo por conglomerados, con distritos como conglomerados. #e selecciona una muestra aleatoria de 6 distritos de un total de 986 que tiene el estado. El periódico quiere "acer la estimación el d$a de la elección, pero antes de que se "aa "ec"o la cuenta final de los otos. Es por eso que los reporteros son eniados a los lugares de otación de cada distrito en la muestra, para obtener la información pertinente directamente de los otantes. !os resultados se muestran en esta tabla: &2 *otantes &2 otantes A 578/ / 55/ -5 9/ 96 57/ 8-6 5-5 97 Estime la proporción de otantes que apoan al candidato A el l$mite para el error de estimación. #!U3;<&: &=986,
n=6,
yi mi 7// -7/ -88/// 5659// 65-7 955//7
Esimación del oal. @e la relación entre la media el total poblacional el estimador del total poblacional .
se sigue que = F, siendo
la ariana estimada del mismo
(#ea cual sea el alor de F no afecta a la ariana ni al error del estimador, aunque s$ al alor del estimador del total).
E$em"lo %& En una ciudad se quiere estimar la proporción de "ogares interesados en contratar el sistema de teleisión digital, para lo cual se considera la ciudad diidida en 7// mananas de iiendas. #e e>trae una muestra piloto de 6 mananas se interroga a cada familia acerca de si estar$a interesada en contratar la teleisión digital. !os datos de la encuesta se encuentran en la tabla:
&2 "ogares &2 "ogares Fanana en la interesado manana s 5 7 7 7 8 9 6 6 3on un interalo de confiana estime el número de "ogares interesados en contratar dic"o sistema.
E$em"lo %' Un sociólogo quiere estimar el ingreso medio por persona en cierta ciudad peque+a donde no e>iste una lista disponible de adultos residentes. ?or esta raón para el dise+o de la encuesta utilia muestreo por conglomerados. #e diide la ciudad en bloques rectangulares el sociólogo decide que cada bloque rectangular a a ser considerado como un conglomerado. !os conglomerados son numerados del 5 al 956. El inestigador tiene tiempo dinero suficientes para "acer un muestreo de 76 conglomerados entreistar a cada "ogar dentro de cada uno. #e seleccionan aleatoriamente 76 conglomerados se realian las entreistas, obteni'ndose estos datos:
Estime el ingreso total de todos los residentes de la ciudad el l$mite para el error de estimación, suponiendo que F es desconocido.
E$em"lo %( #e desea conocer el número de alumnos por aula de la facultad de ciencias econom$as que aprobaron la materia de G$sica.
Estimar la ariana del total el l$mite del error
D= 5585-/
Esimación de la )arian*a oal
L+mie del error
E$em"lo %, #e trata de estudiar una población de 5/// ca%as de tornillos todas ellas con 9/ unidades cada una. ?ara ello se e>trae una muestra sin reposicion de 7/ ca%as, dentro de la cualnuee c%as no tienen tornillos defectuosos, oc"o ca%as tienen un tornillo defectuoso, tres ca%as tiene tornillos defectuosos se pide: Estimar el numero total de tornillos defectuosos en la población susu errores absolutos relatios de muestreo. Healiar la estimación por interalo del 88C. #!U3;<& Ienemos como datos &= 5/// n= 7/. El total de las pieas defectuosas puede estimarse como sigue: ?roporción del total
*ariana del total
E$em"lo %-
En una ona se desea estimar el peso total de la producción de papa de - parcelas. !a parcela está partidas en tres ranc"os con diferentes condiciones climáticas, as$ que se planea un muestreo estratificado. En primer ranc"o se muestrearn 5/ plantas de 8//. 3on los datos que se muestran a continuación encontrar el total con su interalo de confiana al 86C de seguridad con el tama+o de muestra para tener un error má>imo de 758 Jilos.
Esimación del oal c/ando se desconoce el ama7o de la "o#lación. Grecuentemente el número de elementos en la población no es conocido en problemas donde se aplica el muestreo por conglomerados. En ese caso no podemos utiliar el estimador del total
debemos construir un estimador del total que no dependa
de F . !a cantidad es el promedio de los totales de los conglomerados de la muestra por tanto un estimador insesgado del promedio de los & totales de los conglomerados de la población. ?or el mismo raonamiento empleado en el muestreo aleatorio simple, & es un estimador insesgado de la suma de los totales de todos los conglomerados, o equialentemente del total poblacional .
#i e>iste una gran ariación entre los tama+os de los conglomerados además los tama+os están altamente correlacionados con los totales de los conglomerados, la ariana de & t es generalmente maor que la ariana de F . Esto es debido a que el estimador & t no usa la información proporcionada por los tama+os de los conglomerados por ello puede ser menos preciso. 3uando los tama+os de los conglomerados son iguales los dos estimadores del total coinciden, además el estimador de la media,
, es un estimador insesgado de la media
poblacional, , tambi'n es insesgado el estimador de su ariana, * ( se e>tiende al total).
) (lo mismo
E$em"lo %& En una ciudad se quiere estimar la proporción de "ogares interesados en contratar el sistema de teleisión digital, para lo cual se considera la ciudad diidida en 7// mananas de iiendas. #e e>trae una muestra piloto de 6 mananas se interroga a cada familia acerca de si estar$a interesada en contratar la teleisión digital. !os datos de la encuesta se encuentran en la tabla:
Man*a na
N0 1ogares en la man*ana
5 7 9 6
8 6
N0 1ogares ineresad os 7 7 -
Estime la proporción de "ogares interesados en contratar el sistema de teleisión digital. 3alcule el l$mite para el error de estimación. #!U3;<& Aunque en un caso de ariables dicotómicas como 'ste se suele usar en los te>tos la notación ai en lugar de i , utiliaremos esta última para unificar la notación a emplear en el muestreo por conglomerados
m 8 6 (-
yi 7 7 &(
mi ' 9 98 5 - 76 '--
yi ' 9 9 8 8 8 (-
yi mi 5 59 7 5 56 23
Da que F es desconocido,
debe ser estimada por
E$em"lo %' En una ciudad se quiere estimar la proporción de "ogares interesados en contratar el sistema de teleisión digital, para lo cual se considera la ciudad diidida en 7// mananas de iiendas. #e e>trae una muestra piloto de 6 mananas se interroga a cada familia acerca de si estar$a interesada en contratar la teleisión digital. !os datos de la encuesta se encuentran en la tabla: Fanana 5 7 9 6
&2 "ogares en la manana 8 6
&2 "ogares interesados 7 7 -
#uponiendo que el número de "ogares en la ciudad es 56//.
E$em"lo %(
E$em"lo %, Un sociólogo quiere estimar el ingreso medio por persona en cierta ciudad peque+a donde no e>iste una lista disponible de adultos residentes. ?or esta raón para el dise+o de la encuesta utilia muestreo por conglomerados. #e diide la ciudad en bloques rectangulares el sociólogo decide que cada bloque rectangular a a ser considerado como un conglomerado. !os conglomerados son numerados del 5 al 956. El inestigador tiene tiempo dinero suficientes para "acer un muestreo de 76 conglomerados entreistar a cada "ogar dentro de cada uno. #e seleccionan aleatoriamente 76 conglomerados se realian las entreistas, obteni'ndose estos datos:
#uponiendo que e>isten 7.6// residentes en la ciudad, estime el ingreso total de todos los residentes de la ciudad mediante un interalo de confiana.
Deerminación del ama7o m/esral. #upongamos que los conglomerados a están formados amos a seleccionar el número de conglomerados n para conseguir un determinado l$mite para el error de estimación 1
donde
se estima mediante
para la estimación de la media
de una muestra preia, siendo para la estimación del total.
Babitualmente el tama+o promedio de los conglomerados de la población no se conoce tiene que estimarse por el tama+o medio de los conglomerados de una muestra preia. 3uando se utilia & para estimar el total, el número de conglomerados en la muestra para obtener un determinado l$mite para el error de estimación 1 iene dado por
se estima mediante
de una muestra preia (o
a partir de una estimación del rango de los alores de i como
E$em"lo %& En una ciudad se quiere estimar la proporción de "ogares interesados en contratar el sistema de teleisión digital, para lo cual se considera la ciudad diidida en 7// mananas de iiendas. #e e>trae una muestra piloto de 6 mananas se interroga a cada familia acerca de si estar$a interesada en contratar la teleisión digital. !os datos de la encuesta se encuentran en la tabla: Fanana &2 "ogares en la manana 5 7 9 6
8 6
&2 "ogares interesado s 7 7 -
Hepresentar una muestra preia, cómo debe tomarse una nuea muestra para estimar la proporción poblacional del apartado a) con un l$mite para el error de estimación del 5C. #!U3;<&
E$em"lo %' Una industria está considerando la reisión de su pol$tica de %ubilación quiere estimar la proporción de empleados que apoan la nuea pol$tica. !a industria consta de 6 plantas. #e selecciona una muestra aleatoria simple de 6 plantas se obtienen las
opiniones de los empleados en estas plantas a tra's de un cuestionario. !os resultados se presentan en esta tabla:
Plana
N0 de em"leados
5 7 9 6
65 7 98 5/5 •
N0 de em"leados 5/e a"oyan la n/e6a "oliica 97 69/ 96 -
!a industria modificó su pol$tica de %ubilación despu's de obtener los resultados de la encuesta. A"ora se quiere estimar la proporción de empleados a faor de la pol$tica modificada K3uántas plantas deben ser muestreadas para tener un l$mite del 6C para el error de estimaciónL Use los datos anteriores para apro>imar los resultados de la nuea encuesta.
#!U3;<&:
E$em"lo %( 3on el fin de determinar si es coneniente instalar una productora de ogurt en cierto poblado, se desean conocer el consumo mensual por persona al mes. @e un total de 57/ conglomerados detectados se establecieron conglomerados con los resultados que se muestran. Estimar la media, su interalo de confiana los tama+os adecuado de la muestra si el error má>imo es /,7. El total de personas estimadas es de 5////
E$em"lo %, Un sociólogo quiere estimar el ingreso medio por persona en cierta ciudad peque+a donde no e>iste una lista disponible de adultos residentes. ?or esta raón para el dise+o de la encuesta utilia muestreo por conglomerados. #e diide la ciudad en bloques rectangulares el sociólogo decide que cada bloque rectangular a a ser considerado como un conglomerado. !os conglomerados son numerados del 5 al 956. El inestigador tiene tiempo dinero suficientes para "acer un muestreo de 76 conglomerados entreistar a cada "ogar dentro de cada uno. #e seleccionan aleatoriamente 76 conglomerados se realian las entreistas, obteni'ndose estos datos:
E$em"lo %3on el fin de determinar si es coneniente instalar una productora de ogurt en cierto poblado, se desean conocer el consumo mensual por persona al mes. @e un total de 57/ conglomerados detectados se establecieron conglomerados con los resultados que se muestran. Estimar la media, su interalo de confiana los tama+os adecuado de la muestra si el error má>imo es /,7. El total de personas estimadas es de 5////
MUESTREO PRO8A8LDADES PROPORCONALES AL TAMA9O El auditor desea muestrear los registros de ausencias por enfermedad de una gran empresa, para estimar el número medio de d$as de ba%a enfermedad por empleado, en el cuatrimestre pasado. !a empresa tiene oc"o secciones con diferente número de empleados por diisión, como el número de d$as de ausencia por enfermedad dentro de cada sección debe estar altamente correlacionado con el número de empleados, el auditor decide muestrear n=- secciones con probabilidad proporcional al número de empleados. E>plique cómo seleccionar la muestra si los respectios empleado son 57//, 96/, 75//, /, 79/, 585/, -8/ -7//.
N;MERO DE NTER)ALO EMPLEADOS ACUMULADO 5 57// 5M57// 7 96/ 57/5M56/ 75// 565M-6/ 9 / -65M95/ 6 79/ 955M96/ 585/ 965M8-/ -8/ 8-5M86/ -7// 865M5786/ 5786/ #uponga que el número total de d$as de ausencia por enfermedad registrados en las tres secciones muestreadas durante el cuatrimestre pasado son, respectiamente, SECC:N
5=
4320 2100
=
2,06
7=
4160 1910
=
2,18
-=
5790 3200
=
1,81
SOLUC:N< #e listo el número de empleados el interalo acumulado para cada sección, como se muestra en la tabla. 3omo se muestrearán - secciones, es necesario seleccionar tres números aleatorios entre ////5 57 86/.
µ ppt =
µ ppt =
v^
∑ Yi´ n 2,06 + 2,18 + 1,81 3
=
2,02
´ Yi
1
=
µ ppt
4 >
v^
(
µ ppt
v^
( µ ppt )=/,/558
n ( n− 1 )
¿
∑¿
1
?
µ ppt
4@
) = 3 ( 3 −1 ) [ ( 2,06 −2,02 ) + (2,18 −2,02 ) +( 1,81−2,02 ) ] 2
2
2
µ ppt ± 2 √ ^v ( µ ppt )
7,/7 N
2 √ 0,0119
= 7,/7 N/,77
!a estimación del número medio de d$as de ausencia por enfermedad de los empleados de la empresa es 7,/7 N/,77.
8iogra+a •
•
•
• • • • •
• • •
•
BAE& B. FHH;#, BUHO;IP D FA@& 4. O;!!;AF #ample #ure Fet"ods and I"eor. 586#c"eaffer, Fende"all tt (7//). Elementos de muestreo. ;nternational I"omson Editores. ?alacios, G. 3alle%ón, Q. (7//9). I'cnicas 3uantitatias para el Análisis Hegional. Editorial Uniersidad de 4ranada. Fanuales 3iencias Económicas Empresariales. Gernánde 4arc$a, Faor 4allego (5886). E%ercicios prácticas de muestreo en poblaciones finitas. EU1. !o"r, #.!. (5888). Fuestreo: @ise+o Análisis. ;nternational I"omson Editores !uque, I. (7///). I'cnicas de Análisis de @atos en ;nestigación de Fercados. ?irámide. Bair, Q. G. (7//5). Análisis Fultiariante. ?renticeMBall. ?e+a, @. (7//7). Análisis de @atos Fultiariantes. Fc4raRMBill. Uriel, E. Aldás, Q. (7//6). Análisis Fultiariante Aplicado. ;nternational I"omson Editores.