Estadística administrativa
TEMA 4.2 CONCEPTO DE DISTRIBUCIÓN DE MUESTREO DE LA MEDIA DISTRIBUCIÓN DISTRIBUCIÓ N DE LA MEDIA
DISTRIBUCIÓN DE LA POBLACIÓN La distribución de una variable variable en la población població n se obtiene midiendo cada elemento y estableciendo para cada valor una frecuencia de ocurrencia. Mediante este procedimiento se puede establecer para la variable medida una función de distribución. La función de distribución se caracterizara por los valores que asumen la variable y la frecuencia asociada a cada una de ellos. En general las medidas realizadas en una población se identifican con letras griegas. Si se trata de medir la media de la población la nomenclatura es la siguiente:
Ó
DISTRIBUCIÓN DISTRIBUCIÓN EN LA MUESTRA La distribución de una variable en la muestra se obtiene del mismo modo modo que en la población. El resultad de la medición será una función de distribución que replicara la función de distribución de la variable en la población. La replicación no será exacta como consecuencia del sesgo de muestreo. Cada valor de la muestra tendrá asociado una frecuencia de ocurrencia. En general las medidas realizadas en una muestra se identifican con letras latinas minúsculas. Si se se trata de medir la media de la muestra la nomenclatura se presenta a continuación.
Ó José Luis Aguilar Yáñez
Estadística administrativa DISTRIBUCIÓN DE MUESTREO DE LA MEDIA La distribución muestral de un estadístico es una distribución de probabilidad constituida por cada uno de los valores que puede asumir el estadístico en todas las muestras de tamaño n posibles de extraer sin reposición en una población de tamaño N. Dados los valores de la población y la muestra el numero de muestras posibles a extraer se calcula como combinación .
La distribución muestral de la media puede conocerse empíricamente, según se ha visto, efectuando dos operaciones. A saber, extrayendo todas las muestras posibles de tamaño n de una población de tamaño N y calculando para cada muestra la media y probabilidad asociada. La distribución muestral de las medias muéstrales asume como la media el valor del parámetro poblacional y la desviación típica de la distribución muestral de medias- denominado error estándar o error típico
Asume el valor:
En consecuencia, la media muestral se distribuye según una curva normal definida en los siguientes términos:
Media de las medias muéstrales Es el promedio de todos los valores posibles de las medias que se pueden generar mediante las diversas muestras aleatorias simples. Se puede demostrar que el valor esperado de las medias muéstrales es igual a la media poblacional Error estándar de la media: Es la desviación estándar de la distribución de muestreo de la media, por lo que mide el grado en que se espera que varíen las medias de las diferentes muestras de la media de la población, debido al error aleatorio en el proceso de muestreo. Aplicaciones: Una aplicación muy corriente y útil de la distribución muestral es determinar la probabilidad de que la media de una muestra caiga dentro de un intervalo determinado. Puesto que la distribución muestral seguirá una distribución normal (ya sea porque la muestra se toma de una distribución normal, o porque n " #_% _ teorema del límite central garantice la normalidad en el proceso de muestreo), se podrá utilizar la variable tipificada para obtener la información necesaria en la toma de decisiones.
José Luis Aguilar Yáñez
Estadística administrativa EJEMPLO: Supongamos que el incremento porcentual de los salarios de los funcionarios de todas las corporaciones medianas se distribuye normal con una media de 12.2% y una desviación típica de 3.6%. Si se toma una muestra aleatoria de nueve observaciones de esta población, calcule la probabilidad de que el incremento medio muestral porcentual sea menor del 10%. Como la distribución de la población es normal, tenemos que los parámetros de la distribución muestral de la media son:
EJERCICIO: El precio medio de ventas de casa nuevas en una ciudad americana es de $115 000 con una desviación desviación típica de $25 000. Se toma una muestra muestra aleatoria aleatoria de 100 casas nuevas de esta ciudad. a) ¿Cuál es la probabilidad de que la media muestral de los precios de venta sea menor de $110 000? X: Precios de venta de las casas. Dado que el tamaño de muestra n=100 > 30 podemos utilizar el Teorema Central del Límite, así que tenemos que:
b) ¿Cuál es la probabilidad de que la media muestral se encuentre a menos de $500 de la media poblacional?
José Luis Aguilar Yáñez
Estadística administrativa DISTRIBUCIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS Sean X1 y X2 dos variables aleatorias con valores esperados m1 y m2 y varianzas y, respectivamente. Por ejemplo, X1 puede ser la duración de una batería para carro de una marca, y X2 la duración de una batería de otra marca diferente. Si los medias m1 y m2 son desconocidas, podríamos estar interesados en conocer si ambas baterías tienen la misma duración media. En forma similar, si las varianzas son desconocidas, podríamos estar interesados en saber si son iguales o no. Para realizar estas inferencias, se pueden someter a pruebas idénticas diferentes baterías, controlando los factores externos, de tal forma que las diferencias se deban exclusivamente a la clase de marca probada Inicialmente estaremos interesados en verificar si ambas distribuciones tienen la misma media poblacional, es decir si m1 = m2 ó equivalentemente m1 - m2 = 0. a) Distribución de la diferencia entre dos medias cuando las varianzas son conocidas. Si las varianzas y son conocidas, tanto como se distribuyen normalmente. Por lo tanto la distribución de la diferencia entre las medias muéstrales es normal con el valor esperado y la varianza dados anteriormente, es decir, De acuerdo con lo anterior la siguiente variable aleatoria tiene una distribución normal estándar: Por lo tanto, con base en la expresión anterior se pueden realizar inferencias con respecto a la diferencia de medias poblacionales, bajo el supuesto de que las varianzas sean conocidas. Si además, son iguales, la expresión anterior se puede expresar como: b) Distribución de la diferencia entre dos medias cuando las varianzas son desconocidas pero iguales (= =) Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadística para verificar si éstas son iguales o diferentes. Para realizar esta prueba debemos hacer uso de la distribución F para verificar si la relación de varianzas es igual a uno o diferente de uno. Para cada una de las dos muestras se definen sus respectivas varianzas como: José Luis Aguilar Yáñez
Estadística administrativa Además tienen distribuciones cuadrado con n1±1 y n2±1 grados de libertad respectivamente. Por lo tanto su suma también sigue otra distribución chi cuadrado con n1+n2±2 grados de libertad. Es decir: Ahora bien, si Z es una variable normal (0,1) y tiene una distribución chi cuadrado con n grados de libertad, entonces la variable tiene una distribución t con n grados de libertad. Para nuestro caso la variable Z corresponde a la distribución de la diferencia de las dos medias, con varianzas conocidas, y la variable chi cuadrado corresponde a la variable Y acabada de definir. Por lo tanto Donde es un estimador ponderado de la varianza poblacional s obtenida ponderando las varianzas poblacionales por sus respectivos grados de libertad. c) Distribución de la diferencia entre dos medias cuando las varianzas son desconocidas y diferentes
Ejemplo: En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una distribución distribución normal. El promedio de los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si representa el promedio de los pesos de 20 niños y es el promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas.
Solución:
Datos:
Ó Ó
José Luis Aguilar Yáñez
Estadística administrativa
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más grande que el de la muestra de las niñas es 0.1056. 0.1056
Distribución Muestral de Diferencia de Proporciones Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos: y
y
y
y
Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que aprueban inglés? Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de ese tipo? Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales. Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la máquina A los que genera la máquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones muéstrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para tamaños de muestra grande (n 1p1 5, n 1q1 5, n2p2 5 y n2q2 5). Entonces p 1 y p2 tienen distribuciones muéstrales aproximadamente normales, así que su diferencia p 1-p2 también tiene una distribución muestral aproximadamente normal.
José Luis Aguilar Yáñez
Estadística administrativa Formula:
Ejemplo: Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres. Solución:
Datos: PH = 0.12 PM = 0.10 N H = 100 N M = 100 P (pH-pM
0.03) =?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está utilizando la distribución normal .
José Luis Aguilar Yáñez
Estadística administrativa
0.4562
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.
BIBLIOGRAFIA: y
y
ESTADISTICA PARA ADMINISTRACION Y ECONOMIA ³ANDERSON SWEENEY WILLIANS´ ³DISTRIBUCIÓN DE MUESTREO DE LA MEDIA´ ESTADISTICA PARA LA ADMINISTRACION Y ECONOMIA ³RICHARD LEVIN´ ³DISTRIBUCIÓN DE MUESTREO DE LA MEDIA´
José Luis Aguilar Yáñez