4.1 DEFINICION DE MUESTREO. Muestreo Aleatorio: Empezaremos definiendo Población, como un conjunto de individuos que se pueden identificar por separado. Se puede pensar en una población concreta que realmente existe, como en una conceptual que no exista ni que existirá jamás. En ambos casos, el interés se centrará casi exclusivamente en las poblaciones números. Una población puede ser discreta o continua , dependiendo de que el conjunto de números referidos sea discreto o continuo.
Muestreo Sistemático: En algunos casos la manera más práctica de realizar un muestreo consiste en seleccionar, un primer elemento al azar y luego ir escogiendo cada x-término de una lista, o dejar pasar a x- individuos y preguntar al que sigue y así sucesivamente. Aunque un muestreo sistemático puede no ser aleatorio de acuerdo con la definición, a menudo es razonable tratar las muestras sistemáticas como si fueran aleatorias. El riesgo de los muestreos sistemáticos es el de las periodicidades ocultas. Supongamos que queremos testear el funcionamiento de una máquina, para lo cuál vamos a seleccionar una de cada 15 piezas producidas. Si ocurriera la desgracia de que justamente 1 de cada 15 piezas fuese defectuosa y el error de la máquina fuera defectuoso periódicamente, tendríamos dos posibles resultados muestrales: Que - Que no falla nunca.
falla
siempre.
Muestreo Muestreo Estratificado: Estratificado: Es información a cerca de una población (es decir de su composición) y esta es importante para nuestra investigación, podemos mejorar el muestreo aleatorio por medio de la estratificación . Este es un procedimiento que consiste en estratificar o dividir la población en un número de sus poblaciones o estratos. Y seleccionamos de cada estrato una muestra aleatoria.
Muestreo por conglomerados , se divide la población total en un número determinado de subdivisiones relativamente pequeñas y se seleccionan al azar algunas de estas subdivisiones o conglomerados, para incluirlos en la muestra total. Si estos conglomerados coinciden con áreas geográficas, este muestreo se llama también muestreo por áreas , Estratos. Y seleccionamos de cada estrato una muestra aleatoria.
4.1.1 TIPOS DE MUESTREO
Z=
1.El precio de ventas de casa nueva en la ciudad de América es de $115,000.00 con una desviación típica de $25,000.00 se toma una muestra aleatoria de 200 casas nuevas de esta ciudad. a) cual es la probabilidad de que la media maestral maestral de los precios de venta venta sea menor a $110,000.00 X=precio de venta de la casa. Dado que el tamaño de la muestra n=100>30 podemos utilizar el teorema central del limite así tenemos que
=
=
=
= 2500
P( <110000)= <110000)= p(2<
=
b) cual es la probabilidad de que la media media muestre al menos $500 de la media poblacional
p(
= p (114500< <115000= <115000=
p(-2<>2=0.9772-0.0228=0.9544
2. Supongamos que el incremento % de los salarios de los funcionarios de todas las corporaciones medianas se destruye normal con media de 12.2% y una desviación típica del 3.6% si se toma una de las aleatorias a observaciones de esta población calcule la probabilidad de que el incremento medio maestral % sea menor de 10% Como la distribución de la población es normal tenemos que los parlamentos de la distribución maestral de la media son
P( < 10) = p (Z= =
(-1.86) = 0.0306
Es realmente muy poco probable que el incremento medio %este por debajo de 10%
4.2 Muestreo Un muestreo es la selección de una muestra a partir de una población, entendida como muestra un subconjunto, elegido de un conjunto mayor usualmente de manera aleatoria, para realizar un estudio estadístico. Al elegir una muestra, se espera que los datos estadísticos sean proporcionales a la población, y por lo tanto, que las propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos si se realizasen a toda la población. Cabe mencionar para que el muestreo sea válido y se pueda realizar un estudio fiable (que represente a la población), debe cumplir ciertos requisitos, lo que lo convertiría en una muestra representativa.
Ejemplo: vamos a hallar el intervalo de probabilidad para el peso medio de una muestra de 100 recién nacidos, con un nivel de confianza de 0,9, sabiendo que =3.100 gramos y =150 gramos. Solución:
si consultamos en la tabla de la N(0, 1), comprobaremos que
que simplificado, es el intervalo (3.075´325 ; 3.124´675)
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas.
Solución:
Este valor se busca en la t abla abla d e z
La
interpretación sería que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062.
4.3 TEOREMA DEL LIMITE CENTRAL. El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se distribuye según una distribución normal. Ejemplo: la variable "tirar una moneda al aire" sigue la distribución de Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre sí) se distribuye según una distribución normal. Este teorema se aplica tanto a suma de variables discretas como de variables continuas. Los
parámetros de la distribución normal son:
Media: n * m (media ( media de la l a variable individual multiplicada por el número de variables independientes) Varianza: n * s2 (varianza de la variable individual multiplicada por el número de variables individuales) Ejercicio 1 Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada lanzamiento es una variable independiente que se distribuye según el modelo de Bernouilli, con media 0,5 y varianza 0,25. Calcular la probabilidad de que en estos 100 lanzamientos salga más de 60 caras. La
variable suma de estas 100 variables independientes se distribuye, por tanto, según una distribución normal. Media = 100 * 0,5 = 50 Varianza = 100 * 0,25 = 25 Para ver la probabilidad de que salgan más de 60 caras calculamos la variable normal tipificada equivalente:
Por lo tanto:
Es decir, la probabilidad de que al tirar una moneda 100 veces la moneda salga más de 60 caras es tan solo del 2,28% Ejercicio 2 En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada clase es del 10%. A lo largo del año tienes 100 clases de esa asignatura. ¿Cuál es la probabilidad de tener que salir a la pizarra más de 15 veces? Se vuelve a aplicar el Teorema Central del Límite. Salir a la pizarra es una variable independiente que sigue el modelo de distribución de Bernouilli: "Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10 "No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9 La
media y la varianza de cada variable independiente es:
Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son:
Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamos el valor equivalente de la variable normal tipificada:
Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo del curso es tan solo del 4,47%
4.4 DETERMINACION DEL TAMAÑO DE LA MUESTRA DE UNA POBLACION ¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes? Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral. Donde: N = Total de la población Za2 = 1.962 (si la seguridad es del 95%) p = proporción esperada (en este caso 5% = 0.05) q = 1 ± p (en este caso 1-0.05 = 0.95) d = precisión (en este caso deseamos un 3%).
4.5 INTERVALOS CONFIANZA PARA MEDIA CON EL USO DE LA DISTRIBUCIÓN NORMAL
INTERVALO
DE CONF AMZA I AMZA
Un intervalo de estimación estimación para el cual existe un grado especifico de certeza que el valor real del parámetro poblacional caerá dentro de este intervalo. Para suponerse que la población tiene una distribución normal, el tamaño de la muestra debe ser de al menos 30.
En donde:
= la media de la muestra = la desviación estándar de la población
n= el tamaño de la muestra
z= el valor de z que corresponde al nivel de confianza EJEMPLO 1 Se encontró que la desviación estándar de la población de los diámetros de las varillas producidas por una maquina es = 0.053 pulgadas. Para una muestra aleatoria simple de n=30 varillas, se encontró que el diámetro promedio es = 1.400 pulgadas, con un intervalo de confianza de 95%
Es decir, entre 1.381 y 1.419 pulgadas.
EJEMPLO 2 Se requiere estimar la conductividad promedio con un intervalo de confianza de 95%, dado que la muestra aleatoria de 35 ensayos, resulto una media aritmética 1,2825 y una desviación estándar de 0,1315
Es decir
EJEMPLO 3
Se encontró que la desviación estándar de la población es = 0.055. Para una muestra aleatoria simple de n=42, se encontró = 1.500, con un intervalo de confianza de 95%
Es decir Entre 1.483 y 1.516
BIBLIOGRAF A I A
Introducción a la estadística para negocios Escrito por Ronald M. Weiers
4.7 UNA SOLA MUESTRA: ESTIMACION DE LA PROPORCION.
Intervalos
de confianza para proporciones.
Estimación de una proporción. Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística P=X/N, donde x representa el número de éxitos en n pruebas. Por tanto, la proporción de la muestra p =x/n se utilizará como estimador puntual del parámetro P. Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P al considerar la distribución maestral de proporciones.
Al despejar P de esta ecuación nos queda:
En este despeje podemos observar que se necesita el valor del parámetro P y es precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5. El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no excederá.
Ejercicio 1 Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas. SOLUCION:
Se sabe que con un nivel de confianza del 90% que la probabilidad de discos defectuosos que no pasan la prueba en esa población está entre 0.0237 0.0237 y 0.0376.
4.8. TAMAÑO DE LA MUESTRA COMO UNA ESTIMACION DE P Y UN GRADO DE CONFIANZA
Estimación de una Proporción Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística P=X/N, donde x representa el número de éxitos en n pruebas. Por tanto, la proporción de la muestra p =x/n se utilizará como estimador puntual del parámetro P. Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones.
Al despejar P de esta ecuación nos queda:
En este despeje podemos observar que se necesita el valor del parámetro P y es precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.
El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no excederá.
Ejemplo:
1. Un fabricante de reproductores de discos compactos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas. 2. Solución:
n=500 p = 15/500 = 0.03 z(0.90) = 1.645
0.0237
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos que no pasan la prueba en esa población esta entre 0.0237 y 0.0376. Ejercicio 2 En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales. SOLUCION: