UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE INGENIERIA INDUSTRIAL
“E.A.P INGENIERÍA INDUSTRIAL”
Curso:
Control de Calidad
Profesor:
Felipe Loayza Beramendi
Grupo:
4
Estudiantes:
Quispe Sanchez, Cinthia Torres Ruiz, Javier Mallqui Huamani, Jonathan
2018 – 2018 – II II
Capítulo 4: Elementos de Inferencia Estadística 1. En un estudio estadístico, ¿qué es una población población y para que se toma una muestra?
La población es un conjunto formado por la totalidad de individuos, objetos o medidas de interés sobre los que se realizan un estudio. La muestra se utiliza cuando tenemos una población infinita y por medio de cálculos muestréales adecuados nos permitirá hacer afirmaciones acerca de toda la población. 2. ¿Qué significa probar una hipótesis?
Es un estudio estadístico por lo general se busca responder con cierto nivel de confianza la pregunta planteada para poder tomar las decisiones pertinentes. 3. ¿Qué implica realizar realizar una estimación puntual puntual y en que que consiste la estimación por intervalo para la media?
El estimador puntual de un parámetro es un estadístico que genera un valor numérico simple, y que se utiliza para proporcionar una estimación del valor del parámetro desconocido. Por ejemplo, con frecuencia es necesario estimar el valor de:
La media μ del proceso (o población objeto de estudio). La varianza σ 2 o la desviación estándar del proceso. La proporción proporción p de artículos defectuosos.
4. ¿Por qué no es suficiente la estimación puntual y por por qué se tiene que recurrir a la estimación por intervalo?
Porque a veces es conveniente obtener unos límites entre los cuales se encuentre el parámetro con un cierto nivel de confianza, en este caso necesitamos de estimación por intervalos.
5. Explique el papel que desempeñan probabilidad en la inferencia estadística.
las
distribuciones
de
Una distribución de probabilidad Distribución de una variable o X relaciona el conjunto de valores posibles de aleatoria X, con la probabilidad asociada a estos valores. Una distribución de probabilidad también se puede considerar una distribución teórica de frecuencia, que describe cómo se espera que varíen los resultados de la variable aleatoria. De esta forma, lo aleatorio se modela (describe, acota), y al observar una realización específica de un estadístico es posible corroborar o rechazar supuestos (prueba de hipótesis) o hacer estimaciones poblacionales. Las distribuciones de probabilidad que más se emplean en intervalos de confianza y pruebas de hipótesis son las distribuciones: normal, T de Student, ji-cuadrada y F. 6. En el contexto de estimación por intervalo, señale en forma específica que parámetro utiliza cada una de las siguientes distribuciones para realizar estimaciones de Student, normal y jicuadrada.
7. Explique que es un estadístico de prueba y señale su relación con los intervalos de aceptación y rechazo.
Un estadístico de prueba es un valor estandarizado que se calcula a part ir de los datos de la muestra durante una prueba de hipótesis. Puede utilizar los estadísticos de prueba para determinar si puede rechazar la hipótesis nula. 8. ¿Que son los errores tipo I y tipo II en las pruebas de hipótesis?
Error tipo I: Es cuando se rechaza una Ho que es verdadera Error tipo II: Es cuando se acepta una Ho que es falsa.
9. Señale y describa de manera breve los tres criterios equivalentes de rechazo de una hipótesis.
Estadístico de prueba frente a valor crítico:
Este criterio se utilizó en el ejemplo previo y es el que de manera tradicional se empleaba antes de los avances en materia computacional que ahora existe. Este método consiste en rechazar Ho sí el estadístico de prueba cae en la región de rechazo que está delimitada por el valor crítico.
Significancia observada frente a significancia predefinida:
La significancia predefinida que se denota con o: es el riesgo máximo que se está dispuesto acorrer por rechazar Ho indebidamente (error tipo I). Mientras que la significancia observada o calculada, también conocida como valor-p, es el área bajo la distribución de referencia que está más allá del valor del estadístico de prueba.
10. Señale un ejemplo de datos o muestras pareadas.
Son conocidas como muestras asociadas. Ejemplo: Medir la presión arterial a 10 personas por la mañana. Medir la presión arterial a las mismas 10 personas por la tarde
11. En la elaboración de envases de plástico es necesario garantizar que cierto tipo de botella en posición vertical tenga una resistencia mínima de 50 kg de fuerza. Para asegurar esto, en el pasado se realizaba una prueba del tipo pasa-no-pasa, donde se aplicaba la fuerza mínima y se veía si la botella resistía o no. En la actualidad se realiza una prueba exacta, en la que mediante un equipo se aplica fuerza a la botella hasta que esta cede, y el equipo registra la resistencia que alcanzo la botella. a) ¿Qué ventajas y desventajas tiene cada método? b) Para evaluar la resistencia media de los envases se toma una muestra aleatoria de n = 20 piezas. De los resultados se obtiene que X= 55.2 y S = 3. Estime con una confianza de 95% ¿Cuál es la resistencia promedio de los envases? c) Antes del estudio se suponía que μ = 52. Dada la evidencia de los datos, ¿Tal supuesto es correcto? d) Con los datos anteriores, estime con una confianza de 95% ¿Cuál es la desviación estándar poblacional (del proceso)?
S olución
a) Primer Método: Pasa- No pasa: Ventajas
Es más rápido.
Desventajas
Imprecisión datos.
en
Segundo Método: Hacer pruebas de resistencia: Ventajas
Precisión en los datos
Desventajas
Toma más tiempo
b) Datos:
.=1=201=19 ∝= (5%)
Fórmula: Para hallar intervalo de la media:
̅ ±∝,1 √ Donde:
∝,1
, se saca de la tabla de T-student
los
Reemplazando en la fórmula:
[ ; ]=55.2±(2.093)√ 320 [53.79;56.60]
∴ :. .
c) No es correcto, ya que la media de 52 está por debajo del límite inferior. d) Utilizando los mismos datos especificados en a: La fórmula a utilizar es la siguiente:
; (1) ⌊ ; ⌋= (1) −
Reemplazando datos:
( 201)3 ( 201)3 ⌊ ; ⌋= 32.852 ; 8.907 ⌊ ; ⌋=√ 5.2051;√ 19.1983 ⌊ ; ⌋ =2.2815;4.3816
∴ ó :. . 12. Para evaluar el contenido de nicotina en cierto tipo de cigarros elaborados por un proceso se toma una muestra aleatoria de 40 cigarrillos y se obtiene que X = 18.1 mg y S = 1.7. a) Estime con una confianza de 95% ¿Cuál es la cantidad de nicotina promedio por cigarro? b) ¿Cuál es el error de estimación en el inciso anterior? c) Antes del estudio se suponía que μ = 17.5. Dada la evidencia de los datos. ¿Se puede rechazar tal supuesto? d) Si se quiere estimar la media con un error máximo de 0.4. ¿Qué tamaño de muestra se requiere? e) Con los datos anteriores, estime con una confianza de 95% ¿Cuál es la desviación estándar poblacional (del proceso)? f) Que puede decir sobre la cantidad mínima y máxima de nicotina por cigarro? Es posible garantizar con suficiente confianza que los cigarros tienen menos de 20 mg de nicotina. Sugerencia: aplique la regla empírica (véase capítulo 2).
S olución
DATOS:
() ⁄ 1 = ⁄2 = ⁄ = () = 1 = /2 (1 ) n=40
̅ = 18.1
S=1.7
Calculando en minitab
n = (2.042) (0.05)(1 0.05) /(0.04) = 1.2378
a) La cantidad promedio de nicotina por cigarro se encuentra entre 17.556 y 18.644. b) El error de estimación es de 0.269. c) No, porque se encuentra dentro de los limites calculados en el inciso a. d) Con un error máximo de 0.4 el tamaño de la muestra se requiere que sea de 1.2378. e) La desviación estándar del proceso está dentro 1.39 y 2.18. f) Es posible garantizar con suficiente confianza que los cigarros tienen menos de 20 mg de nicotina.
13. En un problema similar al del ejercicio 11 es necesario garantizar que la resistencia mínima que tienen un envase de plástico en posición vertical sea de 20 kg. Para evaluar esto se obtuvieron los siguientes datos mediante pruebas destructivas: 28.3 26.8 26.6 26.5 28.1 24.8 27.4 26.2 29.4 28.6 24.9 25.2 30.4 27.7 27.0 26.1 28.1 26.9 28.0 27.6 25.6 29.5 27.6 27.3 26.2 27.7 27.2 25.9 26.5 28.3 26.5 29.1 23.7 29.7 26.8 29.5 28.4 26.3 28.1 28.7 27.0 25.5 26.9 27.2 27.6 25.5 28.3 27.4 28.8 25.0 25.3 27.7 25.2 28.6 27.9 28.7 a) Esta variable forzosamente tiene que evaluarse mediante muestreo y no Al 100% ¿Por qué? b) Realice un análisis exploratorio de estos datos (obtenga un histograma y vea el comportamientos de los datos obtenidos). c) Estime con una confianza de 95%, ¿cuál es la resistencia promedio de los envases? d) Antes del estudio se suponía que μ = 25. Dada la evidencia de los datos, ¿tal supuesto es correcto? e) Con los datos anteriores, estime con una confianza de 95% ¿Cuál es la desviación estándar poblacional (del proceso)?
S olución
Hipótesis:
:
= 25
:
≠ 25
Nivel de significancia: = 0.05 Estadístico de Prueba calculado en minitab
a) Los datos se encuentran muy por encima de la especificación inferior (20Kg) se cumple con la calidad exigida. Media y mediana están alrededor de 27 kg, además su desviación es 1,43kg Coef Var= 5,25% Los límites reales se encuentran el 97,3% entre 22,93 y 31,51Kg El diagrama de caja nos señala cierta simetría de la información y que se encuentra los bigotes alejados de la especificación inferior. b) Valor p < Alfa (0,05) entonces se rechaza Ho la media es diferente de 25 c) Con una confianza del 95% se puede afirmar que la media verdadera de la resistencia de los envases se encuentra entre 26,833 y 27,607 Kg d) Sí, porque el método estándar se utiliza sólo para la distribución normal e) Con una confianza del 95% se puede afirmar que la desviación estándar verdadera de la resistencia de los envases se encuentra entre 1,20 y 1,76 Kg.
14. En la elaboración de una bebida se desea garantizar que el porcentaje de CO2 (gas) por envase este entre 2.5 y 3.0. Los siguientes datos fueron obtenidos del monitoreo del proceso: 2.61 2.62 2.65 2.56 2.68 2.51 2.56 2.62 2.63 2.57 2.60 2.53 2.69 2.53 2.67 2.66 2.63 2.52 2.61 2.60 2.52 2.62 2.67 2.58 2.61 2.64 2.49 2.58 2.61 2.53 2.53 2.57 2.66 2.51 2.57 2.55 2.57 2.56 2.52 2.58 2.64 2.59 2.57 2.58 2.52 2.61 2.55 2.55 2.73 2.51 2.61 2.71 2.64 2.59 2.60 2.64 2.56 2.60 2.57 2.48 2.60 2.61 2.55 2.66 2.69 2.56 2.64 2.67 a) Realice un análisis exploratorio de estos datos (obtenga un histograma y vea el comportamientos de los datos obtenidos). b) Estime con una confianza de 95%, ¿cuál es el CO2 promedio por envase? c) Se supone que μ debe ser igual a 2.75. Dada la evidencia, ¿es posible rechazar tal supuesto? d) Con los datos anteriores, estime con una confianza de 95% la desviación estándar del proceso. e) De los datos muestrales se observa que el mínimo es 2.48 y el máximo 2.73, ¿por qué el intervalo obtenido en el inciso b) tiene menor amplitud?
S olución
Datos
̅ , √
= 2.5 ES = 3.0 . = 95% = 68 = 0.05
(−)
V = n – 1 IC de 95% (2.57987, 2.60693)
= 2.5934
= 0.0559
Datos Obtenidos en Minitab
a) Existe un rango mayor de datos obtenidos dentro de un rango de 2.55 a 2.60 donde se demuestra que los niveles de CO2 aproximadamente están en este intermedio. b) El promedio de CO2 promedio por envase esta entre 2.57987 y 2.606692. c) No, la media de 2.75 es incorrecta porque está por debajo del límite inferior. d) La desviación estándar del proceso es de 0.0559 e) Porque la mayor parte de los datos se concentró en un rango de 2.55 a 2.60 dejando así menor amplitud que en la de datos muéstrales, que aún se desconocen.
15. Una característica importante en la calidad de la leche de vaca es la concentración de grasa. En una industria en particular se fijó como estándar mínimo del producto que se recibe directamente de los establos lecheros sea de 3.0%. Por medio de 40 muestreos y evaluaciones en cierta época del ano se obtuvo que X= 3.2 y S = 0.3. a) Estime con una confianza de 90% el contenido promedio de grasa poblacional. b) ¿Cuál es el error máximo de estimación para la media? ¿Por qué? c) Estime con una confianza de 95%, ¿cuál es la desviación estándar poblacional? d) ¿Qué puede decir acerca de la cantidad mínima y máxima de grasa en la leche? ¿Es posible garantizar con suficiente confianza que la leche tiene más de 3.0% de grasa? Sugerencia: aplique la regla empírica.
S olución
a) Contenido promedio de grasa: Datos:
Aplicando la fórmula:
̅ ±∝ √ ∝ =1.64 ; 90% [ ; ]=3.2 ±1.64 √ 0.430 [ ; ] =[ 3.1222;3.2778]
Donde:
Reemplazando datos:
b) Error máximo para la media:
c) Desviación estándar poblacional: Utilizando la fórmula:
(1) (1) ⌊ ; ⌋= ; − ⌊ ; ⌋ =√ 0.0801;√ 0.1898 ⌊ ; ⌋=0.2830;0.4357
∴ ó :. .
d) La cantidad de 3% de grasa esta dentro de los parámetros y la curva de distribución normal muy cerca del promedio y con un nivel de confianza considerable
16. En la fabricación de discos compactos una variable de interés es la densidad mínima (grosor) de la capa de metal, la cual no debe ser menor de 1.5 micras. Por experiencia se sabe que la densidad mínima del metal casi siempre ocurre en los radios 24 y 57, aunque en el método actual también se miden los radios 32, 40 y 48. Se realizan siete lecturas en cada radio, lo cual da un total de 35 lecturas, de las cuales solo se usa la mínima. A continuación se presenta una muestra histórica de 18 densidades mínimas: 1.81, 1.97, 1.93, 1.97, 1.85, 1.99, 1.95, 1.93, 1.85, 1.87, 1.98, 1.93, 1.96, 2.02, 2.07, 1.92, 1.99, 1.93. a) Argumente en términos estadísticos si las densidades mínimas individuales cumplen con la especificación de 1.5 micras. Sugerencia: aplique la regla empírica. b) Encuentre un intervalo de confianza de 99% para la media de la densidad mínima. c) Proporcione un intervalo de confianza de 99% para la desviación estándar. d) Dibuje el diagrama de cajas para los datos e interprete los resultados.
S olución
Para la solución de este problema nos ayudaremos del programa Minitab: a) X: densidad mínima (grosor) micras Variable Aleatoria Continua (MEDICION) Especificación Inferior: Ei= 1,5 micras Regla Empírica: μ ± 3 σ (Es lo mismo que los limit es reales)
El proceso es capaz ya que los datos se encuentran muy por encima de la especificación inferior tanto así aplicando 6 sigma se obtiene un límite μ±6σ de 1.5522 es decir que de 1 millón de CD existen “0” que no
cumple esa calidad. Como se puede apreciar en el siguiente gráfico:
b) Intervalo de confianza la media: Para hallar el intervalo de confianza de la “μ” Como la varianza poblacional es desconocida se aplica “1T”
Utilizando el Minitab: T de una muestra: Densidad
Interpretación: “Se puede afirmar con un 99% de confianza que la media
verdadera de la densidad mínima se encuentra entre 1.8959 y 1.9841 micras”
c) Intervalo de confianza para la desviación estándar Para hallar el intervalo de confianza de la “σ”, para lo cual es necesario
determinar si los datos siguen o no una distribución NORMAL para lo cual utilizamos la prueba o TEST de NORMALIDAD prueba de KOLMOGOROV como se observa a continuación:
Se concluye que los datos siguen una DISTRIBUCIÓN NORMAL Hallando el intervalo de confianza para la σ se obtiene
Prueba e IC para una desviación estándar: Densidad
Interpretación: “Se puede afirmar con un 99% de confianza que la σ
verdadera de la densidad mínima se encuentra entre 0.0446 y 0.1116 micras”
d) Diagrama de cajas
Del diagrama de cajas se observa que el 50% de los datos es superior o Inferior a 1.94 micras, los datos se encuentran muy por encima de la especificación Inferior.
17. En una auditoria se seleccionan de manera aleatoria 200 facturas de las compras realizadas durante el año, y se encuentra que 10 de ellas tienen algún tipo de anomalía. a) Estime con una confianza de 95% el porcentaje de facturas con anomalías en todas las compras del ano. b) ¿Cuál es el error de estimación? ¿Por qué? c) ¿Qué tamaño de muestra se tiene que usar si se quiere estimar el porcentaje de facturas con anomalías con un error máximo de 2%?
S olución
Datos:
=10 =200 =0. 0 5 . =95% , =0.05%
a) Fórmula a utilizar:
) [ ; ] =±( (1 ∝ =1.96 ; 95% ) 0 5 [ ; ] =0.05±1.96( 0.05(10. 200 [ ; ] =[0.019;0.080] b) Error de Estimación
) =( (1 =0.0302 c) Utilizando la fórmula siguiente:
(1) = 1. 9 6 0 5) = .(0.0.05)(10. 02 =456.19
18. En la producción de una planta se está evaluando un tratamiento para hacer que germine cierta semilla. De un total de 60 semillas se observó que 37 de ellas germinaron. a) Estime con una confianza de 90% la proporción de germinación que se lograra con tal tratamiento. b) Con una confianza de 90%, ¿Es posible garantizar que la mayoría (más de la mitad) de las semillas germinaran? c) Conteste los dos incisos anteriores pero ahora con 95% de confianza.
S olución
Datos:
=37 =60 =0.6166 . =90% , =0.10% a) Utilizando la siguiente fórmula:
[ ; ]=±( (1) ∝ =1.64 ; 90% ) 6 166 [ ; ]=0.6166±1.64( 0.6166(10. 60 [ ; ] =[0.5136;0.7198]
b) Sí, porque el porcentaje mínimo es de 51.36% y el máximo 71.98%
c) Usando la misma fórmula que en a, se obtiene:
∝ =1.96 ; 95% ) 6 166 [ ; ] =0.6166±1.96( 0.6166(10. 60 [ ; ]=[0.4935;0.7396] Con el 95% de nivel de confianza, no se garantiza que germinaran la mayoría de las semillas ya que el mínimo porcentaje es de 49.35%, no llega al 50%
19. Para evaluar la efectividad de un fármaco contra cierta enfermedad se integra en forma aleatoria un grupo de 100 personas. Se suministra el fármaco y transcurrido el tiempo de prueba se observa x = 65 personas con un efecto favorable. a) Estime con una confianza de 90% la proporción de efectividad que se lograra con tal fármaco. Realice una interpretación de los resultados. b) ¿Con base en lo anterior se puede decir que a la mayoría de las personas (más de la mitad) les hizo buen efecto el fármaco? c) ¿Qué tamaño de muestra debe usarse si se quiere tener un error de estimación máximo de 4% (0.04)?
S olución
Datos:
=65 =100 =0. 6 5 . =90% , =0.10%
a) Utilizando la siguiente fórmula:
) [ ; ] =±( (1 ∝ =1.64 ; 90% ) 6 5 [ ; ] =0.65±1.64( 0.65(10. 100 [ ; ]=[0.628;0.672] Con una confianza del 90% se estima que p esta entre 62.8% y 67.2% b) Con lo realizado en el inciso a) se confirma que más de la mitad de las personas les hizo bien el fármaco c) Utilizando la fórmula siguiente:
(1) = 1. 6 4 6 5) = .(0.0.65)(10. 04 =382.4275
20. Con respecto al problema del ejercicio 11, los datos anteriores al diseño de la prueba continua muestran lo siguiente: de n = 120 envases de plástico probados para ver si tenían la resistencia mínima de 50 kg de fuerza, x = 10 envases no pasaron la prueba. a) Estime con una confianza de 95% la proporción de envases que no tienen la resistencia mínima especificada. Haga una interpretación de los resultados. b) ¿Cuál es el error de estimación? c) Calcule el tamaño de muestra que se necesita para que el error de estimación máximo sea de 0.03.
S olución
Datos:
a) Utilizando la siguiente fórmula
) [ ; ] =±( (1 ∝ =1.96 ; 95% ) 0 83 [ ; ] =0.083±1.96( 0.083(10. 120 [ ; ]=[0.0336;0.1324]
Con una confianza del 95% se estima que p esta entre 3.36% y 13.24%, esta estimación refleja que hay una muy pequeña proporción que no pasaron la prueba de resistencia.
b) Hallando el error de estimación
) =( (1 ) 0 83 =1.96( 0.083(10. 120 =0.0493 c) Tamaño de la muestra
(1) = 1. 9 6 0 83) = .(0.00.83)(10. 03 =324.875