PRE GRADO
PROFESORES
:
LINEA DE ESTADÍSTICA
TÍTULO
:
CUADERNO DE TRABAJO
FECHA
:
Marzo de 2017
CURSO
:
ESTADÍSTICA
CÓDIGO
:
MA444
ÁREA
:
CIENCIAS
CICLO
:
2017-01
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
UPC
3
Unidad 1. Organización de datos Logro de la unidad Al finalizar la unidad el alumno organiza adecuadamente las observaciones o datos para facilitar la comprensión de los mismos, con ayuda del programa Minitab.
1.1 Definiciones Estadística
Es la ciencia de los datos, implica la colección, clasificación, síntesis, organización, análisis e interpretación de los datos.
1.2 Clasificación Estadística Esta dística descrip tiva
Es la rama de la Estadística que se dedica al análisis, descripción y representación de un conjunto de datos. Obteniéndose conclusiones sobre las características de dicho conjunto. Estadística Esta dística i nferencial
Es la rama de la Estadística que desarrolla los procesos de estimación, análisis y pruebas de hipótesis de un conjunto de datos extraídos de una muestra, con el propósito de llegar a tener conclusiones acerca de una población.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
4
Elemento o unidad elemental
Es cada una de las entidades acerca de las cuales se reúnen los datos. Ejemplo
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro de Información, se puede considerar como elemento a un estudiante de ingeniería de la UPC matriculado en el semestre 2014-2. Población
Es un conjunto de elementos, (personas, objetos, etc.), que tienen una o más características observables que se pueden medir en ellos. Ejemplo
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro de Información, se puede considerar como población a todos los estudiantes de ingeniería de la UPC matriculados en el semestre 2016-2. Muestra
Se denomina muestra a una parte de la población. Ejemplo
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro de Información, se puede considerar como muestra a un subconjunto de estudiantes de ingeniería de la UPC matriculados en el semestre 2016-2.
Ejercicio
Se realizó un estudio para determinar la temperatura diaria promedio en la UPC al medio día durante los meses de enero, febrero y marzo. Determine la población, muestra y elemento.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
5
Ejercicio
El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el departamento de Lima y las consecuencias que éste podría generar en el Cercado de Lima. Por esta razón, Defensa Civil ha decidido realizar un diagnóstico de la situación de las viviendas en éste distrito encuestando a 1200 viviendas seleccionadas al azar. Parte de la encuesta se presenta a continuación: Encuesta de vivienda
1. Tiempo de antigüedad de la vivienda Menos de 10 años Entre 10 y 20 años Más de 20 años 2. Material de construcción de la vivienda: Cemento Adobe Quincha Prefabricado 3. Número de habitaciones: ____________ 4. Área de terreno: __________ m 2 5. La vivienda se encuentra en: Buen estado de conservación Regular estado de conservación Mal estado de conservación
Complete la siguiente Ficha técnica: Fecha: Del 02 al 15 de marzo del 2015 Población: ____________________________________________________________________________________ Muestra: _____________________________________________________________________________________ Unidad elemental: ______________________________________________________________________________ Con 95% de confianza y 3% de margen de error.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
6
1.3 Tipos de datos Cuantitativos, son los que representan la cantidad o el número de algo. Cualitativos o categóricos, son los que no tienen una interpretación cuantitativa; sólo pueden clasificarse en categorías.
1.4 Variables Variable es una característica de interés de los elementos. Clasificación de variables Variable cualitativa
Es la característica cuyos valores se expresan en escala nominal u ordinal. Por ejemplo, carreras universitarias, materiales de construcción y tipos de resistencias. Variable cuantitativa
Es la característica cuyos valores se expresan en escala de intervalo o de razón. Se dividen en: Discretas Continuas Variable cuantitativa discreta
Es aquella variable cuyo resultado sólo puede tomar un número finito o infinito numerable de valores. Estos valores surgen de un proceso de conteo. Por ejemplo, número de artículos defectuosos producidos diariamente o número de columnas de concreto necesarias en la construcción de un puente. Variable cuantitativa continua
Es aquella variable cuyo resultado puede tomar infinitos valores entre dos valores cualesquiera. Estos valores surgen de un proceso de medición. Por ejemplo, temperatura de ignición de un gas, resistencia del concreto a la compresión o tiempo de corte de un torno corriente.
7
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la empresa está fabricando hierro esponja, palanquillas de acero, barras helicoidales, alambrón y barras de construcción y tiene una capacidad de 680,000 toneladas al año. Uno de los mercados a los que más se orientan los productos es el mercado de la construcción de Lima. Al departamento de control de calidad se le ha encargado realizar un estudio sobre las varillas devueltas a la fábrica. Al seleccionar una muestra aleatoria de 80 barras de aceros de la sección de devoluciones del almacén, se midieron algunas características de acuerdo a la siguiente ficha técnica: N° de barra:___________ 1.- Tipo de barra de acero:
Corrugado ASTM Corrugado Grado60 Corrugado NBR7480 Corrugado 4.7 mm
2.- El destino de uso de la barra de acero
Columnas Vigas Cimentación Concreto armado
3.- Resistencia a la tracción:________________ Kg/cm2 4.- Número de protuberancias:________________ 5.- Categoría del límite a afluencia
Alta Regular Baja
6.- Tipo de defecto
Escamas Pliegues Grietas
Marcas mecánicas Fisuras Porosidad
a. ¿Cuál es la población en estudio? b. ¿Cuál es la muestra? c. ¿Qué características medibles y observables surgen en este estudio?
Corrosión
Estadística (Civil/Electrónica/Telecomunicaciones)
8
UPC
Escalas de medició n de las variables
La escala de medición, permite determinar la cantidad de información que contienen los datos e indica el resumen de estos y el análisis estadístico más apropiado. Nominal
Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que se emplean para definir un atributo del elemento. Por ejemplo: el género de las personas, el estado civil, el número del celular, etc. Ordinal
Una variable está medida en escala ordinal cuando pueden ordenarse de acuerdo a algún criterio. Se pueden ordenar en forma ascendente o descendente. También, pueden registrarse por medio de un código numérico. Por ejemplo: el orden de mérito de los alumnos en el curso de Estadística, el grado de instrucción de los clientes de un banco, nivel socioeconómico de los alumnos de la universidad. Intervalo
Una variable está medida en escala de intervalo, si los datos tienen propiedades de datos ordinales y el intervalo entre observaciones, se expresa en términos de una unidad fija de medida. Los datos de intervalo siempre son numéricos. En esta escala, el cero es relativo, es decir, no indica la ausencia de la característica medida. Por ejemplo: las temperaturas en grados centígrados o en grados Fahrenheit. Razón
Una variable está medida en escala de razón si los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es significativo. En esta escala, el cero indica la ausencia de característica de la medida. Por ejemplo: el sueldo de los empleados de una empresa, el peso de los alumnos de la UPC. Ejercicio
1. Con la ficha de la Corporación Aceros Perú complete lo solicitado: Variable
Tipo de variable
Escala de medición
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
9
UPC
Ejercicios propuestos
El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el departamento de Lima y por las consecuencias que esto podría generar, especialmente en algunos distritos como el Cercado de Lima. Por esta razón Defensa Civil realizó un diagnóstico de la situación de las viviendas en el mencionado distrito a través de una muestra de 1200 viviendas seleccionadas al azar. Se registraron las siguientes variables: I. Años de construcción. II. Tipo de vivienda(1 = Cemento, 2 = Adobe, 3 = Quincha, 4: Material prefabricado) III. Número de habitaciones por por vivienda. IV. Área del terreno en donde se construyó la vivienda. a. De acuerdo al enunciado anterior identifique la población y la muestra. b. Identifique el tipo y escala de medición de las variables mencionadas. es una compañía dedicada a brindar servicios informáticos a empresas que desean ComputerSoft es
tener una presencia firme y contundente en la red. Esta compañía se dedica al tendido de redes LAN, instalación de equipos, servidores y toda una gama de productos tecnológicos que puedan resultar imprescindibles para una empresa. Como parte de un estudio realizado por se analizó la información correspondiente a una muestra de 30 empresas en la ComputerSoft se ciudad de Lima a las que se les brindó los servicios informáticos. Identifique el tipo y escala de medición de las variables consideradas en dicho estudio. Variable
Tipo de variable
Escala de medición
Lenguajes de programación (Cobol, Java, etc) Cantidad de servidores por empresa Costo de las licencias de software (en dólares) Año de instalació n del software
La empresa de investigación de mercados AlphaDatum S.A. realizó un estudio para evaluar el efecto de la caída de la bolsa de valores de Lima (BVL) en las administradoras de fondos de pensiones (AFP). En este estudio se tomó una muestra de 300 afiliados entre 25 y 35 años en Lima seleccionados al azar. Se registraron las siguientes variables: I. AFP a la que pertenece el afiliado (1 = Futuro Sólido, 2 = Siempre Contigo, 3 = Forever) II. Monto del fondo del afiliado (en soles) III. Edad del afiliado (en años) IV. Tipo de fondo según riesgo (1 = Bajo riesgo, 2 = Riesgo moderado, 3 = Alto riesgo) a. De acuerdo al enunciado anterior identifique la población y la muestra. b. Identifique el tipo y escala de medición de las variables mencionadas.
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
UPC
10
Indique el tipo y la escala de medición de las características observadas en una muestra de secciones de tuberías de agua. Variable
Tipo de variable
Escala de medición
Diámetro de la tubería (pulgadas)
Material de la tubería
Año de instalación
Ubicación (subterránea, aérea)
Longitud de la tubería (pies)
Estabilidad del suelo circundante (inestable, moderadamente estable o estable)
Corrosividad del suelo circundante (corrosivo o no corrosivo)
1.5 Organización de datos datos cualitativos Frecuencia Fre cuencia absolu ta ( f f i) de la categor ía
La frecuencia absoluta ( f i) de una categoría, está dada por el número de repeticiones en las observaciones que presenta esta categoría. Frecuencia relativa ( h hi) de la categoría
La frecuencia relativa ( hi) de una categoría está dada por la proporción del número total de observaciones que caen en esa categoría Frecuencia relativa acumulada ( H i) de una categor ía
La frecuencia relativa acumulada de una categoría, está dada por la proporción del número total de observaciones que caen hasta esa categoría.
11
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
Ejemplo
La siguiente información muestra la distribución de una muestra de viviendas de un determinado distrito de Lima según material con el cual fue construido. Distribución de viviendas según material de construcción Material de construcción
fi
hi
Cemento
48
0,160
Adobe
100
0,333
Quincha
108
0,360
Material pre fabricado
44
0,167
300
1,000
Total
Interprete: Interprete: f 2
h2
Ejemplo
Se tiene información para una muestra de instituciones peruanas sobre los dominios de segundo nivel registrados bajo la categoría .pe. Título: …………………………………………………………………………………………….. Dominio
f
h
p
com.pe
285
0.570
57.0 57.0
org.pe
106
0.212
21.2
edu.pe
64
0.128
12.8
gob.pe
26
0.052
5.2
net.pe
3
0.006
0.6
Otros
16
0.032
3.2
Total
500
Estadística (Civil/Electrónica/Telecomunicaciones)
12
UPC
Interprete:
f 2
h2
Gráfico d e barras y sector cir cular
Para representar gráficamente la distribución de frecuencias de una variable cualitativa se utilizan las barras y los sectores circulares. Si trabajamos con variables nominales las categorías pueden ser colocadas en cualquier orden. En el caso de escala ordinal las categorías deberán ser colocadas en orden. Ejemplo
La siguiente información muestra la distribución de una muestra de viviendas de un determinado distrito de Lima según material con el cual fue construido. Distribución de viviendas según material de construcción Material de construcción
fi
hi
Cemento
48
0,160
Adobe
100
0,333
Quincha
108
0,360
Material pre fabricado
44
0,167
300
1,00
Total
El gráfico circular se presenta a continuación:
Fuente: Propia
Estadística (Civil/Electrónica/Telecomunicaciones)
13
UPC
Elabore el gráfico de barras para el ejercicio anterior.
Ejercicio
La empresa “PC Review – Perú” está interesada en conocer cuál es el programa de Microsoft Office que más utilizan los empleados de las empresas de la ciudad de Lima. Por tal motivo se seleccionó una muestra de 500 empleados y se les pidió que indicaran el programa que más usaba. La información se presenta a continuación: Distribución de empleados según tipo de programa de Microsoft que usan Tipo de programa de Microsoft
Número de empleados (fi)
Access
50
MS Excel
101
MS Power Point
90
MS Word
113
Outlook
101
Otros
45
Total
500
Fuente: PC-Review-Perú
hi
pi% = hi *100%
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
14
Complete los siguientes gráficos:
120
Categoría Access Ms Excel Ms Power Point Ms Word Otros Outlook
100
80
60
40
20
0 Access
Ms Excel Ms Power Point Ms Word
Otros
Outlook
Fuente:
Fuente:
Gráfico d e Pareto
El diagrama de Pareto es un gráfico de barras ordenado por frecuencia, en orden descendente, también se dice, ordenado por orden de prioridad. Permite mostrar gráficamente el principio de Pareto: “el 80% de los problemas se pueden solucionar, si se eliminan el 20% de las causas que los originan” (pocos vitales, muchos triviales) . Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los defectos surgen de un número pequeño de causas. Este diagrama es un caso particular de gráfico de barras, que es utilizado básicamente para: i) Conocer cuál es el factor o factores más importantes en un problema. ii) Determinar las causas principales del problema. iii) Decidir el objetivo de mejora y los elementos que se deben mejorar. Pasos para realizar el gráfico de Pareto: i) Recolectar datos y clasificarlos por categorías. ii) Ordenar las categorías de mayor a menor, según la frecuencia fi, indicando el número de veces que se ha producido.
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
15
iii) La categoría “ Otros” debe ser colocada en la última posición, no importando cuán grande sea esta categoría. iv) Dibuje dos ejes verticales y uno horizontal. En el eje vertical derecho marque con una escala de 0% a 100%; en el eje vertical izquierdo, marque una escala de 0 hasta el número total de observaciones o de 0% a 100%; en el eje Horizontal, marque los espacios donde estarán dibujadas las barras para cada una de las categorías, incluida la catego ría “otros”. v) Calcular los porcentajes individuales y acumulados de cada categoría. vi) Elabore el diagrama de barras y dibuje la línea de frecuencias acumuladas (curva de Pareto) en función de los datos obtenidos anteriormente. Ejemplo
La siguiente tabla muestra información sobre los defectos observados con mayor frec uencia en los puentes vecinales construidos en estructura de madera de cierta localidad del interior del país: Distribución de puentes vecinales según defectos observados Defectos observados
f i
Pandeos y rajaduras
40
Pudrimiento de las piezas de madera
30
Efectos del desgaste mecánico
20
Otros
5
Deformaciones
15
Ataques de insectos y crustáceos
10
Acción de fuego
5
Complete el diagrama de Pareto obtenido por Minitab para poder identificar los principales defectos en este tipo de puentes. ¿Qué defectos deberán priorizarse?
16
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Diagrama de Pareto de Defectos 140 100
120 100
a i c n e u c e r F
80
80
60
60
40
40 20
20 Defectos
0
0
j s t o t e r a s y C n e e n a y i o s i s s g t o i m a c r e o D e e c d m d r s n o n P u I e f P a D
Frecuencia Porcentaje % acumulado
e j a t n e c r o P
40 32.0 32.0
30 24.0 56.0
20 16.0 72.0
15 12.0 84.0
o e g u F
10 8.0 92.0
5 4.0 96.0
t r o O
5 4.0 100.0
Ejercicio
1. El jefe de control de calidad de la empresa “Mundo” es tá interesado en conocer cuáles son las principales causas que están afectando la producción. Al seleccionar una muestra de 450 artículos fallados obtuvo los siguientes resultados: Causas
Cantidad
Inestabilidad máquina
56
Cambios ambientales
191
Rotura máquina
35
Cansancio operador
11
Desgaste del equipo
3
Desviación del material
5
Fluctuación energía
9
Error de medición
10
Partida fría
8
Rotura de operador
122
Total
450
Distribución de
………………………….………….
Causas
17
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
según principales causas que afectan la producción
fi
hi
Cambios ambientales
191
0,424
Rotura de operador
122
0,271
Inestabilidad máquina
56
0,124
Rotura máquina
35
0,078
Cansancio operador
11
0,024
Error de medición
10
0,022
Fluctuación energía
9
0,020
Partida fría
8
0,018
Desviación del material
5
0,011
Desgaste del equipo
3
0,007
450
1,000
Total
Fi
Hi
Fuente: Departamento de producción
Complete el diagrama de Pareto agrupando en la categoría “Otros” las categorías cuyos porcentajes sean menores al 10%. Identifique las principales causas que resuelvan el 80% de los problemas de producción.
500 100
400 80
300 60
200
19 1 40
12 2
100
56
0
11
s
r
a
r
at
d u
ni
a u
d
e
á
Causas le
o r
a
i
r b at s
o
122 27.1 69.6
n a R
ut R
c o
r b
191 42.4 42.4
oi ut
idl
io C
o a
a
s a
p m
d d
m
e
m e
a
O r
á
o m
rt
q
p b
0 o
a
q
ei
35
o ni
a n
Conteo Porcentaje % acumulado
20
35
s n a
e C n I
56 12.4 82.0
Fuente: ……………………………………………..….
35 7.8 89.8
11 2.4 92.2
35 7.8 100.0
e j a t n e c r o P
18
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
1.6 Tabulaciones cruzadas También llamadas tablas de contingencia o de doble entrada. Se usan para resumir de manera simultánea los datos para dos variables.
Ejercicio
Un estudio realizado por A&C Consultores sobre los tipos de riesgos asociados a las excavaciones de zanjas y tipo de terreno, arrojó los siguientes resultados en base a una muestra de 500 obras de construcción: Distribución de las obras de construcción según tipo de terreno y riesgo más importante Tipo de riesgo más importante Tipo de terreno
Atrapamiento
Caída de personal
Derrumbe
Inundaciones
Otros
Total
Roca blanda
27
66
51
9
25
178
Roca dura
15
53
38
3
9
118
Tierra arcillosa
9
31
17
1
10
68
Tierra fuerte
17
55
36
10
18
136
68
205
142
23
62
500
Total Fuente: Consultores A&C
Complete los espacios en blanco. El número de obras de construcción cuyo tipo de terreno son de roca dura y presentan riesgo de derrumbe es: ………………… Del total de obras que presentan riesgo de atrapamiento, e l ………….…….% son de tierra fuerte.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
19
¿Cuál es el porcentaje de obras de construcción con riesgo de inundación y roca dura? ……………….
Gráfico de barras agrupadas
Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El alto de cada barra es proporcional a la frecuencia de cada categoría.
Gráfico de barras apiladas
Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada categoría. El alto de cada barra es proporcional a la frecuencia de cada categoría.
20
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Gráfico d e barras apil adas al 100%
Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada categoría. El alto de cada barra es el mismo para cada categoría.
Ejercicio A continuación, se muestra la información de una tabla de contingencia y un gráfico incompleto para las variables lugar de destino y nacionalidad. Distribución de pasajeros según su lugar de destino y nacionalidad
Lugar de destino Arequipa Cuzco Miami México D.F Piura Río de Janeiro Total Fuente: Wayra S.A
Nacionalidad Peruana Extranjero 8 8 15 20 20 10 22 10 2 7 23 5 90 60
Total 16 35 30 32 9 28 150
Estadística (Civil/Electrónica/Telecomunicaciones)
21
UPC
Complete todos los elementos del siguiente gráfico. Distribución de pasajeros según su lugar de destino y nacionalidad 18% 16% 14% 12% 10% Peruano
8%
Extranjero 6% 4% 2% 0% Arequipa
Cuzco
Miami
México D.F
Piura
Río de Janeiro
Complete todos los elementos del siguiente gráfico.
100% 17.9%
90% 33.3%
80%
31.3%
50.0%
70% 77.8%
60% 50%
Extranjero
40%
Peruana
30% 20% 10% 0% Arequipa
Cuzco
Miami
México D.F
Piura
Río de Janeiro
22
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Complete todos los elementos del siguiente gráfico.
100% 90%
25.6%
80% 2.2%
70%
Río de Janeiro
24.4%
60%
Piura México D.F
50%
Miami
40%
22.2%
Cuzco
30%
Arequipa
20%
16.7%
10%
13.3%
8.9% 0% Peruana
Extranjero
Estadística (Civil/Electrónica/Telecomunicaciones)
23
UPC
Ejercicios propuestos
La empresa “PC Review Perú” realizó un estudio a una muestra a 500 directores de empresas de la ciudad de Lima. Los resultados obtenidos a la pregunta ¿cuál de los programas de Office usaba con mayor frecuencia? se resumen a continuación: Programa de Microsoft de uso más frecuente
Cantidad de directores de empresas
Access
30
MS Excel
80
MS Power Point
75
MS Word
250
Outlook
55
Otros
10
Total
500
Construya el diagrama de barras y sector circular para la información anterior.
BetaSystems S.A.
es una empresa dedicada a la importación y venta de monitores. Suponga que usted es el encargado de analizar los datos registrados correspondientes a las marcas de los monitores vendidos. La información procesada se muestra en el siguiente gráfico:
Distribución porcentual de monitores según marca
Construya el diagrama de Pareto para poder identificar la estrategia de ventas más conveniente para la empresa. Comente sus resultados.
En la siguiente tabla se muestran los resultados obtenidos en un estudio realizado en la ciudad de Ica por un grupo de profesionales de la UPC de la facultad de Ingeniería sobre las fallas estructurales en las edificaciones debido al último sismo que tuvo como epicentro la ciudad de Nazca. Fallas estructurales
Porcentaje
Columnas cortas
10%
Configuración del edificio
45%
Problemas geotécnicos
30%
Otros
10%
Piso blando
5%
24
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Construya un diagrama de Pareto para identificar las fallas estructurales que tienen mayor incidencia en las edificaciones en la ciudad de Ica debido al último sismo mencionado. La siguiente tabla muestra la distribución de clientes de la empresa de telefonía según sus principales quejas. Distribución de clientes según principales quejas Principales Quejas
Frecuencia
Cambios sin consentimiento
246
Tarifas y servicios
106
Forzamiento al cambio
29
Marketing
74
Llamadas internacionales
14.5
Maltratos
12.5
Servicio de operadora
hi
Fi
Hi
18
Construya el diagrama de Pareto para la variable en estudio. Considere un acumulado de menos de 8% para la categoría Otros. ¿Cuáles son las quejas que deberán priorizarse? A una muestra de 95 hombres y 155 mujeres se formuló la siguiente pregunta: ¿Por qué usa el servicio de taxi mediante una aplicación? Los resultados obtenidos se muestran en los siguientes gráficos: Gráfico 2
Gráfico 3
1.0
100%
0.9
0.32
0.8
0.36
80%
59%
0.7
60%
A
0.6
0.15
0.5
65% Masculino
Reunión Estudio
0.4
D
Femenino
40%
Trabajo
0.3
0.56
0.2
B
20%
C
33%
E
Estudio
Reunión
0%
0.1
Trabajo
0.0 Masculino
a. b. c. d.
Femenino
Indique el título del gráfico 2 y el título del gráfico 3 Complete los elementos faltantes de los gráficos 2 y 3. Del total de encuestados que usan la aplicación de taxi por trabajo, ¿cuántos son mujeres? Del total de hombres, ¿cuántos prefieren usar el servicio de taxi por reuniones?
Estadística (Civil/Electrónica/Telecomunicaciones)
25
UPC
Dos preguntas realizadas fueron: ¿ Qué tipo de viaje realiza usualmente? ¿Qué opinión tiene del servicio de hotel de los lugares que visitó? Los resultados se muestran en la tabla siguiente. Tabla 2: ……………………………………………………………………………………..… Opinión
Tipo de viaje
Total
Descanso
Diversión
Nuevos lugares
Bueno
13
15
23
51
Malo
10
7
22
39
Muy bueno
8
5
12
25
Muy malo
6
11
18
35
Regular
7
8
15
30
44
46
90
180
Total
Fuente: “Perú País de culturas S.R.L.”
a. En la tabla 2, interprete la celda sombreada por fila, por columna y por el total general. b. Presente la tabla relativa con respecto al total de columna y elabore el gráfico apropiado. c. Complete el siguiente gráfico:
26
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
1.7 Organización de datos cuantitativos discretos Frecuencia acumulada ( Fi)
Representa el número de observaciones que caen hasta esa categoría. Tabla de distribución de frecuencias: Título Variable
fi
hi
Fi
Hi
0
f1
h1
F1
H1
1
f2
h2
F2
H2
2
f3
h3
F3
H3
.
.
.
.
.
k
fk
hk
n
1
Total
n
1
Fuente: ………………………………..…………..
Gráfico de bastones
Es un gráfico para variable cuantitativa discreta donde se representan los valores de la variable y sus respectivas frecuencias absolutas o relativas. Título: ...........................................................................................................................................................
27
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
El jefe de Recursos Humanos desea información de la cantidad de faltas que han tenido los trabajadores en el mes anterior. Por tal razón seleccionó al azar a 30 trabajadores y registró el número de faltas. 0
0
0
0
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
4
4
Título: ……………………………………………………………………………………………………………
Número de faltas
fi
hi
Fi
Hi
0
4
0,133
4
0,133
1
8
0,267
12
0,400
2
10
0,333
22
0,733
3
6
0,200
28
0,933
4
2
0,067
30
1,000
Total
30
1,000
Fuente: ………………………………………….………..
a.
Con la información anterior, complete los espacios en blanco: El porcentaje de trabajadores que asisten es: ____________________ El número de trabajadores que tienen a lo más dos faltas es:______________ Los trabajadores con problemas son aquellos con 3 o más faltas, ¿qué porcentaje de trabajadores tienen problemas?__________
b. Presente el gráfico adecuado para variable en estudio.
28
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
1.8 Organización de datos cuantitativos continuos Distribución de frecuencias para datos continuos
1) El rango ( R) o recorrido. R = dato máximo – dato mínimo 2) El número de intervalos k 1 3.322 log10 n . (redondeado al entero más próximo). 3) La amplitud del intervalo w = R/k. (redondeado por exceso y con el mismo número de decimales que tienen los datos). 4) Obtenga las frecuencias absolutas y relativas. 5) Obtenga la marca de clase: /
xi
Lím Inf i Lím Sup i 2
Ejercicio
Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de una planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las válvulas de control. Para ello se eligieron al azar 30 de ellos.
0.08
0.15
0.19
0.71
0.75
0.82
0.84
0.92
0.96
1.16
1.17
1.19
1.23
1.4
1.47
1.59
1.61
2.01
2.16
2.38
2.42
3.07
3.22
3.53
3.76
3.94
4.5
4.59
4.75
5.41
Calcule el rango ( R) o recorrido R = Determine el número de intervalos ( k ) k = Determine el tamaño del intervalo de clase (w) w =
Título: …………………………………………………………………………………………………………………..………………..
i
Intervalo
x’i
1
[
–
[
2
[
–
[
3
[
–
[
4
[
–
[
5
[
–
[
6
[
–
]
Fuente: …………………………………………………
fi
hi
Fi
Hi
Estadística (Civil/Electrónica/Telecomunicaciones)
29
UPC
Gráfico s: Histog rama, polígono y ojiv a
Son gráficas que representan las observaciones obtenidas de las variables cuantitativas continuas. HISTOGRAMA Es una gráfica de barras cuyas categorías son los intervalos de clase. Además, la altura de las barras está determinada por las frecuencias relativas de los intervalos de clase. Según el interés del estudio se pueden considerar también, las frecuencias absolutas.
POLÍGONO
OJIVA
30
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
1. Use la regla de Sturges para construir la tabla de distribución de frecuencias del monto de venta diario, en cientos de soles, de la empresa Beta Systems S.A. 52.0
94.7
95.1
97.5
102.5
104.1
106.0
125.2
125.6
146.0
146.8
158.6
158.7
162.6
166.2
166.2
166.2
166.2
168.2
169.7
196.0
204.9
204.9
204.9
204.9
208.3
215.2
217.5
218.1
218.1
218.1
218.1
220.9
226.2
235.0
239.7
242.2
259.6
261.6
277.2
286.5
287.0
297.8
313.9
315.0
316.2
338.6
359.9
363.1
398.3
Cálculos:
Título: ………………………………………………………………………………………………… Lim Inf
Lim Sup
x´i
f i
hi
Fi
Hi
Fuente: …………………………………………
a) El porcentaje de días que la empresa vende por lo menos 151,0 cientos de soles o menos de 200,5 cientos de soles es: _______________________ b) El número de días que venden menos de 299,5 cientos de soles es:_____________ c) La empresa estaría en superávit cuando su venta es de 299,5 cientos de soles o más ¿qué porcentaje de los días se tiene superávit?_________________ d) Cuando la venta supera 324,25 se considera un “buen día” para la empresa. ¿Qué porcentaje de
días son considerados como “buen día”? ____________________
31
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicios propuestos
Investigadores del Massachussets Institute of Technology (MIT) estudiaron las propiedades espectroscópicas de asteroides de la franja principal, con un diámetro menor a los 100 kilómetros. Los asteroides se observaron con el telescopio Hiltner del observatorio de MIT; se registró el número de exposiciones de imagen espectral independiente para cada observación. Aquí se presentan los datos de 40 observaciones de asteroides obtenidas de Science (9 de abril de 1993). Número de exposiciones de imagen espectral independientes para 40 observaciones de asteroides 3
4
3
3
1
4
1
3
2
3
1
1
4
2
3
3
2
6
1
1
3
3
2
2
2
2
1
3
2
1
6
3
1
2
2
3
2
2
4
2
Construir un gráfico de bastones para el número de exposiciones de imagen espectral. Complete la tabla y elabore un gráfico apropiado, usando las frecuencias porcentuales, para representar la información de la tabla siguiente. Luego interprete en términos del enunciado f 2 y H3. Título: ……………………………………………………………………………… Número de monitores con fallas
f i
0
30
1
10
2
5
3
3
4
2
hi
Hi
32
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Unidad 2 Medidas de Resumen Logro de la unidad Al finalizar la unidad el alumno será capaz de describir el comportamiento de un conjunto de datos a través de las medidas estadísticas de centro, posición, variabilidad y forma aplicado a problemas de su especialidad.
2.1 Métodos numéricos para describir datos cuantitativos Definiciones Parámetro
Es una medida de resumen que caracteriza a la población. Para obtener su valor se hace necesario contar con toda la información que brinda los elementos de una población. Por ejemplo, el promedio poblacional (µ), varianza poblacional (σ 2). Estadístico
Es una medida de resumen que caracteriza a la muestra. Para obtener su valor se utiliza la información muestral. A los valores obtenidos de un estimador se conoce como estimación. Por ejemplo: el promedio muestral ( ), varianza muestral (s2).
̅
Los parámetros y estadísticos de mayor uso son: Nombre
Parámetro
Estadístico
N
Promedio
μ
N
Varianza
σ2
.
i 1
i
X
N
i 1
N
p
Nº de éxitos N
X
S2
i
i 1
n
n
(X i μ) 2
σ
Desviación estándar
Proporción
X
n
X X
2
i
i 1
n-1
S p ˆ
Nº de éxitos n
33
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
2.2 Medidas de tendencia central indicando el valor alrededor del cual tienden a concentrarse ó distribuirse las demás observaciones. Lo que se persigue es conseguir un valor que sea representativo del conjunto de datos que se está analizando. Son aquellas que localizan el “centro” de una distribución,
Media aritmética
La media llamada también promedio, se define como el cociente de la suma de los valores observados de la variable en estudio y el número de observaciones. Características de la media
Es un estadístico o parámetro muy conocido y de fácil comprensión. Se puede calcular para variables de escala intervalo o razón. La mayor desventaja es que se ve afectado por valores extremos, es decir si hay valores muy pequeños o muy grandes la media no los representaría adecuadamente. n
Para datos simples (no agrupados) se calcula por
x
x
i
i 1
n k
f x i
Para datos discretos (agrupados) se calcula por
x
i
i 1
n k
f x i
Para datos continuos (agrupados) se calcula por
x
/
i
i 1
n
Ejemplo
Los siguientes datos son medidas de la resistencia al rompimiento (en onzas) de una muestra de hilos de lino: 15,2
15,8
16,2
18,5
19,4
20,6
21,2
21,9
25,4
27,3
28,3
29,5
32,5
33,7
n
x
x i 1
n
i
= x
(15,2 15,8 16,2 ... 32,5 33,7 36,9) 15
Media = 24,16 Interpretación: La resistencia promedio al rompimiento de los hilos es de 24,16 onzas.
36,9
34
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
1. Calcule e interprete la media para el número de hijos obtenida a partir de una muestra de 35 familias x
f i
0
13
1
6
2
8
3
6
4
2
xi*fi
2. Calcule el tiempo promedio de verificación, en horas, para una muestra de trabajadores Intervalo
f i
1
[0.02 - 0.81[
6
2
[0.81 - 1.60[
13
3
[1.60 - 2.39[
4
4
[2.39 - 3.18[
3
5
[3.18 - 3.97[
2
6
[3.97 - 4.76]
2
x’i
Mediana
Es el valor que ocupa el lugar central de un conjunto de datos ordenados. Por tanto es el valor que divide en dos partes a dicho conjunto de datos. Características de la mediana
Se puede calcular para variables medidas en escala intervalo o razón. El 50% de los datos tienen un valor menor o igual a la mediana. La mediana no se ve afectada por valores “extremos” (mínimo y máximo).
35
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Para datos no Agrupados: Si denotamos las observaciones ordenadas por x 1, x2, x3, ... , xn , la mediana pude representarse por:
me x n 1
Es el dato de la posición [(n+1)/2]
Si n es impar
2
x n x n me
2
2
1
2
Es el promedio de los datos que se encuentran en la posición: [n/2] y [(n/2)+1]
Si n es par
Ejemplo
Los datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) son: 9.84
9.98
9.98
9.99
10.00
10.00
10.05
10.12
10.26
25.00
Calcule e interprete el valor de la mediana. x n x n Me
2
2
2
1
=
x 5 x 6 = 10 2
Interpretación: El 50% de las baterías tienen una lectura máxima de 10 voltios Ejercicio
Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en una muestra de 150 días. Calcule e interprete el valor de la mediana. Número de piezas de defectuosas
Número de días
0
50
1
60
2
25
3
10
4
5
Fi
36
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Moda
La moda de un conjunto de datos es aquel valor que se repite con mayor frecuencia. Características de la moda
La moda se puede calcular para cualquier escala de medición. El valor de la moda no se ve afectada por valores extremos. La moda no siempre es un valor único. Un conjunto de datos puede tener dos modas (bimodal) o más de dos modas (multimodal). Se puede dar el caso de que el conjunto de datos no tiene moda.
Ejemplo
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje se presentan a continuación: 9,84
9,98
9,98
9,99
10,00
10,00
10,05
10,12
10,26
25,00
Moda = 10 Interpretación: La lectura de voltaje más frecuente es de 10 voltios. Ejercicio
Renacer S.A fabrica Hornos de Microondas, encargo al jefe de control de calidad que informe cual es el problema más frecuente encontrado en los hornos microondas. Se tomó una muestra del área de reparaciones y estos fueron los resultados: Problemas
Número de hornos
De capacidad de descongelación
6
Velocidad de calentamiento
14
Cable de alimentación
3
Fuga de la microondas
8
Frecuencia de la microondas (MHz)
9
Potencia de microondas (W)
10
Con la información presentada, ¿qué problema se presenta con mayor frecuencia?
Estadística (Civil/Electrónica/Telecomunicaciones)
37
UPC
Relacio nes entre la media, mediana y moda
Además de las medidas de tendencia central podemos estar interesadas en saber la forma que presenta el conjunto de datos. Para una distribución unimodal (una sola moda) se cumple de manera general lo siguiente: Si la distribución de frecuencias es simétrica (sesgo nulo)
Media = Mediana = Moda
Si la distribución es asimétrica cola a la derecha (sesgo derecho o positivo)
Moda < Mediana < Media
Si la distribución es asimétrica cola a la izquierda (sesgo izquierdo o negativo)
Media < Mediana < Moda
38
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
2.3 Medidas de posición o Cuantiles Se define así a un número real que divide a un conjunto de datos en dos partes con porcentajes especificados debajo y sobre éste valor. Para su cálculo, los datos deben estar previamente ordenados. Cuartil
Divide al conjunto de datos en 4 partes porcentualmente iguales. Se denotan Q 1, Q2 y Q3 que son los correspondientes percentiles P25 , P50 y P75 . Decil
Divide al conjunto de datos en 10 partes porcentualmente iguales, hay nueve deciles D 1, D2, …, D9 que son los correspondientes percentiles P10 , P20 , .., y P90 . Percentil
Divide un conjunto de datos en 100 partes porcentualmente iguales. Dado un percentil Pk, este divide el conjunto de datos en dos partes, la inferior que contiene el K% de datos y la superior que contiene el (100-k)% de datos.
(100-K)%
K% P K
Para datos no agrupados:
Primero debe ordenarse los datos en orden creciente o decreciente. Luego, para hallar el percentil Pk se sugiere los siguientes pasos:
Calcular el valor de la posición que ocupa el percentil Pk en la lista de datos ordenados que está determinada por la siguiente expresión:
Luego,
Pk
i
k (n 1)
100
E , d
X ( E ) 0, d * ( X ( E 1) X ( E ) )
Donde: E : parte entera y d : parte decimal Ejemplo
La compañía VIDRIMAX presenta un informe de sus diez tipos de envases más solicitados con sus respectivas producciones mensuales: 1980
2250
2450
2600
2980
3010
3019
3129
3289
3678
39
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Calcule e interprete el valor del percentil 25 Solución: observe que los datos ya se encuentran ordenados. Calcule la posición que ocupa el percentil P25 i
Pk
k (n 1)
100
E , d
i
25(10 1) 2,75 100
X ( E ) 0, d * ( X ( E 1) X ( E ) )
P25 = X2 + 0,75*(X3 - X2)
Reemplazando: P25 = 2250 + 0,75*(2450 – 2250) = 2400 Interpretación: El 25% de los tipos de envases de la compañía VIDRIMAX tiene una producción máxima de 2400 envases mensuales. Ejercicio
1. Suponga que los promedios ponderados de una muestra de 12 ingenieros civiles egresados se muestra a continuación: 14,5
15,5
15,5
16,2
16,2
16,5
16,5
17,0
17,1
17,3
17,5
17,6
Si se desea contratar a un egresado que pertenezca al quinto superior, ¿Qué percentil debe calcular y cuál es la nota mínima que debería de tener?
2. Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un ejercicio de escape del área. Para ello se registraron los siguientes tiempos, en minutos, empleados en la evacuación. 31.5
32.5
32.5
33.4
33.9
34.0
35.6
35.6
35.9
35.9
36.3
36.4
36.9
37.0
37.3
37.3
37.4
37.5
38.0
38.9
39.2
39.3
39.4
39.7
40.2
40.3
41.5
42.4
42.8
44.5
40
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
a. ¿Cuál es el tiempo mínimo registrado por el 18% de trabajadores que emplearon más tiempo en la evacuación de la plataforma?
b. ¿Cuál es tiempo máximo empleado por el 28% de trabajadores que emplearon menos tiempo en la evacuación de la plataforma?
3. Investigadores del Massachussets Institute of Technology (MIT) realizaron, 9 de abril de 1993, un estudio sobre asteroides. Al observar 40 de éstos asteroides con el telescopio Hiltner del observatorio de MIT; se registró el número de exposiciones de imagen espectral. Número de exposiciones de imagen espectral 1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
6
6
Elabore la Tabla de frecuencia Título:
……………………………………………………………………………………………………………………………..
Número de exposiciones 1 2 3 4 6 Total
f i
hi
Fi
Hi
41
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
a. El mínimo número de exposiciones obtenidos en el 15% de los asteroides con mayores exposiciones es: __________________que corresponde al percentil _____________________
b. Se desea categorizar a los asteroides según su número de exposiciones en categorías baja, media y alta ¿Cuáles serán los límites de estas si la categoría media contiene al 50% central de la cantidad de asteroides?
Ejercicios propuestos
Con base en un célebre experimento, Henry Cavendish (1731 -1810) ofreció evidencias directas de la ley de la gravitación universal de Newton. En el experimento se determinó el peso de masas de objetos, la medida de la fuerza de atracción se usó para calcular la densidad de la Tierra. Los valores de la densidad de la Tierra, en orden temporal por filas son: 5.36
5.29
5.58
5.65
5.57
5.53
5.62
5.29
5.44
5.34
5.79
5.27
5.39
5.42
5.47
5.63
5.34
5.46
5.30
5.75
5.68
5.85
Calcule e interprete el valor de los cuartiles.
5.10
42
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Zinder y Crisis (1990), presentaron un algoritmo híbrido para resolver un problema de programación matemática polinomial cero-uno. El algoritmo incorpora una combinación de conceptos pseudo booleanos y procedimientos de enumeración implícitos probados y comprobados. Se resolvieron 52 problemas al azar utilizando el algoritmo híbrido; los tiempos de resolución (tiempos de CPU en segundos) se listan en la siguiente tabla. 0.045
0.036
0.045
0.049
0.064
0.07
0.079
0.088
0.091
0.118
0.13
0.136
0.136
0.136
0.145
0.179
0.182
0.182
0.194
0.209
0.209
0.227
0.242
0.258
0.258
0.258
0.291
0.327
0.333
0.336
0.361
0.379
0.394
0.412
0.445
0.506
0.554
0.567
0.579
0.6
0.67
0.912
1.055
1.07
1.267
1.639
1.894
3.046
3.888
3.985
4.17
8.788
a.
¿Cuál es el tiempo máximo de resolución de un problema para ser considerado dentro del 10% de los más rápidos? b. ¿Cuál es el tiempo mínimo de resolución de un problema para ser considerado dentro del 20% de los menos rápidos c. Se desea categorizar a los problemas según sus tiempos de resolución en categorías normal, media y alta ¿Cuáles serán los límites de estas si la categoría media contiene al 50% central de la cantidad de problemas? Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribución de frecuencias simétrica de 5 intervalos de igual amplitud resultando que el ingreso mínimo es de 125 dólares y la marca de clase del cuarto intervalo es de 300 dólares. Si el 8% de los ingresos son menores que 175 dólares y el 70% de los ingresos son menores a 275 dólares. a. Determine las frecuencias relativas de cada intervalo. b. ¿Qué porcentaje de ingresos son superiores a $ 285? Investigadores del MassachussetsInstitute of Technology (MIT) estudiaron las propiedades espectroscópicas de asteroides de la franja principal con un diámetro menor a los 100 kilómetros. Los asteroides se observaron con el telescopio Hiltner del observatorio de MIT; se registró el número N de exposiciones de imagen espectral independiente para cada observación. Aquí se presentan los datos de 40 observaciones de asteroides obtenidas de Science (9 de abril de 1993). Número de exposiciones de imagen espectral independientes para 40 observaciones de asteroides 3
4
3
3
1
4
1
3
2
3
1
1
4
2
3
3
2
6
1
1
3
3
2
2
2
2
1
3
2
1
6
3
1
2
2
3
2
2
4
2
Calcule las medidas de tendencia central e interprete los resultados.
43
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
A continuación se presenta la distribución del número de camiones que atendió la planta de Lurín en cada obra con el
Distribución del número de camiones enviados a cada obra desde Lurín 16
objetivo de “ Evaluar indicadores en las atenciones que realiza la planta de Lurín”.
Calcule las medidas de tendencia central e interprete los resultados.
15
14 12
s
11
ra
b 10 o
9
e d or
8
7
e
6
m ú
6
N
4
4
3
2 0
1
2
3
4
5
6
7
Número de camiones Fuente: Tricon S.A.
Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué tanta tensión, en promedio, puede resistir este tipo de concreto. A continuación se presenta la tensión (en kg/cm2) obtenidos de una muestra de 30 bloques de concreto que se utilizarán para construir un puente. 1,2
2,1
2,2
2,2
2,5
2,5
2,6
2,6
2,7
2,8
3,0
3,0
3,2
3,2
3,2
3,4
3,4
3,5
3.5
3,6
3,6
3,6
3,6
3,7
3,8
3,9
3,9
4,0
4,0
4,0
Calcule las medidas de tendencia central e interprete los resultados.
2.4 Medidas de variación o dispersión Son aquellas que cuantifican que tan dispersos o concentrados se encuentran los datos respecto de una medida de tendencia central. Los datos que están relativamente cercanos entre sí, tienen bajas medidas de variabilidad, mientras que los que están más alejados entre sí tienen medidas de variación más grandes. Rango
El rango es una medida de variación de un conjunto de datos y se define como la diferencia entre el valor máximo y el valor mínimo. Es una medida inestable, ya que su valor cambia mucho ante datos extremos. Se calcula para variables en escala de medida de intervalo o razón Varianza
Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su media aritmética. Las unidades en las que queda expresada la varianza son unidades al cuadrado. Esta medida no tiene interpretación.
44
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
La varianza de una muestra se denota por s2, mientras que la de una población se denota por
2 Varianza poblacional N
2
x
i
2
i 1
N
Varianza muestral para datos simples n
x x
2
i
s2
i 1
n 1
Varianza muestral para datos agrupados discretos y continuos k
s
2
f x x i
2
k
i
i 1
s
n 1
2
f x x
2
/
i
i
i 1
n 1
Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza Se denota por s cuando es calculada de una muestra y por cuando es poblacional. Nota: Para calcular la varianza y desviación estándar usaremos su calculadora científica. Video: https://www.youtube.com/watch?v=Ds4vXpZ5jOw
Ejemplo
Calcule el rango, la varianza y la desviación estándar para la cantidad de plomo en una muestra de agua potable en miligramos por litro. 35
73
30
15
36
60
47
Varianza: ____________________ Desviación estándar: _______________
19
15
38
10
35
31
21
22
20
45
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
1. Calcule la varianza y desviación estándar del número de accidentes automovilísticos en una muestra de 100 días: xi
f i
0
10
1
15
2
30
3
35
4
10
100
2. Calcule la varianza y desviación estándar de los tiempos de exposición, en minutos, de un metal a una sustancia química. Los resultados de una muestra de 66 reacciones son las siguientes: I
Intervalos
f i
1
[15.2 – 17.2[
12
2
[17.2 – 19.2[
13
3
[19.2 – 21.2[
20
4
[21.2 – 23.2[
16
5
[23.2 – 25.2]
5
66
Calcule la varianza y desviación estándar.
xl i
46
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Coeficiente de variación
Es una medida de dispersión relativa libre de unidades por lo que es útil para comparar la variabilidad de dos o más grupos de datos expresados en distintas unidades de medida o cuando los promedios de los conjuntos de datos a comparar son diferentes. El coeficiente de variación proporciona una estimación de la magnitud de las desviaciones con respecto a la magnitud de la media CV
s x
100%
Rango intercuartil
Es la amplitud del 50% de los datos que se ubican en el centro de una distribución. No se ve afectada por valores extremos. RIC Q3
Q1 P75 P25
Rango
Es la diferencia entre el dato más grande y el más pequeño. R = Xmáx – Xmín Ejemplo
1. A continuación se presentan los tiempos de transmisión de un archivo, en segundos, evaluados en empresas que adoptaron la Tecnología WAN y la Tecnología LAN bajo condiciones similares. Tecnología LAN
Frecuencia
108
111
3
111
114
35
114
117
66
117
120
57
120
123
29
123
126
16
126
129
9
129
132
3
132
135
2
Total
220
Tecnología WAN 138 126 125 124 119 119 137 110 119 155 123 124
126
126
129
47
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Determine para qué tipo de Tecnología utilizada los tiempos de transmisión de datos son más homogéneos. Justifique numéricamente su respuesta. Tecnología WAN s = 10,45 x = 126,67 CV= 825%
Tecnología LAN s = 4,53 x = 118,02 CV= 3,84%
Interpretación: Los tiempos de transmisión de datos son más homogéneos para el tipo de tecnología LAN. Ejercicio
La empresa Electro, dedicada a la venta de artefactos electrónicos para el hogar, opera 200 tiendas en diferentes lugares del país. Los últimos informes indican que las ventas mensuales ha descendido a tal punto que se han tenido que cerrar algunas tiendas. El gerente, con el fin de enfrentar el problema, ha determinado que es necesario un estudio estadístico de las ventas semanales (en miles de soles) de un producto electrónico en tres de sus principales tiendas: Aptao, Azufral y Brento. Las muestras tomadas al azar de cada tienda arrojó los siguientes resultados: Ventas Aptao
Número de semanas
Ventas Brento
Número de semanas
100 – 200 200 – 300 300 – 400 400 – 500 500 – 600
5 14 21 7 3
20 40 60 80 100
2 8 25 20 8
Total
50
Total
63
Ventas Azufral
120
200
100
50
45
120
100
100
90
75
100
210
a. Calcule la media y la varianza de las ventas en Azufral, Aptao y en Brento.
100
50
120
48
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
b. Determine en cuál de las tiendas las ventas realizadas es más homogénea. Justifique numéricamente su respuesta.
Ejercicios propuestos
En el medio local hay dos plantas (Planta 1 y Planta 2) que se dedican a la fabricación de barras de acero para la construcción. Las empresas proveedoras de barras de acero para la construcción, que abastecen al mercado constructor, desean averiguar acerca de la resistencia media a la tracción y la desviación estándar, para ello, se tomaron muestras aleatorias en ambas plantas y la información registrada acerca de la resistencia a la tracción(en Kg/cm2) se muestra en las siguientes tablas: Resistencia a la tracción (Planta 1)
fi
[ 69.220 – 70.436 [
14
[ 70.436 – 71.652 [
5
[ 71.652 – 72.868 [
6
[ 72.868 – 74.084 [
8
[ 74.084 – 75.300 [
7
[ 75.300 – 76.516 [
17
[ 76.516 – 77.732 [
5
Total
62
Estadísticas descriptivas: Resistencia a la tracción: Planta 2 Variable Tracción
n 62
Media Desv.Est. 64.520 2.983
Varianza 8.899
Mínimo 61.220
Máximo 69.856
Realice el análisis adecuado para la dispersión y responda ¿qué planta es más heterogénea en las resistencias a la tracción? Sustente su respuesta estadísticamente. A continuación se presenta un gráfico que muestra la distribución de los resultados de la medición del Coeficiente de resistencia específica al corte (Kgf/cm2) de la empresa “ACE SA” en 75 obras de la ciudad de Arequipa:
49
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Distribución de las Obras según Coeficiente de Resistencia específica al corte en la ciudad de Arequipa 25 22
20
s
18
ra b o e
15
d or e
10
m
10
ú
8
N
8
i:f
5
4
5
0
3.0
3.6
4.2
4.8
5.4
6.0
6.6
7.2
Xi: Coef. Resistencia específica al corte (Kgf/cm2) Fuente: Mortero S.A.
La empresa opera también en Lima y el estudio de realizado a 75 obras de esta ciudad muestra las siguientes medidas e indicadores sobre el Coeficiente de Resistencia específica al corte (Kgf/cm 2). Los datos se presentan a continuación: Variable C. resistencia.
Total Media 75 2.0595
Desviación Estándar.
Varianza 0.833
La empresa realizará una auditoría en la ciudad que presente una mayor variabilidad de los coeficientes de resistencia específica del corte en las obras. ¿En qué ciudad se debe hacer la auditoría? Justifique su respuesta numéricamente.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
50
Diagrama de cajas o boxplot Es una gráfica que describe la distribución de un conjunto de datos tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango intercuartil como medida de dispersión. Se calcula: Q1, Q2 , Q3 , RIC y 1,5RIC Se traza un rectángulo con los extremos en el primer y tercer cuartil. En la caja se traza una recta vertical en el lugar de la mediana. Así, la línea de la mediana divide los datos en dos partes porcentualmente iguales. Se ubican los límites mediante el rango intercuartil. El límite superior está a 1,5( RIC ) arriba (o a la derecha) de Q3 . El límite inferior está a 1,5( RIC ) debajo (o a la izquierda) de Q1 . Las líneas antes y después de las cajas se llaman bigotes, se traza desde los extremos de la caja hasta el mínimo y máximo dentro de los límites inferior y superior si no hay valores extremos. Se considera dato atípico a cualquier punto mayor al límite superior (a la derecha) y menor al límite inferior (o a la izquierda). Se marcan con un asterisco (*) las localizaciones de los valores atípicos.
El diagrama de Caja nos permite:
Comparar las medianas de dos o más conjuntos de datos. Observar el tipo de distribución de los datos (simétrica o asimétrica en el 50% central). Determinar la dispersión en el 50% central de los datos. Identificar la presencia de valores extremos (datos atípicos) Ejemplo
La empresa Renacer S.A. seleccionó una muestra de 30 hornos microondas del turno noche y midió la radiación, en mw/cm2, que emiten estos aparatos con la puerta cerrada. Los datos se muestran a continuación:
51
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
1
1
2
2
3
4
6
6
6
6
7
7
8
8
8
9
9
9
10
10
10
11
12
15
15.5
16.8
18
19.7
23
24
a. Añada los valores faltantes en la caja del turno noche. Incluya valores atípicos, si existiera(n).
25
Cantidad de Radiaciones emitidas de hornos microondas según turnos
) 2 m20 c / w m ( n 15 ó i c a i d a R e 10 d d a d i t n 5 a C
P75= 11.8 9.35 P25= 7.05
0 T. Mañana
T. Noche Turno de producción
b. Teniendo en cuenta el 50% central de las muestras observadas, ¿cuál de los turnos mañana o noche presenta menor dispersión en los niveles de radiación y qué forma presenta la distribución de cada grupo?
52
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicios propuestos
En un proyecto de construcción se midió la resistencia del concreto (en MN/m2) en dos plantas
diferentes. Se ha determinado que la resistencia mínima del concreto para el tipo de trabajo que se está realizando es 28.0 MN/m2. Los resultados obtenidos se presentan a continuación:
a. La planta _____ cumple con la resistencia mínima de concreto y la planta____ no cumple con la resistencia mínima. b. La planta A presenta asimetría __________________ . c. La planta ________ presenta mayor variabilidad en la resistencia porque ____________________________________________. d. La planta ___________ presenta menor variabilidad en la resistencia porque ____________________________________ e. Interprete en términos del enunciado del problema el valor atípico de la planta 1. La empresa Tricon S.A realiza un estudio sobre el tiempo de espera en las obras. Considera que esta variable es necesaria pues el concreto premezclado tiene un tiempo de vida de aproximadamente 3 horas. A continuación se presentan los datos de los tiempos de espera, en minutos, de las 45 obras a las cuales se envió el concreto premezclado desde la planta de los Olivos: 23
34
37
38
41
43
44
46
47
48
49
49
51
51
52
53
54
55
57
58
58
58
58
59
59
60
60
60
60
61
62
62
62
63
63
63
64
65
70
73
74
76
78
88
89
Estadística (Civil/Electrónica/Telecomunicaciones)
53
UPC
También se presenta el diagrama de cajas de los tiempos de espera (en minutos) para las plantas de Lurín y Callao, desde donde se envía el concreto premezclado. Tiempo de espera del concreto premezclado por planta ( en minutos) 80
74 67
70
60
58
s
58
56.75
53
ot
a 50
49.5
D
40
39,25
39
30
23
25
20 LURIN
CALLAO
OLIVOS
Fuente: Tricon S.A.
a. Complete los datos que faltan en el diagrama de cajas. b. En las obras abastecidas desde la planta de los Olivos, ¿existen datos atípicos?, si existen, diga cuales son c. Respecto al 50% de los datos centrales del tiempo de espera, ¿cuál de las plantas presenta mayor dispersión? Justifique su respuesta numéricamente. Las ventas, en miles de soles, durante 50 semanas de los productos principales A y B de una compañía poseen las siguientes distribuciones de frecuencias: Ventas A
Número de semanas
Número de semanas
10 – 20
2
2 - 4
5
20 – 30
8
4 - 6
14
30 – 40
25
6 - 8
21
40 – 50
9
8 - 10
7
50 – 60
6
10 - 12
3
¿Qué producto tiene un nivel de ventas más homogéneo? Los habitantes de ciudades antiguas en EEUU ingerían cantidades pequeñas, pero dañinas, de plomo introducido en su agua potable por el empleo de las tuberías forradas de plomo que se
54
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
instalaron en los primeros sistemas de agua. Los datos en la tabla son el contenido medio de plomo, cobre y hierro (miligramos por litro) de muestras de agua recolectadas diariamente durante 23 días del sistema de agua de Boston. Los datos se recabaron en 1977 después de que se instaló un sistema de tratamiento de aguas con hidróxido de sodio. Cada media se basa en cerca de 40 determinaciones realizadas en diferentes puntos del sistema de agua de Boston donde se seguían usando tuberías de plomo. Plomo
Cobre
Hierro
0.010
0.022
0.039
0.04
0.07
0.09
0.11
0.14
0.18
0.015
0.030
0.043
0.04
0.07
0.1
0.11
0.15
0.19
0.015
0.031
0.047
0.04
0.07
0.1
0.12
0.15
0.20
0.016
0.031
0.049
0.04
0.07
0.12
0.12
0.16
0.22
0.016
0.035
0.055
0.04
0.07
0.14
0.13
0.17
0.23
0.019
0.035
0.060
0.05
0.08
0.16
0.13
0.17
0.25
0.020
0.036
0.073
0.05
0.08
0.18
0.14
0.17
0.33
0.021
0.038
0.05
0.08
0.14
0.17
a. Calcule las medidas de tendencia central y de variación en cada una de las muestras. b. Construya en un solo gráfico los diagramas de caja para cada una de las muestras. c. ¿Existen valores atípicos en alguna de las muestras?
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
55
Unidad 3 Probabilidad Logro de la unidad Comprende los diferentes conceptos relacionados con probabilidades y los utiliza adecuadamente en la solución de casos relacionados con su especialidad.
3.1 Experimento aleatorio ( ) Es una operación cuyo resultado no se puede predecir con certeza y que se realiza bajo las siguientes condiciones: Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se pueden predecir con certeza. Se puede describir el conjunto de todos los resultados posibles. Cuando se repite un gran número de veces, aparece un modelo definido de regularidad. Ejemplos
1:Lanzar un dado.
2 :Se lanzan dos monedas y se
registra el resultado obtenido. 3 :Seleccionar un dispositivo electrónico y registrar si es defectuoso o no. 4 :Observar el tiempo de vida de un artefacto eléctrico.
3.2 Espacio muestral ( ó S) Es el conjunto de todos los posibles resultados de un experimento aleatorio. Cada elemento de este conjunto se le denomina punto muestral y se le denota con w. Ejemplos 1= {1,2,3,4,5,6} 2= {cc,cs,sc,ss}
= {defectuoso, no defectuoso} 4 = {t/ t ≥ 0 } 3
3.3 Evento Es todo subconjunto del espacio muestral y representa cierta característica de ella. Se denotan mediante las primeras letras del alfabeto y en mayú sculas: A, B, C,…
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
56
Evento sim ple
Formado por un sólo un punto muestral. No se puede descomponer. Ejemplos
Si 1= {1,2,3,4,5,6} entonces {1},{2},{3},{4},{5},{6} son eventos simples Si 2= {cc,cs,sc,ss} entonces{cc},{cs},{sc},{ss} son eventos simples Si 3 = {defectuoso, no defectuoso} entonces {defectuoso},{no defectuoso} son eventos simples
Evento compuesto
Formado por más de un punto muestral. Ejemplos
Si 1= {1,2,3,4,5,6} entonces A = {1, 3, 5} ó A: Obtener un número impar. Es un evento compuesto. Si 2= {cc,cs,sc,ss} entonces B= {cs,sc} ó B: obtener dos valores diferentes en las caras superiores de las dos monedas.
3.4 Operaciones con eventos Intersección
La intersección de dos eventos A y B es el evento que ocurre si tanto A como B, ocurren en una sola realización del experimento. La intersección de los eventos A y B se denota mediante el símbolo A B Unión
La unión de dos eventos A y B es el evento que ocurre si A o B, o ambos ocurren en una sola realización del experimento. La unión de los eventos A y B se denota mediante el símbolo A B
Eventos mutuamente excluyentes
Son aquellos eventos donde la ocurrencia de uno de ellos excluye la ocurrencia del otro, esto es no pueden ocurrir los dos a la vez. Ejemplo
En el experimento: Lanzamiento de un dado. Sean los eventos:
57
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
A: Resulta un número menor que 5.
B: Resulta un número par.
Obtenga la intersección y la unión de los eventos A y B ¿Son los eventos A y B mutuamente excluyentes? = {1,2,3,4,5,6}
A = {1,2,3,4}
y
B = {2,4,6}
A B = {2,4} A B = {1,2,3,4,6} AB ≠ Por tanto, los eventos no son mutuamente excluyentes. Ejemplo
En el experimento : lanzamiento de dos dados, el espacio muestral es = {(1,1), (1,2) (1,3), …….(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} Se definen los eventos: A: obtener una suma de seis B: obtener una suma de cinco
A = {(1,5), (5,1), (2,4), (4,2) (3,3)} B = {(1,4), (4,1), (2,3), (3,2)}
Estos eventos son mutuamente excluyentes, dado que ambos a la vez no pueden ocurrir, esto es AB = , es decir la intersección de los eventos no tienen elementos en común. Ejercicio
Se realiza el siguiente experimento aleatorio : lanzamiento de dos dados de seis caras. Determine el espacio muestral. Sean los eventos: A: suma de los dados es 8; B: suma de los dados mayor a 6 y C : suma de los dados menor a 9. Determine los elementos de los eventos. Obtenga la intersección de los eventos A y B, la unión de los eventos B y C ¿Son los eventos A y C mutuamente excluyentes?
58
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
3.5 Probabilidad Sea un experimento aleatorio, el espacio muestral asociado, y sea A un evento definido en el espacio muestral ; la probabilidad del evento A es la medida del grado de posibilidad de ocurrencia del evento A cuando se realiza una vez el experimento. La probabilidad de un evento A será un número que denotaremos por P(A) y debe cumplir los siguientes axiomas: ii) 0 P(A) 1 iii) P() = 1 iv) Sea {Ai},Ai, i=1,2,3,..,n una sucesión de eventos mutuamente excluyentes, entonces n
P(A1A2A3…An) =
P( A ) i
i 1
Si P(A) tiende a 0, es poco probable que el evento A ocurra. Si P(A) tiende a 1, es un muy probable que el evento A ocurra.
En un espacio muestral finito la suma de las probabilidades de todos los eventos simples E i debe ser igual a 1. n
P( E ) 1 i
i 1,2,3,..., k
i 1
3.6 Definición clásica de la probabilidad de un evento Sea un experimento aleatorio cuyo correspondiente espacio muestral está formado por un número n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces definimos la probabilidad de un evento A como sigue: P( A)
n A n
número de casos favorables al evento A número total de casos
3.7 Eventos complementarios El complemento de un evento A es el evento en el que A no ocurre, es decir, el evento formado por todos los eventos simples que no están en el evento A. El complemento del evento A se denota mediante el símbolo Ac.
A Ac = Ω La suma de las probabilidades complementarias es igual a 1. P( A) P( Ac )
1
59
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
3.8 Reglas de probabilidad para uniones e intersecciones Regla aditiva de la probabilidad
La probabilidad de la unión de los eventos A y B es la suma de las probabilidades de los eventos A y B menos la probabilidad de la intersección de los eventos A y B: P( A B) P( A) P( B) P( A B)
A
B
B
A A ∩ B
Ʊ
Regla aditiva para eventos mutuamente excluyentes
Si dos eventos A y B son mutuamente excluyentes, la probabilidad de la unión de A y B es igual a la suma de las probabilidades de A y B: P( A B) P( A) P( B)
Ejemplo
El gerente de INGENIEROS METAC S.A.C., es una organización orientada a suministrar productos, servicios y desarrollo de soluciones de ingeniería aplicada, considera que la probabilidad de que los accidentes en Transmisiones & Ejes hayan sido ocasionados por las conexiones eléctricas es 0,24, por falla mecánica es 0,18 y por conexiones eléctricas o falla mecánica es 0,39. Si se selecciona al azar un accidente producido en Transmisiones & Ejes y definiendo los eventos de interés: E = {Accidentes por conexiones eléctricas}, P ( E ) = 0,24 y P ( M ) = 0,18 a.
M = {Accidentes por falla mecánica} P ( E M ) = 0,39
Determine la probabilidad que se haya producido por ambos tipos de falla. P ( E M ) = P ( E ) + P ( M ) - P ( E M ) 0,39 = 0,24 + 0,18 - P ( E M ) P ( E M ) = 0,03
Estadística (Civil/Electrónica/Telecomunicaciones)
b.
UPC
60
¿Cuál es la probabilidad de que el accidente se haya producido por solo un tipo de falla? P ( E M´ ) = P ( E) - P ( E M ) = 0,24 - 0,03 = 0,21 o P ( E´ M ) = P ( M) - P ( E M ) = 0,18 - 0,03 = 0,15 P ( E M´ ) + P ( E´ M ) = 0,36
Ejercicio
Después de una política de mejora de la calidad de la producción de Chemi-latex, tanto en el área de llenado como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de producción de la mejor manera y así disminuir los productos defectuosos en la producción. Para corroborarlo se toma una muestra de 80 productos, encontrándose que 25 presentan defectos en el llenado, 32 presentan defectos en el sellado y 30 no presentaban defectos. Si se selecciona un producto al azar. a. Determine la probabilidad de que se hayan producido ambos tipos de defectos.
b.
¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?
c.
¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes? Explique.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
61
3.9 Principios fundamentales de conteo Comprende un conjunto de procedimientos que permiten determinar el número de resultados de un suceso o experimento sin necesidad de utilizar una enumeración e identificación directa de todos los posibles resultados de dicho suceso o experimento. Analicemos los siguientes experimentos aleatorios: 1: lanzamiento de un dado 1=
{1,2,3,4,5,6} es fácil listar y contar los posibles resultados
2: números pares de tres cifras que se pueden formar con los dígitos 1,2,3,4,5,6,7,8,9 2= {174,148,184,198,194,14 4, …}
ya no es fácil listar y contar los posibles resultados Ante esta situación es necesario utilizar técnicas que nos faciliten el conteo de estos posibles resultados. Principio de la multiplicación Si un procedimiento A puede realizarse de “m” maneras y otro procedimiento B puede realizarse de “n” maneras, entonces los dos procedimientos A y B (uno seguido del otro) ocurren de m x n
maneras o formas. Ejemplo
Un ensamblador de computadoras tiene 4 microprocesadores de diferentes marcas y 3 memorias de diferentes marcas ¿de cuántas maneras posibles puede ensamblar una computadora?
Principio de la adición Si un procedimiento A puede realizarse de “m” maneras y otro procedimiento B puede realizarse de “n” maneras, y si no es posible que ambos se realicen en forma simultanea entonces los dos
procedimientos A o B ocurren de m + n maneras o formas. Ejemplo
Un ingeniero de telecomunicaciones está proyectando un viaje a una provincia para instalar una antena parabólica, debe decidir el viaje por bus o por tren. Si hay tres rutas para el bus y dos para el tren ¿de cuántas maneras posibles puede realizar el viaje?
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
62
Técnica de conteo: Combinación Es una técnica que permite contar el número de maneras de seleccionar o elegir aleatoriamente “r” elementos de un total de “n”, sin conside rar el orden de selección. Está dado por: n
C r
n! r !(n r ) !
Ejemplo
Un grupo de 20 ingenieros civiles igualmente capacitados forman el staff de una empresa constructora. Si se eligen al azar a 3 de ellos para participar en un proyecto, ¿de cuántas maneras posibles se pueden seleccionar a estos 3 ingenieros?
Ejercicios propuestos
Una caja contiene 24 resistencias con etiqueta negra y 24 con etiqueta roja; de los de etiqueta negra cinco son de 5 ohmios y el resto de 8 ohmios; mientras que los de etiqueta roja doce son de 5 ohmios y el resto de 8 ohmios: a) Si se selecciona una resistencia al azar de la caja, ¿cuál es la probabilidad que la resistencia sea de 8 ohmios? b) Si se seleccionan al azar dos resistencias de la caja, ¿cuál es la probabilidad que las dos sean de igual color. c) Si se seleccionan al azar tres resistencias de la caja, ¿cuál es la probabilidad que dos sean de 5 ohmios y una de 8 ohmios? Dos ingenieros civiles denominados A y B se distribuyen al azar en tres oficinas enumeradas con 1, 2 y 3 respectivamente, pudiendo estar ambos en una misma oficina. ¿Cuál es la probabilidad de que dos oficinas se queden vacías? En una competencia para construir una pared participan cuatro obreros A, B, C y D. Uno de ellos necesariamente debe ganar. Si la probabilidad de que gane A es el doble de la de B, la de B es la mitad de C y la de D es el triple de A, ¿cuál es la probabilidad que gane A?
63
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
3.10 Probabilidad condicional Si A y B son dos eventos de un espacio muestral Ω, entonces, la probabilidad condicional de
que ocurra el evento A dado B se determina por: P (A/B) =
((∩ ) ) , siendo P (B) > 0
Ejemplo
Para ocupar un puesto de trabajo en el departamento de diseño de ingeniería de una compañía constructora de barcos, se han presentado postulantes, cuyas principales características se resumen en el siguiente cuadro: Años de experiencia Al menos tres años de experiencia (A) Menos de tres años de experiencia (B) Total
Egresado de ingeniería Mecánica (M) Industrial (I)
No egresado de universidad (N)
Total
14 25
4 11
9 27
27 63
39
15
36
90
El orden en que el gerente de la estación entrevista a los aspirantes es aleatorio. Determine la probabilidad de que el primer entrevistado por el gerente: a. Tenga menos de tres años de experiencia y sea egresado de ingeniería mecánica. P ( B ∩ M) =
0,278
b. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia. P ( N / B) =
= 0,429
c. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial. P ( A / I) =
= 0, 267
d. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.
= 0,578
P ( M U A ) = P ( M ) + P ( A ) - P ( M A ) = +
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
Ejercicio
64
, la probabilidad que no haya huelga es , y la probabilidad que la construcción se termine a tiempo dado que no hubo huelga es ; la probabilidad que haya huelga y no se termine la construcción a tiempo es , Defina los eventos y calcule las siguientes probabilidades: La probabilidad que la construcción de un edificio termine a tiempo es
a. La construcción se termine a tiempo y no haya huelga.
b. No haya huelga dado que la construcción se terminó a tiempo.
c. La construcción no se termine a tiempo si hubo huelga.
65
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
d. La construcción no se termine a tiempo si no hubo huelga.
Regla multiplicativa de la probabilidad
De la definición de probabilidad condicional, obtenemos la fórmula para hallar la probabilidad de la intersección (o producto) de los eventos A y B, esto es, de P( A B ) P( A | B ) P(B ) P(B A) P( A)
Ejemplo
Si A y B son eventos tales que P( A) = 0.4,P( B) = 0.2 y P( A/ B) = 0.5. Calcule: P( A
B) y P( Ac B)
3.11 Eventos independientes Los eventos A y B son independientes si la ocurrencia de B no altera la probabilidad de que haya ocurrido A, es decir, los eventos A y B son independientes si: P( A B ) P( A) Si dos eventos no son independientes, se dice que son dependientes. Regla multiplicativa para eventos independientes
Si los eventos A y B son independientes, la probabilidad de la intersección de A y B es igual al producto de las probabilidades de A y B, es decir, P( A B) P( A) P( B)
Generalizando para los eventos independientes E 1 , E 2 , , E k . P( E1 E2 ...Ek ) P( E1 ) P( E2 )
P( E k )
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
66
Propiedades
Si los eventos A y B son independientes, entonces también son independientes: AC y BC esto es P(ACBC) = P(AC) P(BC) AC y B esto es P(ACB) = P(AC) P(B) A y BC esto es P(ABC) = P(A) P(BC) Esta propiedad se puede generalizar para más de dos eventos. Leyes de Morgan
P(AB)C = P(ACBC) P(AB)C = P(ACBC) Estas leyes se pueden generalizar para más de dos eventos. Ejemplo
Un sistema electrónico está compuesto por tres subsistemas A, B y C, de tal manera que las probabilidades de fallar de cada uno son 0,15; 0,20 y 0,35. Si los subsistemas funcionan de manera independiente, definir los eventos y calcular: A = {El subsistema A falle} C = {El subsistema C falle} P(A) = 0,15 P(A´) = 0,85
B = {El subsistema B falle}
P(B) = 0,20 P(B´) = 0,80
P(C) = 0,35 P(C´) = 0,65
a. La probabilidad de que al menos uno de los subsistemas falle. S = {al menos uno de los sistemas falle}
S´ = {Ningún de los sistemas falle}
P(S) = 1- P (S´) = 1 - P ( A´∩B´∩C´) = 1 - P ( A´) * P(B´) * P(C´) P(S) = 1 – 0,85 * 0,80 * 0,65 = 0,558 b. La probabilidad de solo dos de los subsistemas funcionen. S2 = {sólo dos de los sistemas funcionen} P(S2) = P ( A´∩B∩C´) + P ( A∩B´∩C´) + P ( A´∩B´∩C) = P(S2) = P ( A´) *P(B) * P(C´) + P (A) * P(B´) * P(C´) + P (A´) * P(B´) * P(C) P(S2) = 0,85 *0,20 * 0,65 + 0,15 * 0,80 * 0,65 + 0,85 * 0,80 * 0,35 = 0,4265
Estadística (Civil/Electrónica/Telecomunicaciones)
67
UPC
Aplicación al sistema de componentes: Confiabilidad de Sistemas
Podemos aplicar el concepto de la independencia de eventos al caso en que se tenga un sistema de componentes electrónicos acoplados en serie o en paralelo.
)
Sistema en serie: Un sistema de componentes acopladas en serie funciona si todos sus
componentes funcionan. Sea = La componente A funciona; que el sistema funcione , ambos deben funcionar. P(
) = P(
= La componente B funciona Para
∩
) = P(
) P(
Ejemplo
El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una probabilidad de 0.98 y el componente B funciona con una probabilidad de 0.95. Suponga que A y B funcionan de manera independiente. Determine la probabilidad que el sistema funcione.
FS FA FB FA FB)
P( ) = P( ∩
) = P( ) P(
= 0,98 * 0,95 = 0,931
Sistema en paralelo: Un sistema de componentes acoplada en paralelo funciona, si al menos una
de sus componentes funciona. El sistema funcionará si alguno, C o D funcionan.
FFSS FFAA ∪F∪FBB FFAA FFBB)P(F A ∩ FB ) )P(F A)P(FB) FS P(NFA)P(NFB)
P( ) = P( P( ) = P( P( ) = 1 -
) = P( ) + P( ) = P( ) + P(
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
68
Ejemplo
Los componentes C y D funcionan con una probabilidad de 0,90 y 0,85 respectivamente. Suponga que C y D funcionan de manera independiente. Determine la probabilidad de que el sistema funcione.
FS P(NFA)P(NFB)
P( ) = 1 -
= 1 – 0,10 * 0,15 = 0,985
Ejercicio
Un sistema eléctrico consta de cuatro componentes. El sistema funciona si los componentes A y B funcionan, y si funciona cualquiera de los componentes C o D. La confiabilidad (probabilidad de que funcionen) de cada uno de los componentes también se muestra en la figura. Suponga que los cuatro componentes funcionan de manera independiente.
Calcule las siguientes probabilidades: a. Que el sistema completo funcione.
Estadística (Civil/Electrónica/Telecomunicaciones)
69
UPC
b. Que el componente C no funcione, dado que el sistema completo funciona.
3.12 Probabilidad Total y el Teorema de Bayes Probabilidad Total
Sean los eventos A1 , A 2 ,..., Ak ,los cuales forman una partición del espacio muestral mutuamente excluyentes y exhaustivos y sea E otro evento cualquiera de , se cumple:
P( E ) P( A1 ) P( E / A1 ) P( A2 ) P( E / A2 ) ......... P( Ak ) P( E / Ak )
Donde a la P( E ) se le conoce como la probabilidad total. Teorema de B ayes
Si los eventos A1 , A 2 ,..., Ak , constituyen una partición del espacio muestral , entonces para cualquier evento E de la P( Ai |E ) es:
P( Ai | E ) P( Ai | E )
P( Ai E ) P( E )
para i 1, 2 ,, k
P( Ai ) P(E Ai ) P( A1 ) P(E A1 ) P(A2 ) P(E A2 ) ... P(Ak ) P(E Ak )
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
70
Ejemplo
Una cadena de tiendas de suministros de construcción vende tres marcas diferentes de teodolitos. De sus ventas de teodolitos, 50% son de la marca 1 (la menos cara), 30% son de la marca 2 y 20% son de la marca 3. Cada fabricante ofrece 1 año de garantía en las partes y mano de obra. Se sabe que 25% de los teodolitos de la marca 1 requieren trabajo de reparación dentro del periodo de garantía, mientras que los porcentajes correspondientes de las marcas 2 y 3 son 20% y 10%, respectivamente. Definamos los eventos: Ai = {Marca “i” adquirida} con i = 1,2,3 B = {Necesita Reparación} B’ = {No necesita reparación} Con el diagrama del árbol:
a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito marca 1 que necesitará reparación mientras se encuentra dentro de garantía? P(A1∩B) = P(B|A1)*P(A1) = 0,125 b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito que necesitará reparación mientras se encuentra dentro de garantía? P(B) = P(marca 1 y reparación) ó P(marca 2 y reparación) ó P(marca 3 y reparación) = P(A1∩B) + P(A2∩B) + P(A3∩B) = P(B|A1)*P(A1) + P(B|A2)*P(A2) + P(B|A3)*P(A3) =0,125 + 0,06 + 0,020 = 0,205
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
71
c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de garantía, ¿cuál es la probabilidad de que sea un teodolito marca 1? ¿Un teodolito marca 2? ¿Un teodolito marca 3? P(A1| B) = = = 0,6098
(()∩) ,, (∩) = ,, = 0,2927 P(A2| B) = = () (∩) = ,, = 0,0976 P(A3| B) = = ()
Ejercicio
1. Una empresa se encuentra estudiando la posibilidad de importar para el próximo año un nuevo modelo de celular de última generación. Al estudiar la situación económica del próximo año se contemplan tres posibilidades: inflación, estabilidad o crecimiento, estimando dichas alternativas con las siguientes probabilidades: 0,55; 0,35 y 0,10 respectivamente. La probabilidad de importar el nuevo modelo de celular es 0,25 si existiera inflación, 0,40 si existiera estabilidad y 0,65 si existiera crecimiento. Presente el diagrama del árbol y defina los eventos
a.
¿Cuál es la probabilidad de importar el nuevo modelo de celular para el próximo año?
Estadística (Civil/Electrónica/Telecomunicaciones)
b.
UPC
72
Asumiendo que la empresa decidió importar el nuevo modelo de celular, ¿cuál es la probabilidad que existiera inflación en la economía?
2. Consideremos que tres máquinas Alpha, Beta y Gamma producen respectivamente el 50%, el 30% y el 20% del número total de artículos de una fábrica. Si la proporción de artículos defectuosos que produce cada una de estas máquinas es 0,03 0,04 y 0,05 respectivamente y se selecciona un artículo aleatoriamente: Presente el diagrama del árbol y defina los eventos
a. Calcule la probabilidad de que el artículo sea defectuoso.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
73
b. Calcula la probabilidad de que el artículo seleccionado al azar haya sido producido por la máquina Alpha o la máquina Beta, si se sabe que este es defectuoso.
c. Si se seleccionan cinco artículos, ¿cuál es la probabilidad que sólo dos sean defectuosos?
Ejercicios propuestos
Una empresa vende tres tipos de maquinaria pesada para la industria textil A, B y C. El 70% de las máquinas son del tipo A, el 20% del tipo B y el 10% son del tipo C. Las máquinas A tienen una probabilidad de 0,10 de producir una pieza defectuosa a lo largo de un año, las máquinas B tienen una probabilidad de 0,30 y las máquinas C tienen una probabilidad 0,60 de producir una de tales piezas defectuosas a lo largo de un año. Una de estas máquinas ha estado funcionando durante un año de prueba y ha producido una pieza defectuosa. ¿De cuál tipo de máquina es más probable que provenga la pieza defectuosa? Durante la época de exámenes, en cierto colegio, sólo 25% de los profesores advierten por escrito a sus alumnos que no está permitido levantarse a preguntar durante la prueba. No obstante, se ha observado que a pesar de esa advertencia 20% de los estudiantes lo hacen. Para los mentores que no establecen dicha advertencia, la cifra correspondiente es de 70%. Si durante una prueba a cargo del profesor Jaime, de pronto irrumpe un inspector en el salón y observa que hay alumnos que quebrantan la regla, ¿cuál es la probabilidad de que ese profesor no haya advertido por escrito que se prohíbe hacer preguntas en los exámenes?
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
74
Considere el sistema de componentes electrónicos conectados como se muestra en la figura. Los componentes funcionan de manera independiente uno del otro, y la probabilidad de que cada componente funcione es 0,90; ¿cuál es la probabilidad de que el sistema electrónico funcione?
Se tiene un sistema antiguo compuesto de varios componentes que funcionan en forma independiente y la probabilidad de falla de cada componente es 0,4. Para que el sistema funcione basta que funcione al menos uno de los componentes, ¿cuántos componentes debe tener el sistema para tener una probabilidad de 0,98 de que el sistema funcione? Electronic Systems Company que
brinda soporte especializado en la instalación de redes con Tecnología LAN o WAN en diferentes empresas, sabe que el 15% de las empresas prefieren como medio físico de transporte los cables de cobre de par trenzado, el 35% prefiere los cables coaxiales, el 40% fibras ópticas y 10% el aire. Además, si la empresa elige los cables de cobre de par trenzado como medio físico la probabilidad que elija la Tecnología WAN es 0,62; las empresas que eligen cables coaxiales tienen una probabilidad de 0,45 de elegir la Tecnología LAN; las empresas que eligen la fibra óptica tiene una probabilidad de 0,55 de elegir la Tecnología WAN y las empresas que eligen el aire como medio físico de transporte tienen una probabilidad de 0,5 de elegir la Tecnología LAN. a. Calcule la probabilidad que una empresa elija para su Red la Tecnología LAN. b. Si se selecciona al azar una empresa que utiliza Tecnología WAN, ¿cuál es la probabilidad que utilice como medio físico de transporte cables de cobre de par trenzado? Si la probabilidad de que cada llave esté cerrada dejando pasar corriente es p=0,6 y las llaves se cierran y se abren en forma independiente, calcular la probabilidad de que pase corriente de I hacia O en el siguiente circuito:
75
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Unidad 4 Variable aleatoria y distribución de probabilidad Logro de la unidad Al término de la Unidad 4, el estudiante discrimina la distribución de probabilidad a utilizar en los diferentes casos de aplicación.
4.1 Variable aleatoria Sea Ω un espacio muestral. Una variable aleatoria es una resultado w del espacio muestral en un número real X (w).
función X, que transforma cada
El rango de la variable aleatoria X es el conjunto R X de todos sus posibles valores.
Ejemplo
Al lanzar dos monedas para registrar los posibles resultados se obtiene el espacio muestral siguiente.
= {cc, cs, sc, ss } Si ahora definimos la variable aleatoria X como número de caras que se obtiene, entonces a cada resultado de, es posible asignarle un número real de la siguiente manera: S
cc, se le asigna el número real 2
cs, se le asigna el número real 1
sc, se le asigna el número real 1
ss, se le asigna el número real 0
R
CC
• •
2
CS
• •
SC
• •
1
SS
• •
0
76
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Clasific ación d e variables aleatorias
Discreta: Si su rango es un conjunto finito o infinito numerable. Ejemplos:
a. Número de circuitos electrónicos producidos por una empresa que cumplen con las especificaciones técnicas. b. Número de llamadas que recibe una central telefónica. Continua: Si su rango es un conjunto infinito no numerable. Ejemplos:
c. Resistencia a la ruptura de un material plástico (onzas por pulgada cuadrada). d. Resistencia transversal de los ladrillos fabricados por una empresa (MN/m 2).
4.2 Variables aleatorias discretas Sea X una variable aleatoria discreta. Función d e probabilid ad de una variable aleatoria discr eta
La probabilidad de que la variable aleatoria tome un valor genérico igual a x, se denotará de la siguiente manera. f x P( X x ) La función de probabilidad de X debe cumplir las siguientes condiciones:
f ( x) 0
f ( x) 1
Rango X
Ejercicio
El ingeniero de producción de la empresa Tecnotronics S.A. ha determinado que la distribución de probabilidades del número de artículos defectuosos por lote es la siguiente: x
0
1
2
3
4
f(x)
0.25
a
0.10
0.25
0.25
a. Encuentre el valor de la constante “a” para que la distribuci ón sea de probabilidad. b. Calcule la probabilidad de encontrar menos de 2 artículos defectuosos por lote. c. Si el lote tiene 2 o más artículos defectuosos, es considerado “malo” ¿cuál es la probabilidad que el lote sea malo?
77
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
d. Si el número de artículos defectuosos por lote es al menos 1, calcule la probabilidad de que el número de artículos defectuosos sea menor que 3. Solución: a. Para hallar el valor de la constante “a”, usaremos la siguiente condición:
f ( x) 1
Rango X
0,25 + a + 0,10 + 0,25 + 0,25 = 1 →
a = 0,15
b. P (X < 2) = P(X = 0) + P(X = 1) = 0,25 + 0,15 = 0,40
≥
c. P(Lote sea malo) = P (X 2) = 1 – P(X < 2) = 1 – 0,40 = 0,60
≥
d. P(X < 3 / X 1) =
(=)+(=) , +, = −(=) −, = 0,3333
Ejercicio
El departamento de control de calidad de una empresa selecciona al azar diariamente tres bombillas de un lote que contiene 20 bombillas, para decidir si acepta el lote y los pasa al departamento de producción o rechaza el lote y los devuelve al proveedor. a. Construya la distribución de probabilidad del número de bombillas defectuosas que se encuentra en la muestra, si el muestreo es sin reposición y bajo la suposición que el lote contiene 2 bombillas defectuosas. X: Numero de bombillas defectuosas encontradas en la muestra. R x = { } Debido a que las bombillas son escogidas con reposición la probabilidad de que salga defectuoso o no defectuoso permanece constante. D = bombilla defectuosa
P(D) =
DC = bombilla no defectuosa
P(B) =
P(X=0) = P(X=1) = P(X=2) = Finalmente, colocamos los resultados en el cuadro de distribución de probabilidades. X
f(X)
0
1
2
78
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
b. Si la regla de decisión es: Rechazar el lote si en la muestra se encuentra más de un artículo defectuoso. ¿Cuál es la probabilidad de Rechazar un lote?
c. En relación a la regla planteada en (b), si el lote es aceptado, ¿cuál es la probabilidad que la muestra contenga un defectuoso?
Esperado d e una variable aleatori a disc reta
Sea X una variable aleatoria discreta con función de probabilidad f ( x). Entonces el valor esperado o medio de X es: E ( X )
xf ( x)
Rango x
Esperado de una funci ón de X
Sea X una variable aleatoria discreta con función de probabilidad f ( x), y sea g( x) una función de la variable X . Entonces, el valor esperado o medio de g( x) es: E g ( x )
g ( x) f ( x)
Rango x
Propiedades del valor esperado
El valor esperado tiene ciertas propiedades que se presentan a continuación, las cuales son de bastante utilidad. Sean a y b constantes cualesquiera y sea X una variable discreta. Entonces: E(a) = a E(bX) = bE(X) E(a + bX) = a + bE(X) Sean g1 ( x),..., g k ( x) funciones de X , E [g1( x)+ …+ gk ( x)] = E [g1( x)]+ …+ E [gk ( x)]
79
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Varianza de una variabl e aleatori a
Sea X una variable discreta con función de probabilidad f ( x). Entonces, la varianza de X es:
V(X) = E[X - ]2 = E(X2) -
2
Formula abreviada para el cálculo de la varianza:
Dónde: E(X2) =
V(X) = E(X2) – [E(X)]2
∑ ()
La desviación estándar de X es la raíz cuadrada positiva de la varianza de X
2
Propiedades de la varianza
Sean a y b dos constantes cualesquiera y sea X una variable discreta. Entonces: V(a) = 0 V(bX) = b2 V(X) V(a + bX) = b2 V(X) Ejemplo
El número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado se considera una variable aleatoria, que tiene la siguiente función de probabilidad: x
0
1
2
3
P(X = x)
0,38
0,24
k
0,08
a. Calcule e interprete el valor esperado de X. b. Calcule la desviación estándar de X. c. Si por cada falla eléctrica se estima que la región pierde aproximadamente 14300 dólares, ¿cuál es la pérdida esperada? Solución En primer lugar hallaremos el valor de k para que la distribución sea función de probabilidad: 0,38 + 0,24 + k + 0,08 = 1 a. E(X) = 0*0,38 + 1*0,24 + 2*0,3 + 3*0,08 = 1,08
k = 0,3
80
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Si el experimento se repitiera muchas veces, en promedio el número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado, sería de 1.08. b. Para calcular la varianza usaremos la formula abreviada: V(X) = E(X 2) – [E(X)]2
E(X2) = 02*0,38 + 12*0,24 + 22*0,3 + 32*0,08 = 2,16 V(X) = 2,16 – [1,08]2 = 0,9936 c. Perdida = 14300X
E(Perdida) = 14300 E(X) = 14300*1,08 = 15444
Ejemplo
Un ingeniero civil del departamento de obras, muestra la distribución de probabilidad de la variable aleatoria X= Nº de habitaciones a construir en edificios residenciales. x
4
5
7
8
9
f(x)
0,20
0,25
0,10
0,15
0,30
a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo menos cinco habitaciones? P (X ≥ 5 / X < 8) = 0,35/0,55= 0,6364 b. Si el precio Q en soles de una vivienda en un edificio residencial está dado por la función Q = 14 600 X +1000 ¿Cuánto esperaría pagar un cliente por una vivienda? E (X) = 6,65 E (Q) = 14 600 E(X) + 1000 = 14 600 (6,65) + 1000 = 98 090 Un cliente esperaría pagar por una vivienda 98 090 soles. Ejercicios
Según el departamento de control de calidad de una empresa fabricante de tornillos, el número de fallas superficiales en los tornillos corresponde a una variable aleatoria X con E (X) = 0.88 por tornillo. Además se sabe que la función de probabilidad está dada por: x
0
1
2
3
4
f(x)
a
0,37
0,16
b
0,01
a. ¿Cuál es la probabilidad de que un tornillo presente al menos 2 fallas? b. Calcule la varianza y el coeficiente de variación de X.
81
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Una librería necesita hacer el pedido semanal de una revista especializada de ingeniería. Por registros históricos, se sabe que las frecuencias relativas de vender una cantidad de ejemplares es la siguiente: Demanda de ejemplares Frecuencia relativa
1
2
3
4
5
6
1/15
2/15
3/15
4/15
3/15
2/15
a. Calcule la media y varianza de la demanda de ejemplares. b. Pagan S/. 5 por cada ejemplar y lo venden a S/. 10. De mantenerse las condiciones bajo las que se registraron los datos y si las revistas que quedan no tienen valor de recuperación, ¿cuántos ejemplares de revista se debería solicitar. Enigma S.A. produce artículos perecibles. A continuación se presenta una tabla con los datos históricos de las demandas semanales obtenidas en las últimas 50 semanas y el número de semanas de ocurrencia: Número de productos demandados Número de semanas
2 000
3 000
4 000
5 000
15
20
10
5
a. Si la compañía decide programar la producción de dicho artículo tomando exactamente el valor esperado de la demanda, ¿cuántas unidades de dicho artículo debe producir la compañía semanalmente? b. Si cada unidad tiene un costo de S/. 5 y se vende a S/. 10. Si el producto no se vende durante la semana siguiente a la producida, se debe rematar a un precio de S/. 2,5. Todos los productos ofrecidos en remate se venden, ¿cuántas unidades debe producirse semanalmente la compañía para maximizar su utilidad esperada? Un contratista debe elegir entre dos trabajos. El primero promete un beneficio de S/. 80 000 con una probabilidad de 0,75 o una pérdida de S/. 20 000 con una probabilidad de 0,25. El segundo trabajo promete un beneficio de S/. 120 000 con una probabilidad de 0,5 o una pérdida de S/. 30 000 con una probabilidad de 0,5. a. ¿Qué trabajo recomendaría al contratista si éste quiere maximizar su beneficio? b. ¿Qué trabajo debería elegir el contratista si su negocios van mal y para no quebrar necesita un beneficio mínimo de S/. 100 000 en el siguiente trabajo?
Estadística (Civil/Electrónica/Telecomunicaciones)
82
UPC
4.3 Distribuciones especiales discretas Distribución binomial
El experimento consiste de n pruebas idénticas de Bernoulli. Cada prueba tiene únicamente dos resultados: éxito o fracaso. P(éxito)= p y P( fracaso)=1- p se mantiene constante a lo largo de todas las pruebas. Las pruebas son independientes. La probabilidad del evento considerado como “éxito” es constante en cada prueba y se denota por p. La variable aleatoria binomial se define como: Número de éxitos que ocurren en los n ensayos o pruebas.
La función de probabilidad de X es: f x P ( X
n x
x ) C xn p x 1 p
,
x 0, 1, 2, ... , n
Donde: n: Numero de ensayos o pruebas p: Probabilidad de éxito en cada ensayo 1 – p: Probabilidad de fracaso Notación: Si la variable aleatoria X sigue una distribución binomial con parámetros ~ B (n, p) Media Varianza
n y p
se denota: X
= E(X) = np 2 = Var(X) = np(1-p)
Ejemplo
El supervisor de una obra ha determinado que un proveedor entrega los pedidos a tiempo alrededor del 94% de las veces. Para su última obra, el supervisor seleccionó una muestra de 12 pedidos. a. Calcule la probabilidad de que el proveedor entregue por lo menos 11 pedidos a tiempo. b. Calcule el valor esperado del número de pedidos entregados a tiempo. Solución: X: Número de pedidos entregados a tiempo en una muestra de 12 pedidos X ~ B (n = 12, p = 0,94)
Estadística (Civil/Electrónica/Telecomunicaciones)
83
UPC
(10.94)
a) P(X ≥ 11) = P(X = 11) + P(X = 12) = = 0,000
∗0.94 ∗(10.94) ∗0.941 ∗ +
b) E(X) = n*p = 12*0.94 = 11.28 = 11 Ejercicio
En un proceso de fabricación se produce unidades pre coladas con un 1% de unidades defectuosas. Todos los días se someten a prueba 10 unidades seleccionadas al azar de la producción diaria. Si existen fallas en una o más de estas unidades se detiene el proceso de producción. La variable aleatoria X se define: X: X~ a. ¿Cuál es la probabilidad de encontrar dos unidades defectuosas?
Respuesta: 0,00415 b. ¿Cuál es la probabilidad de detener el proceso?
Respuesta: 0,0956 c. Calcule el valor esperado y la desviación estándar del número de unidades no defectuosas.
Respuesta: 9,9 y 0,3146
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
84
Distribución hipergeométrica
El experimento consiste en extraer al azar y sin reposición n elementos de un conjunto de N elementos, r de los cuales son éxitos y ( N -r ) son fracasos. Las pruebas son independientes entre sí. Las pruebas presentan la misma condición, es decir que cada resultado solo puede tener dos posibles resultados: Éxito o Fracaso La probabilidad de éxito cambia en cada ensayo. La variable aleatoria hipergeométrica se define como: Número de éxitos que ocurren en los n ensayos o pruebas.
La función de probabilidad de X es: N r
r
f ( x) P X
x
C x C n x N
C n
x max[0, n ( N r )],..., min(r , n)
Donde: N: Tamaño de la población r : Numero de éxitos en la población n : Numero de ensayos o tamaño de la muestra x : Numero de éxitos en la muestra Notación: Si la variable aleatoria X sigue una distribución hipergeométrica con parámetros N , r y n, se denota: X ~ H ( N , n, r ) Media Varianza
E X n
2
V X n
r N
r N n 1 N N N 1 r
Ejemplo
Una compañía de transporte tiene una flota de 24 camiones. Dentro de la política ambiental de la compañía, cada mes selecciona al azar seis camiones y mide los niveles de contaminación. a. ¿Cuál es la probabilidad de que dos de los camiones elegidos emitan cantidades excesivas de contaminación? Suponga que en verdad cuatro camiones de la flota emiten cantidades excesivas de contaminación. b. Si en la muestra elegida al menos dos emiten cantidades excesivas de contaminación, la compañía decidirá que toda la flota debe pasar una revisión técnica, ¿qué tan probable es que los 24 camiones pasen la revisión técnica, manteniendo la suposición de la parte a?
Estadística (Civil/Electrónica/Telecomunicaciones)
85
UPC
c. ¿Qué tan probable es que toda la flota pase la revisión técnica si en verdad ocho camiones de la flota emiten cantidades excesivas de contaminación? Solución: X: Número de camiones que emiten cantidades excesivas de contaminación de n = 6 camiones X ~ H (N = 24, r = 4, n = 6) a. P(X = 2) =
∗ = 0,21598
b. P(revisión técnica) = P(X≥2) = 1 – P(X≤1) = 1– [
∗ ∗ ] = 1 0,748730 = 0,25127
c. X ~ H (N = 24, r = 8, n = 6) d. P (revisión técnica) = P(X ≥ 2) = 1 – P (X ≤ 1) = 1 – [
–
∗ ∗ ] = 1 0,319118 = 0,680882 –
Ejercicio
Durante una semana, una empresa fabrica 50 radiotransmisores de alta frecuencia. Por histórico se sabe que el 20% de los radiotransmisores fabricados presentan por lo menos una falla y el resto operan sin problemas. El departamento de control de calidad realiza inspecciones rigurosas cada semana que consiste en selecciona al azar una muestra de cinco radiotransmisores. La variable aleatoria X se define X: X~ a. ¿Cuál es la probabilidad de que tres presenten al menos una falla?
Respuesta: 0,04418
Estadística (Civil/Electrónica/Telecomunicaciones)
86
UPC
b. Se rechazará todo el lote para la venta si la muestra presenta por lo menos cuatro radiotransmisores con al menos una falla, ¿qué tan probable es que se rechace el lote?
esta: 0,00408 Distribución Poisson
El experimento consiste en realizar el conteo del número X de veces que ocurre un evento en particular durante una unidad de tiempo, área, volumen, peso, distancia o cualquier otra unidad de medida dada. La probabilidad de que un evento ocurra en una unidad dada de tiempo, área, etc.; es la misma para todas las unidades. El número de eventos que ocurren en una unidad de tiempo, área, volumen es independiente del número de los que ocurren en otras unidades. La variable aleatoria Poisson se define como: Número de veces que ocurre un evento durante un intervalo definido
La función de probabilidad de X es: f ( x) P X x
e x
x!
x 0,1, 2, 3,...
Donde: e: Base del sistema de logaritmos neperianos : Media de la cantidad de veces (éxitos)
que se presenta un evento en un intervalo
particular
Notación: Si la variable aleatoria X sigue una distribución Poisson con parámetro se denota: X ~ P ( ) Media Varianza
E X
2
V X
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
87
Ejemplo
En la inspección del pavimento y asfalto de una carretera recién construida se ha detectado que hay, en promedio 1,25 baches o fisuras cada cuatro kilómetros. Asumiendo una distribución de Poisson, determine: a. La probabilidad de que en el siguiente kilómetro se encuentre dos baches o fisuras. b. La probabilidad de que en los siguientes dos kilómetros se encuentre a lo más tres baches o fisuras. c. El costo de reparación de estos defectos es de $35 por cada bache o fisura detectado. ¿Cuál será el costo esperado al inspeccionar 80 km de esta carretera? Solución a. X: Número de baches o fisuras cada kilómetro X ~ Poisson (λ= 0 ,3125)
P(X=2) =
.!∗. = 0,03572
b. X: Número de baches o fisuras cada dos kilómetro X ~ Poisson (λ= 0.625)
P (X ≤ 3) = P(X=0) + P(X=1) + P(X=2) + P(X=3) = 0,9961 c. X: Número de baches o fisuras en 80 kilómetros X ~ Poisson (λ= 25)
Costo = 35*X E (Costo) = 35*25 = $ 875 Ejercicio
Con la finalidad de diseñar un nuevo sistema de control de tráfico, un ingeniero recoge información sobre el número de automóviles que llegan a una intersección. Por histórico se sabe que en promedio llegan cuatro autos a la intersección cada minuto según un proceso de Poisson. La variable aleatoria X se define: X: X~
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
88
a. ¿Qué probabilidad hay de que en 30 segundos lleguen tres autos?
Respuesta: 0,18045 b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm el número lleguen menos de dos autos?
Respuesta: 1 c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean cinco los autos que llegaron en ese minuto?
Respuesta: 0,620726 Ejercicio
Cierto tipo de azulejo puede tener un número X de puntos defectuosos con media de 3 puntos defectuosos por azulejo. a) Calcule la probabilidad de que haya 5 defectos en un azulejo elegido al azar.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
89
b) El precio del azulejo es $1,5 si el azulejo no tiene ningún defecto, si tiene uno a dos fallas se vende en $0,90 y si tiene más de dos defectos se remata en $0,20. Calcule el precio esperado por azulejo.
Ejercicios
1. Un cierto sistema mecánico contiene componentes y se han seleccionado al azar 10. Suponga que la probabilidad de que cualquier componente individual falle es de 0,07 y que los componentes fallan independientes unos de otros. a) ¿Cuál es la probabilidad de que falle al menos uno de los componentes? b) ¿Cuál es la probabilidad de que fallen exactamente 2 componentes? c) ¿Cuál es la probabilidad de que fallen entre 2 y 5 componentes? d) Obtenga el E ( X ) y V ( X ) 2. Un fabricante de piezas para automóviles garantiza que cada caja de piezas fabricadas por su empresa contiene como máximo 3 piezas defectuosas. Si cada caja contiene un total de 20 piezas y la experiencia ha mostrado que en el proceso de manufactura se produce el 2% de las piezas defectuosas. ¿Cuál es la probabilidad de que cada caja de piezas satisfaga esta garantía? 3. Un comerciante recibe para su venta, cierto tipo de artículo en cajas que contienen 10 unidades de los cuales 3 artículos son defectuosos. El control de calidad por caja consiste en extraer una muestra de 4 artículos uno por uno sin reposición y aceptar la caja si la muestra contiene a lo más un defectuoso. Calcular la probabilidad de rechazar una caja. 4. En un lote de 8 productos, sólo 5 de éstos cumplen con las especificaciones técnicas requeridas. Si de ese lote se escogen 3 productos al azar y sin reposición, calcule la probabilidad de que 2 cumplan con las especificaciones técnicas. 5. Un distribuidor mayorista recibe diariamente un lote de 20 refrigeradoras de las cuales ocho son de color blanco y las restantes de color plata. Un comerciante minorista le solicita, también diariamente, seis refrigeradoras. Suponiendo que las refrigeradoras se seleccionan al azar . a) ¿Cuál es la probabilidad de que, en un día cualquiera, el número de refrigeradoras de color blanco seleccionadas sea más de tres? b) ¿Cuál es la probabilidad que, para los siguientes cinco días, como máximo en dos días, el minorista reciba exactamente tres refrigeradoras de color plata? Suponer independencia. 6. En un almacén de aparatos electrónicos se almacenan 10 tostadoras para su distribución, cuatro de la marca A y el resto de marcas menos conocidas. Si un empleado selecciona al azar cinco
90
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
tostadoras para llevarlas por encargo a una tienda para su comercialización, calcular la probabilidad de que en las cinco tostadoras seleccionadas: a) Existan exactamente dos de la marca A. b) A lo sumo haya una tostadora de las marcas menos conocidas. 7. El número de averías semanales de una cierta máquina de una fábrica es una variable aleatoria con distribución de Poisson con media 0,3. a) ¿Cuál es la probabilidad de que la máquina tenga a lo más dos averías en una semana? b) Si se tienen 5 de estas máquinas. ¿Cuál es la probabilidad de que al menos 2 de estas no tengan averías en dos semanas? 8. En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que llegan a un ovalo tiene distribución de Poisson con media igual a 5 automóviles por segundo. a) ¿Cuál es la probabilidad de que en un segundo lleguen al ovalo más de dos automóviles? b) Calcule la probabilidad de que en los siguientes 10 segundos lleguen al ovalo 40 automóviles. c) Suponga que el 90% de vehículos que llegan diariamente al ovalo mencionado son de transporte privado. Para los siguientes 5 días, calcule la probabilidad de que lleguen al ovalo por lo menos tres vehículos de transporte privado.
4.4 Variables aleatorias continuas Sea X una variable aleatoria continua. Función de densidad de una variable conti nua
Se denomina función de densidad f ( x) de una variable aleatoria continua X a la función f( x) integrable que satisface: f(x)
f ( x) 0
f ( x)dx 1
b
P(a X b) f ( x )dx a
a
b
Ejemplo
Sea K una constante y consideremos la función de densidad de la vida útil, en años, de cierto tipo de computadora:
kx 0 x 2 c.c. 0
f ( x )
Estadística (Civil/Electrónica/Telecomunicaciones)
91
UPC
a. Obtenga el valor de k, para que f ( x) sea función de densidad. b. Calcule la P(0,5 < X < 1,8) c. Calcule la P(X > 1) Solución a. Para que f ( x) sea función de densidad debe de satisfacer la siguiente condición:
∫ 1
K
∫ 1
k(2) = 1
k=½
1 x 0 x 2 f ( x) 2 0 c.c.
.. ∫ ∫
b. P(0,5 < X < 1,8) = c. P(X > 1) = Ejercicio
0,7475
0,75
El gerente de la empresa le informa al departamento de Control de Calidad que uno de los principales clientes de la empresa ha exigido que las bombillas LED tengan como mínimo un tiempo de encendido continuo de 2100 horas. La distribución de densidad del tiempo de encendido continúo (en miles de horas) que obtuvo la empresa es la siguiente:
1 1, 8 ≤≤2, 2 () {6 (17) 0 a. ¿Cuál es la probabilidad de que el departamento de Control de Calidad pueda cumplir con la exigencia del cliente?
b. ¿Cuál es la probabilidad de que el tiempo de encendido sea superior a 2000 horas?
92
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Función de distribución acumulada
La función de distribución acumulativa F ( x) para una variable aleatoria continua X se define: x
F ( x) P( X x )
f t dt
Si F ( x) es la función de distribución acumulativa para una variable aleatoria continua entonces la función de densidad f ( x) para X es: f ( x)
X ,
dF ( x) dx
Propiedad de la Funci ón de distri buci ón acumulada
P( x1
X x2 ) F ( x2 ) F ( x1 )
Ejemplo
El tiempo, en minutos, que un tren se retrasa es una variable aleatoria continua X con la siguiente función de densidad: 3 (25 x 2 ) 0 x 5 f ( x) 250 0 c.c. a. Determine la función acumulada F(X) b. Calcule P(X > 2) haciendo uso de la función acumulada. c. Calcule P(1.5 < X < 3.5) haciendo uso de la función acumulada. Solución a. Para hallar la función acumulada F(X) seguiremos los siguientes pasos:
≤ ≥
Si X 0
Si 0 < X < 5 F(X) =
Si X 5
F(X) = 0
∫ (25) −
F(X) = 1
93
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Finalmente,
F(x) =
0− 0
]0, 4 32 ()− (.)−. (.)−. = 0,442 < 3,5) = F(3.5) F(1.5) =
b. P(X > 2) = 1 – P(X 2) = 1 – F(2) = 1 – [ c. Calcule
P(1,5 < X
–
Ejercicio
Los sondeos de mercado realizados por un fabricante sobre la demanda de un producto indican que la demanda proyectada debe considerarse una variable aleatoria X con valores entre 0 y 25 toneladas. La función de densidad de X está dada por: f ( x )
3x 25
2 3
0 x
25
a. Construir la función de distribución acumulada de X.
b. ¿Cuál es la probabilidad de tener una demanda entre 10 y 20 toneladas?
Respuesta: 0,448
94
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
c. Calcule la mediana e interprete.
Respuesta: 19,8425 Esperado de un a variable aleatori a conti núa
Sea X una variable aleatoria continua con función de densidad f ( x), y sea g( x) cualquier función de X , los valores esperados de X y g( x) son: E X xf ( x) dx
E g x
g (x) f (x)dx
Propiedades del esperado E (c) = c, donde c es una constante. E (cX )= cE ( X )
Sea X una variable aleatoria continua y sean
g1( x), …, gk ( x) funciones de X :
E [g1( x)+ …+ gk ( x)] = E [g1( x)]+ …+ E [gk ( x)]
Varianza de una variabl e aleatori a conti nua
Sea X una variable aleatoria continua con función de densidad f ( x). Entonces, la varianza de X es
V(X) = E[X - ]2 = E(X2) -
2
Formula abreviada para el cálculo de la varianza:
Dónde: E(X2) =
∑ ()
V(X) = E(X2) – [E(X)]2
La desviación estándar de X es la raíz cuadrada positiva de la varianza de X
2
95
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Propiedades de la varianza
Sean a y b dos constantes cualesquiera, entonces: V(a) = 0 V(bX) = b2 E(X) V(a + bX) = b2 E(X) Ejemplo
El tiempo de anticipación (-) o retraso (+) en minutos, de la llegada de un tren sobre su tiempo establecido, es una variable aleatoria continua X con la siguiente función de densidad:
3 (25 x 2 ) 5 x 5 f ( x ) 500 0 c.c. a. Calcule e interprete el valor esperado. E(X) =
∫−+ (25) [ ]
= 0
El tiempo promedio de anticipación o retraso que tiene el tren sobre su hora establecida es 0 minutos, es decir llega en promedio puntual. b. Los supervisores de la estación ferroviaria, han notado que últimamente los trenes no están llegando en su hora establecida, para lo cual han fijado como norma que un tren puede llegar en a lo más , siendo S la desviación estándar. ¿Qué porcentaje de trenes cumplen la norma fijada? E(X2) =
± 0,5 ∫−+ (25) [25∗ 25∗ − −]
= 5
V(X) = 5 – (0)2 = 5 S=
√ 5
= 2,236068
P (-0,5S
≤≤ X
0,5S) = P (-1,118
≤≤
X 1.118) = 0,32981
El 32,981% de los trenes cumplen la norma fijada. c. Calcule la probabilidad de que el tren llegue retrasado a lo más 2 minutos.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
96
d. ¿Cuál es la probabilidad de que el tiempo de llegada de un tren difiera de su hora establecida a lo más en un minuto?
Ejercicio
El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria X con función densidad: f ( x) k ( x 8) 8 x 10 a. Obtenga el valor de k, para que f(x) sea una función de densidad.
Respuesta: 0,5 b. ¿Cuál es la probabilidad que un artículo pese más de 9 onzas?
Respuesta: 0,75
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
97
c. Calcule el peso máximo que debe tener un artículo de manera que el 25% de los artículos tengan pesos menores o iguales a dicho peso.
Respuesta: 9 d. Los artículos con un peso menor a 8,5 onzas son separados. ¿Cuál es la probabilidad que un artículo, seleccionado al azar, sea separado?
Respuesta: 0,0625 e. Calcule e interprete el valor esperado.
Respuesta: 9,3333 f. Calcule la variación relativa.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
98
Ejercicios
Las utilidades netas, en miles de soles, de los propietarios de stands en una galería comercial es una variable aleatoria con la siguiente función de densidad: f ( x )
x 8 0 x 4 0 otro caso
a. ¿Estaría usted en condiciones de afirmar que más de la mitad de los propietarios tiene utilidades superiores al promedio? Justifique. b. Calcule la variación relativa de las utilidades.
99
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
4.5 Principales variables continuas Distribución uniforme
La distribución uniforme es la distribución más simple de una variable aleatoria continua. La distribución tiene forma rectangular y queda definida por valores mínimos y máximos. Función de densidad: Se dice que una variable aleatoria continua X tiene distribución uniforme en [a, b] si su función de densidad está dada por: f x
1 ba
a
x b
Notación: Se denota por X ~U [a , b] f(x)
f (x)
1 / (b-a)
0
a
k 1
k 2
b
x
Si [k 1, k 2] [a, b], la probabilidad de que X tome valores en el intervalo [k 1, k 2] es: P( k 1
E X
Media: Varianza:
2
V X
X k 2 )
k 1 ba
k 2
ab
2
b a2 12
Ejemplo
Se sabe que el peso X de ciertos bloques de acero, es una variable aleatoria continua distribuida uniformemente en el intervalo [50,70] toneladas. Encontrar: b) La función de densidad de la variable. f x
1 70 50
1 20
50 x 70
c) La probabilidad de que si se pesa un bloque seleccionado al azar pese por lo menos 62 toneladas.
Estadística (Civil/Electrónica/Telecomunicaciones)
≥
P (X 62) =
UPC
100
−− 0,4
d) La probabilidad de que el peso del bloque seleccionado varié entre 58 y 63 toneladas. P (58 < X < 63) =
−− 0,25
Ejercicio
El ingeniero supervisor del tren eléctrico de Lima sabe por experiencia que el tiempo que se demora en abordar el tren eléctrico un pasajero tiene una distribución uniforme con parámetros de 0 a 20 minutos. a. Calcule la probabilidad de que un pasajero se demore más de 6 minutos en abordar el tren.
b. Calcule la probabilidad de que un pasajero se demore en abordar el tren entre las 7:15 a.m. y las 7:20 am.
c. ¿Cuál es el tiempo mínimo para que el pasajero este considerado entre el 20% de los que más se demoran en abordar el tren?
101
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
4.6 Distribución Exponencial Función de densidad: Una variable aleatoria X es exponencial con parámetro 0 , si su función de densidad es:
1 1 x e f ( x ) β 0
x 0
otro caso
Notación: Si X sigue una distribución exponencial con parámetro 1/ se denota X ~ Exp ( ). Grafica de la Di stribución Exponencial 1,0
0,8
y t i s n e D
0,6
0,4
0,2
0,0 0
1
2
3
4
5
X
Media: Varianza:
E X
2
V X 2
Función de distribución acumulada:
∫−∞ () −/
F(x) = P(X ≤x) = F(x) = P(X ≤x) = Características:
, x ≥ 0
La variable puede tomar valores de 0 a + , no toma valores negativos. La gráfica es descendente con sesgo a la derecha. Existe una curva para cada valor de .
La distribución exponencial se usa para describir la vida útil de un dispositivo o tiempo de funcionamiento hasta que falle y es el promedio de la vida útil (vida media) del dispositivo.
102
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejemplo
La duración, en miles de millas, que obtienen los dueños de automóviles con cierto tipo de neumático es una variable aleatoria con la siguiente función de densidad:
1 201 x e f ( x) 20 0
si x 0 si x 0
Determine la probabilidad de que uno de estos neumáticos dure a. Como máximo10 000 millas b. entre 16 000 y 24 000 millas c. al menos 30 000 millas. Ejemplo
El tiempo de vida de un componente tiene una función de densidad de f(x)
−
x>0
0
en otros casos
a. ¿Cuál es la probabilidad de que un componente dure más de 800 días? P (X > 800) = 1- P(X ≤ 800) = 1- (1 b. Calcule el valor de la mediana P (X ≤ x) =
-
0,50
l n (0,50)
→ →
(1-
) )
0,2019
0,50
x = 346,57 días
Ejercicio
La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene distribución exponencial con promedio de 8 minutos. a) ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?
103
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
b) ¿Cuál es la probabilidad que una llamada dure más de 9 minutos?
c) ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de las de mayor duración?
d) Si la llamada dura más de 5 minutos ¿cuál es la probabilidad de que dure a lo más 8 minutos?
Ejercicios
1. Se tiene que construir dos casas y para terminar cada una se necesita llevar a cabo determinado trabajo clave. El trabajo clave tiene un tiempo de ejecución cuya función de densidad de probabilidad es: 1 12 x e f ( x ) 12 0
x 0 c.c.
Si se supone que los tiempos de terminación de los trabajos son independientes, calcule la probabilidad de que el tiempo de ejecución de ambos trabajos demande menos de 10 horas. 2. Suponga que la vida útil, en horas, de cierta marca de foco electrónico, es una variable aleatoria X cuya función de densidad de probabilidad es: x 8000 f ( x) ce 0
x 0 c.c.
a. Calcule el valor de la constante c para que f (x) sea función de densidad. Si se selecciona un foco electrónico al azar, calcule la probabilidad de dure más de 10 000 horas. b. Si el costo C, en dólares, por cada foco está dado por:
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
C 20
104
X 2 , determine el costo esperado e interprete. 2 2 4000 8000 X
c. Si se selecciona ocho focos electrónicos, calcule la probabilidad de que por lo menos dos de ellos duren más de 10 000 horas. 3. La vida, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la siguiente función de densidad: 1
1 x f ( x ) e 50 para x 0 50 a. Calcule e interprete la mediana. Si un lote tiene 20 de estos dispositivos, ¿cuántos se esperaría que duren más que la mediana? b. Si el dispositivo duró 80 horas, ¿cuál es la probabilidad de que dure 25 horas más? c. Se escoge aleatoriamente de un lote 5 dispositivos electrónicos, ¿cuál es la probabilidad de que al menos uno dure más de 35 horas?
4. El tiempo de duración X, en meses, de un tipo de resistencia eléctrica tiene la siguiente función de densidad de probabilidad:
0,5e 0,5 x , si x 0 f ( x) , en otro caso 0 a. Si se prueban 10 resistencias eléctricas, ¿cuál es la probabilidad de que al menos dos de ellas duren más de 4 meses? b. Si el costo de producción de una resistencia es: C(X) = 2+ 3x ¿cuánto es el valor esperado del costo?
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
105
Distribución normal
Esta distribución se aproxima a las distribuciones de frecuencias observadas de muchas medidas naturales y físicas, como es el caso de pesos, alturas, ventas, vida útil de producción, coeficiente intelectual, etc. La curva normal tiene forma de campana y es simétrica con respecto a su media La media, la mediana y la moda son iguales y se encuentran en x = y la desviación estándar es . Función de densidad: La variable aleatoria X es normal si su función de densidad se define de la siguiente manera: 1 x
f ( x)
1 e 2 2
2
x
Notación: Si la variable aleatoria tiene distribución normal con parámetros y se denota: X ~ N(, 2) Media E(X) = Varianza Var(X) = 2
Distribución normal estándar
La distribución normal estándar es una distribución de una variable aleatoria continua denotada con la letra Z , que tiene media 0 y desviación estándar 1. Una variable aleatoria con distribución normal se puede convertir en una distribución normal estándar si se realiza la siguiente transformación, llamada de estandarización o de tipificación. Z
X
X : Variable aleatoria de interés. : Media de la distribución.
: Desviación estándar de la distribución. Notación:
Z ~ N (0,1)
≤
Función Acumulada: F (Z) = P (Z z)
La distribución de la variable Z se encuentra tabulada en las tablas estadísticas, pudiendo hallar diversas situaciones como:
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
Ejemplos
Sea Z una variable con distribución normal estándar. a) P(Z < 1,28) = 0,89973 b) P(Z < -1,37) = c) P(Z > - 1,26) = 1- P(Z < - 1,26) = 1 - 0,10383 = 0,89617 d) P(Z > 2.19) = e) P (-2,63< Z < 1,26) = P (Z<1,26) – P (Z<-2,63) = 0,89617 – 0,00427 = 0,8919 f) P( -1,16 < Z < 2,34) = g) P(Z < 6) = 1 h) P(Z < - 4) = i) ¿Cuánto es el valor de Z para pertenecer al percentil 25?
106
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
107
j) ¿Cuánto es el valor de Z para pertenecer al percentil 78?
Ejercicio
Un fabricante de televisores asegura que el tiempo medio de funcionamiento sin fallas de los aparatos es de 2 años con una desviación estándar de 0,25 años. Si el tiempo de vida de los aparatos sigue una distribución normal. X: Tiempo de funcionamiento de televisores X ~ N (2; 0,252) a. ¿Cuál es la probabilidad de que el tiempo de buen funcionamiento sea menor que 2,5 años? P(X < 2,5) = P (Z <
,,− ) P (Z < 2,00) = 0,97725
b. Determine la probabilidad de que el tiempo de funcionamiento este entre 1 año y 1,75 años P (1< X < 1,75) = P (Z<-1,00) – P (Z<-4,00) = 0,15866 – 0,00 = 0,15866 c. El fabricante garantiza que remplazará gratis cualquier aparato de TV cuya duración sin fallas sea menor que k años. Aproximar k de tal modo que sólo el 1% de los aparatos vendidos tenga que ser reemplazado. P(X < K) = 0,01 z = -1,29
− , 1,29
→
k = 1,6775
años
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
108
Ejercicio
Una máquina llena recipientes con determinado producto. Se sabe que el peso de llenado de dicho producto tiene distribución normal. Se sabe, de acuerdo con los datos históricos, que la media es 20,23 y la desviación estándar de pesos de llenado es de 0,6 onzas. X: X ~
a. Se dice que la máquina funciona correctamente si el peso de llenado del producto está entre 19,03 y 21,43 ¿Qué tan probable es que la máquina no funcione correctamente?
Respuesta: 0,0455 b. ¿Cuál es la probabilidad de que el peso de llenado sea menor que el promedio?
uesta: 0,5 c. Si se sabe que la máquina funciona correctamente, ¿cuál es la probabilidad de que el peso de llenado sea menor que el promedio?
Respuesta: 0,0455 Ejercicios
1. Si una persona llega a su centro de labores entre las 9:00 y las 9:15 de la mañana, podrá considerarse que es igualmente probable que llegue, por ejemplo, entre las 9:05 y 9:10 o entre las 9:06 y las 9:11. ¿Cuál es la probabilidad de que llegue entre las 9:08 y 9:13? 2. En ciertos experimentos, el error cometido en la determinación de la solubilidad de una sustancia es una variable aleatoria con densidad uniforme en el intervalo [-0.025, 0.025]. a. Calcule la media y la varianza para el error cometido. b. ¿Cuál es la probabilidad de que el error esté entre -0,012 y 0,012?
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
109
3. El tiempo que un trabajador de construcción civil utiliza durante su refrigerio para ir a la cafetería, almorzar y regresar a su puesto de trabajo es una variable aleatoria con distribución uniforme en el intervalo de 0 a 25 minutos. Si el horario de refrigerio de los trabajadores empieza al mediodía y en ese momento Juan decide ir a la cafetería. Calcular la probabilidad que Juan este de vuelta a su puesto de trabajo en menos de un cuarto de hora. 4. El Departamento de Transporte (DOT) de cierto país, ha determinado que el monto de la licitación ganadora X (en dólares) por contratos de construcción de carreteras tiene una distribución uniforme con función de densidad de probabilidad: 2d 5 x 2d si f ( x) 8d 5 0 c.c. donde “d” es la estimación que h ace el DOT del
costo del trabajo. a. ¿Cuál es el monto esperado de la licitación ganadora? b. ¿Qué fracción de las licitaciones ganadoras por contratos de construcción de carreteras están por encima de la estimación del DOT? 5. Una máquina automática para el llenado de paquetes de arroz puede regularse de modo que la cantidad media de arroz llenado sea la que se desee. Si la cantidad de arroz depositada se distribuye normalmente con desviación estándar igual a 10 gramos, ¿cuál debe ser la regulación media de modo que sólo el 1% de los paquetes tengan un peso neto inferior a 990 gramos? 6. En un taller de la Industria Sideromecánica se fabrican árboles de leva para darles uso en motores de gasolina. Después de investigaciones realizadas se ha llegado a la conclusión de que la excentricidad de estos árboles de leva es una variable aleatoria normalmente distribuida con media de 1.02 pulgadas y desviación estándar de 0.44 pulgadas. Calcule la probabilidad de que al seleccionar un árbol de leva aleatoriamente este tenga una excentricidad: a. Menor de 1 pulgada. b. Al menos 1.05 pulgadas. c. ¿Cuál es el valor de la excentricidad por debajo del cual se encuentra el 70% de los árboles de leva? d. ¿Cuál es el valor de la excentricidad por encima del cual se encuentra el 80% de los árboles de leva? e. Si se seleccionan 10 árboles de leva aleatoriamente ¿Cuál es la probabilidad de que exactamente 2 de estos tengan una excentricidad menor que 1 pulgada? 7. La duración de las llamadas telefónicas de larga distancia realizadas desde una central telefónica tiene distribución aproximadamente normal con media y desviación estándar iguales a 130 segundos y 30 segundos respectivamente. a. ¿Cuál es la probabilidad que una llamada realizada desde la central telefónica haya durado entre 90 y 170 segundos? b. Si en un día cualquiera se realizan 500 llamadas telefónicas desde esta central. ¿Cuál es la probabilidad que la duración total de estas llamadas supere las 18 horas?
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
110
8. Un consultor está investigando el tiempo que emplean los obreros de una planta automotriz en montar una parte específica después de haber seguido un periodo de entrenamiento. El consultor determinó que el tiempo en segundos empleados por los obreros en dicha tarea se distribuye normalmente con una media de 75 segundos y una desviación estándar de 6 segundos. a. Si seleccionamos un obrero al azar, encuentre la probabilidad de que dicho obrero complete su tarea en más de 62 segundos pero menos de 69 segundos. b. Si seleccionamos tres obreros al azar, calcule la probabilidad de que el tiempo total que les demanda realizar el mismo tipo de tarea sea menor de 250 segundos. Asuma que los tiempos para realizar dicha tarea son independientes. 9. Un tubo fluorescente tiene una duración distribuida normalmente con una media de 7000 horas y una desviación estándar de 1000 horas. Un competidor ha inventado un sistema de iluminación fluorescente compacto que se puede insertar en los receptáculos de lámparas incandescentes. El competidor asegura que el nuevo tubo compacto tiene una duración distribuida normalmente con una media de 7500 horas y una desviación estándar de 1200 horas. ¿Cuál tubo fluorescente tiene mayor probabilidad de tener una duración mayor que 9000 horas? 10. Un contratista de construcción afirma que elaborar un proyecto de construcción demora en promedio 35 horas de trabajo, y el 97.5% de los proyectos demandan como máximo 38,92 horas. Considerando que los tiempos para completar proyectos similares se distribuyen normalmente. a. ¿Cuál es la probabilidad de que un proyecto demande menos de 32 horas? b. Si el contratista demora más de 48 horas deberá devolver 2% del costo de dicho proyecto; si en cambio demora menos de 29,5 horas, recibirá un incentivo de 5% del costo del proyecto, ¿cuánto esperaría recibir de incentivo?
111
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Unidad 5 Estadística Inferencial: Estimación de parámetros y prueba de hipótesis Logro de la unidad Al final de la unidad el estudiante será capaz de realizar estimaciones de parámetros desconocidos y verificar hipótesis sobre estos parámetros, así como distinguir las diferentes técnicas a utilizar de acuerdo al tipo de variable (cualitativa o cuantitativa) y de acuerdo al interés del investigador, de modo que pueda modelar satisfactoriamente problemas relacionados con su especialidad, reconociendo la importancia de ésta herramienta en la toma de decisiones.
5.1 Estimación puntual Es la estimación del valor del parámetro por medio de un único valor obtenido mediante el cálculo o evaluación de un estimador para una muestra específica. El estimador se expresa mediante una fórmula. Por ejemplo, la media de la muestra X
1 n
n
X es un posible estimador puntual de la media i
i 1
poblacional . Los parámetros con sus correspondientes estimadores puntuales son: Parámetro
Estimador puntual
x
2
s2
p
p
1
ˆ
2
12 / 22 p1
p2
x1
x2
s12 / s 22 p1 ˆ
p2 ˆ
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
112
5.2 Estimación por intervalos Objetivo: Estimar parámetros desconocidos mediante un rango de valores donde, con cierta probabilidad, se espera se encuentre dicho parámetro.
El intervalo de confianza del 100 (1-α) % para estimar el parámetro θ es dado por: IC(θ)=(LI ; LS)
Donde: P(LI < θ < LS) = 1-α, siendo (1-α) el nivel de confianza.
5.3 Intervalo de confianza para la media El intervalo de confianza del 100(1- α)% para estimar µ es (LI ; LS) tal que P(LI < µ < LS)= 1-
α
Donde los limites LI y LS determinan intervalos aleatorios pues dependen de la muestra. Por ejemplo, un intervalo de 95% de confianza para estimar µ se entiende de la siguiente manera: Si se toman 100 muestras de tamaño “n” se tiene:
Muestra 1 Muestra 2 Muestra 3 Muestra 4 …
Muestra 100
Se espera que cinco de las muestras nos lleven a construir intervalos que no contienen a µ y las 95 restantes si nos darán intervalos que contienen a µ. Por ejemplo, si se desea estimar la resistencia promedio de un bloque de concreto, se elegirá una muestra de 20 bloques y mediante una prueba en laboratorio se determinará la resistencia de estos 20 bloques de concreto. ¿Cuál es la variable en estudio? ¿Cuál es el tipo de variable y la escala adecuada para la variable bajo estudio? ¿Qué parámetro deseamos estimar? ¿Por qué? ¿Cuál es el procedimiento para hacer la estimación?
113
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Intervalo de confianza para la media con varianza poblacional desconocida
n
X
x ,S ME
µ desconocida y 2 desconocida
LI= X - ME
ME LI= X + ME
X
Este intervalo puede contener a µ o no contenerlo. Se construye el ME con una probabilidad (nivel de co nfianza) de que este intervalo contenga a µ.
Si x y S son la media y la desviación estándar de una muestra aleatoria de tamaño n, el intervalo de confianza de (1 – )100% para está dado por: x t / 2 , n 1
S n
x t / 2 , n1
S n
El error es la diferencia que existe del estimador con el parámetro. Su notación:
µ x
El máximo error que se comete al estimar p mediante la muestra con el valor de denotado por: ME = e = t / 2 , n 1
S
̂
es
n
Luego,
y
donde t ( / 2 , n1) es el valor t con ( n – 1) grados de libertad, que deja un área de /2 a la derecha.
x
x
Gráfica de distribución T, gl = n-1 0.4
0.3 d a d i s n e D
0.2
0.1
α/2 0.0
-to
t(α/2, n-1)
α/2 0
to
t(1-α/2, n-1)
114
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
NOTA : Si X no tiene una distribución normal entonces el tamaño de la muestra debe ser mayor o igual que 30 ( n≥30 ) por el Teorema el Límite Central, de modo que la X se aproxima a una distribución normal. Ejemplo
Una máquina produce piezas metálicas de forma cilíndrica que son almacenadas en lotes. El ingeniero del departamento de calidad desea estimar el diámetro medio de las piezas producidas por esta máquina. Por lo tanto, toma una muestra al azar de nueve piezas de uno de los lotes y mide sus diámetros. Los resultados obtenidos en centímetros se muestran a continuación: 1,01
0,97
1,03
1,04
0,99
0,98
0,99
1,01
1,03
Suponga que los diámetros de las piezas tienen una distribución aproximadamente normal. a. Realice la estimación correspondiente con un nivel de confianza del 95%. Interprete.
Interpretación: Existe un 95% de confianza de que el intervalo [0,98668 ; 1,02443]cm. contenga al diámetro medio de las piezas metálicas producidas por esta máquina.
b. Si la especificación para el diámetro es 1±0.02 cm. ¿La muestra obtenida indica que se está cumpliendo con las especificaciones? Justifique su respuesta.
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
115
Ejercicio
El área de desarrollo de la empresa Ingenieros Groups S.A. debe iniciar la construcción de viviendas en terrenos de diferentes áreas de medida, y debe contratar a los trabajadores necesarios. Si el área de terreno es superior a 450 m 2 entonces deberá contratar a 20 trabajadores. La información necesaria que brinda el departamento de desarrollo en una muestra de 36 viviendas se encuentra en el siguiente gráfico:
Con una confianza del 97% estime el área promedio de construcción. Con este resultado diga si el departamento de desarrollo debe contratar a los 20 trabajadores.
116
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
Un receptor GPS capta las ondas electromagnéticas emitidas por los satélites, y también registra el tiempo en recibir la señal, desde que ha sido emitida por el satélite. Se ha realizado el seguimiento a un receptor durante sus últimos 30 registros. La información se presenta en un reporte de MINITAB incompleto: T de una muestra: Tiempo
Variable Tiempo
N 30
Media 0,12366
Error estándar de la media 0,00644
Desv.Est. 0,03528
(
IC de 98% ,
)
Con una confianza del 98% estime el tiempo promedio de recepción de la señal por el receptor GPS.
Tamaño de muestra
Suponga que un ingeniero civil desea estimar la resistencia media de un cilindro de concreto, para lo cual realizará pruebas en el laboratorio sobre la resistencia de este tipo de cilindros. ¿Cuántos especímenes debe probar? Para esto el ingeniero debe decidir dos cosas:
¿Con qué precisión debe trabajar? ¿Con qué confianza?
Error máximo (e) Nivel de confianza (1-α)
Si X se usa como estimación de , podemos tener (1- )x100% de confianza de que el error no exceda una cantidad específica e cuando el tamaño de la muestra es:
z1 2 n e
2
z S n 1 / 2 e
si es conocida
si no es conocida
2
Si el valor del tamaño de muestra es decimal se debe redondear al siguiente número entero.
117
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
1. Un ingeniero desea estimar la resistencia promedio de cilindros de concreto. Como no tiene idea de la variabilidad, selecciona una muestra piloto de 10 especímenes y realiza la prueba obteniendo los siguientes resultados: 2980
3120
3100
3059
2985
2998
3020
3100
2988
3010
¿De qué tamaño necesita que sea la una muestra si desea tener 98% de confianza y un margen de error de 50 psi?
2. Si el ingeniero desea estimar la resistencia promedio de cilindros de concreto ¿De qué tamaño necesita que sea la muestra si desea tener 97% de confianza y un margen de error de 50 psi? De otros estudios se puede asumir que la estimación de la desviación estándar poblacional es 100 psi.
118
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicios
Se afirma que la resistencia de un tipo de alambre tiene distribución normal. Los datos siguientes corresponden a una muestra de dichos alambres: 0,140
0,138
0,143
0,142
0,144
0,137
0,135
0,140
0,136
0,142
0,138
0,140
a. Estime la resistencia promedio de este tipo de alambres mediante un intervalo de 98% de confianza. Interprete. b. Si la especificación para este tipo de alambre es 0.15±0.05. De la estimación hallada en a, ¿se puede decir que el alambre cumple con la especificación? Explique. Un ingeniero de una planta de purificación de agua mide el contenido de cloro diariamente en una muestra de tamaño 25. En la última muestra se obtuvo una media de 4.8 mg de cloro por litro con una desviación estándar de 1.2 mg de cloro por litro. a. Estime, con 96% de confianza, el contenido promedio de cloro del agua. Interprete. b. Si el contenido promedio de cloro por litro de agua no debe exceder de 5 mg puesto que sería dañino para el organismo. ¿Esta muestra nos indica que no hay de qué preocuparse? Para estimar el tiempo promedio que lleva ensamblar cierto componente de una computadora, el supervisor de una empresa electrónica tomó el tiempo que 25 técnicos tardaban en ejecutar esta tarea, obteniéndose una media de 12.73 minutos y una desviación estándar de 3.46 min. a. Con una confianza del 99%, calcular el error máximo de estimación del tiempo promedio que lleva ensamblar el componente de la computadora. b. Si esta muestra se considera una muestra piloto, ¿qué tamaño de muestra es necesario seleccionar de modo que el error de estimación disminuya es un 30%? Los satélites transmisores de datos necesitan alta potencia para evitar bloqueos, es por ello que deben utilizar la banda KU con un valor mínimo de 11 GHz de frecuencia, valor de especificación. Los ingenieros de telecomunicación de INTELSAT desean estimar la frecuencia promedio de sus satélites y verificar si, en promedio, están cumpliendo con la especificación. Por lo tanto seleccionan al azar 66 satélites y registran las frecuencias. Los resultados son puestos en el siguiente gráfico:
Realice la estimación con 98% de confianza y diga si INTEL cumple con la especificación.
119
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Se desea calcular el tamaño de muestra para estimar el número promedio de microorganismos por m3 de aire con un error de 0.08 microorganismos por metro cúbico y con 95% de confianza. Para realizar este cálculo se ha seleccionado una muestra piloto de 12 muestras obteniendo la siguiente cantidad de microorganismos por metro cúbico. 2,212
1,839
3,152
2,608
2,456
2,747
2,913
1,265
2,346
2,333
1,909
2,333
5.4 Intervalo de confianza para la proporción poblacional Población dicotómica
n Número de éxitos
x éxitos
P=Proporción de éxitos=X/N desconocido
ME
Número de fracasos
LI= p - ME
p
ˆ
x n
ME
p
LS= p +
ˆ
ˆ
ˆ
ME
Este intervalo puede contener a p o no contenerlo. Se construye el ME con una probabilidad (nivel de confianza) de que este intervalo contenga a p.
Si p es la proporción de éxitos en una muestra aleatoria de tamaño n, un intervalo de confianza de (1 – )100% para estimar p está dado por: ˆ
p z1 / 2
p(1 p) ˆ
ˆ
ˆ
p p z1 / 2
p(1 p) ˆ
ˆ
ˆ
n
n
donde Z1-/2 es el valor z que deja un área de 1 – /2 a la izquierda. Gráfica de distribución Normal, Media=0, Desv.Est.=1 0.4
0.3 d a d i s n e D
0.2
1-α
0.1
α/2
α/2
0.0
0
Z(α/2)
Z(1-α/2)
120
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
El nivel de confianza 1-α, nos lleva a determinar el valor de la función inversa de Z, como se muestra en la figura. El valor de n debe ser grande ( n≥50). El error es la diferencia entre el valor del parámetro p y su estimación es El máximo error que se comete al estimar p mediante la muestra con el valor de p (1 p) denotado por: ME = e = z(1 / 2)
ˆ
|̂ ̂ |
ˆ
̂ ̂ n
Luego,
y
Ejemplo
El administrador de la red de una empresa ha documentado los incidentes relacionados a la caída de los sistemas. Al tomar una muestra aleatoria de los incidentes ocurridos en los últimos meses, clasifica la información de la siguiente manera: Causas de la caída del sistema
frecuencia
Falla en el Sistema operativo
22
Errores del Aplicativo
15
Falta de capacitación del operador
26
Sobre carga
18
Hardware
7
Enlaces
19
TOTAL
107
Estime la proporción de causas de la caída del sistema que se debe a “ errores del aplicativo ”, con una confianza del 95%. Interprete. Datos: n = 107; x = 15 → IC ( p)
p z (1 / 2)
p(1 p) ˆ
ˆ
IC(p) = 0,1402 ± 1,96 *
̂ 0,1402 ˆ
n
,∗,
IC(p) = 0,1402 ± 0,0658
IC(p) = [ 0,0744 ; 0,2060]
Interpretación: Existe un 95% de confianza de que el intervalo [0,0744; 0,2060] contenga a la verdadera proporción de causas de la caída del sistema que se debe a errores del aplicativo.
121
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
Un fabricante de semiconductores produce controladores utilizados en dispositivos de motores de automóvil, toma una muestra aleatoria de 200 controladores y encuentra que cuatro de ellos están defectuosos. Calcule e interprete un intervalo de confianza del 90% para la proporción de controladores no defectuosos.
Tamaño de muestra para estimar una proporción
Si es la proporción de éxitos en una muestra aleatoria de tamaño n, podemos tener una confianza del (1 – )100% que el error será menor de una cantidad específica e cuando el tamaño de la muestra es: z1 / 2 p1 p 2
n
ˆ
e
ˆ
2
Tamaño de muestra para estimar una proporción sin usar información muestral
El valor de p1 p se hace máximo cuando p 0,5 . Por lo tanto, la fórmula para calcular el tamaño de muestra queda de la siguiente manera: ˆ
ˆ
ˆ
n
2
z1 / 2
4e 2
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
122
Ejercicio
Se lleva a cabo un estudio para estimar el porcentaje de ciudadanos de una ciudad que están a favor de tener agua fluorada. ¿Qué tan grande se necesita que sea la muestra si se desea tener una confianza de 95% de que la estimación esté dentro del 1% del porcentaje real?
Visual Systems S.A.
está lanzando al mercado sus nuevos proyectores con tecnología DLP (Procesado Digital de la luz) que utiliza un nuevo chip DMD. El departamento de ventas desea realizar una encuesta con la finalidad de estimar la proporción de clientes que preferirían este novedoso proyector. El estudio requiere que el error al estimar la proporción no sea mayor a 4,5% con un nivel de confianza de 97%. Se tiene conocimiento por estudios anteriores que aproximadamente el 35% de los clientes podrían preferir el producto. Si el costo operativo para realizar la encuesta es de 5200 soles y además un costo adicional de 3,5 soles por cada encuesta. ¿Cuánto es el costo total que debe tener la empresa para realizarla?
Estadística (Civil/Electrónica/Telecomunicaciones)
123
UPC
Ejercicios
Se desea estimar con 95% de confianza y con un error de estimación no mayor de 3,5% el porcentaje de todos los conductores que exceden el límite de velocidad de 90 kilómetros por hora en cierto tramo del camino. ¿De qué tamaño se necesita tomar la muestra? Si se desea estimar la proporción real de unidades defectuosas en un embarque muy grande de ladrillos de adobe, y se quiere estar al menos 98% seguros de que el error es a lo más 0,04. ¿Qué tan grande deberá ser la muestra si: a. No se tiene idea de cuál es la proporción real? b. Si la proporción real es 0,12? Una empresa desea estimar la proporción de trabajadores de la línea de producción que están a favor de que se corrija el programa de aseguramiento de la calidad. La estimación debe quedar a menos de 0.05 de la proporción verdadera de los que favorecen el programa, con un nivel de confianza del 98%. A continuación se muestran el número de hurtos que han ocurrido en la última semana de un centro comercial. El administrador de este centro desea estimar la proporción de hurtos que se deben a la sección de joyería con una confianza del 98%. Realice la estimación e interprete el resultado. Número de hurtos en las secciones de un centro comercial Hogar, 10 Ropa, 16
Joyería, 62
Música, 47
Deportes, 50
Se desea estimar la proporción de componentes electrónicas que fallan antes de cumplir su vida útil de dos años. Para esto un ingeniero electrónico selecciona al azar 150 componentes y encuentra que 6 fallan antes de cumplir su vida útil. a. Realice la estimación con una confianza del 94%. Interprete. b. Si el fabricante garantiza que a lo más el 5% de sus componentes no cumplen con el tiempo de vida útil de dos años, ¿la información obtenida en a, pone en duda tal afirmación? Explique.
Estadística (Civil/Electrónica/Telecomunicaciones)
124
UPC
5.5 Prueba de hipótesis Conceptos generales
La prueba de hipótesis involucra una suposición elaborada sobre algún parámetro de la población. Después tomaremos una muestra para ver si la hipótesis podría ser correcta. La hipótesis que contrastamos se llama hipótesis nula (H o). La hipótesis nula se contrasta con la hipótesis alternativa (H 1) Luego, a partir de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial del parámetro poblacional podría ser correcta. El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula. Contraste de hipó tesis
La hipótesis que se contrasta es rechazada o no en función de la información muestral. La hipótesis alternativa se especifica como opción posible si se rechaza la nula. Tipos de errores Información muestral
La realidad
No rechazar H0
Rechazar H0
H0 es cierta
No hay error
Error tipo I
H0 es falsa
Error tipo II
No hay error
Error tipo I
Ocurre cuando se rechaza una hipótesis H 0 que es verdadera. La probabilidad de cometer error tipo I viene a ser la probabilidad de rechazar H 0 cuando ésta es cierta. Pr Cometer error tipo I Pr Rechazar Ho Ho es cierta
El valor es fijado por la persona que realiza la investigación. Por lo general, 1%, 5% o 10% Error tipo II
Ocurre cuando se acepta una hipótesis H 0 que es falsa, la probabilidad de cometer error tipo II es la probabilidad de no rechazar H 0 cuando ésta es falsa. Pr Cometer error tipo II Pr No rechazar Ho Ho es falsa
Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.
125
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Pasos para realizar una prueba de hip ótesis
Paso 1
•
Plantear las hipótesis
Paso 2
•
Fijar el nivel de significación
Paso 3
•
Calcular el estadístico de la prueba
Paso 4
Graficar las regiones críticas
•
•
Paso 5
Aplicar los criterios de decisión
Paso 6
•
Concluir
5.6 Prueba de hipótesis para una media poblacional Cuando la VARIANZA POBLACIONAL es desconocida
1. Plantear las hipótesis
H 0 : 0 H 1 : 0
H 0 : 0 H 1 : 0
H 0 : 0 H 1 : 0
2. Fijar el nivel de significación: 3. Estadístico de la prueba t
x μ o S n
El estadístico tiene una distribución t con (n – 1) grados de libertad.
126
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
4. Graficar las regiones críticas
H1:
Bilateral
Unilateral Izquierda
H : <
Unilateral Derecha
H1: >
0
0
5. Decisión: Rechazar Ho o No rechazar Ho. 6. Concluir. Ejemplo
Se sabe que el rendimiento promedio (en porcentaje) de un proceso químico es 12. Sin embargo últimamente se observa muchos valores menores. Para comprobar que efectivamente el rendimiento promedio ha disminuido, se toma una muestra aleatoria de un lote de materia prima y se registra las siguientes observaciones: 9,7
12,8
8,7
13,4
8,3
11,7
10,7
8,1
9,1
10,5
Suponiendo normalidad y a partir de la información muestral, verifique si efectivamente el rendimiento promedio ha disminuido. Use α = 0,04.
127
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Variable
Ejercicios
Cierto fabricante de motocicletas anuncia en un comercial de televisión que su vehículo rendirá en promedio 87 millas por galón. Los millajes (recorrido en millas) en ocho viajes prolongados fueron: 88, 82, 81, 87, 80, 78, 79, 89. Al nivel de significación del 5% ¿el millaje medio es menor que el anunciado? La densidad de ciertos fluidos es muy volátil por lo que se requiere que la densidad promedio sobrepase al valor de 0.031 para poder utilizarlo. La empresa 3C Ingenieros, encargada de realizar los análisis físico-químicos, debe evaluar la densidad de la sustancia XP90. Para estos fines se selecciona aleatoriamente 10 muestras de distintos lotes de producción y se registra la densidad. Los datos se muestran a continuación: Muestra Densidad
1 0.033
2 0.040
3 0.031
4 0.034
5 0.036
6 0.031
7 0.036
8 0.034
9 0.034
¿La empresa 3C Ingenieros recomendará usar la sustancia XP90? Use un α=0.02.
10 0.032
128
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Una de las últimas innovaciones en el campo de la iluminación es el proyector de cabeza móvil. Este proyector está compuesto por un foco halógeno que permite variar la intensidad luminosa. El gerente de ventas de la empresa Visual Systems S.A. ha decidido este año exportar este novedoso proyector si la intensidad luminosa promedio de estos proyectores es superior a 2600 lúmenes. Al seleccionar 12 proyectores y medir la intensidad luminosa de cada proyector se obtuvieron los siguientes datos: 2600
2800
3000
2000
2400
2800
2700
2600
3000
3200
3100
2500
Suponiendo que la intensidad luminosa tiene distribución normal ¿ Visual Systems S.A. deberá decidir realizar la exportación del lote? Use un nivel de significación de 3%. La norma internacional indica que el tiempo que tarda en recibir una señal un receptor parabólico no debe sobrepasar los 65 milisegundos. La Unión Internacional de Telecomunicaciones sospecha que INTELSAT está infringiendo esta norma y por lo tanto debe retirar los satélites de órbita que ha puesto esta compañía. Para tomar la decisión, selecciona al azar 66 satélites de INTELSAT y registra el tiempo que tarda en recibir una señal un receptor parabólico. Los resultados fueron procesados con el MINITAB obteniendo el siguiente reporte: Variable
Tiempo
N
Media
66
66.7
Desv.Est. Varianza
3.8
¿La
14.44
Unión Internacional de Telecomunicaciones deberá INTELSAT? Realice la prueba necesaria usando un α=0 ,03.
retirar de órbita los satélites de
5.7 Pruebas de hipótesis para una proporción poblacional 1. Planteamiento de las hipótesis
H 0 : p p0 H 1 : p p0
H 0 : p p0 H 1 : p p0
2. Fijar el nivel de significación: 3. Estadístico de la prueba Z
p po ˆ
po (1 po ) n
4. Graficar las regiones críticas
H 0 : p p0 H 1 : p p0
Estadística (Civil/Electrónica/Telecomunicaciones)
129
UPC
H1 : p p0 Bilateral
Unilateral Izquierda
H1 : <
0
H1 : >
0
Unilateral Derecha
5. Decisión: Rechazar Ho o No rechazar Ho. 6. Concluir. Ejemplo
El área de Marketing de la empresa Visual Systems S.A. está realizando una campaña publicitaria para la venta de los proyectores con tecnología LCD. Él asegura que, con esta campaña, se aumentará la proporción de proyectores de tipo LCD que se venden con respecto al año anterior que fue de 45%. En una muestra de 52 proyectores se observaron las siguientes ventas: Tipo de proyector
Ventas realizadas
LCD
36
DLP
16
¿La campaña publicitaria fue efectiva? Use un nivel de significación del 2%
Estadística (Civil/Electrónica/Telecomunicaciones)
130
UPC
Ejercicios
Un fabricante sostiene que al menos el 95% de los equipos que envió a una fábrica está acorde con las especificaciones técnicas. Una revisión de una muestra de 200 piezas reveló que 18 eran defectuosas. Pruebe la afirmación del fabricante al nivel de significancia de 1%. En cierta universidad se estima que menos 2,5% de los estudiantes van a bicicleta a la universidad. ¿Esta parece ser una estimación válida si, en una muestra aleatoria de 90 estudiantes universitarios, se encuentra que 28 van en bicicleta a la universidad? Utilice un nivel de significancia de 0,05. Los usuarios de la sustancia XP90 indican que cuando esta sustancia no es óptima ocurre un fenómeno conocido como licuefacción y se requiere un reproceso. La certificadora, encargada de la realización de los análisis físico-químicos, asegura que la proporción de reprocesos disminuye cuando la sustancia está certificada por lo tanto una de las metas de la empresa es tener más del 20% de sustancias certificadas. De una muestra de 120 reprocesos se identificó que 26 usaron sustancias certificadas. En base a esta información podemos afirmar que ¿la empresa ha logrado la meta? Use α=0 ,03 El fabricante de un nuevo controlador de errores de comunicación asegura que la proporción de procesos en los que se pierden datos cuando su controlador está operando es menor de 0,10. A fin de probar esta aseveración, se vigila el enlace de comunicación entre una terminal de gráficos y una computadora con el controlador de errores funcionando. De una muestra de 300 elementos se observó los siguientes resultados: Se perdieron datos cuando el controlador del fabricante está operando Sí
No
10
290
Total 300
¿La información recolectada refuta la aseveración del fabricante? Use 0,03 .
Estadística (Civil/Electrónica/Telecomunicaciones)
131
UPC
5.8 Prueba de hipótesis para una varianza poblacional 1. Planteamiento de las hipótesis
H 0 : 2 02 H 1 : 2 02
H 0 : 2 02 H 1 : 2 02
H 0 : 2 02 H 1 : 2 02
2. Fijar el nivel de significación: 3. Estadístico de la prueba c2
(n 1) S 2 02
~ n21
4. Graficar las regiones críticas
5. Decisión: Rechazar Ho o No rechazar Ho.
6. Concluir.
Bilateral
H1 :
Unilateral Izquierda
H1 :
Unilateral Derecha
H1 :
132
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejemplo
La norma de seguridad indica que la variabilidad de las charlas de seguridad debe ser de 2.76 minutos. El inspector de obra sospecha que la variabilidad en las obras que supervisa es muy alta y por tanto debería llamar la atención al jefe de supervisión de la obra. Para realizar la verificación del cumplimiento de dicha norma toma una muestra al azar de 9 días, encontrando los siguientes tiempos en minutos: 10
17
15
12
14
12
17
18
13
Con un nivel de significación del 2.5% se llamará la atención al Jefe de seguridad de la obra.
133
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicios
Se reporta que la desviación estándar de la resistencia al rompimiento de ciertos cables producidos por una compañía es 240 lb. Después de que se introdujo un cambio en el proceso de producción de estos cables, la resistencia al rompimiento de una muestra de 8 cables mostró una desviación estándar de 300 lb. Investigue la significación del aumento aparente en la variación usando un nivel de significación de 0,05. Cierto proceso de producción está diseñado para dar como resultado tornillos con una longitud media de 3 pulg y varianza de 2,56 pulg 2. Plantéese las hipótesis para cada una de las siguientes situaciones: a. El gerente de producción desea determinar si la longitud promedio ha disminuido. b. El gerente de producción desea determinar si la varianza de la longitud ha cambiado. En la empresa inmobiliaria Brento, se ha generado un descontento general respecto al desempeño mostrado por José, un tasador (valuador) que ha ingresado recientemente a la empresa. La queja es que José sobrestimaba el valor de las propiedades y esto conlleva, como consecuencia, a incrementar la varianza del valor de las propiedades que se había mantenido en 40 mil dólares2. En respuesta a la queja, la gerencia de la inmobiliaria, seleccionó 8 propiedades que fueron tasadas por José: 56,3
68,4
60,2
74,7
48,7
62,8
56,1
59,0
Las tasaciones en miles de dólares, se asumen que tienen distribución normal. A un nivel de significación del 5%, ¿proporcionan los datos evidencia suficiente para indicar que las quejas son válidas. Los proyectores de video vienen equipados con un ventilador tipo TitanTec que permite la refrigeración de la lámpara. Debido a esto, en algunos modelos, el ruido acústico, medido en decibeles, dB, puede ser molestoso. El jefe del área encargado de comprar componentes para los proyectores tomará la decisión de adquirir este tipo de ventilador si la variabilidad del ruido con este ventilador es menor a 6dB. Para analizar el caso se toma una muestra de 20 proyectores que arroja una desviación estándar de 4,2 dB. Asumiendo normalidad en el ruido acústico ¿el jefe del área deberá comprar este tipo de ventiladores para los proyectores? Utilice un nivel de significación del 5%. En un proceso de fabricación de filamentos se desea contrastar que la varianza del grosor de los filamentos es 4 milímetros2. Para ello se toma una muestra de 28 filamentos que arroja una varianza de 3.5 milímetros2. Realice la prueba respectiva con 5% de nivel de significación. Asuma normalidad en los grosores de los filamentos.
134
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
5.9 Pruebas de hipótesis para el cociente de varianzas poblacionales 1. Planteamiento de las hipótesis H 0 : 12 22 H 1 : 12 22
H 0 : 12 22 H 1 : 12 22
H 0 : 12 22 H 1 : 12 22
2. Fijar el nivel de significación: α 2
3. Estadístico de la prueba:
F c
S 1
2
S 2
4. Decisión: Rechazar Ho o No rechazar Ho 5. Concluir Ejemplo
La producción de compuestos inflamables es delicada y requiere técnicas muy precisas para lograr resultados óptimos. Actualmente, en el laboratorio se aplica la técnica A y se desea probar una nueva técnica, B. La siguiente información muestra el resultado obtenido por Minitab de los tiempos, en minutos, que utilizó cada técnica por proceso. Variable
Técnica A Técnica B
N
Media
16 11
9.97 9.27
Desv.Est.
6.56 2.05
Un ingeniero desea probar si la variabilidad entre los tiempos usados por ambas técnicas no son similares. Use =0,05 Test and CI for Two Variances Method F
DF1 15
DF2 10
Test Statistic 10.24
P-Value 0.001
Estadística (Civil/Electrónica/Telecomunicaciones)
135
UPC
5.10 Pruebas de hipótesis para la diferencia de medias poblacionales Caso 1: Varianzas poblacionales desconocidas e iguales
1. Planteamiento de las hipótesis Unilateral izquierda
Bilateral
Unilateral derecha
H0 : 1 2 k
H 0 : 1 2 k
H0 : 1 2 k
H1 : 1 2 k
H1 : 1 2 k
H1 : 1 2 k
2. Fijar el nivel de significación: α 3. Estadístico de la prueba
t c
x1 x 2 k
1 1 S p2 n n 2 1
(n1 1) S 12 (n2 1) S 22 S p n1 n2 2 2
~ t n1 n2 2
4. Decisión: Rechazar Ho o No rechazar Ho 5. Concluir Caso 2: Varianzas poblacionales desconocidas y diferentes
1. Planteamiento de las hipótesis Unilateral izquierda
Bilateral
Unilateral derecha
H0 : 1 2 k
H 0 : 1 2 k
H0 : 1 2 k
H1 : 1 2 k
H1 : 1 2 k
H1 : 1 2 k
2. Fijar el nivel de significación: α 3. Estadístico de la prueba:
t c
x1 x 2 k 2 S 1
n1
136
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
2 S 2
2
~ t
n2
S 12 S 22 n1 n2 2 2 S 12 S 22 n1 n2 n1 1 n2 1
El valor de debe ser entero pues son grados de libertad, si se obtiene un valor decimal se deberá redondear al entero menor del número obtenido, tal como lo hace el software Minitab. Por ejemplo si = 18,1260827 18 grados de libertad.
4. Decisión: Rechazar Ho o No rechazar Ho 5. Concluir Ejemplo
1. El tiempo de exposición, en minutos, de un metal con una sustancia química hasta lograr un
adherido perfecto es parte de un proceso de producción. Se considera que el menor tiempo de exposición es mejor. Como parte de la mejora del proceso se somete a prueba dos procedimientos y se mide el tiempo de exposición para dos muestras independientes. Tamaño de muestra
Promedio
Desv. estandar
Procedimiento A
31
12.97
4.25
Procedimiento B
25
11.99
2.47
a. Asumiendo que los tiempos de exposición tienen distribución normal, ¿se puede afirmar que hay diferencia en la variación de los tiempos? Use un nivel de significación del 5%. Test and CI for Two Variances Method F
DF1 30
DF2 24
Test Statistic 2.96
P-Value 0.008
137
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
b. Asumiendo que los tiempos de exposición tienen distribución normal y usando un nivel de significación del 5%, ¿Recomendaría el procedimiento B? Two-Sample T-Test and CI Sample 1 2
N 31 25
Mean 12.97 11.99
StDev 4.25 2.47
SE Mean 0.76 0.49
- μ (2) Estimate for difference: 0.980 95% lower bound for difference: -0.544 T-Test of difference = 0 (vs >): T-Value = 1.08 Difference = μ (1)
P-Value = 0.143
DF = 49
Ejercicio
1. Un componente de los satélites son los paneles solares. La compañía INTELSAT está probando
dos tipos de paneles solares: el EQM y el EM3, los cuales deben pasar un estricto control de calidad. Según información del departamento de calidad si la potencia de los paneles solares EQM supera en más de 2 Kw a los de EM3, se sugiere dejar de fabricar el modelo EM3. El jefe de producción selecciona al azar dos muestras de paneles de ambos modelos y registra las potencias de estos. A continuación se presenta la siguiente información: Variable
Tamaño de muestra
Media
Desv.Est
Panel EQM (1)
16
27,21
1,620
Panel EM3 (2)
21
23,63
3,490
Considerando que la potencia se distribuye normalmente, con un nivel de significación del 5%, ¿se debe dejar de fabricar el modelo EM3?
138
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Test and CI for Two Variances Method F
DF1 15
DF2 20
Test Statistic 0.22
P-Value 0.004
Two-Sample T-Test and CI Sample 1 2
N 16 21
Mean 27.21 23.63
StDev 1.62 3.49
SE Mean 0.41 0.76
- μ (2) Estimate for difference: 3.580 95% lower bound for difference: 2.114 T-Test of difference = 2 (vs >): T-Value = 1.83 Difference = μ (1)
P-Value = 0.039
DF = 29
Ejercicio
Los siguientes datos corresponden a la resistencia a la compresión a los 28 días, en kg/cm 2, reportados por dos laboratorios: Laboratorio 1
287,0
238,2
314,3
365,9
362,0
388,7
Laboratorio 2
306,0
338,0
349,4
307,4
316,2
326,9
292,9
290,3
Con 5% de nivel de significación, ¿los laboratorios reportan resultados en promedio similares? Asuma poblaciones normales.
139
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Test and CI for Two Variances: Laboratorio 1, Laboratorio 2 Method F
DF1 7
DF2 5
Test Statistic 8.50
P-Value 0.032
Two-Sample T-Test and CI: Laboratorio 1, Laboratorio 2 - μ (Laboratorio 2) Estimate for difference: -6.6 95% CI for difference: (-50.2, 37.0) T-Test of difference = 0 (vs ≠): T-Value = -0.34 P-Value = 0.741 Difference = μ (Laboratorio 1)
DF = 9
La exactitud obtenida en mediciones con GPS depende del equipo receptor. Uno de los fabricantes de receptores está realizando un estudio para comparar la exactitud de dos modelos, GPSMAP (1) y Oregón (2). Según información del departamento de control de calidad, la exactitud del modelo GPSMAP es menor que la de Oregón, por lo cual se sugiere dejar de fabricarla. El jefe de producción selecciona al azar dos muestras de receptores de ambos modelos con la finalidad de realizar la prueba correspondiente y registra la exactitud, en mm, obtenida por ambos receptores. Considerando que la exactitud se distribuye normalmente y con un nivel de significación del 4%, ¿la empresa debe dejar de fabricar el modelo GPSMAP A continuación se muestran los reportes obtenidos con Minitab: Test and CI for Two Variances Method F
DF1 15
DF2 12
Test Statistic 0.81
P-Value 0.691
Two-Sample T-Test and CI Sample 1 2
N 16 13
Mean 7.22 16.03
StDev 2.17 2.41
SE Mean 0.54 0.67
- μ (2) Estimate for difference: -8.810 96% upper bound for difference: -7.261 T-Test of difference = 0 (vs <): T-Value = -10.35 Both use Pooled StDev = 2.2798 Difference = μ (1)
P-Value = 0.000
DF = 27
Se desea determinar si un proceso de fabricación, que se efectúa en un lugar remoto se puede establecer localmente, a esta conclusión se llega si las lecturas de voltaje promedio en ambos lugares son iguales. Se instalaron dispositivos de prueba (pilotos) en ambos lugares y se tomaron las lecturas de voltaje en 10 series de producción de ambos lugares. Los datos se muestran a continuación. Lugar antiguo (1)
9,98
10,26
10,05
10,29
10,03
9,05
10,55
10,26
9,97
9,87
Lugar nuevo (2)
9,19
9,63
10,10
9,70
10,09
9,60
10,05
10,12
9,49
9,37
140
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Asuma que las lecturas de voltaje tienen comportamiento normal. Con 5% de nivel de significación, ¿se puede afirmar que las lecturas promedio de voltaje presentan diferencias significativas en ambos lugares? Un ingeniero de control de calidad sospecha que el tiempo promedio que se necesita para ensamblar un producto es mayor en el turno de la tarde que en el turno de la mañana. Si comprueba su sospecha deberá realizar una capacitación para los trabajadores del turno de la tarde. Al seleccionar muestras aleatorias de 10 productos que fueron ensamblados en el turno de la mañana y 10 en el turno tarde se obtuvieron los siguientes resultados para los tiempos, en horas, que demoran en ser ensamblados. Mañana (1)
6
7
8
6
7
6
7
8
6
7
Tarde (2)
9
15
9
8
3
12
24
12
11
9
Use un nivel de significancia de 0,02.
Estadística (Civil/Electrónica/Telecomunicaciones)
141
UPC
Unidad 6 Diseño de experimentos 6.1 Diseño de experimentos Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada (factores controlables) de un proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la variable de salida ( variable respuesta).
Ejemplo
Suponga que un exportador desea evaluar el efecto de tres métodos de empaque y dos sustancias preservantes en el tiempo de duración de cierto alimento. El exportador podría entonces realizar una serie de experimentos para evaluar cuál de las seis combinaciones entre método de empaque y sustancia preservante da mejores resultados; a cada una de estas seis combinaciones se les denomina tratamientos. Tratamiento 1: Empaque 1 con preservante A
Tratamiento 2: Empaque 2 con preservante A
Tratamiento 3: Empaque 3 con preservante A
Tratamiento 4: Empaque 1 con preservante B
Tratamiento 5: Empaque 2 con preservante B
Tratamiento 6: Empaque 3 con preservante B
Suponga que el exportador decide realizar cinco repeticiones del experimento con cada tratamiento. Como las condiciones ambientales (humedad, temperatura, etc.) pueden influir en el tiempo de duración del producto, los seis tratamientos deben ser sometidos a prueba en cada réplica en forma simultánea. Dado que el tiempo de duración promedio del producto es de aproximadamente 10 días, el exportador decide realizar una réplica quincenal. Por ejemplo, empezar la primera réplica con los seis tratamientos el día primero, la segunda el día 15, la tercera el día primero del siguiente mes y así sucesivamente. Réplica 1 Tratamiento 1: Empaque 1 con preservante A
Tratamiento 2: Empaque 2 con preservante A
Tratamiento 3: Empaque 3 con preservante A
Tratamiento 4: Empaque 1 con preservante B
Tratamiento 5: Empaque 2 con preservante B
Tratamiento 6: Empaque 3 con preservante B
Tratamiento 2: Empaque 2 con preservante A
Tratamiento 3: Empaque 3 con preservante A
Tratamiento 4: Empaque 1 con preservante B
Tratamiento 5: Empaque 2 con preservante B
Tratamiento 6: Empaque 3 con preservante B
Réplica 2 Tratamiento 1: Empaque 1 con preservante A
….
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
142
Conceptos generales Factor: Variable independiente que afecta los resultados del experimento: controlables o no controlables. En un experimento se puede evaluar uno o más factores. Tratamientos: Un tratamiento corresponde a los niveles de un factor o a la combinación de los niveles de dos o más factores. Es un conjunto de procedimientos cuyo efecto sobre la variable respuesta nos interesa estudiar. Su efecto se mide y se compara con otros tratamientos. Variable respuesta: Es la variable en la cual se evaluarán los efectos de los tratamientos. Unidad experimental: Es la unidad (sujeto u objeto) sobre el cual se le aplica un tratamiento. Ejemplo
El Gerente de una compañía dedicada a ensamblar piezas de equipos electrónicos, realizó un estudio con el fin de comparar la eficacia de 3 programas de capacitación, A, B y C. Para ello se asignaron al azar quince empleados, cinco a cada uno de los tres programas. Después de terminado los cursos de capacitación se registró el tiempo, en minutos, que les tomó ensamblar las piezas en los equipos electrónicos. Complete el siguiente cuadro: Variable respuesta Factor Tratamientos Unidad experimental
Diseño c ompl etamente al azar (DCA)
Suponga que se cuenta con los resultados de k muestras aleatorias independientes, cada una de tamaño ni, obtenidas desde k diferentes poblaciones y se desea probar la hipótesis de que las medias de estas k poblaciones son todas iguales. Las poblaciones que se desea comparar suelen ser producto de la aplicación de distintos tratamientos a ciertas unidades de análisis. Considere el caso en el que se desea comparar el efecto de cinco programas de incentivos en la productividad de los trabajadores.
143
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
En este caso: los cinco programas de incentivos serían los cinco tratamientos aplicados (los cuales definen las cinco poblaciones que se van a comparar) la unidad de análisis sería un trabajador (quien recibe el tratamiento). Los datos a analizar pueden arreglarse en una tabla como la que se muestra a continuación: Tratamientos Repeticiones
1
2
1
Y11
Y21
2
Y12
Y22
3
Y13
Y23
…
…
…
Y1j
Y2j
…
…
n i
Y1 n1
Y2 n2
Total
Y1.
Y2.
j …
…
…
…
…
i Yi1 Yi2 Yi3
…
…
…
…
…
k
…
Yk1
…
Yk2
…
Yk3
…
…
Yij …
Yi ni Yi.
…
Ykj
…
…
…
Yk nk
…
Yk.
…
Para probar la hipótesis de que las muestras se obtuvieron de k poblaciones con medias iguales se harán varias suposiciones. Con más precisión, se supondrá que las poblaciones son normales y que tienen varianzas iguales. Supuesto de homogeneidad de varianzas: H0: 12 22 32 42 (esto es, la varianza es la misma en las cuatro sucursales) H1: Al menos una varianza es diferente. Test for Equal Variances for Depósitos Bartlett's Test Test Statistic P- Value
1
0.19 0.980
Levene's Test Test Statistic P- Value l a s r u c u S
0.04 0.988
2
3
4
0.5
1.0 1.5 2.0 2.5 3.0 95% Bonferroni Confidence Intervals for StDevs
Con un p valor de 0,988, el resultado de esta prueba indica que no hay suficiente evidencia estadística para rechazar el supuesto de homogeneidad de varianzas al 5% de nivel de significancia.
144
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Supuesto de normalidad de los errores H0: Los errores del modelo tienen distribución normal. H1: Los errores del modelo no tienen distribución normal. Probability Plot of RESI1 Normal 99
Mean 5.551115E-17 StDev 0.9708 N 28 KS 0.081 P- Va lue >0 .1 50
95 90 80 70
t n 60 e c 50 r e 40 P
30 20 10 5
1
-2
-1
0
1
2
RESI1
Con un p valor de 0,150, el resultado de esta prueba indica que no hay suficiente evidencia estadística para rechazar el supuesto de normalidad al 5% de nivel de significancia. El modelo para este diseño es el siguiente: y ij i ij para i 1, 2, ..., k ; j 1, 2, ..., ni
donde:
: valor observado del i- ésimo tratamiento en la j-ésima repetición : Media poblacional
i
: Efecto del i-ésimo tratamiento
ij
: Error experimental asociado a la observación yij, donde
yij
ij ~ N (0, 2 )
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
145
6.2 Análisis de la varianza de un factor: DCA El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar tres o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. Se desea medir el efecto del factor en estudio (variable independiente de naturaleza cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de naturaleza cuantitativa). En un DCA los tratamientos se asignan aleatoriamente a las unidades experimentales. Hay k poblaciones (k tratamientos) y se seleccionan k muestras aleatorias independientes, una de cada población. Ejemplo:
Una importante compañía de construcciones desea comparar tres marcas de taladros para determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los taladros de cada marca se distribuyen normalmente. ¿Las marcas de taladro tienen un tiempo de vida útil promedio similar a las otras marcas antes de requerir una reparación? Un ingeniero civil residente de una obra desea evaluar el efecto que tiene las técnicas de mezclado de concreto sobre la resistencia (kg/cm 2) a la compresión. Para ello evalúa cuatro técnicas diferentes y para realizar la prueba produce especímenes de concreto. ¿La resistencia promedio a la compresión es la misma para cada técnica de mezclado? Suponga que una empresa constructora brinda capacitación con diferentes métodos a sus operarios. ¿El rendimiento promedio de los operarios en la empresa es el mismo según los métodos de adiestramiento recibido por el operario? Una importante compañía de construcciones desea comparar tres marcas de camiones antes de ordenar toda una nueva flota de una clase de camión. ¿Los costos medios de operación por kilómetro de cada camión es el mismo para cada marca de camión? Análisis de la varianza Técnica estadística que permite descomponer la variabilidad total de los resultados de un experimento en sus distintas fuentes (tratamientos, error experimental), con la finalidad de compararlas e identificar su importancia relativa en la explicación de la variación total.
146
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Tabla del ANOVA Fuente de variación
Grados de libertad
Suma de cuadrados k
Tratamientos
k – 1
SCTR
2
y i
n i 1
n. – k
Error
n. – 1
Total
2
i
y n
SCE SCT SCTR k
SCT
CMTR
SMTR
CME
SCE
F c
k 1
n
k
CMTR CME
2
n
Cuadrado medio
2 y ij
i 1 j 1
y n
Asumiendo el cumplimiento de los supuestos antes mencionados, y que en realidad no hay diferencia entre los tratamientos, la cantidad F c del cuadro de análisis de varianza seguiría una distribución F con los grados de libertad del tratamiento y con los grados de libertad del error. Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay diferencias entre las medias de los tratamientos. Ejemplo
La gerente de mercadeo de un banco planea poner en marcha cierto tipo de promociones para atraer nuevos clientes en cuatro sucursales del banco. Ella está convencida que diferentes tipos de promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de haber diferencias entre los ingresos medios de los clientes de cada sucursal, se optará por un programa de promociones distinto para cada una. Considere a los montos de los depósitos, en miles de soles, como una medida representativa de los ingresos de los clientes. Se presentan datos para una muestra de siete depósitos de cada sucursal ¿Debe la gerente optar por un programa de promociones distinto para cada sucursal? Evalúe esta posibilidad con un nivel de significación del 5%.
Depósito
Sucursal 1 (Tratamiento 1)
Sucursal 2 (Tratamiento 2)
Sucursal 3 (Tratamiento 3)
Sucursal 4 (Tratamiento 4)
1
y11 = 5,3
y21 = 3,3
y31 = 3,6
y41 = 4,3
2
y12 = 2,6
y22 = 4,6
y32 = 2,8
y42 = 2,5
3
y13 = 3,6
y23= 2,1
y33 = 4,5
y43 = 1,8
4
y14 = 3,8
y24 = 3,5
y34 = 3,8
y44 = 3,0
5
y15 = 2,7
y25 = 5,0
y35 = 1,9
y45 = 3,9
6
y16 = 5,1
y26 = 2,8
y36 = 4,1
y46 = 3,5
7
y17 = 4,2
y27 = 2,5
y37 = 5,1
y47 = 4,1
Total yi.
y1. = 27,3
y2. = 23,8
y3. = 25,8
y4. = 23,1
Los cálculos para obtener las sumas de cuadrados son:
k 4 2 y .. i 1
2
y ij j 1 k 4 7
-
n.
147
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
n.
2
(100)
7777
357,1429
i 1
k 4
-
SCT
SCTR
2
y i
n i 1
-
2
y 2 y ij n i 1 j 1 k 4
-
7
i
2
y n
,0171 5,32 2,62 . . . 4,12 357,1429 27
27,32 23,8 2 25,82 23,12 357,1429 1,568 7 7 7 7
SCE SCT SCTR 27,0171 1,568 25,4486
La tabla del análisis de varianza: Fuente de variación
Grados de libertad
Tratamientos k – 1 = 4 – 1 = 3
Suma de cuadrados
SCTR =1,569
Error
n. – k = 28 – 4 = 24 SCE =25,449
Total
n. – 1 = 28 – 1 = 27 SCT = 27,017
Cuadrados medio
1,569 3 25,449 24
0,523
Fcritico
0 ,523 1,060
0,49
Ftabla
3,01
1,060
La salida que muestra el Minitab es la siguiente: Source
DF
Seq SS
Adj SS
Adj MS
F
P
Sucursal Error Total
3 24 27
1.569 25.449 27.017
1.569 25.449
0.523 1.060
0.49
0.690
Hipótesis estadística Ho: 1= 2=…= K H1: Al menos un i es diferente
No hay diferencia en las medias poblacionales Hay diferencia en las medias poblacionales
Paso 1: Formular la hipótesis de trabajo Ho: A = B = C H1: Al menos un i es diferente a los demás
El factor en estudio no afecta a la variable respuesta El factor en estudio afecta a la variable respuesta
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
148
Paso 2: Establecer el nivel de significación = 0,05
Paso 3: Estadístico de Prueba Fc = 0,49 Paso 4: Criterio de decisión Fc = 0,49 < Fcrit = 3,01 NO se rechaza Ho Paso 5: Conclusión Al 5% de significación, no es posible afirmar que al menos un depósito promedio sea diferente a los demás.
6.3 Prueba para la diferencia de medias Se supone que el experimentador tiene a su disposición mediciones relativas a varios tratamientos. El análisis de varianza indica si hay evidencias de que al menos una de las medias sea diferente o no. Cuando se rechaza la hipótesis nula, el análisis de varianza no revela cuál o cuáles de las medias son significativamente diferentes; en estos casos se deben utilizar otras pruebas estadísticas. Método de comparaciones m últip les: Prueba de Tukey-Kramer
Cuando el experimentador desea determinar todos los pares de medias que se puede concluir que difieren de otro ( µ i versus µ j) se utilizan las pruebas de comparaciones múltiples, como la de Tukey - Kramer. Con esta prueba, con el fin de probar todas las hipótesis nulas simultaneas H 0: µ i - µ j = 0, los estadísticos de prueba son: x i . x j . CME 1
2
1 Ji J j
donde: CME es el cuadrado medio del error del análisis de varianza J i y J j son los tamaños de muestra de los tratamientos i y j, respectivamente. Ejemplo
Los siguientes datos corresponden a las mediciones de los pesos de recubrimiento de estaño de discos por cuatro laboratorios diferentes.
149
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Laboratorio A
Laboratorio B
Laboratorio C
Laboratorio D
0,25
0,18
0,19
0,23
0,33
0,28
0,25
0,30
0,22
0,21
0,27
0,28
0,30
0,23
0,24
0,28
0,27
0,25
0,18
0,24
0,28
0,20
0,26
0,34
0,32
0,27
0,28
0,20
0,24
0,19
0,24
0,18
0,31
0,24
0,25
0,24
0,26
0,22
0,20
0,28
0,20
0,29
0,21
0,22
0,28
0,16
0,19
0,21
3,26
2,72
2,76
3,00
Determine qué medias difieren de las otras. Use un nivel de significación 0,05 . Solución
La tabla del análisis de varianza es: Source
DF
Seq SS
Adj SS
Adj MS
F
P
Laboratorio Error Total
3 44 47
0.015558 0.072833 0.088392
0.015558 0.072833
0.005186 0.001655
3.13
0.035
Desarrollando el ejemplo utilizando el Minitab se obtienen los siguientes resultados: Probability Plot of RESI2 Normal 99
Mean -8.67362E-18 S tDev 0.03937 N 48 KS 0.077 P- Va lue >0. 150
95 90 80 70
t n 60 e c 50 r e 40 P
30 20 10 5
1
-0.10
-0.05
0.00
RESI2
0.05
0.10
150
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
Test for Equal Variances for Pesos de Recubrimiento Bartlett's Test Test Statist Statistic ic P-V al alue
A
0.96 0.96 0.810
Levene's Test Test Statist Statistic ic P-V al alue o i r o t a r o b a L
0.26 0.26 0.852
B
C
D
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
95% Bonferroni Confidence Intervals for StDevs
Estos resultados pueden resumirse en un diagrama de líneas como el que se muestra a continuación. La idea es que los tratamientos unidos por una línea no presentan diferencias significativas.
Factor Lab_A Lab_D Lab_C Lab_B
N 12 12 12 12
Mean 0.2717 0.2500 0.2300 0.2267
B
C
D
A
0,227
0,230
0,250
0,272
Grouping A A B A B B
Means that do not share a letter are significantly different.
151
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
Ejemplo
Una importante compañía de construcciones desea comparar tres marcas de taladros para determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los taladros de cada marca se distribuyen normalmente. Los datos de los tiempos de vida útil (decenas de horas) para cada marca se encuentran en la siguiente tabla. Marca A
Marca B
Marca C
6
10
3
2
9
2
4
8
5
1
6
4
7
a. ¿Sugieren los datos que el tiempo promedio de vida es el mismo para cada marca de taladro antes de una reparación? Utilice nivel de significación de 5%. b. Si la prueba resulta significativa, ¿qué marca de taladro recomendaría utilizar? Solución: a. ¿Sugieren los datos que el tiempo promedio de vida es el mismo para cada marca de taladro antes de una reparación? Utilice nivel de significación de 5%. Paso 1: Formular la hipótesis de trabajo Ho: A = B = C H1: Al menos un i es diferente a los demás. Paso 2: Establecer el nivel de significación = 0,05
Paso 3: Estadístico de Prueba Fc = 7,037 Paso 4: Criterio de decisión Fc = 7,037 > Fcrit(2,10; 0,05) = 4,1 4,1 Se rechaza Ho Paso 5: Conclusión Al 5% de significación, existe evidencia estadística para afirmar que el tiempo promedio de vida es diferente para cada marca de taladro antes de una reparación.
152
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
Resultado obtenido con Minitab Paso 1: Formular la hipótesis Ho: A = B = C H1: Al menos un i es diferente a los demás. Paso 2: Establecer el nivel de significación = 0,05
Paso 3: Estadístico de Prueba Source Factor Error Total
DF 2 10 12
Adj SS 55.94 39.75 95.69
Adj MS 27.971 3.975
F-Value 7.04
P-Value 0.012
Paso 4: Criterio de decisión p = 0,012 < α = 0,05
Se
rechaza Ho
Paso 5: Conclusión Al 5% de significación, existe evidencia estadística para afirmar que el tiempo promedio de vida es diferente para cada marca de taladro antes de una reparación. a. Si la prueba resulta significativa, ¿qué marca de taladro recomendaría utilizar?
Factor Marca B Marca A Marca C
N 4 5 4
Mean 8.250 4.00 3.500
Grouping A B B
153
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Observación: Las medias que no comparten una letra son significativamente diferentes Luego, ordenando las medias en forma ascendente según las medias muestrales, y colocando una línea debajo de las medias no se ha encontrado diferencias significativas entre las marcas de taladros A y C, la marca de taladro B presenta un mayor tiempo promedio de vida antes de la reparación. Se tiene:
µC µA µB Conclusión: Se recomienda utilizar la marca de taladro B. Ejercicio
1. Un ingeniero civil residente de una obra desea evaluar el efecto que tienen las técnicas de mezclado de concreto sobre la resistencia (kg/cm 2) a la compresión. Para ello evalúa cuatro técnicas diferentes y para realizar la prueba produce especímenes de concreto. Si la resistencia a la compresión del concreto de cada técnica se distribuye normalmente y tienen la misma varianza. Los datos recabados son los siguientes:
Source Factor Error Total
DF 3 12 15
Técnica 1
Técnica 2
Técnica 3
Técnica 4
2765
3200
2800
2600
2665
3300
3150
2700
2865
2975
2885
2600
2890
3150
2850
2765
Adj SS 522475 180275 702750
Adj MS 174158 15023
F-Value 11.59
Factor Técnica Técnica Técnica Técnica
2 3 1 4
N 4 4 4 4
Mean 3156.3 2921.3 2796.3 2666.3
154
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
Grouping A A B B B
a. Al 5% de significación, ¿al menos una técnica de mezclado influye en la resistencia a la compresión del concreto? Fuente de variación
Grados de libertad
Suma de cuadrados
Cuadrado medio
Paso 1: Formular la hipótesis de trabajo Ho: A = B = C H1: Al menos un i es diferente a los demás. Paso 2: Establecer el nivel de significación = 0,05
Paso 3: Estadístico de Prueba Fc = Paso 4: Criterio de decisión Como Fc =
Fcrit (2,10; 0,05) 0,05) = 4,1
Se rechaza Ho
Paso 5: Conclusión Al 5% de significación,
b. Si la prueba resulta significativa, ¿qué técnica recomendaría utilizar?
Fc
155
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
2. Una compañía que produce ladrillos, efectuó un experimento para determinar si cuatro temperaturas (en °F) de cocción específicas afectan la densidad (gr/cm 3) de cierto tipo de ladrillo. la drillo. La densidad de los ladrillos para cada temperatura se distribuye normalmente y tienen la misma varianza. Temperaturas 100°F (1)
125°F (2)
150°F (3)
175°F (4)
19,9
21,7
20,9
21,8
19,7
21,4
20,8
21,9
19,8
21,5
20,8
21,7
19,7
21,5
20,6
21,6
20,0
21,7
Después de procesar la información, los resultados obtenidos con Minitab se muestran a continuación: Analysis of Variance Source Factor Error Total
DF Adj SS 3 10.9494 14 14 0.2150 17 11.1644
Factor 175°F (4) 125°F (2) 150°F (3) 100°F (1)
N 5 4 4 5
Adj MS 3.64981 0.01536
Mean 21.7400 21.5250 20.7750 19.8200
F-Value 237.66
Grouping A A B C
P-Value 0.000
156
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
a. Utilice nivel de significación de 5% para probar si al menos una temperatura de cocción influye en la densidad de los ladrillos. Fuente de variación
Grados de libertad
Suma de cuadrados
Cuadrado medio
Paso 1: Formular la hipótesis de trabajo Ho: A = B = C H1: Al menos un i es diferente a los demás. Paso 2: Establecer el nivel de significación = 0,05
Paso 3: Estadístico de Prueba Fc = Paso 4: Criterio de decisión Como Fc =
Fcrit (2,10; 0,05) 0,05) = 4,1
Se rechaza Ho
Paso 5: Conclusión Al 5% de significación,
b. Si la prueba resulta significativa, ¿qué temperatura recomendaría utilizar?
Fc
Estadística (Civil/Electrónica/Telecomunicaciones)
157
UPC
Ejercicios
Importación Bombardera desea determinar si el tipo de chip (A, B, C) que tienen laptops que ellos importan influye en el tiempo de respuesta (microsegundos). Si el tiempo de respuesta para cada tipo de chip se distribuye normalmente y tienen la misma varianza. Para esto, prueba 5 laptops con cada chip. A continuación se muestran los resultados en microsegundos:
Source Factor Error Total
DF Adj SS 2 342.5 12 178.8 14 521.3
Factor Tipo B Tipo A Tipo C
N 5 5 5
Mean 28.80 20.80 17.40
Tipo A
Tipo B
Tipo C
18
24
17
23
25
14
21
30
19
18
27
20
24
38
17
Adj MS 171.27 14.90
F-Value 11.49
P-Value 0.002
Grouping A B B
a. Al nivel de significancia del 5%, ¿la importadora puede concluir que hay diferencia en los tiempos promedio de respuesta según el tipo de chip utilizado? b. Si la prueba resulta significativa, ¿qué tipo de chip recomendaría utilizar? Un empresario debe elegir la alternativa más eficiente para fabricar un mismo producto. Se analiza el costo por unidad (en soles) de tres alternativas. Si el costo por unidad para cada alternativa se distribuye normalmente y tienen la misma varianza, ¿qué alternativa deberá elegirse?
158
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Alternativa A
Alternativa B
Alternativa C
9,35
8,35
9,35
8,35
8,35
10,35
7,35
7,35
9,35
8,35
7,35
8,35
9,35
8,35
9,35
7,35
7,35
9,35
Los resultados obtenidos con Minitab se presentan a continuación: Source
DF
Adj SS
Adj MS
F-Value
P-Value
Factor Error Total
2 15 17
7.000 7.500 14.500
3.5000 0.5000
7.00
0.007
Factor
N
Mean
Alternativa C Alternativa A Alternativa B
6 6 6
9.350 8.350 7.850
Grouping
A A B B
a. Pruebe si existe alguna diferencia significativa en los costos unitarios de las tres alternativas de fabricación. Utilice nivel de significación de 5%. b. Si existen diferencias, ¿entre qué grupos están las diferencias? Utilice nivel de significación de 5%.
Estadística (Civil/Electrónica/Telecomunicaciones)
159
UPC
Unidad 7 Análisis de regresión lineal simple y no lineal Logro de la unidad Al final la unidad el alumno será capaz de modelar adecuadamente la relación existente entre dos variables cuantitativas con el fin de predecir una de ellas Y (variable respuesta o dependiente) en función de otra variable X (regresora o independiente) mediante una función lineal o no lineal en el ámbito de su especialidad y utilizando el software estadístico Minitab.
7.1 Regresión lineal ¿La velocidad de transferencia de datos de un disco duro depende de la velocidad en que giran los discos del plato del disco duro o de su capacidad de almacenamiento? ¿El tiempo de ejecución de una obra civil depende del número de trabajadores o del índice de automatización? ¿El tiempo de falla de los equipos electrónicos dependerá de la resistencia de los resistores? ¿el sueldo dependerá del grado de instrucción? ¿el tiempo de procesamiento de trabajos estará relacionado con el número de trabajos por día? ¿La temperatura está relacionada con la presión sobre el rendimiento de un producto químico? Estas preguntas surgen cuando queremos estudiar dos variables de una población con el fin de examinar la relación existente entre ellas. Las dos variables en estudio son variables cuantitativas que nos permitirá construir una ecuación lineal que modela la relación existente entre estas dos variables. En el análisis de regresión la ecuación lineal puede usarse para estimar o predecir los valores de una variable dependiente, llamada Y, cuando se conocen o se suponen conocidos los valores de otra variable, variable independiente, llamada X. El análisis de correlación permite determinar el grado de relación lineal existente entre dos variables. Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa relación. ¿Qué es el análisis de regresión lineal?
Es modelar la dependencia de la variable Y en función de la variable X a través de la ecuación de una recta
Yi 0 1 X i ei Variable respuesta o Dependiente
i = 1, 2,…, n
Variable predictora o Independiente
160
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
7.1.1 Diagrama de dispersión o gr áfico del pl ot
El primer paso en el análisis de regresión es registrar simultáneamente los valores de las dos variables asociadas (X, Y) en una gráfica bidimensional para ver si existe una tendencia lineal que podría explicar la relación entre estas dos variables Variables no relacionadas
Modelo lineal Buen ajuste
Cuando X crece Y decrece
Modelo lineal Buen ajuste
Variables no relacionadas
Cuando X crece Y crece
Ejercicio
Se desea modelar la vida útil (en años) de un satélite en función de la cantidad de combustible (en kg) requerido para moverlo de su posición orbital, usando un modelo lineal. Los datos se muestran a continuación: Vida útil (años)
10,8
11,5
12
12,4
13,2
13,7
13,9
14,1
14,8
15
Cantidad de combustible (kg) 150,4
156,3
162,5
165,8
172,5
168,9
184,5
185,9
187,2
199,4
RELACION ENTRE LA VIDA UTIL Y LA CANTIDAD DE COMBUSTIBLE 15
14
li t
ú 13 a di V 12
11 150
160
170
180
Cantidad de combustible
190
200
161
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Comente el diagrama de dispersión de estas variables.
7.1.2 Método de los mínimos cuadrados
Mediante este método es posible seleccionar la recta que se ajuste mejor a los datos. La recta resultante tiene dos características importantes: La suma de las desviaciones verticales de los puntos con relación a la recta es cero; y La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una menor suma de cuadrados de tales desviaciones).
n
Es decir:
( y y ) ˆ
i
2
i
es mínima
i 1
Los valores de 0 y 1 que minimizan la suma de los cuadrados de las desviaciones, son las soluciones de las llamadas ecuaciones normales de la recta de regresión:
n y i n 0 1 xi i 1 i 1 n n n 2 xi y i 0 xi 1 xi i 1 i 1 i 1 n
ˆ
ˆ
ˆ
ˆ
Este método nos permite estimar los parámetros del modelo de regresión. Resolviendo las ecuaciones simultáneas para 0 y 1 tenemos: n n n n xi yi xi yi i 1 i 1 i 1 1 2 n 2 n n xi xi i1 i1
ˆ
y 0 y 1 x ˆ
7.1.3 Recta d e regresi ón
La ecuación lineal es: yi 0 1 xi ˆ
ˆ
ˆ
donde:
1 es la pendiente de la recta o coeficiente de regresión.
0 es la ordenada en el origen o intercepto de la recta con eje y
ˆ
ˆ
ˆ
162
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejercicio
Calcule e interprete los coeficientes de regresión estimados del ejemplo anterior, considerando la siguiente información: Cantidad de combustible
150.4
156.3
162.5
165.8
172.5
168.9
184.5
185.9
187.2
199.4
Vida útil
10.8
11.5
12
12.4
13.2
13.7
13.9
14.1
14.8
15
Haciendo uso de las fórmulas, el procedimiento implica realizar los siguientes cálculos previos: N°
X Cantidad de combustible
Y Vida útil
xy
x2
y2
1
150.4
10.8
1624,32
22620,16
116,64
2
156.3
11.5
1797,45
24429,69
132,25
3
162.5
12
1950
26406,25
144
4
165.8
12.4
2055,92
27489,64
153,76
5
172.5
13.2
2277
29756,25
174,24
6
168.9
13.7
2313,93
28527,21
187,69
7
184.5
13.9
2564,55
34040,25
193,21
8
185.9
14.1
2621,19
34558,81
198,81
9
187.2
14.8
2770,56
35043,84
219,04
10
199.4
15
2991
39760,36
225
Total
1733,4
131,4
22965,92
302632,46
1744,64
Para simplificar los cálculos, se ha realizado la corrida con el Minitab, obteniendo el siguiente reporte: The regression equation is Y = - 1.996 + 0.08732 X
1 ˆ
0 ˆ
163
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
7.1. 7. 1.4 4 Anális is de varianza
El análisis de varianza es la descomposición de la variación total en sus fuentes de variación: regresión y error (residual). Fuente de variación
Grados de libertad
Suma de cuadrados
Cuadrado medio
Estadístico de prueba
1
SCReg
CMReg (1)
Fc = (1) / (2)
Error (residual)
n – 2
SCE
(2) CME (2)
Total
n – 1
SCTot
Regresión
Donde las fórmulas a usar estarían dadas por: 2 n xi n 2 i 1 2 y SC Re g 1 . x i1 i n
2
n yi n i 1 , SCTot yi2 n i 1
Además
CM Re g
SC Re g
1
y
ˆ
CME CME
SCE n2
SCE SCTot SC Re g
.
.
Este análisis permite realizar la prueba de hipótesis para validar el modelo de regresión obtenido a un nivel de significación α.
H 0 : 1 0 H1 : 1 0
1. α (nivel de significación) =
=
Z.R.
2. Prueba estadística Fcal
CMReg CMError
3. Criterios de decisión Si Fcal > Fcrit. (α, 1, n -2)
α
Z.NR
Fcrit
entonces se rechaza Ho, por lo tanto tanto el modelo es válido válido o Si Fcal ≤ Fcrit. (α, 1, n -2) entonces no se rechaza Ho el modelo no es válido 4. Conclusión
164
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
Ejercicio
A un nivel de significación del 5%, valide el modelo de regresión lineal del ejercicio anterior. Analysis of Variance
Source Regression Error Total
DF SS 1 16.5077 8 1.5363 9 18.0440
MS 16.5077 0.1920
F 85.96
P 0.000
Complete la tabla: Fuente de variación
Grados de libertad
Suma de cuadrados
Cuadrado medio
Estadístico de prueba
Regresión Error (residual) Total
1. H 0 : H1 : 2. α = =
=
Z.R.
3. Prueba estadística Fcal
CMReg CMError
α
Z.NR
Fcrit=
4. Decisión: 5. Conclusión:
7.1.5 Coeficiente de determinación
Es una medida de bondad de ajuste del modelo. Nos indica que tan bueno es el modelo para explicar el porcentaje de variabilidad de la variable dependiente Y. El coeficiente de determinación R 2 indica el porcentaje de la variabilidad de la variable dependiente Y que es explicada por el modelo de regresión lineal. También nos ayuda a saber la precisión con la que se puede predecir o pronosticar el valor de una variable, si se conocen o suponen valores para la otra variable.
165
UPC
Estadística (Civil/Electrónica/Tele (Civil/Electrónica/Telecomunicaciones) comunicaciones)
El coeficiente de determinación R 2 se calcula de la siguiente manera: R 2
SCReg 100% SCTot
Ejercicio Calcule e interprete el coeficiente de determinación del ejercicio anterior. S = 0.438218
R-Sq = 91.5%
R-Sq(adj) = 90.4%
7.1. 7. 1.6 6 Erro Erro r estándar d e la estim ación
El error estándar de la estimación mide la variabilidad, o dispersión, de los valores de Y alrededor del plano de regresión. Actúa como la desviación estándar, es una medida promedio de la diferencia del valor observado y el valor estimado de Y. S
SCE n2
CME
Ejercicio Calcule el valor del error estándar de estimación en la salida del Minitab.
S
7.1.7 Coeficiente de correlación
El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y . Se calcula como la raíz cuadrada del coeficiente de determinación:
R 2 si 1 0 R 2 si 1 0
r
ˆ
ˆ
Si el coeficiente de correlaciónesta cerca de cero entonces indicará que no existe relación lineal significativa entre las dos variables Si el coeficiente de correlación se acerca a 1 o a -1 indicará que existe una relación lineal fuerte pudiendo ser directa o inversa. inversa.
166
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Relación lineal
No existe
Relación lineal
fuerte e
Relación
fuerte y
inversa
Lineal
directa
-1.0
-0.65
-0.2
0.2
0.65
1.0
Su valor varia dentro del intervalo de -1 y 1
Ejercicio Calcule e interprete el coeficiente de correlación del ejemplo anterior. S = 0.438218
R-Sq = 91.5%
R-Sq(adj) = 90.4%
r
Ejercicio Una empresa dedicada a la fabricación de equipos de telecomunicación considera que la vida útil de los equipos puede estar explicada por la temperatura del ambiente en el que trabaja mediante una relación lineal. Para encontrar la ecuación de regresión lineal de la vida útil en función de la temperatura se tomó una muestra de 11 datos, los cuales se muestran en la tabla siguiente: Temperatura(ºC)
24
20
18
16
10
12
13
28
16
15
23
Vida útil(en años)
8,0
6,4
5,5
4,6
3,8
3,9
5,6
8,5
6,6
4,5
8,8
T 0.93 6.35
P 0.376 0.000
Salida del Minitab Predictor Coef Constante 0.798 Temperatura 0.2944
S = 0.811758
EE Coef 0.858 0.0464
R-cuad. = 81.74%
R-cuad.(ajustado) = 79.71% Gráfica de dispersión de Vida útil vs. Temperatura
Análisis de varianza Fuente Regresión Error residual Total
GL 1 9 10
SC 26.546 5.931 32.476
9
CM
F
8 ) s
o 7 ñ a n e ( il
t 6 ú a id V
5
4 10
15
20
Temperatura
25
30
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
Responda las siguientes preguntas: a. Comente el diagrama de dispersión de estas variables.
b. Interprete los coeficientes de regresión estimados. 1 ˆ
0 ˆ
c. Valide el modelo de regresión al 1% de nivel de significación. Ho: H1:
d. Interprete el coeficiente de determinación y el coeficiente de correlación. r 2
167
168
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
r
7.1.8 Intervalos de predicción
El intervalo de confianza al 1 100% para un valor individual es: y 0 ˆ
1
x0 x 2
n
S xx
t ( n2, / 2) S 1
donde S xx
n
n xi i 1 2 x
i
x0 x 2
n
S xx
Y X y 0 t ( n 2, / 2) S 1 ˆ
ˆ
0
2
o
n
i 1
1
S xx
SC Re gr b12
Ejercicio
Para la construcción de carreteras que experimentan heladas intensas, es importante que la densidad del concreto (Kg/m2) seleccionado tenga un valor bajo de conductividad térmica para reducir al mínimo los daños provocados por cambios de temperatura. Por lo tanto, se desea modelar la conductividad térmica en función de la densidad que posee el concreto. Por lo tanto se toman 12 trozos al azar de diferentes densidades de concreto y se registra la conductividad. El registro se muestra a continuación en la siguiente tabla: Densidad del concreto Conductividad térmica (watts/metros.Kelvin)
300
400
500
600
700
800
900
1000
1100 1200 1400 1600
0.065
0.08
0.095
0.115
0.13
0.15
0.175
0.205
0.23
Diagrama de dispersión de Conductividad vs Densidad 0,45 0,40
d a d i v i t c u d n o C
0,35 0,30 0,25 0,20 0,15 0,10 0,05 200
400
600
800
1000
Densidad
1200
1400
1600
0.27 0.346 0.436
169
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Coefficients
Term Constant Densidad del concreto S = 0,0241052
Coef -0.0494 0.000275
SE Coef 0.0173 0.000018
R-Cuad = 95,87%
T-Value -2.86 15.24
P-Value 0.017 0.000
VIF 1.00
R-Cuad(ajustado) = 95,46%
Análisis de Varianza
Fuente Regresión Error residual Total
GL SC 1 10 0,00581 11 0,14085
Variable Densidad del concreto Fit 0.129486
SE Fit 0.0080576
CM
F
Setting 650
95% CI (0.111533, 0.147440)
95% PI (0.0728555, 0.186117)
a. Comente el diagrama de dispersión.
b. Presente la ecuación de la recta o modelo de regresión estimado.
c. Interprete el valor de la pendiente de la recta.
d. Interprete el coeficiente de determinación y correlación. r 2
r
170
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
e. Valide el modelo de regresión. Use un nivel de significación de 0,01
f. Pronostique con 95% de confianza la conductividad térmica cuando la densidad del concreto es de 650 Kg/m2. Interprete.
Ejercicio Se desea modelar el tiempo de operación (en horas) en función de la temperatura de un dispositivo. Para ello se realiza un experimento estadístico, cuyos resultados son los siguientes: Temperatura ( oC) Tiempo de operación
18
18
18
22
22
26
30
30
34
1200
1215
1150
1000
974
810
583
612
240
Gráfica de dispersión de Tiempo de operación vs. Temperatura (oC) 1200
1000
n ói e
ra
c 800
o
p e p
o
d 600
m ei T
400
200 20
24
28
Temperatura (oC)
32
36
171
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Análi si s d e regr esión: Tiemp o vs. Temper atura (°C) La ecuación de regresión es Tiempo = 2184 - 54.46 Temperatura(°C) Coefficients Term Constant Temperatura
Coef 2184.0 -54.46
SE Coef 75.0 3.02
T-Value 29.11 -18.06
P-Value 0.000 0.000
VIF 1.00
Analysis of Variance
Source Regression Error Total S = 51.4830
DF SS 1 864685 7 18554 8 883239
R-cuad. = 97.9%
Variable Tiempo acumulado Variable Temperatura Fit 822.532
MS 864685 2651
F 326.23
P 0.000
R-cuad(ajustado) = 97.6%
Setting 25
Setting 25
SE Fit 17.3205
95% CI (781.576, 863.488)
95% PI (694.089, 950.975)
a. Comente el diagrama de dispersión.
b. Presente la ecuación de la recta o modelo de regresión estimado.
c. Interprete el coeficiente de regresión de la variable independiente. 1 ˆ
172
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
d. Interprete el coeficiente de determinación y correlación. r 2
r
e. Valide el modelo de regresión. Use un nivel de significación del 5%.
f. Pronostique con 95% de confianza el tiempo de operación hasta el fallo cuando la temperatura es 25ºC. Interprete.
Ejercicio
NVZ Import-Export es una empresa proveedora de GPS para automóviles de diferentes modelos, últimamente ha importado nuevos modelos de GPS que ya están a la venta. El jefe del departamento de ventas ha implementado charlas motivadoras para sus agentes vendedores y desea modelar la eficiencia de sus ventas (%) en función de las horas que asisten mediante una función lineal. Por lo tanto, selecciona aleatoriamente una muestra de 10 agentes vendedores y registra el tiempo acumulado de horas en las que estuvo presente el agente vendedor en una o más charlas durante el último trimestre y la eficiencia de sus ventas. Los datos y resultados se muestran a continuación: Eficiencia en las ventas (%)
47
84
80
46
62
72
52
87
37
68
Tiempo acumulado, en horas
27
45
41
19
35
39
19
49
15
31
Coefficients Term Constant Tiempo acumulado
Coef 18.06 1.420
SE Coef 5.16 0.152
T-Value 3.50 9.32
P-Value 0.008 0.000
VIF 1.00
173
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Analysis of Variance
Source Regression Error Total
DF SS 1 2520.5 8 232.0 9 2752.5
Variable Tiempo acumulado Fit 53.56
a. b. c. d.
SE Fit 2.00918
MS 2520.5 29.0
F 86.91
P 0.000
Setting 25
95% CI (48.9268, 58.1932)
95% PI (40.3056, 66.8144)
Presente la ecuación de la recta. Interprete el coeficiente de regresión estimado. Realice el proceso de validación del modelo, con un nivel de significación de 5%. Si es deseable alcanzar una eficiencia de por lo menos 50% cuando las horas de capacitación sea de 25 horas, estime, con un nivel de confianza del 95%, la eficiencia de un agente vendedor cuando realizó 25 horas de charla y diga si es posible alcanzar la eficiencia deseada.
7.2 Regresión no lineal El modelo de regresión lineal simple resulta ser una herramienta útil en el análisis de la relación lineal existente entre una variable dependiente, Y , y otra independiente, X . Sin embargo no todas las relaciones existentes pueden considerarse lineales, de hecho existen muchas relaciones no lineales. Muchas relaciones de este tipo, a pesar de su naturaleza no lineal pueden ser linealizados aplicando alguna transformación sobre una de las variables o sobre ambas. Las transformaciones pueden ser de diferente tipo y dependerán del modelo inicial considerado para el análisis. Cuando la relación entre variables (x, y) no es lineal: o El coeficiente de determinación es bajo. o La prueba de validación del modelo resulta no significativa. Si la relación no es línea, los siguientes modelos pueden ser linealizados: Y 0 e
1 X ˆ
ˆ
Y 0 X ˆ
1 ˆ
al tomar logaritmo, se tiene ln Y ln 0 1 X ˆ
ˆ
al tomar logaritmo, se tiene ln Y ln 0 1 ln X ˆ
ˆ
El primero es el modelo exponencial y el segundo, el modelo potencia. De hecho existen modelos no lineales que no pueden ser linealizados: Y 0 e
1 x 2 x 2
174
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
La transformación de datos nos permite linealizar la relación entre dos variables, se realiza cuando se sospecha y luego se verifica que no existe dependencia lineal entre las variables en estudio. Las transformaciones que pueden mejorar el ajuste y la capacidad de predicción del modelo son muy numerosas. Aquí se presenta algunas de las trasformaciones.
Forma funcional que relaciona y con x
Transformación apropiada
Exponencial : y 0e 1 x Potencia: y 0 x 1
y *
y *
Forma de regresión lineal simple
ln y
ln y;
Regresión de y * vs. X
x* ln x
Regresión de y * vs. x *
Ejemplo
El gerente de una empresa dedicada a la producción de brocas de acero para cerámicas o mayólicas, sospecha que la deformación del acero a temperatura normal mantiene una relación inversa con la dureza del mismo ya que, a medida que la deformación crece, se ve afectada la dureza del acero. Él desea modelar la dureza en función de la deformación. Para ello se realizan 10 pruebas encontrando los siguientes resultados: Deformación (mm)
6
7
11
13
20
26
28
33
35
30
Dureza (kg/mm2)
65
67
65
53
41
40
37
34
32
42
a. Comente el diagrama de dispersión.
175
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Dispersión de la dureza en función de la deformación 80 ) 2 70 m m60 / g 50 K ( a 40 z e r 30 u D 20
y = -1.191x + 72.493 R² = 0.9103 y = 76.902e-0.025x R² = 0.9247 y = 149.29x-0.41 R² = 0.9118
10 0 0
10
20
30
40
Deformación (mm)
Y= X= b. Obtener la ecuación del modelo de regresión no lineal indicado. Según el enunciado, analizaremos la regresión lineal entre X y ln(Y) N°
Y: Dureza (kg/mm2)
ln(Y)
X: Deformación (mm)
X*ln(Y)
X^2
1
65
4,1744
6
25,0463
36
2
67
4,2047
7
29,4328
49
3
65
4,1744
11
45,9183
121
4
53
3,9703
13
51,6138
169
5
41
3,7136
20
74,2714
400
6
40
3,6889
26
95,9109
676
7
37
3,6109
28
101,1057
784
8
34
3,5264
33
116,3699
1089
9
32
3,4657
35
121,3008
1225
10
42
3,7377
30
112,1301
900
38,2669
209,00
773,1000
5449
Total
Al reemplazar estos resultados en las fórmulas para determinar la pendiente y la ordenada en el origen, tenemos:
n n n n xi ln yi xi ln yi i 1 i 1 i1 10773,1 209 38,2669 0,02468 y 1 2 2 105449 209 n 2 n n xi xi i 1 i 1 ˆ
ln 0 ln Y ln 1 X ˆ
ˆ
176
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
38,2669 209 0,02468 4,3425 10 10
Así, como ln 0 4,3425 0 e 4, 3425 7 6,8995 ˆ
ˆ
Entonces, la ecuación del modelo potencia estimado está dado por Y 7 6,8995 e 0, 0247 X .
Modelo Exponencial
La ecuación de regresión es lny = 4.3425 - 0.02468Deformación Análisis de Varianza Fuente Regresión Error Total
GL 1 8 9
SC Ajust. 0.65845 0.05360 0.71205
MC Ajust. 0.658453 0.006700
Valor F 98.28
Valor p 0.000
Resumen del modelo
S 0.0818508
R-cuad. 92.47%
R-cuad. (ajustado) 91.53%
R-cuad. (pred) 89.36%
Coeficientes
Término Constante Deformación
Coef 4.3425 -0.02468
EE del coef. 0.0581 0.00249
Valor T 74.72 -9.91
Valor p 0.000 0.000
c. Asumiendo que el modelo obtenido en el ítem anterior es válido, estime la dureza cuando la transformación es de 15 mm.
177
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Ejemplo
Se desea analizar la pureza del oxígeno producido en un proceso de destilación química, en base al porcentaje de hidrocarburos que están presentes en el condensador principal de la unidad de destilación. Se tomó una muestra aleatoria de diez observaciones para ambas variables, cuyos resultados se procesaron en Minitab, obteniendo las siguientes salidas: Regresión Lineal Simple: Análisis de regresión: Purezas vs. Porcentaje_hidrocarburo
La ecuación de regresión es Purezas = 74.7 + 15.4 Porcentaje_hidrocarburo
Predictor Constante Porcentaje_hidrocarburo S = 0.432434
Coef 74.6732 15.4301
R-cuad. = 88.6%
SE Coef T 0.8126 91.89 0.6502 23.73
P 0.000 0.000
R-cuad.(ajustado) = 88.4%
Análisis de varianza
Fuente Regresión Error residual Total
GL 1 8 9
SC 105.32 1.50 106.82
CM 105.32 0.19
F 563.21
P 0.000
Modelo Exponencial Análisis de regresión: LnY vs. Nivel_hidrocarburo
La ecuación de regresión es LnY = 4.34 + 0.166 Nivel_hidrocarburo Análisis de varianza Fuente
GL
SC
CM
F
P
Regresión Error residual Total
1 8 9
0.012149 0.000204 0.012353
0.012149 0.000026
476.24
0.000
S = 0.00505068
R-cuad. = 98.3%
Predictor Constante Nivel_hidrocarburo
Coef 4.33513 0.165720
R-cuad.(ajustado) = 98.1%
SE Coef 0.00949 0.007594
T 456.76 21.82
P 0.000 0.000
178
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Modelo potencia Análisis de regresión: LnY vs. LnX
La ecuación de regresión es LnY = 4.34 + 0.166 LnX Análisis de varianza Fuente
GL
SC
CM
F
P
Regresión Error residual Total
1 8 9
0.012149 0.000204 0.012353
0.012149 0.000026
476.24
0.000
S = 0.00505068
R-cuad. = 99.3%
Predictor Constante LnX
Coef 4.33513 0.165720
SE Coef 0.00949 0.007594
R-cuad.(ajustado) = 99.1%
T 456.76 21.82
P 0.000 0.000
a. Determine y valide el modelo de regresión más adecuado (entre el lineal, exponencial y potencia). Utilice 5% de nivel de significación. Paso 1: Modelo
Paso 2: Validación del modelo
R2
Prioridad
179
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
b. Usando el modelo el modelo obtenido en el ítem anterior, estime la pureza del oxígeno producido, cuando el porcentaje de hidrocarburos presentes en el condensador principal de la unidad de destilación es de 1,36%.
Ejemplo
En EE.UU. el costo del servicio para realizar llamadas telefónicas empleando la red satelital está en función a los minutos empleados. En cierto día se puso a prueba un plan llamado Beyond Zero, en la cual a mayor tiempo empleado en la llamada menor el costo por minuto. Se desea modelar el costo en función del tiempo con un modelo de regresión no lineal. Los datos se muestran a continuación así como las salidas del Minitab: Costo($)
2,5
2,2
1,05
0,81
0,56
0,45
0,5
2,65
0,75
Tiempo (min)
0,95
1,15
1,4
1,4
2,1
1,68
1,97
0,99
1,55
Regresión Lineal Simple: Fuente Regresión Error Total
GL 1 7 8
SC Ajust. 5.15119 1.43064 6.58182
MC Ajust. 5.15119 0.20438
Valor F 25.20
Valor p 0.002
Resumen del modelo S 0.452080
R-cuad. (ajustado) 75.16%
R-cuad. 78.26%
Coeficientes Término Coef Constante 4.180 Tiempo -1.983
R-cuad. (pred) 61.10%
EE del coef. Valor T 0.598 6.99 0.395 -5.02
Valor p 0.000 0.002
Ecuación de regresión Costo($) = 4.180 - 1.983 Tiempo(min)
Modelo Exponencial Análisis de regresión: lny Fuente Regresión Error Total
GL 1 7 8
vs. Tiempo
SC Ajust. 3.32458 0.66746 3.99204
MC Ajust. 3.32458 0.09535
Valor F 34.87
Valor p 0.001
180
UPC
Estadística (Civil/Electrónica/Telecomunicaciones)
Resumen del modelo S 0.308791
R-cuad. 83.28%
R-cuad. (ajustado) 80.89%
R-cuad. (pred) 69.54%
Coeficientes EE del Término Coef coef. Constante 2.352 0.409 Tiempo -1.593 0.270 Ecuación de regresión Lny
Valor T 5.76 -5.90
Valor p 0.001 0.001
VIF 1.00
= 2.352 - 1.593 Tiempo
Modelo potencia Análisis de regresión: lny Fuente Regresión Error Total
GL 1 7 8
vs. lnx
SC Ajust. 3.54008 0.45196 3.99204
MC Ajust. 3.54008 0.06457
Valor F 54.83
Valor p 0.000
Resumen del modelo S 0.254097
R-cuad. 88.68%
R-cuad. (ajustado) 87.06%
R-cuad. (pred) 80.97%
Coeficientes Término Constante lnx
Coef 0.840 -2.365
EE del coef. 0.140 0.319
Valor T 6.01 -7.40
Valor p 0.001 0.000
VIF 1.00
Ecuación de regresión lnny = 0.840 - 2.365 lnx
a. Determine y valide el modelo de regresión más adecuado (entre el lineal, exponencial y potencia). Use 5% de nivel de significación. Paso 1: Modelo
Paso 2: Validación del modelo
R2
Prioridad
Estadística (Civil/Electrónica/Telecomunicaciones)
UPC
181
b. Usando el modelo el modelo obtenido en el ítem anterior, estime el costo del servicio, cuando el tiempo empleado es de 2 minutos.
FÓRMULAS ESTADÍSTICAS
DISTRIBUCIONES IMPORTANTES Binomial
X ~ B( n, p)
P(X x) C nx p x (1 p) n x
Poisson
X ~ P ( )
P(X x )
e . x x!
x 0 , 1 , 2 , ... C x C n x r
f ( x) P X
Hipergeométrica X ~ H ( N , n, r )
Uniforme
Exponencial
1
x
X ~ U (a, b)
f x
X ~ Exp( )
1 1 x e f ( x) β 0
ba
a
x 0 , 1 ,... , n
V(X) np(1 p)
E(X )
V (X )
N r
x max[0, n ( N r)],...,min( r, n)
N n
C
x b
F(x) = P(X ≤x) =
E(X) np
E X n
E X
r N
ab
2
Intervalos de Confianza
otro caso
−/
E X
, x ≥ 0
Estadístico de Prueba
Varianza desconocida
_
IC ( ) x t ( n 1, / 2)
_
s n
V X
r
r N n
N
N N 1
1
b a 2 12
x 0
ESTIMACIÓN POR INTERVALO Y PRUEBA DE HIPOTESIS Parámetro
V X n
t
x
S/ n
~ t (n 1)
V X 2
Universidad Peruana de Ciencias Aplicadas
IC ( p) p Z (1 / 2)
p
ˆ
ˆ
LIC( 2 )
2
Z
p(1 p) ˆ
n
(n 1)S 2
ˆ
p(1 p) n
LSC( 2 )
(2n 1, / 2)
p p
2
(n 1)S 2
2( n 1, 1- / 2)
(n 1)S2 2
~ X (2n 1)
Varianzas poblacionales desconocidas pero iguales 1 2
_
t
_
( x 1 x 2 ) ( 1 2 )
1
S p2
n 1
1 n 2
2 ~ t ( n1 n 2 2) donde S p
(n1 1) S 12 ( n2 1) S 22 n1 n2 2
Varianzas poblacionales desconocidas y diferentes 2
t
(x1 x 2 ) (1 2 ) S12 S22 n1 n 2
~ t (v)
donde
S12 S22 n n 2 v 12 2 S12 S22 n1 n 2 n1 1 n 2 1
2
2
1
2
/ 2
F
S 1
2
S 2
~ F n1 1, n2 1
Estadística (Civil/Electrónica/Telecomunicaciones)
183
Universidad Peruana de Ciencias Aplicadas
ANÁLISIS DE REGRESIÓN Coeficiente de determinación r 2
SSR SST
Modelos no lineales: Potencia: y 0 x 1 ˆ
ˆ
ˆ
Pronósticos: Valor y 0 t ( n 2 , / 2 )s 1 ˆ
o Lny Ln 0 1 Lnx ˆ
ˆ
individual
1 (x 0 x )2 n Sxx
Exponencial: y 0 e 1 x ˆ
ˆ
ˆ
o Lny Ln 0 1 x ˆ
ˆ
donde: S xx
s
xi2
x 2 i
n
SS Re g
1
2
ˆ
CME
Estadística (Civil/Electrónica/Telecomunicaciones)
184
Tabla N° 2.1 TABLA DE LA DISTRIBUCION NORMAL
Área bajo la curva normal: P Z z Z -3.9 -3.8 -3.7 -3.6 -3.5 -3.4 -3.3 -3.2 -3.1 -3.0
-0.09 0.000033 0.000050 0.000075 0.000112 0.000165 0.000242 0.000349 0.000501 0.000711 0.001001
-0.08 0.000034 0.000052 0.000078 0.000117 0.000172 0.000251 0.000362 0.000519 0.000736 0.001035
-0.07 0.000036 0.000054 0.000082 0.000121 0.000178 0.000260 0.000376 0.000538 0.000762 0.001070
-0.06 0.000037 0.000057 0.000085 0.000126 0.000185 0.000270 0.000390 0.000557 0.000789 0.001107
-0.05 0.000039 0.000059 0.000088 0.000131 0.000193 0.000280 0.000404 0.000577 0.000816 0.001144
-0.04 0.000041 0.000062 0.000092 0.000136 0.000200 0.000291 0.000419 0.000598 0.000845 0.001183
-0.03 0.000042 0.000064 0.000096 0.000142 0.000208 0.000302 0.000434 0.000619 0.000874 0.001223
-0.02 0.000044 0.000067 0.000100 0.000147 0.000216 0.000313 0.000450 0.000641 0.000904 0.001264
-0.01 0.000046 0.000069 0.000104 0.000153 0.000224 0.000325 0.000466 0.000664 0.000935 0.001306
-0.00 0.000048 0.000072 0.000108 0.000159 0.000233 0.000337 0.000483 0.000687 0.000968 0.001350
-2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0
0.00139 0.00193 0.00264 0.00357 0.00480 0.00639 0.00842 0.01101 0.01426 0.01831
0.00144 0.00199 0.00272 0.00368 0.00494 0.00657 0.00866 0.01130 0.01463 0.01876
0.00149 0.00205 0.00280 0.00379 0.00508 0.00676 0.00889 0.01160 0.01500 0.01923
0.00154 0.00212 0.00289 0.00391 0.00523 0.00695 0.00914 0.01191 0.01539 0.01970
0.00159 0.00219 0.00298 0.00402 0.00539 0.00714 0.00939 0.01222 0.01578 0.02018
0.00164 0.00226 0.00307 0.00415 0.00554 0.00734 0.00964 0.01255 0.01618 0.02068
0.00169 0.00233 0.00317 0.00427 0.00570 0.00755 0.00990 0.01287 0.01659 0.02118
0.00175 0.00240 0.00326 0.00440 0.00587 0.00776 0.01017 0.01321 0.01700 0.02169
0.00181 0.00248 0.00336 0.00453 0.00604 0.00798 0.01044 0.01355 0.01743 0.02222
0.00187 0.00256 0.00347 0.00466 0.00621 0.00820 0.01072 0.01390 0.01786 0.02275
-1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0
0.02330 0.02938 0.03673 0.04551 0.05592 0.06811 0.08226 0.09853 0.11702 0.13786
0.02385 0.03005 0.03754 0.04648 0.05705 0.06944 0.08379 0.10027 0.11900 0.14007
0.02442 0.03074 0.03836 0.04746 0.05821 0.07078 0.08534 0.10204 0.12100 0.14231
0.02500 0.03144 0.03920 0.04846 0.05938 0.07215 0.08691 0.10383 0.12302 0.14457
0.02559 0.03216 0.04006 0.04947 0.06057 0.07353 0.08851 0.10565 0.12507 0.14686
0.02619 0.03288 0.04093 0.05050 0.06178 0.07493 0.09012 0.10749 0.12714 0.14917
0.02680 0.03362 0.04182 0.05155 0.06301 0.07636 0.09176 0.10935 0.12924 0.15151
0.02743 0.03438 0.04272 0.05262 0.06426 0.07780 0.09342 0.11123 0.13136 0.15386
0.02807 0.03515 0.04363 0.05370 0.06552 0.07927 0.09510 0.11314 0.13350 0.15625
0.02872 0.03593 0.04457 0.05480 0.06681 0.08076 0.09680 0.11507 0.13567 0.15866
-0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 -0.0
0.16109 0.18673 0.21476 0.24510 0.27760 0.31207 0.34827 0.38591 0.42465 0.46414
0.16354 0.18943 0.21770 0.24825 0.28096 0.31561 0.35197 0.38974 0.42858 0.46812
0.16602 0.19215 0.22065 0.25143 0.28434 0.31918 0.35569 0.39358 0.43251 0.47210
0.16853 0.19489 0.22363 0.25463 0.28774 0.32276 0.35942 0.39743 0.43644 0.47608
0.17106 0.19766 0.22663 0.25785 0.29116 0.32636 0.36317 0.40129 0.44038 0.48006
0.17361 0.20045 0.22965 0.26109 0.29460 0.32997 0.36693 0.40517 0.44433 0.48405
0.17619 0.20327 0.23270 0.26435 0.29806 0.33360 0.37070 0.40905 0.44828 0.48803
0.17879 0.20611 0.23576 0.26763 0.30153 0.33724 0.37448 0.41294 0.45224 0.49202
0.18141 0.20897 0.23885 0.27093 0.30503 0.34090 0.37828 0.41683 0.45620 0.49601
0.18406 0.21186 0.24196 0.27425 0.30854 0.34458 0.38209 0.42074 0.46017 0.50000
Universidad Peruana de Ciencias Aplicadas
Tabla N° 2.2 TABLA DE LA DISTRIBUCION NORMAL
Área bajo la curva normal: P Z z Z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.00 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594
0.01 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859
0.02 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121
0.03 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381
0.04 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639
0.05 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894
0.06 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80511 0.83147
0.07 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83398
0.08 0.53188 0.57142 0.61026 0.64803 0.68439 0.71904 0.75175 0.78230 0.81057 0.83646
0.09 0.53586 0.57535 0.61409 0.65173 0.68793 0.72240 0.75490 0.78524 0.81327 0.83891
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9
0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128
0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193
0.84614 0.86864 0.88877 0.90658 0.92220 0.93574 0.94738 0.95728 0.96562 0.97257
0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96638 0.97320
0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.94950 0.95907 0.96712 0.97381
0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441
0.85543 0.87698 0.89617 0.91309 0.92785 0.94062 0.95154 0.96080 0.96856 0.97500
0.85769 0.87900 0.89796 0.91466 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558
0.85993 0.88100 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615
0.86214 0.88298 0.90147 0.91774 0.93189 0.94408 0.95449 0.96327 0.97062 0.97670
2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9
0.97725 0.98214 0.98610 0.98928 0.99180 0.99379 0.99534 0.99653 0.99744 0.99813
0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819
0.97831 0.98300 0.98679 0.98983 0.99224 0.99413 0.99560 0.99674 0.99760 0.99825
0.97882 0.98341 0.98713 0.99010 0.99245 0.99430 0.99573 0.99683 0.99767 0.99831
0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836
0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841
0.98030 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846
0.98077 0.98500 0.98840 0.99111 0.99324 0.99492 0.99621 0.99720 0.99795 0.99851
0.98124 0.98537 0.98870 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856
0.98169 0.98574 0.98899 0.99158 0.99361 0.99520 0.99643 0.99736 0.99807 0.99861
3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9
0.99865 0.99903 0.99931 0.99952 0.99966 0.99977 0.99984 0.99989 0.99993 0.99995
0.99869 0.99907 0.99934 0.99953 0.99968 0.99978 0.99985 0.99990 0.99993 0.99995
0.99874 0.99910 0.99936 0.99955 0.99969 0.99978 0.99985 0.99990 0.99993 0.99996
0.99878 0.99913 0.99938 0.99957 0.99970 0.99979 0.99986 0.99990 0.99994 0.99996
0.99882 0.99916 0.99940 0.99958 0.99971 0.99980 0.99986 0.99991 0.99994 0.99996
0.99886 0.99918 0.99942 0.99960 0.99972 0.99981 0.99987 0.99991 0.99994 0.99996
0.99889 0.99921 0.99944 0.99961 0.99973 0.99982 0.99987 0.99992 0.99994 0.99996
0.99893 0.99924 0.99946 0.99962 0.99974 0.99982 0.99988 0.99992 0.99995 0.99996
0.99897 0.99926 0.99948 0.99964 0.99975 0.99983 0.99988 0.99992 0.99995 0.99997
0.99900 0.99929 0.99950 0.99965 0.99976 0.99984 0.99989 0.99993 0.99995 0.99997
Estadística (Civil/Electrónica/Telecomunicaciones)
186
Universidad Peruana de Ciencias Aplicadas
Tabla Nº 3.1 TABLA DE LA DISTRIBUCION T-STUDENT
Área bajo la curva: P T c
1 2 3 4 5 6 7 8 9 10
0.4 0.32492 0.28868 0.27667 0.27072 0.26718 0.26483 0.26317 0.26192 0.26096 0.26018
0.3 0.72654 0.61721 0.58439 0.56865 0.55943 0.55338 0.54911 0.54593 0.54348 0.54153
0.2 1.37638 1.06066 0.97847 0.94096 0.91954 0.9057 0.89603 0.88889 0.8834 0.87906
0.15 1.96261 1.38621 1.24978 1.18957 1.15577 1.13416 1.11916 1.10815 1.09972 1.09306
0.1 3.07768 1.88562 1.63774 1.53321 1.47588 1.43976 1.41492 1.39682 1.38303 1.37218
11 12 13 14 15 16 17 18 19 20
0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 0.2576 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.024 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.015 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371
2.20099 2.17881 2.16037 2.14479 2.13145 2.11991 2.10982 2.10092 2.09302 2.08596
2.32814 2.30272 2.2816 2.26378 2.24854 2.23536 2.22385 2.2137 2.2047 2.19666
2.49066 2.4607 2.43585 2.4149 2.39701 2.38155 2.36805 2.35618 2.34565 2.33624
2.71808 2.681 2.65031 2.62449 2.60248 2.58349 2.56693 2.55238 2.53948 2.52798
3.10581 3.05454 3.01228 2.97684 2.94671 2.92078 2.89823 2.87844 2.86093 2.84534
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
0.25658 0.25643 0.2563 0.25617 0.25606 0.25595 0.25586 0.25577 0.25568 0.25561
0.53246 0.53208 0.53175 0.53144 0.53115 0.53089 0.53065 0.53042 0.53021 0.53002
0.85907 0.85827 0.85753 0.85686 0.85624 0.85567 0.85514 0.85465 0.85419 0.85377
1.06267 1.06145 1.06034 1.05932 1.05838 1.05752 1.05673 1.05599 1.0553 1.05466
1.32319 1.32124 1.31946 1.31784 1.31635 1.31497 1.3137 1.31253 1.31143 1.31042
1.72074 1.71714 1.71387 1.71088 1.70814 1.70562 1.70329 1.70113 1.69913 1.69726
1.83965 1.83542 1.83157 1.82805 1.82483 1.82186 1.81913 1.81659 1.81424 1.81205
1.98804 1.98291 1.97825 1.97399 1.9701 1.96651 1.9632 1.96014 1.95729 1.95465
2.07961 2.07387 2.06866 2.0639 2.05954 2.05553 2.05183 2.04841 2.04523 2.04227
2.18943 2.18289 2.17696 2.17154 2.16659 2.16203 2.15782 2.15393 2.15033 2.14697
2.32779 2.32016 2.31323 2.30691 2.30113 2.29581 2.29091 2.28638 2.28217 2.27826
2.51765 2.50832 2.49987 2.49216 2.48511 2.47863 2.47266 2.46714 2.46202 2.45726
2.83136 2.81876 2.80734 2.79694 2.78744 2.77871 2.77068 2.76326 2.75639 2.75000
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
0.25553 0.25546 0.2554 0.25534 0.25528 0.25523 0.25518 0.25513 0.25508 0.25504
0.52984 0.52967 0.5295 0.52935 0.52921 0.52908 0.52895 0.52883 0.52871 0.52861
0.85337 0.853 0.85265 0.85232 0.85201 0.85172 0.85144 0.85118 0.85094 0.8507
1.05406 1.0535 1.05298 1.05248 1.05202 1.05158 1.05117 1.05077 1.0504 1.05005
1.30946 1.30857 1.30774 1.30695 1.30621 1.30551 1.30485 1.30423 1.30364 1.30308
1.69552 1.69389 1.69236 1.69092 1.68957 1.6883 1.68709 1.68595 1.68488 1.68385
1.81 1.80809 1.80629 1.80461 1.80302 1.80153 1.80012 1.79878 1.79751 1.79631
1.95218 1.94987 1.9477 1.94567 1.94375 1.94195 1.94024 1.93863 1.93711 1.93566
2.03951 2.03693 2.03452 2.03224 2.03011 2.02809 2.02619 2.02439 2.02269 2.02108
2.14383 2.1409 2.13816 2.13558 2.13316 2.13087 2.12871 2.12667 2.12474 2.12291
2.27461 2.2712 2.26801 2.26501 2.26219 2.25953 2.25702 2.25465 2.2524 2.25027
2.45282 2.44868 2.44479 2.44115 2.43772 2.43449 2.43145 2.42857 2.42584 2.42326
2.74404 2.73848 2.73328 2.72839 2.72381 2.71948 2.71541 2.71156 2.70791 2.70446
31 32 33 34 35 36 37 38 39 40
Estadística (Civil/Electrónica/Telecomunicaciones)
0.05 6.31375 2.91999 2.35336 2.13185 2.01505 1.94318 1.89458 1.85955 1.83311 1.81246
0.04 7.91582 3.31976 2.60543 2.33287 2.19096 2.10431 2.04601 2.00415 1.97265 1.9481
0.03 10.57889 3.89643 2.95051 2.60076 2.42158 2.31326 2.24088 2.18915 2.15038 2.12023
0.025 0.02 12.7062 15.89454 4.30265 4.84873 3.18245 3.48191 2.77645 2.99853 2.57058 2.75651 2.44691 2.61224 2.36462 2.51675 2.306 2.44898 2.26216 2.39844 2.22814 2.35931
0.015 21.20495 5.64278 3.89605 3.29763 3.00287 2.82893 2.71457 2.63381 2.5738 2.52748
0.01 0.005 31.82052 63.65674 1 6.96456 9.92484 2 4.5407 5.84091 3 3.74695 4.60409 4 3.36493 4.03214 5 3.14267 3.70743 6 2.99795 3.49948 7 2.89646 3.35539 8 2.82144 3.24984 9 2.76377 3.16927 10
187
Universidad Peruana de Ciencias Aplicadas
Tabla Nº 3.2 TABLA DE LA DISTRIBUCION T-STUDENT
Área bajo la curva: P T c v 41 42 43 44 45 46 47 48 49 50
0.4 0.255 0.25496 0.25492 0.25488 0.25485 0.25482 0.25479 0.25476 0.25473 0.2547
0.3 0.2 0.5285 0.85048 0.5284 0.85026 0.52831 0.85006 0.52822 0.84987 0.52814 0.84968 0.52805 0.84951 0.52798 0.84934 0.5279 0.84917 0.52783 0.84902 0.52776 0.84887
0.15 1.04971 1.04939 1.04908 1.04879 1.04852 1.04825 1.048 1.04775 1.04752 1.04729
0.1 0.05 1.30254 1.68288 1.30204 1.68195 1.30155 1.68107 1.30109 1.68023 1.30065 1.67943 1.30023 1.67866 1.29982 1.67793 1.29944 1.67722 1.29907 1.67655 1.29871 1.67591
α 0.04 1.79517 1.79409 1.79305 1.79207 1.79113 1.79023 1.78937 1.78855 1.78776 1.787
51 52 53 54 55 56 57 58 59 60
0.25467 0.25465 0.25462 0.2546 0.25458 0.25455 0.25453 0.25451 0.25449 0.25447
0.52769 0.52763 0.52757 0.52751 0.52745 0.5274 0.52735 0.5273 0.52725 0.5272
0.84873 0.84859 0.84846 0.84833 0.84821 0.84809 0.84797 0.84786 0.84776 0.84765
1.04708 1.04687 1.04667 1.04648 1.0463 1.04612 1.04595 1.04578 1.04562 1.04547
1.29837 1.29805 1.29773 1.29743 1.29713 1.29685 1.29658 1.29632 1.29607 1.29582
1.67528 1.67469 1.67412 1.67356 1.67303 1.67252 1.67203 1.67155 1.67109 1.67065
1.78627 1.78558 1.78491 1.78426 1.78364 1.78304 1.78246 1.7819 1.78137 1.78085
1.92356 1.92272 1.92191 1.92114 1.92039 1.91967 1.91897 1.9183 1.91765 1.91703
2.00758 2.00665 2.00575 2.00488 2.00404 2.00324 2.00247 2.00172 2.001 2.0003
2.10762 2.10655 2.10553 2.10455 2.10361 2.1027 2.10182 2.10097 2.10015 2.09936
2.2325 2.23127 2.23009 2.22895 2.22785 2.22679 2.22577 2.22479 2.22384 2.22292
2.40172 2.40022 2.39879 2.39741 2.39608 2.3948 2.39357 2.39238 2.39123 2.39012
2.67572 2.67373 2.67182 2.66998 2.66822 2.66651 2.66487 2.66329 2.66176 2.66028
61 62 63 64 65 66 67 68 69 70
0.25445 0.25444 0.25442 0.2544 0.25439 0.25437 0.25436 0.25434 0.25433 0.25431
0.52715 0.52711 0.52706 0.52702 0.52698 0.52694 0.5269 0.52687 0.52683 0.5268
0.84755 0.84746 0.84736 0.84727 0.84719 0.8471 0.84702 0.84694 0.84686 0.84679
1.04532 1.04518 1.04504 1.0449 1.04477 1.04464 1.04452 1.0444 1.04428 1.04417
1.29558 1.29536 1.29513 1.29492 1.29471 1.29451 1.29432 1.29413 1.29394 1.29376
1.67022 1.6698 1.6694 1.66901 1.66864 1.66827 1.66792 1.66757 1.66724 1.66691
1.78034 1.77986 1.77939 1.77893 1.77849 1.77806 1.77765 1.77724 1.77685 1.77647
1.91642 1.91584 1.91527 1.91472 1.91419 1.91368 1.91318 1.91269 1.91222 1.91177
1.99962 1.99897 1.99834 1.99773 1.99714 1.99656 1.99601 1.99547 1.99495 1.99444
2.0986 2.09786 2.09715 2.09645 2.09578 2.09514 2.09451 2.0939 2.0933 2.09273
2.22204 2.22118 2.22035 2 .21955 2.21877 2.21802 2 .21729 2.21658 2.21589 2.21523
2.38905 2.38801 2.38701 2.38604 2.3851 2.38419 2.3833 2.38245 2.38161 2.38081
2.65886 2.65748 2.65615 2.65485 2.65360 2.65239 2.65122 2.65008 2.64898 2.64790
75 0.25425 80 0.25419 85 0.25414 90 0.2541 95 0.25406 100 0.25402 105 0.25399 110 0.25396 120 0.25391 ∞ 0.25335
0.52664 0.5265 0.52637 0.52626 0.52616 0.52608 0.526 0.52592 0.5258 0.5244
0.84644 0.84614 0.84587 0.84563 0.84542 0.84523 0.84506 0.8449 0.84463 0.84162
1.04365 1.0432 1.0428 1.04244 1.04212 1.04184 1.04158 1.04134 1.04093 1.03643
1.29294 1.29222 1.29159 1.29103 1.29053 1.29007 1.28967 1.2893 1.28865 1.28156
1.66543 1.66412 1.66298 1.66196 1.66105 1.66023 1.6595 1.65882 1.65765 1.64484
1.77473 1.77321 1.77187 1.77068 1.76961 1.76866 1.76779 1.76701 1.76564 1.75069
1.90967 1.90784 1.90623 1.9048 1.90352 1.90237 1.90133 1.90039 1.89874 1.88079
1.9921 1.99006 1.98827 1.98667 1.98525 1.98397 1.98282 1.98177 1.97993 1.95997
2.09008 2.08778 2.08574 2.08394 2.08233 2.08088 2.07958 2.07839 2.07631 2.05375
2.21216 2 .20949 2.20713 2.20504 2.20317 2.2015 2.19998 2.19861 2.1962 2.17009
2.3771 2.37387 2.37102 2.3685 2.36624 2.36422 2.36239 2.36073 2.35782 2.32635
2.64298 2.63869 2.63491 2.63157 2.62858 2.62589 2.62347 2.62126 2.61742 2.57583
Estadística (Civil/Electrónica/Telecomunicaciones)
0.03 1.93428 1.93298 1.93173 1.93054 1.92941 1.92833 1.92729 1.9263 1.92535 1.92444
0.025 2.01954 2.01808 2.01669 2.01537 2.0141 2.0129 2.01174 2.01063 2.00958 2.00856
0.02 2.12117 2.11952 2.11794 2.11644 2.115 2.11364 2.11233 2.11107 2.10987 2.10872
0.015 2.24825 2.24633 2.24449 2.24275 2.24108 2.23949 2 .23797 2.23652 2.23512 2.23379
0.01 2.4208 2.41847 2.41625 2.41413 2.41212 2.41019 2.40835 2.40658 2.40489 2.40327
0.005 2.70118 2.69807 2.69510 2.69228 2.68959 2.68701 2.68456 2.68220 2.67995 2.67779
188
Universidad Peruana de Ciencias Aplicadas
Tabla N°4.1
TABLA DE LA DISTRIBUCIÓN JI-CUADRADO
Áreas bajo la curva: P( 2 c) v
1 2 3 4 5
0.995 0.000 0.010 0.072 0.207 0.412
0.990 0.000 0.020 0.115 0.297 0.554
0.980 0.001 0.040 0.185 0.429 0.752
0.975 0.001 0.051 0.216 0.484 0.831
0.960 0.003 0.082 0.300 0.627 1.031
0.950 0.004 0.103 0.352 0.711 1.145
0.900 0.016 0.211 0.584 1.064 1.610
0.800 0.064 0.446 1.005 1.649 2.343
0.700 0.148 0.713 1.424 2.195 3.000
0.600 0.275 1.022 1.869 2.753 3.656
0.500 0.455 1.386 2.366 3.357 4.351
6 7 8 9 10
0.676 0.989 1.344 1.735 2.156
0.872 1.239 1.647 2.088 2.558
1.134 1.564 2.032 2.532 3.059
1.237 1.690 2.180 2.700 3.247
1.492 1.997 2.537 3.105 3.697
1.635 2.167 2.733 3.325 3.940
2.204 2.833 3.490 4.168 4.865
3.070 3.822 4.594 5.380 6.179
3.828 4.671 5.527 6.393 7.267
4.570 5.493 6.423 7.357 8.295
5.348 6.346 7.344 8.343 9.342
11 12 13 14 15
2.603 3.074 3.565 4.075 4.601
3.053 3.571 4.107 4.660 5.229
3.609 4.178 4.765 5.368 5.985
3.816 4.404 5.009 5.629 6.262
4.309 4.939 5.584 6.243 6.914
4.575 5.226 5.892 6.571 7.261
5.578 6.304 7.041 7.790 8.547
6.989 7.807 8.634 9.467 10.307
8.148 9.034 9.926 10.821 11.721
9.237 10.182 11.129 12.078 13.030
10.341 11.340 12.340 13.339 14.339
16 17 18 19 20
5.142 5.697 6.265 6.844 7.434
5.812 6.408 7.015 7.633 8.260
6.614 7.255 7.906 8.567 9.237
6.908 7.564 8.231 8.907 9.591
7.596 8.288 8.989 9.698 10.415
7.962 8.672 9.390 10.117 10.851
9.312 10.085 10.865 11.651 12.443
11.152 12.002 12.857 13.716 14.578
12.624 13.531 14.440 15.352 16.266
13.983 14.937 15.893 16.850 17.809
15.338 16.338 17.338 18.338 19.337
21 22 23 24 25
8.034 8.643 9.260 9.886 10.520
8.897 9.542 10.196 10.856 11.524
9.915 10.600 11.293 11.992 12.697
10.283 10.982 11.689 12.401 13.120
11.140 11.870 12.607 13.350 14.098
11.591 12.338 13.091 13.848 14.611
13.240 14.041 14.848 15.659 16.473
15.445 16.314 17.187 18.062 18.940
17.182 18.101 19.021 19.943 20.867
18.768 19.729 20.690 21.652 22.616
20.337 21.337 22.337 23.337 24.337
26 27 28 29 30
11.160 11.808 12.461 13.121 13.787
12.198 12.878 13.565 14.256 14.953
13.409 14.125 14.847 15.574 16.306
13.844 14.573 15.308 16.047 16.791
14.851 15.609 16.371 17.138 17.908
15.379 16.151 16.928 17.708 18.493
17.292 18.114 18.939 19.768 20.599
19.820 20.703 21.588 22.475 23.364
21.792 22.719 23.647 24.577 25.508
23.579 24.544 25.509 26.475 27.442
25.336 26.336 27.336 28.336 29.336
31 60 70 120
14.458 35.534 43.275 83.852
15.655 37.485 45.442 86.923
17.042 39.699 47.893 90.367
17.539 40.482 48.758 91.573
18.683 42.266 50.724 94.303
19.281 43.188 51.739 95.705
21.434 46.459 55.329 100.624
24.255 50.641 59.898 106.806
26.440 53.809 63.346 111.419
28.409 56.620 66.396 115.465
30.336 59.335 69.334 119.334
Estadística (Civil/Electrónica/Telecomunicaciones)
189
Universidad Peruana de Ciencias Aplicadas
Tabla N°4.2
TABLA DE LA DISTRIBUCIÓN JI-CUADRADO
Áreas bajo la curva: P( 2 c)
1 2 3 4 5
0.250 1.323 2.773 4.108 5.385 6.626
0.125 2.354 4.159 5.739 7.214 8.625
0.100 2.706 4.605 6.251 7.779 9.236
0.050 0.025 0.020 3.841 5.024 5.412 5.991 7.378 7.824 7.815 9.348 9.837 9.488 11.143 11.668 11.070 12.832 13.388
6 7 8 9 10
7.841 8.558 9.446 9.992 9.037 9.803 10.748 11.326 10.219 11.030 12.027 12.636 11.389 12.242 13.288 13.926 12.549 13.442 14.534 15.198
10.645 12.017 13.362 14.684 15.987
12.592 14.067 15.507 16.919 18.307
14.449 16.013 17.535 19.023 20.483
15.033 16.622 18.168 19.679 21.161
16.812 18.475 20.090 21.666 23.209
18.548 20.278 21.955 23.589 25.188
11 12 13 14 15
13.701 14.845 15.984 17.117 18.245
14.631 15.812 16.985 18.151 19.311
15.767 16.989 18.202 19.406 20.603
16.457 17.703 18.939 20.166 21.384
17.275 18.549 19.812 21.064 22.307
19.675 21.026 22.362 23.685 24.996
21.920 23.337 24.736 26.119 27.488
22.618 24.054 25.471 26.873 28.259
24.725 26.217 27.688 29.141 30.578
26.757 28.300 29.819 31.319 32.801
16 17 18 19 20
19.369 20.489 21.605 22.718 23.828
20.465 21.615 22.760 23.900 25.038
21.793 22.977 24.155 25.329 26.498
22.595 23.799 24.997 26.189 27.376
23.542 24.769 25.989 27.204 28.412
26.296 27.587 28.869 30.144 31.410
28.845 30.191 31.526 32.852 34.170
29.633 30.995 32.346 33.687 35.020
32.000 33.409 34.805 36.191 37.566
34.267 35.718 37.156 38.582 39.997
21 22 23 24 25
24.935 26.039 27.141 28.241 29.339
26.171 27.301 28.429 29.553 30.675
27.662 28.822 29.979 31.132 32.282
28.559 29.737 30.911 32.081 33.247
29.615 30.813 32.007 33.196 34.382
32.671 33.924 35.172 36.415 37.652
35.479 36.781 38.076 39.364 40.646
36.343 37.659 38.968 40.270 41.566
38.932 40.289 41.638 42.980 44.314
41.401 42.796 44.181 45.558 46.928
26 27 28 29 30
30.435 31.528 32.620 33.711 34.800
31.795 32.912 34.027 35.139 36.250
33.429 34.574 35.715 36.854 37.990
34.410 35.570 36.727 37.881 39.033
35.563 36.741 37.916 39.087 40.256
38.885 40.113 41.337 42.557 43.773
41.923 43.195 44.461 45.722 46.979
42.856 44.140 45.419 46.693 47.962
45.642 46.963 48.278 49.588 50.892
48.290 49.645 50.994 52.335 53.672
31 60 70 120
35.887 66.981 77.577 130.055
37.359 68.972 79.715 132.806
39.124 71.341 82.255 136.062
40.181 72.751 83.765 137.990
41.422 74.397 85.527 140.233
44.985 79.082 90.531 146.567
48.232 83.298 95.023 152.211
49.226 84.580 96.387 153.918
52.191 88.379 100.425 158.950
55.002 91.952 104.215 163.648
v
0.200 1.642 3.219 4.642 5.989 7.289
0.150 2.072 3.794 5.317 6.745 8.115
Estadística (Civil/Electrónica/Telecomunicaciones)
0.010 6.635 9.210 11.345 13.277 15.086
0.005 7.879 10.597 12.838 14.860 16.750
190
Universidad Peruana de Ciencias Aplicadas
Tabla N°5.1 TABLA DE LA DISTRIBUCIÓN F Áreas bajo la curva: P(F c) 0.050 0.025 0.010 0.005
v2 1
1 2 3 4 161.45 199.50 215.71 224.58 647.79 799.48 864.15 899.60 4052.18 4999.34 5403.53 5624.26 16212.46 19997.36 21614.13 22500.75
v1 5 230.16 921.83 5763.96 23055.82
6 7 8 9 10 233.99 236.77 238.88 240.54 241.88 937.11 948.20 956.64 963.28 968.63 5858.95 5928.33 5980.95 6022.40 6055.93 23439.53 23715.20 23923.81 24091.45 24221.84
0.050 0.025 0.010 0.005
2
18.51 38.51 98.50 198.50
19.00 39.00 99.00 199.01
19.16 39.17 99.16 199.16
19.25 39.25 99.25 199.24
19.30 39.30 99.30 199.30
19.33 39.33 99.33 199.33
19.35 39.36 99.36 199.36
19.37 39.37 99.38 199.38
19.38 39.39 99.39 199.39
19.40 39.40 99.40 199.39
0.050 0.025 0.010 0.005
3
10.13 17.44 34.12 55.55
9.55 16.04 30.82 49.80
9.28 15.44 29.46 47.47
9.12 15.10 28.71 46.20
9.01 14.88 28.24 45.39
8.94 14.73 27.91 44.84
8.89 14.62 27.67 44.43
8.85 14.54 27.49 44.13
8.81 14.47 27.34 43.88
8.79 14.42 27.23 43.68
0.050 0.025 0.010 0.005
4
7.71 12.22 21.20 31.33
6.94 10.65 18.00 26.28
6.59 9.98 16.69 24.26
6.39 9.60 15.98 23.15
6.26 9.36 15.52 22.46
6.16 9.20 15.21 21.98
6.09 9.07 14.98 21.62
6.04 8.98 14.80 21.35
6.00 8.90 14.66 21.14
5.96 8.84 14.55 20.97
0.050 0.025 0.010 0.005
5
6.61 10.01 16.26 22.78
5.79 8.43 13.27 18.31
5.41 7.76 12.06 16.53
5.19 7.39 11.39 15.56
5.05 7.15 10.97 14.94
4.95 6.98 10.67 14.51
4.88 6.85 10.46 14.20
4.82 6.76 10.29 13.96
4.77 6.68 10.16 13.77
4.74 6.62 10.05 13.62
0.050 0.025 0.010 0.005
6
5.99 8.81 13.75 18.63
5.14 7.26 10.92 14.54
4.76 6.60 9.78 12.92
4.53 6.23 9.15 12.03
4.39 5.99 8.75 11.46
4.28 5.82 8.47 11.07
4.21 5.70 8.26 10.79
4.15 5.60 8.10 10.57
4.10 5.52 7.98 10.39
4.06 5.46 7.87 10.25
0.050 0.025 0.010 0.005
7
5.59 8.07 12.25 16.24
4.74 6.54 9.55 12.40
4.35 5.89 8.45 10.88
4.12 5.52 7.85 10.05
3.97 5.29 7.46 9.52
3.87 5.12 7.19 9.16
3.79 4.99 6.99 8.89
3.73 4.90 6.84 8.68
3.68 4.82 6.72 8.51
3.64 4.76 6.62 8.38
0.050 0.025 0.010 0.005
8
5.32 7.57 11.26 14.69
4.46 6.06 8.65 11.04
4.07 5.42 7.59 9.60
3.84 5.05 7.01 8.81
3.69 4.82 6.63 8.30
3.58 4.65 6.37 7.95
3.50 4.53 6.18 7.69
3.44 4.43 6.03 7.50
3.39 4.36 5.91 7.34
3.35 4.30 5.81 7.21
0.050 0.025 0.010 0.005
9
5.12 7.21 10.56 13.61
4.26 5.71 8.02 10.11
3.86 5.08 6.99 8.72
3.63 4.72 6.42 7.96
3.48 4.48 6.06 7.47
3.37 4.32 5.80 7.13
3.29 4.20 5.61 6.88
3.23 4.10 5.47 6.69
3.18 4.03 5.35 6.54
3.14 3.96 5.26 6.42
0.050 0.025 0.010 0.005
10
4.96 6.94 10.04 12.83
4.10 5.46 7.56 9.43
3.71 4.83 6.55 8.08
3.48 4.47 5.99 7.34
3.33 4.24 5.64 6.87
3.22 4.07 5.39 6.54
3.14 3.95 5.20 6.30
3.07 3.85 5.06 6.12
3.02 3.78 4.94 5.97
2.98 3.72 4.85 5.85
0.050 0.025 0.010 0.005
11
4.84 6.72 9.65 12.23
3.98 5.26 7.21 8.91
3.59 4.63 6.22 7.60
3.36 4.28 5.67 6.88
3.20 4.04 5.32 6.42
3.09 3.88 5.07 6.10
3.01 3.76 4.89 5.86
2.95 3.66 4.74 5.68
2.90 3.59 4.63 5.54
2.85 3.53 4.54 5.42
0.050 0.025 0.010 0.005
12
4.75 6.55 9.33 11.75
3.89 5.10 6.93 8.51
3.49 4.47 5.95 7.23
3.26 4.12 5.41 6.52
3.11 3.89 5.06 6.07
3.00 3.73 4.82 5.76
2.91 3.61 4.64 5.52
2.85 3.51 4.50 5.35
2.80 3.44 4.39 5.20
2.75 3.37 4.30 5.09
Estadística (Civil/Electrónica/Telecomunicaciones)
191
Universidad Peruana de Ciencias Aplicadas
Tabla N°5.2 TABLA DE LA DISTRIBUCIÓN F Áreas bajo la curva: P(F c) v2 1
12 243.90 976.72 6106.68 24426.73
15 245.95 984.87 6156.97 24631.62
20 248.02 993.08 6208.66 24836.51
24 249.05 997.27 6234.27 24937.09
v1 30 250.10 1001.40 6260.35 25041.40
40 251.14 1005.60 6286.43 25145.71
50 251.77 1008.10 6302.26 25212.76
60 252.20 1009.79 6312.97 25253.74
70 252.50 1011.01 6320.89 25283.55
120 253.25 1014.04 6339.51 25358.05
0.050 0.025 0.010 0.005
2
19.41 39.41 99.42 199.42
19.43 39.43 99.43 199.43
19.45 39.45 99.45 199.45
19.45 39.46 99.46 199.45
19.46 39.46 99.47 199.48
19.47 39.47 99.48 199.48
19.48 39.48 99.48 199.48
19.48 39.48 99.48 199.48
19.48 39.48 99.48 199.48
19.49 39.49 99.49 199.49
0.050 0.025 0.010 0.005
3
8.74 14.34 27.05 43.39
8.70 14.25 26.87 43.08
8.66 14.17 26.69 42.78
8.64 14.12 26.60 42.62
8.62 14.08 26.50 42.47
8.59 14.04 26.41 42.31
8.58 14.01 26.35 42.21
8.57 13.99 26.32 42.15
8.57 13.98 26.29 42.10
8.55 13.95 26.22 41.99
0.050 0.025 0.010 0.005
4
5.91 8.75 14.37 20.70
5.86 8.66 14.20 20.44
5.80 8.56 14.02 20.17
5.77 8.51 13.93 20.03
5.75 8.46 13.84 19.89
5.72 8.41 13.75 19.75
5.70 8.38 13.69 19.67
5.69 8.36 13.65 19.61
5.68 8.35 13.63 19.57
5.66 8.31 13.56 19.47
0.050 0.025 0.010 0.005
5
4.68 6.52 9.89 13.38
4.62 6.43 9.72 13.15
4.56 6.33 9.55 12.90
4.53 6.28 9.47 12.78
4.50 6.23 9.38 12.66
4.46 6.18 9.29 12.53
4.44 6.14 9.24 12.45
4.43 6.12 9.20 12.40
4.42 6.11 9.18 12.37
4.40 6.07 9.11 12.27
0.050 0.025 0.010 0.005
6
4.00 5.37 7.72 10.03
3.94 5.27 7.56 9.81
3.87 5.17 7.40 9.59
3.84 5.12 7.31 9.47
3.81 5.07 7.23 9.36
3.77 5.01 7.14 9.24
3.75 4.98 7.09 9.17
3.74 4.96 7.06 9.12
3.73 4.94 7.03 9.09
3.70 4.90 6.97 9.00
0.050 0.025 0.010 0.005
7
3.57 4.67 6.47 8.18
3.51 4.57 6.31 7.97
3.44 4.47 6.16 7.75
3.41 4.41 6.07 7.64
3.38 4.36 5.99 7.53
3.34 4.31 5.91 7.42
3.32 4.28 5.86 7.35
3.30 4.25 5.82 7.31
3.29 4.24 5.80 7.28
3.27 4.20 5.74 7.19
0.050 0.025 0.010 0.005
8
3.28 4.20 5.67 7.01
3.22 4.10 5.52 6.81
3.15 4.00 5.36 6.61
3.12 3.95 5.28 6.50
3.08 3.89 5.20 6.40
3.04 3.84 5.12 6.29
3.02 3.81 5.07 6.22
3.01 3.78 5.03 6.18
2.99 3.77 5.01 6.15
2.97 3.73 4.95 6.06
0.050 0.025 0.010 0.005
9
3.07 3.87 5.11 6.23
3.01 3.77 4.96 6.03
2.94 3.67 4.81 5.83
2.90 3.61 4.73 5.73
2.86 3.56 4.65 5.62
2.83 3.51 4.57 5.52
2.80 3.47 4.52 5.45
2.79 3.45 4.48 5.41
2.78 3.43 4.46 5.38
2.75 3.39 4.40 5.30
0.050 0.025 0.010 0.005
0.050 0.025 0.010 0.005
10
2.91 3.62 4.71 5.66
2.85 3.52 4.56 5.47
2.77 3.42 4.41 5.27
2.74 3.37 4.33 5.17
2.70 3.31 4.25 5.07
2.66 3.26 4.17 4.97
2.64 3.22 4.12 4.90
2.62 3.20 4.08 4.86
2.61 3.18 4.06 4.83
2.58 3.14 4.00 4.75
0.050 0.025 0.010 0.005
11
2.79 3.43 4.40 5.24
2.72 3.33 4.25 5.05
2.65 3.23 4.10 4.86
2.61 3.17 4.02 4.76
2.57 3.12 3.94 4.65
2.53 3.06 3.86 4.55
2.51 3.03 3.81 4.49
2.49 3.00 3.78 4.45
2.48 2.99 3.75 4.41
2.45 2.94 3.69 4.34
0.050 0.025 0.010 0.005
12
2.69 3.28 4.16 4.91
2.62 3.18 4.01 4.72
2.54 3.07 3.86 4.53
2.51 3.02 3.78 4.43
2.47 2.96 3.70 4.33
2.43 2.91 3.62 4.23
2.40 2.87 3.57 4.17
2.38 2.85 3.54 4.12
2.37 2.83 3.51 4.09
2.34 2.79 3.45 4.01
Estadística (Civil/Electrónica/Telecomunicaciones)
192
Universidad Peruana de Ciencias Aplicadas
Tabla N°5.3 TABLA DE LA DISTRIBUCIÓN F Áreas bajo la curva: P(F c) v2 13
1 4.7 6.4 9.1 11.4
2 3.8 5.0 6.7 8.2
3 3.4 4.3 5.7 6.9
4 3.2 4.0 5.2 6.2
v1 5 3.0 3.8 4.9 5.8
6 2.9 3.6 4.6 5.5
7 2.8 3.5 4.4 5.3
8 2.8 3.4 4.3 5.1
9 2.7 3.3 4.2 4.9
10 2.7 3.2 4.1 4.8
0.050 0.025 0.010 0.005
14
4.60 6.30 8.86 11.06
3.74 4.86 6.51 7.92
3.34 4.24 5.56 6.68
3.11 3.89 5.04 6.00
2.96 3.66 4.69 5.56
2.85 3.50 4.46 5.26
2.76 3.38 4.28 5.03
2.70 3.29 4.14 4.86
2.65 3.21 4.03 4.72
2.60 3.15 3.94 4.60
0.050 0.025 0.010 0.005
15
4.54 6.20 8.68 10.80
3.68 4.77 6.36 7.70
3.29 4.15 5.42 6.48
3.06 3.80 4.89 5.80
2.90 3.58 4.56 5.37
2.79 3.41 4.32 5.07
2.71 3.29 4.14 4.85
2.64 3.20 4.00 4.67
2.59 3.12 3.89 4.54
2.54 3.06 3.80 4.42
0.050 0.025 0.010 0.005
20
4.35 5.87 8.10 9.94
3.49 4.46 5.85 6.99
3.10 3.86 4.94 5.82
2.87 3.51 4.43 5.17
2.71 3.29 4.10 4.76
2.60 3.13 3.87 4.47
2.51 3.01 3.70 4.26
2.45 2.91 3.56 4.09
2.39 2.84 3.46 3.96
2.35 2.77 3.37 3.85
0.050 0.025 0.010 0.005
24
4.26 5.72 7.82 9.55
3.40 4.32 5.61 6.66
3.01 3.72 4.72 5.52
2.78 3.38 4.22 4.89
2.62 3.15 3.90 4.49
2.51 2.99 3.67 4.20
2.42 2.87 3.50 3.99
2.36 2.78 3.36 3.83
2.30 2.70 3.26 3.69
2.25 2.64 3.17 3.59
0.050 0.025 0.010 0.005
30
4.17 5.57 7.56 9.18
3.32 4.18 5.39 6.35
2.92 3.59 4.51 5.24
2.69 3.25 4.02 4.62
2.53 3.03 3.70 4.23
2.42 2.87 3.47 3.95
2.33 2.75 3.30 3.74
2.27 2.65 3.17 3.58
2.21 2.57 3.07 3.45
2.16 2.51 2.98 3.34
0.050 0.025 0.010 0.005
40
4.08 5.42 7.31 8.83
3.23 4.05 5.18 6.07
2.84 3.46 4.31 4.98
2.61 3.13 3.83 4.37
2.45 2.90 3.51 3.99
2.34 2.74 3.29 3.71
2.25 2.62 3.12 3.51
2.18 2.53 2.99 3.35
2.12 2.45 2.89 3.22
2.08 2.39 2.80 3.12
0.050 0.025 0.010 0.005
45
4.06 5.38 7.23 8.71
3.20 4.01 5.11 5.97
2.81 3.42 4.25 4.89
2.58 3.09 3.77 4.29
2.42 2.86 3.45 3.91
2.31 2.70 3.23 3.64
2.22 2.58 3.07 3.43
2.15 2.49 2.94 3.28
2.10 2.41 2.83 3.15
2.05 2.35 2.74 3.04
0.050 0.025 0.010 0.005
50
4.03 5.34 7.17 8.63
3.18 3.97 5.06 5.90
2.79 3.39 4.20 4.83
2.56 3.05 3.72 4.23
2.40 2.83 3.41 3.85
2.29 2.67 3.19 3.58
2.20 2.55 3.02 3.38
2.13 2.46 2.89 3.22
2.07 2.38 2.78 3.09
2.03 2.32 2.70 2.99
0.050 0.025 0.010 0.005
60
4.00 5.29 7.08 8.49
3.15 3.93 4.98 5.79
2.76 3.34 4.13 4.73
2.53 3.01 3.65 4.14
2.37 2.79 3.34 3.76
2.25 2.63 3.12 3.49
2.17 2.51 2.95 3.29
2.10 2.41 2.82 3.13
2.04 2.33 2.72 3.01
1.99 2.27 2.63 2.90
0.050 0.025 0.010 0.005
70
3.98 5.25 7.01 8.40
3.13 3.89 4.92 5.72
2.74 3.31 4.07 4.66
2.50 2.97 3.60 4.08
2.35 2.75 3.29 3.70
2.23 2.59 3.07 3.43
2.14 2.47 2.91 3.23
2.07 2.38 2.78 3.08
2.02 2.30 2.67 2.95
1.97 2.24 2.59 2.85
0.050 0.025 0.010 0.005
120
3.92 5.15 6.85 8.18
3.07 3.80 4.79 5.54
2.68 3.23 3.95 4.50
2.45 2.89 3.48 3.92
2.29 2.67 3.17 3.55
2.18 2.52 2.96 3.28
2.09 2.39 2.79 3.09
2.02 2.30 2.66 2.93
1.96 2.22 2.56 2.81
1.91 2.16 2.47 2.71
0.050 0.025 0.010 0.005
Estadística (Civil/Electrónica/Telecomunicaciones)
193