UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
1
Plan de Estudio
MEDIDAS DE RESUMEN
Tendencia
Cuantiles
Central
caso:
Media
Mediana
Aritmetica
Moda
datos no agrupados
caso: datos no agrupados
caso:
caso:
caso:
datos
datos
datos
no agrupados
no agrupados
no agrupados agrupados
ñcaso:
caso:
datos
datos
agrupados
agrupados
caso: datos agrupados
MEDIA Geometrica
1
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
2
Medidas descriptivas (Estadígrafo o Estadístico) variables cuantitativas Los datos organizados en una distribución de frecuencias destacan sus características mas esenciales, como marcas de clases, centro forma de distribución (asimétrica simetría). Sin embargo los indicadores que describen a los datos en forma más precisa debe calcularse. Estos indicadores resumen los datos en medidas descriptivas que se refieren a la centralización (medidas de tendencia central) o de posición, a la dispersión o variación, a la asimetría y a la curtosis de los datos. Medidas de tendencia central sus valores tienden a ocupar posiciones centrales o intermedios entre el menor y mayor valor del conjunto de datos, nos da la información sobre el centro de la distribución las más importante y muy usadas son: la media aritmética, la mediana, media geométrica, la media armónica. Los estadísticos de dispersión dispersión indican cuan dispersos dispersos están los datos mientras su valor valor sea mayor mas dispersos se encuentran las observaciones. Las mas importantes son: desviación típica y el coeficiente de variación. MEDIDA DE TENDENCIA CENTRAL es un valor único que resume un conjunto de datos. Señala el centro de los valores Porque son importantes las medidas de tendencia central? Porque la mayor parte de los conjuntos de datos muestran una tendencia agruparse alrededor de un dato central. En general las medidas de tendencia central se denominan promedios son puntos en una distribución, los valores medios o centrales de esta. Las mas importantes son la media, la mediana y la moda •
•
•
Media Aritmetica
La media aritmética es el estadígrafo de posición más importante se denomina simplemente media o promedio. Definición. La media aritmética, es la suma de los valores observados de la variable, dividido por el número de observaciones. observaciones. Suponga que en una muestra de n se observan x 1 , x2, ..... xn de una variable Para valores de una variable X observados en una muestra, la media aritmética se denota por Calculo de la media aritmética de datos no agrupados Media aritmética de la poblacional.
La media aritmética de una población denotamos por μ . Si la población es finita de tamaño N con valores x 1 , x 2 , x3 . . . .x N la media es el numero : Se reporta el promedio en el el examen de admisión de todos todos los estudiantes que ingresaron ingresaron a la UNFV en año 2008, es 195.4 puntos; este es un ejemplo de una media poblacional porque se tienen las puntuaciones de todos los estudiantes que e ingresaron en ese año.
2
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
2
Medidas descriptivas (Estadígrafo o Estadístico) variables cuantitativas Los datos organizados en una distribución de frecuencias destacan sus características mas esenciales, como marcas de clases, centro forma de distribución (asimétrica simetría). Sin embargo los indicadores que describen a los datos en forma más precisa debe calcularse. Estos indicadores resumen los datos en medidas descriptivas que se refieren a la centralización (medidas de tendencia central) o de posición, a la dispersión o variación, a la asimetría y a la curtosis de los datos. Medidas de tendencia central sus valores tienden a ocupar posiciones centrales o intermedios entre el menor y mayor valor del conjunto de datos, nos da la información sobre el centro de la distribución las más importante y muy usadas son: la media aritmética, la mediana, media geométrica, la media armónica. Los estadísticos de dispersión dispersión indican cuan dispersos dispersos están los datos mientras su valor valor sea mayor mas dispersos se encuentran las observaciones. Las mas importantes son: desviación típica y el coeficiente de variación. MEDIDA DE TENDENCIA CENTRAL es un valor único que resume un conjunto de datos. Señala el centro de los valores Porque son importantes las medidas de tendencia central? Porque la mayor parte de los conjuntos de datos muestran una tendencia agruparse alrededor de un dato central. En general las medidas de tendencia central se denominan promedios son puntos en una distribución, los valores medios o centrales de esta. Las mas importantes son la media, la mediana y la moda •
•
•
Media Aritmetica
La media aritmética es el estadígrafo de posición más importante se denomina simplemente media o promedio. Definición. La media aritmética, es la suma de los valores observados de la variable, dividido por el número de observaciones. observaciones. Suponga que en una muestra de n se observan x 1 , x2, ..... xn de una variable Para valores de una variable X observados en una muestra, la media aritmética se denota por Calculo de la media aritmética de datos no agrupados Media aritmética de la poblacional.
La media aritmética de una población denotamos por μ . Si la población es finita de tamaño N con valores x 1 , x 2 , x3 . . . .x N la media es el numero : Se reporta el promedio en el el examen de admisión de todos todos los estudiantes que ingresaron ingresaron a la UNFV en año 2008, es 195.4 puntos; este es un ejemplo de una media poblacional porque se tienen las puntuaciones de todos los estudiantes que e ingresaron en ese año.
2
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
3
Media Muestral La media de n valores x1 , x2, ..... xn de una variable cuantitativa X. Observados en una muestra es el numero Media Muestral = Suma de todos los valores de la muestra Numero de todos los valores en la muestra La media de una muestra o cualquier otra medida basada en datos muestrales se denomina estadístico. La media de una muestra y la media Poblacional se calculan de la misma manera pero la simbología es diferente. Ejemplo:. el promedio de gasto gasto en refrigerio de estudiantes del primer año año es : S/. 10, S/.15, S/.12, S/.20, S/.18, S/.15, S/.10, S/.21, S/.19, mensual = 10 +10+15 +12 +20 + 18 +15 + 10 + 21 +19 = 15 soles mensual 10 promedio de gasto por los estudiantes es 15 soles Interpretación : se espera que el gasto promedio en refrigerio por cada estudiante sea 15 soles mensual
equilibrio de los datos mayores y menores. menores. Significa que la media es el punto de equilibrio
+3 -4
+2
-2 1
2
3
4
5
+1 6
7
8
9
10
X
La media se puede considerarse como un punto de equilibrio de un conjunto de datos tenemos tenem os Cinco datos 3, 3, 5, 8, 9, 10 cuya punto equilibrio queda fijado en 7 que es es la media de los cinco números entonces las las desviaciones hacia abajo de la media -6 y son iguales a las desviaciones desviaciones hacia arriba de la misma (+6) POR LO SIGUIENTE Propiedades de la media aritmética:
1. La media es la única medida de tendencia central donde la suma de las l as
desviaciones de cada valor, respecto a la media, siempre es igual a cero, expresado de modo expresado algebraicamente 3
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
2. 3. 4. 5.
4
Para evaluar la media se consideran todos los valores Un conjunto de datos solo tiene una media, la cual es un valor único. La media es una medida muy útil para comparar dos más poblaciones. Si cada uno de los n valores x i es transformado en : y i = ax i k siendo a y k constante, entonces, la media de los n valores y i es
Como casos particulares se tiene: a. ”La media aritmética de una constante es igual a la misma constante”
si y i = k, entonces, b. “La media de una variable menos o o más la constante ”
más una constante, es igual a la media de la variable menos
Si y i = x i k entonces,. Esto es si a cada dato se resta o suma una constante la media queda disminuida o sumada por esa constante. c. “La media del producto de una constante por una variable, es igual al producto de la constante por la media de la variable”
Si y i = axi entonces, esto es, si a cada dato se multiplica por una constante, la media queda multiplicada por esa constante.
Ejemplo 1: Los costos de fabricación, en soles, de diez objetos seleccionados, son los siguientes: 9.35, 9.46, 9.20, 9.80, 9.77, 9.00, 9.99, 9.36, 9.50, 9.60 soles Si el precio de venta de cada objeto es 3 veces su costo de fabricación menos 5 soles, calcular la ganancia promedio por objeto. Soluc. xi = costo del objeto _ El promedio del costo de los objetos Xc = 9.35+9.46+9.20+9.80 +9.77+9.00+9.99+9.36+9.50+9.60 =9.503 10 Precio de venta es zi = 3xi -5 aplicando propiedad (1a) Se tiene la media de venta es Zv = 3*Xc - 5 =3*9.503 – 5 =28.509 – 5 =23.509 soles La media de venta es 23.509 soles la ganancia promedio es Z v – X c = 23.509 –9.503=14.006 soles Ejemplo 2. El sueldo promedio de 200 empleados de una empresa es S/. 400. Se proponen dos alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo más 10 soles a cada uno. Si la empresa dispone a lo mas de S/. 94.000 para pagar sueldos, ¿¡Cual alternativa es más conveniente? . RP. b es la conveniente 4
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
5
*Ventajas de la media aritmética . •
Concepto familiar para muchas personas
Desventajas:
Se ve afectada por los datos extremos,, altos o bajos llamados atipicos Si los datos están agrupados en clases con extremos abiertos, no es posible calcular la media Nota 1: La media para datos agrupados por intervalos es aproximada por que hay una ligera perdida de
información al construir la tabla de distribución de frecuencia y al ubicar las observaciones en los intervalos los valores pierde identidad y la marca de clase se supone que es la representación del intervalo. -Es una medida que puede ser calculada y es única. Cada conjunto de datos tiene una y solo una media. -La media aritmética como estadígrafo de posición de una distribución proporciona una idea de la posición de los valores alrededor de la media. -Para evaluar la media se consideran todos los valores ejemplo: En la distribución de los ingresos o salarios se aprecia un predominio de ingresos menores, es decir que hay muchas personas que ganan poco y predominio de ingresos menores, es decir que hay muchas personas que ganan poco y pocas personas que ganan mucho. Supongamos que los haberes de los trabajadores de una pequeña empresa es como sigue: Cargo Gerente general administrador Contador Empleado Obrero calificado Obrero simicalificado
Numero de trabajadores 1 1 1 3 5 3
haberes en soles mensual 560 520 480 160 150 140
a-determinar el haber promedio mensual de la empresa b-será representativo este haber promedio del conjunto de trabajadores c-Cual sería un procedimiento adecuado para un análisis de los datos? Soluc. a)el haber promedio mensual es decir la media aritmética: X =
1*560 +1*520 +1*480 +3*160+ 5*150+3*140 = 3210 = 229.3 soles por trabajador 1 + 1 + 1 + 3 + 5 +3 14 b-No es representativo, porque hay solo 3 personas con sueldo alto que hacen crecer el promedio Un procedimiento adecuado podría ser estratificado previamente los datos originales en dos categorías En este caso la media estaría influenciada por los pocos valores mayores, originando una elevación del sueldo promedio, de este modo se distorsiona la interpretación de los sueldos de esta población.
5
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
6
NOTA: Media aritmética ponderada:
La media ponderada es un caso especial de la media común (o media aritmética). Se presenta cuando hay valores de las observaciones que esta ponderada ( por pesos). Para explicar esto La media aritmética de los valores x 1 , x 2 , x 3 .. . ..x m ponderada por los pesos w1 , w 2 , w 3 .... . . wm . es el numero: ejemplo de media ponderada Si un alumno en el semestre anterior ha obtenido 11 en el curso A de 5 créditos, 13 en el curso B de 4 créditos, y 16 en el curso C de 3 créditos, entonces, su promedio (ponderado por los créditos) es es _ X= 11*5+13*4+16*3 =155 =12.92puntos 5+4+3 12 NOTA: Media aritmética total. A partir de sub muestras
Si consideramos muestras de tamaños n1 ,, n2 . . . n m de una población a las cuales le corresponden media aritméticas , respectivamente: entonces la media asociada a la muestra de tamaños n 1 ,,, n 2 . . . n m esta dada por : Por ejemplo; si un examen, 50 alumnos de sección A obtuvieron una media de 12,6 ; 45 alumnos de la sección B obtuvieron un promedio de 13.48 entonces, y 40 alumnos de la sección C obtuvieron un promedio de 13,5. Los 135 alumnos en conjunto obtuvieron el promedio: _ XT = 50*12,6 + 45*13,48+40*13,5 = 1776,6 = 13,16 puntos 50+45+40 135 Ejemplo. .En una empresa la edad promedio de las 17 trabajadoras mujeres es de 31.2 años, y la edad promedio de los 23 trabajadores hombres es de 38 años. ¿Cuál es la edad promedio del total de trabajadores? _ _ Mujeres : n 1 = 17 X 1 =31.2 años Hombres: n 2 = 23 X 2 = 38 años _ XT = 17 * 31.2 + 23 * 38 = 1404.4 =35.1 años 17 + 23 40 ejemplo 6. En un examen de Estadística participaron tres grupos A, B, C con un total de 180 alumnos; habiendo obtenido nota promedio general de 72 puntos. Los puntajes promedio de los grupos A y B fueron 75 y 62, y estaban constituidos por 80 y 60 alumnos respectivamente. ¿Cuál es la nota promedio del grupo C? _ _ _ _ nA + nB + nc = 180 alumnos Y T = 72 puntos YA = 75 YB = 62 YC = ¿? Como nA = 80 nB =60 entonces nC = 40 _ YT = 75(80) + 62(60) + YC (40) = 6000 +3720 + 40 YC = 72 _ 180 180 YC = 180(72) – 6000 – 3720 = 3240 = 81 puntos 40 40 Entonces la nota promedio del grupo C es de 81 puntos. 6
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
7
Ejercicios I 1.- Evalué la media del siguiente conjunto de valores:6,3,5,7,6 a- Demuestre algebraicamente y luego aritméticamente con los valores. 2.-El ingreso anual para una muestra de varios empleados de gerencia de nivel medio en la empresa Donofrio es: S/.10500, S/.9500, S/. 11000, S/.15,500 S/. 12000, S/. 13500. a) exprese la fórmula para la media muestral b) Obtenga la media de la muestra c) La media que obtuvo en B) es un estadístico o un parámetro? Explique porque? d) Cual es su mejor estimación de la media poblacional? 3.- Los estudiantes de un curso de Estadística II se consideran como una Población, Sus calificaciones en el curso son 92, 96, 61, 86, 79, y 84 a) indique la fórmula para calcular la media poblacional b) Determine la calificación media del curso. c) La media que obtuvo en B) es un valor estadístico o parámetro? Porque? 4- Los estudiantes del curso de Microeconomía se consideran como una población, sus calificaciones en el curso son 12, 16, 61, 16,19 y 14 a) indique la formula para calcular la media poblacional b) Determine la calificación media del curso e interprete c) La media que obtuvo es un valor estadístico o un parámetro porque? 5- EL Hospital Almenara emplea 200 personas en su cuerpo de enfermeras. De ese personal, 50 son ayudantes de enfermería, 50 son enfermeras practicantes y 100 son enfermeras generales. Las primera reciben un sueldo de S/.8 por hora; la segundas, ganan S/. 10 por hora y las ultimas S/. 14 por hora. ¿Cuál es el promedio del sueldo por hora. 6-Para calcular el suministro de agua que una ciudad requiere mensualmente, se escogen 15 familias de la ciudad, resultando los siguientes consumos en metros cúbicos: 11,2 21,5 16,4 19,7 14,6 16,9 32,2 18,2 13,1 23,8 18,3 15,5 18,8 22,7 14,0 Si en la ciudad hay 5 000 familias. ¿Estime cuántos metros cúbicos de agua se requieren mensualmente si el consumo promedio por familia permanece igual? 8- En una empresa donde el sueldo medio es de $400 se incrementa un personal igual al 25% del ya existente con un sueldo medio igual al 60% de los antiguos. Si 3 meses más tarde se incrementan cada sueldo en 20%, mas 30$, cual es el promedio del nuevo salario? Ejemplo 2: Ssupóngase que en un restaurante se venden refrescos medianos , grande y extragrandes, y sus precios son los siguientes: 100, 1.50. 2.00 soles respectivamente. De los últimos 10 refrescos que se vendieron 3 eran medianos, 4 grandes y 3 extragrandes. Para calcular el precio promedio de los últimos diez refrescos vendidos se puede _
= 3*1.00+ 4*1.50+3*2.00 = 15/10 =1.5 10 El precio promedio de venta de los últimos diez refrescos es de 1.5 soles. X
7
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
8
EjercicioEn junio una inversionista compro 300 acciones de Canal 5 a un precio de $20 (dólares) por acción; en agosto compro 400 acciones más a $25 cada una, y en noviembre, 400 a $23 por acción. ¿Cuál es el precio promedio por acción? 2) Media aritmética de datos tabulados a) Media para datos tabulados por valores diferentes ( variable discreta) Si n valores de una variable estadística discreta X y sus m valores x 1 , x 2 . . . . . . . . x frecuencias absolutas respectivas f1 , f2 , f3 , f4 . . fm , entonces, su media aritmética es el numero :
m
con sus
Ejemplo 1 : Calcular la media aritmética de la distribución del numero de hijos por familia Número de hijos 0 1 2 3 4
Número de familias Frecuencia absoluta fi 1 4 7 6 2
Se tiene que m= 5 y
Valores diferentes Y1 =0, y2 = 1, y3 = 2 ,y4 =3 , y5 =4
20 Luego calculando la media aritmética es: Número de hijos x i 0 1 2 3 4
Número de familias Productos fi fi * y i 1 1 *0 = 0 4 4*1=4 7 7 * 2 = 14 6 6 * 3= 18 2 2*4=8 20
∑ni * y i = 44
Interpretación: el número de hijos que se espera tenga cada familia es de 2.
b ) Media para datos agrupados por Intervalos Si n valores de alguna variable X están tabulados en una distribución de frecuencias de m intervalos, donde: MC1 , , MC2 , .. . . MCm son las marcas de clase y f 1 , f 2 , f 3 , . . . f m son las
frecuencias absolutas respectivas entonces, su media aritmética es el numero:
8
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
9
Ejemplo: Distribución de 40 empleados de la empresa Tupac S. A. por sueldos mensuales, 2006 Sueldos Frecuencia absoluta f i [320 – 378) 4 [378 – 436) 7 [436 – 494) 10 [494 – 552) 6 – [552 610) 8 [610 – 668] 5 Total 40
Para calcular es necesario calcular las marcas de clase Sueldo en $
[320 – 378 > [378 – 436 > [436 – 494 > [494 – 552 > [552 – 610 > [610 – 668] Total
Marcas MC 349 407 465 523 581 639
i
N° de empleados f i 4 7 10 6 8 5 40
Productos f i* y i 4 *349 = 1396 7 * 407= 2849 10 * 465 =4650 6 * 523 = 3138 8 * 581 = 4648 5 * 639 = 3195 ∑fi*MC i = 19876
Resultando
Interpretación: el sueldo que se espera sea de cada empleado es de 496.9 dólares mensuales. Nota 1: La media para datos agrupados por intervalos es aproximada porque hay una ligera pérdida de información al construir la tabla de distribución de frecuencia y al ubicar las observaciones en los intervalos los valores pierde identidad y la marca de clase se supone que es la representación del intervalo. -
No se puede calcular la media aritmética para un conjunto de datos que tiene intervalos de clases abiertos en los extremos. Por ejemplo suponga que un conjunto
-
Sueldos soles Menos de 200 [200 – 400) [400 – 600) [600 – 800) [800 – 1000]
Empleados 25 35 60 40 20 180
Sueldos Menos de 400 [400 – 600) [600 – 800) [800 – 1000) [1000 y mas
Empleados 55 35 60 40 10 200
Sueldos soles [500 – 1000) [1000 – 1500) [1500 – 2000) mas de 2000
empleados 20 30 60 20 130
9
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
10
La mediana (Me)
Definición. La mediana es el valor Me que separa a la conjunto de datos ordenados (creciente o decreciente)
en dos partes de igual número de datos. La Me es el valor que corresponde al punto medio de los valores después de ordenarlos de menor a mayor o de mayor a menor. La mediana llamada algunas veces media posicionad porque queda exactamente en la mitad del conjunto de datos después que las observaciones se han colocado en serie ordenada. Significado Valor de la observación que ocupa la posición central de un conjunto de datos ordenados según su magnitud. Es el valor medio o la media aritmética de los valores medios. La mediana es un valor de la variable que deja por debajo de él un número de casos igual al que deja por arriba. Geométricamente la mediana es el valor de la variable que corresponde a la vertical que divide al histograma en dos áreas iguales. Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños con respecto a los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo, en esos casos es conveniente utilizar la mediana como medida d e tendencia central.
Interpretación: Sea { x 1 , x 2 , x 3 .. . ..x n } ordenados representemos en un segmento Los datos ordenados x (1 ), x (2 ), x(3 ) .. . . .. ..x (n-1 ) , x (n) La mitad de las observaciones estará por encima de la mediana, la otra mitad estará por debajo de ella. El 50% de observaciones es menor o igual a Me y el otro 50% es mayor que Me Cálculo de la mediana (Me) de datos no Agrupados
Sea el conjunto de observaciones x 1 , x 2 , x 3 .. . ..x n de la variable X - Se ordenan los datos en forma creciente Luego se ubica el valor central Me . ( es decir la posición de la Me) a. Si n es impar, la mediana es el dato ordenado del centro. Posición de la Me = ( ( n+1 ) /2)° lugar en conjunto b. Pero si n es par, la mediana es la semisuma de los dos valores ordenados centrales. Posición de Mediana esta entre dos valores centrales (n/2)° lugar y ( (n/2) +1)° lugar Ejemplo: Calcular la mediana para las siguientes serie correspondiente a cantidades vendidas de carne cuy en kg por 9 microempresarios. 120kg., 3kg, 14kg, 1kg, 99kg, 7kg, 30kg, 2,000kg, 16 kg. ordenamos la serie de los 9 datos es n= 9 numero impar observaciones ,
1, 3, 7, 14, 16, 30, 99, 120, 2000 Posición
1° 2° 3° 4°
5°
6° 7°
8° 9°
entonces la mediana es el valor de la observación que ocupa la posición central es decir: posición de la Me esta ((n +1)/2)° = ((9+1)/10)° = 5° lugar el valor que esta en 5° lugar es 16 la Me
= 16 kg la mediana es el quinto dato divide a la serie en dos grupos.
Interpretación: El 50 % de los microempresarios sus ventas de carne cuy es menor o igual a 16 kg y el otro 50% mayor que 16 kg. 10
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
11
Ejemplo 2: se tiene datos de producción de arroz en toneladas por 8 caseríos: 30tn, 77tn , 3tn, 300tn, 36tn, 11tn, 10000tn, 29tn ordenamos el conjunto de observaciones n = 8 es par, 3, 11, 29, 30, 36, 77, 300, 10000 Posición
1° 2° 3° 4° 5° 6° 7° 8° Posición de Mediana Me esta entre valor que ocupa la posición (n/2)° y ((n/2) +1)°=(8/2)° y ((8/2) + 1)°
Es decir 4° y 5° lugar Existen dos valores centrales. La mediana será la semisuma de los dos valores centrales. La Me esta entre 30 y 36, ya que este dividirá a los datos en dos grupos de 4 datos cada uno. Entonces mediana la semisuma de los dos valores centrales. Esto es, Me = (30 +36)/2 =33 toneladas Me = 33 toneladas Interpretación: el 50% de los caseríos de la muestra la producción de arroz es menor o igual a 33 toneladas. Nota = la mediana no depende de la magnitud de los datos. Depende sólo del número de ellos. Ejemplo; La edad de ingresantes del 2011 son los siguientes: 15, 16, 15, 17, y 18 años calcular la mediana y la media aritmética Ordenando 15, 15, 16, 17, 18 n=5 impar la mediana es valor que se pocisiona en (n+1)/2 posicion 3ª la mediana es Me = 16 interpretación 50% de los ingresantes sus edades el menor o igual a 16 años y la otra 50% es superior a 16 media aritmética 16,2 la edad que se espera tenga cada ingresante es de 16.2 años 15, 15, 16, 17, 55 me = 16
media aritmética =23.6
Características de la mediana
1. Es un promedio de posición no afectado por los valores extremos. 2. No está definida algebraicamente lo que es difícil su manejo o manipulaciones en procedimentos complejos 3. Cuando la localización del elemento central puede ser determinada y los límites de clase mediana son conocidos, la mediana para la distribución de frecuencias puede ser calculada por interpolación, no importando que ésta contenga intervalos abiertos, cerrados, iguales o diferentes. 4 La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de tendencia central. 5. Si se desea ubicar las condiciones de un elemento en una clase, la mediana resulta se indicada, ya que por comparación pone en evidencia si un elemento está en la mitad superior a ella o en la inferior.
11
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
12
CASO DATOS AGRUPADOS POR VALORES DIFERENTES
a- Calcular las frecuencias acumuladas
y aplicar el procedimiento anterior EJEMPLO Distribución de frecuencias de número de cajas de cerveza por pedido de clientes mayoristas en una distribuidora en año 2006 Numero de cajas Pedidos ni El procedimiento para calcular la mediana siguiendo la técnica 30 4 anterior n es par 32 2 Nos ayudamos con la frecuencia acumuladas n =30 34 2 36 1 n/2= 30/2= 15 mitad la mediana está en la simusuma de los 2 datos 38 1 centrales ( que se posiciona en 15° y 16°) 40 3 42 2 44 2 46 6 48 4 50 3 30 Numero de cajas 30 32 34 36 38 40 42 44 46 48 50
Pedidos ni 4 2 2 1 1 3 2 2 6 4 3
N 4 6 8 9 10 13 15 17 23 27 30
La mediana queda entre los valores que ocupa la posición 15° y 16° Luego la Me = (42 + 44)/2 = 43 cajas de cerveza por pedido Interpretación: los 30 pedidos analizados el 50 % de los ellos fueron menor 0 igual a 43 cajas de cerveza y la otra mitad más de 43 de cajas.
30
Calculo de Me Datos tabulados o agrupados por intervalos Si las observaciones de la variable se organizan en una distribución de frecuencias por intervalos, por tanto parte de la información ya no es identificable como resultado, no es posible determinar la mediana exacta. Sin embargo puede estimarse localizando la clase en la que se encuentra la mediana y realizando interpolaciones dentro de esa clase para obtener dicho valor. La mediana se estima por interpolación lineal a partir de la distribución de frecuencia acumuladas.
12
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
13
Para calcular la mediana el procedimiento consiste: a- Calcular las frecuencias acumuladas b- Ubicar la clase mediana será el intervalo de la variable cuya frecuencia acumulada es inmediatamente mayor a n/2 observaciones es decir n/2 < Fi
Ii =[ limite inferior Ii , limite superior Ii ] intervalo que contiene a la mediana Me para la cual se determinó las frecuencias acumuladas Fi y Fi-1
De modo que Fi-1 ≤ n/2 < Fi Me ε [Limite inferior de Ii, Limite superior Ii] intervalo de amplitud ai cuya frecuencia absoluta acumulada es Fi y la frecuencia absoluta es fi = Fi - Fi-1
La mediana
Me ε [limite inferior de Ii,límite superior Ii] luego Luego la Me se obtiene por interpolación lineal Graficando el intervalo de la clase mediana por interpolación lineal se tiene; si en la amplitud el intervalo Ii = ai se tiene
-- Fi - Fi-1 = fi observaciones
en amplitud Me - Li se tiene --- n/2 luego
Fi-1
Me = Li + ai * (n/2 - Fi-1) / f i
donde: Li = límite inferior del intervalo donde se ubica la Me ai = amplitud del intervalo de clase mediana I i n = tamaño de la muestra o número de observaciones fi = Frecuencia absoluta del intervalo de clase mediana (donde se encuentra la Me) Fi-1 = Frecuencia acumulada anterior a la clase mediana Ejemplo: Distribución de frecuencia de sueldos mensuales de 40 empleados de la empresa Tupac S. A. del año, 2006. Calcular la mediana e interpretar
Sueldos $ [320 – 378) [378 – 436) [436 – 494) [494 – 552) [552 – 610) [610 – 668] Total
Frecuencia absoluta f i 4 7 10 6 8 5 40
13
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
14
Para el cálculo de la Me Sueldos [320 – 378) [378 – 436) [436–494) [494 – 552) [552 – 610) [610 – 668]
Total
Frecuencia Frecuencia acumulada absoluta n i absoluta Fi 4 4 7 11 10 21 6 27 8 35 5 40
40
Ubicamos la clase mediana Calculamos las frecuencias acumuladas Como n/2=20 entonces la menor frecuencia absoluta acumulada que supera 20 es absoluta F 3 clase mediana ([436 –494>)intervalo que contenga la Me
Fi-1 ≤ n/2 < F i ----- 11< 20<21
es el tercer intervalo que contiene la Me es la clase mediana
Apliquemos interpolación lineal En la amplitud 494–436 =58 se tiene 21-11= 10 empleados Y en la amplitud b= Me-436 se tiene 40/2-11=9 empleados (Me-436)*10 = 58 *9 ----> 10Me-4360= 522 -10Me= 522+4360 luego la mediana estimada es Me = 488.2 $
Interpretación: el 50% de empleados de la muestra su sueldo es menor o igual a 488.2$ y la otra mitad su sueldo es mas de 488.2$. O el 50% de los salarios de los menor o igual a 488.2$ y la otra mitad es mayor que 488.2$ Puede aplicar directamente la formula. Nota: caso de que n/2 = F i en este caso la clase mediana es el intervalo Ii = [limite inferior - limite superior> la Mediana es igual al limite Inferior del intervalo I i Ventajas Mediana -La mediana solo depende del número de datos ordenados y no del valor de los datos -La mediana puede ser calculada para distribuciones de frecuencias con intervalos de diferente amplitud, siempre que se pueda determinar el límite inferior del intervalo de la mediana. -La mediana puede ser calculada para variables cualitativa con valores en escala ordinal. -La Mediana no es afectada por valores extremos Ejemplo Un investigador recibe las siguientes respuestas a un enunciado en una encuesta de evaluación: discrepa fuertemente, discrepa ligeramente, discrepa un poco concuerda, concuerda fuertemente. cual es la mediana de las 5 respuestas? 1 discrepa fuertemente 2 discrepa ligeramente 3 discrepa un poco 4 concuerda 5 concuerda fuertemente
Me = 3 discrepa un poco El 50% de observaciones discrepa un poco a fuertemente
14
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
15
Defectos de la media aritmética
La media depende de todos los valores observados en consecuencia es afectada o sesgada por valores extremos. Por ejemplo, la media aritmética de los grupos a) edades de ingresantes de la UNFV 15, 16, 17, 18, 19, 20 es igual X = 17,4 la Me=17,5 15, 16, 17, 18, 19, 45 es igual X = 22,4 Me=17,5 4, 16, 17, 18, 19, 20 es igual X = 15,6 Me=17,5 como se puede observar en este caso en lo dos últimos grupos la media aritmética es sesgada por valores extremos. En este caso una mejor medida es la Mediana. La Moda. Mo
Definición. La moda de un conjunto de observaciones es el valor Mo, que se define como el dato que más se repite. Es decir es el valor de un conjunto de datos que ocurre más frecuentemente, se considera como el valor más típico de una serie de datos. La moda no siempre existe y si existe no siempre es única La moda es una medida que se usa cuando se quiere señalar el valor mas común se una serie datos. Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia. Características de la Moda.
1. Representa más elementos que cualquier otro valor 2. La moda para una distribución de frecuencias de datos agrupados no puede ser calculada exactamente, el valor de la moda puede ser afectado por el método de agrupación de los intervalos de clase. 3. La moda no permite conocer la mayor parte de los datos 4. Algunas veces el azar interviene de manera importante y hace que un valor no representativo se repita frecuentemente. 5. Puede usarse para datos cuantitativos como cualitativos 6. La moda como estadístico, varía mucho de una muestra a otra 8. Cuando se tienen dos o más modas es difícil su interpretación 9. Tiene la ventaja de que los datos desproporcionados con respecto al resto no la distorsionan, pero no se presta para un tratamiento matemático. Ejemplo: datos no agrupados Calcular la moda para las siguientes serie correspondiente a cantidades vendidas de carne de cuy en kg. Por 9 microimpresarios, en una semana 20kg., 30kg, 14kg, 1kg, 9kg, 7kg, 30kg, 25kg, 16 kg. La Moda es Mo =s 30 Kg y este conjunto es unimodal Interpretamos : la cantidad mas frecuente vendida por los Microimpresarios en una semana de carne de cuy es de 30 kg Ejemplo 2: se tiene datos de producción de arroz en toneladas por 8 caseríos: 30tn, 77tn , 3tn, 300tn, 36tn, 11tn, 10000tn, 29tn no existe moda Mo 15
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
16
Calculo de la Moda para datos agrupados por valores diferentes: En este casi se determina fijándose en el valor de la variable que mas se repite (es decir la máxima frecuencia absoluta) Ejemplo: sea la distribución de frecuencia de numero de hijos por familia calcular la Moda e i nterpretar Numero de hijos
Numero de familias Frecuencia absoluta fi 1 4
0 1 2
7
3 4
6 2 23
La frecuencia absoluta máxima es 7 Por tanto el valor que mas se repite es 2
Mo = 2 hijos Interpretación : Las familias de la muestra el numero de hijos mas frecuente es de 2 hijos
Moda para datos tabulados por intervalos Para calcular la moda de n datos tabulados por intervalos se determina: 1- Se determina la clase modal. Esto es el intervalo que tiene la mayor frecuencia (clae modal), Luego se utiliza la formula
Mo = Li + ai( ∆ 1
)
∆1 + ∆2
Donde Li = es el limite inferior del intervalo o clase ∆1 = f i – fi-1 esto es ∆1 igual a la frecuencia de la clase modal menos la frecuencia de la clase modal inmediato anterior ∆2 = f i – fi +1 esto es ∆2 es igual a la frecuencia de la clase modal menos la frecuencia de la clase modal inmediatamente posterior. ai = es la amplitud del intervalo modal Esta formula de la moda solo se aplica en distribución con una sola frecuencia máxima Ejemplo: Se tiene la siguiente distribución de sueldos por empleado de una empresa. Calcular la moda e interprete Sueldos $ Frecuencia 1ero. Se ubica la absoluta f i clase modal [320 – 378 > 4 En este caso la frecuencia [378 – 436 > 7 Máxima n3 = 10 es decir Mo Є [436 - 494) [436–494 > 10 [494 – 552 > 6 Li = 436 [552 – 610 > 8 [610 – 668] 5 y ∆2 = f 3 – f4 =10 –6 ∆1 = f 3 – f2= 10 – 7 Total 40 a3 = 436 – 494 =58 16
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
17
Utilizando la formula Mo = Li + ai( ∆ 1 ) ∆1 + ∆2 Mo = 436 + 58 ( 10 - 7 ) = 436 + 58(3)/7 = 436 + 24.857 = 460.857 (10-7)+(10-6) Mo = 460.857 $ Interpretación : En la muestra los empleados de la empresa tienen su sueldo mas frecuente es de 460.86 $ Ventajas de la Mo -No se ve afectada por valores extremos -La moda se puede calcular en datos tabuladas con intervalos abiertos -Se da moda tanto para datos cualitativos como cuantitativos. Desventaja de la Mo Muy ha menudo no hay un valor modal en un conjunto de observaciones. Cuando el conjunto de observaciones contiene dos o tres o mas modas son difíciles de interpretar . ejercicio II 1- En una muestra por seguridad social revelo los siguientes pagos en soles 426,299,290,687,480,439 y 565 a) Cual es la mediana de los ingreso? b) Cuantas observaciones son inferiores a la mediana? Cuantas son superiores a la mediana? 2.- El numero de paros laborales en la industria automotriz en los meses seleccionados 6,0,10,14,8 y 0 a- Cual es la mediana del numero de paros? b- Cuantas observaciones son menores que la mediana? ¿Cuántas son mayores? c-Cual es el valor modal de los paros en el trabajo? 3-Un estudio económico muestra que el gasto en alimentos de una familia de cuatro personas es en promedio $218 mensuales, hallar la media del gasto diario en alimentos. Rp. $7.27$. 4- Las ventas de un distribuidor de automóviles en cierto periodo, ascendieron a la cantidad de 1,650,000 vendiendo 50 automóviles nuevos a un precio promedio de 13,000 y algunos carros usados con un precio de 5000 soles en promedio ¿Cuál es el promedio de los precios de todos los automóviles que se vendieron? Rp. 6,600soles. 5- En una empresa donde el sueldo medio es de 400 soles se incrementa un personal igual al 25% del ya existente con un sueldo medio igual al 60% de los antiguos. Si 3 meses mas tarde se incrementan cada sueldo en 20%, mas 30soles ¿Cuánto es el nuevo sueldo medio? Rp.471.6soles
17
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
18
Relación entre Media, mediana y Moda
1-
Si la distribución de frecuencia es simétrica entonces Media , la Mediana y la Moda tienen el mismo valor. Esto es
2- Si la distribución es asimétrica de cola a la derecha, es decir la distribución es mas alargada para valores grandes de la variable, entonces la Moda es menor que la Mediana y esta a su vez es menor que la Media es decir:
3- Si la distribución es asimétrica de cola a la izquierda, es decir la distribución es mas alargada para valores pequeños de la variable entonces, la Media es menor que la Mediana y esta su vez es menor que la Moda. De (2) y ( 3) se debe concluir que cuando la población tiene sesgo, la mediana es la mejor medida de la ubicación, puesto que siempre esta entre Mo y X media aritmética.
4- Si al distribución es moderadamente asimétrica y unimodal, se cumple aproximadamente la relación: Los tres medidas de tendencia central puede calcularse también para distribuciones de frecuencias con intervalos de diferente longitud, siempre que pueden determinarse o las marcas de clase ( para la media aritmética) o el limite inferior Li del intervalo (para la mediana y la moda) Uso de la 3 medidas de tendencia central 1La media aritmética se usa con mas frecuencia por su mejor tratamiento algebraico. Pero no siempre es una buena medida. 2Si la distribución de frecuencias es simétrica ( o casi simétrica) la media o la mediana o la moda es representativo, pues en este caso los tres promedios son iguales (o casi iguales) 3Si la distribución tiene marcada asimetría, entonces la mediana es la medida mas representativa. debido a que está siempre entre la media y la moda. La mediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores extremos como la media. 4La selección de la media, la mediana o la moda, depende de la aplicación. Por ejemplo, se habla del salario promedio (media); el precio mediano de una casa nueva puede ser una estadística más útil para personas que se mudan a un nuevo vecindario (si hay una o dos crestas que distorsionan la media). Y mientras que la familia promedio conste de 1,7 niños, tiene más sentido para los diseñadores de automóviles pensar en la familia modal, con dos niños. 18
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
19
Ejercicios V
1Ventas netas soles Menos de 200 [200 – 400) [400 – 600) [600 – 800) [800 – 1000]
Frecuencias 25 35 60 40 20 180
Las ventas netas de una muestra de pequeñas plantas de estampado se organizaron en la siguiente distribución de frecuencias ¿Cual es la mediana estimada de las ventas netas? Y cual es su media aritmética y su moda e interprete
RP : 500 soles
2-Los datos siguientes corresponden a valores de una tabla de frecuencia de 7 intervalos que muestra la distribución de las ventas semanales (en miles de soles) de la sucursal Cañete de una cadena de multitienda de mediana importancia. f7 =1 h5 = 0.14 F1 =3 h2 = 0.12 F4 = 39 H3 = 0.46 H6 = 0.98 Mc1 = 8.685 a = 0.16 a- Complete la tabla, bosqueje un histograma de frecuencia b- ¿Qué proporción de semanas se tiene ventas de al menos 9,100 soles c- ¿Cuáles son las ventas semanales media dela sucursal y su mediana 3-
4-
19
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
20
5-
6-Calcular la media aritmética e interprete de cada una de las tabla de Distribución de frecuencias Calificaciones Porcentaje de alumnos Edades Pacientes fi [5- 10 > 30 [0-3 > 35% [10 – 15 > 20 [3-5 > 16% [15 – 25 > 45 [5-8 > 42% [8-10 ] 7% [25 – 40 > 40 [40 – 50 > 30 { 50 – 65] 35
7- En la siguiente distribución de frecuencias de venta de carne de cerdo (redondeadas a mil kilos) de 60 microempresas. a) Calcular sus medidas de tendencia central e interpretar. b) Y el valor de ventas que esta en el cuarto superior. 8-
Mil kilos [5-10) [10-15) [15-20) [20-25) [25-30]
Numero de microempresas 5 15 20 15 5 60
20
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
21
Las cuantiles. Se ha definido la mediana Me como aquel valor de la variable que divide a la distribución en dos partes iguales. Siguiendo con esta idea podríamos plantearnos buscar valores de la variable que dividan la distribución en un determinado número de partes iguales. Se denomina cuantiles a los valores de la variable que dividen a la distribución de los datos en 2, 4, 10 o 100. . Las cuantilas de uso más frecuente son las: cuartilas, las decilas y las centilas o percentiles. En consonancia con la idea de cuantilas que se ha dado previamente, las definiciones concretas de cada una de ellas serían las siguientes: Cuartilas (Qi) : son tres valores de la variable que dividen la distribución en cuatro partes iguales, es decir, en cuatro intervalos dentro de cada cual están incluidos la cuarta parte de los valores u observaciones de la variable.
Sea el conjunto de observaciones : { x1 , x2 , ...........x n } para calcular la cuartilas ordenamos los xi y dividimos en cuatro partes. Se tiene gráficamente: el primer cuartil Q 1 , el segundo cuartil Q2 que es igual a la mediana Me y el tercer cuartil Q3
Decilas (Di) : son los nueve valores de la variable que dividen la distribución en diez partes iguales , es decir, en diez intervalos dentro de cada cual están incluidos la décima parte de los valores u observaciones de la variable.
Sea el conjunto de observaciones : { x1 , x2 , ...........x n } para calcular la Decilas ordenamos los xi y dividimos en diez partes. Se tiene : gráficamente. D 1 1er decil el 10% D 2 2do decil 20% D 3 3er decil 30% D 4 4to decil 40% D 5 5to decil 50% D 6 6to decil 60% D 7 7mo decil 70% D 8 8vo decil 80% D 9 9no decil 90%
Centilas (Ci)o percentiles : son los noventa y nueve valores de la variable que dividen la distribución en cien
partes iguales, es decir, en cien intervalos dentro de cada cual están incluidos la centésima parte de los valores u observaciones de la variable.
Sea el conjunto de observaciones : { x1 , x 2 , dividimos en cien partes.
...........x n } para calcular los percentiles ordenamos los xi y
21
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
22
gráficamente: el primer centil P1 , el segundo centil P2 que asi sucesivamente , el noventa ochoavo centil P 98 , el noventa y nueve avo centil P 99
El centil o percentil P 25 = Q1 , P 50 = Q2 y P75 = Q3 Calculo de los cuartiles Calculo para datos no agrupados
1. Se ordena los datos en forma Ascendente. 2. Se Localiza la posición de Q 1,Q2,Q3. Si la ubicación del cuartil es entero Q1 = (n+1 )°, Q2 = (2(n+1))° , Q3=(3 (n+1))° (*)
4
4
4
Entonces Q1 , Q2 , Q3 es igual a la observación particular correspondiente al punto de posición calculada de (*) Si la ubicación del cuartil no es entero, hacemos una interpolación lineal entre los dos valores correspondientes a las dos observaciones entre las cuales se encuentra la fracción
Qi =L j + (LJ+1 )* (Fracción) donde (i=1,2,3)
Ejemplo: Los siguientes datos representan tiempo en minutos de 12 estudiantes de llegar a su centro de estudio:
9’, 10’, 12’, 8’, 8’, 7’, 15’, 10’, 9’, 11’, 13’, 11’
Determinar el 1er, y 3er Cuartil. se tiene n = 12 ordenar los valores
Q1 Q2 Q3 7, 8, 8, 9, 9, 10, 10, 11, 11, 12, 13, 15 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12° Ubicar la posición de Q1 = ( n +1)° = (12+1)° = 13 = 3,25°. Esto significa que el valor de Q1 es el
4 4 4 tercer dato mas 25% de la diferencia entre los valores de las observaciones 3° y 4°. Así el valor de la 3° es 8 y el 4° es 9 entonces Q1 = LJ + (LJ+1 – LJ) (Fracción) = $8+(9-8)0.25 Q1 = 8.25 minutos Interpretación: el 25% de los estudiantes el tiempo en llegar a su centro de estudio es menor o igual 8.25 minutos y el otro 75% de estudiantes el tiempo en llegar a su centro de estudio es mayor 8.25 minutos. Calculo de Q3 Ubicación de Q 3 = 3(n+1) – 3(12+1)= 9.75° Datos.
4 4 Q3 = Qi =L j + (LJ+1 )* (Fracción) = 11+(12-11)(0.75) Q3 = 11.75 minutos 22
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
23
Interpretación: el 75% de estudiantes de los estudiantes el tiempo en llegar a su centro de estudio es menor o igual 11.75 minutos
PARA DATOS AGRUPADOS el
procedimiento para el cálculo de los cuartiles es similar a la mediana
es decir Calcular las Frecuencias acumuladas Localizar la clase cuartilica Será el intervalo Frecuencia acumulada es inmediatamente mayor a Q i = (i n/4) observaciones es decir i*n/4 < Fi (la primera Frec.Acumulada que supere a i*n/4) y luego por interpolación lineal y se llega a la formula (aplica directamente la formula:
Formula para calcular el Primer Cuartil Q1 ,, segundo cuartil Q2 , tercer cuartil Q3
Li = Es el Limite inferior de la clase que contiene al primer cuartil.o segundo cuartil o tercer cuartil n/4 = Localización del primer cuartil Q1, en la distribución de frecuencias 2n/4= Localización del segundo cuartil Q2 en la distribución de frecuencias 3n/4 =Localización del tercer cuartil Q3 en la distribución de frecuencias F i-1 = Es la frecuencia acumulada anterior a la clase que contiene a Q 1 o Q 2 o Q3 fi = Es la frecuencia de la clase que contiene a Q1 o Q 2 o Q3 ai =Es la amplitud de la clase en que se encuentre Q1 o Q 2 o Q3 Ejemplo 1 . Una muestra de las cantidades quincenales invertidas en el plan de participación de utilidades en la corporación Backus por parte de los empleados, se organiza en una distribución de frecuencias para su estudio. Clase Limites Frecuencia Frecuencia acumulada $ absoluta fi absoluta F i 1ª I1 [30 – 35 > 3 3 2ª I2 [35 – 40 > 7 10 3ª I3 [40 – 45 > 11 21 4ª I4 [45 – 50 > 22 43 Q1 5ª I 5 [50 – 55 > 40 83 Q2 6ª I 6 [55 – 60 > 24 107 Q3 7ª I 7 [60 – 65 > 9 116 8ª I8 [65 – 70] 4 120 ni = n = 120 ¿Cual es el 1er Cuartil, 2do Cuartil, 3er Cuartil e interprete
Determinar el Q 1?
1 localizar posición de Q1 = n/4 = 120/4 = 30° < F4 =43 el 1er cuartil se localiza en la cuarta clase 2. fi = 22 3. Fi-1 = 21 4. El limite inferior 45 =Li 23
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
5to.
24
a = 5 amplitud del intervalo cuartilico
Q1 = 45 +5 (30-21) /22 = 45 + 5*( 9/22) Q1 = 45 + 2.046 =47.045$ Interpretación.- Un cuarto (o 25%) de las aportaciones quincenales de los empleados es inferior o igual a $ 47.045 y los tres cuartos (o 75%) de las aportaciones quincenales de los empleados de la corporación Backus es superior a $47.045. Calculo Q3
1ero. Localizar la posicion de Q3 = 3n = 3(120) = 90° 4 4 el tercer cuartil esta ubicada en la 6ª clase 2do. fi = 24 3ero. F i-1 = 83 4to. Limite inferior de la clase tercer cuartil $55 5to ai = 5
Q3 Interpretación.- 75%
Q3 = 55 + 3(120)/4 –83) *5 = 55 + (90 –83) *5 = 24 24 =55 + (7/24) *5 =55+ 1.458333 Q3 = $56.46
de las aportaciones quincenales de los empleados de la corporación Backus es inferior o
igual a $56.46.. Calculo de los Deciles y Centiles o Percentile : los Deciles y percentiles se determina de manera
similar a los cuartiles . Asi cuando los datos no están tabulados 1ero de ordena las observaciones 2do se localiza la posición del valor correspondiente a la i( n +1)/10 observación ordenada. Entonces Para datos tabulados se sigue los mismo pasos Como los cuartiles Para obtener los valores de estas medidas se procederá Qi es el valor correspondiente a la frecuencia acumulada mayor o igual que (i n)/ 4, para i=1,2,3. Di es el valor correspondiente a la frecuencia acumulada mayor o igual que (i n)/1 0, para i=1,2,3,...9.
Ci es el valor correspondiente a la frecuencia acumulada mayor o igual que (i n)/10 0, para i=1,2,3,...,98,9 9. Generalizando para las cuantilas Si la distribución está agrupada o tabulada por intervalos entonces
la expresión general para determinar estas medidas, que es similar a la de la mediana, viene dada por: : para k=4 y r=1,2,3, tendremos las cuartilas para k=10 y r=1,2,3,......,9, tendremos las decilas para k=100 y r=1,2,3,...........,99 tendremos la centilas. Li =Limite inferior I i = limite inferior del intervalo donde se ubica el cuantil ai = amplitud del intervalo de clase I i n = tamaño de la muestra 24
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
25
fi = Frecuencia absoluta del intervalo de clase cuantil (donde se encuentra el cuantil correspondiente ) Fi-1 = Frecuencia acumulada anterior a la clase cuantil Ejemplo:
3-En el hospital Loayza 120 pacientes pagaron por su hospitalización por 3 días según tabla de distribución de frecuencias :
a) Calcular los pagos del 25% de los pacientes b) calcular los pagos del 25% superior de los pacientes. c) Cual es el mínimo pago del 60% de los pacientes. d) Calcular el pago que es superado por el 15% de los pacientes
Pagos en soles [130 –150> [150-170> [170-190> [190-210> [210-230> [230-250] Total
Para calcular 1- calcular las frecuencias acumuladas que nos permita hallarla clase cuantil Localizamos a) ( n)/4 = 120 )/4= 30 el valor esta en [150-170> b) (3 n)/4 = (3*120 )/4 = 90 el valor esta en [190-210> c) (60 n)/100 = (60* 120) /100= 72 el valor esta en [170-190> d) (85 n /100) =(85*120) / 100 =102 el valor esta en [210-230>
Frecuencia 20 25 38 15 12 10 120
aplicando la formula =
Para a) P25 = 150 + 20*(30 - 20) /2 5 = 158soles b) P75 = 190 + 20*(90 - 83) / 15 =199.3soles c)P60 = 170 + 20*(72 – 45) /38 = 184,21 Soles d)P85 = 210 + 20 *(102 – 98) /12 = 216.6 soles La media Geométrica Útil cuando la variable cambia a lo largo del tiempo, esto es, en el cálculo del promedio de tasas, razones, proporciones geométricas y relaciones de variables. Se utiliza en Matemáticas Financieras y Finanzas para promediar números índices, tasas de cambio, etc. La media geométrica se representa por “G” y se puede considerar:
Es la raiz enésima del producto de los n valores de una serie. Esto es, dado los n valores
x 1 , x2 , . . . xn Ejemplo: Los empleados reciben un aumento de sueldo de este año de 5% y recibirá un 15% el año próximo. Calcular el aumento porcentual promedio. Si utilizaríamos la media aritmética (5%+15%)/2 = 10% Lo cual no es cierto veamos calculemos la media Geométrica Para la cual un aumento de 5% significa de cada 100 soles 5 soles es el aumento es decir se recibe 105 entonces la tasa de aumento es 1.05 15% es decir de cada 105 soles el aumento es de 15.75 soles es decir recibirá 120.75 soles es decir la tasa de aumento es 1.15 25
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
26
G = \/1.05*1.15 = 1.09886 tasa promedio de aumento
Luego el aumento porcentual promedio es =0.09886=9.886% y no 10% De lo anterior suponga que Si el sueldo de Juan era de 2000 soles y recibió dos aumentos de 5% y 15% Aumento 1 = 2000 * 0.05 =100 Aumento 2 = 2100 * 0.15 =315 Total = 415 soles El aumento de sueldo es 415 soles esto equivale 2000 *0.09886 = 197.72 2197.72*0.09886 = 217.26659 414.9865 redondeando 415 soles otro ejemplo: Las ganancia obtenidas por la Cia Andina en cuatro proyectos recientes fueron. 3%, 2%, 4% y 6% ¿cuál es la media geométrica de la ganancia? ______ G = \/3*2*4*6 = 3.46% En general para simplificar la solución de la raíz n-ésima se obtiene utilizando logaritmos:
Log G = 1/n (log x1 + log x 2 + log x3 G = anti log(1/n (log x 1 + log x 2 + log x3 +. . . .+log xn ) )
+. . . .+log xn )
Ejemplo: En una empresa la producción ha experimentado un crecimiento del 25% del primer año al segundo año, del 40% del segundo al tercero a) determine la tasa promedio de crecimiento del primer año al tercer Soluc Porcentaje Producción tasas de variación 1er año 100 2do año 25% 100+0.25*100=125 125/100=1.25 3er año 40% 125+ 0.40*125= 175 175/125=1.40 _____ El Tasa promedio de aumento es G = \/1.25*1.4 = 1.3225 Por tanto la el porcentaje promedio de crecimiento es será 32.25%
Ejercicio III 1-Supóngase que durante cinco años de una Economía altamente inflacionaria, los bancos pagan tasas anuales de interés de 100, 200, 250,300 y 400 por ciento. Hallar la tasa de interés promedio anual de un deposito de $100. 2- Si una producción ha experimentado un crecimiento del 30% del primero al segundo año y un incremento del 35% del segundo al tercer año y un decrecimiento del 15% del tercer al cuarto año. a) Calcular la tasa promedio de crecimiento de los 3 últimos años 3- El crecimiento de la población estudiantil con respecto al semestre anterior fue como sigue: aumento 10% en el segundo, aumento 20% en el tercero y bajo 15% en el cuarto. Encuentre la promedio porcentual de crecimiento en los tres semestres Rp. 3.91% 4- En cuatro meses consecutivos los precios de un articulo fueron $500, $550, $440 y $462 respectivamente ¿es la tasa de variación promedio igual al –16.7% si no es así ¿cuánto es? 5-Si la producción de azúcar en 1991 bajo 20% con relación al año 1990 y si en 1992 aumento en 20% con respecto a 1991, calcule la tasa promedio del crecimiento de la producción Rp. G=0-9798% bajo 2% 26
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
27
Ejercicios V
1-Los ingresos netos de una muestra de grandes importadores de antigüedades se organizaron en la siguiente tabla Ingreso Numero de a) como se llama este tipo de tabla? neto $ importadores b) Evalué aproximadamente, la media aritmética, la [2 –6 > 1 mediana, y al moda, y cual es la relación de las mediadas calculadas que [6- 10 > 4 significa [10- 14 > 10 c) Cual es la interpretación. De las medidas de [14- 18 > 3 resumen calculadas [18- 22 2 2-Cuando se calcula la media de un distribución de frecuencias ¿Por qué se designa como media estimada o aproximada? 3- El sueldo medio de los obreros de una fábrica es de $286 a) ¿Qué porcentaje de hombres y mujeres trabajan en la fábrica si sus sueldos medios respectivos son $300 y $260? b) Si el 50% de los obreros tienen menos de 30 años y percibe el 20% del total de los sueldos ¿Cuánto es el sueldo medio de los obreros de al menos 30 años?, Rp a) 65% y 35% b) = 572$
4- Se tiene la siguiente información sobre la distribución de ventas (redondeado a miles de soles) de calzado en 90 días de una fabrica de calzado. Estime la media y la mediana. Indique la forma de la distribución. El Ventas Numero de días 2do décil e interprete. calcular la venta mínima del 30% de los días Miles se soles vendidos 14-36 > 8 [36-58 > 12 [58-80 > 16 [80-102 > 20 [102-124 > 24 [124-146] 10 5- Una firma comercial tiene fama de “pagar bien” a sus empleados, ya que un empleado afirma que paga en promedio S/. 500 mensuales. Sin embargo después se averiguó que la empresa solo tiene 10 empleados, 9 de los cuales ganan al mes 250 soles. y el jefe de ellos S/. 2750 ¿¡Paga bien la empresa?¿Porque? 6- Las ventas semanales en una muestra de tiendas de suministros electrónicos se organizaron en una distribución de frecuencias. El valor calculado para la media de las ventas semanales fue $ 105,900, la mediana fue $ 105 000 y la moda $104 500. a) Represente las ventas en forma de un polígono de frecuencia alisado. Observe la ubicación de la media, la mediana y la moda sobre el eje de las abscisas b) La distribución es simétrica o bien asimétrica positiva o negativa’ Explique su respuest a. 7- En una evaluación 5 alumnos tiene cada uno nota 12 y un alumno tiene 18. Si se indica como nota promedio 13, ¿qué nota promedio es??es el promedio adecuado?¿cuánto es el promedio adecuado? Rp: media, no Me = 12. 8- De las edades de cuatro personas se sabe que la media es igual a 24 años, la mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas.
27
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
28
9- En un informe que se supone es correcto sobre sueldos en todo el pais una empresa de estudios de mercados publica la siguiente tabla Clase A Clase B Clase C Clase E % de población 10% 25% 35% 30% Sueldos S/. 2500 S/. 1500 S/. 500 S/. 200 Y concluye diciendo que la “la media de los sueldos en todo el pais es S/. 1175”
a) ¿Que comentario le merece el informe? Si no esta de acuerdo, ¿Cuál seria la corrección? b) ¿Es la media en este caso el promedio representativo?, si no esta de acuerdo, ¿Cuánto es el promedio adecuado? Rp. A) la media correcta es 860 b) Mediana es 500 soles. 10- Los sueldos en una empresa varían de $300 a $800 distribuidos en forma simétrica en 5 intervalos de igual amplitud con el 15%, 20% y 30% de casos en el primer, segundo y tercer intervalo respectivamente. a) Calcule los diferentes indicadores de tendencia central b) Si se aplica un impuesto a los sueldos localizados en el cuarto superior ¿a partir de que sueldo se paga el impuesto? Rp. a)media = Mediana = Mo= 550 b) 6505 11-Se tiene una tabla de distribución de frecuencias relativa de los sueldos en dólares de empleados de una empresa Sueldos hi 60 – 100 0.16 100–140 0.2 140-180 0.4 180-220 0.14 220-260 0.1 a) calcule el porcentaje aproximado de empleados cuyos sueldos sea $100 a mas pero menos de $ 160 . b)Se plantean dos alternativas de aumento: La primera consiste en un aumento general de 50$. La segunda consiste en un aumento general del 35% del sueldo. Además una bonificación de 10$ ¿Cual de las dos propuestas conviene a los trabajadores si el interés es subir el promedio de los sueldos? Rp. a)40% b) la segunda 216.28$ 12-En una granja avícola se registra la siguiente tabla de distribución de pollos con respecto a sus pesos Se desea agrupar los pollos en 4 categoría con relación al peso de modo que: Peso (en grs) Nº de pollos Los 20% menos pesados sean de la categoría D [950-980> 60 Los 30% siguientes sean de la categoría C [980-1000> 120 Los 30% siguientes sean de la categoría B [1000-1020> 280 Los 20% mas pesados sean de la categoría A [1020-1040> 260 ¿Cuáles son los límites de peso entre las categorías A,B,C,D [1040-1060> 160 [1060-1080] 80 13- Una empresa decide hacer un reajuste entre sus empleados . La clasificación se lleva a cabo mediante la aplicación de un test que arroja las siguientes puntuaciones Puntuaciones Nº de empleados [0-30 > 94 [30-50 > 140 [50-70 > 150 [70-90 > 98 [90-100 ] 8 La planificación optima de la empresa exige que el 65% sean administrativos, el 20% jefes de sección, el 10% jefes de departamento y el 5% inspectores según sea la puntuación obtenida. Se pide calcular la puntuación máxima para ser administrativo, jefe de sección y jefa de departamento. 28
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS Introducción de la Estadística Lic. Filomena Chino Villegas
29
14-La distribución de frecuencias sobre notas de estudiantes de estadística presenta las frecuencias relativas h 3 y h5 borrosas. Se sabe que la media es 7.9 determine aproximadamente Notas [0.5-2.5> [2.5-4.5> [4.5-6.5> [6.5-8.5> [8.5-10.5> [10.5-12.5> [12.5-14.5> [14.5-a mas hi 0.02 0.10 ----0.16 ---0.10 0.02 0.00 a- La nota que es excedido por el 75% de las notas de los estudiantes b- La nota que supere a las notas de 75% de los estudiantes. c- RP. a-5.8 b-9.85 15-El jefe de control de calidad de una empresa ha clasificado un lote de 80 artículos con una distribución de 6 clases y con un intervalo de 5 unidades. Si las frecuencias correspondientes son: 6,12, 24, 18, 13 y 7, siendo la cuarta marca de clase igual a 35gr. Determinar la moda y la mediana de la distribución. 16-Se tiene una población dividida en dos grupos de diferentes tamaños, el primer grupo tiene un ingreso medio de 8000 soles y el segundo grupo tiene un ingreso medio de 4000 soles. a.- Si el ingreso medio total es de 5200 soles ¿qué porcentaje de la población esta en cada grupo? Rp 30% en el primer grupo y 70% en el segundo grupo. 17-
De una muestra de tamaño 3 se sabe que: c) La media aritmética es 7 d) La mediana es 6 e) X1 < X2 < X3 f) Determinar los valores de los datos muestrales X1, X2 , X3
18-En una sección de la asignatura de Macroeconomía la distribución de calificaciones de 50 alumnos resulto: Calificaciones Nº de estudiantes [0, , 4 > 2 [4, , 8 > 8 [8, , 12 > 20 [12,, 16 > 15 [16 , 20 > 5 Se desea agrupar a los estudiantes de esta sección en 3 categorías, tomando en cuenta las notas obtenidas. El 20% de los que tienen las peores notas estarán en la categoría de Deficientes; el 60% de los siguientes estarán en la categoría de Normales y el 20% de los que tienen las mejores notas estarán en la categoría de excelentes. ¿Cuáles son los limites de calificaciones entre las categorías? 19-Una empresa decide hacer un reajuste entre sus empleados. La clasificación se lleva a cabo mediante la aplicación de un test que arroja las siguientes puntuaciones Puntuaciones Empleados [0-30> 94 [30-50> 140 [50-70> 180 [70-90> 98 [90-100] 8 La planificación optima de la empresa exige que el 65% sean administrativos, el 20% jefes de sección, el 10% jefes de departamento y el 5% inspectores según sea la puntuación obtenida. Se pide calcular la puntuación máxima para ser administrativo, jefe de sección y jefe de departamento 20 -Un conjunto habitacional esta formada por 3 edificios de departamentos. Se tiene los siguientes datos respecto al consumo mensual de electricidad de cada uno de los edificios Edificio 1: Tiene 8 departamentos, la media es de S/. 85 Edifico 2: Tiene 9 departamentos cuyos consumos en soles son: 88, 92, 106, 110, 93, 102, 91, 94, 80 29