TRABAJO PRÁCTICO 1: ORGANIZACIÓN Y TABULACIÓN DE DATOS 1) A continuación, se algunos ejemplos de fichas. Determinar las posibles variables a analizar indicando si son cualitativas o cuantitativas y proponer una categorización posible para cada una de ellas (tener en cuenta que las categorías deben cumplir con las condiciones de exhaustividad y exclusión). a. Ficha de productos que elabora una fábrica: Nombre del producto: Cualitativa - exclusión
Tipo de envase: Cualitativa - exhaustividad exhaustividad
Peso por unidad: Cuantitativa - exhaustividad
Tiempo de procesamiento: Cuantitativa - exhaustividad
Costo por unidad: Cuantitativa - exhaustividad
Precio de venta por unidad: Cuantitativa - exclusión
b. Ficha del personal que entra a trabajar en una empresa: Nombre y apellido: Cualitativo - Exclusión
Edad: Cuantitativo - Exclusión
Estado Civil: Cualitativo - Exclusión
Estudios: Cualitativos - Exhaustivos
Sección en la que ingresa: Cualitativo - Exhaustivo
Sueldo básico: Cuantitativo - Exclusión
2) El gerente de una importante empresa de administración clasificó las especialidades de sus 64 miembros en Contabilidad (C), Mercadotecnia (M), Estadística (E) y Finanzas (F). Los datos son los siguientes: CFMCFCEMECMCEFCCMECMEFCEFCCFCCMM CECMFCMFCFCCFMCFCMMEEMFMCEEFCMEF a. Determinar cuál es la variable a analizar y si es cualitativa o cuantitativa. b. Especificar cuáles son las categorías para dicha variable c. Realizar la tabla de distribución de frecuencias con porcentajes. d. Construir los gráficos de barras y circular. e. Dar conclusiones. a.
La variable a analizar es especialidad y esta se clasifica en cualitativa ya que la misma expresa una cualidad de los miembros. b. La categoría para dicha variable es cualitativa nominal ya que los valores de la variable no pueden ser sometidos a un orden c.
Especialidades Contabilidad Mercadotecnia Finanzas Estadística Total:
F 23 15 14 12 64
fr 0,359 0,234 0,218 0,187 1
% 35,9% 23,4% 21,8% 18,7% 100%
d.
e.
Con la tabla y gráfico podemos concluir que, la especialidad de la empresa es la contabilidad .
3) El siguiente gráfico circular muestra los datos extraídos d e una encuesta 500 empresas de determinada ciudad. Se agregó el valor en grados de cada uno de los ángulos para reconstruir la tabla de frecuencias correspondiente.
Empresas Industria Transporte Comercio Bancos Construcción Servicios total
4)
F 120 100 80 75 75 50 500
fr 0,24 0,2 0,16 0,15 0,15 0,1 1
% 24% 20% 16% 15% 15% 10% 100%
La siguiente tabla muestra la cantidad de clientes que entran en el horario de 14 a 15 horas en 60 importantes locales de ventas de automóviles de cierta ciudad: 0 2 5 0 1 4 1 0 2 1 5 0 1 3 0 0 2 1 3 1 4 0 2 4 1 2 4 0 4 3 5 0 1 3 6 4 2 0 0 2 3 0 4 2 5 1 1 2 2 1 6 5 0 3 3 0 0 a. Determinar la variable a analizar e indicar cuál es su tipo. b. Construir una distribución de frecuencias absolutas y representarla mediante un diagrama de barras. c. Construir una distribución de frecuencias relativas y porcentuales e interpretar el significado de la cuarta frecuencia. d. Si en el 8(P/o o más de los locales entran como máximo 4 personas, se decidirá no atender al público en horario (de 14 a 15 horas) y comenzar a atender a partir de las 15 horas. En base a los datos, ¿qué decisión se tomará? Justificar. La variable a analizar es clientes y es de tipo cuantitativa discreta ya que presenta separaciones o interrupciones de valores que puede tomar Clientes F fr % 0 15 0,25 25% 1 12 0,2 20% 2 11 0,183 18,3% 4 8 0,116 11,6% 3 7 0,133 13,3% a.
1 2 4
5 6 total
5 2 60
0,083 0,033 1
9,3% 3,3% 100%
b. c. Mi cuarta frecuencia, es 8 y representa al número de clientes que visitan un local de
14:00 a 15:00 hs, en este caso 4. Esto puede interpretarse como que, al horario de 14:00 y 15:00hs algunos de los 60 locales son visitados por 4 clientes d. Si en los locales entran como máximo 4 personas en los horarios de 14:00 a 15:00hs como a los dueños no les parece conveniente, tomarán la decisión de cerrar los locales que tengan 4 o menos clientes en dicho horario, y atenderán después de las 15:00hs. 5) A fin de decidir cuántos mostradores de servicio necesitarán en tiendas que construidas en el futuro, una cadena de supermercados quiso obtener información acerca del tiempo (en minutos) requerido para atender a los clientes. Se registró la duración de 60 casos: 3,6 1,9 2,1 0,3 0,8 0,2 1,0 1,4 1,8 1,6 1,1 1,8 0,3 1,1 0,5 1,2 0,6 1,1 0,8 1,7 1,4 0,2 1,3 3,1 0,4 2,3 1,8 4,5 0,9 0,7 0,6 2,8 2,5 1,1 0,4 1,2 0,4 1,3 0,8 1,3 1,1 1,2 0,8 1,0 0,9 0,7 3,1 1,7 1,1 2,2 1,6 1,9 5,2 0,5 1,8 0,3 1,1 0,6 0,7 0,6 a. ¿Cuál es la variable a analizar? ¿Es cuantitativa o cualitativa? b. Organizarlos de la manera que le resulte más conveniente (de forma discreta o en intervalos) y justificar la organización elegida. c. Construir una distribución de frecuencias absolutas, relativas y acumuladas.
d. Representar gráficamente las frecuencias anteriores. e. Interpretar en cada caso el significado de la cuarta frecuencia. f. ¿Qué proporción de los tiempos de servicio es menor a un minuto? La variable a analizar es el tiempo que tardan en atender a los clientes y es de tipo cuantitativa continua ya que la misma puede adquirir valores dentro de un intervalo especificado b. [0,2 – 1,2),[1,2 – 2,2),[2,2 – 3,2),[3,2 – 4,2),[4,2 – 5,2)[5,2 – 6,2]. Elegí organizarlos de manera en intervalos por que las variables discretas no comprenden valores intermedios como los dados en la tabla. a.
c.
Tiempo [0,2 - 1,2) [1,2 – 2,2) [2,2 – 3,2) [3,2 – 4,2) [4,2 – 5,2) [5,2 – 6,2] Total
F 32 19 6 1 1 1 60
Fr 0,533 0,316 0,1 0,016 0,016 0,016 1
Fa 32 51 57 58 59 60 60
d.
e. f.
La cuarta frecuencia, que comprende de 3.2 a 4.2 minutos sugiere que son excepcionales los casos en que la atención al cliente dure dicho período La proporción de los tiempos de servicio menor a un minuto es de 27,7%.
6) Una empresa consultora ha entrevistado un grupo de 50 personas a las cuales les han preguntado la edad. Se obtuvieron los siguientes datos: 23 34 21 41 42 35 32 36 27 20 19 31 39 38 41 26 24 27 30 33 32 40 34 25 28 29 30 22 24 23 26 36 38 21 39 22 33 35 32 28 27 26 24 32 37 39 32 24 35 26 Se ha decidido organizar los datos en intervalos de tal manera que las marcas de clase de los mismos sean: 20, 24, 28, etc. a. Construir una distribución de frecuencias absolutas, porcentuales y acumuladas, b. Representar gráficamente. c. Obtener conclusiones. a.
Edades [19 - 21) [21 - 23) [23 - 25) [25 - 27) [27 29)
F 2 4 6 5 5
fr 0,04 0,08 0,12 0,1 0,1
% 4% 8% 12% 10% 10%
Fa 2 6 12 17 22
[29 - 31) [31 – 33) [33 – 35) [35 – 37) [37 – 39) [39 – 41) [41 – 43] Total
3 6 4 5 3 4 3 50
0,06 0,12 0,08 0,1 0,06 0,08 0,06 1
6% 12% 8% 10% 6% 8% 6% 100%
b. c. Podríamos concluir que en la zona en la que se realizó la encuesta suelen circular más
personas pertenecientes al grupo de edades (21~37) o que las personas pertenecientes al grupo (21~37) de edades es más abierta a participar en encuestas 7) A continuación, se presenta un polígono de frecuencias absolutas correspondiente a los tiempos de demora (en minutos en atención al público para 60 trámites: a. ¿Cuál es la variable? ¿Cuál es el tipo?
25 31 35 40 43 47 50 50
b. c. d. e.
Construir una distribución de frecuencias absolutas y acumuladas ¿Cuántos trámites tienen un tiempo de demora inferior a 4 minutos? ¿Qué porcentaje de trámites tiene un tiempo de demora superior o igual a 8 minutos? ¿Cuánto tiempo de demora hubo para los primeros 40 trámites? a. La variable es el tiempo de demora y es de tipo cuantitativa continua ya que la misma puede adquirir valores comprendidos entre un número y otro. b. Tiempo [0 – 2) [2 – 4) [4 – 6) [6 – 8) [8 – 10) [10 – 12) [12 – 14] Total
F 0 5 10 15 20 10 0 60
Fa 0 5 15 30 50 60 60 60
c. Los trámites que tienen un tiempo de demora inferior a 4 minutos son 5. d. Los trámites que tienen un tiempo de demora superior o igual a 8 minutos es el 50%. e.
Para los primeros 40 trámites hubo un tiempo de demora aproximado de 18 minutos.
8) Los datos que se presentan a continuación fueron extraídos del Informe Regional 2006 del "Observatorio Pyme Regional del Centro de la Provincia de Buenos Aires". Industria Manufacturera. Año 2006. La encuesta fue realizada a empresarios que desarrollan actividades industriales dentro de la región. La región Centro de la Provincia de Buenos Aires está integrada por los siguientes 10 partidos: Adolfo González Chávez, Ayacucho, Azul, Benito Juárez, Lobería, Necochea, Olavarría, Rauch, San Cayetano y Tandil. El universo tomado como punto de partida para esta encuesta fue el de los locales contactados, dentro de la región, en la primera etapa del Censo Nacional Económico de 2005 y clasificados como industriales.
Partido Total Centro de la Prov. de Bs. As. Adolfo González Chaves A acucho Azul Benito Juárez
Cantidad 1562 53 71 173 53
Lobería 68 Necochea 302 Olavarría 331 Rauch 51 San Ca etano 31 Tandil 429 a. ¿Cuál es la variable que se analizó? ¿Cuál es el tipo de la misma? b. ¿Cuáles son las categorías? c. Calcular las frecuencias relativas y porcentajes y describir los datos en base a las mismas. d. Realizar un gráfico. a. La variable que se analizó fueron los partidos dentro de la región que realizan actividades industriales. b. La variable es de tipo cualitativa ordinal ya que esta puede tomar valores ordenados (En este caso alfabéticamente ( A, B , … L, etc.) c.
Partido Adolfo González Chaves A acucho Azul Benito Juárez Lobería Necochea Olavarría Rauch San Ca etano Tandil Total:
F 53 71 173 53 68 302 331 51 31 429 1562
fr 0,033 0,045 0,110 0,033 0,043 0,193 0,211 0,032 0,019 0,274 1
% 3,3% 4,5% 11% 3,3% 4,3% 19,3% 21,1% 3,2% 1,9% 27,4% 100%
d.
TRABAJO PRÁCTICO 2: INDICADORES DE POSICIÓN Y DISPERSIÓN 1) A continuación, se dan las edades en años de los automóviles con que trabajó una empresa transportista la última semana: 5, 6, 3, 6, 11, 7, 9, 10, 2, 4, 10, 6, 2, 1, 1, 5 Calcular las medidas de tendencia central y las de dispersión posible e interpretarlos. 1.
Edad 1 2 3 4 5 6 7 9 10 11 Total
F 6 2 1 1 2 3 1 1 2 1 20
Fa 6 8 9 10 12 15 16 17 19 20
X*F 6 4 3 4 10 18 7 9 20 11 92
(X-X)^2 0,648 0,338 0,128 0,018 0,008 0,098 0,12 0,968 1,458 2,048
((X-X)^2)*F 3,888 0,676 0,128 0,018 0,016 0,294 0,12 0,968 2,916 2,048 11,072
Promedio = 92/20 Promedio = 4,6 años Me = 4 años. Mo = 1 año. R = 11 – 1 R = 10 Varianza =
2) Calcular todas las medidas de tendencia central y de dispersión para el Ejercicio 4 del Práctico 1 e interpretar cada uno de ellos. A partir de los indicadores calculados responder las siguientes preguntas indicando con qué indicador obtuvo la respuesta. a. ¿Cuál es la cantidad promedio de clientes que entran? b. En la mitad de los locales entran ¿.....? clientes como máximo. c. El 103/0 de los locales con mayor cantidad de clientes, tienen ¿.....? como mínimo. d. ¿Cuál es la cantidad de clientes que más se repite? e. ¿El promedio de la cantidad de clientes por local es representativo del conjunto de datos? Justificar. 3) Calcular todas las medidas de tendencia central y de dispersión para el Ejercicio 5 del Práctico 1 e interpretar cada uno de ellos. Los cálculos deben realizarse para los datos sin agrupar. A partir de los indicadores calculados responder las siguientes preguntas indicando con qué indicador obtuvo la respuesta. a. ¿Cuál es el promedio de atención al cliente?
4)
b. El 5(P/o de los casos con menores tiempos de atención, requieren ¿. ... . ..? minutos como máximo para atendidos. c. El 5(P/o central de los casos atendidos entre ¿.......? minutos (como mínimo) y ¿ ? minutos (como máximo). d. El 250/0 de los casos que requieren mayor tiempo de atención, atendidos en un tiempo mayor o igual a ¿.......? minutos. e. El 40)/o de los casos con menores tiempos de atención, s on atendidos en un tiempo mayor o igual a ¿.......? minutos y menor o igual a ¿ ..... ..? minutos. f. ¿Cuál es la desviación de los tiempos? ¿Qué indica? g. ¿El promedio es representativo del conjunto de datos? h. En base a los gráficos y a los indicadores calculados en los incisos anteriores, brindar conclusiones generales sobre los datos. i. Responder los teniendo en cuenta los datos agrupados. ¿Existen diferencias con los cálculos realizados para los datos sin agrupar? ¿Qué cálculo es el más exacto? Justificar. El siguiente cuadro muestra la distribución de ingresos de obreros en la ciudad A: Cantidad de obreros
Fa ↑
menos de 500
10
10
500 < 1000
40
50
1000 x < 2000
50
100
2000 x < 2500
30
130
2500 0 más
20
150
Ingresos
a. b. c. d.
5)
Graficar la distribución de los ingresos. ¿Con qué indicador de posición podría Representarla? Hallar y justificar. Ídem para la dispersión. Entre los intervalos presentados para la variable Ingreso, dos de ellos son intervalos abiertos. ¿Cuáles son? ¿Cuáles son las ventajas y desventajas de trabajar con intervalos de este tipo?
La siguiente tabla muestra distintas de interés, en las últimas 5 semanas, de tres financieras diferentes (A, B y C). Si se busca aquélla en la cual la tasa de interés fluctúe lo menos posible, ¿qué financiera elegiría Semana 1 2 3 4 5
A 0,05 0,12 0,60 0,55 0,25
Financiera B 0,35 0,24 0,12 0,65 0,39
C 0,05 0,08 0,09 0,15 0,01
6) En una ciudad existen 3 grandes plantas de fabricación de automóviles: A, B y C, cada una con 50 empleados. En cada de estas plantas se registró el salario de cada uno de los empleados. En la tabla siguiente, se muestran los valores de las medidas en tendencia central y dispersión calculados para cada conjunto de datos:
A B C
Media
Mediana
$ 550 $ 1200 $ 1300
$ 510 $1000 $600
Valor min. Valor Max. $ 500 $ 2500 $ 500 $ 2500 $ 500 $ 2500
Desv. estandar $ 280 $ 500 $ 900
N 50 50 50
a. Realizar un polígono de frecuencias aproximado para los ingresos en cada una de las pantas de automóviles. Compararlos y sacar conclusiones. b. Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te aseguran que vas a estar entre el 50% de los que menos cobran ¿En qué planta elegirías trabajar y por qué? c. Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te aseguran que vas a estar entre el 25% de los que más cobran ¿en qué planta elegirías trabajar y por qué? d. ¿En cuál de las 3 plantas se observa una menor variabilidad de salarios (con respecto a la media)? Justificar e. ¿En cuál o cuáles de las 3 plantas de fabricación de automóviles el salario promedio no es representativo de los salarios de los 50 empleados? En ese caso, ¿con que indicadores resumirías la información? Justificar.