Universidad ESAN CURSO:
PROFESOR:
Análisis de Datos
TOMÁS MINAURO LA TORRE
Pregunta 1
El Señor Juan Guerrero ha sido nombrado recientemente director de mercadotecnia de nuevos productos de la empresa IC!SUR" !ctualmen !ctualmente te est# considerando la posibilidad posibilidad de comerciali$ar comerciali$ar un nuevo producto altamente altamente nutritivo a base de %i&icha" Este producto podr'a ser usado como como un canap() un producto para d'as de campo o como un elemento diet(tico" *ebido a esta amplia +ama de usos posibles) la compañ'a ten'a una +ran di,icultad para de,inir el mercado" El producto era visuali$ado sin tener competidores directos" -as pruebas de mercado . las primeras ventas del producto ,ueron mu. alentadoras" Estos primeros resultados resultados condu/eron al señor Guerrero a pensar 0ue el producto pod'a vender ,#cilmente dos millones de ca/as 123 pa0uetes en cada ca/a4 ba/o el pro+rama propuesto de mercadotecnia 0ue implicaba un precio de 5 6"23 por pa0uete . un pro+rama de publicidad 0ue implicaba 57 millones en +astos por año" *ebido a 0ue e8ist'a e8ist'a +ran incertidumbre entre entre la administraci9n administraci9n de IC!SUR en cuanto a las ventas del primer año . los años subsecuentes) o en cuanto a la me/or campaña introductoria) se decidi9 0ue se llevar'a a cabo otra prueba de mercado de seis meses" -os ob/etivos de la prueba ,ueron: ♦
Estimar me/or las ventas del primer año"
♦
Estudiar ciertas variables de mercadotecnia para determinar un plan de introducci9n 9ptimo o por lo menos me/or"
♦
Estimar el potencial del producto a lar+o pla$o"
-as tres variables incluidas en el diseño e8perimental ,ueron el precio) los +astos de publicidad . la locali$aci9n del producto en de la tienda" Se probaron tres precios 123) 2) 73 centavos4) dos niveles de publicidad 1una simulaci9n simulaci9n de un plan de introducci9n de 57 millones 164 . otra de 5; millones 1<44) . dos locali$aciones locali$aciones 1colocar el producto en la secci9n de pan 164 versus la secci9n de desa.unos instant#neos instant#neos 1<44" -os precios . la ubicaci9n ,ueron variados a lo lar+o de las tiendas dentro de cuatro ciudades" -os datos ,ueron anali$ados sobre una base bimestral" -a medida de respuestas usada en el an#lisis ,ue el promedio de ventas unitarias por mes" -a in,ormaci9n recolectada se muestra en el libro de E8cel" a.La a. La correlación correlación entre el precio y las ventas es grande y negativa para los tres períodos de tiempo. ¿Qué le indica esto acerca de la forma como funciona el precio? b.Epli!ue la correlación entre la publicidad y las ventas. ¿Qué le est" sucediendo a la publicid publicidad ad a lo largo largo del tiempo? tiempo? c.#ote !ue las correlaciones entre la publicidad y el precio casi no eiste. ¿Por !ué? d.$orra regresiones para cada una de las tres variables de ventas %&1' &( y &)* usando P' + y L como variables independientes. ¿Qué implican estas regresiones acerca del efecto de precio? ¿,e la publicidad? ¿,e la locali-ación? e.aga una regresión !ue incluya las variables / y 0. ¿$ambian sus uicios acerca de los efectos de precio' de la publicidad y de la locali-ación? ¿Por !ué? f. 0erifi! 0erifi!ue ue los residuo residuos s para para identific identificar ar observa observacion ciones es !ue no se austan al modelo. modelo. ¿Por !ué no se austan? g.¿Qué corridas de regresión adicionales' debe 2acerse para completar el an"lisis de estos datos? 2.aga un resumen eecutivo de todas sus conclusiones.
Pregunta (
El señor Fred G" =ire es el +erente de recursos humanos del Centro >(dico St" -u?e" Como parte de su reporte anual al presidente de dicha instituci9n se le pidi9 presentar un an#lisis de los empleados a sueldo" *ebido a 0ue ha. m#s de < 666 traba/adores) no tiene el personal para reunir in,ormaci9n respecto a cada uno de los empleados en cuesti9n) as' 0ue selecciona una muestra aleatoria de 76" Por cada traba/ador re+istra el pa+o laboral mensual) los meses de servicio en St" -u?e) el se8o 1< @ masculino) 6 @ ,emenino4) . si el empleado tiene un puesto t(cnico o de o,icina" -os 0ue hacen traba/os t(cnicos se codi,ican como <) . los 0ue reali$an actividades de escritorio) como 6" -os datos los encontrar# en el ,ile de E8cel" a* ,etermine la ecuación de regresión usando el sueldo como la variable dependiente' y las otras cuatro variables como variables independientes. b* ¿$u"l es el valor de 3 ( ? $omente respecto a este valor. c* 3ealice una prueba global de 2ipótesis para determinar si algunas de las variables independientes son diferentes de cero. d* 3ealice una prueba individual para determinar si se puede eliminar alguna de las variables independientes. e* 0uelva a establecer la ecuación de regresión utili-ando sólo las variables independientes significativas. ¿$u"nto m"s gana al mes el 2ombre !ue la muer? ¿ay alguna diferencia si el empleado tiene un puesto técnico o uno de oficina?
Pregunta )
Una compañ'a 0ue vende hard&are al por ma.or surte pedidos en un e8tenso almac(n" El volumen de los pedidos ,luctAa sustancialmente de un d'a a otro . la compañ'a tiene como pol'tica surtir cada pedido el d'a de su recepci9n" -as 9rdenes se reciben por tel(,ono . por correo alrededor de las <6 a"m" El supervisor del almac(n estima el tiempo correspondiente a cada orden . asi+na el nAmero necesario de traba/adores para atenderlas" -os traba/adores restantes) si los ha.) son asi+nados a otras tareas . no pueden ser llamados hasta el d'a si+uiente" Frecuentemente) las estimaciones del tiempo por pedido 0ue hace el supervisor suelen ser err9neas) de modo 0ue en ocasiones al+unos traba/adores est#n ociosos . en otras se les deben pa+ar horas e8tra" Se reali$a un estudio de re+resi9n para tratar de me/orar la predicci9n del tiempo correspondiente a cada pedido" -a mini computadora 0ue se utili$a para procesar los pedidos . llevar el control de inventarios puede calcular con mucha ,acilidad los tiempos previstos) una ve$ determinado el modelo" -os art'culos se clasi,ican de acuerdo con la ,recuencia con 0ue se piden como ,recuentes) moderados . poco comunes" -os art'culos poco comunes est#n almacenados en las partes m#s distantes del almac(n .) por lo tanto) se re0uiere de un ma.or tiempo para traerlos" Se piensa 0ue el nAmero de art'culos pedidos de cada cate+or'a . el tamaño promedio por art'culo in,lu.en en el tiempo necesario para surtir el pedido" -a ma.or'a de los art'culos se piden por pa0uetes) surti(ndose los restantes como art'culos de Bca/a sueltaB 10ue en su ma.or'a son poco comunes4" Ciertos pedidos re0uieren empa0ues especiales para prote+er art'culos 0ue son ,r#+iles" El supervisor asi+na cada orden de este tipo a uno de dos puestos para empa0uetado) ! o " Dodos los art'culos se empa0uetan en una estaci9n central . se colocan en contenedores de madera" Para mover los contenedores a los camiones de reparto se utili$a un montacar+as de hor0uilla" Se selecciona una muestra de ;6 pedidos se tiene cuidado de incluir 9rdenes de compra de tipos relativamente e8tremos 1pe0ueños . +randes) inte+rados principalmente por pa0uetes . por ca/as sueltas) por art'culos ,recuentes . por art'culos poco comunes4" Se re+istran los valores correspondientes a las si+uientes variables: TIME:
Diempo necesario para surtir el pedido 1en minutostraba/ador4
NUMFREQ:
Amero de art'culos ,recuentes en el pedido
NUMMOD:
Amero de art'culos moderados en el pedido
NUMRARE:
Amero de art'culos poco comunes en el pedido
NUMLOOSE:
Amero de art'culos de ca/a suelta
AVSZCAR:
Damaño medio de los pa0uetes 1pa0uetesart'culo4
AVSZLB:
Damaño medio de los art'culos de ca/a suelta 1pie$asart'culo4
SPECIALS:
6 si no se re0uiere de un empa0uetado especial < si se empa0uet9 en el puesto ! 2 si se empa0uet9 en el puesto Amero re0uerido de contenedores
SKIDS:
El supervisor piensa 0ue las variables de predicci9n m#s importantes son las 0ue comien$an con el pre,i/o NUM, pues +ran parte del tiempo dedicado a surtir un pedido se utili$a para 0ue los traba/adores se desplacen al lu+ar apropiado" o obstante) este tiempo de traslado no parece ser proporcional al nAmero de art'culos) pues un traba/ador puede combinar art'culos 0ue se encuentran en la misma #rea del almac(n" El nAmero de pie$as de cada art'culo tambi(n es relevante) pues se re0uiere de al+An tiempo para tomarlas del estante" Se espera 0ue este tiempo sea proporcional a AVSZ. Dambi(n se espera 0ue el tiempo destinado a trasladar los contenedores sea proporcional a SKIDS. Con los datos 0ue encontrar# en el ,ile de E8cel":
a) Epli!ue por !ué la variable &PE$/+L& se debería registrar como dos variables4 &PE$/+L+ 5 1 si el empa!uetado especial se reali-a en el puesto +' 6 si no. &PE$/+L7 5 1 si el empa!uetado especial se reali-a en el puesto 7' 6 si no. b* Epli!ue la interpretación de los coeficientes de estas dos variables. c* ,e acuerdo con la información dada' ¿!ué variables independientes deberían considerarse en el meor modelo de regresión? d* ¿ay alg8n indicio de valores atípicos? e* ¿ay alg8n indicio de !ue la varian-a no es constante?
f) ¿ay alg8n indicio de auto correlación? ¿&e debería esperar auto correlación en este estudio? Pregunta 4
-a Compañ'a >ountain States Potato es una empresa procesadora de papas situada en el este de Idaho" Un producto secundario del proceso) conocido como pastel de ,iltro) ha sido vendido a los +ran/eros como alimento para el +anado" Recientemente) uno de los +ran/eros se 0ue/9 de 0ue el +anado no estaba +anando peso . cre'a 0ue el problema era el pastel de ,iltro 0ue hab'an ad0uirido de esta Compañ'a" Inicialmente) todo lo 0ue se sab'a del sistema del pastel de ,iltro era 0ue los re+istros hist9ricos mostraban 0ue en años anteriores la cantidad de s9lidos era de apro8imadamente <<";H" En a0uel momento) los s9lidos se encontraban entre . H Se hicieron varias adiciones ala planta durante los años intermedios . se increment9 si+ni,icativamente el volumen de a+ua . de s9lidos) as' como la temperatura del clari,icador" -o 0ue realmente estaba a,ectando a los s9lidos era un misterio) pero como la planta necesitaba deshacerse de sus desperdicios s9lidos para poder ,uncionar) ten'a 0ue hacerse al+o . r#pido" -a Anica soluci9n pr#ctica consist'a en determinar al+una manera de 0ue el contenido de s9lidos re+resara a sus niveles ori+inales" ! los individuos implicados en el proceso se les pidi9 0ue identi,icaran variables 0ue pudieran ser manipuladas . 0ue) a su ve$) pudieran estar a,ectando el contenido de los s9lidos" Esta revisi9n dio como resultado seis variables 0ue podr'an a,ectar el contenido de s9lidos" -as variables son:
SO-I*S P=
Porcenta/e de s9lidos en el pastel de ,iltro" !cide$" Esto indica la acci9n bacteriana en el clari,icador" A medida 0ue pro+resa esta acci9n) se producen #cidos or+#nicos 0ue pueden ser medidos utili$ando el p=" Esto se controla durante los tiempos de receso del sistema"
-OER
Presi9n de l'nea de vac'o 0ue se encuentra deba/o de la l'nea de ,luido en el tambor +iratorio" Presi9n de l'nea de vac'o 0ue se encuentra arriba de la l'nea de ,luido en el tambor +iratorio" Grueso del pastel medido en el tambor"
UPPER D=IC%
K!RI*RIK
Estructura utili$ada para controlar la velocidad del tambor" Puede ser di,erente de *RU>SP* debido a de,iciencias mec#nicas" *RU>SP* Kelocidad a la cual estaba +irando el tambor cu#ndo se reco+i9 el pastel de ,iltro" >edida con un cron9metro" -os datos obtenidos al monitorear el proceso en varias ocasiones diariamente durante 26 d'as se presentan en el ,ile de e8cel ,esarrolle un modelo de regresión para predecir el porcentae de sólidos. Escriba un resumen eecutivo al presidente de la $ompa9ía :ountain &tates Potatos. Pregunta ;
-os datos de la tabla si+uiente) contienen el volumen de producci9n de arro$ entre los años <L . 2667) en miles de toneladas) de una re+i9n del pa's" Drimestre !ño < 2666 266< 2662 2667 2663 Dotal a.
I 23"23 72L"<< 77L"6; 7L"6L 3;"3 332"7; 227"7
II 7<"; 7<6"63 73"M 32M"
III 7<<"66 72"3; 32L"L 36L"<6 ;6M"27 3L";M 23;"<7
IK 73;"77 7<7"7 32"7 3M"76 ;2"3M ;L7"; 2L<2"L
Dotal <2M6"; <2L"6 <;L"<
b. Epli!ue estos índices' !ué factores son los !ue podrían eplicar esta componente de la serie de tiempo. c.
,etermine a2ora la línea de tendencia.
d. Epli!ue a !ue factores se les puede atribuir esta componente y finalmente' e.
Pronosti!ue la producción para los cuatro trimestres de este a9o utili-ando el modelo multiplicativo.
f.
¿Est" de acuerdo con las predicciones del modelo? ¿Es un modelo adecuado para pronosticar esta serie? aga un breve comentario al respecto.
Pregunta =
!merican !utos S"!" ha estado operando en nuestra ciudad durante los Altimos cinco años" En ese tiempo) la venta de autos de su modelo econ9mico ha crecido desde <3 unidades el 2666 hasta los < en el 2663" Juan Castro) propietario del ne+ocio desea reali$ar un pron9stico de la venta de autos de dicho modelo para el año 266;" -os datos aparecen en la tabla si+uiente: !ño 2666 266< 2662 2667 2663 Dotal
I 7 M
Drimestre II III 2 3 M <2 ; <2 <2 <6 < 72 ;
IK ; <3 < 22 7; 3
Dotal <3 3< 3< M6 < 27L
a. Elabore res8menes de los datos de ventas de automóviles en los 8ltimos cinco a9os. ¿!ué nos dicen dic2os res8menes?
b. 3ealice un an"lisis de influencias estacionales sobre los datos. /ndi!ue los índices estacionales y 2aga comentarios acerca de las ventas en trimestres altos y baos. ¿>iene sentido intuitivo esos índices estacionales? ,escriba por !ué. c. Elimine el efecto del índice estacional de la serie y determine la ecuación de tendencia.
d.
¿Qué conclusiones y recomendaciones puede deducir de su an"lisis?
Pregunta
-os datos de la si+uiente tabla representan las ventas totales al menudeo en -ima >etropolitana de +aseosas en envase personal correspondientes al periodo 0ue va de enero del 266< a diciembre de 266;"
>es Enero Febrero >ar$o !bril >a.o Junio Julio !+osto Septiembre Octubre oviembre *iciembre a. b. c. d. e.
< <23"2 <26"; <3<" <36"3 <;<"6 <3" <3;"7 <;7" <33" <37"< <3"M
2666 <77"7 <2"6 <3"2 <3;" <;;"6 <;3"3 <3"L <;"2 <3M"7 <;<"; <;M"<
!ño 266< <73"; <7<"M <;2"L <;<"L
2662 <3<" <32" <;3"; <;"
2667 <3"3 <3;"6
@rafi!ue los datos en un diagrama. %+proimado* >rate de identificar si eisten o no las componentes estacional' de tendencia y de ciclo. $alcule el índice estacional. +uste una línea de tendencia lineal de mínimos cuadrados a la serie de tiempo mensual.