Regresión lineal Erick Bascur Godoy Estadística Instituto IACC 05 de marzo de 2018
Desarrollo
Le han solicitado elaborar un estudio de desempeño laboral en la empresa Luz Ltda. con el fin de observar la incidencia y determinar si es relevante que un empleado realice actividades personales en su horario de trabajo. Es por esto que se tomó como referencia el tiempo en horas que un empleado navega en Internet en su puesto durante la semana hábil y verificar si existe relación entre el consumo de Internet y las siguientes variables: edad, antigüedad laboral, sueldo mensual que percibe y su escolaridad, además de si el sexo del funcionario incide en este comportamiento de actividades no laborales en su lugar de trabajo. De acuerdo a los datos entregados: A) Realice un gráfico de dispersión e indique el tipo de relación entre las variables edad del trabajador y horas conectadas a Internet.
Relación entre la edad del trabajador y horas conectadas a Internet 25
y = -0.3659x + 27.685 R² = 0.7959
20 s 15 a r o H10
Series1 Linear (Series1)
5 0 0
10
20
30
40
50
60
70
Edad
B) Con respecto a las mismas variables de la letra a, construya un modelo de regresión e interprete el valor de la pendiente.
Horas internet = −0,3659 ∗ Edad + 27,685 b < 0, ya que la relación entre las variables es indirecta, por ende la variable aumenta la otra disminuye o si una disminuye la otra aumenta. c) Estime el número de horas que un trabajador está conectado a Internet, si tiene 62 años de edad.
Horas internet = −0,3659 ∗ Edad + 27,685 Horas internet = −0,3659 ∗ 62 + 27,685 Horas internet = 5 horas app
d) Si un trabajador está conectado 18 hrs. a Internet, ¿qué edad se puede estimar que tiene el trabajador?
18 = −0,3659 ∗ Edad + 27,685
Edad = 26,5 años
e) Desde la gerencia se requiere establecer un modelo de regresión para las variables: sueldo mensual y antigüedad de los trabajadores, para realizar estimaciones respecto a esas variables. Entonces:
e.1) Construya el modelo lineal y exponencial
Modelo Lineal 1600.0 1400.0
y = 77.404x + 118.07 R² = 0.7726
l a 1200.0 u s n 1000.0 e M 800.0 o d l 600.0 e e u 400.0 S
Series1 Linear (Series1)
200.0 0.0 0
5
10
15
Antigüedad de trabajadores
Modelo Exponencial 1600.0
y = 296.76e0.1094x R² = 0.8098
1400.0
l a 1200.0 u s n 1000.0 e M 800.0 o d 600.0 l e e u 400.0 S
Series1 Expon. (Series1)
200.0 0.0 0
2
4
6
8
10
Antigüedad de trabajadores
12
14
e.2) Estime qué modelo se ajusta mejor a los datos. Justifique su respuesta. Al lograr comparamos los modelos, el modelo lineal es mas confiable; ya que es el que mejor se ajusta a los datos, por ende su coeficiente de determinación es mayor, por lo que en este ultimo las estimaciones son mas confiables. Ejemplo el modelo exponencial de determinación es de 0.8098 o 80.98%, lo que significa que es mayor que los resultados del otro modelo.
e.3) Utilizando el modelo más adecuado, determine el sueldo mensual de un trabajador, si lleva 15 años en la empresa.
= 296,76, = 296,76,∗ = 296,76, = 1,641 = 10.000 ($) ñ 1641 $ = 1,641 = 1.000 ($) , ñ $1,641 = 11408,20 e.4) Utilizando el mismo modelo anterior estime la antigüedad de un trabajador, con un sueldo mensual de $750.000. = 296,76 0,1094 ∗ 750.000 = 296,76,∗ = 21,7208
Bibliografía 1) Refresión lineal, Estadística (IACC 2018)