FACULTAD CIENCIAS ECONÓMICAS Y ADMINISTRATIVAS ESCUELA PROFESIONAL DE ECONOMÍA Y NEGOCIOS INTERNACIONALES
INFORME: TALLER ECONOMETRÍA AUTOR: ERICK HERRERA MATOS CARLOS NUÑOVERO ALEGRE CHIMBOTE – PERÚ 2017
CAPÍTULO 7 ANÁLISIS DE REGRESIÓN MÚLTIPLE: EL PROBLEMA DE ESTIMACIÓN Ejercicios: 7.1 Considere los datos de la tabla 7.5.
Y
X2
X3
1
1
2
3
2
1
8
3
-3
Con base en estos datos, estime las siguientes regresiones: Yi = α1 + α2X2i + u1i Yi = λ1 + λ3X3i + u2i Yi = β1 + β2X2i + β3X3i + ui Solución
a) ¿Es α2 = β2? ¿Por qué? No, dado que el modelo (3) es el verdadero, α2, es un estimador sesgado β2.
b) ¿Es λ3 = β3? ¿Por qué? No porque λ3 Es un estimador sesgado de β3
c) ¿Qué conclusión importante obtiene de este ejercicio?
una ecuación parcial puede conducirnos a estimar de forma sesgada.
7.6. Si la relación α1X1 + α2X2 + α3X3 = 0 se cumple para todos los valores de X1, X2 y X3, encuentre los valores de los tres coeficientes de correlación parcial.
El primer paso consiste en escribir la forma de la ecuación: X1 = (-α2 / α1) X2 + (α3 / α1) X3 X2 = (-α1 / α2) X1 + (α3 / α2) X3 X3= (-α1 / α3) X1 + (α2/ α3) X2 Los valores de los coeficientes de correlación parcial son los siguientes: β123= (-α2 / α1) β213= (-α1/ α2) β312= (-α1/ α3) β13.2= -(α3/ α1) β23.1= -(α2/ α3) β32.1= -(α2/ α3)
Ejercicios empíricos 7.18 Desembolsos del presupuesto de defensa de Estados Unidos, 1962-1981. Para explicar el presupuesto de defensa de Estados Unidos, considere el siguiente modelo: Yt = β1 + β2X2t + β3X3t + β4X4t + β5X5t + ut
Donde Yt = desembolsos del presupuesto de defensa durante el año t, $ miles de millones X2t = PNB durante el año t, $ miles de millones.
X3t = ventas militares de Estados Unidos/ayuda en el año t, $ miles de millones. X4t = ventas de la industria aeroespacial, $ miles de millones. X5t = conflictos militares que implican a más de 100 000 soldados. Esta variable adquiere el valor de 1 cuando participan 100 000 soldados o más, y es igual a cero cuando el número de soldados no llega a 100 000. Para probar este modelo, se proporcionan datos en la tabla 7.8.
YEAR
Y 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981
X2 51.1 52.3 53.6 49.6 56.8 70.1 80.5 81.2 80.3 77.7 78.3 74.5 77.8 85.6 89.4 97.5 105.2 117.7 135.9 162.1
X3 560.3 590.5 632.4 684.9 749.9 793.9 865 931.4 992.7 1077.6 1185.9 1326.4 1434.2 1549.2 1718 1918.3 2163.9 2417.8 2633.1 2937.7
X4 0.6 0.9 1.1 1.4 1.6 1 0.8 1.5 1 1.5 2.95 4.8 10.3 16 14.7 8.3 11 13 15.3 18
X5 16 16.4 16.7 17 20.2 23.4 25.6 24.6 24.8 21.7 21.5 24.3 26.8 29.5 30.4 33.3 38 46.2 57.6 68.9
0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0
Solución
a) Estime los parámetros de este modelo y sus errores estándar, y obtenga R2, R2 modificada y R2.
7.21. Considere la siguiente función de demanda de dinero para Estados Unidos durante el periodo 1980-1998: Mt = β1Yt β2rt β3 eut Donde M = demanda real de dinero, de acuerdo con la definición M2 de dinero Y = PIB real r = tasa de interés Para estimar la anterior función de demanda de dinero se presentan los datos de la tabla 7.10.
AÑO
PIB
M2
CPI
TILP
TITM
1980
2795.6
1600.4
82.4
11.27
11.506
1981
3131.3
1756.1
90.9
13.45
14.029
1982
3259.2
1911.2
96.5
12.76
10.686
1983
3534.9
2127.8
99.6
11.18
8.63
1984
3932.7
2311.7
103.9
12.41
9.58
1985
4213
2497.4
107.6
10.79
7.48
1986
4452.9
2734
109.6
7.78
5.98
1987
4742.5
2832.8
113.6
8.59
5.82
1988
5108.3
2995.8
118.3
8.96
6.69
1989
5489.1
3159.9
124
8.45
8.12
1990
5803.2
3279.1
130.7
8.61
7.51
1991
5986.2
3379.8
136.2
8.14
5.42
1992
6318.9
3434.1
140.3
7.67
3.45
1993
6642.3
3487.5
144.5
6.59
3.02
1994
7054.3
3502.2
148.2
7.37
4.29
1995
7400.5
3649.3
152.4
6.88
5.51
1996
7813.2
3824.2
156.9
6.71
5.02
1997
8300.8
4046.7
160.5
6.61
5.07
1998
8759.9
4401.4
163
5.58
4.81
Solución:
a) Con los datos anteriores, calcule la función de demanda anterior. ¿Cuáles son las elasticidades del ingreso y de la tasa de interés de la demanda de dinero?
b) En lugar de estimar la función demanda anterior, suponga que debe ajustar la función (M/Y) t = α1 rtα2 eut. ¿Cómo interpretaría los resultados? Muestre los cálculos necesarios.
c) ¿Cómo decidiría cuál es la mejor especificación?
7.24. La tabla 7.12 presenta datos del gasto de consumo real, ingreso real, riqueza real y tasas de interés reales de Estados Unidos de 1947 a 2000. Estos datos se volverán a usar en el ejercicio 8.35. AÑO
C 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960
Yd 976.4 998.1 1025.3 1090.9 1107.1 1142.4 1197.2 1221.9 1310.4 1348.8 1381.8 1393.0 1470.7 1510.8
Riqueza 1035.2 1090.0 1095.6 1192.7 1227.0 1266.8 1327.5 1344.0 1433.8 1502.3 1539.5 1553.7 1623.8 1664.8
5166.8 5280.8 5607.4 5759.5 6086.1 6243.9 6355.6 6797.0 7172.2 7375.2 7315.3 7870.0 8188.1 8351.8
Tasa de Interés -10.351 -4.720 1.044 0.407 -5.283 -0.277 0.561 -0.138 0.262 -0.736 -0.261 -0.575 2.296 1.511
1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
1541.2 1617.3 1684.0 1784.8 1897.6 2006.1 2066.2 2184.2 2264.8 2317.5 2405.2 2550.5 2675.9 2653.7 2710.9 2868.9 2992.1 3124.7 3203.2 3193.0 3236.0 3275.5 3454.3 3640.6 3820.9 3981.2 4113.4 4279.5 4393.7 4474.5 4466.6 4594.5 4748.9 4928.1 5075.6 5237.5 5423.9 5683.7 5968.4 6257.8
1720.0 1803.5 1871.5 2006.9 2131.0 2244.6 2340.5 2448.2 2524.3 2630.0 2745.3 2874.3 3072.3 3051.9 3108.5 3243.5 3360.7 3527.5 3628.6 3658.0 3741.1 3791.7 3906.9 4207.6 4347.8 4486.6 4582.5 4784.1 4906.5 5014.2 5033.0 5189.3 5261.3 5397.2 5539.1 5677.7 5854.5 6168.6 6320.0 6539.2
8971.9 9091.5 9436.1 10003.4 10562.8 10522.0 11312.1 12145.4 11672.3 11650.0 12312.9 13499.9 13081.0 11868.8 12634.4 13456.8 13786.3 14450.5 15340.0 15965.0 15965.0 16312.5 16944.8 17526.7 19068.3 20530.0 21235.7 22332.0 23659.8 23105.1 24050.2 24418.2 25092.3 25218.6 27439.7 29448.2 32664.1 35587.0 39591.3 38167.7
1.296 1.396 2.058 2.027 2.112 2.020 1.213 1.055 1.732 1.166 -0.712 -0.156 1.414 -1.043 -3.534 -0.657 -1.190 0.113 1.704 2.298 4.704 4.449 4.691 5.848 4.331 3.768 2.819 3.287 4.318 3.595 1.803 1.007 0.625 2.206 3.333 3.083 3.120 3.584 3.245 3.576
a) Con los datos de la tabla, estime la función de consumo lineal usando los datos de ingreso, riqueza y tasa de interés. ¿Cuál es la ecuación ajustada?
La ecuación ajustada es: Consumo: -20.6332 + 0.7340X2 + 0.0359X3 - 5.5211X4
b) ¿Qué indican los coeficientes estimados sobre las relaciones entre las variables y el gasto de consumo? Indican que si todo lo demás permanece constante (Ceteris paribus) cuando el ingreso disponible aumente en un dólar, el consumo se incrementa en 0.73 dólares. Si la riqueza aumenta en un dólar, el consumo aumenta en 0.03 dólares. Y si el interés aumenta 1 punto porcentual, la tasa de interés reduce el consumo en un-5.52 dólares.
CAPÍTULO 8 Análisis de Regresión Múltiple: El problema de la inferencia
Ejercicios Empíricos 8.12. Consulte el ejercicio 7.21.
a) ¿Cuáles son las elasticidades del ingreso real y de la tasa de interés de los balances reales de efectivo? Las elasticidades del ingreso real son, 0.5243 y -0.0255 y las tasas de interés de los balances reales son 0.4946 y -0.0516.
b) ¿Son las elasticidades anteriores, consideradas en forma individual, estadísticamente significativas? La elasticidad ingreso es significativa en ambos casos si consideramos de forma individual.
8.16 Al estudiar la demanda de tractores agrícolas en Estados Unidos durante los periodos 1921-1941 y 1948-1957, Griliches obtuvo los siguientes resultados:
Donde Yt = valor de las existencias de tractores en las granjas el 1 de enero, en dólares de1935-1939, X2 = índice de precios pagado por los tractores dividido entre un índice de precios recibidos por todas las cosechas en el tiempo t − 1, X3 = tasa de interés prevalente en el año t − 1, y los errores estándar están dados entre paréntesis.
a) Interprete la regresión anterior. Los registros de índice de precios reales y la tasa de interés en el año anterior explican aproximadamente el 79% de la variación en el registro de las existencias de tractores, una forma de capital. Ya que se trata de una doble modelo de registro, la pendiente los coeficientes (parcial) elasticidad cruzada de la demanda. b) ¿Son los coeficientes de pendiente estimados estadísticamente significativos de manera individual? ¿Son significativamente diferentes de la unidad? Cada uno de los coeficientes parciales es individualmente significativos a un
nivel del 5%. c) Utilice la técnica de análisis de varianza para probar la significancia de la regresión en general. Sugerencia: Utilice la variante R2 de la técnica ANOVA. 0.793 F = 2 = 53.63 0.207 28 El resultado del valor F es estadísticamente significativa.
d) ¿Cómo calcularía la elasticidad tasa de interés de la demanda de tractores agrícolas?
e) ¿Cómo probaría la significancia del R2 estimado? Utilizando la prueba “F” dad en el ejercicio (C). 8.18 Una variación de la ecuación de determinación de salarios del ejercicio 8.17 es la siguiente:
Donde: W = sueldos y salarios por empleado V = empleos vacantes como porcentaje del número total de empleados en Gran Bretaña X = producto interno bruto por persona empleada M = precios de importaciones M t−1 = precios de importaciones en el año anterior (o rezagado) (Los errores estándar estimados están dados entre paréntesis.) a) Interprete la ecuación anterior. Un aumento de 1 punto porcentual en la tasa de vacantes en promedio es aproximadamente 5,29 libras. Aumento de los sueldos y salarios por empleado, ello supone un incremento del PIB de alrededor de 1 libra por persona. b) ¿Cuáles de los coeficientes estimados son estadísticamente significativos individualmente?
Los valores estimados son los siguientes: 6.51, -1.04, 2.45 y 2.42. De los cuales se afirma que el segundo es estadísticamente significativa de forma individual. c) ¿Cuál es el razonamiento para la introducción de la variable X? A priori, ¿se espera que el signo de X sea negativo? Se puede esperar una mayor productividad per cápita y de este modo llevar a cabo salarios más elevados. Además el coeficiente estimado no es estadísticamente significativamente distinto a cero. d) ¿Cuál es el propósito de incluir Mt y Mt−1 en el modelo? El principal propósito es que buscan recoger el efecto de rezagos distribuidos en curso y el anterior en cuanto a los precios de importación sobre los sueldos y salarios. e) ¿Cuáles variables pueden sacarse del modelo? ¿Por qué? Únicamente podría salir la variable X ya que tiene el signo equivocado porque su valor “t” es baja. f) Pruebe la significancia general de la regresión observada.
F=
0.934 ∕ 4 = 49.53 0.66 ∕ 14
El valor F es altamente significativa. 8.26 La demanda de cable. La tabla 8.10 presenta los datos de un fabricante de cable telefónico para pronosticar las ventas a uno de sus principales clientes durante el periodo 19681983. Las variables en la tabla se definen de la siguiente forma: Y = ventas anuales en millones de pies de cables pareados (MPC) X 2= Producto Interno Bruto (PIB), $, miles de millones X 3= construcción de nuevas viviendas, miles de unidades X 4= tasa de desempleo, % X 5= tasa preferencial rezagada 6 meses X 6= ganancias de línea para el cliente, % AÑO
X2 PIB
1968
1051.8
X3, Construcción de Nueva Viviendas 1503.6
1969
1078.8
1486.7
X4, Desempleo %
X6, ganancias línea clientes, %
3.6
X5, Tasa Referencial, rezago, 6 meses 5.8
Y, Ventas Anuales
5.9
5873
3.5
6.7
4.5
7852
1970
1075.3
1434.8
5.0
8.4
4.2
8189
1971
1107.5
2035.6
6.0
6.2
4.2
7497
1972
1171.1
2360.8
5.6
5.4
4.9
8534
1973
1235.0
2043.9
4.9
5.9
5.0
8688
1974
1217.8
1331.9
5.6
9.4
4.1
7270
1975
1202.3
1160.0
8.5
9.4
3.4
5020
1976
1271.0
1535.0
7.7
7.2
4.2
6035
1977
1332.7
1961.8
7.0
6.6
4.5
7425
1978
1399.2
2009.3
6.0
7.6
3.9
9400
1979
1431.6
1721.9
6.0
10.6
4.4
9350
1980
1480.7
1298.0
7.2
14.9
3.9
6540
1981
1510.3
1100.0
7.6
16.6
3.1
7675
1982
1492.2
1039.0
9.2
17.5
0.6
7419
1983
1535.4
1200.0
8.8
16.0
1.5
7923
Considere el siguiente modelo:
a) Estime la regresión anterior.
b) ¿Cuáles son los signos esperados para los coeficientes de este modelo?
La regresión hallada nos muestra que tanto B2, B3 y B6 son positivas mientras que B4 y B6 son negativos.
c) ¿Corresponden los resultados empíricos a las expectativas a priori? Los coeficientes que tienen signos positivos (B2, B3 y B6) consiguen satisfacer las expectativas mientras que los coeficientes con signos negativos no.
d) ¿Son los coeficientes de regresión parcial estimados estadísticamente significativos considerados en forma individual en el nivel de 5% de significancia? La regresión X3, X4 y X6 son significativos a un nivel de significancia del 5%. e) Suponga que efectúa la regresión de Y sobre X2, X3 y X4 solamente y luego decide agregar las variables X5 y X6. ¿Cómo averiguará si se justifica agregar las variables X5 y X6? ¿Qué prueba utiliza? Muestre los cálculos necesarios.
𝐹=
(0.8227 − 0.6012) ∕ 2 ≡ 6.25 (1 − 0.8227)/10
8.28. Estimación del modelo de asignación de precios de activos de capital (CAPM). En la sección 6.1 consideramos brevemente el conocido modelo de asignación de precios de activos de capital de la teoría moderna de portafolios. En el análisis empírico, el CAPM se estima en dos etapas. Etapa I (Regresión de serie de tiempo). Para cada uno de los N títulos incluidos en la muestra efectuamos la siguiente regresión a través del tiempo:
Donde Rit y Rmt son las tasas de rendimiento del i-ésimo título y el portafolios del mercado (por ejemplo, el S&P 500) en el año t; βi, como ya vimos, es el coeficiente beta o coeficiente de volatilidad del mercado del i-ésimo título y eit son los residuos. En total hay N regresiones, una para cada título, y se producen, por consiguiente, N valores estimados para βi.
Etapa II (Regresión transversal). En esta etapa efectuamos la siguiente regresión para los N títulos
Donde Ri es el promedio o tasa media de rendimiento para el título i, calculado sobre el periodo muestral cubierto por la etapa I, βi es el coeficiente beta estimado de la regresión de la primera etapa y ui es el término residual. Al comparar la regresión (2) de la segunda etapa con el CAPM, ecuación (6.1.2), escrita como
Donde rf es la tasa de rendimiento libre de riesgo, vemos que ˆ γ 1 es una estimación de rf y es γ2 una estimación de (ERm − rf), la prima del riesgo del mercado. Así, en la prueba empírica de CAPM, Ri y βi se utilizan como estimadores de ERi y βi respectivamente. Ahora, si se mantiene CAPM, estadísticamente,
Considere ahora otro modelo:
Donde s2 ei es la varianza residual del i-ésimo título de la regresión de la primera etapa. Entonces, si CAPM es válido, γ3 no debe ser significativamente diferente de cero. Para probar el CAPM, Levy efectuó las regresiones (2) y (4) sobre una muestra de 101 acciones durante el periodo 1948-1968 y obtuvo los siguientes resultados.
a) ¿Apoyan estos resultados el CAPM? No, porque el estimado que nos arroja es diferente de cero.
b) ¿Se justifica agregar la variable s2 ei al modelo? ¿Cómo sabe? Sí, porque arroja luz sobre la validez de la teoría. Y esto demuestra también que es estadísticamente significativa. c) Si el CAPM se mantiene, γ1 en (2) debe aproximar el valor promedio de la tasa libre de riesgo rf. El valor estimado es 10.9%. ¿Parece una estimación razonable de la tasa de rendimiento libre de riesgo durante el periodo de observación, 1948-1968? (Se puede considerar la tasa de rendimiento de los bonos del Tesoro o de un activo libre de riesgo relativamente parecido.) No parece demasiado alta rentabilidad de letras del tesoro de Estados Unidos. d) S i el CAPM se mantiene, la prima de riesgo del mercado (Rm − rf) de es cerca de 3.7%. Si se supone que rf es 10.9%, esto implica que Rm para el periodo de la muestra fue aproximadamente 14.6%. ¿Parece una estimación razonable? No, debido a que tiene valores elevados. e) ¿Qué puede decir sobre el CAPM en general? Es un modelo financiero y que vincula linealmente la rentabilidad de cualquier activo financiero con el riesgo de mercado de ese activo. Sin embargo no puede ser adecuada en todas las situaciones presentadas en el presente enunciado.
CAPÍTULO 10 MULTICOLINEALIDAD: ¿qué pasa si las regresoras están correlacionadas? Ejercicios 10.1. En el modelo de regresión lineal de k variables, hay k ecuaciones normales para estimar las k incógnitas. Estas ecuaciones normales están dadas en el apéndice C. Suponga que Xk es una combinación lineal perfecta de las variables X restantes. ¿Cómo se demostraría que en este caso es imposible estimar los k coeficientes de regresión? Y
X2
X3
-10
1
1
-8
2
3
-6
3
5
-4
4
7
-2
5
9
0
6
11
2
7
13
4
8
15
6
9
17
8
10
19
10
11
21
Si es una combinación perfecta lineal de las variables explicativas, existen más incógnitas que ecuaciones, por lo tantos soluciones únicas no son posibles. 10.3. Consulte el ejemplo de la mortalidad infantil analizado en el capítulo 8 (ejemplo 8.1). Dicho ejemplo implicó hacer la regresión de la tasa de mortalidad infantil (MI) sobre el PIB per cápita (PIBPC) y la tasa de alfabetización de las mujeres (TAM). Ahora, suponga que añadimos la variable tasa de fecundidad total (TFT). Lo anterior da los siguientes resultados de la regresión
a) Compare estos resultados de la regresión con los obtenidos en la ecuación (8.1.4). ¿Qué cambios observa? ¿Cómo los explica? Las variables que se muestran son estadísticamente significativas. Por lo tanto los cambios que se han efectuado se deben a la incorporación de la tasa de fecundidad global, por ello puede existir alguno multicolinealidad entre los regresores.
b) ¿Vale la pena añadir la variable TFT al modelo? ¿Por qué? Dado el valor del coeficiente TFT, revela que es muy importante (p = 0.0032). El signo positivo de este coeficiente tiene mucha coherencia, debido a la relación entre el número de los niños para una mujer, mayores son las probabilidades de la mayor mortalidad infantil.
c) Como todos los coeficientes t individual son estadísticamente significativos, ¿podemos decir que no existe un problema de colinealidad en el presente caso? En este caso existe colinealidad, debido a que los coeficientes son estadísticamente significativos.
Ejercicios Empíricos 10.26 Klein y Goldberger intentaron ajustar el siguiente modelo de regresión a la economía de Estados Unidos:
Donde Y = consumo, X2 = ingreso salarial, X3 = ingreso no salarial, no procedente del campo, y X4 = ingreso procedente del campo. Pero, como se espera que X2, X3 y X4 sean muy colineales, obtuvieron las siguientes estimaciones de β 3 y β4 del análisis de corte transversal: AÑO
Y
X2
X3
X4
1936
62.8
43.41
17.10
3.96
1937
65.0
46.4
18.65
5.48
1938
63.9
44.35
17.09
4.37
1939
67.5
47.82
19.28
4.51
1940
71.3
51.02
23.24
4.88
1941
76.6
58.71
28.11
6.37
1945
86.3
87.69
30.29
8.96
1946
95.7
76.73
28.26
9.76
1947
98.3
75.91
27.91
9.31
1948
100.3
77.62
32.30
9.85
1949
103.2
78.01
31.39
7.21
1950
108.9
83.57
35.61
7.39
1951
108.5
90.59
37.58
7.98
1952
111.4
95.47
35.17
7.42
β3 = 0.75β2 y β4 = 0.625β2. Con estas estimaciones reformularon su función de consumo de la siguiente manera:
Yi = β1 +β2 (X2i +0.75X3i +0.625X4i) + ui = β1 +β2Zi + ui donde Zi = X2i + 0.75X3i + 0.625X4i.
a) Ajuste el modelo modificado a los datos de la tabla 10.12 y obtenga estimaciones de β1 a β4.
b) ¿Cómo interpretaría la variable Z? La variable Z puede interpretarse como una media ponderada de los diferentes tipos de ingresos.
10.27. La tabla 10.13 proporciona cifras sobre importaciones, PIB e índice de precios al consumidor (IPC) de Estados Unidos de 1975 a 2005. Se le pide considerar el siguiente modelo: Ln Importacionest = β1 + β2 ln PIBt + β3 ln IPCt + ut
a) Estime los parámetros de este modelo con la información de la tabla.
b) ¿Sospecha multicolinealidad en los datos?
Debido al alto valor de R2 y el valor “t” de los coeficientes mostrados es muy probable que exista multicolinealidad.
c) Efectúe las siguientes regresiones:
1) Ln Importacionest = A1 + A2 ln PIBt
2) Ln Importacionest = B1 + B2 ln IPCt
3) Ln PIBt = C1 + C2 ln IPCt
Con base en estas regresiones, ¿qué puede decir sobre la naturaleza de la multicolinealidad en los datos? AÑO
IPC
PBI
IMPORTACIONES
1975
53.8
1,638.3
98185
1976
56.9
1,825.3
124228
1977
60.6
2,030.9
151907
1978
65.2
2,294.7
176002
1979
72.6
2,563.3
212007
1980
82.4
2,789.5
249750
1981
90.9
3,128.4
265067
1982
96.5
3,255.0
247642
1983
99.6
3,536.7
268901
1984
103.9
3,933.2
332418
1985
107.6
4,220.3
338088
1986
109.6
4,462.8
368425
1987
113.6
4,739.5
409765
1988
118.3
5,103.8
447189
1989
124.0
5,484.4
477665
1990
130.7
5,803.1
498438
1991
136.2
5,995.9
491020
1992
140.3
6,337.7
536528
1993
144.5
6,657.4
589394
1994
148.2
7,072.2
668690
1995
152.4
7,397.7
749374
1996
156.9
7,816.9
803113
1997
160.5
8,304.3
876470
1998
163.0
8,747.0
917103
1999
166.6
9,268.4
1029980
2000
172.2
9,817.0
1224408
2001
177.1
10,128.0
1145900
2002
179.9
10,469.6
1164720
2003
184.0
10,960.8
1260717
2004
188.9
11,712.5
1472926
2005
195.3
12,455.8
1677371
d) Suponga que existe multicolinealidad en los datos, pero que β2 y β3 son significativos individualmente en el nivel de 5%, y que la prueba global F es también significativa. En este caso, ¿debe preocupar el problema de colinealidad? Una solución apropiada es expresar las “Importaciones y el PBI” en términos reales y dividirlas por el IPC
10.29 La tabla 10.14 proporciona información sobre los automóviles de pasajeros nuevos vendidos en Estados Unidos como función de diversas variables. AÑO
Y
X2
X3
X4
X5
X6
1971
10227
112
121.3
776.8
4.89
79367
1972
10872
111
125.3
839.6
4.55
82153
1973
11350
111.1
133.1
949.8
7.38
85064
1974
8775
117.5
147.7
1038.4
8.61
86794
1975
8539
127.6
161.2
1142.8
6.16
85846
1976
9994
135.7
170.5
1252.6
5.22
88752
1977
11046
142.9
181.5
1379.3
5.5
92017
1978
11164
153.8
195.3
1551.2
7.78
96048
1979
10559
166
217.7
1729.3
10.25
98824
1980
8979
179.3
247
1918
11.28
99303
1981
8535
190.2
272.3
2127.6
13.73
100397
1982
7980
197.6
286.6
2261.4
11.2
99526
1983
9179
202.6
297.4
2428.1
8.69
100834
1984
10394
208.5
307.6
2670.6
9.65
105005
1985
11039
215.2
318.5
2841.1
7.75
107150
1986
11450
224.4
323.4
3022.1
6.31
109597
a) Desarrolle un modelo lineal o log-lineal apropiado para estimar una función de demanda de automóviles en Estados Unidos.
b) Si decide incluir todas las regresoras dadas en la tabla como variables explicativas, ¿espera encontrar el problema de multicolinealidad? ¿Por qué?
c) Si espera lo anterior, ¿cómo resolvería el problema? Plantee los supuestos claramente y muestre todos los cálculos de manera explícita.
Al examinar los coeficientes de correlación entre todas las variables explicativas se aprecia una correlación muy alta entre el IPC del nuevo coche y el IPC general, y entre el IPD y el IPC del automóvil nuevo. Además el IPD también se encuentra estrechamente relacionado con el nivel de empleo.
CAPÍTULO 11 HETEROSCEDASTICIDAD: ¿qué pasa si la varianza del error no es constante? Ejercicios:
11.5 Muestre que β∗ 2 de (11.3.8) también se expresa como
Y var (β*2) dada en (11.3.9) también se expresa como
Donde y∗i = Yi − Y∗ y x∗i = Xi − X∗ representan las desviaciones en relación con las medias ponderadas Y* y X* definidas como
Ejercicios Empíricos
11.11. Con la información de la tabla 11.1, efectúe la regresión de la remuneración salarial promedio Y sobre la productividad promedio X, y considere el tamaño de la planta laboral como unidad de observación. Interprete sus resultados y vea si están de acuerdo con los presentados en (11.5.3). IND
A
B
C
D
E
F
G
H
I
1
2994
3295
3565
3907
4189
4486
4676
4968
5342
2
1721
2057
3336
3320
2980
2848
3072
2969
3822
3
3600
3657
3674
3437
3340
3334
3225
3163
3168
4
3494
3787
3533
3215
3030
2834
2750
2967
3453
5
3498
3847
3913
4135
4445
4885
5132
5342
5326
6
3611
4206
4695
5083
5301
5269
5182
5395
5552
7
3875
4660
4930
5005
5114
5248
5630
5870
5876
8
4616
5181
5317
5337
5421
5710
6316
6455
6347
9
3538
3984
4014
4287
4221
4539
4721
4905
5481
10
3016
3196
3149
3317
3414
3254
3177
3346
4067
11
3396
3787
4013
4014
4146
4241
4387
4538
4843
12
743.7
851.4
727.8
805.06
929.9
1080.6
1243.2
1307.7
1112.5
13
9355
8584
7962
8275
8389
9418
9795
10281
1750
Si la productividad media aumenta en un dólar, en promedio, la compensación aumenta en unos 23 centavos.
a) De la regresión anterior, obtenga los residuos ui. Los residuos son los siguientes: -775.6579, -205.0481. 165.8515, 183.9356, 199.3785, 54.6657, 112.8410, 150.6239, 113.4100.
b) Según la prueba de Park, efectúe la regresión de ln u 2i sobre ln Xi y verifique la regresión (11.5.4).
c) Según el método de Glejser, efectúe la regresión de |ui| sobre Xi y luego la regresión de |ui| sobre √Xi. Comente sus resultados.
̂ | = 407.3455 − 0.0203x |U t = (0.6433)(−0.3013)r 2 = 0.0128 |û| = 575.2976 − 3.7097 + √x t = (0.4479)(−0.2787)r 2 = 0.0109
d) Encuentre la correlación de orden entre |ui| y Xi, y comente sobre la naturaleza de la heteroscedasticidad presente en los datos, si existe.
Sobre las bases de las pruebas realizadas de correlación, no tenemos ninguna razón de heteroscedasticidad. Es decir todas las pruebas que se han mostrado hasta el momento sugieren que no existe problema de heteroscedasticidad.
11.13 Prueba de homogeneidad de varianza de Bartlett.* Suponga que hay k varianzas muestrales independientes s2 1, s22,..., s2k con f1, f2,. . ., fk gl, cada una proveniente de poblaciones normalmente distribuidas con media μ y varianza σ2 i. Suponga además que deseamos probar la hipótesis nula H0: σ21 = σ22 =···= σ2 k = σ2; es decir, cada varianza muestral es una estimación de la misma varianza poblacional σ2. Si la hipótesis nula es verdadera, entonces.
Constituye una estimación de la estimación común (agrupada) de la varianza poblacional σ2, donde fi = (ni − 1), con ni como el número de observaciones en el i-ésimo grupo y donde f = k Bartlett demostró que la hipótesis nula se prueba por la razón A/B, distribuida aproximadamente como la distribución χ2 con k − 1 gl, donde
Aplique la prueba de Bartlett a los datos de la tabla 11.1 y verifique que no se puede rechazar la hipótesis de que las varianzas poblacionales de la remuneración salarial son las mismas para cada tamaño de la planta laboral del establecimiento, en el nivel de significancia de 5%.
Nota: fi, los gl para cada varianza muestral, es 9, pues ni para cada muestra (es decir, clase de empleados) es 10.
Utilizando la prueba de Bartlett, el valor X2 es 6.6473, cuyo valor p es 0.5748. Por lo tanto, no se rechaza la hipótesis nula ya que las varianzas son iguales.
11.15 La tabla 11.7 proporciona datos sobre 81 automóviles respecto de su MPG (millas promedio por galón), CF (caballos de fuerza de su motor), VOL (pies cúbicos de su cabina), VM (velocidad máxima en millas por hora) y su PS (peso del vehículo en cientos de lb).
HP 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
MPG 65.4 56 55.9 49 46.5 46.2 45.4 59.2 53.3 43.4 41.1 40.9 40.9 40.4 39.6 39.3 38.9 38.8 38.2 42.2 40.9 40.7 40 39.3 38.8 38.4 38.4 38.4 46.9 36.3 36.1 36.1 35.4 35.3 35.1 35.1 35 33.2 32.9
VM 53.7006814 50.0134012 50.0134012 45.6963224 50.5042318 45.6963224 50.0134012 46.7165543 46.7165543 42.2990782 44.6528342 39.3540941 39.3540941 44.6528342 45.7348929 44.6528342 42.7899089 39.3540941 42.7899089 38.901834 38.4110033 42.8284794 38.310606 40.4747233 38.310606 38.4110033 38.4110033 38.4110033 43.4694339 35.4041924 39.4312352 39.4312352 36.2854565 36.2854565 39.5316325 37.9587432 37.9587432 34.0706683 34.0706683
CF 89 92 92 92 92 89 92 50 50 94 89 50 99 89 89 89 91 50 91 103 99 107 101 96 89 50 117 99 104 107 114 101 97 113 101 98 88 86 86
VOL 17.5 20 20 20 20 20 20 22.5 22.5 22.5 22.5 22.5 22.5 22.5 22.5 22.5 22.5 22.5 22.5 25 25 25 25 25 25 25 25 25 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 30 30
PS 96 97 97 105 96 105 97 98 98 107 103 113 113 103 100 103 106 113 106 109 110 101 111 105 111 110 110 110 90 112 103 103 111 111 102 106 106 109 109
40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81
32.3 32.2 32.2 32.2 32.2 31.5 31.5 31.4 31.4 31.2 33.7 32.6 31.3 31.3 30.4 28.9 28 28 28 28 28 27.7 25.6 25.3 23.9 23.6 23.6 23.6 23.6 23.6 23.5 23.4 23.4 23.1 22.9 22.9 19.5 18.1 17.2 17 16.7 13.2
31.0141309 35.152727 35.152727 34.0706683 35.152727 35.6435576 34.561499 34.561499 35.0523296 31.0141309 29.629936 29.629936 29.629936 29.629936 24.4873667 26.8522787 27.8562519 31.1135839 29.629936 30.1319226 28.8602252 27.3542653 24.6091316 23.5159169 23.5159169 23.6051583 23.1031717 23.1031717 23.1031717 23.1031717 21.2737079 19.6785067 23.203569 23.203569 19.0863405 19.0863405 18.7628367 20.2018546 19.1978876 20.0568397 19.8337332 12.1012629
92 113 106 92 88 102 99 111 103 86 101 101 101 124 113 113 124 92 101 94 115 111 116 131 123 121 50 114 127 123 112 50 135 132 160 129 129 50 115 50 119 107
30 30 30 30 30 30 30 30 30 30 35 35 35 35 35 35 35 35 35 35 35 35 40 40 40 40 40 40 40 40 40 40 40 40 45 45 45 45 45 45 45 55
120 106 106 109 106 105 108 108 107 120 109 109 109 109 133 125 115 102 109 104 105 120 107 114 114 117 122 122 122 122 148 160 121 121 110 110 121 165 140 147 157 130
a) Considere el siguiente modelo:
Estime los parámetros de este modelo e interprete los resultados. Desde el punto de vista económico, ¿tiene sentido?
Se puede observar que MPG se relaciona de manera negativa con PS, debido a la velocidad y el peso.
b) ¿Esperaría que la varianza del error en el modelo anterior sea heteroscedástica? ¿Por qué? Al observarse que se tratan de datos transversales, ello implica una mayor diversidad de automóviles, lo cual permite que se espere heteroscedasticidad.
c) Con la prueba de White determine si la varianza de error es heteroscedástica.
d) Obtenga los errores estándar de White consistentes con la heteroscedasticidad, así como los valores t, y compare los resultados con los obtenidos mediante MCO.
e) Si se establece heteroscedasticidad, ¿cómo puede transformar los datos de manera que en los datos transformados la varianza del error sea homoscedástica? Muestre los cálculos necesarios.
No existe una fórmula sencilla para determinar la naturaleza exacta de la heteroscedasticidad en el presente caso. Tal vez uno podría hacer una suposición simple y probar varias transformaciones. Por ejemplo, si se cree que la variable culpable es HP, y si creemos que la varianza de los errores es proporcional al cuadrado de HP, podríamos dividirla por HP y ver qué sucede. Por supuesto, cualquier otro regresor es un candidato probable para la transformación.
11.20. La tabla 11.8 proporciona datos sobre la mediana de los salarios de catedráticos en estadística que laboraron en centros universitarios de investigación de Estados Unidos durante el año académico 2007.
Years in Rank
Year
Year^2
Count
Median
0 to 1
0.5
0.25
40
101478
2 to 3
2.5
6.25
24
102400
4 to 5
4.5
20.25
35
124578
6 to 7
6.5
42.25
34
122850
8 to 9
8.5
72.25
33
116900
10 to 14
12
144
73
119465
15 to 19
17
289
69
114900
20 to 24
22
484
54
129072
25 to 30
27.5
756.25
44
131704
32
1024
25
143000
31 or more
a) Grafique la mediana de los salarios respecto de los rangos de años (como medida de los años de experiencia). Para propósitos de la gráfica, suponga que la mediana de los salarios está referida al punto medio del rango de años correspondiente. Por consiguiente, el salario de $124 578 del rango 4-5 está referido a 4.5 años del rango correspondiente, y así sucesivamente. Para el último grupo, suponga que el rango es 31-33.
Se aprecia un aumento de los salarios mediano con el paso de los años.
b) Considere los siguientes modelos de regresión:
Donde Y = mediana del salario, X = año en el rango (medido como el punto medio del intervalo), y u y v son los términos de error. ¿Puede justificar por qué el modelo (2) sería preferible al modelo (1)? A partir de estos datos, estime los modelos. De la imagen observada, se puede afirmar que el modelo (2) es el más apropiado ya que encaja en la teoría económica del capital humano.
11.20. La tabla 11.8 proporciona datos sobre la mediana de los salarios de catedráticos en estadística que laboraron en centros universitarios de investigación de Estados Unidos durante el año académico 2007. a) Grafique la mediana de los salarios respecto de los rangos de años (como medida de los años de experiencia). Para propósitos de la gráfica, suponga que la mediana de los salarios está referida al punto medio del rango de años correspondiente. Por consiguiente, el salario de $124 578 del rango 4-5 está referido a 4.5 años del rango correspondiente, y así sucesivamente. Para el último grupo, suponga que el rango es 31-33. b) Considere los siguientes modelos de regresión:
Donde Y _ mediana del salario, X _ año en el rango (medido como el punto medio del intervalo), y u y v son los términos de error. ¿Puede justificar por qué el modelo (2) sería preferible al modelo (1)? A partir de estos datos, estime los modelos. c) Si observa heteroscedasticidad en el modelo (1) pero no en el modelo (2), ¿a qué conclusiones llega? Muestre los cálculos necesarios. d) Si observa heteroscedasticidad en el modelo (2), ¿cómo puede transformar los datos de manera que en el modelo transformado no existiera heteroscedasticidad?
RESPUESTA
a)
Tal como se muestra en esta figura, con aumentos de sueldo promedio años de graduación, pero no lineal. b) De la cifra indicada en (a) parece que modelo (2) puede ser más apropiado, que se corresponde también con la teoría económica del capital humano. c) Los resultados de los modelos lineales y cuadráticas son los siguientes:
La heterocedasticidad de White prueba aplicada al modelo (1) se demostró que no había evidencia de heterocedasticidad. El valor de n.R2 de la regresión auxiliar del cuadrado de los residuos se 11,4108 con un valor de p de 0,0033, lo cual sugiere una fuerte heterocedasticidad. Cuando el mismo se aplicó la prueba con el modelo (2), n .R2 fue 7,6494, con ap. valor de 0,0538, lo que sugiere que no hay heterocedasticidad al nivel del 5 por ciento. Pero este valor es tan cerca del nivel del 5% que uno podría sospechar la heteroscedasticidad leve en el modelo, aunque la posibilidad de error en la especificación no puede descartarse.
d) Suponiendo que la varianza del error es proporcional al cuadrado de la experiencia, nos hemos dividido modelo (1) a través de X y obtener los siguientes resultados:
Cuando este modelo se sometió a prueba la heterocedasticidad de White, no hubo pruebas de heterocedasticidad.