PUBLICACIONES DE 3er CURSO Licenciatura: L.A.D.E
Asignatura: ECONOMETRÍA II
COLECCION DE PROBLEMAS RESUELTOS Y PROPUESTOS
Grupos: 32, 33 y 34 Departamento: ANÁLISIS ECONÓMICO
Curso Académico: 2005/2006
Facultad de Ciencias Económicas y Empresariales
Universidad de Zaragoza
PROBLEMAS RESUELTOS Problema 1. Se ha estimado por MCO un modelo lineal entre las variables y t y xt utilizando 10 observaciones. La serie de residuos MCO obtenida es:
t
1
2
3
4
5
6
7
8
9
10
uˆ t
-0,76
-0,57
-0,24
-0,16
0,24
0,66
0,89
0,53
0,15
-0,74
Se pide: 1.1. Obtenga una estimación consistente de la función de autocorrelación muestral de los residuos. 1.2. Obtenga el valor exacto del estadístico de Durbin-Watson, y resuelva el contraste correspondiente. 1.3. A la vista de los resultados anteriores identifique, razonando razonando la respuesta, que error se ha cometido en la especificación del modelo.
Solución Problema 1. 1.1. La estimación consistente de cada uno de los elementos que integran la función de autocorrelación muestral de los residuos viene dada por la siguiente expresión:
r j =
c j c0
=
∑ uˆ uˆ ∑ uˆ
t t − j
2 t
( j = 1,2, …..)
En este caso solo vamos a calcular los tres primeros elementos de dicha función.
uˆ t
2 uˆ t
-0,76 -0,57 -0,24 -0,16 0,24 0,66 0,89 0,53 0,15 -0,74
0,5776 0,3249 0,0576 0,0256 0,0576 0,4356 0,7921 0,2809 0,0225 0,5476 0,5476
3,122
uˆ t −1
uˆ t uˆ t −1
-0,76 -0,57 -0,24 -0,16 0,24 0,66 0,89 0,53 0,15
0,4332 0,1368 0,0384 -0,0384 0,1584 0,5874 0,4717 0,0795 -0,1110
uˆ t − 2
-0,76 -0,57 -0,24 -0,16 0,24 0,66 0,89 0,53
1,756
uˆ t uˆ t − 2
0,1824 0,0912 -0,0576 -0,1056 0,2136 0,3498 0,1335 -0,3922
uˆ t −3
-0,76 -0,57 -0,24 -0,16 0,24 0,66 0,89
0,4151
uˆ t uˆ t −3
0,1216 -0,1368 -0,1584 -0,1424 0,1272 0,0990 -0,6586
-0,7484
A partir de esta información se obtiene:
1,756
r 1 =
9 = 0,1951 = 0,62 3,122 0,3122 10
0,4151 8 = 0,1662 r 2 = 3,122 10
1
uˆ t - uˆ t −1
0,19 0,33 0,08 0,4 0,42 0,23 -0,36 -0,38 -0,89
(uˆ t − uˆ t −1 )2 0,0361 0,1089 0,0064 0,1600 0,1764 0,529 0,1296 0,1444 0,7921
1,6068
PROBLEMAS RESUELTOS Problema 1. Se ha estimado por MCO un modelo lineal entre las variables y t y xt utilizando 10 observaciones. La serie de residuos MCO obtenida es:
t
1
2
3
4
5
6
7
8
9
10
uˆ t
-0,76
-0,57
-0,24
-0,16
0,24
0,66
0,89
0,53
0,15
-0,74
Se pide: 1.1. Obtenga una estimación consistente de la función de autocorrelación muestral de los residuos. 1.2. Obtenga el valor exacto del estadístico de Durbin-Watson, y resuelva el contraste correspondiente. 1.3. A la vista de los resultados anteriores identifique, razonando razonando la respuesta, que error se ha cometido en la especificación del modelo.
Solución Problema 1. 1.1. La estimación consistente de cada uno de los elementos que integran la función de autocorrelación muestral de los residuos viene dada por la siguiente expresión:
r j =
c j c0
=
∑ uˆ uˆ ∑ uˆ
t t − j
2 t
( j = 1,2, …..)
En este caso solo vamos a calcular los tres primeros elementos de dicha función.
uˆ t
2 uˆ t
-0,76 -0,57 -0,24 -0,16 0,24 0,66 0,89 0,53 0,15 -0,74
0,5776 0,3249 0,0576 0,0256 0,0576 0,4356 0,7921 0,2809 0,0225 0,5476 0,5476
3,122
uˆ t −1
uˆ t uˆ t −1
-0,76 -0,57 -0,24 -0,16 0,24 0,66 0,89 0,53 0,15
0,4332 0,1368 0,0384 -0,0384 0,1584 0,5874 0,4717 0,0795 -0,1110
uˆ t − 2
-0,76 -0,57 -0,24 -0,16 0,24 0,66 0,89 0,53
1,756
uˆ t uˆ t − 2
0,1824 0,0912 -0,0576 -0,1056 0,2136 0,3498 0,1335 -0,3922
uˆ t −3
-0,76 -0,57 -0,24 -0,16 0,24 0,66 0,89
0,4151
uˆ t uˆ t −3
0,1216 -0,1368 -0,1584 -0,1424 0,1272 0,0990 -0,6586
-0,7484
A partir de esta información se obtiene:
1,756
r 1 =
9 = 0,1951 = 0,62 3,122 0,3122 10
0,4151 8 = 0,1662 r 2 = 3,122 10
1
uˆ t - uˆ t −1
0,19 0,33 0,08 0,4 0,42 0,23 -0,36 -0,38 -0,89
(uˆ t − uˆ t −1 )2 0,0361 0,1089 0,0064 0,1600 0,1764 0,529 0,1296 0,1444 0,7921
1,6068
− 0,7484 r3 =
7 = -0,3424
3,122 10
1.2. El valor exacto del estadístico de Durbin-Watson viene dado por:
∑ (uˆ − uˆ DW = ∑ uˆ t
t −1
)2
2 t
Atendiendo a los resultados de la tabla anterior, resulta: DW =
1,6068
= 0,5147
3,122
Como DW = 0,5147 < d L = 0,6 ⇒ se rechaza la H0: ρ = 0, al nivel de significación del 5%, y hay evidencia para pensar que existe autocorrelación positiva de primer orden. 1.3. Dado que existe un problema de autocorrelación sabemos que ello viene provocado por un error de especificación bien en la forma funcional, o en la determinación de otros elementos de la parte sistemática del modelo. Si representamos los residuos en función del tiempo resulta la típica estructura curvilínea que refleja claramente un error en la forma funcional del modelo.
Problema 2. Se ha estimado por MCO el modelo y t =
α + β xt + u t , con T = 50 lo que produce una
varianza estimada de 0,327. Para estudiar el supuesto de homoscedasticidad se dispone de la siguiente información relativa al estadístico de Goldfeld-Quandt (se ha tomado c=16):
MUESTRA ORDENADA CON t x
SR1 4,58 3,97
SR2 4,21 5,12
donde t es el tiempo En relación con el estadístico de Breusch-Pagan se han obtenido los siguientes resultados ( en los tres casos, se ha incluido también una constante): EXPLICATIVAS REGRESION AUXILIAR ˆ2 σ R 2 BP
BP
t 0,040 0,73 0,158 0,64 x t, x 0,292 0,55 Por último, la ecuación auxiliar del contraste de White genera una varianza estimada de 0,06. Utilizando toda esta información indique si existen problemas de heteroscedasticidad en la especificación.
Solución Problema 2. Aplicamos primero Goldfeld-Quandt, para verificar la hipótesis nula de homoscedasticidad, suponiendo que ordenamos la muestra respecto a la variable tiempo: GQ =
4,21 4,58 15
= 0,92
Dado que en este caso se verifica que F15 (0,025) homoscedasticidad respecto al ⇒ se acepta la H0 de homoscedasticidad
15 (0,975) = 2,86 = 0,35 < 0,92 < F15
tiempo.
Si ahora ordenamos la muestra respecto a la variable exógena, resulta:
2
GQ =
5,12 3,97
= 1,29
15 15 F15 (0,025) = 0,35 < 1,29 < F15 (0,975) = 2,86 ⇒
se
acepta
la
H0
de
homoscedasticidad respecto a x. Para contrastar la misma hipótesis nula podemos ahora aplicar Breusch-Pagan, suponiendo distintas explicativas en la regresión auxiliar:
uˆ t 2 SUPUESTO 1: ~ 2 = f (t) σ 2
ˆ BP · (T-k) = 0,73 · 48 = 35,04 SR BP = σ SR BP
2 R BP = 1-
BP =
ST BP
SE BP
=
2
⇒ ST BP
=
35,04 1 − 0,040
36,5 − 35,04
= 36,5
= 0,73
2 2
BP = 0,73 < χ (1) = 3,8
⇒
se acepta la H0 de homoscedasticidad, al nivel de
significación del 5%.
uˆ t 2 SUPUESTO 2: ~ 2 = f ( x x) σ 2
ˆ BP · (T-k) = 0,64 · 48 = 30,72 SR BP = σ ya que la suma total es la misma para todas las regresiones podemos pasar a calcular el valor del estadístico: BP =
SE BP
2
=
36,5 − 30,72 2
= 2,88
2
BP = 2,88 < χ (1) = 3,8
⇒
se acepta la H0 de homoscedasticidad, al nivel de
significación del 5%.
uˆ t 2 SUPUESTO 3: ~ 2 = f (t, x) σ SR BP = 0,55 · 47 = 25,85
BP =
SE BP
2
=
36,5 − 25,85 2 2
BP = 5,33 < χ (2) = 6
= 5,33
⇒
se acepta la H0 de homoscedasticidad, al nivel de
significación del 5%. Por último, podemos aplicar el contraste de White basado en la regresión auxiliar:
uˆ 2t
= θ0 + θ1 x t + θ2 x 2t + et
3
2
y calcular a partir de ella, el estadístico T Rw . Para obtener este último, hallamos primero la suma residual de dicha regresión auxiliar como: 2
ˆ w · (T-k) = 0,06 · 47 = 2,82 SR w = σ y para obtener la suma total de esa ecuación, procedemos del modo siguiente: STw =
∑ ( uˆ = ∑ uˆ 2 t
∑ uˆ -
4 t
2 t
∑
)2 =
2 ~ 2 )2 = ( uˆ t - σ
T ~ 4 - 2 T σ ~4 = + T σ
∑
∑
4 ~ 4 - 2 σ ~ 2 uˆ 2 ) = ( uˆ t + T σ t
4 ~4 . uˆ t - T σ
ˆ2 (T − k )σ 48 ⋅· 0,327 2 ~ σ = = = 0,31 50 T 4 uˆ t ~4 ⇒ STBP = ~ 4 - T ⇒ uˆ t 4 = (STBP + T) σ σ
∑
∑ uˆ
4 t
∑
= (36,5 + 50) (0,31) 2= 8,31.
STw = 8,31 – 50 · 0,0961 = 3,5
Rw2 = 1 -
2,82 3,50
= 0,195
Con lo cual: W = 50 · 0,195 = 9,75 2
W = 9,75 > χ (2) = 6
⇒
se rechaza la H0 de homoscedasticidad, al nivel de
significación del 5%. En resumen, aunque los contrastes particulares no detectan síntomas de heteroscedasticidad en el modelo, el contraste genérico de White sí que encuentra indicios de este problema.
Problema 3. Los errores asociados a la forma funcional de un modelo tienen consecuencias múltiples sobre la estimación MCO. En concreto, suponga que el proceso generador de los datos (PGD) es el siguiente:
y t = 0,25 + 4,5
⎛ 1 ⎞ ⎜⎜ ⎟⎟ ⎝ xt ⎠
2
+ εt
εt
iid N(0,σ2).
y se ha ajustado el modelo lineal simple:
y t = α + β xt + u t Examine analíticamente las consecuencias de este error en relación a los supuestos asumidos habitualmente con respecto a: 3.1. E [ut] 3.2. V [ut] 3.3. Cov [u t , ut-s] para s ≠ 0 3.4. Normalidad de u t.
Solución Problema 3. La situación planteada por el problema hace referencia a establecer un PGD del tipo:
4
y t = h(xt,β) + εt cuando el modelo utilizado es de la forma: y t = xt ′ β + u t Bajo este planteamiento, la perturbación aleatoria del modelo considerado será: u t = y t - xt ′ β = h(xt,β) + εt - xt ′ β = g(xt,β) + εt A partir de aquí podemos analizar cada uno de los supuestos considerados: 3.1. E[ u t ] = E[g(x t,β) + εt] = g(xt,β) ≠0 Con lo cual, el valor esperado de la perturbación aleatoria del modelo considerado será, en general, diferente de cero. 3.2. V[ u t ] = E[ u t - E( u t )]2 = E[εt]2 = σ2. De manera que se sigue cumpliendo la hipótesis de varianza constante. 3.3. Cov[ u t , u t − s ] = E[ εt εt-s] = 0. Satisface el supuesto de no autocorrelación. 3.4. Dada la expresión u t = g(xt,β) + εt, donde el primer sumando del segundo miembro es una constante podemos concluir que u t también sigue una distribución normal con esperanza g(xt,β), distinta para cada u t , y varianza constante
σ2.
Problema 4. Se desea modelizar la variable endógena y t en función de la exógena xt y de un término independiente. En este sentido se han planteado las siguientes regresiones con una muestra de 50 observaciones:
~ 2 = 3,23; σ ~ 2 = 3,19 R 2 = 0,30; = -10,3; σ A
M1 : yˆ t = 3,4 – 0,86 xt (8,1)(-0,7) M2 : ln yˆ t = 0,67 –0,3 ln xt
~ 2 = 1,25; σ ~ 2 = 1,06 R 2 = 0,70; = -10,8; σ A
(10,9) (-6,3) 2
ˆ A es la estimación de la varianza deducida de la donde es la log-verosimilitud estimada y σ ecuación auxiliar del contraste RESET con p = 2. Utilizando esa información, discuta cada una de las siguientes tres posibilidades: 4.1. Utilizaremos M2 porque al resolver el contraste de forma funcional mediante el estadístico LR seleccionamos este modelo. Además, los resultados de la estimación son sensiblemente mejores. 4.2. Utilizaremos M1 porque el contraste RESET descarta M2 y la log-verosimilitud estimada es mayor. 4.3. Ninguno de los dos modelos es adecuado.
Solución Problema 4. 4.1. Dado que los modelos analizados son un modelo lineal y un modelo doblemente logarítmico no es posible aplicar el contraste LR puesto que no estamos en el marco de modelos anidados, con lo cual basándose en esta estrategia no se puede proceder a la selección. Lo que sí es cierto es que los resultados de la estimación para M2 son mejores en términos de 2
ˆ . significatividad individual, R 2 y σ 4.2. La aplicación del contraste RESET para M1 da como resultado: F=
3,23 − 3,19 3,19 1
·
F = 0,58 < F 47 = 4
47 1
= 0,58
⇒ se acepta, al nivel de significación del 5%, la hipótesis
linealidad.
5
nula de
Aplicando el contraste para M2: F=
1,25 − 1,06 1,06 1
·
47 1
F = 8,42 > F 47 = 4
= 8,42
⇒ se rechaza, al nivel de significación del 5%, la hipótesis
nula de
modelo doblemente logarítmico. Por tanto, la posibilidad enunciada es correcta. 4.3. Esta alternativa también es correcta ya que observamos que en M1 la variable x no resulta significativa, lo que podría estar indicando algún tipo de problema en la especificación del modelo.
Problema 5. Se ha estimado una función de consumo de la economía española para el periodo 1971-1995 con los siguientes resultados:
ˆ = 40,63 + 0,72 Y M0: C t t
SR = 110
También se han resuelto estas otras estimaciones:
ˆ = 38,59 +0,62 Y + 0,15 Z M1: C t t t
SR = 88
ˆ = 48,23 – 12,94 D +0,68 Y M2: C t t t
SR = 100
ˆ = 45,63 –8,34 D +0,65 Y + 0,10 Z SR = 85 M3: C t t t t donde Dt =1 para t > 1985 y cero en otro caso y Z t = Y t · Dt . Especifique y resuelva las siguientes hipótesis: 5.1. La entrada de la economía española en la CEE ocasionó una ruptura total de la estructura en el comportamiento de la función de consumo. 5.2. La entrada de la economía española en la CEE solo afectó a la distribución entre consumo y ahorro de una unidad adicional de renta. 5.3. La escala de la función de consumo fue el único elemento afectado por la adhesión a la CEE.
Solución Problema 5. 5.1. En el enunciado se está planteando el contraste de M3 frente a M0, es decir, se trata de verificar sobre el modelo M3: H0: β2 = β4 = 0 HA: No H0 . Para lo cual se puede utilizar el estadístico F de diferencia de sumas residuales dado por: F =
SRR − SR T − k SR
r
que en este caso se concreta en: F = 2
110 − 85 25 − 4 85
Es decir: F = 3,1 < F 21 = 3,5
2
= 3,1
⇒ al nivel de significación del 5%, hay evidencia para
aceptar que la entrada de España en la CEE no ocasionó un cambio en el comportamiento de la función de consumo. 5.2. Aquí se plantea el contraste de M1 frente a M0 siendo, en este caso la H 0 formulada sobre M1 del tipo H0: β3 = 0. F= 1
F = 5,5 > F 22 = 4,3
110 − 88 25 − 3 88
1
= 5,5
⇒ al nivel de significación del 5%, hay evidencia para rechazar la
H0 y, por tanto, concluir que la entrada de España en la CEE sí que afectó a la distribución entre consumo y ahorro de una unidad adicional de renta.
6
5.3. Se trata del contraste de M2 frente a M0 siendo, en este caso la H 0 formulada sobre M2 del tipo H0: β2= 0. F =
110 − 100 25 − 3 100
1
1
= 2,2 < F 22 = 4,3
⇒
al nivel de significación del 5%, hay
evidencia para aceptar la H 0 y, por tanto, concluir que la entrada de España en la CEE no afectó a la escala de la función de consumo.
Problema 6. En un muestreo efectuado entre 100 grandes empresas de la industria química se ha obtenido el siguiente modelo de regresión estimado:
ˆ = 2,3 +0,05 T –2,4 C +1,9 F E (0,37)
(0,53)
(0,61)
donde E es el número de empleados de la empresa (en cientos de personas), T es igual a 1 si la empresa incorpora los últimos adelantos tecnológicos y 0 en caso contrario, C es igual a 1 si existen empresas competidoras en un radio de 50 Km de la empresa en cuestión y 0 en otro caso y F es igual a 1 si hay una empresa complementaria en un radio de 50 Km y 0 en otro caso. A partir de aquí, indique razonadamente si las siguientes afirmaciones son verdaderas o falsas: 6.1. Una empresa con tecnología punta tiene por término medio 5 empleados más que una que no incorpora los últimos adelantos tecnológicos. 6.2. Por cada empresa de la competencia existente en un radio de 50 Km, una empresa de la industria química contrata 240 trabajadores menos. 6.3. El coeficiente que acompaña a la variable C indica el efecto diferencialprovocado por la competencia.
Solución Problema 6. Dado que los números entre paréntesis representan las desviaciones típicas estimadas de los estimadores, podemos calcular el t-ratio asociado a cada parámetro de posición individual, resultando: t-ratio asociado al parámetro que acompaña a la variable T → 0,13. t-ratio asociado al parámetro que acompaña a la variable C → 4,52. t-ratio asociado al parámetro que acompaña a la variable F → 3,11. en consecuencia la variable T que recoge la incorporación por parte de la empresa de las últimas tecnologías no resulta significativa. 6.1. Falsa, dado que dicha variable no es significativa en la estimación. 6.2. Falsa, la interpretación no es por cada empresa de la competencia, sino que la existencia de empresas competidoras hace que las empresas químicas contraten 240 empleados menos. 6.3. Verdadera, ya que el hecho de que exista competencia o no tiene una influencia sobre el empleo autónomo reflejado por el coeficiente de la variable C.
Problema 7. El PGD de la variable y t es el siguiente:
+ β 0 xt + u t y t = α 1 + β 1 xt + u t y t = α 0
t = 1,2,…..,T-1 t = T
2 u t ∼ iid N(0, σ ) ∀ t
α 1
= 2α 0
, β 1
= 2 β 0
Razone qué tipo de resultados esperaría encontrar en términos de: 7.1. Contraste de Chow. 7.2. Estimación recursiva de los parámetros de posición. 7.3. Análisis de atípicos
Solución Problema 7.
7
7.1. En este caso tiene lugar una ruptura en la estructura paramétrica en una observación muy próxima del final de la muestra. Ello implica que el contraste de Chow tendrá muy poca potencia para detectar la existencia de la ruptura porque, con independencia de donde se situemos el punto de corte del contraste, tenderán a constituirse dos submuestras con características muy similares. 7.2. Cuando se van estimando recursivamente los parámetros de posición obtenemos unos valores de los mismos que si los representamos gráficamente en términos de T lo más probable es que hasta T-1 los valores sean muy parecidos y en el periodo T se produzca un salto. 7.3. En el análisis de atípicos, utilizando los residuos internamente o externamente estudentizados, es muy probable que detectemos un atípico en respuesta en el periodo T.
Problema 8. En la tabla adjunta aparecen los datos de beneficios ( y t ) y gastos en publicidad ( xt ) de la empresa A, tomados de los últimos 10 años. Utilizando esas series se ha estimado un MLS con los siguientes resultados: yˆ t = 5,05 + 0,70 xt FAV = 16,7 ST = 35,7 (5,6)
(4,1)
entre paréntesis aparece el t-ratio y ST es la suma total. Los elementos de la diagonal de la matriz M aparecen en la cuarta columna de la tabla y en la quinta las sumas residuales (SR t) de la estimación del mismo MLS, pero excluyendo de la muestra la observación t-ésima.
t 1 2 3 4 5 6 7 8 9 10
y t
xt
M t
SRt
6,593 7,053 7,137 7,295 8,227 8,451 9,303 5,876 10,485 12,972
2 2,5 2,5 3 4 4,5 5,5 6 7 10
0,770 0,814 0,814 0,849 0,891 0,899 0,889 0,870 0,806 0,399
13,308 13,258 13,199 13,311 13,185 13,271 13,167 0,067 12,743 11,375
Realice un análisis de puntos atípicos utilizando los residuos interna y externamente estudentizados
Solución Problema 8. Los residuos internamente estudentizados vienen dados por: b j =
uˆ j
ˆ 1 − h j σ
para cuya obtención calculamos yˆ j y posteriormente uˆ j = y j - yˆ j .
8
yˆ j
uˆ j
ˆ 1 − h j σ
b j
ˆ ( j ) σ
ˆ ( j ) 1 − h j σ
r j
6,45 6,8 6,8 7,15 7,85 8,2 8,9 9,25 9,95 12,05
0,143 0,253 0,337 0,145 0,377 0,251 0,403 -3,374 0,535 0,922
1,053 1,083 1,083 1,106 1,133 1,138 1,131 1,119 1,077 0,758
0,13 0,23 0,31 0,13 0,33 0,22 0,36 -3,01 0,50 1,22
1,38 1,38 1,37 1,38 1,37 1,38 1,37 0,09 1,35 1,.27
1,21 1,24 1,24 1,27 1,29 1,31 1,29 0,08 1,21 0,80
0,12 0,20 0,27 0,11 0,29 0,19 0,31 42,17 0,44 1,15
ˆ aplicamos SR = (1-R 2) ST y el estadístico del análisis de la varianza: Para obtener σ R FAV =
2
1 − R
k − 1
⇒ 16,7 =
2
T − k
8 R 2 1 − R
2
⇒ 16,7 –16,7 R 2 = 8 R 2 ⇒
⇒ R 2 = 16,7 / 24,7 = 0,676. ˆ = 11,5668 / 8 =1,445 ⇒ σ ˆ = 1,20. SR = (1-0,676) · 35,7 = 11,5668, por tanto, σ Teniendo en cuenta la regla habitual de comparar los b j con un punto de referencia de 2,5, podemos concluir que para el periodo 8 hay evidencia de atípico en respuesta. Los residuos externamente estudentizados se definen como: 2
r j =
uˆ j
ˆ ( j ) 1 − h j σ
ˆ ( j ) denota la desviación típica estimada del modelo omitiendo la observación j-ésima donde σ de la muestra. Este conjunto de valores los obtenemos a partir de SR t. Ya que se cumple que r j ∼ t T −k −1 , resulta claro que existe evidencia de atípico en respuesta para el periodo 8.
Problema 9. Se ha estimado por MCO, el modelo lineal general con k=3: t = 1,2,…….100 y t = xt ′ β + u t Utilizando los residuos MCO y sus cuadrados se han obtenido las siguientes funciones de autocovarianzas muestrales:
1
2
3
4
5
6
C j ( uˆ )
-0,52
1,10
-0,01
-0,31
-0,29
-0,43
2 C j ( uˆ )
-7,62
25,60
-7,92
-2,57
-5,20
-9,71
2
La estimación MV de σ es 2,89 y la media muestral de los residuos elevados a la cuarta es 86,5. Chequee la estimación de ese MLG, empleando la información anterior (utilice dL=1,4 y dU=1,5).
Solución Problema 9. A partir de la información suministrada, podemos analizar de forma inmediata el supuesto de no autocorrelación. 2
Como disponemos de las autocovarianzas, el conocimiento de la varianza de uˆ t y uˆ t , permitirá obtener la función de autocorrelación para cada una de las series.
9
C0
uˆ ∑ ˆ (u ) = t
2 t
T
2
C0 ( uˆ t ) =
1
~ 2 = 2,89 = σ
∑ [uˆ T
~2] − σ
2
2 t
=
1 T
[∑ uˆ
4 t
~ 4 − 2σ ~ 2 uˆ 2 ] = + T σ ∑ t
1 T
[∑ uˆ
4 t
~4 ] = − T σ
2
= 86,5 – (2,89) = 78,15. Los valores de la función de autocorrelación muestral para ambas series son:
1
2
3
4
5
6
r j ( uˆ )
-0,18
0,38
0.00
-0,11
-0,10
-0,15
2 r j ( uˆ )
-0,10
0,33
-0,12
-0,10
-0,03
-0,07
El valor del estadístico de Durbin-Watson viene dado por:
ˆ ) = 2 (1- r 1 ) = 2 (1 + 0,18) = 2,36 DW ≅ 2( 1- ρ Teniendo en cuenta los valores de tablas, concluimos que existe evidencia de autocorrelación en los residuos ajustándose a un esquema autoregresivo de orden 1. Calculando el estadístico de Box-Pierce resulta: Q=T
∑ r = 100 [(-0,18) 2 j
2
Q = 22,14 > χ (6) = 12,6
2
+ (0,38)2 +….+ (-0,15)2] = 22,14
⇒ existe evidencia para rechazar la H 0:
ρ 1 (uˆ ) = ρ 2 (uˆ ) = … = ρ 6 (uˆ ) = 0, al nivel de significación del 5%, es decir, hay evidencia de problemas de autocorrelación. También podemos calcular el contraste LM: 2
2
LM(1) = T r 1 = 100 · (-0,18) 2 = 3,24 < χ (1) = 3,84
⇒ acepto la H0: ρ 1 (uˆ ) = 0
y no
hay evidencia para aceptar la existencia de autocorrelación de orden 1. 2
2
2
LM(2) = T( r 1 + r 2 ) = 100 [(-0,18) 2 + (0,38)2] = 17,68 > χ (2) = 6
⇒ rechazo la H0:
ρ 1 (uˆ ) = ρ 2 (uˆ ) = 0 y hay evidencia para aceptar la existencia de autocorrelación de orden 2. 2
2
2
2
LM(3) = T( r 1 + r 2 + r 3 ) = 100 [[(-0,18) 2 + (0,38)2 + (0,00)2] = 17,68> χ (3) = 7,8
⇒
rechazo la H0: ρ 1 (uˆ )
= ρ 2 (uˆ ) = ρ 3 (uˆ ) = 0
y hay evidencia para aceptar la
existencia de autocorrelación de orden 3. 2
2
2
2
2
LM(4) = T ( r 1 + r 2 + r 3 + r 4 ) = 18,89 > χ (4) = 9,5
⇒
rechazo la H0:
ρ 1 (uˆ ) = ρ 2 (uˆ ) = ρ 3 (uˆ ) = ρ 4 (uˆ ) = 0 y hay evidencia para aceptar la existencia de autocorrelación de orden 4. La información disponible también permite estudiar el posible problema de heteroscedasticidad provocada por un esquema condicional autoregresivo (ARCH). Suponiendo un ARCH(1):
uˆ t 2 = θ0 + θ1 uˆ t 2−1 + vt
10
t = 1,2,…….100
se trata de contrastar la H 0:
θ1 = 0, a partir del estadístico TR . En nuestro caso, R = 2
2
⎡r ⎤ ⎢⎣ uˆ t 21uˆ t 2−1 ⎥⎦
2
= (0,1)2 = 0,01 , por tanto: 2
TR 2 = 1 < χ (1) = 3,84
⇒
acepto la hipótesis nula de homoscedasticidad bajo este
esquema, al nivel de significación del 5%.
Problema 10. Con objeto de analizar los principales determinantes del consumo anual de productos de bollería en España en el año 1995, se encuesta a 10.000 familias preguntándoles acerca de su renta anual ( y i ), su gasto en productos de bollería ( g i ) y el número de hijos. Con estos datos se efectúa la siguiente regresión: M1: gˆ i = 77,67+0,002 y i (1,4)
W = 2,5
SR = 9991,85
(17,0)
∑ uˆ
4 i
= 20900,8
donde SR es la suma residual y W es el estadístico del contraste de White. Se sabe también que de la estimación de la regresión auxiliar del contrate de Breusch-Pagan (planteada como zˆ i =
ˆ + β ˆ y ) se ha obtenido que σ ˆ 2 = 1,0935. β i 0 1 El MLS inicial se ha estimado igualmente agrupando las familias en función del número de hijos, distinguiendo tres categorías: familias sin hijos, familias con 1 o 2 hijos y familias con más de 2 hijos. El porcentaje de familias incluidas en cada grupo es del 30%, 40% y 30% respectivamente, de la muestra original. Los principales resultados obtenidos se resumen en: Sin hijos: SR = 2090,5 1-2 hijos: SR = 2543,2 Más de 2 hijos: SR = 5356,3 Se pide: 10.1. Analizar los problemas que presenta el modelo inicialmente propuesto, prestando atención a las cuestiones de heteroscedasticidad y permanencia estructural. Para intentar solucionar los problemas encontrados en el apartado anterior se han especificado y estimado los siguientes modelos alternativos: M2: gˆ i = 1753 – 56738400 (5,7)
W= 1,75 SR= 1998,37
y i
(-13,1)
M3: gˆ i = 1850 –53427300 (8,7)
1
1 y i
+ 80 D1i + 100 D2i W=2
SR= 983,7
(-13,2)
donde D1i toma el valor 1 para las familias de 1 ó 2 hijos y cero en el resto de los casos y D2i toma el valor 1 para las familias con más de dos hijos y cero en el resto. En el modelo M2 también se ha realizado una reestimación por grupos de familias, como la llevada a cabo en M1 con los resultados: Sin hijos: SR = 577,8 1-2 hijos: SR = 612,3 más de 2 hijos: SR =609,9 Se pide: 10.2. Compruebe si alguno de los modelos anteriores, M2 ó M3, mejora la especificación del primer modelo. 10.3. Contraste la significatividad conjunta de las variables ficticias en M3.
11
10.4. Interprete el conjunto de resultados obtenidos y haga una lectura económica del modelo M3.
Solución Problema 10. 10.1. Análisis de H0: Homoscedasticidad. as
⎯→ χ p , siendo p en Contraste de White: W= 2,5. Teniendo en cuenta que W ⎯ 2
nuestro caso igual a 2, el punto crítico es 6 con lo cual existe evidencia para aceptar la hipótesis nula de varianza constante. Contraste de Breusch-Pagan:
SE 2
as ⎯ ⎯→ χ p2 ,
siendo p el número de parámetros
incluidos en la hipótesis nula que, en nuestro caso, es 1 ya que la regresión auxiliar solo incluye a la variable y i (Renta). Para hallar la suma explicada que interviene en el contraste necesitamos conocer la ST y la SR de la ecuación auxiliar. En concreto: SR(Regr. Aux.) = 1,0935 · 9998 =10932,81 Para obtener la ST, deberemos tener en cuenta que la variable dependiente de la regresión auxiliar es:
uˆ i2 ~2 σ con lo cual:
∑ uˆ ST(Regr. Aux.) = ~ σ
4
4 i
-T=
20900,8
⎛ ⎜ 9991,8510000 ⎞⎟ ⎝ ⎠
2
− 10000 =
20900,8 0,99837
- 10000 =
= 10934,91. SE (Regr. Aux.) = ST(Regr. Aux.) - SR(Regr. Aux.) = 10934,91 - 10932,81 = 2,1. B.P. =
2,1 2
= 1,05
B.P. = 1,05 < χ 1 = 3,8 ⇒ aceptamos H0: Homoscedasticidad, al nivel de significación del 5%. 2
Contraste de Goldfeld-Quandt. Se supone que la varianza del modelo responde al número de hijos de cada familia. En consecuencia, se ordenan las observaciones de acuerdo con esa información ( sin hijos, 1-2 hijos, 2 hijos) y se elimina el grupo central que contiene 4000 observaciones, es decir, c = 4000. G.Q. = Valor
que
debemos
comparar
5356,3 2090,5 con
= 2,56
los
valores
de
F2998 (0,025) = 0,93 2998
y
2998 F2998 (0,975) = 1,07 . En este caso se cumple que G.Q. = 2,56 > 1,07 ⇒ se rechaza H0:
Homoscedasticidad, al nivel de significación del 5%, y obtenemos evidencia de que el modelo presenta problemas de varianza no constante provocados por la variable número de hijos. Análisis de H0: Permanencia estructural. La permanencia estructural se puede verificar a través del test de Chow aunque, en este caso, habrá que tomarlo con ciertas reservas dado que no se mantiene la homoscedasticidad de la perturbación. A efectos ilustrativos simplemente para su cálculo tendremos en cuenta que las submuestras se corresponden con la categorías constituidas al analizar heterocedasticidad con
12
Goldfeld-Quandt, número de hijos. Por tanto existen tres segmentos diferentes que conducen a la hipótesis nula H0:β1=β2=β3= β. F=
9991,85 − (2090,5 + 2543,2 + 5356,3) / ( p − 1)k 2090,5 + 2543,2 + 5356,3 / T − pk 4
Como F = 0,46 < F ∞ =2,4
⇒
=
0,4625 0,9996
= 0,46
aceptamos H0: Permanencia estructural, al nivel de
significación del 5%. De esta forma, el modelo propuesto presenta únicamente problemas de varianza no constante provocados por la variable número de hijos. 10.2. Comenzamos con el análisis de las mismas cuestiones anteriores en el modelo M2. Análisis de H0 : Homoscedasticidad. 2
Contraste de White: W =1,75 < χ 2 = 6
⇒ aceptamos H0: Homoscedasticidad, al nivel
de significación del 5%.
609,9
Contraste de Goldfeld-Quandt :
577,8
= 1,05.
Se cumple que 0,93<1,05<1,07
⇒
existe evidencia para aceptar H 0: Homoscedasticidad, al nivel de significación del 5%. Análisis de H0 : Permanencia estructural. F=
1998,37 − (577,8 + 612,3 + 609,9 ) / 4 577,8 + 612,3 + 609,9 / 10000 − 6 4
Como F = 275,36 > F ∞ =2,4
⇒
= 275,36
rechazamos H0: Permanencia estructural, al nivel de
significación del 5%. En cuanto al modelo M3, solo podemos analizar la cuestión de la heteroscedasticidad a través del contraste de White resultando: 2
W = 2 < χ 4 = 9,5
⇒
aceptamos H0: Homoscedasticidad, al nivel de significación del
5%. Por lo tanto y teniendo en cuenta que los t-ratios no evidencian ningún problema de falta de significatividad individual, el modelo que incorpora las variables ficticias mejora la especificación del modelo inicial. 10.3. Para contrastar M 3 la significatividad conjunta de las variables ficticias, es decir, H 0: β4= 0 se puede utilizar el estadístico F de diferencia de sumas residuales: F=
SRR − SR / r SR / T − k
=
1998,37 − 983,7 / 2 983,7 / 10000 − 4
β3 =
= 5155,3
Valor suficientemente alto como para concluir rechazando la H 0, al nivel de significación del 5%, con lo cual hay evidencia para aceptar la significatividad conjunta de las variables ficticias. 10.4. El modelo M1 presenta problemas de varianza no constante provocados por la variable número de hijos. El modelo M2 no satisface la hipótesis de permanencia estructural. El modelo M3 no presenta ninguno de estos problemas, por lo tanto es la especificación finalmente seleccionada. Tal modelo hace depender el gasto de productos de bollería de la inversa de la renta y del número de hijos de la familia. La forma de la dependencia respecto a la renta esta indicando que conforme esta crece, el gasto en bollería tiende a un umbral. El consumo autónomo estimado para cada uno de los grupos distinguidos viene dado por: a) Grupo sin hijos → 1850. b) Grupo 1 ó 2 hijos → 1850 +80.
13
c) Grupo más de 2 hijos
→ 1850 +100.
Problema 11. Se ha estimado el MLS: y t = α + β xt + u t
t = 1,2,…….,100.
bajo el supuesto de normalidad de la perturbación. El coeficiente de asimetría de los residuos MCO es 2,7 y el de kurtosis 7,8. Se pide: 11.1. Contraste el supuesto de normalidad. 11.2. Sabiendo que u t
∼ χ 2 (1), ∀ t, obtenga E[ α ˆ ], E[ β ˆ ] y E[ σ ˆ 2 ].
11.3. El economista A indica que, dados los resultados de los apartados anteriores, la especificación propuesta no tiene ninguna utilidad, mientras que el B afirma que esa especificación todavía es útil. ¿ Con cuál de ellos estaría de acuerdo?.
Solución Problema 11. 11.1. Aplicando el contraste de Jarque-Bera para verificar la hipótesis nula de normalidad, resulta: JB = T
⎡ (c.as.)2 (c.k . − 3)2 ⎤ + ⎢ ⎥ 6 24 ⎣ ⎦ 2
Como JB = 217,5 > χ (2) = 6
⇒
= 100
⎡ (2,7 )2 (7,8 − 3)2 ⎤ + ⎢ ⎥ 6 24 ⎣ ⎦
= 217,5
existe evidencia para rechazar la hipótesis nula de
normalidad, al nivel de significación del 5%.
∼ χ 2 (1), entonces E( u t ) = 1 y Var( u t ) = 2. ˆ =α+ ˆ ) = α + α k t u t ⇒ E( α k t = α +1
11.2. Si u t
∑
siendo k t
=
1 T
− x
∑
( xt − x ) ∑ ( xt − x )2 ˆ = β β
siendo wt
=
+ ∑ wt u t ⇒ E( β ˆ ) = β + ∑ wt = β
( xt − x ) ∑ ( xt − x )2 2
ˆ )= E( σ
1 T − k
trME (uu ′) =
1 T − k
trMA
⎡ E (u12 ) E(u1 u 2 ) … E(u1 u T )⎤ ⎡3 1 … 1⎤ ⎢ ⎥ ⎢ ⎥ E(u1 u 2 ) E (u 22 ) … E(u 2 u T )⎥ ⎢1 3 … 1⎥ ⎢ A = E[uu '] = = Con , dado que ⎢ ⎥ ⎢ … ⎥ … ⎢ ⎥ ⎢ ⎥ 2 ( ) ( ) ( ) E E … E uT u 2 u T ⎦⎥ ⎣1 1 … 3⎦ ⎣⎢ u T u1 2 E[u 2t] = V[u t ] + (E[u t ]) = 2 + 1 = 3 y E[u t u t ± s] = Cov[u t ; u t ±s] + E[u t ]E[u t ±s] = 0 + 1 = 1 . 2
ˆ )= En consecuencia, no hay ninguna garantía de que E( σ
σ2 =2. 2
De este modo, cuando el vector de perturbaciones se distribuye como una χ (1), los 2
estimadores MCO del parámetro α y del parámetro de dispersión σ dejan de ser insesgados mientras que al estimador MCO del parámetro β sigue siendo insesgado. 11.3. El conocimiento de la distribución de probabilidad del término de perturbación nos permite plantear la estimación MV del modelo con lo cual aseguraremos buenas propiedades
14
asintóticas de los estimadores y la posibilidad de utilizar contrastes de significatividad individual y conjunta adecuados. Todo esto no es posible cuando se plantea la estimación MCO.
Problema 12. Un equipo de investigación desea explicar el comportamiento de la tasa de desempleo de la economía nacional (variable y ) en función del stock de capital productivo del país (variable x ). Los datos observados en el periodo 1978 a 1997 son los del Cuadro 3. Con esta información se ha resuelto: Ma, una regresión estática entre y y x ; M b, una regresión donde a M a se le añade un retardo de y ; Mc, una regresión donde a M a se le añade una ficticia aditiva, la cual contiene un único valor diferente de cero. Los principales resultados de la estimación se recogen el Cuadro 1. Otros resultados relativos a esas estimaciones se adjuntan en el Cuadro 2.
CUADRO 1 Constante
xt
Ma Estimación t-ratio 6,014 10,009 0,744 8,841
M b Estimación t-ratio 6,641 4,328 0,874 4,3
Mc Estimación t-ratio 5,936 14,591 0,793 13,708
y t −1
-
-
-0,106
-0,595
-
-
Dt R 2
-
0,810 1,939
-
-4,489 0,919 0,829
-4,728
~2 σ
0,813 1,812
FAV
78,155
34,115
CUADRO 2 r 1 r 2 r 3 r 4 r 5 JB
∑ uˆ
4 t
γ 2 RW 2 R BP
96,604
Ma -0,145 -0,231 -0,316 -0,008 0,070 17,03 321,09
M b -0,039 0,330 -0,318 0,090 0,071 12,62 279,63
Mc -0,010 -0,220 0,249 -0,144 0,045 0,84 30,94
-0,055 0,044
-0,005 0,161
-0,058 0,152
0,002
0,002
0,055
donde: r j es el coeficiente de autocorrelación de orden j entre los residuos del modelo.
γ es el coeficiente de correlación entre uˆ t 2
2
y uˆ t −1 .
2 RW es el coeficiente de determinación de la ecuación auxiliar del contraste de White. 2 R BP es el coeficiente de determinación de la ecuación auxiliar del contraste de Breuch-
Pagan. Se pide: 12.1. Chequee cada una de las tres alternativas, prestando atención a las hipótesis básicas asociadas a la perturbación. 12.2. Seleccione la alternativa que considere más adecuada, justificando su decisión. NOTA: Tome dL=1,4 y d U=1,5 en todos los casos.
15
Solución Problema 12. 12.1. Análisis del modelo M a : y t = β0 + β1 xt + u t
T = 20.
- Los t-ratios indican que ambos parámetros son individualmente significativos y el análisis de la varianza permite acepta la significatividad conjunta del modelo. - Heteroscedasticidad. H0: homoscedasticidad 2
Contraste de White: 20·0,044 = 0,88, valor inferior a la χ (2) = 5,99 y, por tanto, aceptaríamos al nivel de significación del 5% la hipótesis nula de homoscedasticidad. Contraste de Breuch-Pagan. El estadístico de contraste exige calcular la suma explicada de la regresión auxiliar. Como disponemos del R 2 de dicha regresión, hallando la suma total de la misma podremos obtener la suma explicada. STBP
∑ uˆ =
4 t
~4 σ
321,09
− T =
(1,812) 2
- 20 = 77,79
2
SEBP = R BP · STBP = 0,002 · 77,79 = 0,1556 BP =
0,1556 2
= 0,078
De nuevo el valor del estadístico es menor que el punto crítico correspondiente a una 2
χ (1), con lo cual se acepta la hipótesis nula. Contraste ARCH. El estadístico, en este caso, es T veces el R 2 de la regresión auxiliar:
uˆ t 2 = α0 + α1 uˆ t 2−1 + vt . Como esa regresión se corresponde con un MLS, el R 2 será igual al 2 2 cuadrado del coeficiente de correlación entre uˆ t y uˆ t −1 , por tanto: ARCH = 20· (-0,055) 2 = 0,006 2
Este valor es pequeño e inferior al punto crítico de la χ (1), con lo cual se acepta la hipótesis nula de varianza constante. - Normalidad. H0: distribución normal. 2
JB = 17,03 > χ (2) = 5,99
⇒ se rechaza, al nivel de significación del
5%, el supuesto
de normalidad de las perturbaciones. -Autocorrelación. Contraste de Durbin-Watson. H 0: ρ =0
ˆ ) = 2(1-(-0,145)) = 2,29 DW ≅ 2(1- ρ Como 2,29 < 4- d u = 2,5
⇒ acepto H0: ρ =0, al nivel de significación del 5%.
Esto es,
no existen problemas de autocorrelación provocados por la existencia de un esquema AR(1) en las perturbaciones. Para determinar si existen problemas de autocorrelación provocados por AR ó MA de ordenes superiores, podemos aplicar el contraste de Breuch-Godfrey. 2
LM(2) = T
∑ r
2 j
= 20· [ (-0,145) 2 + (-0,231) 2] = 1,49.
j =1
2
LM(2) = 1,49 < χ (2) = 5,99
⇒
se acepta, al nivel de significación del 5%, la no
existencia de autocorrelación de orden 2. 3
LM(3) = T
∑ r
2 j
= 20· [ (-0,145) 2 + (-0,231) 2 + (-0,316) 2] = 3,48.
j =1
16
2
LM(3) = 3,48 < χ (3) = 7,81
⇒
se acepta, al nivel de significación del 5%, la
no
existencia de autocorrelación de orden 3. 4
∑ r
2 j
LM(4) = T
= 20· 0,1743 = 3,49
j =1
2
LM(4) = 3,49 < χ (4) = 9,49
⇒
se acepta, al nivel de significación del 5%, la no
existencia de autocorrelación de orden 4. Análisis del modelo M b: y t = β0 + β1 xt + β2 y t −1 u t
T = 19.
-Los t-ratios indican la significatividad individual de todos los parámetros excepto el que acompaña a la endógena retardada. El análisis de la varianza nos permite concluir con la significatividad conjunta del modelo. -Heteroscedasticidad. H0: homoscedasticidad 2
Contraste de White: 19·0,161 = 3,059, valor inferior a la χ (5) = 11,07 y, por tanto, aceptamos al nivel de significación del 5% la hipótesis nula de homoscedasticidad. Contraste de Breuch-Pagan. STBP
∑ uˆ = ~ σ
4
4 t
− T =
279,63
- 19 = 55,37
(1,939) 2
2
SEBP = R BP · STBP = 0,002 · 55,37 = 0,1107 BP =
0,1107 2
= 0,055
De nuevo el valor del estadístico es menor que el punto crítico correspondiente a una
χ 2 (2), con lo cual se acepta la hipótesis nula. Contrate ARCH. ARCH = 19· (-0,005) 2 = 0,00047 2
valor pequeño e inferior al punto crítico de la χ (1), con lo cual se acepta la hipótesis nula de varianza constante. -Normalidad. H0: distribución normal. 2
JB = 12,62 > χ (2) = 5,99
⇒
se rechaza, al nivel de significación del 5%, el supuesto de
normalidad de las perturbaciones. -Autocorrelación. Contraste h de Durbin. H 0: ρ =0 h= ρ ˆ
T ˆ ⎛ 1 − TV ⎜ βˆ ⎞⎟ ⎝ 2 ⎠
= -0,039
19 1 − 19·0,03174
= -0,26
Para obtener la varianza estimada del estimador que acompaña a la variable endógena retardada un periodo, razonamos a partir de:
ˆ ( βˆ ) = DT 2
− 0,106 − 0,595
Dado que h = -0,26 > -1,64
= 0,1781
⇒
⇒ Vˆ(βˆ ) = 0,03174 2
acepto H0: ρ =0, al nivel de significación del
decir no existen problemas de autocorrelación de primer orden.
17
5%, es
Análisis del modelo Mc: y t = β0 + β1 xt + β2 Dt + u t
T = 20.
-Tanto los t-ratios como el análisis de la varianza determinan que los parámetros son significativos individual y conjuntamente. -Heteroscedasticidad. H0: homoscedasticidad 2
Contraste de White: 20·0,152 = 3,04, valor inferior a la χ (4) = 9,49 y, por tanto, aceptaríamos al nivel de significación del 5% la hipótesis nula de homoscedasticidad. Contraste de Breuch-Pagan. STBP
∑ uˆ = ~4 σ
4 t
30,94
− T =
(0,829) 2
- 20 = 25,02
2
SEBP = R BP · STBP = 0,055 · 25,02 = 0,68 BP =
1,37 2
= 0,078
De nuevo el valor del estadístico es menor que el punto crítico correspondiente a una 2
χ (2), con lo cual se acepta la hipótesis nula. Contraste ARCH. ARCH = 20· (-0,058) 2 = 0,067 2
valor pequeño e inferior al punto crítico de la χ (1), con lo cual se acepta la hipótesis nula de varianza constante. -Normalidad. H0: distribución normal. 2
JB = 0,84 < χ (2) = 5,99
⇒ se acepta, al nivel de significación del 5%, el supuesto de
normalidad de las perturbaciones. -Autocorrelación. Contraste de Durbin-Watson. H 0: ρ =0
ˆ ) = 2(1-(-0,010)) = 2,02 DW ≅ 2(1- ρ Como 2,02 > d u = 1,5 ⇒ acepto H0: ρ =0, al nivel de significación del 5%, y no existen problemas de autocorrelación provocados por la existencia de un esquema AR(1) en las perturbaciones. Para determinar si existen problemas de autocorrelación provocados por AR ó MA de ordenes superiores, podemos aplicar el contraste de Breuch-Godfrey. 2
LM(2) = T
∑ r = 20· [ (-0,010) 2 j
2
+ (-0,220) 2] = 0,97.
j =1
2
LM(2) = 0,97 < χ (2) = 5,99
⇒
se acepta, al nivel de significación
del 5%, la no
existencia de autocorrelación de orden 2. 3
LM(3) = T
∑ r = 20· [ (-0,010) 2 j
2
+ (-0,220) 2 + (0,249)2] = 2,21.
j =1
2
LM(3) = 2,21 < χ (3) = 7,81
⇒
se acepta, al nivel de significación
existencia de autocorrelación de orden 3.
18
del 5%, la no
4
LM(4) = T
∑ r = 20· 0,1312 = 2,62 2 j
j =1
2
LM(4) = 2,62 < χ (4) = 9,49
⇒
se acepta, al nivel de significación
del 5%, la no
existencia de autocorrelación de orden 4. 12.2. El modelo M a no resulta adecuado por presentar problemas de falta de normalidad. Análogamente, el modelo M b tampoco resulta adecuado por cuanto presenta los mismos problemas de falta de normalidad. En consecuencia, el modelo finalmente seleccionado atendiendo al cumplimiento de las hipótesis básicas asociadas a la perturbación es el modelo Mc.
19
PROBLEMAS PROPUESTOS Problema 1. La asociación española de productores de cava ha observado que sus ventas en España han aumentado considerablemente en los últimos meses. Con el objeto de conocer los motivos de esta evolución decide encargar un estudio econométrico de la función de demanda. En el estudio se plantea una función de demanda del tipo CobbDouglas tal que una vez linealizada, se estima por MCO. Las variables, todas ellas expresadas en logaritmos, son las siguientes: CE: Consumo per-capita de cava, M: Gasto per-cápita en bebidas alcohólicas, PE: Precio medio del cava, PC: Indice de precios de bebidas alcohólicas, excluido el cava, PF: Indice de precios del champagne, DQ: Variable ficticia que toma valor unitario en el cuarto trimestre de cada año y cero en el resto de los casos. Utilizando una muestra de 50 datos trimestrales se estiman los siguientes modelos ^
MODELO 1. C E t = -0,073 + 1,36 M t - 0,5 PEt + 0,47 DQt (-0,24) (1,98) (-2,15) (9,97) 2 R = 0,9763 d = 1,90 F AV = 260,6 ^
MODELO 2. C E t = -0,06 + 1,3 M t - 0,5 PEt + 0,1 PCt + 0,47 DQ t (-0,19) (1,84) (-1,86) ( ) (9,53) 2 R = 0,9764 d = 1,89 F AV = 386,48 ^
MODELO 3. C E t = -0,2 + 1,7 M t - 0,6 PEt + 0,1 PFt + 0,48 DQt (-0,6 (3,01) (-3,02) (?????) (10,2) 2 R = 0,9782 d = 1,88 F AV = 222,24 donde FAV es el estadístico del análisis de la varianza. En base a esta información se pide: a) Obtenga los t-ratios que faltan en las ecuaciones 2 y 3. ¿Qué modelo resultaría preferido? b) Análisis económico de los coeficientes del modelo elegido, atendiendo al análisis de los signos y a la cuantía de los coeficientes estimados. c) Comente brevemente la siguiente afirmación: ‘Suponiendo que ambos bienes siguen una función de demanda ordinaria, podemos considerar que el champagne es un bien complementario del cava ‘.
Problema 2. Dados los siguientes modelos anidados: y t = β1 + β2 x 2t + β3 x3t + u t
y t = β1 + β2 x 2t + vt Demuestre que para contrastar H 0: β3 = 0, solo necesitamos conocer el tamaño muestral y el coeficiente de determinación de ambos modelos.
Problema 3. La ecuación que relaciona las variables y i , x 2i y x3i es la siguiente:
y i = β1 + β2 x 2i + β3 x3i + u i
( i = 1,2,….,N);
u ∼ N( 0, σ I ) 2
Sin embargo, los N individuos se han agrupado en M grupos diferentes, cada uno M
compuesto por N j individuos (
∑
N j = N ), observándose las variables agregadas Y j =
j =1
∑ y ; i
i∈ j
20
∑ x
X 2 j =
2i
y X 3 j =
i∈ j
β2 X 2 j
∑ x
3i
. Con estas M observaciones se ha estimado el modelo: Y j =
β1 +
i∈ j
+ β3 X 3 j + v j
( j = 1,2,…,M ) con v j =
∑u
i
.
i∈ j
Discuta cual sería el método eficiente de estimación del modelo agregado.
Problema 4. Dada la siguiente estimación obtenida con T = 20: yˆ t = 0,3 y t −1 - 0,6 xt (0,2)
(0,1)
d=1 dL = 0,86 dU = 1,27 Contraste, al nivel de significación del 5%, la posible existencia de autocorrelación.
Problema 5. Se desea modelizar las ventas de automóviles en el mercado aragonés. Con este fin se dispone de información anual sobre el número de vehículos vendidos ( y t ), renta per cápita (R t) así como de un índice de precios sintético para el sector del automóvil (p t). La información muestral abarca desde el año 1947 a 1996 y ha permitido estimar los siguientes modelos: M1: yˆ t = 20,3 + 0,2 R t + 0,3 p t. (8,3)
(4,1)
(1,5)
M2: yˆ t = 15,8 + 0,15 R t –0,4 pt + 0,2 y t −1 (6,9)
(3,7)
(-2,7)
(3,8)
Los valores entre paréntesis corresponden a los t-ratios. Además se dispone de la siguiente información sobre los residuos de los modelos: r j( uˆ ) M1 M2
1 0,17 -0,09
2 0,32 0,03
3 0,10 0,08
4 0,11 0,15
5 -0,05 -0,12
6 -0,04 -0,03
Examine el supuesto de incorrelación utilizando todos los instrumentos disponibles. ¿Cuál de los modelos planteados seleccionaría?. Justifique su decisión.
Problema 6. Utilizando datos de la economía española para el periodo 1964 – 1988 ( T = 25), se ha estimado la siguiente relación: ln yˆ t = -0,18 + 0,64 ln x 2t -0,25 ln x3t SR = 52,3 (-1,23)
(7,07)
(-4,62)
donde y t es consumo, x 2t renta y x3t tipo de interés. Con datos deducidos de la anterior, se han estimado también los siguientes modelos: uˆ t = 0,67 uˆ t −1
SR = 38,9
uˆ t = -0,007 –0,004 ln x 2t +0,002 ln x3t + 0,61 uˆ t −1
SR = 33,2
uˆ t = -0,002 - 0,01 ln x 2t +0,003 ln x3t + 0,57 uˆ t −1 + 0,001 uˆ t − 2
SR = 31,4
Utilizando la información anterior, analice el supuesto de incorrelación por todos los métodos posibles.
Problema 7. En un análisis acerca de los flujos comerciales españoles, un investigador pretende realizar un estudio de las exportaciones de España a 3 países para el periodo muestral 1965-1992, planteando el siguiente modelo lnY t = β1 + β2lnX2t + β3 lnX 3t + u t. Las
21
variables utilizadas son los logaritmos neperianos de: Yt, exportaciones españolas, X2t, P PIB del país destino de las exportaciones y X3t= it , precios relativos de las Pet exportaciones:
Pr eciodel país destino Pr eciode España
.
Los resultados obtenidos se resumen en el siguiente cuadro: FRANCIA USA JAPON ^ 3,83 2,71 2,23 β 1 (4,2) (3,6) (2,2) ^ -0,367 0,49 2,22 β 2 (-1,6) (3,2) (1,12) ^ -0,433 0,95 0,1 β 3 (-0,23) (2,63) (1,23) 2 0,96 0,95 0,7 R G–Q(c = 8) 1,32 2,27 2,12 d 2,04 3,72 2,20 CHOW(86) 0,23 16,22 15,22 Para realizar el test de Chow se considera como el año de posible ruptura estructural 1986 por la entrada de nuestro país en la CEE. Se pide: a) Evaluación de los tres modelos estimados. b) Plantee las soluciones que considere oportunas a los problemas existentes.
Problema 8. Se ha estimado el siguiente modelo econométrico: yˆ t = 2,3 –0,6 x1t + 0,9 x 2t con una muestra de 50 observaciones y se está estudiando el supuesto de homoscedasticidad. Se dispone de la siguiente información adicional: El gráfico de x1t contra x 2t no revela ninguna tendencia significativa. Se ha ordenado la muestra con respecto al tiempo y se han omitido las 16 observaciones centrales. Después de estimar la primera y la segunda submuestra, el valor del estadístico de Goldfeld-Quandt es GQ = 0,24. La estimación de la ecuación auxiliar del contraste de BreuschPagan es vˆt = 0,031 x1t + 0,022 x 2t , la cual proporciona una suma explicada de 0,75. Por último, la estimación de la ecuación auxiliar del contraste de White es:
uˆ t 2 = 1,32 + 0,15 x1t + 0,07 x 2t - 0,02 x12t + 0,31 x 22t - 0,32 x1t x 2t El R 2 de la regresión es 0,36, lo que conduce a un estadístico W = 6 · 0,36 = 2,16. Utilizando toda esta información concluimos que puede aceptarse el supuesto de varianza constante. Se pide: 6.1. En el planteamiento anterior parece que existen errores. Indique cuales son y cómo debería haberse resuelto el análisis. 6.2. Con la información aprovechable, contraste el supuesto de varianza constante.
Problema 9 Se ha especificado y estimado, con una muestra de 70 datos, un MLS con los siguientes resultados: SR=359.75 yˆt = 2.22 + 1.02 xt Además, se dispone de la siguiente información auxiliar: 2 uˆt
= 0.71 + 1.4 xt + ε ˆt
ST=2800.39
22
uˆt 2
= 3.66 + 4.75 xt − 0.56 xt 2 + ε ˆt
uˆt 2
= 4.64 + 0.8 zt + ε ˆt
uˆt 2
= 6.46 − 0.037t + ε ˆt
SR=2492.64
Varianzas muestrales y
6.265 1.003
x z
5.245 414.167
t
Analice la posible existencia de heteroscedasticidad con todos los instrumentos que tenga a su alcance, indicando, en su caso, la causa y la dirección a seguir para resolver el problema, si existe.
Problema 10 Se ha estimado una relación lineal entre la variable y y las variables explicativas x1 y
~ 2 de 5.2 junto con que x 2 , con una muestra de 50 observaciones, obteniéndose un valor de σ T
∑ uˆ 4t =9921.03. Además, la suma residual obtenida de la estimación del modelo utilizando las
t =1
17 primeras observaciones es 39.45 y 104.58 la deducida de la estimación del mismo empleando las 17 últimas. Por otro lado, se han realizado las siguientes regresiones auxiliares: vˆt = 0.97 + 0.93 x2t SR=272.381
vˆt = 0.058 + 0.036 t SR=313.57 vˆt = 1 + 0.015 x1t
SR=315.7
siendo vt la variable dependiente de la regresión de Breusch-Pagan. Se sabe también que la suma residual de la regresión de White es 5424.35. Analice la hipótesis de homocedasticidad con todos los instrumentos disponibles, justificando, en su caso, los posibles resultados contradictorios.
Problema 11 Un investigador (A) ha especificado la siguiente relación:
y
t
= β 0 + β1x1t + β 2 x 2 t + u t
De la estimación de dicho modelo con una muestra de 100 observaciones, se obtiene que la suma residual es 886.416. Además, se dispone de las siguientes regresiones auxiliares:
uˆ uˆ uˆ uˆ
t t t t
= 0.8uˆ t −1 + ε t = x ′ β + γ uˆ t −1 + ε t
SR=221.86
1t
= x ′t β + γ1 uˆ t −1 + γ 2 uˆ t −2 + ε 2t = x ′ β + γ1 uˆ t −1 + γ 2 uˆ t −2 + γ3 uˆ t −3 + ε t
SR=209.46 3t
SR= 208.84
En todos los casos, con x ′ β se está indicando la parte sistemática de la ecuación de t
referencia. Otros dos investigadores (B y C) consideran que este modelo incumple al menos una de las hipótesis básicas del modelo, y plantean como soluciones alternativas dos modelos, de cuyas estimaciones se obtiene la siguiente información:
23
Investigador B: y = β + δy t
uˆ uˆ uˆ uˆ
t t t t
0
t −1
+ β1x1t + β 2 x 2 t + u t
= −0.1uˆ t −1 + ε t = x ′ β + γ uˆ t −1 + ε t
SR=81.68
1t
= x ′t β + γ1 uˆ t −1 + γ 2 uˆ t −2 + ε 2t = x ′ β + γ1 uˆ t −1 + γ 2 uˆ t −2 + γ3 uˆ t −3 + ε t
Investigador C: y = β + β x + β x t
uˆ uˆ uˆ uˆ
t t t t
SR=83.27
0
1 1t
2
2t
SR=79.054 3t
+ β 3 x1t −1 + u t
= 0.82u t −1 + ε t = x ′ β + γ uˆ t −1 + ε t
SR= 78.457 SR=742.702
SR=195.3
1t
= x ′t β + γ1 uˆ t −1 + γ 2 uˆ t −2 + ε 2t = x ′ β + γ1 uˆ t −1 + γ 2 uˆ t −2 + γ3 uˆ t −3 + ε t
SR=194.67 3t
SR= 194.47
donde x ′ β tiene la misma interpretación que antes. Se pide: t
- Estudie si es correcta la afirmación de los investigadores B y C acerca del problema que presenta el modelo del primer investigador. - ¿Cuál de las dos especificaciones propuestas (B ó C) le parece adecuada? Justifique su respuesta utilizando toda la información de la que dispone.
Problema 12. Suponga que se especifica el siguiente modelo de regresión: 2 y t = β0 + β1 xt + β2 xt + u t
Determinar, razonando la contestación, con cuál o cuáles de los comportamientos siguientes es compatible esta especificación no lineal en variables: 11.1. Una variación unitaria en x genera siempre el mismo efecto sobre la variable endógena. 11.2. Una variación unitaria en x no genera siempre el mismo efecto sobre y, sino que depende de que x tome un valor reducido o elevado.
Problema 13. Se está especificando una función de consumo para las familias de la región aragonesa. Los datos de consumo se recogen en la variable y t y los de renta en xt ( t = 1946,….,1995). Se han ensayado formas funcionales diferentes: M1: y t = α + β xt + u1t M2: y t
= α + β xt (λ )
M3: ln y t
= α + β ln xt + u 3t
( λ 1 )
2
+ u 2t
con los siguientes resultados:
MODELO
M1
M2
M3
Método estimación
MCO 2,1 0,21
MV 1,6 0,07
MCO 0,8 0,01
0,8
0,6
0,9
0,12
0,05
0,17
-53,62 0,741
-31,17 0,921
-82,41 0,653
ˆ α ˆ [α ˆ] V ˆ β ˆ ˆ β V Log-verosimilitud
R 2
24
0,862
R A2
0,923
0,655
2
Siendo R A el coeficiente de determinación de la ecuación auxiliar del contraste Reset con p = 2. Se pide: 12.1. Seleccione la forma funcional que considere más adecuada. 12.2. De acuerdo con los resultados del apartado anterior, ¿cree que la elasticidad renta de las familias aragonesas es constante?. Obtenga su expresión utilizando el modelo teórico correspondiente.
Problema 14. Los economistas A y B han especificado la siguiente función de demanda en transformadas Box-Cox: ( λ )
y t 1
= α + β xt ( λ ) 2
+ u t
u t ∼ iid N(0, σ2)
Están seguros de que el parámetro λ 1 solo puede tomar tres valores: -0,5; 0 ó 0,5. Así mismo, los valores que puede tomar λ 2 se limitan a 1; 2 ó 5. El problema es que no saben cuál es el par correcto ( λ 1 , λ 2 ). El economista A sugiere la siguiente estrategia: “Linealicemos el modelo para los distintos cruces posibles, y obtengamos la estimación MCO de cada caso. A continuación nos quedaremos con la alternativa que asegure un R 2 más elevado”. El economista B coincide con el planteamiento de A aunque sugiere utilizar como criterio de selección la logverosimilitud estimada en cada modelo. Indique, razonando su decisión, con cuál de las propuestas se quedaría, A ó B.
Problema 15. En la Lonja Agropecuaria del Ebro se está estudiando la relación entre precio alcanzado en las subastas ( y t ) y cantidad total ofrecida de carne de vacuno ( xt ), utilizando datos semanales. Especifique el modelo econométrico, suponiendo una ecuación de comportamiento lineal, que mejor se ajusta a cada uno de los siguientes planteamientos: 14.1. La reacción del precio con respecto al volumen ofertado de vacuno parece diferente en aquellas semanas en las que se producen importaciones de carne de porcino. 14.2. Cuando se ofertan grandes volúmenes de carne de vacuno, tiende a aumentar la variabilidad de los precios. 14.3. La parte del precio no explicada por la oferta de vacuno mantiene una cierta dependencia temporal, que no alcanza más allá de dos semanas.
Problema 16. Para explicar la relación entre las variables y y x 1 se ha considerado la especificación general Box-Cox:
y (t λ1 )
= α + β1 x 1(λt 2 ) + u t
Utilizando 20 observaciones, la estimación máximo verosímil del mismo ofreció el siguiente resultado:
~
λ1
λ~ 2
~2 σ
0 0,5 0,00636 Se sabe que la media muestral de los logaritmos neperianos de la variable endógena es 6,995212, y se dispone también de la la siguiente información:
λ~1R
λ~ 2 R
~ 2R σ
0,0 0,0 0,0
0,4 1,0 0,0
0,006366 0,006647 0,006598
25
1,0 1,0
1,0 0,0
26250,3 36121,7
Se pide: 15.1- Contrastar si puede aceptarse que una variación unitaria de x 1 provoca una variación porcentual constante en y. 15.2- ¿Podría aceptarse que una variación unitaria en x 1 provoca una variación en y fija e independiente de los valores de las variables? 15.3- En función del resultado obtenido en los dos apartados anteriores, especifique el modelo original que le parezca más adecuado, y proporcione una interpretación económica a los coeficientes del modelo.
Problema 17. Para cada uno de los siguientes supuestos especifique un modelo económetrico (detallando qué variables se introducen y cómo se miden) donde pueda contrastarse tal afirmación, indicando las hipótesis del contraste y el estadístico de prueba asociado: 16.1- La elasticidad-precio de la demanda de petróleo en los países desarrollados (renta per cápita, rpc, igual o superior al 75% de la media de la zona UEM) es inferior en un 50% a la existente en los países subdesarrollados (rpc inferior al 25% de la zona UEM). 16.2- La demanda mundial de petróleo es poco sensible a la temperatura media del planeta. Por el contrario, el parque automovilístico mundial es un elemento que parece determinante. 16.3- El precio del petróleo responde a varios factores entre los que se puede citar el volumen de la demanda mundial, las expectativas sobre reservas futuras y el grado de consenso existente en la OPEP. La crisis política rusa apenas ha tenido incidencia al igual que los conflictos surgidos en las zonas productoras. 16.4- La energía eléctrica y la petrolífera pueden entenderse como bienes sustitutivos, de manera que por cada peseta que aumenta el precio de la primera la demanda de petróleo aumenta en un 0.2%.
Problema 18. Se dispone de información diaria sobre temperatura (y t) y consumo de energía eléctrica en Zaragoza (x t). Los datos tomados abarcan un año (364 días), con los cuales se han estimado varios modelos:
MODELO M1 2
R
= 0.940
MODELO M2 2
R
= 0.700
MODELO M3 2
R
= 0.870
MODELO M4
yˆ t
= − 106821+ 12846.3 x t ( −3.7 )
~ 2 = 1687419 σ ln yˆt
( 4.95)
=
(~ )
∑ y t = 28569996
t =1
R A
2
= 0.970
R A
2
= 0.780
2
= 0.871
( 29.3)
364
∑ ln yt = 2446.08
t =1
2.02 + 0.32 x t
( 21.55)
~ 2 = 2.08 σ y t λ1
364
= 1.07 + 2.53 ln x t
~ 2 = 3.72 σ ln yˆt
(8.0)
( 61.69)
364
∑ ln yt = 2446.08
t =1
~
= 1.39 + 0.49 x (tλ 2) ( −3.7 )
( 5.4)
26
R A
2
R
= 0.891
~2 = 1 σ
364
~ l( θ ) = −3094.67
∑ ln yt = 2446.08
t =1
2
R A
= 0.892
Donde R 2A se refiere al coeficiente de determinación obtenido en la ecuación auxiliar del contraste RESET, en la que se ha introducido en todos los casos solo un término cuadrático. ~ Además l( θ ) indica la log-verosimilitud del modelo correspondiente. Se pide: - En M4 obtenga la estimación de λ1 - Utilizando toda la información aportada seleccione el modelo que considere más adecuado.
Problema 19. La verdadera relación entre la variable y y la variable x viene dada por: γ
yt = β 1 xt
+ ε t
Sin embargo se ha especificado y estimado un modelo lineal sin término independiente. Demuestre que el sesgo existente en la estimación MCO de β1 aumenta a medida que γ toma valores mayores.
Problema 20. Indique si en las siguientes especificaciones puede encontrarse algún problema de multicolinealidad y de que tipo: 19.1. Ct = β0 +β1 Yt +β2 YR t + β3 Pt + ut. con Ct e Y t consumo y renta en términos corrientes, YR t renta en términos reales y P t el deflactor de la renta. 19.2. Mt = α0 + α1 POt + α2 Nt + α3 Dt + α4 It + ut. con Mt gasto sanitario anual en Aragón, PO t población final de año, N t y D t número de nacimientos y defunciones anuales e I t saldo migratorio anual. 19.3. R t = θ0+θ1 M t +θ2 M t −1 +θ3 M t − 2 +θ4 M t −3 +θ5 M t − 4 +θ6VAMt +θ7IPCt+ ut. con R t tipo de interés del trimestre, M t masa monetaria en circulación en el trimestre, VAMt variación en la masa monetaria a lo largo del último año e IPC t índice de precios del trimestre.
Problema 21. Se ha observado la variable y t para T individuos, estimándose el siguiente modelo:
y t = β1 D1t + β2 D2t +………+βk Dkt + ut. donde D jt toma el valor 1 si el individuo en cuestión pertenece al grupo j ( j = 1,2,..,k) y cero en otro caso. Los grupos son excluyentes. Demuestre que cada uno de los parámetros estimados presentará una varianza menor cuanto mayor sea el número de individuos que forman parte del grupo al que se asocia el parámetro.
Problema 22. Se ha estimado por MCO el modelo y t = observaciones con los siguientes resultados: yˆ t = 1,5 + 3,5 x 2t - 0,7 x3t
β1
+
β2 x 2t
+
β3 x3t + u t
utilizando 23
R 2 = 0,982
El mismo modelo se ha reestimado con la restricción β3 = 0 resultando: yˆ t = 1,2 + 3,8 x 2t R 2= 0,876 Contrastar al nivel de significación del 5%, la hipótesis nula
β3 = 0.
Problema 23. Dado el modelo y t = que el parámetro
α + β xt
+ u t ( t = 1, ….,T), se desea contrastar la hipótesis de
β es constante en el tiempo. Desarrolle una estrategia para resolver el contraste
27
empleando técnicas de regresión (especifique claramente el modelo que plantea y la hipótesis nula objeto de contraste).
Problema 24. Indique razonadamente qué tipo de problemas presenta cada una de las siguientes especificaciones: 23.1. y t = α + β xt + u t ; u t ∼ N(0,1) ∀ t ≠ 24
y t = α + β xt + u t ; u t ∼ N(0,2) t = 24 23.2. y t = α + β xt + u t ; u t
∼ N(0,1) ; xt = 3,8 ∀ t 23.3. y t = α + β xt + u t ; u t ∼ N(0,1) ∀ t ≠ 24 y t = α + β xt + u t ; u t ∼ N(1,1) t = 24 23.4. y t = α + β xt + u t u t = ε t + 0,1 ε t − 4 ; ε t ∼ N(0,1) Problema 25. Un equipo de investigación desea modelizar la evolución de la renta per cápita ( y t ) de un determinado país en función de la productividad ( x1t ) y del tipo de interés real de la economía ( x 2t ). Con 16 observaciones se han obtenido las siguientes estimaciones: M1: yˆ t = 2,99 + 0,60 x1t + 0,80 x 2t (0,025) (0,004)
R 2 = 0,99
(0,005)
SR = 0,00145
M2: ln yˆ t = 0,81 + 0,61 ln x1t + 0,22 ln x 2t (0,105)
(0,062)
R 2 = 0,99
(0,030)
SR = 0,00249
M3: ∆ yˆ t = -0,002 + 0,60 ∆ x1t +0,79 ∆ x 2t (0,005)
(0,007)
R 2 = 0,99
(0,005)
SR = 0,00260
Las FAM de los residuos de cada especificación son:
M1 M2 M3
1
2
3
4
5
0,08 0,37 0,55
-0,03 0,21 0,46
-0,02 -0,16 0,22
0,04 -0,04 0,15
0,06 -0,01 0,07
Los valores propios ( λ j) asociados a la correspondiente matriz de correlaciones de las variables explicativas de cada modelo son:
1 2 3
M1
M2
M3
0,0017 0,41 2,58
0,20 0,34 2,46
0,80 1,01 1,19
Además, para los modelos M1 y M2 se ha estimado también la ecuación auxiliar:
28
z t = xt ′ β +
4
∑α zˆ j
j t
j = 2
donde z t y xt hacen referencia a la endógena y exógenas del modelo respectivo, con sumas residuales iguales a 0,00110 en M1 y 0,00014 en M2. Utilizando toda la información, se pide: 24.1. Indique qué problema, o problemas, existen en M1 para que se hayan planteado también otras alternativas (modelos M2 y M3). En función de la respuesta anterior: 24.2. Analice los resultados de M2, ¿aceptaría esta propuesta?. 24.3. Resuelva la misma cuestión en relación a M3. 24.4. Exponga razonadamente cuál sería su decisión final.
Problema 26. Se pretende explicar las exportaciones de la economía española (variable y ) a través del tipo de cambio de la peseta con respecto al franco, marco y dólar (variables x 2, x3 y x4, respectivamente). Con datos de los últimos 50 años se han obtenido los siguientes resultados de la estimación máximo-verosimil: ˆ = 2,0 yˆ t = 62,3 –0,68 x2t –0,76 x3t +1,25 x4t R 2 = 0,98 σ (2,1)
(-0,65)
(-0,32)
(0,89)
La tabla de correlaciones entre las variables es la que aparece en el siguiente cuadro, donde en la última fila se reproducen las raíces características obtenidas en la aplicación:
y y
x2 0,82 1
x3 0,73 0,92 1
x4 0,93 0,85 0,90 1
λ 1
λ 2
λ 3
1204,8
25,3
1,2
1
x2 x3 x4
Para intentar solucionar el problema evidente en los anteriores resultados se han ensayado algunas variaciones con la forma funcional, tomando como marco de referencia el planteamiento general Box-Cox. El resumen de los resultados obtenidos es:
Parámetro asociado a : y
x2
x3
x4
1 0 -0,45
1 0 0,03
1 0 0,26
1 0 -0,89
Método estimación RESTRINGIDO RESTRINGIDO MV
ˆ σ
ˆ A σ
2,00 2,24 1,1
1,95 2,10 1,03
ˆ A indica la desviación típica estimada obtenida al añadir a la ecuación básica las donde σ potencias dos, tres y cuatro de las estimaciones de la correspondiente variable endógena de la ecuación. Además, se sabe que Σ ln y t = 0,20. Se pide: 25.1. Indique qué problemas presenta la estimación del modelo lineal inicial, utilizando todos los instrumentos que considere oportunos. 25.2. De acuerdo con los resultados reflejados en el cuadro anterior, ¿considera que alguna de las alternativas propuestas es preferible al planteamiento inicial?. Justifique su decisión.
29
Problema 27. Se dispone de una muestra de las variables y t y xt de tamaño 50, con la que se ha estimado un MLS como el siguiente: yˆ t = 5,39 – 1,74 xt
R 2 = 0,459
ST = 126,68
La función de autocovarianzas de los residuos es:
j
1
2
3
4
5
6
γ ˆ j (uˆ )
-0,162
0,108
0,071
-0,235
0,257
-0,148
2
2
Definimos además las siguientes variables: R1 t = uˆ t , R2t = uˆ t y E2t = yˆ t . Los momentos muestrales de estas variables son:
Media Varianza
R1
R2
E2
0,000 1,396
1,371 4,444
4,936 17,088
Si cada una de estas variables instrumentales, por separado, se añade al MLS estimado anteriormente, el coeficiente de determinación del modelo ampliado aparece en la segunda fila de la tabla siguiente. En la tercera fila se indica el coeficiente de correlación entre cada una de estas variables y la variable x. 2
R (Modelo amplio) Coef. Correlación con x.
R1
R2
E2
1,000 0,000
0,635 -0,313
0,569 -0,961
Analice la hipótesis de linealidad así como los supuestos de homoscedasticidad e incorrelación en relación con los resultados aportados para la estimación del MLS.
Problema 28. Para explicar la variable y, se ha especificado y estimado un Modelo Lineal Simple. De la estimación del mismo se proporciona la siguiente información:
uˆt
h tt
σˆ ( t )
r t
bt
-0,0802 0,0869 0,0325 0,1317 0,1171 -0,0384 0,0392 0,1273 0,0016 -0,1097 -0,2103 -0,0327
0,3698 0,3279 0,1936 0,0968 0,0839 0,1115 0,1585 0,2075 0,1424 0,1037 0,1004 0,1038
0,1118 0,1113 0,1161 0,1072 0,1093 0,1159 0,1159 0,1066 0,1167 0,1102 0,0904 0,1162
-0,9036 0,9524 0,3118 1,2927 1,1193 -0,3515 0,3687 1,3414 0,0148 -1,0515 -2,4527 -0,2973
-0,9109 0,9558 0,3263 1,2495 1,1031 -0,3673 0,3853 1,2894 0,0156 -1,0448 -1,9992 -0,3114
σˆ = 0,11075 Realice un análisis de puntos atípicos. Si es posible, indique cómo resolver los problemas detectados.
30
Problema 29.
Se ha especificado el MLG: yt = β0 + x1tβ1 + x2tβ2 + ut, y se conocen los siguientes resultados:
⎡20 βˆ = [X' X]−1 X' Y = ⎢⎢ 8 ⎢⎣ 4 2 R =0,98 σˆ 2 = 32,3
8 24 20
4⎤
⎥ ⎥ 18 ⎥⎦ 20
−1
⎡ 3 ⎤ ⎡ 0,083 − 0,167 0,167 ⎤ ⎡ 3 ⎤ ⎡− 0,250⎤ ⎢12⎥ = ⎢− 0,167 0,896 − 0,958⎥ ⎢12⎥ = ⎢ 1,625 ⎥ ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎢⎣ 9 ⎥⎦ ⎢⎣ 0,167 − 0,958 1,083 ⎥⎦ ⎢⎣ 9 ⎥⎦ ⎢⎣ 1,250 ⎥⎦
Indique, utilizando todos los instrumentos oportunos, qué problemas presenta esa regresión.
Problema 30. El PGD de y t es un MLS sin término constante, con parámetro β=2. La perturbación sigue un esquema AR(1) con coeficiente de autocorrelación de primer orden igual a 0,9. Dados los siguientes seis valores de xt y del ruido blanco del proceso AR(1), εt:
xt
εt
1
2
3
4
5
6
2 0,1
2,1 0,2
2,5 -0,1
3,2 0,3
3,3 0,1
3,5 0,1
Se pide: 29.1- Obtenga los valores de y t y de ut (t=1, 2, …, 6) suponiendo que u 0=0. 29.2- Obtenga una estimación insesgada del parámetro de posición. 29.3- Contraste el supuesto de incorrelación en esa estimación por todos los medios posibles. Explique las discrepacias que se producen en ese terreno. 29.4- Obtenga el sesgo del estimador MCO de
2
2
β y de σ , sabiendo que σ =1.
Problema 31. Con una muestra de 100 observaciones se ha obtenido la estimación recursiva del MLS: yt=α+βxt+ut. Los resultados aparecen en las Figuras 1 y 2. Además se ha resuelto el contraste de Chow de forma iterativa, dividiendo la muestra siempre en dos períodos y con un punto de corte moviéndose desde 4 hasta 97. La sucesión de estadísticos obtenidos se representa en la Figura 3. Utilizando la información existente en esos gráficos, indique razonadamente qué especificación propondría.
31
Problema 32. Para analizar las calificaciones de una determinada asignatura de la UZ se ha especificado el modelo: Yi = β0 + β1D1i + β2D2i + β3D1iD2i + β4Zi + ui Donde Yi es la calificación obtenida por el estudiante i, Z i son las horas de estudio invertidas en preparar la asignatura, D 1i toma valor 1 si los datos corresponden a una mujer y D 2i es otra ficticia con valor 1 si el estudiante proviene de un centro privado y cero en caso contrario. Se pide: - Aporte una interpretación precisa para cada uno de los cuatro parámetros de posición del modelo diferentes de β0. - Indique como analizaría el supuesto de que en esa asignatura se discrimina en función del centro de procedencia entre mujeres pero no entre hombres. - ¿Cómo contrastaría el supuesto de que el número de horas invertidas en la preparación de la asignatura por los estudiantes procedentes de la educación pública, no tiene ningún impacto en la calificación obtenida? En los apartados segundo y tercero indique claramente cual es la hipótesis a contrastar y con qué estadístico puede resolverse el contraste planteado.
Problema 33. Disponemos de 364 datos de las variables y t y x t Estos datos son observaciones diarias de ambas variables y se han tomado a lo largo de un año. Se sabe además que las dos variables están relacionadas a través de un MLS como:
= α + β x t + u t ⎫⎪ ⎬ 2 u t ~ iidN(0; σ ) ⎪ ⎭
yt
Sin embargo, en lugar de utilizar esa información se aplican las transformaciones siguientes: - Los datos diarios se acumulan en semanas y en la estimación se utilizan los 52 datos semanales. - Los datos diarios se acumulan en meses y en la estimación se utilizan los 12 datos mensuales. *
- Los 364 datos se convierten en 363 al agregarlos como y t = y t + y t −1 ; t = 2,...,364 . En la estimación se utilizan los 363 datos así obtenidos. Analice cada una de las alternativas propuestas y señale los problemas resultantes de esas transformaciones. En cada caso indique, detallando su propuesta, cual será el método de estimación que se debería utilizar. Por último, si tuviera que elegir entre estimar el modelo utilizando la información original o la conseguida con alguna de las tres transformaciones propuestas, ¿cuál sería su decisión?. Razone su contestación.
Problema 34. Se ha especificado un modelo lineal con tres variables explicativas:
32
yi
= β 1 + β 2 x 2i + β 3 x3i + β 4 x4i + ui
donde x3 es ortogonal con x 2 y con x 4 , mientras que el coeficiente de correlación simple entre x 2 y x 4 es próximo a 1 ( ∑ ( x 2i − x 2 )( x3i − x3 ) = ∑ ( x 4i − x 4 )( x3i − x3 ) = 0 ,
r 2,4
≈ 1 ). Demostrar que la elevada correlación entre x2
y x 4 tiene consecuencias negativas
sobre la precisión de la estimación de β 2 y β 4 , mientras que no tiene efectos sobre la estimación de β 3 .
Problema 35. De la estimación del modelo y t = información: T
β1+ β2x2t+β3x3t
+ut, se ha obtenido la siguiente
ˆ2 σ
1-25 26-75 76-100 1-100
0.8193 1.5134 1.5761 1.6256 La estimación recursiva de los parámetros del modelo se muestra en los siguientes gráficos:
beta1 2.5 2.0 1.5 1.0 0.5 0.0 1
25
49
73
97
beta 2
3.0 2.5 2.0 1.5 1.0 0.5 0.0 1
26
51
76
beta 3 2.5 2.0 1.5 1.0 0.5 0.0 1
26
51
76
Determine si la especificación inicial es la adecuada, y en caso de no serlo, proporcione una especificación que resuelva los problemas existentes.
33
Problema 36 Una empresa fabricante de prendas deportivas desea analizar los determinantes de la venta de uno de sus productos. El servicio de estudios considera que el problema se puede abordar mediante una regresión entre las ventas anuales (Vt), la renta disponible del periodo (Yt) y una variable que mida la influencia del precio sobre la ventas. En este punto se presentan ciertos problemas ya que el cálculo del verdadero índice de precios del producto (P1t) es una tarea complicada. En consecuencia, optan por aproximarse a esta variable de precios a través de un índice alternativo, P2t, pero más sencillo de calcular y que, en su opinión, puede desarrollar el mismo papel que el anterior. A partir de esta especificación, estiman dos modelos: ^
M1: V t = 0,29 + 0,04 Yt - 0,04 P2t (2,66) (0,59) (-39,67) _
2 = 0,89 d = 2,12 Chow = 3,69 LM(1) = 0,68 LM(2) = 1,37 LM(3) = 1,48
R
l = -580,06 LM(4) = 2,82
Reset = 5,80
^
M2: ln V t = -3,70 + 1,19 ln Y t - 1,54 ln P2 t (-26,07) (29,06) (-142,82) _
2 = 0,99 d = 2,06 Chow = 0,88 l = -180,06 Reset = 1,80 LM(1) = 0,68 LM(2) = 1,37 LM(3) = 1,48 LM(4) = 1,12 En la estimación se utilizó información trimestral para las diversas variables tomada durante los últimos 25 años. Asimismo, LM(p) representa el valor del estadístico de Breusch-Godfrey, l el logaritmo neperiano de la función de verosimilitud, el contraste Reset se ha calculado para p = 2 y d el estadístico de Durbin-Watson. Chow es el contraste del mismo nombre para intentar captar una posible ruptura estructural que se podía haber producido justo en la mitad de la muestra. Con esta información se pide: a) Contraste cuál de las dos formas funcionales es la más adecuada b) ¿Se puede interpretar en el modelo M1 los resultados del estadístico de Chow como evidencia en favor de la existencia de una posible ruptura estructural? ¿Por qué? c) Interprete económicamente los resultados de las estimaciones del modelo elegido. Una vez acabado el estudio, un nuevo economista indica que, tal vez, los resultados no sean correctos debido a que el índice de precios utilizado no es el adecuado. Para demostrarlo obtiene el índice de precios real y reestima las ecuaciones anteriores. Los resultados obtenidos son los siguientes:
R
^
M3: V t = 0,49 + 0,24 Yt - 0,14 P1t (2,66) (1,59) (-29,67) _
2 = 0,89 d = 2,11 Chow = 2,89 LM(1) = 0,69 LM(2) = 1,34 LM(3) = 1,28
R
l = -575,06 LM(4) = 2,12
Reset = 6,20
l = -175,06 LM(4) = 2,80
Reset = 2,10
^
M4: ln V t = -3,38 + 0,76 ln Y t - 1,45 ln P1 t (-25,05) (28,57) (-136,96) _
2 = 0,99 d = 2,07 Chow = 0,89 LM(1) = 0,68 LM(2) = 1,37 LM(3) = 1,48 En virtud de los nuevos resultados:
R
34
d) ¿Considera acertada la observación del economista? ¿Por qué?. Reinterprete el mejor de los cuatro modelos anteriores en términos económicos. En un último intento, el servicio de estudios estima un nuevo modelo introduciendo una forma funcional doblemente logarítmica donde se utilizan, como variables explicativas, las dos variables de precios. ^
M5: ln V t = -4,04 + 0,81 ln Y t + 6,49 ln P1 t - 7´94 ln P2 t (-13,76) (24´77) (2,04) (-2,50) _
R
2 = 0,99 d = 2,07
Chow = 1,15
l = -174,12
Reset = 1,90
LM(1) = 0,21 LM(2) = 0,23 LM(3) = 1,76 LM(4) = 2,76 e) El servicio de estudios, a la vista de estos resultados, se ratifica en su opinión aunque, como los dos precios son significativos, admiten la existencia de un efecto cruzado de precios. Frente a ello, el economista argumenta que tal efecto cruzado no es sino consecuencia de un evidente problema de multicolinealidad aproximada. Más aún, continúa, si tenemos en cuenta que la correlación entre los dos precios es muy elevada, el modelo M5 es cualitativamente idéntico al modelo M4. ¿Cuál de las dos últimas posturas le parece más correcta? ¿Por qué?
Problema 37. Un investigador desea modelizar la demanda de tabaco en Aragón en el periodo 1953-1976. Los modelos que estima son los siguientes _
^
M1
R 2 = 0,29
Q t = 7,3 + 0,00093 R t - 0,017 P t (18,3)
(1,78)
(-3,35)
^
M2
d=0,71
_
R 2 = 0,3
LQt = 2,42 + 0,078 LR t - 0,24 LP t
d=0,73
(10,1) (0,96) (-2,74) Las variables utilizadas en ambos modelos son Qt: consumo de tabaco en Aragón, Pt: precio del tabaco y R t: renta de los consumidores, mientras que LQt, LR t y LPt son sus respectivos logaritmos neperianos. a) Comente los resultados obtenidos Posteriormente se consideró la posibilidad de que la demanda de tabaco hubiese sufrido un cambio importante desde 1961 debido a una agresiva campaña publicitaria. A tal fin se introduce en las especificaciones anteriores una variable D t que toma valor unitario a partir de ese año y cero en otro caso. Tras la inclusión de la nueva explicativa se estiman dos nuevo modelos, cuyos resultados son los siguientes: _
^
M3
Q t = 8,42 - 0,0005 R t - 0,025 P t+ 0,44 Dt (14,11) (-0,66)
(-4,37)
(2,36)
^
M4
R 2 = 0,41 d=1,27 LM(1)=2,8 _
LQt = 4,04 - 0,08 LR t - 0,4 LPt + 0,1 Dt
R 2 = 0,65 d=1,38 LM(1)=1,8
(10,03) (-2,1) (-6,64) (4,46) b) Analice la existencia de una ruptura estruct ural en la serie original. c) Analice estadísticamente los dos últimos modelos d) Elija razonadamente el mejor los cuatro modelos estimados e) Interprete económicamente dicho modelo.
35
Problema 38. Un centro de estudios está interesado en estudiar el comportamiento de la función de consumo en España. Tras diversos trabajos, considera que las variables más adecuadas para el estudio son Y t : Consumo privado de las familias, R t : Renta nacional disponible, Pt: índice de precios. La información disponible incluye una muestra de 50 datos. Asimismo, existe una cuarta variable ficticia (Dt) que intenta recoger el efecto de la primera crisis del petróleo. A partir de esta información, se estiman diversos modelos: ^
MODELO 1.
Y t = 34,07 - 0,03 R t - 0,06 Pt (4,73)
SR = 136,6 R 2 = 0,02
(-0,14)
(0,33)
FAV = 0,07
d = 0,98 Chow(1973) = 141´23 l = -96,06 LM(1) = 16,28 LM(2) = 19,27
LM(3) = 19,97
LM(4) = 19,14
^
MODELO 2.
Y t = 11,0 + 0,54 Y t-1 + 0,13 R t (1,34) (4,15) F AV = 8,65
SR = 100,31 R 2 = 0,27 Chow(1973) = 43,96 d = 2,15 h Durbin = -2,11 l = -88,31 LM(1) = 2,26 LM(2) = 2,69 LM(3) = 3,44
(0,73)
LM(4) = 5,32
^
MODELO 3.
Y t = 13,4 + 0,64 R t - 2,95 Dt (2,38)
SR = 66,05 R 2 = 0,52
(3,79)
(-7,09)
FAV = 25,24
d = 1,93 Chow(1973) = 1,05 l = -77,90 LM(1) = 0,07 LM(2) = 0,25
LM(3) = 0,20
LM(4) = 0,85
^
MODELO 4.
Y t = 12,12 + 0,71 R t - 0,09 (Dt R t) (2,4)
SR= 65,56 R 2 = 0,52
(4,08)
(-7,15)
FAV = 25,60 d = 1,96
Chow(1973) = 0,29 l = -77,72 LM(1) = 0,14 LM(2) = 0,31 LM(3) = 0,23 LM(4) = 0,93 donde LM(p) es el estadístico de Breusch-Godfrey y l es el logaritmo de la función de verosimilitud. A partir de estos resultados considere las siguientes cuestiones: a) Contraste la existencia de autocorrelación en los modelos b) ¿Podemos afirmar que los problemas de autocorrelación existentes tienen una naturaleza dinámica?. ¿Qué otras causas pueden ser determinantes en este aspecto? c) Analice económicamente el mejor de los tres modelos planteados. d) Con respecto al modelo anterior, conteste razonadamente a los siguientes puntos: d1) ¿Cómo influyó la primera crisis del petróleo? d2) ¿Cuál es la propensión marginal al ahorro para el conjunto de la muestra?
Problema 39. El departamento de marketing de una empresa dedicada a la distribución de aceite de oliva se dispone a realizar un estudio de mercado entre 30 familias. Realiza las siguientes regresiones relacionando Qol,i (litros consumidos de aceite de oliva, por la familia i y mes) con Pol,i (Ptas/litro aceite de oliva para la familia i), Pgi,i (Ptas/litro aceite de girasol), Pma,i
36
(Ptas/litro de aceite de maiz) y R i (renta mensual de la familia i, medida en cientos de miles de pesetas). Se estiman los siguientes modelos alternativos donde L representa el logaritmo neperiano de la respectiva variable: M1:
Qol,i = 91,58 - 0,93 P ol, i+ 0,82 Pgi,i - 0,36 Pma,i + 0,54 R i (2,86) (-3,93) (4,03) (-2,12) (5,62) 2 BP=5,2 d=2,3 R =0,65 l=-105,1 SR=1936 Reset=4,80 M2: LQol,i = 4,27 - 0,89 LP ol, i+ 0,55 LPgi,i - 0,34 LPma,i + 0,74 LR i (3,54) (-4,12) (4,26) (-1,91) (5,50) 2 BP=4,01 d=2,2 R =0,66 l =37,4 SR=0,145 Reset=1,10 LQol,i = 4,49 - 0,01 P ol, i+ 0,01 Pgi,i - 0,003 Pma,i + 0,01 R i M3: (16,5) (-4,08) (4,36) (-2,23) (5,88) 2 BP=5,97 d=2,3 R =0,67 l=37,79 SR=0,14 Reset=6,50 En el estadístico de Breusch-Pagan se ha supuesto que la variable renta se asocia al posible problema de heterocedasticidad y el contraste Reset se ha calculado para p = 2 . Se pide: a) Elija la especificación más adecuada. b) Suponiendo que elegimos el modelo lineal, y sabiendo que la renta mensual media de las familias encuestadas es de 200000 ptas y que en media consumen un litro y medio de aceite de oliva al mes, indique si calificaría al aceite de oliva como un bien de lujo, de primera necesidad o como inferior. No satisfechos con las estimaciones anteriores, el departamento decide introducir dos variables ficticias D1i y D2i definidas como: D1i toma el valor 1 para las familias de menor renta y cero en el resto, y D2i toma valor 1 para la familias de renta media y cero el resto. Los modelos estimados son los siguientes: M1:Qol,i=95,12-0,84 Pol,i+0,92 Pgi,i –0,36 Pma,i+0,45 R i-0,09 (D1i R i)-0,04 (D2i R i) (2,89) (-3,27) (4,01) (-2,15) (3,59) (-0,95) (-0,96) 2 BP=5,4 d=2,3 R =0,66 l=-104,4 SR=1856 Reset=5,00 M2:LQol,i=4,42-0,79 LPol,i+0,66 LPgi,i-0,41 LPma,i+0,60 LR i-0,03 (D1i LR)-0,02 (D2i LR i) (3,61) (-3,54) (4,65) (-2,23) (3,01) (-1,8) (-1,9) 2 BP=5,38 d=2,1 R =0,85 l=39,4 SR=0,127 Reset=1,30 M3:LQol,i=4,53 - 0,01 Pol, i+0,01 Pgi,i -0,003 Pma,i+0,01 R i-0,001 (D1i R i)-0,0003(D2i R i) (16,12) (-3,41) (4,29) (-2,23) (3,77) (-0,98) (-0,9) 2 BP=5,97 d=2,3 R =0,67 l=37,79 SR=0,14 Reset=4,50 c) A la vista de los resultados aparecen discrepancias en el equipo de investigación. El investigador A piensa que el mejor modelo es el M1, mientras que el investigador B dice el mejor modelo es el M2.¿Qué investigador piensa que tiene razón? El economista C considera excelente el modelo M2. Desde esta posición, considere las siguientes cuestiones: d) ¿Cree que, económicamente, el modelo elegido es satisfactorio teniendo en cuenta las diferencias observadas según los niveles de renta? Posteriormente se decide utilizar una serie de contrastes adicionales tras estimar los modelos que se presentan a continuación: Q*ol,i = 99,23 C*- 0,91 P* ol, i+ 0,75 P*gi,i - 0,38 P*ma,i + 0,53 M4: (3,81) (-4,76) (4,55) (-2,57) (6,52) 2 BP=1,93 d=2,1 R =0,95 l=-87,5 SR=0,047 Reset=5’90 LQ*ol,i = 4,35 C* - 0,89 LP* ol, i+ 0,55 LP*gi,i - 0,34 LP*ma,i + 0,74 M5: (3,72) (-4,29) (4,30) (-2,94) (5,66)
37
BP=1,87 d=2,2 R 2 =0,98 l=-54,2 SR=0,005 Reset=1,80 LQ*ol,i = 4,56 C* - 0,01 P* ol, i+ 0,01 P*gi,i - 0,004 P*ma,i + 0,01 M6 : (20,4) (-4,96) (4,97) (-1,67) (6,85) 2 BP=3,2 d=2,1 R =0,93 l=-196,9 SR=0,08 Reset=6,20 donde el signo * en la parte superior de cada variable indica la variable transformada. e) A la vista de estas estimaciones ¿qué modelo preferiría de entre los anteriores?. Suponiendo que el modelo elegido es el M5 atienda a los siguientes puntos f) Cual es la estructura correspondiente a la varianza del término de perturbación: V(Ui). g) Discuta la naturaleza de la demanda, así como el carácter complementario, sustitutivo o independiente de los distintos aceites. A pesar de que el modelo anterior parece satisfactorio, se decide ampliar todas las especificaciones anteriores incluyendo las variables ficticias D1 y D2, con resultados:
t-ratio D1
t-ratio D2
BP
SR
R2
l
Reset
M1
-1,01 -0,89 2,08 0,045 0,95 -89,7 4,50 -1,29 -1,06 2,35 0,004 0,99 -54,80 1,20 M2 -0,93 -0,71 2,07 0,07 0,94 -108,2 5,90 M3 h) A la vista de estos resultados analice la significatividad conjunta de las variables ficticias. i) ¿Qué tipo de campaña de marketing cree más aconsejable para la empresa en cuestión?
Problema 40. El gerente del principal matadero de corderos de Zaragoza está preocupado por la variabilidad de las ventas mensuales de cordero de su empresa (Vt). Dispone de información sobre el precio del producto (PP t) y el precio de la competencia (PC t). Utilizando información procedente de 52 meses anteriores plantea dos modelos con los siguientes resultados: LVt = 4,77 - 0,89 LPP t+ 0,57 LPCt M1: (3,26) (-2,82) (14,56) BP=2,01 d=1,90 R 2 =0,83 Reset= 0,95 SR=70 LM(1)=12,1 LM(2)=24,9 LM(12)=134,56 Vt = 334,72 - 0,79 PP t+ 0,02 PCt M2: (4,24) (-2,79) (15,86) BP=1,98 d=1,98 R 2 =0,85 Reset= 6,30 SR=80 LM(1)=22,9 LM(2)=23,7 LM(12)=110,89 Se supone que la variable precio del producto se halla vinculada con el posible problema de heteroscedasticidad en el estaístico BP; LM indica el estadístico de Breusch-Godfrey y el contraste Reset se ha calculado para p = 2. a) Sabiendo que los valores críticos son dL=1,48, dU=1,63. ¿Qué modelo seleccionaría? Algunos expertos consideran que, como existe cierta inercia en el consumo, los modelos anteriores están mal especificados, por lo que deciden estimar formas alternativas. M3:
M4:
M5:
LVt = 4,63 - 0,97 LPP t+ 0,08 LPCt +0,87 LVt-1 (6,65) (-6,27) (2,01) (1,2) 2 BP=1,91 d=1,80 R =0,90 Reset= 1,30 Var[e p] =0,2 LM(1)=9,12 LM(2)=11,57 LM(12)=25,41 SR=50 σ2 =0,01 Vt = 84,3 - 0,87 PP t+ 0,18 PCt +0,7 Vt-1 (2,65) (-3,27) (3,01) (0,2) 2 BP=2,9 D-W=d=1,90 R =0,91 Reset= 5,80 Var[e p] =0,3 LM(1)=12,3 LM(2)=15,2 LM(12)=26,14 SR=70 σ2 =0,02 LVt = 5,3 - 0,97 LPP t+ 0,88 LPCt +0,27 LVt-12
38
(6,65) (-6,27) (2,01) (.....) 2 BP=1,91 d=1,80 R =0,98 Reset= 1,80 Var[e p] =0,2 LM(1)=1,12 LM(2)=1,57 LM(12)=5,41 SR=30 σ 2 =0,01 Vt = 84,3 - 0,87 PP t+ 0,18 PCt +0,17 Vt-12 M6 : (2,65) (-3,27) (3,01) (4,2) 2 BP=2,9 d=1,90 R =0,97 Reset= 7,10 Var[e p] =0,3 LM(1)=2,4 LM(2)=3,2 LM(12)=6,4 SR=40 σ 2 =0,02 b) Discuta las diferencias existentes entre el modelo M1 y el modelo M3. ¿Qué modelo seleccionaría de esos dos? c) ¿Y entre el modelo M2 y el modelo M4 ? d) Considerando ahora todos los modelos ¿Qué modelo elegiría? e) En base a la información disponible, calcule el valor del t-ratio correspondiente a la variable LV t-12 del modelo M3. Con independencia del modelo elegido en el apartado anterior, decidimos trabajar con el modelo M3. f) Calcule las ventas medias para el primer mes del próximo año 1998, sabiendo que: 1) el precio esperado del producto es de 1200; 2) el precio aproximado de la competencia será aproximadamente de 1500; y 3) se dispone de la siguiente información muestral en relación a las ventas de los anteriores meses: Diciembre 1996, 400; Enero 1997, 405; Octubre 1997, 600; Noviembre 1997, 607; Diciembre 1997, 625. g) Calcule el intervalo de confianza, al nivel de significación del 5%, para dichas ventas medias. h) Señale cuál de las siguientes afirmaciones es cierta: h1) La sensibilidad de las ventas de cordero del matadero con respecto a su propio precio es mayor en el largo plazo que en el corto. h2) La sensibilidad de las ventas de cordero del matadero al precio de la competencia es menor en el largo plazo que en el corto. h3) No existen diferencias significativas entre las respuestas a largo plazo y a corto plazo. h4) Tanto en el largo como en el corto plazo, el comportamiento de la demanda es muy inelástico.
Problema 41. Un empresario quiere estudiar los determinantes que llevan a la compra de su producto. Para ello, contrata los servicios de una empresa de consulting. Para una muestra de 100 individuos, dicha empresa estima el siguiente modelo por Mínimos ^
Cuadrados ponderados: D i = -1,3 + 0,12 Ri + 0,8 RBi, donde Di es una variable dicotómica que toma valor unitario si el individuo compra el producto y 0 si no lo compra, Ri es la renta del individuo y RBi es una variable que toma valor 1 si el individuo compra este tipo de productos durante la época de rebajas y 0 en otro caso. a) ¿Por qué es conveniente la estimación por Mínimos Cuadrados Ponderados? b) Para una persona que tiene una Renta de 10 y compra este tipo de bien en las rebajas, ¿cuál es la probabilidad de que compre el producto? c) De igual forma, para una persona que tiene una Renta de 4 y compra este tipo de bien en las rebajas, ¿cuál es la probabilidad de que compre el producto? ¿Cómo debe interpretarse ese resultado? Una segunda empresa de asesoría realiza un estudio paralelo, estimando a tal fin ^
un modelo LOGIT. Los resultados de esta estimación son los siguientes: L i = -4,7 + 0,48 Ri + 3,2 Rbi.
39