ECONOMETRÍA: MODELOS Y PRONÓSTICOS
ECONOMETRÍA: MODELOS Y PRONÓSTICOS Cuarta edición
ROBERT S. PINDYCK Massachusetts Institute of Technology
DANIEL L. RUBINFELD University of California at Berkeley
Traducción
Jorge Alberto Velázquez Arellano Traductor profesional Revisión técnica
Víctor Aguirre Torres Instituto Tecnológico Autónomo de México
Ma. Teresa López Álvarez Consultor independiente
McGRAW-HILL M É X I C O • BU E N O S A I R E S • C A R A C A S • G U A T EM A L A • LI S BO A • MA D R I D N U EVA Y ORK • SA N JU AN • SAN TAF É DE BOGO TÁ • SAN TIA GO • SAO PA ULO
AUCKLAND • LONDRES • MILÁN • MONTREAL • NUEVA DELHI • SAN FRANCISCO • SINGAPUR ST. LOUIS • SIDNEY • TORONTO
Gerente de producto: Ricardo del Bosque Alayón Supervisor de edición: Arturo González Maya Supervisor de producción: Zeferino García García
ECONOMETRIA: MODELOS Y PRONÓSTICOS Cuarta edición Prohibida la reproducción total o parcial de esta obra, por cualquier medio, sin autorización escrita del editor. DERECHOS RESERVADOS © 2001, respecto a la primera edición en español por: McGRAW-HlLL/INTERAMERlCANA EDITORES, S.A. de C.V. A Subsidiary of The McGraw-Hill Companies, Inc. Cedro Núm. 512, Col. Atlampa, Delegación Cuauhtémoc, C.P. 06450, México, D.F. Miembro de la Cámara Nacional de la Industria Editorial Mexicana, Reg. Núm. 736 ISBN 970-10-2925-9 Translated from the fourth English edition of: ECONOMETRIC MODELS AND ECONOMETRIC FORECASTS Copyright © 1998 by R. Pindick and D. Rubinfeld Copyright © 1998 by the McGraw-Hill Companies, Inc. All rights reserved. ISBN 0-07-913292-8 1234567890
098765432 01
Impreso en México
Printed in México
Esta obra se terminó de imprimir en Octubre del 2000 en Impresora OFGLOMA S.A. de C.V. Calle Rosa Blanca Núm. 12 Col. Santiago Acahualtepec México, 13 D.F. Se tiraron 7,000 ejemplares
ACERCA DE LOS AUTORES
ROBERT S. PINDYCK es Profesor Mitsubishi Bank de Economía Aplicada en la Sloan School of Management del Massachusetts Institute of Technology. El profesor Pindyck se incorporó al cuerpo docente del M.I.T. después de recibir un doctorado ahí en 1971. También ha sido Profesor Visitante de Economía en la Universidad de Tel Aviv y es Investigador Asociado del National Bureau of Economic Research. Es coautor, con Daniel Rubinfeld, de Microeconomics, que en la actualidad se encuentra en su cuarta edición. DANIEL L. RUBINFELD es Profesor Robert L. Bridges de Leyes y Profesor de Economía en la University of California, Berkeley. El profesor Rubinfeld recibió un doctorado en 1972 del M.I.T. Ha enseñado en la Suffolk University, Wellesley College y en la University of Michigan. Ha sido miembro del National Bureau of Economic Research, The Center for Advanced Study in the Behavioral Sciences y The Guggenheim Foundation, y en la actualidad es coeditor de la revista International Review of Law and Economics.
Para nuestras esposas, Nurit y Gail
CONTENIDO
EJEMPLOS PREFACIO INTRODUCCIÓN
PARTE 1
xiv XV xix
LOS FUNDAMENTOS DEL ANÁLISIS DE REGRESIÓN
1 1
Introducción al modelo de regresión 3 1.1
AJUSTE DE CURVA
1.2
DERIVACIÓN DE MÍNIMOS CUADRADOS
3 7 Apéndice 1.1
El uso del operador sumatoria
Apéndice 1.2 Derivación de los estimadores de parámetros de mínimos cuadrados 2
Estadística elemental: a revisión
13 17 20
2.1
VARIABLES ALEATORIAS
20
2.2
ESTIMACIÓN
25
2.3
PROPIEDADES DESEABLES DE LOS ESTIMADORES
30
2.4
DISTRIBUCIONES DE PROBABILIDAD
34
2.5
PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA
40
2.6
ESTADÍSTICA DESCRIPTIVA Apéndice 2.1
Las propiedades del operador de expectativas
Apéndice 2.2 Estimación de máxima verosimilitud
47 50 53
ix
CONTENIDO
3
El modelo de regresión de dos variables 3.1
EL MODELO
59
3.2
MEJOR ESTIMACIÓN LINEAL INSESGADA
63
3.3
PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA
69
3.4
ANÁLISIS DE VARIANZA Y CORRELACIÓN
73
Apéndice 3.1 Varianza del estimador de la pendiente de los mínimos cuadrados Apéndice 3.2 Algunas propiedades de los residuales de mínimos cuadrados 4
El modelo de regresión múltiple
5
EL MODELO
87
ESTADÍSTICAS DE REGRESIÓN
90
4.3
PRUEBAS F, R Y R CORREGIDA
91
4.4
MULTICOLINEALIDAD
98
4.5
COEFICIENTES ESTANDARIZADOS Y ELASTICIDADES
101
4.6
CORRELACIÓN PARCIAL Y REGRESIÓN POR ETAPAS
102
2
2
Estimación del parámetro de mínimos cuadrados
108
Apéndice 4.2 Coeficientes de regresión
109
Apéndice 4.3 El modelo de regresión múltiple en forma matricial
110
MODELOS DE REGRESIÓN DE UNA SOLA ECUACIÓN
119
Usando el modelo de regresión múltiple
121
5.1
EL MODELO LINEAL GENERAL
121
5.2
USO DE VARIABLES INDICADORAS
126
5.3
EL USO DE PRUEBAS f Y FPARA HIPÓTESIS QUE INVOLUCRAN MÁS
5.4
REGRESIQN LINEAL POR SEGMENTOS
141
5.5
EL MODELO DE REGRESIÓN MÚLTIPLE CON VARIABLES EXPLICATIVAS ESTOCÁSTICAS Apéndice 5.1 Pruebas que involucran coeficientes de variable indicadora
143 144
132
Correlación serial y heterocedasticidad
150
6.1
HETEROCEDASTICIDAD
151
6.2
CORRELACIÓN SERIAL Apéndice 6.1
7
87
4.2
DE UN PARÁMETRO
6
82 83
4.1
Apéndice 4.1
PARTE 2
59
Estimación de mínimos cuadrados generalizados
Variables instrumentales y especificación del modelo
164 177 186
7.1
CORRELACIÓN ENTRE UNA VARIABLE INDEPENDIENTE Y EL TÉRMINO DEL ERROR
187
7.2
ERRORES EN LAS VARIABLES
188
CONTENIDO
7.3
ERROR DE ESPECIFICACIÓN
7.4
DIAGNÓSTICO DE REGRESIÓN
198
7.5
PRUEBAS DE ESPECIFICACIÓN
203
Apéndice 7.1 8
Estimación de variables instrumentales en forma de matricial
Pronóstico con un modelo de regresión de una sola ecuación
11
12
211
PRONÓSTICO INCONDICIONAL
213
PRONÓSTICO CON ERRORES CORRELACIONADOS EN FORMA SERIAL
224
8.3
PRONÓSTICO CONDICIONAL Pronóstico con el modelo de regresión múltiple
231 234
Estimación de una sola ecuación: temas avanzados
239
9.1
MODELOS DE REZAGO DISTRIBUIDO
239
9.2
PRUEBAS PARA CAUSALIDAD
253
9.3
OBSERVACIONES FALTANTES
257
9.4
EL USO DE DATOS DE PANEL
261 273
Estimación no lineal y de máxima verosimilitud
277
10.1
ESTIMACIÓN NO LINEAL
278
10.2
ESTIMACIÓN POR MÁXIMA VEROSIMILITUD
285
10.3
MODELOS ARCH Y GARCH
298
Apéndice 10.1
306
Estimación por el método de momentos generalizado
Modelos de elección cualitativa
312
11.1 11.2 11.3
312 334 340
MODELOS DE ELECCIÓN BINARIA MODELOS DE ELECCIÓN MÚLTIPLE MODELOS DE REGRESIÓN CENSURADA Apéndice 11.1 Estimación de máxima verosimilitud de los modelos logit y probit
PARTE 3
207
8.2
Apéndice 9.1 Estimación de intervalos de confianza para elasticidades a largo plazo 10
192
8.1
Apéndice 8.1 9
XI
345
MODELOS DE ECUACIONES MÚLTIPLES
351
Estimación de ecuaciones simultáneas
353
12.1
INTRODUCCIÓN A LOS MODELOS DE ECUACIONES SIMULTÁNEAS
354
12.2
EL PROBLEMA DE LA IDENTIFICACIÓN
358
12.3
ESTIMACIÓN CONSISTENTE DE LOS PARÁMETROS
363
12.4
MÍNIMOS CUADRADOS DE DOS ETAPAS
365
12.5
ESTIMACIÓN DE ECUACIÓN SIMULTÁNEA CON CORRELACIÓN SERIAL Y VARIABLES DEPENDIENTES REZAGADAS
373
Xii
CONTENIDO
12.6
13
14
15
16
383
El problema de la identificación en forma matricial
Apéndice 12.2 Mínimos cuadrados de dos etapas en forma matricial
389
Apéndice 12.3 Estimación de regresión aparentemente no relacionada en forma matricial
392 398
13.1
EL PROCESO DE SIMULACIÓN
399
13.2
EVALUACIÓN DE MODELOS DE SIMULACIÓN
404
13.3
UN EJEMPLO DE SIMULACIÓN
410
13.4
ESTIMACIÓN DEL MODELO
416
13.5
MODELOS NO ESTRUCTURALES: AUTORREGRESIONES VECTORIALES
420
13.6
MODELADO CON DATOS LIMITADOS
427
Comportamiento dinámico de los modelos de simulación
434
14.1 14.2
435
COMPORTAMIENTO DEL MODELO: ESTABILIDAD Y OSCILACIONES COMPORTAMIENTO DEL MODELO: MULTIPLICADORES Y RESPUESTA DINÁMICA LA FUNCIÓN DE RESPUESTA AL IMPULSO Y AUTORREGRESIONES VECTORIALES
443 453
14.4
AJUSTE DE MODELOS DE SIMULACIÓN
457
14.5
SIMULACIÓN ESTOCÁSTICA
461
Apéndice 14.1
464
Un modelo macroeconómico pequeño
MODELOS DE SERIES DE TIEMPO
487
Suavizamiento y extrapolación de series de tiempo
491
15.1
MODELOS DE EXTRAPOLACIÓN SIMPLE
491
15.2
SUAVIZAMIENTO Y AJUSTE ESTACIONAL
502
Propiedades de las series de tiempo estocásticas
514
16.1 16.2
514
16.3 16.4
17
375
Apéndice 12.1
Introducción a los modelos de simulación
14.3
PARTE 4
MÉTODOS DE ESTIMACIÓN MÁS AVANZADOS
INTRODUCCIÓN A LOS MODELOS DE SERIES DE TIEMPO ESTOCÁSTICAS CARACTERIZACIÓN DE SERIES DE TIEMPO: LA FUNCIÓN DE AUTOCORRELACIÓN PRUEBAS PARA CAMINATAS ALEATORIAS
520 532
SERIES DE TIEMPO COINTEGRADAS
539
Apéndice 16.1
542
La función de autocorrelación para un proceso estacionario
Modelos lineales de series de tiempo
547
17.1 MODELOS DE PROMEDIO MÓVIL 17.2 MODELOS AUTORREGRESIVOS 17.3 MODELO MIXTO AUTORREGRESIVO-PROMEDIO MÓVIL
548 553 561
CONTENIDO
18
19
Xiii
17.4
PROCESOS NO ESTACIONARIOS HOMOGÉNEOS: MODELOS ARIMA
17.5
ESPECIFICACIÓN DE MODELOS ARIMA
567
Apéndice 17.1
570
Estacionariedad, invertibilidad y homogeneidad
564
Estimación y pronóstico con modelos de series de tiempo
575
18.1
ESTIMACIÓN DEL MODELO
575
18.2
VERIFICACIÓN DIAGNÓSTICA
581
18.3
PRONÓSTICOS CON ERROR CUADRÁTICO MEDIO MÍNIMO
586
18.4
CÁLCULO DE UN PRONÓSTICO
588
18.5
EL ERROR DE PRONÓSTICO
589
18.6
INTERVALOS DE CONFIANZA DE PRONÓSTICOS
590
18.7
PROPIEDADES DE LOS PRONÓSTICOS ARIMA
591
18.8
DOS EJEMPLOS
599
Aplicaciones de los modelos de series de tiempo
606
19.1
REVISIÓN DEL PROCESO DE MODELADO
607
19.2
MODELOS DE VARIABLES ECONÓMICAS: INVERSIÓN EN INVENTARIOS
608
19.3
PRONÓSTICO DE DATOS TELEFÓNICOS ESTACIONALES
613
19.4
COMBINACIÓN DEL ANÁLISIS DE REGRESIÓN CON UN MODELO DE SERIES DE TIEMPO: MODELOS DE FUNCIÓN DE TRANSFERENCIA UN MODELO COMBINADO DE REGRESIÓN Y SERIES DE TIEMPO PARA PRONÓSTICO DE FLUJOS DE DEPÓSITO DE AHORROS A CORTO PLAZO UN MODELO COMBINADO DE REGRESIÓN Y SERIES DE TIEMPO PARA PRONÓSTICO DE TASAS DE INTERÉS
19.5
19.6
TABLAS ESTADÍSTICAS SOLUCIONES A PROBLEMAS SELECTOS
617
619 624 631 639
EJEMPLOS 1.1 Promedio de calificaciones, 10 1.2 La explosión de los litigios, 12 1.3 Precios de acciones de compañías de servicio públicas, 13 2.1 Covarianza y correlación, 24 2.2 Error cuadrático medio, 32 2.3 Distribución normal, 36 2.4 Éxito en las solicitudes de empleo, 46 3.1 Promedio de calificaciones, 68 (continuación) 3.2 Gastos de consumo, 72 3.3 Ventas de automóviles al menudeo, 78 3.4 Promedio de calificaciones, 80 (continuación) 3.5 Inscripción en universidades públicas y privadas, 80 4.1 Ventas de automóviles, 89 4.1 Ventas de automóviles, 94 (continuación) 4.2 Tasas de interés, 95 4.3 Función de consumo, 96 4.4 El valor de los boletos de fútbol revendidos, 104 4.5 Ventas de bienes duraderos, 106 5.1 Una función de costo para la industria de ahorros y préstamos, 124 5.2 Predicción de precios de vinos, 125 5.3 Diferenciales de salarios, 130 5.4 Certificados de depósito, 131 5.5 Demanda de vivienda, 135 5.6 Demanda de vivienda, 138 5.7 Demanda de vivienda, 139 6.1 Gastos de vivienda, 156 6.2 Prueba de Goldfeld-Quandt, 159 6.3 Pruebas de Breusch-Pagan y White, 162 6.4 Corrección de la heterocedasticidad, 163 6.5 Carbón bituminoso, 173 6.6 Tasas de interés, 174 6.7 Consumo agregado, 177 7.1 Demanda de dinero, 197 7.2 El efecto de la contaminación del aire y el crimen en el valor de la propiedad, 201 7.3 Prueba para error de medición en un modelo de gasto público, 206 8.1 Pronóstico de promedios de calificaciones, 221 8.2 Pronóstico de tasas de interés, 222 8.3 Pronóstico de tasas de interés, 226 8.4 Pronóstico de la demanda de carbón, 227 9.1 Función de consumo, 250 9.2 Inversión en inventario, 251 9.3 El petróleo y la economía, 255 9.4 ¿Cuál fue primero: la gallina o el huevo?, 256 XIV
9.5 Ayuda a los estados, 260 9.6 Aplicaciones de patentes y gasto en investigación y desarrollo, 268 9.7 Ayuda extranjera, 271 10.1 Función de consumo, 284 10.2 Energía, clima y el valor de la vivienda residencial, 292 10.3 Prueba de la linealidad de una función de consumo, 297 10.4 Tasas de interés a largo plazo, 301 10.5 Rendimiento de acciones, 304 11.1 Predicción de incumplimiento de bonos, 317 11.2 Comportamiento de la votación, 321 11.3 Votación para un presupuesto escolar, 328 11.4 Predicción del comportamiento de asistencia a la universidad, 330 11.5 Logro ocupacional, 337 11.6 Voto del Congreso sobre Medicare, 339 11.7 La demanda de escuelas públicas, 343 12.1 Demanda de electricidad, 368 12.2 Gasto público, 372 12.3 Asistencia pública, 379 12.4 Modelo macroeconómico, 381 13.1 Modelado de la dinámica del mercado de la calefacción con petróleo, 422 14.1 Modelo St. Louis, 445 14.2 Demanda de automóviles, 448 14.3 Otro modelo macroeconométrico, 450 14.4 Comportamiento dinámico del mercado del petróleo para la calefacción, 455 15.1 Pronóstico de las ventas de una tienda de departamentos, 497 15.2 Construcción residencial nueva mensual, 505 15.3 Construcción residencial nueva mensual, 508 16.1 Tasa de interés, 526 16.2 Precios diarios de cerdos, 528 16.3 Producción porcina, 530 16.4 ¿Los precios de las mercancías siguen caminatas aleatorias?, 535 16.5 La cointegración del consumo y el ingreso, 541 17.1 Inversión en inventario, 560 17.2 Precio del papel periódico, 568 17.3 Tasas de interés, 569 17.4 Producción porcina, 570 18.1 Tasas de interés, 583 18.2 Producción porcina, 585 18.3 Pronóstico de tasas de interés, 599 18.4 Pronóstico de la producción porcina, 602
PREFACIO
Las nuevas tendencias en econometría, así como los comentarios y sugerencias de una gran cantidad de usuarios de las primeras tres ediciones de este libro, nos han conducido a realizar cambios extensos en esta cuarta edición. Hemos agregado varios temas y ejemplos nuevos y actualizado muchos de los ejemplos anteriores. Además, hemos reestructurado el libro en cuatro partes en lugar de tres. En función del contenido del libro, la parte uno abarca temas que proporcionan al estudiante una comprensión básica del modelo de regresión múltiple. El capítulo 2, que expone la estadística elemental, ha sido revisado y ampliado. También se incluye material y ejemplos nuevos sobre estadística descriptiva. La parte dos cubre temas sobre modelos de regresión de una sola ecuación. El capítulo 10 es nuevo, presenta un tratamiento profundo de la estimación no lineal y de máxima verosimilitud. La adición de este capítulo refleja la creciente importancia de estos temas en años recientes. El capítulo 10 también contiene una sección nueva sobre la estimación y uso de los modelos Arch y Garch, los cuales han encontrado muchas aplicaciones en las finanzas y la macroeconomía. Otros cambios importantes en la parte dos es que se incluye material nuevo sobre pruebas para heterocedasticidad en el capítulo 6 y la sección sobre el uso de los datos de panel en el capítulo 9. La parte tres del libro se concentra en los modelos de ecuaciones múltiples. Además de contener ejemplos nuevos y actualizados, se ha revisado gran parte de la exposición y hemos incluido un pequeño modelo macroeconómico especificado y estimado de nuevo (construido por Michael Donahue del Colby College) en el apéndice 14.1. En la parte cuatro se incluye una exposición revisada y actualizada de los análisis de series de tiempo. El capítulo 18 combina dos capítulos de la tercera edición, el primero sobre estimación y el segundo sobre pronóstico con modelos de series de tiempo. xv
XVi
PREFACIO
Como en la edición anterior, los datos para muchos de los ejemplos se han incluido en el texto mismo o en el Manual del maestro. Acompañando a esta edición, proporcionamos un disquet con los datos de los ejemplos. El Manual del maestro contiene las respuestas a todas las preguntas planteadas al final de los capítulos. Todas las preguntas empíricas se relacionan con los conjuntos de datos proporcionados en el texto y en el Manual del maestro, además de incluirse en el disquet, de modo que los maestros puedan usar en forma directa las tareas en sus cursos. Al elaborar este libro para la cuarta edición, nos hemos beneficiado mucho de los comentarios y críticas de nuestros colegas y estudiantes al igual que de las sugerencias que nos hicieron una gran variedad de personas. Agradecemos a Steven Dietrich y Annette Hall, quienes nos ayudaron a planear y editar la primera edición; a Bonnie Lieberman y Susan Norton, quienes ayudaron con la segunda edición, y a Scolt Stratford, quien inspiró nuestro trabajo para la tercera edición. Lucille Sutton y sus asociados en McGraw-Hill han sido de gran ayuda en la preparación de esta cuarta edición. No nos es posible agradecer a todas las personas que nos proporcionaron ayuda con esta nueva edición, pero deseamos agradecer en especial a Sergio Schmukler, quien nos ayudó a redactar de nuevo y actualizar muchos de los ejemplos; a Michael Donahue, quien elaboró el nuevo modelo macroeconómico que aparece en el apéndice del capítulo 14, y a Jeanette Sayre y Lynn Steele, por proporcionar un valioso apoyo editorial y administrativo. También deseamos dar las gracias a nuestros colegas Ernst Berndt, Bronwyn Hall, Paul Ruud y Thomas Stoker por ofrecernos numerosos comentarios y sugerencias útiles. También deseamos agradecer a los revisores que nos orientaron durante la planeación y elaboración de la cuarta edición; Walter Park de la American University; Houson Stokes de la University of Illinois-Chicago; William Parke de la University of North Carolina, Chapel Hill; Walter Mayer de la University of Mississippi; Mukhtar M. Al de la University of Kentucky; Tom Taylor de la Wright State University; Cari Moody del College of William and Mary; David Selover de la Wesleyan University; Steven Hansen de la Western Washington University. Además, debemos mencionar a algunas de las personas que han establecido correspondencia con nosotros, sugiriendo muchos cambios y mejoras para el libro. Nos referimos a Imad Al-Akhdar del Central Bank of Jordán; Walter Bell de la Princeton University; Christiaan Heij y Marius Ooms de la Universidad Erasmo en Rotterdam; Hiroyuki Kawakatsu de la University of California en Irvine, California; Huston McCulloch de la Ohio State University; Jeffrey Perloff de la University of California en Berkeley; Roben Rycroft del Mary Washington College; Sergio Schmukler de Berkeley, California, y Kenneth White de la University of British Columbia. También nos gustaría extender nuestro agradecimiento a Data Resources Incorporated, subsidiaria de McGraw-Hill, Inc., por poner a nuestra disposición su base de datos Citibase para el desarrollo de muchos de nuestros ejemplos, a David Lilien y Quantitative Micro Software de Irvine, California, por permitirnos usar el programa de software EVIEWS, y a Bronwyn Hall y TSP International por su oferta comparable de su programa PC-TSP.
PREFACIO
XVii
El Manual del maestro se actualizó a partir de la tercera edición. Se encuentran disponibles dos guías en software: el manual EVIEWS de Hiroyuki Kawakatsu y el manual TSP de Sergio Schmukler. Estas guías en software, al igual que el Manual del maestro, pueden obtenerse en forma directa en McGrawHill. Robert S. Pindyck Daniel L. Rubinfeld
INTRODUCCIÓN
Las personas que pretendan predecir el futuro serán consideradas alborotadoras bajo la subdivisión 3, sección 901 del código criminal, y se harán acreedoras a una multa de 250 dólares y lo seis meses de prisión.
Sección 889, Código de Procedimientos Penales del Estado de Nueva York. Este libro es una introducción a la ciencia y el arte de construir y usar modelos. Al contrario de las leyes penales de Nueva York, dirigidas a aquellos que pretendan predecir con bolas de cristal, creemos que estos modelos pueden ser una herramienta de pronóstico muy útil. La ciencia de la construcción de modelos consiste de un conjunto de herramientas cuantitativas que se usan para construir y luego probar representaciones matemáticas del mundo real. La elaboración y uso de estas herramientas se incluyen bajo el encabezado temático de la econometría. El arte de construir modelos es, por desgracia, difícil de describir con palabras, pues consiste principalmente de juicios intuitivos que se hacen durante el proceso de modelado. En vista de que no hay reglas definidas para hacer estos juicios, el arte de la construcción de modelos también puede ser difícil de dominar. No obstante, uno de los propósitos de este libro es transmitir la naturaleza de este arte. Esto se logrará en parte con ejemplos y exposiciones de la técnica, pero también alentando a los lectores a construir sus propios modelos. El libro se centra en modelos de procesos que se producen, en general, en el comercio, la economía y las ciencias sociales. Estos modelos de procesos pueden incluir modelos de actividad económica agregada, las ventas de una empresa individual o un proceso político. Como podría esperarse, pueden usarse y a menudo se han usado muchos tipos de modelos para pronóstico y análisis de políticas. Este libro no intenta abarcar el espectro de los tipos de modelos y metodologías de modelado; en lugar de ello, se concentra en modelos que pueden expresarse en forma de ecuación, relacionando variables en forma cuantixix
XX
INTRODUCCIÓN
tativa. Entonces, se usan los datos para estimar los parámetros de la ecuación o ecuaciones, y las relaciones teóricas se prueban en forma estadística. Esto aún deja una gama bastante amplia de modelos de donde escoger. En un extremo de esta gama podría determinarse el efecto de políticas monetarias alternativas en el comportamiento de la economía estadounidense, construyendo un modelo econométrico grande de ecuaciones múltiples de la economía y luego simularlo usando diferentes políticas monetarias. El modelo resultante sería bastante complicado y supondría explicar una estructura compleja en el mundo real. En el otro extremo de la gama podría desearse pronosticar el volumen de ventas de una empresa y, creyendo que dichas ventas siguen un patrón cíclico fuerte, usar un modelo de series de tiempo para extrapolar a partir del comportamiento pasado de las ventas. Esta gama de modelos es el tema de este libro y el objetivo es dar al lector alguna comprensión de la ciencia y arte de determinar qué tipo de modelo construir -el más apropiado-, probar el modelo en forma estadística y luego aplicarlo a problemas prácticos en pronóstico y análisis. 1
¿POR QUÉ MODELOS?
Muchos de nosotros a menudo usamos o hacemos pronósticos de una forma u otra. Pocos de nosotros reconocemos, sin embargo, que alguna clase de estructura lógica o modelo, está implícita en cada pronóstico. Considere, por ejemplo, que un corredor de bolsa le dice que el Promedio Industrial Dow Jones se elevará el próximo año. El corredor de bolsa puede haber hecho este pronóstico debido a que el promedio Dow Jones se ha elevado durante los años anteriores y el corredor siente que sea lo que sea que ha hecho que aumente continuará haciéndolo en el futuro. De manera alternativa, el sentimiento de que el Dow Jones se elevará el próximo año puede resultar de una creencia de que esta variable está vinculada con un conjunto de variables económicas y políticas a través de una serie de relaciones compleja. El corredor de bolsa puede creer, por ejemplo, que el promedio Dow Jones está relacionado, de cierta manera, con el producto interno bruto y con las tasas de interés, de modo que dadas otras creencias acerca del comportamiento futuro más probable de esas variables, parecería probable un incremento en el promedio Dow Jones. Si tenemos que encontrar una palabra para describir el método por el que nuestro corredor de bolsa hizo este pronóstico, es probable que dijéramos que fue intuitivo, aunque la cadena de razonamiento difirió de manera considerable en los dos casos citados antes. Pero en cada caso estaba involucrada alguna forma implícita de construcción de modelo. Un corredor de bolsa que ha basado el pronóstico optimista para el promedio Dow Jones en incrementos anteriores en efecto ha construido un modelo de series de tiempo que extrapola tendencias pasadas al futuro. Si, en lugar de ello, el pronóstico estaba basado en un conocimiento de la economía, aún estaría involucrado de manera implícita un modelo; estaría compuesto de las relaciones que fueron concebidas en forma vaga en la mente del corredor de bolsa como resultado de su experiencia pasada.
INTRODUCCIÓN
XXi
Por tanto, incluso un pronosticador intuitivo construye algún tipo de modelo, quizá sin percatarse de que lo hace. Por supuesto, es razonable preguntar ¿por qué uno podría querer trabajar con un modelo explícito para producir pronósticos? ¿Valdría la pena, por ejemplo, que nuestro corredor de bolsa leyera este libro para construir un modelo explícito, estimarlo y probarlo en forma estadística? Nuestra respuesta es que hay varias ventajas en trabajar con modelos de manera explícita. Construir modelos obliga al individuo a pensar con claridad y explicar todas las interrelaciones importantes implicadas en un problema. Fiarse de la intuición puede ser peligroso a veces debido a la posibilidad de que se ignoren o se usen de manera inapropiada relaciones importantes. Además, es importante que las relaciones individuales sean validadas de alguna manera. Por desgracia, generalmente no se hace esto cuando se realizan pronósticos intuitivos. Sin embargo, en el proceso de construir un modelo, una persona debe validar no sólo el modelo en conjunto sino también las relaciones individuales que forman el modelo. Al hacer un pronóstico, también es importante proporcionar una medida de la precisión que esperamos del pronóstico. El uso de métodos intuitivos, por lo general, impide cualquier medida cuantitativa de confianza en el pronóstico resultante. El análisis estadístico de las relaciones individuales que forman un modelo, y del modelo como un conjunto, hace posible adjuntar una medida de confianza a los pronósticos del modelo. Una vez que se ha construido un modelo y se ha adecuado a los datos, puede usarse un análisis de sensibilidad para estudiar muchas de sus propiedades. En particular, pueden evaluarse los efectos de cambios pequeños en variables individuales en el modelo. Por ejemplo, en el caso de un modelo que describe y predice tasas de interés, uno podría medir el efecto en una tasa de interés particular de un cambio en el índice de inflación. Este tipo de estudio de sensibilidad sólo puede realizarse si el modelo está en forma explícita. 2
TIPOS DE MODELOS
En este libro se examinan tres clases generales de modelos que pueden construirse para propósitos de pronóstico o análisis de políticas. Cada una implica un grado diferente de complejidad de modelo y supone un nivel diferente de comprensión acerca de los procesos que uno está tratando de modelar. Modelos de series de tiempo En esta clase de modelos suponemos no saber nada sobre la causalidad que afecta a la variable que estamos tratando de pronosticar. En lugar de ello, examinamos el comportamiento pasado de una serie de tiempo a fin de inferir algo acerca de su comportamiento futuro. Cada método usado para producir un pronóstico puede implicar el uso de un modelo determinista simple como una extrapolación lineal o el uso de un modelo estocástico complejo para pronóstico adaptable. Un ejemplo del uso del análisis de series de tiempo sería una extrapolación simple de una tendencia pasada en la predicción del crecimiento de la pobla-
XXii
INTRODUCCIÓN
ción. Otro ejemplo puede ser la elaboración de un modelo estocástico lineal complejo para número de pasajeros en una línea aérea. Los modelos de series de tiempo se han usado para el pronóstico de la demanda de capacidad para la aerolínea, la demanda telefónica estacional, el movimiento de las tasas de interés a corto plazo y otras variables económicas. Estos modelos también son útiles en particular cuando se sabe poco acerca del proceso subyacente que uno está tratando de pronosticar. La estructura limitada de los modelos de series de tiempo los hace confiables sólo a corto plazo, pero no obstante son bastante útiles. Modelos de regresión de una sola ecuación En esta clase de modelos la variable bajo estudio es explicada por una función única (lineal o no lineal) de un número de variables explicativas. La ecuación a menudo será dependiente del tiempo (es decir, el índice de tiempo aparecerá de manera explícita en el modelo), de modo que uno puede predecir la respuesta a través del tiempo de la variable bajo estudio ante los cambios en una o más de las variables explicativas. Un ejemplo de un modelo de regresión de una sola ecuación podría ser una ecuación que relacione una tasa de interés particular, como la tasa de un bono de Tesorería a tres meses, con un conjunto de variables explicativas como la oferta de dinero, el índice de inflación y la tasa de cambio en el producto interno bruto. Modelos de ecuaciones múltiples En estos modelos la variable que se va a estudiar puede ser una función de diversas variables explicativas, las cuales ahora son relacionadas entre sí al igual que la variable bajo estudio por medio de un conjunto de ecuaciones. La construcción de un modelo de ecuaciones múltiples comienza con la especificación de un conjunto de relaciones individuales, cada una de las cuales es ajustada a los datos disponibles. La simulación es el proceso de resolver estas ecuaciones simultáneamente sobre algún intervalo. Un ejemplo de un modelo de ecuaciones múltiples sería un modelo completo de la industria textil estadounidense que contiene ecuaciones que explican variables como la demanda textil, la producción textil, el empleo de trabajadores de producción en la industria textil, la inversión en la industria y los precios textiles. Estas variables se relacionarían entre sí y con otras variables (como el ingreso nacional total, el índice de precios al consumidor y las tasas de interés) por medio de un conjunto de ecuaciones lineales o no lineales. Dadas las suposiciones acerca del comportamiento futuro del ingreso nacional, las tasas de interés, etc., uno podría simular este modelo en el futuro y obtener un pronóstico para cada una de las variables del modelo. Un modelo como éste puede usarse para analizar el impacto en una industria de los cambios en variables económicas externas. Los modelos de ecuaciones múltiples explican mucho la estructura del proceso real que se está estudiando. Es decir, no sólo se especifican relaciones individuales, el modelo también explica la interacción de todas estas interrelaciones. Por tanto, un modelo de cinco ecuaciones en realidad contiene más
INTRODUCCIÓN
XXiii
información que la suma de cinco ecuaciones de regresión individuales. Esto es, el modelo no sólo explica las cinco relaciones individuales sino también describe la estructura dinámica implicada por la operación simultánea de estas relaciones. La elección del tipo de modelo a elaborar implica hacer intercambios entre tiempo, energía, costos y la precisión deseada del pronóstico. La construcción de un modelo de simulación de ecuaciones múltiples puede requerir grandes gastos de tiempo y dinero. Las ganancias de este esfuerzo pueden incluir una mejor comprensión de las relaciones y estructura involucrada al igual que la capacidad para hacer un mejor pronóstico. Sin embargo, en algunos casos estas ganancias pueden ser lo bastante pequeñas para ser superadas por los grandes costos implicados. Debido a que el modelo de ecuaciones múltiples necesita una buena cantidad de conocimiento sobre el proceso que se está estudiando, la construcción de estos modelos puede ser extremadamente difícil. La decisión de construir un modelo de series de tiempo, por lo general, ocurre cuando se sabe poco o nada sobre los determinantes de la variable que se está estudiando, cuando se dispone de una gran cantidad de puntos de datos y cuando el modelo se va a usar en gran medida para pronósticos a corto plazo. Sin embargo, dada alguna información sobre los procesos relacionados, puede ser razonable que un pronosticador construya ambos tipos de modelos y compare su desempeño relativo. 3
QUÉ CONTIENE EL LIBRO
El libro está dividido en cuatro partes, cada una de las cuales contiene una clase diferente de modelos. La clase más fundamental, expuesta en la primera y segunda partes del libro, es el modelo de regresión de una sola ecuación. Estos métodos econométricos elaborados y usados para construir modelos de regresión de una sola ecuación encontrarán aplicación, con modificaciones, en la construcción de los modelos de ecuaciones múltiples y los modelos de series de tiempo. Los capítulos 1 y 2 inician la parte uno con una introducción a los conceptos básicos del análisis de regresión y una revisión de la estadística elemental. Luego se desarrolla en detalle el modelo de regresión, comenzando con un modelo de dos variables en el capítulo 3 y procediendo hasta el modelo de regresión múltiple en el capítulo 4. El capítulo 5 da comienzo a la parte dos, continuando el desarrollo del capítulo 4 de las pruebas y procedimientos estadísticos que pueden usarse para evaluar un modelo de regresión. En las técnicas de estimación usadas en el análisis de regresión simple se requiere que se hagan ciertas suposiciones acerca de los datos y del modelo y a veces estas suposiciones no se cumplen. En los capítulos 6 y 7 se inicia una exposición de lo que puede hacerse en algunos de estos casos. El capítulo 6 trata de la heterocedasticidad y la correlación serial e incluye pruebas estadísticas para estos problemas al igual que los métodos de estimación que los corrigen. El capítulo 7 trata del error de medición y los erro-
XXiV
INTRODUCCIÓN
res causados por una especificación errónea, concentrándose además, en la elaboración de la técnica de estimación por variable instrumental y diagnósticos de la regresión. El capítulo 8 expone el uso de un modelo de regresión de una sola ecuación para propósitos de pronóstico. El capítulo no sólo expone los métodos con los que se produce un pronóstico sino también las medidas que describen la confiabilidad de éste, como los intervalos de confianza y el error del pronóstico. Los últimos tres capítulos en la parte dos presentan una visión más amplia del modelo de regresión. Estos capítulos son un poco más avanzados y pueden ser omitidos por estudiantes principiantes. El capítulo 9 trata de los problemas de observaciones faltantes, modelos de retraso distribuido, el uso de datos de panel y las pruebas de causalidad. El capítulo 10 expone la estimación no lineal y la de máxima verosimilitud, incluyendo los modelos Arch y Garch. El capítulo 11 trata de los modelos en los que la variable que se va a explicar es de naturaleza cualitativa. En estos modelos se incluyen los modelos de probabilidad lineal, probit, logit y de regresión censurada. Los fundamentos de econometría de las partes uno y dos son esenciales para la elaboración de modelos de ecuaciones múltiples en la parte tres del libro. Esta parte comienza con un capítulo sobre técnicas de estimación particulares para modelos de ecuaciones simultáneas. Éste incluye problemas de identificación del modelo al igual que técnicas como mínimos cuadrados en dos etapas y en tres etapas. Los capítulos 13 y 14 exponen la metodología para construir y usar modelos de ecuaciones múltiples. El capítulo 13 es una introducción a los modelos de simulación en los que se incluyen una exposición del proceso de estimación, métodos para evaluar los modelos de simulación, métodos alternativos para estimar modelos de simulación y enfoques generales de la construcción de modelos. El capítulo 14 es de naturaleza más técnica y expone métodos para analizar el comportamiento dinámico de los modelos de simulación, además de incluir aspectos de estabilidad del modelo, multiplicadores dinámicos y métodos para afinar y ajustar modelos de simulación. El capítulo 14 concluye con una exposición del análisis de sensibilidad y de la simulación estocástica. Se construye un macromodelo pequeño de la economía estadounidense y se usa para un análisis simple de políticas en el apéndice del capítulo. La parte cuatro de este libro está dedicada a los modelos de series de tiempo, los cuales pueden verse como una clase especial de los modelos de regresión de una sola ecuación. Por tanto, las herramientas econométricas elaboradas en las partes uno y dos encontrarán una aplicación extensa en la parte cuatro. Los capítulos 15 y 16 dan inicio a la parte cuatro, en éstos se exponen técnicas de suavización y extrapolación básicas, introducen las propiedades básicas de las series de tiempo aleatorias al igual que la noción de un modelo de series de tiempo. El capítulo 16 también expone las propiedades de las series de tiempo estacionarias y no estacionarias, la función de autocorrelación, las pruebas de raíz unitaria y el concepto de series de tiempo cointegradas. Los capítulos 17 y 18 elaboran métodos, por medio de los cuales se especifican, estiman y usan para el pronóstico los modelos de series de tiempo. El capítulo 17 cubre los modelos de series de tiempo lineales en detalle, incluyendo
INTRODUCCIÓN
XXV
modelos de promedio móvil, modelos autorregresivos, modelos mixtos y por último modelos de series de tiempo no estacionarias. El capítulo 18 desarrolla métodos de regresión que pueden usarse para estimar un modelo de series de tiempo como también métodos para verificación diagnóstica que pueden usarse para asegurar lo bien que se "ajusta" a los datos el modelo estimado. El capítulo 18 también trata del cálculo del pronóstico con error cuadrático medio mínimo, el error de pronóstico y los intervalos de confianza del pronóstico. El último capítulo de la parte cuatro se dedica por completo a ejemplos de la construcción y uso de los modelos de series de tiempo. Después de que revisamos el proceso de modelado, construimos modelos de diversas variables económicas y los usamos para producir pronósticos a corto plazo. Por último, demostramos cómo pueden construirse modelos que combinen series de tiempo con análisis de regresión. 4
USO DE HERRAMIENTAS MATEMÁTICAS
Este libro está escrito en un nivel bastante elemental, y puede ser comprendido por lectores con un conocimiento limitado de cálculo y sin conocimiento del álgebra matricial. Las derivaciones y pruebas matemáticas, por lo general, se reservan para los apéndices o se suprimen por completo. En las partes uno y dos del libro, la elaboración del modelo de regresión en forma matricial se incluye en los apéndices. Por tanto, la mayor parte del libro, si no es que todo, deberá ser accesible para los estudiantes de licenciatura avanzados como para los estudiantes graduados. Es deseable que el lector tenga algunos antecedentes de estadística. Aunque el capítulo 2 contiene una revisión breve de probabilidad y estadística, un estudiante sin estos antecedentes puede encontrar algunas dificultades en algunas partes del libro. De manera típica, este libro se usaría en un curso de econometría aplicada o de pronóstico comercial que un estudiante podría tomar después de terminar un curso introductorio de estadística. 5
USOS ALTERNATIVOS DEL LIBRO
El libro tiene el propósito de tener un espectro amplio de usos. Estos usos en los planes de estudio incluyen un curso de licenciatura o introductorio de posgrado sobre econometría y un curso de licenciatura o de posgrado en pronóstico de negocios. Además, este libro puede ser de valor considerable como libro de referencia para personas que hacen análisis estadísticos de datos económicos y comerciales o para el científico social o analista de negocios interesados en la aplicación de modelos de simulación dinámica para pronóstico o análisis de políticas. La cobertura en un curso introductorio de econometría o de pronóstico de negocios dependerá en alguna medida, por supuesto, de los antecedentes de los estudiantes y las metas del maestro. El énfasis en el uso de técnicas econométricas con el propósito de pronosticar proporcionará un enfoque, pero se dispone
XXVi
INTRODUCCIÓN
de otras alternativas. A continuación enumeramos varios usos alternativos del libro, pero enfatizamos que por la variedad del material se deja una buena cantidad a criterio del maestro. 1. Econometría para licenciatura (un semestre) a) Estándar Parte uno: capítulos 1 a 4 Parte dos: capítulos 5 a 7; porciones de los capítulos 8 a 11 opcionales b) Énfasis en la simulación Parte uno: capítulos 1 a 4 Parte dos: capítulos 5, 6, 8 Parte tres: capítulos 12 a 14 Ambos cursos omitirían todos los apéndices de matrices. 2. Primer año de posgrado en econometría a) Un semestre Parte uno: capítulos 1 a 4 Parte dos: capítulos 5, 6, 8; capítulos 9 a 11 opcionales Parte tres: capítulos 12 a 14 Fragmentos de lo anterior y los apéndices pueden ser opcionales. b) Dos semestres Parte uno: capítulos 1 a 4 Parte dos: capítulos 5 a 11 Parte tres: capítulos 12 a 14 Parte cuatro: capítulos 15 a 17; algunas secciones del capítulo 17 a 19 opcionales El énfasis en la simulación y/o el análisis de series de tiempo dependería del interés del maestro. 3. Pronóstico de negocios (posgrado o estudiantes de licenciatura avanzados) a) Un semestre Parte dos: capítulo 8 más una revisión de los capítulos 1 a 7 Parte tres: capítulos 13, 14 Parte cuatro: capítulos 15 a 19 (fragmentos seleccionados) b) Dos semestres Parte uno: capítulos 1 a 4 Parte dos: capítulos 5 a 8 Parte tres: capítulos 12 a 14 Parte cuatro: capítulos 15 a 19 4. Métodos cuantitativos para el análisis de políticas a) Licenciatura, un semestre Parte uno: capítulos 1 a 4 Parte dos: capítulos 5 a 8 Parte tres: capítulos 13, 14 b) Posgrado, un semestre Parte uno: capítulos 1 a 4 Parte dos: capítulos 5 a 8 Parte tres: capítulos 12 a 14
INTRODUCCIÓN
XXVii
c) Posgrado, dos semestres Parte
uno: capítulos 1 a 4 Parte dos: capítulos 5 a 8; capítulos 9 a 11 opcionales Parte tres: capítulos 12 a 14 Parte cuatro: capítulos 15 a 19
El libro también puede ser usado para cursos sobre modelado cuantitativo en ciencias sociales (como se enseña en los departamentos de sociología o ciencias políticas). Es probable que un curso así que use este libro como texto abarcaría la mayor parte de las partes uno a tres. 6
¿QUÉ DISTINGUE A ESTE LIBRO DE OTROS?
La mayor parte de los libros de texto sobre econometría elaboran el modelo de regresión de una sola ecuación como una entidad autónoma y aislada. El lector a menudo infiere que los modelos de regresión estadística son algo distintos e independientes de otros aspectos del modelado, así como el análisis de la estructura dinámica del modelo y el uso de análisis de series de tiempo para pronosticar una o más variables exógenas en el modelo. Por supuesto que éste no es el caso. Al elaborar un modelo de ecuación múltiple, por ejemplo, uno debe estar informado no sólo de los métodos de regresión sino también acerca de la forma en que el comportamiento dinámico de un modelo resulta de la interacción de sus ecuaciones individuales. Creemos que esta amplitud en la cobertura es deseable. Las técnicas de simulación y de series de tiempo que forman las partes tres y cuatro de este libro, por lo general, sólo son presentadas en un nivel avanzado. Sentimos que la ventaja de este libro es que la cobertura es amplia e incluye estas técnicas avanzadas pero está presentado en un nivel que puede ser comprendido y apreciado por un estudiante principiante.
PARTE
UNO LOS FUNDAMENTOS DEL ANÁLISIS DE REGRESIÓN
La parte uno de este libro trata de los conceptos más básicos del modelado econométrico, centrándose en los modelos de regresión de una sola ecuación, los cuales son simples en la forma, pero bastante poderosos en función de la variedad de sus posibles aplicaciones en los negocios y la economía. En estos modelos, la variable bajo estudio se considera una función lineal de diversas variables explicativas. Los modelos de regresión de una sola ecuación son importantes, no sólo porque pueden usarse para probar hipótesis y para pronosticar, sino también debido a que forman la base para el análisis de modelos de ecuaciones simultáneas y modelos de series de tiempo. En el capítulo 1 se exponen los conceptos elementales de ajuste de curvas y la noción de mínimos cuadrados. El capítulo 2 contiene una revisión extensa de las ideas estadísticas básicas que son necesarias para los análisis que siguen. En el capítulo 3 el modelo de dos variables se usa como un medio para enfocarse en las propiedades estadísticas que son necesarias para las estimaciones de parámetros de regresión. Este capítulo pone énfasis en la prueba de hipótesis y en la medición de la bondad de ajuste. El capítulo 4 extiende el modelo de regresión al caso de variables múltiples. La presencia de más de una variable explicativa en el modelo de regresión conduce a problemas econométricos adicionales, incluyendo la multicolinealidad que afecta la interpretación de los coeficientes de regresión. También se comentan las estadísticas de regresión adicionales que ayudan con estos problemas.
1
CAPÍTULO
1
INTRODUCCIÓN AL MODELO DE REGRESIÓN
En este capítulo comenzamos nuestra exposición de la econometría con el modelo de regresión lineal de dos variables. En la primera sección, se comenta el ajuste de la curva usando un ejemplo basado en los promedios de calificaciones de los estudiantes. Se presenta el criterio de mínimos cuadrados para el ajuste de la curva y se compara con varios esquemas alternativos para este ajuste. En la segunda sección derivamos el procedimiento de estimación de mínimos cuadrados. El capítulo concluye con tres aplicaciones elementales de la técnica de regresión de mínimos cuadrados.
1.1 AJUSTE DE CURVA Los datos que resultan de la medición de variables pueden provenir de cualquier cantidad de fuentes y en diversas formas. Los datos que describen el movimiento de una variable a lo largo del tiempo son llamados datos de series de tiempo y pueden ser diarios, semanales, mensuales, trimestrales o anuales. Los datos que describen las actividades de personas individuales, empresas u otras unidades en un punto dado en el tiempo son llamados datos de corte transversal. Estos datos pueden ser empleados, por ejemplo, en un estudio de mercado que tiene que ver con los gastos familiares en un tiempo dado. También podrían usarse para examinar un grupo de declaraciones de contabilidad comercial, con el propósito de estudiar patrones de comportamiento entre empresas individuales en una industria. Los datos combinados, los cuales combinan datos de series de tiempo y de corte transversal, pueden usarse para estudiar el comportamiento de un grupo de empresas a lo largo del tiempo.
3
4
PARTE UNO: Los fundamentos del análisis de regresión
CUADRO 1.1 PROMEDIO DE CALIFICACIONES E INGRESO FAMILIAR Y
X
(promedio de calificaciones)
(ingreso de los padres en miles de dólares)
4.0
21.0
3.0 3.5 2.0 3.0 3.5
15.0 15.0 9.0 12.0 18.0 6.0 12.0
2.5 2.5
Supóngase que estamos interesados en la relación entre dos variables X y Y. Para describir esta relación de manera estadística necesitamos un conjunto de observaciones para cada variable y una hipótesis que exponga la forma matemática explícita de la relación. El conjunto de observaciones se llama muestra} Nos interesaremos inicialmente en el caso en que se supone que la relación entre X y y es lineal, es decir, descrita por una línea recta. Dada la linealidad, nuestro objetivo es especificar una regla por la que pueda determinarse la "mejor" línea recta que relacione a X y Y. Por ejemplo, supóngase que deseamos probar la hipótesis de que el promedio de calificaciones de un estudiante puede explicarse por el ingreso económico de sus padres. Se obtuvieron (hipotéticamente) ocho puntos muéstrales que se describen en el cuadro 1.1. y se colocaron en una gráfica como un diagrama de dispersión en la figura 1.1. Pueden elegirse muchas líneas rectas para ajustar los puntos, una de ellas podría conectar los puntos del valor menor de X con el valor mayor de X (línea l 1 ), o se podría dibujar una línea punteada que parezca ajustarse a la dispersión completa de puntos (línea l 2 ). Un procedimiento mejor podría ser elegir una línea de modo que la suma de las distancias verticales (positiva y negativa) de los puntos en la gráfica a la línea sea cero. (Estas distancias, conocidas como desviaciones, se muestran en la figura 1.2). Este criterio aseguraría que a las desviaciones que son iguales en magnitud e iguales en signo se les da igual importancia. Por desgracia, este procedimiento tiene la propiedad indeseable de que las desviaciones que son iguales en tamaño pero de signo opuesto se cancelan, y como resultado, se podría encontrar una línea (o más de una, respecto a eso) que tenga una suma de desviaciones igual a cero pero que no se ajuste a los datos como se pretende. Se puede mejorar este método si minimizamos el valor absoluto de las desviaciones de los puntos muéstrales de la línea ajustada. Aquí está implícito el juicio de que la importancia de la desviación es proporcional a su magnitud. Aunque la minimización de la suma de las desviaciones absolutas es atractiva, 1 Los datos de una muestra son observaciones que se han elegido de una población subyacente, la cual representa la relación verdadera bajo estudio.
CAPITULO 1: Introducción al modelo de regresión
5
Figura 1.1
Diagrama de dispersión.
sufre de varias desventajas. La primera es que el procedimiento es difícil desde el punto de vista del cálculo. También podría ser que las desviaciones grandes serán tratadas con una atención relativamente mayor que las desviaciones pequeñas. Por ejemplo, es probable que una predicción que implique un error de dos unidades se consideraría peor que una predicción que implicara dos errores de una unidad cada uno. Existe un procedimiento cuyo cálculo es simple y que penaliza relativamente más los errores grandes que los errores pequeños. Éste es el método de míniFigura 1.2 Desviaciones.
PARTE UNO: Los fundamentos del análisis de regresión
mos cuadrados. El criterio de mínimos cuadrados es el siguiente: Se dice que la "línea de mejor ajuste" es aquella que minimiza la suma de las desviaciones al cuadrado de los puntos de la gráfica desde los puntos de la línea recta (con distancias medidas en
forma vertical). Veremos en los dos capítulos siguientes que los mínimos cuadrados también son convenientes porque permiten realizar pruebas estadísticas. En este libro nos basaremos mucho en el procedimiento de mínimos cuadrados, pero también hay otras técnicas de estimación que son factibles y en ocasiones deseables. Podemos ver cómo los mínimos cuadrados se relacionan con algunas de estas técnicas alternativas observando la figura 1.3a y b. En la figura 1.3a se presenta la gráfica de la desviación de un punto de los datos desde la línea recta en el eje horizontal y la "pérdida" asociada con esta desviación en el eje vertical. Con los mínimos cuadrados, la pérdida asociada con cada desviación individual es esa desviación al cuadrado. Con la estimación del valor absoluto mínimo, la pérdida es el valor absoluto de la desviación. Las funciones de pérdida asociadas con los mínimos cuadrados y con los valores absolutos mínimos, son simétricas con respecto al signo de la desviación, pero la función de pérdida de mínimos cuadrados penaliza más las desviaciones grandes que la función de pérdida del valor absoluto mínimo. Un problema con los mínimos cuadrados ocurre cuando hay una o más desviaciones grandes. Supóngase que se cometió un error de reporte con respecto al promedio de calificaciones del primer estudiante, habiéndose reportado
Figura 1.3 a) Función de pérdida b) función de pérdida alternativa.
a) Pérdida
CAPÍTULO 1: Introducción al modelo de regresión
7
una calificación de 1.0 en lugar de la cifra correcta de 4.0. Si la línea l2 en la figura 1.1 fuera considerada como una posible línea de mínimos cuadrados, la desviación asociada con el primer punto de los datos sería muy grande y la desviación al cuadrado sería aún más grande. La recta de mínimos cuadrados de mejor ajuste cambiaría en forma considerable, es decir, su pendiente se haría más plana. La penalidad grande asociada con los mínimos cuadrados ha forzado al procedimiento de estimación a poner mayor énfasis en la relación entre la línea recta y el primer punto de los datos. El resultado es que la pendiente (y el intercepto) de la recta de mínimos cuadrados es muy sensible a los puntos que se encuentran lejos de la verdadera línea de regresión. Llamamos puntos atípicos a aquellos puntos que están a más de una cierta distancia de la línea de regresión. Por supuesto, los puntos atípicos pueden representar información importante acerca de la relación entre diversas variables, por tanto, nunca deben desecharse sin un mayor análisis. El examen cuidadoso de los puntos atípicos puede ayudarnos a encontrar errores, en cuyo caso puede hacerse una corrección. ¿Qué puede hacerse con respecto a la sensibilidad de los mínimos cuadrados con los puntos atípicos? La solución más simple es volver a calcular la recta de mínimos cuadrados eliminando el punto atípico. Al reportar tanto la pendiente de mínimos cuadrados original como la nueva y las intersecciones, podemos determinar la sensibilidad de nuestros resultados ante la presencia de puntos atípicos. Debido a que la decisión es arbitraria respecto a cuáles son puntos atípicos, un procedimiento mejor colocaría relativamente menos peso en las desviaciones grandes. Un ejemplo de este procedimiento se da en la figura 1.3b, en la cual se muestra una función de pérdida que es menos sensible a los puntos atípicos que los mínimos cuadrados o el valor absoluto mínimo.
1.2 DERIVACIÓN DE MÍNIMOS CUADRADOS El propósito de construir relaciones estadísticas es, por lo general, predecir o explicar los efectos de una variable resultante de los cambios en una o más variables predictoras o explicativas. Para la dispersión de puntos en la figura 1.1, podemos escribir la ecuación lineal Y = a + bX, donde Y, la variable de la izquierda, es llamada variable dependiente y X, la variable de la derecha, es llamada variable independiente. Debido a que se trata de explicar o predecir movimientos en Y, es natural elegir como nuestro objetivo la minimización de la suma vertical de las desviaciones cuadráticas a partir de la recta ajustada.2 2
En general, nuestra decisión de escribir una ecuación en la forma Y = a + bX, en lugar de la forma inversa X = A + BY, implica que se ha hecho un juicio de que los movimientos en la variable Y son "causados" por movimientos en la variable X y no viceversa. Por tanto, en el ejemplo del promedio de calificaciones hemos asumido de manera implícita que el promedio de calificaciones es determinado por el ingreso familiar. Si revisamos nuestra opinión de la causalidad a una que establezca que el ingreso familiar es determinado por el promedio de calificaciones, escribiríamos la ecuación X = A + BY y de acuerdo con esto estaría nuestro criterio de ajuste de curvas. Esto es importante debido a que las dos ecuaciones generan dos rectas de regresión diferentes.
8
PARTE UNO: Los fundamentos del análisis de regresión
Para obtener la fórmula de mínimos cuadrados para calcular los valores de a y b, debemos usar algunas herramientas matemáticas básicas. Se sugiere una revisión del apéndice 1.1, el cual habla acerca de las propiedades de los operadores de sumatoria y enfatizamos que no es importante que se entiendan todos los detalles sobre el uso de derivados parciales. El criterio de los mínimos cuadrados puede replantearse de manera formal como sigue: (1.1)
donde Ŷi= a + bXi representa la ecuación para una línea recta con un intercepto a y pendiente b. En esta notación Yi es el valor real de Y para la observación i y corresponde al valor de X para esa observación, mientras que N es el número de observaciones. Ŷi, llamado valor ajustado o pronosticado de Yi, es el valor de Y en la línea recta asociado con la observación Xi. Esto puede verse con claridad en la figura 1.4, donde la desviación se calcula restando el valor ajustado de Yi del valor real. Es decir, para cada observación en X, hay una desviación correspondiente del valor ajustado del valor real de Y. La suma de cuadrados de estas desviaciones es la que deseamos minimizar y que nos permitirá (en el capítulo 3) calcular una medida de lo bien que se ajusta la línea recta a los datos. El problema es elegir valores para a y b que minimicen la expresión en la ecuación (1.1). Esto puede hacerse usando cálculo elemental o álgebra. Los detalles de la derivación del cálculo se estudiarán en el apéndice 1.1.3 Como se muestra ahí, las soluciones de mínimos cuadrados para la pendiente y el intercepto son: (1.2) (1.3) donde Y y X son las medias muéstrales de Y y X, respectivamente. Ahora consideremos cómo las fórmulas en las ecuaciones (1.2) y (1.3) se simplifican en el caso especial, donde X y Y tienen medias muéstrales igual a 0. Primero, escribiendo de nuevo la ecuación (1.3), notamos que:
a = Y − b X = 0
(1.4)
3 Alentamos al lector a seguir la derivación para familiarizarse más con nuestra notación y nuestro uso de los operadores de sumatoria.
CAPÍTULO 1: Introducción al modelo de regresión Figura 1.4 Valores ajustados.
Por tanto, cuando las medias muéstrales de X y Y son 0, el intercepto de la línea de regresión ajustada será 0. Para obtener la estimación de la pendiente correspondiente en este caso especial, se divide tanto el numerador como el denominador de la ecuación (1.2) entre N2:
Sustituyendo Y y X nos da
Pero Y = X = 0 por suposición. Por consiguiente,
(1.5) El hecho de que la ecuación (1.5) sea menos complicada que la ecuación (1.2) sugiere que simplificará las cosas e incrementará nuestra comprensión si escribimos los estimadores de mínimos cuadrados en función de variables que son expresadas como desviaciones de sus respectivas medias muéstrales, sean o no estas medias cero. Para hacer esto, transformamos los datos a forma de desviaciones expresando cada observación en X y Y en términos de desviaciones de sus respectivas medias:
Con esta definición, el estimador de la pendiente de mínimos cuadrados .puede obtenerse (en el caso general) directamente de la ecuación (1.5), en vista de que las variables x y y tienen media cero.4 En efecto hemos centrado los datos mo4
Por ejemplo,
9
10
PARTE UNO: Los fundamentos del análisis de regresión
viendo el origen de la gráfica que relaciona X y Y a la media muestral. En este caso las variables en minúscula son versiones "centradas" de las variables en mayúscula. El estimador de la pendiente de mínimos cuadrados es: (1.6) El proceso de centrado que transforma las variables en forma de desviaciones se describe en la figura 1.5 a y b. La línea de regresión se representa en la gráfica a usando las observaciones originales, mientras que en b se usan las desviaciones. Nótese que las pendientes estimadas de ambas líneas de regresión son idénticas. Esto es obvio a partir de la ecuación (1.6), en vista de que sólo las variables en forma de desviaciones entran en el cálculo. Sin embargo, el intercepto de la línea de regresión en la figura 1.5b es idénticamente igual a 0. Esto se deriva de la ecuación (1.4) y del hecho de que x y y¯ son iguales a 0. Por tanto, si elegimos trabajar con los datos en forma de desviaciones, se mueve el origen de la línea de regresión a la media muestral pero no se altera la pendiente. Observe también que la línea en la figura 1.5b pasa por el origen. Esto es equivalente al hecho de que la línea en la figura 1.5a pasa por el punto de las medias ( Y , X ).
EJEMPLO 1.1
Promedio de calificaciones
En el ejemplo del promedio de calificaciones descrito en el texto, el procedimiento de mínimos cuadrados nos permite obtener un intercepto de 1.375 y una
Figura 1.5 Uso de la forma de desviaciones.
Ingreso familiar (en miles de dólares) a) Recta de regresión original
b) Regresión transformada x= X - 1 3 . 5 y= V-3.0
CAPÍTULO 1: Introducción al modelo de regresión
11
pendiente de .12, produciendo la línea Ŷ = 1.375 + .12X.5 Los detalles de los cálculos aparecen en el cuadro 1.2. (La línea de regresión l2 y los puntos de los datos originales se muestran en la figura 1.2.) Para cualquier ingreso familiar dado X, la línea de regresión nos permite predecir un valor para el promedio de calificaciones Y. Por ejemplo, un ingreso familiar de 12 mil dólares nos llevaría a un promedio de calificaciones pronosticado de Ŷ= 1.375 + .12(12) = 2.815. Aunque el promedio de calificaciones pronosticado no dará necesariamente una estimación exacta cada vez, proporcionará una buena aproximación. Por ejemplo, podríamos notar que los dos estudiantes en la muestra original (véase el cuadro 1.1) con padres que tienen ingresos de 12 mil dólares tenían promedios de calificaciones de 3.0 y 2.5. El promedio de calificaciones pronosticado resulta encontrarse entre los dos puntos de datos reales. La pendiente nos dice que un cambio de mil dólares en el ingreso familiar conduciría a un cambio esperado de .12 en el promedio de calificaciones. El valor positivo para la pendiente es consistente con la hipótesis de que los estudiantes con promedios de calificaciones relativamente altos vienen de familias con ingresos relativamente altos. El interceptó de 1.375 nos dice que si el ingreso familiar fuera proyectado a cero, la mejor predicción para el promedio de calificaciones sería 1.375. En vista de que ninguna de las familias en nuestra muestra tenía un ingreso cercano a cero, no confiaremos mucho en este resultado.
CUADRO 1.2
5 A lo largo de la parte uno de este libro colocamos un "sombrero" encima de la variable dependiente para denotar el valor ajustado. Relajaremos esta regla en otras partes del texto para simplificar la presentación.
12
PARTE UNO: Los fundamentos del análisis de regresión
El modelo de regresión lineal de dos variables se examinará con mucho mayor detalle en el capítulo 3, pero es apropiado hacer aquí un comentario final. En el modelo Y = a + bX, la inclinación b es una estimación de dY/dX, la razón de un cambio en Y para un cambio en X Esto nos permite interpretar la pendiente de regresión en forma bastante natural. La interpretación de el intercepto, sin embargo, depende de si se dispone de suficientes observaciones cercanas a X= 0 para producir resultados estadísticamente significativos. Si éste es el caso, se puede interpretar el intercepto como un estimado de Y cuando X = 0. Sin embargo, si no se dispone de suficientes observaciones, la intersección tan sólo es la altura de la recta de mínimos cuadrados.
EJEMPLO 1.2
La explosión de los litigios
¿Qué tan rápido ha crecido con el tiempo el número de casos presentados en los tribunales de Estados Unidos, y qué tan constante ha sido este crecimiento? Un estudio reciente proporciona información útil sobre las tendencias en las demandas de derechos civiles.6 Usando datos de series de tiempo trimestrales para el periodo que comienza en el segundo trimestre de 1977 y llega al tercer trimestre de 1988, se estimó una ecuación de regresión que relaciona el número de demandas presentadas por trimestre Y, con una variable de tendencia de tiempo T, la cual se define igual a 1 en el segundo trimestre de 1977 y con un incremento de 1 en cada trimestre posterior. La ecuación estimada es: Ŷ = 13.00 + 51.03T El coeficiente de la pendiente de regresión nos dice que en efecto hay una explosión, en el número de casos presentados incrementándose por poco más de 51 en cada trimestre. Por supuesto, una ecuación de regresión no es esencial para calcular este índice de crecimiento de los litigios. Veremos en el capítulo 3 que una Ventaja importante, del enfoque de la regresión, es que nos permite determinar la significación estadística de la estimación de la razón de crecimiento. El estudio encontró que el crecimiento de los litigios no fue constante a lo largo del periodo y que este crecimiento es sensible al ciclo comercial; entre mayor es el índice de desempleo U, es más probable que se presenten demandas de derechos civiles. La ecuación de regresión estimada es: Ŷ= -144.38 + 168.91U
6 Véase P. Siegelman y J.J. Donohue III, "The Selection of Employment Discrimination Disputes for Litigation: Using Business Cycle Effects to Test the Priest-Klein Hypothesis", Journal of Legal Studies, vol. 24, pp. 427-462, junio de 1995. Estos resultados reportados son una simplificación del estudio, considerablemente, más completo descrito en el artículo.
CAPÍTULO 1: Introducción al modelo de regresión
13
Esta ecuación nos dice que para cada incremento del 1% en el índice de desempleo, se presentaron casi 170 casos adicionales.
EJEMPLO 1.3
Precios de acciones de compañías de servicio públicas
Como parte de un ambicioso estudio financiero corporativo, se ha planteado la hipótesis de que las razones entre precio e ingresos para las compañías de servicio públicas son influidas por sus razones entre deuda y capital contable. Esto es razonable, en vista de que uno esperaría que una razón mayor entre deuda y capital contable conduciría a un patrón de ingresos más variable para una compañía y que este riesgo añadido conduciría a un precio menor de las acciones, y por tanto a una razón menor entre precio e ingresos. El modelo puede expresarse de manera formal como: Y = a + bX donde Y= la razón entre precio e ingresos de la compañía (el precio de una acción de la reserva común dividida entre los ingresos por acción) X = su razón entre deuda y capital contable (deuda a largo plazo dividida entre la deuda más el capital contable) Esperamos que b tenga un valor negativo pero no tenemos una expectativa a priori respecto al valor del intercepto. Se obtuvieron observaciones para las variables Y y X para un corte transversal de compañías de servicio públicas (en un punto fijo en el tiempo). El resultado de la regresión lineal es: Ŷ = 10.2 - 4.07X El coeficiente de -4.07 parece confirmar la hipótesis planteada. Sin embargo, para conocer con más detalle cuánta confianza debemos tener en la hipótesis, necesitamos usar algunas de las pruebas estadísticas que se exponen en el capítulo 2.
APÉNDICE 1.1 El uso del operador sumatoria
Debido a que muchas proposiciones elementales en econometría implica» el uso de sumas de números, será útil revisar (o conocer) los signos de sumatoria. A lo largo del libro la letra griega sigma mayúscula Σ, representa la sumatoria de los valores de cada una de las observaciones para una variable. Por ejemplo, supon-
14
PARTE UNO: Los fundamentos del análisis de regresión
gamos que X representa la variable "ingreso familiar". Entonces, usando la notación con subíndices, se escribe: X 1 , X 2 , . . ., X N
y representan los valores tomados por cada una de las N observaciones de ingre… so familiar. Entonces el ingreso familiar total (X1 +X2 + +XN) puede representarse como (A1.l)
Las siguientes reglas del operador sumatoria son útiles. Regla 1 La sumatoria de una constante por k veces una variable es igual a la constante por la sumatoria de esa variable.
(A1.2) Regla 2 La sumatoria de la suma de observaciones en dos variables es igual a la suma de sus sumatorias. N
N
N
Σ (Xi + Yi) = Σ Xi + Σ Yi
i =1
i =1
(Al.3)
i =1
Regla 3 La sumatoria de una constante sobre N observaciones es igual al producto de la constante por N. N
Σ k = kN
(A1.4)
i =1
Usando estas tres reglas, se pueden obtener algunos resultados útiles concernientes a las medias, varianzas y covarianzas de variables aleatorias. En vista de que estos conceptos se exponen en forma más completa en el capítulo 2, nos restringiremos aquí a una exposición de propiedades algebraicas (en lugar de estadísticas). Primero, definiremos que la media o promedio de N observaciones en la variable X es:
(A1.5) Usando esta definición, podemos demostrar la regla 4.
CAPITULO 1: Introducción al modelo de regresión
15
Regla 4 La sumatoria de las desviaciones de observaciones sobre X alrededor de su media es cero. N
Σ (X i - X¯ ) = 0
(A1.6)
i =1
(Véase la nota de pie de página 4 para la prueba.) En el texto tendremos oportunidades frecuentes para usar la forma de desviaciones. Usando letras minúsculas para representar la forma de desviaciones, es decir, xi = Xi – X , la regla 4 se vuelve: N
Σ xi = 0
(A1.7)
i=1
Ahora definimos la varianza de X como: (A1.8) y la covarianza de X y Y como: (A1.9) Usando estas definiciones y los resultados anteriores, se pueden demostrar las últimas dos reglas de sumatorias. Regla 5 La covarianza entre X y Y es igual al promedio de los productos de observaciones en X y Y menos el producto de sus medias: (Al.10) PRUEBA
y usando la regla 1, se obtiene
16
PARTE UNO: Los fundamentos del análisis de regresión
Ahora, recordando la definición de la media de X y la media de Y, se tiene:
La regla 6 se deriva con facilidad de la regla 5, en vista de que se aplica al caso en el que X y Y son la misma variable. Regla 6 La varianza de X es igual al promedio de los cuadrados de las observaciones en X menos su media al cuadrado.
(Al.11) Nótese, de manera incidental, que cuando X y Y resultan tener medias iguales a cero (como ocurre cuando son medidas como desviaciones alrededor de sus medias), las definiciones de covarianza y varianza se vuelven: (aquí se ha omitido el rango del índice)
En ciertas situaciones será necesario usar sumatorias que se aplican a dos variables aleatorias, llamadas sumatorias dobles. De manera específica, supongamos que Xij es una variable aleatoria que adopta N valores para cada resultado de i y j. Habrá, por supuesto, N2 resultados totales. Ahora definimos la sumatoria doble de estos N2 resultados como:
Las siguientes dos reglas de sumatoria doble serán útiles.
CAPÍTULO 1: Introducción al modelo de regresión
17
Regla 7 (Al.12) Nótese que la sumatoria doble en la regla 7 es muy diferente de la sumatoria N sencilla Σ i =1XiYi la cual contiene N (en lugar de N2) términos. Regla 8
(A1.13)
APÉNDICE 1.2 Derivación de los estimadores de parámetros de mínimos cuadrados
Como se estableció en el texto, nuestra meta es minimizar Σ(Yi - Ŷi)2, donde Ŷi =a + bXi es el valor ajustado de Yi correspondiente a una observación Xi particular. Minimizamos la expresión tomando las derivadas parciales con respecto a a Y b, estableciendo cada una igual a 0, y solucionando el par resultante de ecuaciones simultáneas:7 (Al.14)
(Al.15)
Al igualar estas derivadas a cero y dividirlas entre -2, obtenemos: Σ(Yi - a - bXi) = 0 ΣXi (Yi - a - bXi) = 0
(Al.16) (Al.17)
Por último, escribiendo de nuevo las ecuaciones (Al.16 y Al.17) obtenemos un par de ecuaciones simultáneas (conocidas como las ecuaciones normales): ΣYi = aN + bΣXi
(Al. 18)
ΣXiYi = aΣXi + bΣX2i
(Al. 19)
7 No aparece índice en los signos de sumatoria, pero se asume que el índice abarca todas las observaciones 1, 2, . . . . N.
18
PARTE UNO: Los fundamentos del análisis de regresión
Ahora se puede resolver para a y b de manera simultánea al multiplicar la ecuación (Al. 18) por ΣXi y al multiplicar la ecuación (Al. 19) por N:
ΣXi ΣYi = aN ΣXi+ b(ΣXi)2
(A1.20)
NΣXiYi = aN ΣXi + bN ΣX2i
(A1.21)
Al restar la ecuación (Al.20) de la ecuación (A1.21), se obtiene:
NΣXiYi - ΣXi ΣYi = b[N ΣX2i - (ΣXi)2]
(A1.22)
de lo cual se desprende que (A1.23) Dado b, podemos calcular a con la ecuación (Al. 18): (A1.24) EJERCICIOS 1.1 Suponga que está a cargo de una autoridad monetaria central en un país mítico. Se le dan los siguientes datos históricos sobre la cantidad de dinero e ingreso nacional (ambos en millones de dólares): Cantidad
Ingreso
Cantidad
Ingreso
Año
de dinero
nacional
Año
de dinero
nacional
1987
2.0
5.0
1992
4.0
7.7
1988 1989 1990 1991
2.5 3.2 3.6 3.3
5.5 6.0 7.0 7.2
1993 1994 1995 1996
4.2 4.6 4.8 5.0
8.4 9.0 9.7 10.0
a) Haga una gráfica de estos puntos en un diagrama de dispersión. Luego estime la regresión del ingreso nacional Y sobre la cantidad de dinero X y haga la gráfica de la recta en el diagrama de dispersión. b) ¿Cómo interpreta el intercepto y la pendiente de la recta de regresión? c) Si tuviera el control único sobre el suministro de dinero y deseara lograr un nivel de ingreso nacional de 12.0 en 1997, ¿en qué nivel establecería el suministro de dinero? Explíquelo.
CAPITULO 1: Introducción al modelo de regresión
19
1.2 Calcule la regresión del ingreso sobre el promedio de calificaciones en el ejemplo descrito en este capítulo y compárela con la regresión del promedio de calificaciones sobre el ingreso. ¿Por qué son diferentes estos dos resultados? 1.3 a) Suponga que se obtienen los estimadores de mínimos cuadrados para la relación Y = a + bX. Después de terminar el trabajo, se decide multiplicar las unidades de la variable X por un factor de 10. ¿Qué le sucederá a la pendiente e intercepto de mínimos cuadrados resultante? b) Generalice el resultado de la parte a) evaluando los efectos en la regresión del cambio de unidades de X y Y en la siguiente manera: Y* = C 1 +
c2Y
X* = d 1 + d 2 X
¿Qué puede concluir? 1.4 ¿Qué le sucede a la estimación del intercepto y la pendiente de los mínimos cuadra dos cuando todas las observaciones en la variable independiente son idénticas? ¿Puede explicar de manera intuitiva por qué ocurre esto? 1.5 Demuestre que la línea de regresión estimada pasa por el punto de las medias (Y , X ). Pista: Muestre que Y y X satisfacen la ecuación Y = a + bX, donde a y b son definidas en las ecuaciones (1.2) y (1.3). 1.6 ¿Cómo interpretaría el valor -144.38 del intercepto en la regresión de Y en U en el ejemplo 1.2? Explique por qué no es probable que el valor del intercepto sea de mucho interés práctico. 1.7 Para probar la sensibilidad de los estimadores de mínimos cuadrados del intercepto y la pendiente ante la presencia de puntos a típicos, realice los siguientes cálculos: 1. Estime de nuevo la pendiente y el intercepto en el ejemplo 1.1 bajo la suposición de que la primera observación fue (21.0, 1.0) en lugar de (21.0, 4.0). 2. Estime de nuevo la pendiente y el intercepto dejando fuera la primera observación de la muestra. a) Describa cómo los estimadores de la pendiente e interceptos en 1 y 2 se comparan con aquellos dados en el ejemplo. Una gráfica de ambas líneas rectas sería útil. ¿Por qué los estimadores de mínimos cuadrados son tan sensibles a los puntos individuales? b) Habiendo trazado la gráfica de la línea de mínimos cuadrados en el caso 1, ¿concluiría que el primer punto de los datos es un punto atípico? Explique.
CAPÍTULO
2
ESTADÍSTICA ELEMENTAL: A REVISIÓN
El estudio de la econometría, aun en su forma más práctica, requiere un buen entendimiento de la estadística. Asumimos que la mayoría de nuestros lectores poseen estudios de estadística pero puede ser que este conocimiento deba actualizarse. Antes de continuar el estudio de la econometría, revisaremos las ideas estadísticas que se usarán en varias etapas en el texto. Para ayudar al lector a enfocarse en ideas importantes en lugar de en los detalles, hemos colocado la mayor parte de las derivaciones en el apéndice 2.1.
2.1 VARIABLES ALEATORIAS Una variable aleatoria es una variable que toma valores alternativos, cada uno con una probabilidad menor que o igual a 1. Podemos describir una variable aleatoria al examinar el proceso que genera sus valores. Este proceso, llamado distribución de probabilidad, enumera todos los resultados posibles y la probabilidad de que ocurra cada uno. Se puede definir una variable aleatoria, como una función que asigna un número real a cada resultado de un experimento. Por ejemplo, supongamos que asignamos un valor de 1 a las caras de lanzamientos de una moneda y el valor de 0 al número de cruces (si usamos una moneda legal, la probabilidad de las caras será de 21 ). En este caso podemos interpretar el valor de los lanzamientos de una moneda como una variable aleatoria; el proceso generado por la variable aleatoria es la distribución de probabilidad binomial.
Es útil distinguir entre variables aleatorias discretas y continuas. Una variable aleatoria continua puede tomar cualquier valor en la línea de números reales, mientras que una variable aleatoria discreta sólo puede tomar un número especí-
20
CAPÍTULO 2: Estadística elemental: a revisión
21
Figura 2.1
Densidades de probabilidad.
fico de valores reales. La figura 2.1 ilustra las funciones de probabilidad discretas y continuas. Con la distribución discreta, vemos que los valores 10 y 20 ocurren con probabilidad de .25, mientras el valor 40 se presenta con una probabilidad de .50. Con la distribución continua, la probabilidad de que un valor particular se encuentre entre cualesquiera dos valores de la distribución es determinada por el área bajo la función de densidad continua entre esos dos valores. En este ejemplo, la probabilidad de que los valores de la distribución se encuentren entre 10 y 20 es aproximadamente igual a .30, como se muestra en el área sombreada de la figura.
2.1.1
Valores esperados
Las distribuciones de probabilidad, a menudo, se describen en función de sus medias y varianzas, las que a su vez son definidas en función del operador de valor esperado E. En virtud de que trabajaremos al principio con variables aleatorias discretas, entonces supongamos que X1, X2,…, XN representan los N resultados posibles asociados con la variable aleatoria X. Es decir, la media o valor esperado de X es un promedio ponderado de los resultados posibles, donde las probabilidades de los resultados sirven como los pesos apropiados. De manera específica, la media de X, denotada µx, se define por: (2.1) donde pi es la probabilidad de que ocurra Xi, Σ pi = 1 y E( ) es el operador de valor esperado. El valor esperado debe distinguirse de la media muestral, la cual nos dice el promedio de los resultados obtenidos en una muestra en la que se han elegido un número de observaciones (por lo general al azar) de la distribución de probabilidad subyacente. Denotamos la media muestral de un conjunto de resultados de X por X .
22
PARTE UNO: Los fundamentos del análisis de regresión
La varianza de una variable aleatoria proporciona una medida de la extensión o dispersión alrededor de la media. Es denotada por σ 2x , y (en el caso discreto) se define como (2.2)
Por tanto, la varianza es un promedio ponderado de los cuadrados de las desviaciones de los resultados de X de su valor esperado, sirviendo como ponderaciones las probabilidades correspondientes de que cada resultado ocurra. La varianza en la ecuación (2.2) es en sí misma un valor esperado, ya que (2.3)
La raíz cuadrada (positiva) de la varianza se llama desviación estándar. Hay varias propiedades del operador de valor esperado que encontraremos útiles, en especial al exponer las medias y varianzas de variables aleatorias. Alentamos al lector para que examine con cuidado los detalles que se describen en el apéndice 2.1. Tres de los resultados principales concernientes al operador de valor esperado son los siguientes: Resultado 1
E(aX + b) = aE(X) + b
donde X es una variable aleatoria y a y b son constantes. Resultado 2
E[(aX)2] = a2E(X 2)
Resultado 3
Var (aX + b) = a2 Var (X)
2.1.2
Distribuciones conjuntas de variables aleatorias
Será útil estudiar las distribuciones conjuntas de X y una segunda variable aleatoria Y. En el caso discreto, las distribuciones conjuntas se describen con una lista de probabilidades de ocurrencia de todos los resultados posibles tanto de X como de Y. Por ejemplo, si Y es una variable aleatoria que toma el valor de 1 si el jefe de una familia tiene una educación universitaria y de 0 si esa persona no la tiene, mientras que X es la variable del ingreso familiar descrita con anterioridad, entonces la distribución conjunta de X y Y podría ser como sigue:
CAPÍTULO 2: Estadística elemental: a revisión
23
Nótese que todas las probabilidades son no negativas y suman 1. Como en el caso de una sola variable aleatoria, el operador de valor esperado es útil para describir las características importantes de las distribuciones conjuntas. La covarianza de X y Y se define como el valor esperado del producto de X y Y cuando ambas son medidas como desviaciones alrededor de sus medias; Cov (X, Y) = E[(X - E(X))(Y - E(Y))] (2.4)
donde pij representa la probabilidad conjunta de que ocurran X y Y. La covarianza es una medida de la asociación lineal entre X y Y. Si ambas variables siempre están por encima y por debajo de sus medias al mismo tiempo, la covarianza será positiva, como en la figura 2.2b. Si X está por encima de su media cuando Y está por debajo de su media y viceversa, la covarianza será negativa, como se muestra en la figura 2.2a. El valor de la covarianza depende de las unidades en las que sean medidas ,Y y Y. Como resultado, frecuentemente tendremos la oportunidad para usar el coeficiente de correlación
(2.5)
donde σx y σY representan las desviaciones estándar de X y Y, respectivamente. A diferencia de la covarianza, el coeficiente de correlación se ha normalizado y es independiente de la escala. Puede mostrarse que el coeficiente de correlación siempre caerá entre -1 y +1. Una correlación positiva indica que las variables se mueven en la misma dirección, mientras que una correlación negativa implica que se mueven en direcciones opuestas.
Figura 2.2
Covarianza.
24
PARTE UNO: Los fundamentos del análisis de regresión
Varias de las propiedades del operador de valor esperado son útiles cuando se trata con distribuciones de probabilidad conjuntas. Éstas se plantean aquí y se demuestran en el apéndice 2.1. Resultado 4 Si X y Y son variables aleatorias, E(X + Y) = E(X) + E(Y) Resultado 5 Var (X+Y)= Var (X) + Var (Y) + 2 Cov (X, Y)
EJEMPLO 2.1
Covarianza y correlación
La distribución de probabilidad conjunta del ingreso (en miles de dólares) y la educación (en años) para los cinco empleados de una empresa pequeña es la siguiente: Ingreso (X)
5 10 15 20 25
Educación (Y) 10
8 10 15 12
Las medias y varianzas de cada una de las variables son: E(X) = (5 + 10 + 15 + 20 + 25)/5 = 15 Var(X) = [(-10) 2 + (-5) 2 + 0 2 + 5 2 + 10 2 ]/5 = 50 E(Y) = ( 10 + 8 + 10 + 15 + 12)/5 = 11 Var(7) = [(-1) 2 + (-3) 2 + (-1) 2 + 4 2 + l 2 ]/5 = 5.6 Entonces la covarianza entre X y Y está dada por: Cov(X,Y) = [(-10)(-l) + (-5)(-3) + (0)(-l) + (5)(4) + (10)(1)]/5=11 Por último, la correlación entre X y Y es: p(X, Y) = ll/[(50)(5.6)]1/2 = .66
2.1.3
Independencia y correlación
La probabilidad de un resultado asociado con Y, en ciertos casos, no estará relacionado con el resultado asociado con X y viceversa. En este caso decimos que X y Y son variables aleatorias independientes. Como un ejemplo, considérese el lanzamiento de una moneda para la cual la probabilidad de caras y la probabilidad de cruces son ambas de 21 . Ahora supóngase que los primeros cinco lanzamientos son todos caras. La probabilidad de que ocurra una cruz en el sexto lanzamiento será de 12 y ésta es independiente de los lanzamientos anteriores.
CAPÍTULO 2: Estadística elemental: a revisión
25
Cuando dos variables son independientes, los cálculos que introducen al operador de valor esperado se simplifican. La consecuencia es resumida en los resultados 6 y 7 para el operador de valor esperado, los cuales se demuestran en el apéndice 2.1. Resultado 6 Si X y Y son independientes, E(XY) = E(X)E(Y). Resultado 7 Si X y Y son independientes, Cov (X, Y) = 0. El resultado 7 establece que si dos variables aleatorias son independientes, la covarianza entre ellas es 0. Esto tiene sentido de manera intuitiva, debido a que la independencia de X y Y significa que, no hay relación entre los resultados de una variable y los resultados de la otra variable. Si no hay relación, esperaríamos que las desviaciones en X alrededor de su media no estuvieran relacionadas con las desviaciones en Y. Es importante observar, sin embargo, que el resultado no se sostiene en la dirección opuesta. Dos variables pueden tener una covarianza de cero, pero puede haber dependencia entre las variables. La clave es que la covarianza y la correlación miden dependencia lineal, las variables pueden estar relacionadas no linealmente pero aún así tener una covarianza de cero. Como por ejemplo, suponga que X y Y siguen la distribución de probabilidad X
-2
-1 0
1
2
Y
4
1 0
1
2
Se asume que todas las observaciones suceden con una probabilidad igual ( En este caso E(X) = 0, E(Y) = 2, y
1 5
).
5
Cov (X, Y) = 1/5
Σ X (Y i = 1
i
i
- 2) = 0
Sin embargo, es claro que las variables aleatorias de seguro no son independientes. De hecho, las cinco parejas listadas satisfacen la relación Y = X 2 , de modo que hay una relación no lineal exacta entre X y Y.
2.2 ESTIMACIÓN 2.2.1
Estimadores de media, varianza y covarianza
Las medias, varianzas y covarianzas pueden medirse con exactitud sólo si conocemos casi todos los resultados posibles, es decir, la población. Sin embargo, por lo general, cuando emprendemos un estudio, sólo tenemos una muestra de la población. Entonces desearemos hacer inferencias acerca de las características
26
PARTE UNO: Los fundamentos del análisis de regresión
de la población a partir de la muestra. Mostraremos en este capítulo cómo podemos tomar una muestra de N puntos de datos, obtener estimaciones de las características de la población y luego sacar conclusiones acerca de la relación entre las estimaciones de la muestra y los correspondientes parámetros de la población. En vista de que no podemos conocer la verdadera media y varianza de una variable aleatoria, o la verdadera covarianza entre dos variables aleatorias, usaremos la información muestral para obtener las mejores estimaciones posibles. El objetivo es determinar una regla que dé una estimación muestral para todas y cada una de las muestras posibles. Para distinguir la estimación de la regla más general, llamaremos a esta última estimador. Es común que los estudiantes confundan "estimaciones" y "estimadores", pero esta confusión puede eliminarse si recordamos que los estimadores son reglas, mientras que las estimaciones son números. Hallar el mejor estimador, para cualquier muestra dada, es un asunto complejo que se expone con mayor detalle en la sección 2.3. Por el momento, supóngase que un requisito mínimo es que el estimador de un parámetro (como la media o variación) produce estimaciones que se aproximan mucho a ese parámetro. De manera más específica, nos gustaría que el estimador fuera insesgado en el sentido de que el valor esperado del estimador es igual al parámetro mismo. Como un ejemplo, reconsidérese la media muestral de una variable aleatoria X con media µx. El estimador X¯ se define por: (2.6) Es muy importante señalar que X es una variable aleatoria cuyos valores variarán de una muestra a otra, aun cuando el parámetro de población correspondiente µ permanezca sin cambio. Debido a que las estimaciones muéstrales varían de una muestra a otra, podemos representar su distribución de probabilidad. Esta distribución muestral se consigue obteniendo, de manera repetida, muestras nuevas y calculando las medias y varianzas muéstrales cada vez. La distribución muestral para la media medirá la probabilidad de que la media muestral caiga dentro de una serie de intervalos específicos (recuérdese el estudio previo de las distribuciones de probabilidad). Dado que X tiene una distribución muestral, es natural preguntar si el valor esperado del estimador X es igual a la media poblacional; en otras palabras, ¿X es un estimador insesgado de µ?Para mostrar que X es insesgado, demostraremos que E(X ) = µx:
CAP PÍTULO 2: Estadísstica elemental: a revisión r
27
Una elecció ón razonable para un estim mador de la varianza de un na variable aleeatoria es:
El problema es que este estim mador es sesg gado. Como see muestra en el apéndice 2.1 1, en el resulttado 9, un esstimador insessgado de la varianza v de una u variable aleeatoria (con media m descono ocida), está dado d por: (2.7) ¿Po or qué dividim mos entre N - 1 (en lugar de d entre N) paara obtener un n estimador inssesgado de la varianza v muestral? La resp puesta exacta sse encuentra en e la prueba dell resultado dado en el apén ndice 2.1, pero o una respuestta intuitiva pu uede basarse en el concepto de d grados de libertad. Se sabe que, nueestra muestra contiene N pun ntos. Sin emb bargo, al calcu ular la varian nza muestral u un primer passo necesario fuee el cálculo dee la media mueestral. Esto co oloca una restrricción en los N puntos de dattos de que las N observacio ones se suman n N veces a la media calculaada X . Esto dejja N - 1 obserrvaciones sin n restriccioness con las cualles se estima la varianza mu uestral. Por último, considérese c có ómo podríamo os obtener un estimador insesgado de la cov varianza entree dos variabless aleatorias. Ya Y que la covarrianza se defin ne como: Cov (X, Y) = E[(X - E(X))(Y - E E(Y))] la covarianza c po odría medirse como el prom medio del prod ducto de las desviaciones d de X y Y alreded dor de sus meedias, es decirr,
Co omo en el caso o anterior, estee estimador seerá sesgado. P Para obtener un u estimador inssesgado dividimos la sumatoria anterior entre el númeero de grados de libertad. Sin n embargo, al calcular la su uma del producto de las desv viaciones en X y Y, hay N observaciones en e los resulttados conjunttos de X y Y y por tantto N piezas ind dependientes de informació ón. Sin embaargo, una piezza de informaación se usa parra calcular laas medias de X y Y: la restricción r dee que la sum ma de las N obsservaciones es igual a N v veces las med dias de X y Y, Y respectivam mente. Como ressultado hay N - 1 grados de libertad, y el e estimador insesgado i es:: ( 2.8)
28
PARTE UNO: Los fundamentos del an nálisis de regresión n
Para distingguir la covarianza muestrral de la real se coloca unn sombrero (^) encima de laa Cov. Por últim mo, podemos definir el coeeficiente de coorrelación muuestral entre dos d variables paara que corressponda al coefficiente poblaacional definiido con anteriioridad. El coeeficiente de correlación muuestral es: (2.9)
Para distinguuir rXY de otraas medidas más m complejass de correlacióón, la llamam mos correlación simple s entre X y Y. Como suu contraparte ppoblacional, rXY X varía en vallor de -1 a +1, de d modo que su cuadrado se s encuentra eentre 0 y 1. Se puede señallar que la correllación simple se relaciona en e forma direccta con la covaarianza muestrral entre X y Y como c sigue:
En el esstudio de la eeconometría se s incluyen laas relaciones entre variablees. Uno de los fundamentos de la econom metría aplicadda es, que la covarianza nos n indica si doss variables esstán relacionadas y en qué medida. Es decir, d una covvarianza posittiva supone qque cuando X se encuentrra por encima de su mediia, también lo estará Y, y que q cuando X se encuenttra por debaj o de su meddia, también lo estará e Y. Esto ssugiere (véasee la figura 2.2aa) que la línea de mejor ajusste a través de un u conjunto de d puntos con covarianza neegativa tendráá una pendiennte negativa. Podemoos ver esto ccon más clarridad si relaacionamos la medida de la covarianza muestral conn el estimadorr de la pendiiente de mínimos cuadraddos dado en el capítulo c 1. Reeplanteando el e estimador de d la covariannza muestral en forma de dessviaciones, coon xi = Xi - X y yi = Yi < Y , (2.10) Nótese que hemos dejadoo de lado el índice i = 1, 2, . . ., N poor conveniencia. Recordemoss también quee nuestro estiimador muestral de la varrianza de X, en 2 ocasiones deenotado comoo s X , está dadoo por:
CA APITULO 2: Estadíística elemental: a revisión
29
Ahhora considerre la expresión obtenida al dividir la covvarianza muestral entre la vaarianza muesttral:
Essta razón es igual a la esttimación de la pendiente obtenida en la ecuación (1.6). Para cualquier muestraa, el estimadorr de la pendiennte de mínimoos cuadrados pu uede medirse por la razón dde covarianza, la cual tomaa la dirección de d la recta, y la varianza tom ma un númeroo positivo quee sirve para noormalizar las unidades en qu ue son medidos los datos. Para aplicaar lo anterior, considérese el e ejemplo dell promedio dee calificacionees. Nuestros cálculos c para lla estimación de la pendiennte de mínimoos cuadrados pu uede usarse paara calcular m medias muéstrrales, varianza y covarianzza. Por tanto, los datos en form ma de desviacciones, x y y = 0. La covariianza entre X y Y está dada poor:
m mientras que laa varianza de X está dada por: p
See tiene que la covarianza ess positiva, lo que indica unna pendiente positiva, p y la raazón de la covvarianza muestral y la variianza muestraal, 2.79/23.144, produce la esstimación de la l pendiente, .12.
2.2.2
El teorema t de el límite cen ntral
¿Q Qué le sucedee a la distribuución muestral de la mediia conforme se hace más grrande el tamaaño de la muuestra? De manera m intuitivva, esperaríaamos que un tam maño de mueestra más grannde conduciríía a un estimaador de la meedia que está enn promedio más m cerca de la media pob blacional. Dee hecho, si laa muestra se vu uelve grande en forma arbbitraria, o igual a la pobllación, el esttimado de la m media muestraal sería idénticcamente iguaal a la media ppoblacional. Esta intuicción, que se ccumple para las l distribucioones de probabilidad con m medias finitas y no se limitaa a la normal,, se resume dde manera form mal como el teoorema del límitte central:
Teorema del límite centraal. Si la variaable aleatoriaa X tiene unaa media µ y T u varianza σ2, entonces lla distribuciónn muestral dee X se vuelvee aproximauna d damente norm mal con mediia µ y varianzza σ2/N conforme N se incrrementa.
30
PARTE UNO: Los fundamentos del análisis de regresión
El teorema del límite central proporciona una razón importante para el estudio de la distribución normal en la sección 2.4; veremos que para tamaños de muestras suficientemente grandes, la suposición de normalidad nos permitirá simplificar, en gran medida, nuestras pruebas estadísticas. Antes de estudiar esta descripción, haremos una breve interrupción para exponer las propiedades deseables en un estimador estadístico.
2.3
PROPIEDADES DESEABLES DE LOS ESTIMADORES Hemos afirmado que una propiedad útil de un estimador estadístico es que sea insesgado y en vista de que la búsqueda de estimadores está en el corazón de la ciencia de la econometría, haremos una pausa aquí para considerar otras propiedades deseables. Para ligar nuestra exposición con el análisis del modelo de regresión, tendríamos que preguntar qué propiedades debemos buscar al elegir un estimador para un parámetro arbitrario β, como el estimador de la pendiente de una línea recta. Hay cuatro propiedades importantes de los estimadores que son: 2.3.1
Ausencia de sesgo
Una propiedad muy deseable asociada con un parámetro de regresión estimado es que la distribución del estimador tenga al parámetro como su valor medio. Entonces, si pudiéramos analizar datos nuevos, nos aseguraríamos de estar en el promedio correcto. Diríamos que βˆ es un estimador insesgado si la media o valor esperado de βˆes igual al valor verdadero; es decir, E (βˆ ) = β. La diferencia entre un estimador sesgado y un estimador insesgado puede verse en la figura 2.3. Para aclarar la exposición definiremos el sesgo asociado con un parámetro estimado como sigue:
Sesgo = E( βˆ ) - β Aunque la ausencia de sesgo en un estimador es una propiedad deseable, no supone nada acerca de la dispersión del estimador alrededor del parámetro verdadero. En general, a uno le gustaría que el estimador fuera insesgado y también que tuviera una dispersión muy pequeña alrededor de la media. Esto nos sugiere que debemos definir un segundo criterio que le permitiera elegir entre estimadores insesgados alternativos.
2.3.2
Eficiencia
Decimos que, βˆ es un estimador insesgado eficiente si para un tamaño muestral dado la varianza de βˆ es menor que la varianza de cualesquier otros estima-
CA APÍTULO 2: Estadísstica elemental: a revisión
31
Figura 2.3
Sesgo.
dorres insesgadoss. Esto, en ocaasiones es difíícil, de modo que q es naturall describir a los estimadores en función de su eficiencia relativa. Un estimaddor es más eficciente que otro o si tiene una varianza mennor. Esta eficiencia es deseaable debido a que q entre mayyor sea la eficciencia asociaada con un prooceso de estim mación son más fuertes las afirmacioness estadísticas que puede hhacer uno aceerca de los parrámetros estim mados. Por taanto, en el casso extremo dee un estimadoor (insesgado)) con varianzza cero, podeemos afirmarr con certezaa el valor nuumérico del parrámetro de reg gresión verdaadero. En la figura f 2.4, se muestra de manera m gráficaa un estimador relativam mente eficieente y un esstimador relaativamente ineficiente.
2.3 3.3
Erro or cuadráticco medio mínimo m
En diversas circu unstancias noss vemos obliggados a sacrificar el sesgo y la varianza de los estimadoores. Esto es, cuando la meta m de un m modelo es maaximizar la precisión de las predicciones,, por ejemplo, un estimadoor con una vaarianza muy baja y un pequeño sesgo pueede ser más deeseable que uun estimador insesgado
Figura 2.4 Eficiencia.
32
P PARTE UNO: Los fundamentos f del análisis de regresió ón
con una vaarianza alta. Un U criterio que q es útil a este respectoo es la meta de minimizar el e error cuadrrático medio, el e cual se definne como:
No es difícil mostrar quee esta definición es equivaalente a:1
Por tanto, el e criterio de minimizar m el error cuadráttico medio toma en cuentaa la varianza y el e cuadrado ddel sesgo del estimador. e Cuuando βˆ es insesgado, el errror cuadrático medio m y la vaarianza de βˆ son iguales.
EJEMPL LO 2.2
Error cuadrá ático medio
Supóngase que estamos iinteresados enn estimar la media m de una variable v aleatooria X, con meddia poblacionaal desconocid da µ y desviacción estándar σ, y que puedden recolectarsee 10 puntos por p muestreo aleatorio. Deebido a que laa recolección de datos es costosa, un inveestigador proopone recolectar sólo cincoo puntos al azzar. ¿Qué efectto tiene estee procedimieento de mueestreo más limitado l en las propiedades del estimaddor de la mediia? El prim mer estimador dde muestra coompleta está dado d por: X = (X1 + … +X10 1) / 10, mientraas que el seguundo estimado or de muestraa limitada estáá dado por: X ' = (X1 + … +X X 5)/5. Ambos estimadores so on insesgadoss en vista de quue:
Sin embarggo, el primer estimador e es más m eficiente que el segunddo debido a quue tiene una varianza v menoor. Para ver por p qué, nótesse que:
De hecho, el estimadoor de la mediaa muestral, laa cual utiliza todos los datos disponiblees (ponderadoos en forma iggual), es el estimador más eficiente e posibble.
CAP PÍTULO 2: Estadísstica elemental: a revisión r
2.3 3.4
33
Conssistencia
Parra completar laa exposición, considerarem mos las propieedades de los estimadores e connforme el tam maño de la m muestra es más m grande, es decir, las propiedades p asinntóticas, o de muestra grannde. Nos gustaaría que el esttimador βˆ se acerque a la β verdadera confforme se incrrementa el tam maño de la muestra. m De manera m específica, esperamos que conform me el tamañoo de la muestrra se hace máás grande, la probabilidad de que βˆ diferrirá de β se hará h muy peqqueña. Para aplicar este conncepto probabbilístico a la elección e del estimador, e deffinimos el lím mite de probabbilidad de βˆ (plim ( βˆ, probability limit of o β) de la siguuiente maneraa: pllim βˆ es igua al a β si, confoorme N se aprroxima al infin nito, la probaabilidad de qu ue │β - βˆ │ seerá menor qu ue cualquier número n positiivo arbitrariaamente pequ ueño se aprox xime a 1. Con este conncepto es natuural definir el criterio de coonsistencia com mo sigue: βˆ es un estiimador consistente de β si el e límite de proobabilidad de βˆ es β.2
Habblando en form ma aproximada, un estimaador es consisttente si la disttribución de proobabilidad dell estimador see plega a un solo punto ((el parámetroo verdadero) con nforme el tam maño de la muuestra se hacee arbitrariameente grande. En E la figura 2.5, esto se describe en formaa gráfica.
Figura 2.5 Consistencia.
2
En sentido esttricto, βˆ converrge con β en el lím mite de probabiliidad si para cualqquier δ > 0,
lím Prob(│β - βˆ│< δ) = l N →∞
34
P PARTE UNO: Los fundamentos f del análisis a de regres sión
Como una u regla, los cronometristtas tienden a ppreocuparse más m con la coonsistencia quee con la falta de sesgo. Un estimador sesgado pero coonsistente pueede no igualar al a parámetro verdadero enn promedio, pero p se aproxximará al parrámetro verdaadero conform me la información de la m muestra se haace más grandde. Esto es máss tranquilizador, desde un punto p de vistta práctico, qu ue la alternatiiva de encontrarr un estimadoor del parámeetro que sea innsesgado, perro continúe deesviándose enn forma considderable del parámetro verddadero conforrme crece el tat maño de la muestra. En lla figura 2.6, se s ilustran dos estimadoress de parámetroos, uno de los cuales es im mparcial con una u varianza grande. Debbido a las collas grandes, un segundo estiimador, aunqu ue sesgado, tiiene una variaanza suficienttemente pequueña para teneer en total unn error cuadráático medio más m pequeño.. Es naturral considerarr como un critterio alternativvo el objetivoo de que el errror cuadrático medio del estimaador debería aproximarse a a cero conforme se incrementa la
muestra. Ell criterio del error cuadráático medio iimplica que el e estimador es asintóticameente insesgadoo y que su variianza va a ceroo conforme creece el tamaño de la muestra. Resulta que un estimadoor con un errror cuadráticoo medio que se aproxime a cero será unn estimador coonsistente perro que lo con ntrario no neccesariamente es e cierto. Adeemás, en la mayor m parte dee las aplicacioones los estim madores consisstentes tienenn errores cuad dráticos mediios que se aprroximan a cerro; estos dos crriterios se usaan en forma inntercambiablee.
2.4
DISTRIBU UCIONES DE E PROBABIL LIDAD Hay varias distribuciones d s de probabiliidad específicas que serán útiles ú en uno o más temas de d este libro.. Las cuatro distribucione d s cubiertas soon la normal,, ji cuadrada, t y F. La expposición que sigue s pretendee ser descripttiva, no riguroosa.
2.4.1
La distribucción norma al
La distribuución normal es una distribución de proobabilidad coontinua en forrma de campanaa, como se iluustra en la fig gura 2.7. Unaa distribución normal puedde
Figura 2.6 6; Error cuadrático medio.
CA APÍTULO 2: Estad dística elemental: a revisión
35
deescribirse, com mpletamente por su media y su varianzaa, de modo quue si X estuviiera distribuidda en forma normal, n escribbiríamos X ~ N(µx, σ2x), loo cual se lee "X X está distribuida como unna variable normal n con m media µx y varrianza σ2x". Si X está distribuida en fforma normal (y exp A = eA),
Para los prropósitos de lla prueba estaadística, es úttil saber que: Prob (µx - 11.96 σx < Xi < µx + 1.96 σx) ≈ .95
(2.12)
Prob (µx - 22.57 σx < Xi < µx + 2.57σx) ≈ .99
(2.13)
doonde µx y σx son la mediia y la desviaación estándaar de la variaable aleatoria noormal X. La probabilidad p dde que una sola observacióón de una variiable X distribuuida en formaa normal caerrá dentro de alrededor a de 2 desviaciones estándar de suu media es approximadamennte .95. La prrobabilidad dee estar dentro de alrededor 2 21 desviacionees estándar ess de aproximaadamente .99. A la inversaa, la probabiliddad de que unna sola observvación estaráá a más de 2 (22 21 ) desviacioones estándar dee distancia dee la media es de .05 (.01). La figura 2.77 contiene unna ilustración dee una variablee normal con media 0 y deesviación estánndar 1. La pro obabilidad de quue una observvación de la vvariable aleato oria X estará en una u otraa de las áreas soombreadas es igual a .05. Para P ejemplifiicar lo anterioor, supóngase que las puntuuaciones en loos exámenes dde admisión a la universidadd (SAT) estánn distribuidos enn forma norm mal con una ppuntuación media m de 500 y una desviacción estándar dee 100, entonnces, la probbabilidad de que cualquieer puntuaciónn de prueba paarticular estarrá dentro del rango de 304 4 a 696 [5000 ± 1.96(100))] es, .95. De m manera corresspondiente, sóólo el 2.5% de las puntuuaciones de prueba p serán m mayores que 696, 6 mientras que el 2.5% será menor qque 304. ¿Por qué estudiar e la diistribución no ormal? La diistribución noormal es una ellección frecueente de la disttribución de probabilidad p aal menos por dos d razones: 1. Es simétrica y en foorma de cam mpana, una foorma razonabble para que deescribamos laa distribución de los parám metros, como la pendiente y el intercepto o, que esperam mos estimar. 2. La distrribución es deescrita por completo por suu media y su varianza, v de m modo que no necesitamos n p preocuparnos por otras propiedades com mo el sesgo y laa kurtosis. El siguientte resultado aayuda con mu uchas de las ppruebas estadíísticas usadas enn econometríaa. Resultadoo 10 Si dos ((o más) variaables aleatorrias están disstribuidas en foorma normal con medias y varianzas iddénticas, cuallquier suma ponderada p de estas variabless estará distriibuida en form ma normal.
36
PAR RTE UNO: Los fund damentos del análisis de regresión
Probab bilidad
Figura 2.7
Distribución n normal estándar.
EJEMPLO 2.3
Distribución normal
La distribucióón de los índicces de salario por L p hora de unna población de d trabajadorees e distribuidda en forma aproximadam está a ente normal ccon media de 9.60 dólares y d desviación estándar de 55.25 dólares. ¿Qué porceentaje de la población de d e empleados gaana más de 20.00 2 dólares por hora? ¿M Menos de 5.000 dólares poor h hora? Para reesponder ambbas preguntas,, determinamoos que 20.00 dólares está a (20.00 - 9.60))/5.25 = 1.98 ddesviaciones estándar e por enncima de la media, m mientraas q 5.00 dólaares está a (9.660 - 5.00)/5.25 = .88 desviaaciones estánd que dar por debajoo d la media. Usando la taabla 1 al finaal del libro para de p la distrib bución normaal e estandarizada a, encontram mos que 2.39% % de la distrribución se encuentra e a la l d derecha de 1..98 desviacionnes estándar por p encima de d la media, mientras m que el e 18.94% se enncuentra a la izzquierda de .888 desviaciones estándar poor debajo de la l m media. Por co onsiguiente, approximadameente el 2.39% de los empleaados gana máás d 20.00 dóllares por horra, mientras que de q aproximadamente el 18.94% ganna m menos de 5.000 dólares porr hora.
2.4.2
D Distribución ji cuadrad da
La ji cuadradda es útil para probar hipóteesis que tieneen que ver conn varianzas de L d v variables aleaatorias. Su aplicación se deeriva del resultado 11. Resultaddo 11 La sumaa de los cuadra ados de N variiables aleatoriias distribuidaas independienteemente en forrma normal (ccon media 0 y varianza 1) está e distribuidda como ji cuadrrada con N grrados de liberttad. Supóngase, por p ejemplo, qque calculamoos la varianzaa muestral s2 de N observaaciones extraíd das de una ddistribución no ormal con vaarianza σ2. Enntonces, no es e 2 2 difícil mostraar que (N - 1 )s /σ estará distribuida como ji cuadraada con N - 1 grados de libertad.3 Al exaaminar valorees críticos de la distribucióón ji cuadradaa 3
Véase a W.H. W Greene, Ecoonometric Analysiis (Nueva York: Macmillan, M 1990),, pp. 62-63.
CAP PÍTULO 2: Estadíística elemental: a revisión
37
conn el número appropiado de ggrados de libeertad, podemoos decidir si see rechaza la hip pótesis de quee la varianza dde la variable aleatoria es iigual a un núm mero determinnado. La ji cuadraada comienzaa en el origen n, es sesgada hacia la dereecha y tiene unaa cola que se extiende infinnitamente haccia la derechaa (como se muuestra en la figuura 2.8). La foorma exacta ddé la distribucción depende del número de d grados de libeertad, con la distribución volviéndose cada vez máás simétrica conforme c el núm mero de gradoos de libertad se hace más grande. Cuanndo los gradoss de libertad se hacen h muy grrandes, la disttribución ji cuuadrada se aprroxima a la normal. n Una tabla de la ji cuaadrada, a mennudo denotadaa como x2, see proporciona al final del librro (tabla 2),
2.44.3
La diistribución nt
En ocasiones, enn estadística, se s asume que la l varianza dee una variable aleatoria es connocida. ¿Cóm mo probamos hipótesis cuaando la variannza no es conocida? La resppuesta se encuentra en la ddistribución t.. El resultado central que nos n permite usaar la distribución t es el sigguiente. Resultado 12 1 Supóngase que X está diistribuida en forma f normall con media 0 y varianza 1 y que Z estáá distribuida como ji cuaadrada con N grados de libeertad. Entoncces si X y Z son independiientes, X √Z/N /N se tiene unna distribución t con N graados de libertaad. Como la norrmal, la t es ssimétrica, y see aproxima a la normal paara tamaños de muestra gran ndes, pero la t tiene colas más m gruesas que q la normaal, una ocurren ncia que es prronunciada enn especial parra tamaños dee muestras dee aproximadam mente 30 o menos. m La figuura 2.9 ilustraa la distribución t. Para verr cómo nos ayuuda el resultaado 12, recuéérdese que paara la X norm mal, (X - µx)/(σσx/√N) está disttribuida en forma f normall con media 0 y varianzaa unitaria. Perro si no se connoce σx, debem mos remplazaar σ2x por la varianza v mueestral s2x . En vista v de que 2 2 (N--1) s x /σ x siguee una distribuución ji cuadrada y que (X- µx)/(σx/√N)) es normal uniitaria, el resulltado 12 nos dice que:
siguue una distribbución t. Por taanto, la distribbución t puedee usarse para probar si la med dia de una variable v aleatooria es igual a cualquier número partticular, aun cuaando se desconozca la variaanza de la varriable aleatoria. Puede ser úttil hacer un exxamen breve de los percenntiles de la disstribución t dadda en la tabla 3 al final dell libro. Para una u prueba dee significanciia al 5%, el valo or crítico de la l distribuciónn t se aproxim ma a 1.96, el vvalor crítico de d la distribucción normal, conforme N sse hace grandde. Para una m muestra de 200 o más el
38
P PARTE UNO: Los fundamentos del análisis de regresión
Figura 2..8
Distribucción ji cuadrad da.
valor críticoo de 2.0 es unna aproximacióón razonable. Para ilustrar, reconsidéresee el ejemplo dell SAT mencioonado antes, peero supóngasee que la mediaa muestral de uuna distribución de 21 puntuuaciones de prueba p es 5000 y que la desv viación estánndar estimada (een oposición a la desviacióón estándar vverdadera) es 100. En vistaa de que el valorr crítico de la distribución t (para un niveel de significanncia del 5%) con c 20 grados de d libertad ess 2.086, la proobabilidad de que cualquieer puntuación de prueba dadda será mayorr que 708 [500 + 2.086(100)] es de 2.5% %.
2.4.4
La L distribución F
En ocasion nes cuando deeseamos probbar hipótesis cconjuntas quee implican doos o más parám metros de regreesión; por ejemplo, la hipóótesis de que el e intercepto y la pendiente son cero contra la alternativa de que uuna o la otra o ambas no son s cero. La esstadística de prueba p apropiaada se basa enn la distribuciión F y se carracteriza por dos parámettros, estando asociado el primero conn el número de parámetross estimados y el segundo con el númeero de gradoss de libertad. La distribución n F, como la jji cuadrada, tieene una formaa sesgada y vaaría en valor de d 0 al infinito (véase ( figura 2.10). La disttribución F puuede usarse paara probar la igualdad de doos varianzas. Su S utilidad se deriva del resultado 13. Resulttado 13 Si X y Z son ind dependientess y están distrribuidas como ji cuadrada coon N1 y N2 graddos de libertadd, respectivameente, entonces (X/N1)/(Z/N2) Figura 2.9
Distribucción f.
CAP PÍTULO 2: Estadísstica elemental: a revisión r
39
Figura 2.10 Distribución F.
está distribuida de d acuerdo coon una distribuución F con N1 y N2 grados de libertad. Parra ver la utilid dad del resultaado 13, supónngase que hem mos obtenido muestras m de tam maño N1 y N2 de dos distribbuciones norm males diferenttes X y Z. La varianza de X es e estimada co omo:
y laa varianza de Z es estimadda como
2
2
Si deseamos d pr obar si σ2x = σ 2Z., podemoss calcular la eestadística s x /s Z . Si X y Z son independ dientes, entoncces (N1 - 1)s2x /σ / 2x . está distrribuida como ji cuadrada 2 conn N1 - 1 gradoos de libertad y (N2 - 1) s Z /σ / 2Z. está distrribuida como ji cuadrada conn N2 - 1 gradoos de libertad. Entonces, ussando el resulltado 13, sabeemos que el cocciente
estaará distribuiddo como una distribución d F. F Nótese quee si σ2x = σ 22 , esto se re2 2 ducce a ) s x /s Z y el cociente de las variannzas estimadaas sigue una distribución d F con c N1 - 1 y N2 - 1 grados de libertad. La estadísticca F siempre sse tabula con el e estimador m mayor de la vaarianza en el num merador y ell estimado m menor en el denominador. d . El cocientee resultante siem mpre es mayoor que 1, y prroporciona información resspecto a la coola superior de la distribucióón F. Entre m mayor es la diferencia d enttre las dos vaarianzas, es maayor la estadísttica F. Por tannto, un valor grande g de F im mplica que es improbable quee las dos varianzas de erroor sean iguales. En la prácttica, la pruebaa se lleva a cab bo eligiendo un u nivel de significancia y luego buscanndo el valor crítico c de la distribución F en e una tabla eestándar de F..
40
PARTE UNO: Los fundamentos del análisis de regresión
Como por ejemplo, supóngase que deseamos saber si la varianza de la prueba de matemáticas del SAT difiere de la varianza de la prueba verbal del SAT. Supóngase también que de los 21 estudiantes, todos respondieron la prueba verbal pero sólo 16 respondieron la prueba de matemáticas. La varianza muestral de la prueba de matemáticas es 100 000, mientras que la varianza muestral de la prueba verbal es 80 000. Al asumir que las poblaciones de las puntuaciones de prueba están distribuidas en forma normal, la estadística F es 1.25 (100 000/80 000) con 20 y 15 grados de libertad. En vista de que el valor crítico del 5% de la distribución F es 2.33, no podemos descartar la posibilidad de que las varianzas reales son iguales (1.25 < 2.33). Ya que hemos elegido una proporción F mayor que 1 en la cola superior de la distribución, entonces nuestra prueba de significancia al 5% es una prueba unilateral. Si deseamos interpretar nuestros resultados en el contexto de una prueba bilateral que permitiera que la varianza de las puntuaciones de la prueba de matemáticas fuera superior o inferior que la varianza de las puntuaciones de la prueba verbal, llegaríamos a la misma conclusión en el nivel de significancia del 10%.4
2.5
PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA En esta sección revisaremos el problema de probar hipótesis. Las hipótesis que ocurren más a menudo en econometría implican pendientes e interceptos de líneas de regresión, pero también pueden implicar varianzas o covarianzas de distribuciones de probabilidad. Para una aplicación simple, reconsidérese el ejemplo del promedio de calificaciones del capítulo 1. La pendiente de .12 nos da una buena conjetura acerca del efecto del ingreso familiar en las calificaciones, ¿pero qué tan confiable es esa conjetura? De manera específica, ¿cómo podemos estar seguros de que la pendiente en realidad no es cero, de modo que el ingreso y el promedio de calificaciones no estén relacionados? Éste es un problema de prueba de hipótesis, y el concepto de un intervalo de confianza está relacionado con esta prueba. Mientras que .12 es una buena estimación de la pendiente, de seguro no estaríamos preparados para afirmar que .12 mide la pendiente de la relación entre el ingreso y las calificaciones de todos los estudiantes. Para demostrar qué tan confiables son los resultados, necesitaremos usar los datos para hacer afirmaciones probabilísticas acerca de nuestra estimación de la pendiente. De manera específica, podríamos encontrar que se puede afirmar que con una probabilidad de .95 el intervalo de .06 a .18 contiene la pendiente verdadera. El intervalo de .06 a .18 se llama intervalo de confianza del 95% para la pendiente. 4 Si elegimos hacer una prueba bilateral con un nivel de significancia del 5% usando el cociente de la estimación de la varianza mayor sobre la menor, podríamos usar información acerca de las pruebas de significancia al 2.5% para la distribución F (no disponible al final de este libro). De manera alternativa, podríamos calcular la cola inferior de la distribución invirtiendo los grados de libertad y usando como valor crítico el recíproco del valor crítico enumerado en la tabla para los grados de libertad invertidos.
CA APÍTULO 2: Estadísstica elemental: a revisión
41
La relaciónn entre la pruueba de hipótesis y los inntervalos de confianza c es esstrecha. Para ver esto, supponga que deeseamos probbar la hipótesis de que la peendiente es 0. Entonces, deccimos que la hipótesis nulaa es que la pendiente es 0. Siin embargo, enn vista de quee sabemos quee 0 se encuenntra afuera del intervalo de co onfianza del 955%, concluim mos (con una confianza c del 95%) 9 que poddemos rechazaar la hipótesiss nula de una pendiente dee cero. Para continnuar esta revisiión, hay que considerar c cóm mo se relacion nan la prueba dee hipótesis y los l intervaloss de confianzaa con la deterrminación de la media de un na variable aleatoria. a De manera espeecífica, supónngase que coonocemos la vaarianza de unaa variable aleeatoria X (la cual c está distrribuida en forrma normal) peero que se descconoce la meddia verdadera.. Deseamos haacer afirmacioones respecto a la l precisión co on la que hem mos estimado el valor descoonocido de laa media, y en vissta de que ess difícil hacerr afirmacioness de confianzza acerca de estimaciones e pu untuales, usam mos intervaloss de confianzza. Entonces, vamos a supponer que se qu uiere obtener un intervalo de confianza del 95% aceerca de la meddia muestral (see dice que éstta se asocia coon un nivel dee significancia del 5%). Ell intervalo se ob btiene utilizanndo el hecho de que X estáá distribuida een forma norm mal con una deesviación estáándar σx /√N, donde N es el e número dee observacionnes. El intervaalo de confian nza del 95% es
Su upóngase, porr ejemplo, quee N= 100 y σx = 10. Entonnces X está distribuida d en forma normal con c una desviaación estándar de 1. Si la esstimación pun ntual de µx es X = 3, el interrvalo de con nfianza del 955% será 1 ≤ µx ≤ 5. El intervalo de coonfianza del 955% sugiere quue es muy prob bable que el inntervalo (1,5) contendrá la media verdaderra µx. La interprettación de la afirmación de que "con una confianza del 95% 1 ≤ µx ≤ 5" es como sigue. Si pudiiéramos obten ner un númerro grande de muestras de tam maño N = 100, obtendríaamos muchass estimacioness puntuales diferentes d de µx . Si calculam mos el intervvalo X ±2σ x /√N / correspoondiente a la estimación dee /ux de cada muestra, m tendrríamos variass afirmaciones de intervaloos como:
Pu uede esperarsee que algunoss de estos inteervalos excluyyan a la mediia verdadera. Siin embargo, con c una gran cantidad de estos e cálculoss, puede espeerarse que el 955% de los inteervalos obtennidos contengan a la mediaa verdadera. Los intervaalos de confiianza puedenn usarse para probar hipóttesis. Ahora coonsideremos laa hipótesis nuula de que la media m verdadeera es igual a cero para la media muestrall de 3, en el ejemplo e anterrior vemos quue es improbaable que sea veerdadera la hipótesis nula y la rechazam mos (con un nnivel de signifficancia del
42
PA ARTE UNO: Los fundamentos del aná álisis de regresión n
5%) a favor de la hipótesis alternativa,, bastante vagga, de que la media m no es 00. Nótese que la l hipótesis nuula ha sido reechazada debido a que es im mprobable quue hubiéramos obtenido unaa media muesstral de 3 si lla media verd dadera hubierra sido 0. Como unn atajo para pprobar la hipótesis nula de que la media es 0, podemoos calcular Z = X /(σx/√N) Esta E estadística se distribuirrá en forma normal n con unna varianza de 1 y, si la hipóttesis nula es verdadera, unaa media de 0. Si S la estadísticca es mayor quee 1.96 en valoor absoluto, podemos p rechaazar la hipótessis nula con un u nivel del 5%,, mientras quee si es mayor que q 2.57, podeemos rechazarrla con un nivel del 1% (una afirmación m más poderosa desde d el punto de vista estaddístico). Ahora, suponiendo que sabemoss que para unna muestra dada d el valorr Z fue 2.13 y observando la tabla 1 al final del librro, bajo la coolumna .03 y en la fila 2.1, encontraríam mos que la proobabilidad de que Z sea maayor o igual a 2.13 es igual a .0166. Del mismo m modo la probabiliddad de que Z sea menor o igual a -2.113 también es .00166. Tomanndo en cuenta ambas, asociiaríamos un nivel n de signifficancia de .03332, o 3.32%, con Z. En virrtud de que Z es mayor que 1.96, podemoos rechazar la hipótesis h nulaa de que la meedia verdaderra de la distribución es cerro en un nivel del d 5%. Hemos asumido a que la l varianza de X se conoce, pero es más probable p que la varianza no sea conocida. Por consigu uiente, necesittamos remplaazar la varianzza desconocida σ2x con la varrianza muestrral estimada s2x . (Más adeelante nos refe feriremos a laa varianza dell error verdaddero estimada por s2.) Laa estadística de d prueba aproopiada se obttiene sustray yendo la meddia verdaderaa de la mediia muestral y dividiendo d la ddiferencia enttre la desviacción estándar muestral:
Cuando desseamos probaar la hipótesiis nula de quue µx = 0, estoo se simplificca a:
En vista de que q esta estaddística sigue una u distribucióón t, la llamarremos estadís-tica t. La estaddística t puedee usarse para construir inteervalos de confianza de unna manera análloga a la distrribución norm mal. Un interrvalo de conffianza del 95% % sería:
donnde tc es el vaalor crítico dee la distribuciión t (determiinado con la tabla 3 al finnal dell libro) basado o en el númerro de grados de d libertad y eel nivel de siggnificancia
CAP PITULO 2: Estadísstica elemental: a revisión r
43
desseado. El núm mero de gradoos de libertad es igual al núúmero de datoos menos el núm mero de restrricciones colocadas en los datos d por el pprocedimientoo estadístico quee se esté usanndo. Como unn ejemplo de la l forma de caalcular tc, debemos seleccio onar un valorr de la tabla de la distribuución t, de m modo que el 2.5% de la disstribución t see encuentre affuera de cualqquier extremoo del intervaloo correspondieente. Esto se muestra m en la ffigura 2.11 paara una distribbución t con 60 6 grados de libertad. Entoncces, si deseam mos que haya 2.5% en caada cola, seleeccionamos tc = 2.00, leyenddo en la colum mna denomin nada .05. Para probar la hipótesis dde que la med dia verdadera es igual a unn valor dado µ*X , especificam mos la hipótesiis nula µx= µ*x y la hipótessis alternativaa µx ≠ µ*x así com mo un nivel de significanncia. Usando el valor críttico de la disstribución t, callculamos el in ntervalo de cconfianza aprropiado. Si laa media hipottética µ*x se enccuentra fuera del intervalo de confianza,, rechazamos la hipótesis nula, n pero si éstta se encuentrra dentro, no la podemos rechazar. r Las hipótesiis alternativass no necesitann ser de la vaariedad bilaterral, en cuyo casso la media verdadera v pueede ser negattiva o positivva. Es frecueente que las pruuebas unilaterrales sean deseeables. Esto sóólo implica ajuustes menoress en la construccción de los intervalos i de confianza. Por ejemplo, ssupóngase que deseamos pro obar la hipótessis de que µx = 0 pero teneemos razones poderosas parra creer que si µx no es iguall a 0, entoncees es positiva. Aquí es aproopiada una prrueba unilateraal. La prueba es e como antes,, pero el valor crítico tc se elige de modo que q el 5% de la distribución d c caiga en una ccola, como see muestra en lla figura 2.12. En el caso don nde el número o de grados dee libertad es 60, 6 leemos quee el valor crítiico es 1.671 en la columna de d la tabla t deenominada .10. Para explicaar lo anterior, supóngase qu ue una muestrra de 64 puntu uaciones de pru uebas de mattemáticas dell SAT tiene una u media de 520 y una desviación esttándar estimad da de 100 y ddeseamos proobar la hipótesis nula de quue la media pobblacional de laas puntuacionnes del SAT es 500 con un nivel de signiificancia del 5% %. Para hacer esto, encontraamos que el valor v crítico dee la distribuciión t con 63 graados de liberttad es aproxim madamente 2..0. De esto see deriva que un u intervalo de confianza del 95% está daado por:
Enn vista de que 500 se encuenntra dentro deel intervalo dee confianza deel 95%, no pod demos rechazzar la hipótesis de que la media m poblaciional es iguall a 500.
2.S S.1
Erro ores Tipo I y Tipo II
La elección del nivel n de signifficancia, por lo l general 1 o 5%, correspoondiente a la eleección del tam maño del intervvalo de confiaanza, se comprrende mejor al considerar quéé tipos de errrores podríann cometerse cuando se hacen las prueebas de las hip pótesis. Supóngase que probamos la hippótesis nula dde que β = 0 y que a un
44
PA ARTE UNO: Los fu undamentos del análisis a de regresió ón
Figura 2.11 Prueba bilateral.
nivel de siggnificancia dell 5% la recha azamos. Es posible p que haayamos rechaazado en forma incorrrecta la hipóótesis nula. Este E error se lllama error Tipo T I, y la probabip lidad de su ocurrencia o es .05. Ahora, sii recolectamoos un conjuntoo de datos difeerente y encontramoos un interrvalo de coonfianza dell 95% entrre -.02 y .26 no podemos reechazar la hipótesis h nulaa de que β = 0 y por tanto t aceptamos de manera impplícita que ess verdadera. Sin embargoo, es posible que estemoss cometiendo un errror en este ccaso. El valorr verdadero dde β podría ser .05, en cuuyo caso habríamos aceptado a la hipótesis nula de que β = 0 cuando de hecho h era falsa. Este error, llamado erroor Tipo II, ess una posibiliidad probablee ya que el intervalo de confianza contiene unn gran númeroo de puntos. En otro casso, si cambiamos el niveel de significcación del 5% 5 al 1%. Entonces E la confianzaa del 95% paara β se incrementará al 99%. Esto im mplica que laa probabilidad de rechazar r de m manera incorrrecta la hipóótesis nula (eerror Tipo I) cae del 5% al 1%, pero al mismo tiempo se inccrementa la prrobabilidad dee un error Tipoo II. Por tanto, al seleeccionar el niivel de signifiicancia, uno enfrenta e un inntercambio: coonforme disminuimoos la probabiliidad del error Tipo I, increm mentamos la probabilidad p d error del Tipo II. La elección quee se tomará depende d del pproblema enn particular, pero en econometríaa es usual eleggir un nivel dee significanciaa bastante bajjo y una probaabilidad baja de erroor Tipo I.
Figura 2.1 12 Prueba un nilateral.
|
CAPITULO 2: Estadística elemental: a revisión
2.5.2
45
Valores p
La mayor parte de los análisis estadísticos reportan pruebas de significancia estadística señalando cuáles coeficientes son significativos al 1%, 5% u otro nivel de significancia apropiado. Sin embargo, en ocasiones es útil proporcionar información adicional en forma de un valor p (valor de probabilidad). Un valor p describe el nivel de significancia exacto asociado con un resultado econométrico particular. Por tanto, un valor p de .07 indica que un coeficiente es significativo estadísticamente en un nivel de .07 (pero no en nivel del 5%). En el contexto de una prueba bilateral usando una distribución normal, esto significa que el 7% de la distribución t se encuentra afuera del intervalo, más o menos, 1.96 desviaciones estándar de la media. Usualmente la hipótesis nula que se está probando será la hipótesis de que un coeficiente de regresión particular es igual a 0. Por consiguiente, el valor p es la probabilidad de obtener datos que generen una estimación del coeficiente estimado tan grande o mayor que el coeficiente estimado, dado que la hipótesis nula de un coeficiente cero es verdadera. Entre menor sea el valor p para un estudio dado, más sorprendente será ver un resultado así, si la hipótesis nula es válida. De manera correspondiente, un valor p grande indica que los datos son consistentes con la hipótesis nula. El valor p mide la probabilidad de un error Tipo I (como se expone en la sección 2.5.1), es decir, la probabilidad de rechazar en forma incorrecta una hipótesis nula correcta. Entre mayor es el valor p, es más probable que será un error rechazar la hipótesis nula; entre menor sea el valor p estaremos más seguros al rechazarla.
2.5.3
La potencia de una prueba
Un valor p alto significa que un coeficiente no es significativamente diferente de cero; como resultado el investigador no puede rechazar la hipótesis nula de que el coeficiente es cero. ¿Cuáles son las razones para este "fracaso"? Una razón obvia podría ser que la hipótesis nula es verdadera. Sin embargo, una posibilidad alternativa es que la hipótesis nula es falsa pero el conjunto de datos particular usado para la prueba resulta ser consistente con la nula. (Una tercera posibilidad, que el modelo es inválido, se comentará más adelante en el libro.) El concepto estadístico que nos ayuda a evaluar la importancia de la segunda explicación es la potencia de la prueba. La potencia es la probabilidad de rechazar la
hipótesis nula cuando de hecho es falsa. Por consiguiente para cualquier hipótesis nula particular, la potencia está dada por 1 menos la probabilidad de que haya un error Tipo II, es decir, 1 menos la probabilidad de que uno aceptará la hipótesis nula como verdadera cuando ésta es falsa. La potencia no sólo depende del tamaño del efecto que se ha medido, sino también del tamaño del conjunto de datos que se está estudiando. Siendo iguales otras cosas, entre mayor sea el efecto y mayor sea la muestra, la prueba será más potente. Cuando un análisis estadístico con potencia relativamente baja no
46
PARTE UNO: Los fundamentos del análisis de regresión
puede mostrar un valor p significativo, no deberíamos deducir, en forma definitiva, que no hay efecto. Más bien, debemos aceptar el hecho de que el estudio pueda no ser concluyente debido a que el conjunto de datos no es suficiente como para que nos permita distinguir entre las hipótesis nula y alternativa. Se proporciona un resumen de la relación entre los errores Tipo I y Tipo II y la potencia de una prueba estadística en el cuadro que sigue denotando la hipótesis nula como Ho. Ocurre un error Tipo I cuando la hipótesis nula es verdadera pero es rechazada por nuestra prueba; la probabilidad de que suceda esto está dada por el valor p. Un error Tipo II ocurre cuando la hipótesis nula es falsa pero no podemos rechazarla. Su probabilidad es igual a 1 menos la potencia de la prueba estadística. POTENCIA Y ERRORES TIPO
I
TIPO II
Decisión No puede rechazarse Ho Rechaza Ho
EJEMPLO 2.4
Ho Verdadera Decisión correcta Error Tipo I (valor p)
Ho Falsa Error Tipo II (1 - potencia) Decisión correcta
Éxito en las solicitudes de empleo
Supóngase que una reserva de solicitantes de empleo contiene 10 000 hombres y 10 000 mujeres y que deseamos saber si hay una diferencia significativa entre el éxito de las mujeres y el de los hombres para obtener empleos.5 Para una muestra particular de 50 hombres y 50 mujeres, el índice de aprobación fue del 58% para las mujeres (29 de 50) y del 38% para los hombres, de modo que el diferencial fue del 20%. La distribución de la población de las diferencias en los índices de aprobación se aproxima a una distribución normal, con una media de 20 puntos porcentuales y una desviación estándar de 9.7 puntos porcentuales.6 Considérese la hipótesis nula de que los hombres y las mujeres tienen un índice de éxito idéntico en sus solicitudes. Con una distribución normal, un intervalo del 95% para el diferencial del índice de aprobación está dado por 20 ± 1.96*9.7 = 20 ± 19.0 = (1.0, 39.0). Los diferenciales que son menores que 1 punto porcentual o mayores que 39 puntos porcentuales tienen más o menos una probabilidad de ocurrencia del 5%. El valor p asociado con un diferencial de 0 es algo menor que el 5%; de hecho, la probabilidad de obtener un diferencial menor o igual a 0 (y mayor o igual a 40) está dada por la probabilidad de que una distribución normal con media 0 y una desviación estándar de 1 tome valores menores que -20/9.7 = -2.06, o mayores que 2.06, la cual es del 4%. En vista de que el valor p es menor que el 5%, rechazamos la hipótesis nula de índices de éxito iguales con un nivel de significancia del 5%. Debido a que 5 Este ejemplo se basa en D. Kaye y D. Freedman, "Reference Guide on Statistics", en Reference Manual on Scientiftc Evidence (Washington, D.C.: Federal Judicial Center, 1994). 6 La desviación estándar se determina como la desviación estándar de una diferencia en dos proporciones y para una población grande es igual a [.58 (1 - .58)/50 + .38( 1 - 38)/50]5 = .096. Véase a D. Freedman y cols., Statistics (Nueva York: Norton, 1991), p. 67.
CAPÍTULO 2: Estadística elemental: a revisión
47
hemos rechazado escasamente la nula, podría ser interesante preguntarse respecto a la potencia de la prueba estadística. Para evaluar la potencia, necesitamos especificar la hipótesis alternativa de manera explícita. Supóngase que la alternativa es que el 55% de las mujeres aprobarán, al igual que el 45% de los hombres, un diferencial de 10 puntos porcentuales. Con una distribución normal que tiene una desviación estándar de 9.7, sólo diferenciales muéstrales mayores que aproximadamente 9.7*1.96 o 19.0 puntos, o menores que -19.0 puntos, serían considerados estadísticamente significativos en un nivel del 5%. Para una distribución normal que está centrada en el 10% (reflejando la hipótesis alternativa), podemos determinar que aproximadamente el 18% de la distribución se encuentra arriba de 19.0 puntos porcentuales y que sólo un porcentaje muy pequeño se encuentra debajo de -19.0. Por consiguiente, la potencia de la prueba, contra la alternativa que se acaba de especificar, es del 18%. Vemos, por consiguiente, que debido a que la prueba tiene una potencia algo limitada contra esta alternativa particular, la probabilidad de rechazar la hipótesis nula cuando la alternativa es correcta es de sólo el 18%; hay, por supuesto, una probabilidad del 82% de aceptar la hipótesis nula cuando la alternativa es correcta. Ahora supóngase que se ha duplicado el tamaño de la muestra, de 50 hombres y 50 mujeres a 100 hombres y 100 mujeres, y que los índices de aprobación permanecen iguales: 58% para las mujeres y 38% para los hombres. Entonces, la desviación estándar estimada de la población cae de 9.7 puntos porcentuales a 6.9 puntos porcentuales. El intervalo de confianza del 95% para el diferencial del índice de aprobación es 20 ± 1.96*6.9 = 20 ± 13.5 = (6.5, 33.5). Ahora el valor p asociado con un diferencial de 0 es más o menos 0.3%, el cual mide la probabilidad de que el diferencial real de 20 puntos porcentuales (o uno mayor) pudiera haber resultado de un mundo en el que los hombres y las mujeres tuvieran índices de aprobación iguales. Ahora, la potencia de la prueba también ha cambiado. Con esta muestra mayor, el diferencial de los índices de aprobación mayores que 6.9*1.96 o 13.5 puntos, o menor que -13.5 puntos, serán significativos. Con una distribución centrada en 10 puntos porcentuales (asociados con la hipótesis alternativa del 55%, 45%), la probabilidad de que ocurrirá dicho diferencial de los índices de aprobación es la probabilidad de que una distribución normal con media 10 y desviación estándar 6.9 será mayor que 13.5 o menor que -13.5, la cual aproximadamente es del 31%. Por consiguiente, la duplicación del tamaño de la muestra ha incrementado la potencia de la prueba contra esta alternativa particular del 18 al 31%.
2.6
ESTADÍSTICA DESCRIPTIVA Un histograma es un instrumento útil para describir los datos asociados con un valor particular. Este histograma tabula la distribución de frecuencia de los datos y, usualmente, divide la distancia entre los valores mínimo y máximo de
48
PARTE UNO: Los fundamentos del análisis de regresión
la serie de datos en intervalos iguales, para después poder tabular el número de observaciones que caen dentro de cada intervalo. La figura 2.13a presenta un histograma que describe el número de individuos por cada mil de población inscritos en instituciones públicas de educación superior (PÚBLICA) en cada uno de los 50 estados de Estados Unidos en el año académico 1984-1985. El histograma correspondiente para las inscripciones privadas por cada mil (PRIVADA) aparece en la figura 2.132b. En la primera figura vemos que los tres estados en el extremo inferior del espectro tuvieron una matrícula de entre 25 y 27.5 por cada mil en la educación pública (el más bajo fue Georgia), mientras que un estado (Arizona) inscribió algo más de 60 por cada mil. Con respecto a la matrícula privada, el estado más bajo no tuvo instituciones privadas (Wyoming) mientras que la inscripción en Massachusetts fue de más de 40 por cada mil.7 Al principio de este capítulo nos centramos en la media y la desviación estándar como medidas descriptivas de las propiedades de una serie de datos. El histograma tiende a enfatizar el mínimo y el máximo de esta serie, así como la distribución de los datos individuales. Además, hay otras medidas de resumen de series de datos, en general, que pueden proporcionar instrumentos descriptivos útiles y que pueden ser favorables en particular cuando uno desea evaluar si una serie de datos se aproxima a una distribución de probabilidad particular como la normal. La mediana es una medida de tendencia central que es más robusta a los errores o puntos de datos inusualmente extremos que la media. Para un número impar de observaciones, la mediana es la observación intermedia cuando los datos son colocados del menor al mayor (o del mayor al menor). Cuando el número de observaciones es par, la mediana, por lo general, se calcula por convención como el promedio de las dos observaciones intermedias. El sesgo es una estadística que proporciona información útil sobre la simetría de una distribución de probabilidad. La estadística de oblicuidad S para una variable X está, dada por:
donde s es la desviación estándar de X. S es igual a cero para todas las distribuciones simétricas incluyendo la normal. Para distribuciones que no son simétricas, la estadística de sesgo es positiva cuando la cola superior de la distribución es más gruesa que la cola inferior y negativa cuando la cola inferior es más gruesa. La kurtosis proporciona una medida del "grosor" de las colas de una distribución. La estadística de kurtosis K, está dada por
7 Para mayores detalles, véase J. Quigley y D. Rubinfeld, "Public Choices in Public Higher Education", en C. Clotfelter y M. Rothschild (eds.), Studies of Supply and Demand in Higher Education (Chicago, University of Chicago Press, 1993), pp. 245-283.
CAPÍTULO 2: Estadísstica elemental: a revisión
49
Figura 2.13 Matrícula en escuelas e públicas y priv vadas.
Paara una distribbución normaal es igual a 3. Cuando las ccolas de la distribución so on más gruesaas que la norm mal, K será mayor m que 3 y viceversa. A menudo es útil probarr si una serie de datos dadaa se aproximaa a la distribuución normal. Esto puede evvaluarse, de manera m informaal, revisando para p ver si la meedia y la mediana son casi iguales, si el sesgo es aprooximadamentee cero y si la kuurtosis está cerca de 3. Unaa prueba más formal de norrmalidad estáá dada por la esttadística Jarque-Bera: JB B = [N/6][S2 + (K ( - 3)2 /4]
50
PARTE UNO: Los fundamentos del análisis de regresión
La estadística JB sigue una distribución ji cuadrada con 2 grados de libertad. Si la estadística JB es mayor que el valor crítico de la ji cuadrada, rechazamos la hipótesis nula de normalidad. Para ilustrar diversas de estas medidas estadísticas, hemos tabulado cada una de ellas para las series de datos de inscripción, PÚBLICA y PRIVADA, descritas con anterioridad: Pública Media Mediana Desviación estándar Sesgo Kurtosis Jarque-Bera
39.29 38.84 8.17 0.38 2.61 1.54
Privada 10.53 7.84 8.24 1.78 6.24 48.26
La serie de inscripción pública tiene una mediana que sólo es ligeramente inferior que la media y un sesgo que está cerca de cero. Como se sugirió en el histograma en la figura 2.13a, la serie es razonablemente simétrica. Por el contrario, es claro que la serie de inscripción privada no lo es. Tiene una mediana que está considerablemente por debajo de la media, un resultado típico para una serie con una cola superior larga. Además, la estadística de sesgo de 1.78 es mucho mayor que 0. ¿Cualquiera de las series se aproximan de manera razonable a una distribución normal? Para PRIVADA, es evidente que la respuesta es no, en vista de que la kurtosis de 6.24 es considerablemente mayor que 3 (más gruesa que las colas normales) y la estadística Jarque-Bera de 48.26 es mucho mayor que el valor crítico de la distribución ji cuadrada 5.99 (con un nivel de significancia del 5%). Sin embargo, no podemos rechazar la suposición de que PÚBLICA es aproximadamente normal. Aunque el histograma no refleja en forma directa la normal, debemos tomar en cuenta el hecho de que, con sólo 50 observaciones no esperaríamos que la aproximación fuera cercana en extremo. Además, la kurtosis de 2.61 es cercana a 3 y la estadística Jarque-Bera de 1.54 no es significativamente diferente de 0 con un nivel de significancia del 5%.
APÉNDICE 2.1 Las propiedades del operador de expectativas
Este apéndice revisa algunas de las propiedades útiles del operador de valor esperado. Resultado 1
E(aX + b) = aE(X) + b
donde X es una variable aleatoria, y a y b son constantes.
(A2.1)
CA APITULO 2: Estad dística elemental: a revisión
Resultado o28 Resultado 3
51
E[(aX)2] = a2E(X2)
(A2.2)
V Var (aX + b) = a 2 Var (X)
(A2.3)
DEMOSTRACIÓN N Por definiciión
Pero E(aX + b) = a E (X) + b, usando el resulltado 1. Por co onsiguiente, V (aX + b) = E[aX - E(aX Var X)] 2 = E[aX - aE(X)] 2 = E[a(X - E(X)))]2 = a2E[X - E E(X)]2
por el e resultado 2
= a2 Var (X) Ahora, podem os usar el opeerador de valoor esperado p ara probar alg A gunos resultaados concerniientes a la covvarianza entrre dos variabl es aleatorias. Resultadoo 4
Si X y Y son variablees aleatorias, entonces: E E(X + Y) = E(X) E + E(Y)
Resultadoo 5 DEMOSTRACIÓN N
(A2.4)
Var (X + Y) = Var (X X) + Var (Y) + 2 Cov (X, Y))
(A2.5)
Var (X + Y) Y = E[(X + Y)) - E(X + Y)]2 = E[(X + Y) - E(X) - E(Y)] 2
por el resu ultado 4
= E[(X - E(X X)) + (Y - E(Y Y))) 2 = E[X - E(X))] 2 + E[Y-E((Y)] 2 + 2E[(X - E(X (X))(Y - E(Y)))] = Var (X) + Var V (Y) + 2 C ov (X, Y) Resultado 6
Si X y Y son indepen dientes, entonnces E(XY) = E(X)E(Y).
8 Nótese que no n es verdad que E(X2) = [E(X)]2. Para ver esto enn el caso más simp mple, supongamos qu ue X = 1 cuando o aparecen caras en una moneda y X= 0 cuando apparecen cruces. Enntonces para una 1 1 2 1 2 1 2 1 moneda m legal, p1 = 2 y p0 = 2 ,dee modo que E(X E ) = 2 (l ) + 2 (0 ) = 2 (l) = 12 . Sin embargo,
E(X) = 12 (1) + 12 (0) = 21 , y [E(X)]2 = 14 .
52
PAR RTE UNO: Los fund damentos del análisis de regresión
Resultadoo 7 DEMOSTRACIÓ ÓN
Si X y Y son indepenndientes, entoonces Cov (X,, Y) = 0. COV (X, Y) = E[X-E(X X)][Y -E(Y)] = E[XY - E(X X)Y - XE(Y) + E E(X)E(Y)] = E(XY)-E(X X)E(Y) = 0
por el resultado 6
Resultado o8
donde d ¯X es la media m muestrral de una var iable aleatori a con media µ y varianza σ2x
D EMOSTRACIÓN N
El resulttado 8 muestrra que la var ianza del esttimador de laa media X¯ caee conforme se incrementa i el tamaño de la muestra. m Por tanto, t con máss informaciónn, cada vez obteenemos más precisión p en nu uestras estimaaciones de la media µ. Resultad do 9 DEMOSTRACIÓ ÓN sumatoria:
Primero,, consideremoos el término qque involucra al operador dee
CAPÍTULO C 2: Estad dística elemental: a revisión
53 3
Por consiguuiente, tomanndo valores esperados da:
APÉNDICE 2.2 2 Es stimación de máxima m verosim militud
Laa estimación de d máxima veerosimilitud see centra en el hecho de quee poblaciones diferentes geneeran muestrass diferentes; cualquier muuestra que se esté examinaando tiene maayor, probabiliidad de haberr provenido dee algunas poblaciones que dee otras. Por ejjemplo, si unno estuviera tomando t mueestras de lanzamientos de moonedas y se obtuviera o unaa media muesstral de 0.5 (representandoo la mitad de caaras y la mitaad de cruces),, la poblaciónn más probable de la que se s extrajo la muuestra sería una u poblaciónn con una meedia de 0.5. La L figura A2.1, ilustra un caaso más general en el que see sabe que unaa muestra (X1,,X2,. .. ,X8) fuee extraída de unna población normal n con vaarianza dada pero media dessconocida. Suupóngase que lass observacionnes provienen ya sea de la distribución d A o de la distriibución B. Si la población veerdadera fueraa B, la probabbilidad de quee hubiéramoss obtenido la muuestra mostrrada sería baastante pequ ueña. Sin em mbargo, si laa población veerdadera fueraa A, la probabbilidad sería coonsiderablem mente mayor. Por P tanto, las obbservaciones "seleccionan" " a la poblacióón A como la que tiene maayor probabilid dad de haber generado los datos observvados.
54
PA ARTE UNO: Los fu undamentos del an nálisis de regresió ón
Figura A2.1
Estimación n de máxima verosimilitud.
Definim mos el estimaador de máxiima verosimilitud de un parámetro β como el valor de βˆ que sería más probablle que generaara las obserrvaciones muuéstrales observadas Y1, Y2, ..., YN. E En general, sii Yi está distribbuida de form ma normal y caada una de las Y es extraída e en foorma indepenndiente, el esttimador de máxima m verosiimilitud maximiza P(Y1)p(Y2) … p(YN)
donde cada p representa una probabillidad asociadaa con la distrribución norm mal. Por tanto, la estiimación de m máxima verosimilitud calcuulada es una función fu de la muestra m particular dee Y elegida. U Una muestra diiferente daría como c resultaddo una estimaación de máxima vero osimilitud differente. A menuddo se hace referrencia a P(Y1)p((Y2) … p (Yn) coomo la función de verosimilitu ud. Esta función no sólo s depende de los valorres muéstraless sino tambiéén de los paráámetros desconocido os del problema. Al describir la función de verossimilitud, a menudo m pensamos enn los parámetrros desconociidos como varriables mientrras que las Y soon fijas. La estimacióón por máxim ma verosimilitu ud implica unna búsqueda entre e estimaddores de parámetros alternativos para enconntrar aquellos estimadorees que con mayor probabilidad d generan la muestra. m Para verr cómo puede aplicarse el principio de m máxima verosim militud, notam mos que si X está disstribuida en foorma normal con media µ y desviación n estándar σ (sección 2.4.1),
donde exp representa laa función ex xponencial. L La función de d probabilidad está dada entonces por:
CAPÍT TULO 2: Estadístic ca elemental: a re evisión
55
Tom mando el logaaritmo de ambbos lados se produce p la funnción log-vero osimilitud: ln L = - N ln σ - N ln(2π) 1 / 2 - (l/2σ 2 ) ∑(X i - µ) 2 Para obtenerr el estimadorr de máxima verosimilitud v de la media µ, µ notamos que µ sólo entra en el último término, el cual c es preceddido por un signo negativoo. Por consigu uiente, para m maximizar el valor v de la fuunción de verrosimilitud, min nimizamos ∑(X (X i - µ) 2 , lo ccual se logra con el estimadoor de mínimoss cuadrados X¯, la a media mueestral. Resultta que si X esstá distribuidda de forma normal, n la meddia muestral es el estimaddor de máxim ma verosimiliitud de la meedia poblacion nal. Para obtenerr el estimadorr de máxima verosimilitud v de σ2, diferennciamos ln L coon respecto a σ e igualamoos el resultaddo a 0, obteniendo
-N/σ - 1/2 ∑(X i - µµ) 2 (-2/σ 3 ) = 0 Muultiplicando am mbos lados poor - σ 3 / N, obttenemos comoo un estimadoor de la variannza poblacionnal a:
Éstee es un estimaador consistennte de la variaanza pero sessgado.
EJE ERCICIOS Algunas de las prreguntas siguieentes perteneceen al conjuntoo de datos del cuadro 2.1. Estoos datos fueronn recopilados en una encuesta de estudiaantes de econoometría. Las variiables están deffinidas como REN NTA = renta m mensual total enn dólares NP = número de personas enn un departam mento NH = número de habitacionees 1 si ess mujer SE EXO= 0 si es hombre D DIST = distanciia desde el cenntro del campuss en calles RENTA RPP R =--------- = renta por perssona NP 2.1 RPP R es una meedida de renta ppagada por perso ona. Muéstresee que (RENTA//NP) = RPP no es e igual a RENT TA/NP.
56
PARTE UNO: Los fundamentos del análisis de regresión
CUADRO 2.1 DATOS DE RENTA Renta
NP
NH
Sexo
$230 245 190 203 450 280 310 185 218 185 340 230 245 200 125 300 350 100 280 175 310 450 160 285 255 340 300 880 800 450 630 480
2 2 1 4
2 2 1 2 2 2 2 1 2 1 2 2 1 2 1 3 2 1 2 1 2 2 1 1 2 2 2 6 5 3 6 3
1 0 1 0 1
3 2 2 2 2 1 2 2 1 2 1 3 2 1 2 2 2 3 2 1 2 4 2 6 5 3 6 3
1 0 0 0 1 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0
RPP = Renta/NP
Dist 7 24 0 24 4 6 8 8 42 8 3 60 24 36
$115.00 122.50 190.00 50.75 150.00 140.00 155.00 92.50 109.00 185.00 170.00 115.00 245.00 100.00 125.00 100.00 175.00 100.00 140.00 87.50 155.00 150.00 80.00 285.00 127.50 85.00 150.00 146.67 160.00 150.00 105.00 160.00
3 9 16 5 6 4 10 12 4 8 3 11 6 10 5 24 24
2.2 El resultado del ejercicio 2.1 sugiere que en general E(Y/X) ≠ E(Y)/E(X). Muestre que para el siguiente ejemplo E(Y/X) es positivo y E(Y)/E(X) es negativo: X = -4
Y= -8
Prob =
X=2
Y = 60
Prob =
1 2 1 2
2.3 Suponga que la RPP está distribuida en forma normal con media µRPP y varianza σ2RPP . Pruebe la hipótesis de que µRPP = $135 con un nivel de significancia del 5% si a) σ2RPP = 2 150 o b) σ2RPP es desconocida. Ponga atención particular a su elección de la estadística de prueba. 2.4 Ahora suponga que la RPP entre los hombres se distribuye en forma normal con media µmRPP y varianza (σmRPP )2 . También suponga que la RPP entre las mujeres se distribuye f f en forma normal con media µRPP y varianza (σRPP )2. Pruebe la hipótesis de que m f µ RPP = µRPP con un nivel de significancia del 5% cuando se le da que σ2f = σ2m = 1 681. RPP
RPP
CAP PÍTULO 2: Estadísstica elemental: a revisión
57
m 2.5 (Difícil) Repitaa el ejercicio 2..4 asumiendo que qu σ 2fRPP = σ 2m v común RP PP pero que su valor se desconoce. 2.6 En la parte a)) del ejercicio 2.3 asumimos que la RPP esstaba distribuidda en forma norm mal con media desconocida d µRPPP y varianza co onocida σ2RPP = 2 150. Asumienddo, como lo 2 hicim mos en la partee b), que o σRPPP se desconocee, pruebe con un u nivel de signnificancia del 5% que σ2R PP =2 1550. Sugerencia:: Bajo la hipóteesis de que σ2R PPP =2 150, encu uentre la distribuución (N- 1)s2/2 / 150, donde:
2.7 En el ejercicio 2.6 asumimos qque (σ mRPP )2 = (σσfRPP )2. Pruebe eesta igualdad coon un nivel de significancia s deel 5%. 2.8 Suponga que X es una variabble aleatoria diistribuida en foorma normal coon media µx y vaarianza σ2x . Suupongamos quee Z = (X - µx)//σx es una variiable aleatoria nueva. Demueestre que Z está distribuida en e forma norm mal con media 0 y una varianzza de 1/N. 2.9 Suponga que X está distribuuida en forma normal con media m 10 y variianza 625. Enccuentre la probaabilidad de quee X ≥ 30. 2.100 Una monedaa es lanzada seiis veces. Ustedd desea probar la hipótesis dee que la probabiilidad de caras = probabilidadd de cruces = 12 . ¿Cómo proocedería? 2.111 El coeficiente de correlacióón muestra! enttre dos variablees X y Y se denoota (X, Y) y estáá dado por:
Mueestre que si unoo estima las reegresiones Y = a + bX b X = A + BY B
el prroducto de los estimadores ppara b y B será igual a r2XY 2.122 Si X está disttribuida en forrma normal conn media µ y vaarianza σ2, encuuentre una tran nsformación dee X que tenga laa distribución ji j cuadrada conn 1 grado de liibertad. 2.13 3 Demuestre que q E(X)2 = (E((X))2 sólo ocurrre si X toma unn solo valor co on probabilidad 1. 2.144 Suponga quee ε1 y ε2 son vaariables aleatoriias independienntes, cada una con media 0 y varianza v σ2. Sup ponga que obseerva a X1 yX2, loos cuales se relaacionan con ε1 y ε2 como siguue:
donde p es una coonstante, -1 ≤ p ≤ 1. a) ¿Cuál es laa covarianza enntre X1y X2? ¿C Cuál sería la corrrelación? b) ¿Cuál es la l media del ppromedio X = (X 1 + X 2 )/2 dde X 1 y X 2? c) ¿Cuál es laa varianza del ppromedio X ? Evalúe E la variaanza de ρ = -l, - 1 ,- 1 , 0, 1 , 2 2 4 1 , 1.. ¿Qué concluy ye acerca de la precisión p de loss promedios muuéstrales cuanddo los datos 2 suby yacentes no so on variables aleeatorias indepeendientes?
58
PARTE UNO: Los fundamentos del análisis de regresión
2.15 Suponga que es un agricultor interesado en la cantidad de lluvia que cae en sus campos. Donde X denota la precipitación pluvial anual en pulgadas y (por su modelo) que X está distribuida en forma lognormal, esto es que loge X se distribuye en forma normal con media µx. Las cantidades observadas de lluvia para el periodo de 10 años de 1988 a 1997 están dadas como sigue: Año
Precipitación
Año
pluvial 1988 1989 1990 1991 1992
51.06 30.06 31.81 74.46 32.41
Precipitación pluvial
1993 1994 1995 1996 1997
35.48 30.42 33.09 30.39 41.08
a) Estime la media µx y la varianza σ2x de loge X. b) Use una estadística ji cuadrada para probar la hipótesis de que las cantidades de precipitación pluvial varían 20% por año (es decir, que la varianza log σ2x es igual a .04). 2.16 Usando los datos de rentas del cuadro 2.1, calcule la media, la mediana, el sesgo y la kurtosis de la variable RPP. Usando estas estadísticas describa la distribución de la renta per capita en forma tan completa como sea posible.
CAPÍTULO
3
EL MODELO DE REGRESIÓN DE DOS VARIABLES
En el capítulo 1 describimos el método de mínimos cuadrados como uno de los medios posibles por el cual una curva puede ajustarse a los datos. Nuestra preocupación era la estimación del parámetro en lugar de las estadísticas de prueba del modelo. En este capítulo exponemos la prueba estadística del modelo de regresión de mínimos cuadrados con una variable dependiente y una variable independiente. Primero describiremos las suposiciones subyacentes en el modelo, y luego analizaremos las propiedades estadísticas de los estimadores de mínimos cuadrados. Veremos que bajo ciertas situaciones los estimadores de mínimos cuadrados son insesgados, consistentes y eficientes. La distribución de los estimadores de los parámetros será usada luego para construir intervalos de confianza y para probar hipótesis acerca del modelo. Para completar el capítulo introducimos R2, una medida del ajuste del modelo de regresión.
3.1
EL MODELO Para explorar la naturaleza probabilística del modelo de regresión, contaremos con el hecho de que para un valor observado dado de X (la variable independiente), podemos observar muchos valores posibles de Y (la variable dependiente). Como un ejemplo considérese el consumo de un individuo que recibe un ingreso de 20 000 dólares cada año. Debido a que es probable que la cantidad de dinero gastada en alimento varíe cada año, suponemos que para cada observación X (ingreso), las observaciones en Y (compras de alimento) diferirá en forma aleatoria. Para describir esta situación de manera formal, agregamos un componente de "error" aleatorio al modelo, escribiéndolo como: Yi = α + βXi + εi
(3.1) 59
60
PARTE UNO: Los fundamentos del análisis de regresión
donde Y es una variable aleatoria, X es fija o no estocástica, y ε es un término de error
aleatorio cuyo valor se basa en una distribución de probabilidad subyacente. (Hemos cambiado nuestra notación para usar las letras griegas α y β para representar el intercepto y la pendiente de la línea; es decir, los parámetros de regresión, en vista de que nuestro modelo ahora contiene un término de error aleatorio. ) El término de error puede surgir por medio de la interrelación de varias fuerzas.1 En primer lugar, los errores aparecen debido a que el modelo es una simplificación de la realidad. Por ejemplo, asumimos que el precio es el único determinante de la demanda para un producto. Pero de hecho, diversas variables omitidas relacionadas con la demanda, como son gustos individuales, población, ingreso y clima, pueden estar incluidas en el término del error. Si estos efectos omitidos son pequeños, es razonable asumir que el término del error es aleatorio. Una segunda fuente de error se asocia con la recolección y medición de los datos. Los datos económicos y empresariales con frecuencia son difíciles de medir. Por ejemplo, una empresa individual puede no estar dispuesta a proporcionar información explícita de costos, de modo que no se obtendrán datos sobre costos libres de errores. Dadas estas fuentes de error, nuestra decisión de representar la relación en la ecuación (3.1) como estocástica, debería ser clara. Para cada valor de X existe una distribución de probabilidad de ε y por consiguiente una distribución de probabilidad de las Y. Esto se describe en forma gráfica en la figura 3.1. Ahora estamos en posición de especificar por completo el modelo de regresión lineal de dos variables enumerando sus suposiciones importantes. 1. 2. 3. 4.
La relación entre y y X es lineal y está dada por la ecuación (3.1). Las X son variables no estocásticas cuyos valores son fijos. El error tiene un valor esperado cero: E(ε) = 0. El término del error tiene una varianza constante para todas las observaciones; es decir, E(ε2) = σ2. 5. Las variables aleatorias εi son estadísticamente independientes. Por tanto, E(εi εj) = 0, para todas las i ≠ j. 6. El término del error está distribuido en forma normal. Las suposiciones 1 a 5 constituyen el modelo de regresión lineal clásico. La ecuación (3.1), a menudo, es denominada la especificación del modelo. Nótese que hemos asumido que Y se relaciona con X en lugar de viceversa. También, nos hemos restringido a una variable de la derecha. La suposición de que cada X es fija es equivalente a la suposición de que cada variable independiente en cuestión es controlada por el investigador, quien puede cambiar su valor de acuerdo con objetivos experimentales. Dicha suposición es irreal en el El término del error debe distinguirse del residual (ε^ i = Yi – Y i ) o la desviación de la observación de la variable dependiente de su valor ajustado. Los errores se asocian con el modelo de regresión verdadero, mientras que los residuales surgen del proceso de estimación. 1
CA APÍTULO 2: Estadística elemental: a revisión
61
Figura 3.1 Modelo de regresión de dos variables.
esttudio de la maayor parte dee los problemaas empresariaales y económ micos; se ha heccho con propóósitos de expoosición. La suposicióón de que el ttérmino del errror tiene un valor v esperadoo de cero se hacce en parte poor convenienccia. Para ver esto, se tiene que, el efecto promedio de las variables omitidas es igual i a α'; es decir, E(εi) = α'. Entoncees, podemos esccribir el modeelo de dos variables como:
Por tanto, si el término del error tiene una u media que no es cero,, el modelo oriiginal sería eqquivalente al m modelo nuevoo con un interrcepto diferennte pero con un término del error tenienddo media cero o. Si el términoo del error tienne una varianzza constante (ccomo se supu uso antes), lo llam mamos homoocedástico, peero si la variaanza es cambbiante, lo llam mamos error hetterocedástico. La L heterocedastticidad (en opossición a la homoocedasticidad) puede surgir si uno está exxaminando unna muestra representativva de empressas en una inddustria. Puedee haber una raazón para creeer que los térm minos de erroor asociados con n empresas muy m grandes teendrán una vaarianza mayor que aquelloos asociados con n empresas peequeñas. La fiigura 3.2 ilusttra dos casos dde heterocedasticidad. En a) la l varianza deel término del error disminuuye conforme se incrementaa el valor de X, mientras que en la figura b)) la varianza de d los errores se s incrementaa con X. La suposicióón de que los errores corresspondientes a diferentes observaciones sonn independienntes y por connsiguiente caarecen de relaación es impo ortante
I
62
P PARTE UNO: Los fundamentos f del análisis a de regresión
Figura 3.22 Heteroced dasticidad.
tanto en esstudios de seeries de tiem mpo como en los de cortee transversal.. Cuando los términoos del error de diferentees observacioones están correlacionad c os, decimos que el proceso de error e está corrrelacionado serialmente. s L figura 3.3 ilustra la La correlación serial negatiiva y positivaa en un estuddio de series de tiempo (X ( t representa el valor de X en el momento t). La correllación serial negativa n signnifica que los errores negativos enn un periodoo están asociados con errrores positivvos en el siguiente, y viceversa, como en la figura 3.3a. Sin embargoo, cuando occurre una correlación serial positivva, como en la figura 3.33b, un error positivo en un u periodo tenderá a estar asociaado con un errror positivo een el siguientte periodo. Como un corolario de las suposiciones plannteadas 2 y 3, 3 estamos assumiendo de manera implícita quue el términ no del error es independiiente de las X y por consiguientte no está coorrelacionado o con las X. Esto resultaa de la supossición de que las X noo son estocástticas. Entoncees, E(X i εi) = X iE(εi) = 0 Necesitarem mos esta supoosición planteeada de mannera explícita cuando habllemos de modelos enn los que lass X son estoccásticas. Adeemás, la supo osición 3 noss permite concluir quue el valor espperado de la suma de los errores en cualquier mueestra será idénticamennte cero; es decir, d E(Σ εi) = ΣE(εi) = 0 Esto resultaa de la suposicción de que E(ε E i) = 0, lo cuual implica qu ue el valor espperado de los términoss del error asoociados con unna X particulaar serán idéntticamente ceroo para un muestreo reepetido de Y aasociadas con esa X. Fijamoos cada valor de X; luego extraemos muestras para los errorres aleatorioss de una pooblación con una distribuución de probabilidaad conocida. E Entonces, el valor v que asum mimos que ess idénticamentte cero es el valor espeerado de cadaa una de estass muestras de ttérminos del error. En la suuposición 4, hhemos descritto que cada téérmino del errror tiene una varianza constante σ2. Esta variannza es un paráámetro desconnocido y debee esti-
CAPÍTUL LO 3: El modelo de e regresión de doss variables
63 3
Figura 3.3 Correlación serial.
marse como parte m p del moddelo de regressión. Por tantto, el modeloo de regresiónn d descrito aquí tiene t tres parrámetros desconocidos, miientras el moddelo de ajustee d curvas del capítulo de c 1 sóllo tenía dos. Las L suposicionnes del modelo se han dadoo e función dee la perturbacción del errorr ε, pero con igual facilidaad podríamoss en h haber escrito las l suposicionnes en funcióón de la distriibución de proobabilidad dee Y En este caso apareceríann como sigue: Y. 3'. La variab ble aleatoria Y tiene un vallor esperado α + βX: E(Yi) = E(α + βXi + εi) = α + βXi + E (εi) = α + βXi 4'. La variab ble aleatoria Y tiene várianzza constante. 5′. Las varia ables aleatoriaas Yi son indeependientes.
Para realizzar pruebas esstadísticas en el e modelo lineeal, necesitam mos especificarr laa distribuciónn de probabiliddad del términno del error. En el modelo o de regresiónn liineal normal clásico agregaamos la supossición 6. Esta suposición enn la que el tér-mino m del error está distribuuido en form ma normal es importante para la pruebaa estadística e dell modelo. Si uno u cree que los errores inndividuales soon pequeños e in ndependientes entre sí, la suposición dee normalidad es razonable.. Dado que ell téérmino del errror e está disttribuido en fo orma normal, resulta que Y también estáá distribuida d enn forma norm mal (en vista de que Xi es una constan nte, pero εi ess normal). n
3.2
MEJOR ESTTIMACIÓN LINEAL L INSE ESGADA Para P examinarr las caracteríísticas de las estimacioness de los parám metros de mí-nimos n cuadraddos, recuérdeese que resultan de una muuestra específfica de obser-vaciones v de laas variables dependiente d e independiennte. Entonces si la muestraa puede p variar, las l estimacionnes pueden vaariar tambiénn y por tanto están e asocia-
64
PARTE UNO: Los fundamentos del análisis de regresión
das con una variable aleatoria.2 Debido a que el modelo es estocástico, hemos mostrado las fórmulas para el intercepto y pendiente de regresión como αˆ y βˆ (donde los "sombreros" sobre α y β representan valores estimados), pero es importante darse cuenta que la notación βˆ sirve para un doble propósito: se refiere a la estimación de la pendiente resultante de una muestra específica al igual que al estimador (una fórmula que se aplica a cualquier muestra) que sigue una distribución de probabilidad. Esperamos que los estimadores de mínimos cuadrados ordinarios (OLS, por sus
siglas en inglés) sean insesgados y consistentes. De hecho, una de las propiedades buenas del estimador de mínimos cuadrados ordinarios (el cual no requiere de normalidad del término del error) es que de todos los estimadores que son lineales [como en la ecuación (3.1)] y que producen estimaciones insesgadas, las estimaciones resultantes del estimador OLS tienen la varianza mínima. Ésta es la base del teorema Gauss-Markov. Teorema. Gauss-Markov- Dadas las suposiciones 1 a 5, los estimadores αˆ y βˆ son los mejores (más eficientes) estimadores lineales insesgados de α y β en el sentido de que tienen la varianza mínima de todos los estimadores lineales insesgados. Para entender la importancia del teorema de Gauss-Markov, debemos notar primero que βˆ (y αˆ ) es un estimador lineal, en vista de que βˆ puede escribirse como un promedio ponderado de las observaciones individuales en Y. Hay una gran cantidad de estimadores lineales posibles que podrían usarse para estimar el intercepto y la pendiente, y una porción de estos estimadores será insesgado.3 Sin embargo, βˆ tienen la propiedad adicional de que su distribución de probabilidad tiene la varianza menor de todos los estimadores lineales que son insesgados. El objetivo de hallar el mejor estimador lineal insesgado (BLUE, por sus siglas en inglés) es uno que surgirá una y otra vez en este libro. Veremos que si ciertas de las suposiciones del teorema de Gauss-Markov no se cumplen, los estimadores de mínimos cuadrados ya no serán BLUE. Nuestra meta será entonces obtener un estimador distinto de los mínimos cuadrados que sea BLUE. Es importante percatarse de que el teorema de Gauss-Markov no se aplica a estimadores no lineales. Estos estimadores no lineales pueden ser insesgados y tener una varianza inferior o un error cuadrático medio inferior que un estimador lineal de mínimos cuadrados. Esto nos dice que, puede haber circunstancias en las que uno debería usar un objetivo distinto al "mejor estimador lineal insesgado" cuando se seleccionan características de la estimación. Por ejemplo, 2 Si seleccionamos una sola muestra de Y observaciones asociadas con los valores de la variable independiente, podemos obtener una "estimación" de la pendiente de la regresión. Si replicamos el experimento con los mismos valores de X, obtenemos un nuevo conjunto de observaciones en Y (debido a que las e diferirán en la muestra nueva) y por tanto una estimación nueva de la pendiente. Si extraemos muestras suficientes de Y, obtenemos una distribución de estimadores de la pendiente. 3 Véase el ejercicio 3.10 para un ejemplo.
CAPÍTUL LO 3: El modelo de e regresión de doss variables
65 5
lo os estimadorees no lineales sesgados conn error cuadráático medio mínimo m tienenn varias v aplicaciiones útiles. No intentaaremos demoostrar el teorem ma de Gauss--Markov en este e momentoo (la prueba se encuentra enn el apéndice 4.3), pero enncontraremoss expresioness para p la mediaa y la varianzza de los estiimadores de mínimos cuaadrados. Paraa simplificar s traabajaremos coon los datos en e forma de desviaciones. d A partir de d la ecuaciónn (3.1), se recordará que Yi = α + βXi + εi . Sumandoo todas las N obbservaciones y dividiendo entre N, encoontramos quee: (3.2))
ddonde ε repreesenta la meddia muestral del d término deel error. Restaando la ecua-c ción (3.2) de la l ecuación (33.1) y combinnando términos se obtiene:
o (3.3))
ε no será iguaal a 0 en la muuestra, aun cuaando E(εi) = 0. 0 Sin embargo o, la ecuaciónn
(3.3) sólo se usará u cuando derivemos reesultados conncernientes all sesgo de loss e estimadores. P consiguiennte, para simpplificar hacem Por mos la suposicción implícitaa d que ε = 0 y escribimoss el modelo en de n forma de desviaciones d (descrita en ell c capítulo 1) com mo: yi = βX Xi + εi
(3.4))
La recta de reggresión verdaadera es E(yi) = βXi. La penndiente estimaada de la rectaa L e es: (3.5))
Debido a que yi es una variable aleattoria, βˆ tambiién será aleatooria, de modoo qque es naturall determinar las l propiedaddes de la distrribución de βˆ . Los detalless s relativameente sencilloss, pero en virttud de que sonn algo tediosoos, los hemoss son d dejado al apénndice 3.1. Lass pruebas dep penden sobre todo de los resultados quee innvolucran loss operadores de sumatoriaa y valor espeerado, como se s describe enn los apéndices 1.1. y 2.1, assí como de laas suposicionees del modeloo de regresiónn lineal clásico. El primer ressultado es quee:
E (βˆ ) = β de d modo que βˆ es un estimaddor insesgado de β.
(3.6))
66
PAR RTE UNO: Los fun ndamentos del aná álisis de regresión
El segunddo resultado ees que (3.77)
dde modo que la varianza dde βˆ depende sólo de la vaarianza del errror, la varianz de las X y el número dee observacionnes. Además, la media y laa varianza del za e estimador dell intercepto soon: (Véase ejeercicio 3.11) (3.8) (3.9)
P último, laa covarianza entre αˆ y βˆ está Por e dada porr: (3.100)
Con inforrmación respecto a las meedias y variannzas de los estimadores dee mínimos cuad m drados y su ccovarianza, esstamos listos para exponerr la prueba est tadística del modelo m lineal. Para hacerlo,, necesitamos la suposición n 6, un términoo d error disstribuido en forma normaal. Primero, observe, ya que βˆ es unn del p promedio ponnderado de lass y y en vista de que las yi están distribuuidas en formaa n normal, el estimador βˆ estarrá distribuido en forma norm mal. (Una com mbinación lineaal
dde variables independiente i es distribuidaas en forma noormal estará distribuida enn f forma normaal.) Aun si laas y no estánn distribuidass en forma normal, n puedee m mostrarse quee la distribuciión de βˆ es assintóticamentee normal (bajjo condiciones r razonables) recurriendo all teorema dell límite centraal de la estad dística.4 Resuu5 m miendo, (3.11) (3.12) (3.13)
4 Hablando aproximadamennte, el teorema deel límite central eestablece que la distribución de la m media muestral de d muestra de vvariables indepenndientes tenderá hacia la normalidad conforme el e
ttamaño de la mueestra se vuelve innfinitamente grannde. Se aplica a βˆ debido a que βˆ es una combinaac lineal de las yi. ción 5
2
La ecuacióón (3.11) dice quue “βˆ sigue una distribución norm mal con una med dia β y una variannza
σ /∑x 2i ”.
CAPÍTULO 3: El modelo de re egresión de dos variables v
67
Nótese que la varianza dde βˆ varía en forma directaa con la varian nza de ε. Por tannto, siendo igguales otras coosas, es probaable que obtenngamos estim maciones más prrecisas de la pendiente p cuaando la varian nza del térmiino del error es pequeña. Sin embargo, la l varianza dde βˆ varía inv versamente ccon Σxi2. Por tanto, entre maayor es la variianza de Xi, ess probable quee le resulte meejor la estimacción de β. De heecho, será diffícil determinnar la pendieente con preecisión cuanddo los datos mu uéstrales en las l X están lim mitados a un intervalo peqqueño. La varianzza de αˆ alcannza su mínim mo de σ2/N cuuando la meddia de X es idéénticamente cero. c Tambiénn observe quee el signo de la l covarianza de αˆ y βˆ es oppuesto en sign no a X .Si laa media de X es positiva, ppor ejemplo, es probable quue un sobrestiimado de αˆ eesté asociado con un subestimado de βˆ . El análisis no n está completo, ya que necesitamos n oobtener un estiimador de la vaarianza poblaccional σ2. Usaaremos el siguuiente estimaddo muestral dee la varianza veerdadera σ2: (33.14) do onde εˆ i = Yi – Ŷi es residual dde la regresión n. La varianza residual s2 es un estimador inssesgado al iguual que consistente de la varrianza del erroor, (s, y en ocaasiones SER, po or sus siglas enn inglés, es llam mado error esstándar de la rregresión.) El lector podría 2 preeguntarse por qué la suma de los residuuales al cuadra rado Σεˆi fue diividida entre N - 2 para obbtener un esttimador insesgado de la varianza veerdadera. La respuesta es que mientras haay N puntos dee datos, la estiimación de laa pendiente y el intercepto pone dos restriccciones en los datos. d Esto deeja N - 2 obserrvaciones sin restricciones coon las cuales eestimar la varrianza residuaal. Por esta razzón, se hace referencia al diivisor de N - 2 como el nú úmero de graddos de libertaad. Con una esstimación de σ2, podemos reegresar a las ecuaciones e (3.11) a (3.13) paara obtener unna estimaciónn de la covarianza y estimaaciones muésstrales de las vaarianzas asociiadas con los parámetros estimados e αˆ y βˆ . Cada unaa se enlista a coontinuación: (3.15)
(3.16)
(3.17) S βˆ y S αˆ, los errrores estándaar de los coefiicientes estimaados βˆ y αˆ, reespectivamente,, proporcionann una medidda de la disspersión de llos estimadores alrededor dee sus medias (como ( lo haceen los estimadoores muéstralees de las varian nzas). No
68
PA ARTE UNO: Los fu undamentos del an nálisis de regresió ón
deben confuundirse con el error estándaar de la regressión s, el cual mide la dispersión del térm mino del errorr asociado coon la recta de regresión.
EJEMPLO O 3.1
Promedio de calificaciones
Reconsidérese el ejemploo del promedio o de calificacciones del cap pítulo 1. La reelación estimadda entre el proomedio de callificaciones Y y el ingreso familiar X eraa
Los cálculoss que nos perrmiten determ minar s2 se prroporcionan en e el cuadro 3.1 (véase el cuuadro 1.2 parra los detallees preliminarees). En este caso s, el errror estándar de la l regresión, es igual a 0.333. Esto representa el 11% de la media del promedio dee calificacionees. (Entre mennor sea el cocciente de s con la media dee la variable deppendiente, se ajustan en fo orma más esttrecha los dattos a la recta de regresión.) En E vista de quue Σx2i = 162, es fácil calcuular el error esstándar de βˆ . De manera espeecífica,
Del missmo modo, puede p usarse la ecuación (3.16) para calcular c el errror estándar de αˆ como 0.3688. Suponienndo errores noormales, deteerminamos quue βˆ está distribu uida en formaa normal con media m 0.12 y desviación estándar e 0.0266 y que αˆ está distribuida d en forma normaal con media 1.375 y desv viación estánddar 0.369.
CUADRO 3.1 2 CÁLCULO DE s Cálculos del prromedio de calificaciones
CAPÍTULO 3: El modelo de regresión de dos variables
3.3
69
PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA Dado el conocimiento de las distribuciones de αˆ y βˆ , es posible construir intervalos de confianza y probar hipótesis concernientes a los parámetros de regresión. Los intervalos de confianza proporcionan un rango de valores que es probable que contengan los parámetros de regresión verdaderos. Con cada intervalo de confianza asociamos un, nivel de significancia estadística; Los intervalos de confianza se construyen de modo que la probabilidad de que el intervalo contenga el parámetro de regresión verdadero sea 1 menos el nivel de significancia. Los intervalos de confianza son útiles en particular para probar hipótesis estadísticas acerca de los parámetros de regresión estimados. Comenzamos con una hipótesis nula, la cual, por lo general, establece que un cierto efecto no está presente. Debido a que frecuentemente esperamos "aceptar" el modelo, la hipótesis nula se construye de tal manera que pueda hacer posible su rechazo. Para probar la validez de un modelo establecemos la hipótesis nula de que β es igual a 0. Esperamos rechazar la hipótesis nula obteniendo un valor de βˆ que sea suficientemente diferente de 0 para arrojar una duda significativa sobre la hipótesis de que β es igual a 0. Supóngase, por ejemplo, que βˆ es 0.9. Si elegimos un nivel de significancia del 10%, el intervalo de confianza del 90% para β podría ser: .6 < β < 1.2
Esto significa que la probabilidad de que β esté dentro del rango 0.6 a 1.2 es 0.90. Además significa que podemos rechazar la hipótesis nula de que β es igual a 0 con una confianza del 90%. En la prueba de hipótesis debe elegirse alguna regla de aceptación y rechazo. Con frecuencia se usa una regla que implica el nivel de significancia del 5%, el cual usa un criterio de que el rechazo de la hipótesis nula cuando es verdadera debería ocurrir menos del 5% del tiempo. La elección del nivel de significancia depende de la importancia relativa de dos fuentes de error. La prueba de hipótesis en la econometría clásica trata casi en forma exclusiva con el problema de rechazar en forma incorrecta una hipótesis verdadera (un error Tipo I). Debido a la naturaleza de las hipótesis probables que son especificadas, las hipótesis alternativas a menudo se definen mal, dificultando juzgar el número de veces que uno aceptaría la hipótesis nula cuando de hecho es falsa (un error Tipo II). Por esta razón, a menudo afirmaremos que una hipótesis nula ha sido rechazada con un nivel de significancia del 5% mientras dejamos implícita la aceptación de la hipótesis alternativa. Examinar la estadística de prueba y los errores estándar de los coeficientes en forma cuidadosa es una norma en el trabajo econométrico aplicado. Cuando el rechazo de la hipótesis nula es válido, por lo general, el modelo es aceptado, al menos hasta que se disponga de mayor información que muestre lo contrario. El nivel de significancia necesario para la aceptación del modelo varía en forma considerable entre los investigadores y entre los tipos de modelos que se están investigando. Por ejemplo, un modelo estimado con un gran número de obser-
70
PAR RTE UNO: Los fun ndamentos del aná álisis de regresión n
vaciones pueede, permitirlee a uno rechaazar hipótesiss nulas de coeeficientes cero para muchas variables exp plicativas. Porr tanto, podríaamos elegir, seleccionar un n nivel de signiificancia algo o inferior paraa hacer más d difícil el rechaazo de la hipó ótesis nula.
3.3.1
Prruebas sob bre coeficien ntes de regresión
La prueba estadística para rrechazar hipóttesis nulas aso ociadas con un n coeficiente de d regresión, po or lo general, se basa en la distribuciión t. La disstribución t es e relevante deb bido a que paara la prueba estadística necesitamos uttilizar un estiimado muestraal de la varian nza del error en n lugar de su v valor verdaderro. Para usar la distribución t para consstruir intervaalos de conffianza del 95% 9 para lo os parámetros estimados, priimero estandaarizamos el parámetro de regresión r estiimado, digamo os βˆ , restando o su valor verd dadero hipotétiico β0 y dividiéndolo entre el e estimador dee su error estáándar. Esto puede p verse con mayor faccilidad cuand do consideramoss la hipótesis n nula de que β = 0 o, de man nera equivalen nte, que no haay relación entree las variabless X y Y en el modelo m de do os variables. En E este caso la l estadística t está e dada por::
Si la estadístiica t es mayorr que tc, en magnitud, m a el valor crítico rechazamos lla hipótesis nula. En vista de que tc = 1.96 para muesstras grandes y un nivel de d significancia del 5%, unaa regla empíriica frecuente es que un vaalor t con un na magnitud de 2 o mayor no os permite recchazar la hipó ótesis nula. De maneera más generaal, podemos probar p la hipó ótesis nula de que β = β0. Para hacerlo, calcu ulamos la estaadística t: 3.18)
La variable esstandarizada tN-2 también sig gue una distrib bución t con N - 2 grados de d libertad. El valor v crítico ees definido, en n una prueba del 5%, de modo m que: P Prob (-tc< tN-2 < tc) = .95
(3.19 9)
donde Prob significa probaabilidad. Ahora, su ustituyendo d de la ecuación (3.18) obteneemos: (3.20 0)
CAPÍTULO 3: El modelo de re egresión de dos va ariables
71
Moodificando liggeramente la eecuación (3.2 20), (3.21) Dee la ecuación (3.21) obteneemos un intervvalo de confiaanza del 95% % para β: (3.22) Ussando un procedimiento sim milar, obtenem mos un intervaalo de confiannza del 95% parra α: (3.23)
Es posible determinar d inttervalos de coonfianza para cualquier niv vel de significancia en tantoo el valor críticco de la distrib bución t sea eelegido en form ma correcta. Lo os intervalos de d confianza para p los parám metros desconnocidos nos prroporcionan unaa afirmación estadística acerca a del ranngo de valorees, que es prrobable que conntenga el paráámetro verdaddero. Por tantto, la ecuacióón (3.22) nos dice que un intervalo de tc deesviaciones esstándar a ambbos lados del estimador e de la l pendiente tiene una probaabilidad de 0.95 de contener el parámettro verdadero o. En ocasionees los análisis econométricoos proporcionnarán informacción adicionall en forma dee un valor p. Un U valor p deescribe el niveel de significaancia exacto asoociado con unn resultado ecconométrico. Por tanto, unn valor p de 0.07 indica quee un coeficiennte es estadístticamente signnificativo en uun nivel 0.07 (pero no en un nivel del 5% %). En este casso el 7% de laa distribuciónn t se encuentrra afuera de un intervalo de tc desviacionnes estándar del d estimador de la pendiennte.
EJEMPLO 3.1
(co ontinuación) Prromedio de calificaciones
Parra probar el parámetro p de la pendiente en el ejemploo del promediio de calificacciones, podem mos usar los ccálculos hechoos en la expossición inicial del d ejemplo 3.1 1. Comenzam mos seleccionaando un nivell de significanncia, en este caso c el 5%. Luuego encontram mos el valor crítico c de la distribución d t (de la tabla 3 al final del libro) asociado con una probbabilidad de 0.05 0 y 6 grados de libertadd (hay ocho obsservaciones y dos parámettros estimadoss). En este caaso, t c = 2..447
Enntonces, un inntervalo de coonfianza del 95% para el parámetro dee pendiente serría:
72
PARTE UNO: Los fun ndamentos del aná álisis de regresión
Además,
Observamos que 0 se encuuentra afuera a del intervaloo de confianzaa del 95% parra β, lo que noss permite rechhazar con un nivel n de signifficancia del 5%, 5 la hipótesis nula de que β = 0. De mannera equivalen nte, podemos observar que el valor calcuulado de t (4.66) es mayor qque el valor crítico c de 2.455 y de nuevo rechazamos la l hipótesis nulla.
EJEMPLO O 3.2
Gastos de con nsumo
Supóngase que q deseamos construir un modelo de doos variables que q explique el valor en dólaares de los gaastos de conssumo agregaddos C, medidos en miles de d millones de dólares d (ajustaados estacionalmente).6 Coomo una variaable explicativva usamos el ing greso disponibble personal agregado a Y, m medido en miles de millonees de dólares (aajustados estaacionalmente). Cuando C ees regresado sobre s Y usanddo datos trimesttrales del prim mer trimestree de 1959 al segundo trim mestre de 1995, obtenemos el siguiente resultado (los errores e estánddar están entree paréntesis):
En este caso o, el interceptto de -27.53 es significativvo con un niivel del 5% ((la estadística t es -6.18 [-27.53/4.45]). Dee mayor impoortancia, la esstadística t asoociada con el coeficiente de d ingreso disponible es 5517 (0.93/0.00018). Podemoos rechazar conn claridad la hipótesis nulla de una incclinación ceroo a favor de la hipótesis alteernativa de quue la pendien nte no es ceroo. El rechazo de la hipótessis nula nos perm mite aceptar, al menos en forma f provisioonal, el modeelo de regresióón de dos variaables. Por suupuesto, una mayor investtigación podrría permitirnoos encontrar un n modelo de ggastos de con nsumo agregaados que sea más adecuaddo que el que see acaba de deescribir. Supóngaase (para proppósitos ilustraativos) que rem mplazamos Y como una variable explicaativa por unaa variable aleaatoria. (Elegim mos una variable X que fuue extraída cadda vez de unna distribució ón normal coon una mediaa de 50 y unna varianza de 25.) Entonces, esperaríam mos que aproxximadamente 1 vez en 20 el coeficiente en e la variablee X sería signnificativamentte diferente de cero (con uun nivel de signnificancia del 5%). Encontrramos que tom mó 22 ensayos antes de quee 6 Este ejem mplo usa datos suuministrados por la base de datos Citibase. Los daatos originales (G GC y GYD) están ajjustados estacionaalmente a tasas anuales. a
CAPÍTULO O 3: El modelo da regresión de dos variables v
73
see obtuviera unn coeficiente significativam mente negativo. Esto mueestra que sin im mportar cuán confiable c o caarente de conffiabilidad seaa un estimadorr estadístico, sieempre hay una posibilidad estadística dee que uno haráá inferencias inncorrectas al baasarse en los resultados r de regresión.
3.4
ANÁLISIS DE E VARIANZA A Y CORRE ELACIÓN 3..4.1
Bon ndad de aju uste
Loos residuales de regresiónn pueden prooporcionar unna medida útil del ajuste en ntre la línea de d regresión eestimada y loss datos. Una buena b ecuación de regresió ón es aquella que ayuda a explicar una proporción p grrande de la vaarianza de Y. Loos residuales grandes g impliican un ajustee deficiente, m mientras que loos residuales peequeños implican un buen ajuste. El prooblema con eel uso de residduales como unna medida de la bondad de ajuste es que su valor depeende de las unnidades de la vaariable dependdiente. Para eencontrar unaa medida de bbondad de ajuuste que esté lib bre de unidad des, parece raazonable usarr la varianza rresidual divid dida entre la vaariación de Y. Nu uestra meta ess dividir la varriación de Y enn dos partes, la l primera expplicada por la eccuación de reegresión y la segunda asoociada con laa porción ineexplicada (el térrmino del erroor) del modello. Supóngasee primero quee se sabe que la pendiente deel modelo de regresión r lineeal es 0 y ajusttamos una reggresión estimaando sólo un inttercepto. Entoonces la mejoor predicción para Yi asociiada con cualq quier Xi está daado por la meedia muestral de Y:
Enn este caso esspecial podem mos concluir que q la variacióón de Y mide el cuadrado dee la diferenciia entre los vvalores obserrvados Yi y los l valores prronosticados Yi=Y ¯. Cuando la pendiente noo es cero poddemos mejoraar nuestras prredicciones exxplicando que Yi es dependiiente de Xi,
Laa informaciónn adicional reeducirá la porrción inexpliccada de la varriación en Y. Paara ver esto, considérese c la siguiente idenntidad, la cual se cumple para p todas las obbservaciones:
(3.24)
74
PA ARTE UNO: Los f undamentos del análisis a de regresió ón
El término a la izquierd da del signo de igualdad denota la differencia entree el valor muesttral de Y y laa media de Y, Y el primer término de la l derecha daa el residual ε^ i, y el segundo o término de la derecha daa la diferenciia entre el vaalor pronosticado o de Y y la m media de Y. Esto se describee en la figura 3.4. Para meedir variación n, elevamos al a cuadrado am mbos lados de d la ecuación n (3.24) y luego sumamos todas las observaciones i = 1, 2, ..., N:
Puede mosttrarse que el ú último términ no en la ecuaación (3.25) es e idénticameente 0 usando do os propiedadees de los resiiduales de m mínimos cuadrrados, Σε^ i = 0 y Σε^i Xi = 0. Las L derivacion nes aparecen en e el apéndicee 3.2. Resultaa que
vaariación total de Y (o suma de cuaadrados del totall)
TSS
variación residual de Y (o suma de cuadrado os del error)
=
ESS E
variación expplicada de Y (o sum ma de cuadrados de la regresiónn)
+
RSS
(3.2 26)
Para normallizar, dividim mos ambos lad dos de la ecuacción (3.26) en ntre la suma to otal de cuadrado os para obteneer:
Definim mos la R cuadrrada (R2) de laa ecuación de regresión com mo:
(3.27 7)
R2 es la prop porción de laa variación tottal en Y explicada por la reegresión de Y en X. Ya que laa suma de cuaadrados del errror varía en valor v entre 0 y el total de la l Figura 3.4 4
Descomp posición de Yi.
CAPÍTULO O 3: El modelo de rregresión de dos variables v
75
suuma de cuadraados, es fácil ver que R2 varía v en valorr entre 0 y 1. Una R2 de 0 occurre cuando el modelo de regresión lineeal no hace naada para ayud dar a explicar laa variación enn Y. Esto pueede ocurrir cuuando los vaalores de Y see encuentran alleatoriamentee alrededor de d la línea ho orizontal Y = Y o cuandoo los puntos m muéstrales se encuentran e enn un círculo (figura 3.5b).. Una R2 de 1 sólo puede occurrir cuandoo todos los puuntos muéstraales se encuenntran en la línnea de regresión estimada (figura ( 3.5a). Para relacioonar R2 con loos parámetros de regresión eestimados conn anterioridad en n este capítuloo, escribimos los valores prronosticados dde yi como:
Luuego, cada ob bservación de la variable deependiente puuede subdividdirse como:
doonde ε^i es el residual r de la regresión. Ah hora,
dee lo cual resullta que:
o
La ecuación (3.28) ( proporrciona una fórrmula simple para calcularr R2.
Figura 3.5
Medición de R cuadrada.
76
PARTE UNO: Los fundamentos del análisis de regresión
Observe que R2 sólo es una estadística descriptiva. Hablando en forma aproximada, asociamos un valor alto de R2 con un buen ajuste de la línea de regresión y asociamos un valor bajo de R2 con un mal ajuste. Debemos darnos cuenta, sin embargo, de que un valor bajo de R2 puede ocurrir por varias razones relacionadas. Esto es, en ciertos casos X puede no ser una buena variable explicativa. Aun cuando hay razón para creer que X ayuda en la predicción de Y, la variación inexplicada en Y puede permanecer aun después de que X ha aparecido en la ecuación. En estudios de series de tiempo, sin embargo, a menudo obtenemos valores altos de R2 simplemente porque es probable que cualquier variable que crece con el tiempo haga un buen trabajo explicando la variación de cualquier otra variable que crece con el tiempo. En estudios de cortes transversales, por el contrario, puede ocurrir una R2 baja aun si el modelo es un satisfactor debido a la variación grande a través de unidades de observación individuales.7 En ocasiones es útil resumir el desglose de la variación en Y en función de un análisis de varianza. En tal caso, el total de las variaciones inexplicada y explicada en Y son convertidas en varianzas, dividiendo entre el número apropiado de grados de libertad.8 Por tanto, la varianza en Y es la variación total dividida entre N - 1, la varianza explicada es igual a la variación explicada (puesto que la regresión sólo involucra una restricción adicional además de la usada para estimar la media de y), y la varianza residual es la variación residual dividida entre N - 2.
3.4.2
Correlación
Debido a que R2 tiene valor para analizar un modelo con una relación causal entre la variable dependiente Y y la variable independiente X, R2 es interpretada como más que una medida de correlación entre dos variables. Las técnicas de correlación no involucran una suposición implícita de causalidad, mientras que las técnicas de regresión sí. En el capítulo 1 vimos que la elección de las variables dependiente e independiente en un modelo de regresión es crucial. La variable dependiente es la variable que se va a explicar, mientras que la variable independiente es la fuerza motriz. La técnica de mínimos cuadrados es apropiada sólo si la estructura causal del modelo puede determinarse antes de que los datos sean examinados. Si se especifica un modelo Y = α + βX, uno puede interpretar una estadística t significativa en el parámetro de pendiente de regresión como evidencia tendiente a validar el modelo. Por el contrario, una estadística insignificante lo invalidaría. 7 Esto sugiere que R2 sola puede no ser una medida adecuada del grado en que es satisfactorio un modelo. Una medida general mejor podría ser una estadística que describa el poder predictivo del modelo frente a datos nuevos. 8 El número de grados de libertad es el número de observaciones menos el número de restricciones colocadas en los datos por el procedimiento de cálculo. Por tanto, una estimación de la variación en Y implica N - 1 grados de libertad debido a que se coloca una restricción en los datos cuando se miden las desviaciones alrededor de la media muestral (la cual en sí misma debe ser calculada). Un grado de libertad adicional se usa en el cálculo del parámetro de pendiente, dejando N-2 grados de libertad asociados con la variación inexplicada en el problema.
CAPÍTULO O 3: El modelo del regresión de dos variables v
77
Como un ejemplo e de coorrelación sin n causalidad, considérese una serie de obbservaciones a lo largo del tiempo que podrían p haberrse obtenido en e un estudio deel siglo XIX de d medicina en e África. Uno o podría encoontrar una corrrelación alta en ntre el número o de doctores presentes en una región y la frecuencia de enfermedaades en esa reegión, pero seería erróneo inferir i que la presencia dee doctores es un na causa de laa propagaciónn de enfermedades. Por tanto, las correlacioones altas noo establecen uuna inferenciia de causalid dad. Uno debee especificar a priori (basad do en informacción previa) quue el número dee doctores en una región es e una funcióón de la frecuuencia de enfeermedades y prrobar estadísticamente si se mantiene un na relación assí, si uno usa la regresión enn forma correcta. Las técniicas de correllación, a mennudo, se usan para sugerir hipótesis o parra confirmar sospechas que q se teníann con anteriooridad. Tales prrocedimientoss son aceptabbles en tantoo uno no infiiera causalidaad en forma directa a partir de d los datos. H Hay numerosoos casos en ecconomía, com mercio y otros caampos en los que q dos variabbles se correlaacionan en forrma alta pero ambas están deeterminadas por p una tercerra variable suubyacente. Cuando éste es el caso, la vaariable subyaccente debería aparecer en ell modelo de regresión r com mo la variable inndependiente. ¿Qué le su ucede al parám metro de pen ndiente de la rregresión cuaando se hace unna especificacción causal inncorrecta? Com mparemos loss parámetros de d pendiente associados con los l siguientess modelos de regresión:
Lo os estimadorees de mínimoos cuadrados de d b y B son
Laas dos pendientes producirán conclusionnes idénticas acerca a de la reelación entre el movimiento en e X y el movvimiento en Y sólo s si bˆ = 1/B Bˆ, o de maneraa equivalente si R2 = 1 (véasee ejercicio 3.44). Así tenemoos que, la eleccción de especcificación del modelo m de regrresión afectarrá a nuestras estimaciones de los parám metros y prediicciones.
3.4.3
Pru ueba de la e ecuación de regresión n
Ell procedimiennto de subdivvidir la variacción en Y en ddos componeentes sugiere unna prueba estaadística de la existencia dee una relaciónn lineal entre Y y X. Consid dérese el siguuiente cocientee:
78
PARTE UNO: Los fundamentos del análisis de regresión
Siendo iguales otras cosas, esperaríamos que una relación estadística fuerte entre X y Y resultará en una razón grande entre varianza explicada e inexplicada. Esta prueba puede aplicarse en forma directa debido a que F1,N - 2 sigue la distribución F con 1 y N - 2 grados de libertad. Los subíndices en F describen el número de grados de libertad en el numerador y el denominador, respectivamente. El valor de la estadística F será 0 sólo cuando la varianza explicada en la regresión es 0. Uno asocia un valor bajo con una relación (lineal) débil entre X y Y y un valor alto con una relación (lineal) fuerte. Afortunadamente, la distribución numérica de la estadística F es conocida (véase tabla 4 al final del libro para la distribución F). Por ejemplo, rechazaríamos la hipótesis nula de ninguna relación entre Y y X con un nivel de significancia del 5% buscando el valor crítico apropiado de la distribución F (significancia del 5%) con 1 y N - 2 grados de libertad. Si el valor de F1,N - 2 calculado a partir de la regresión es mayor que el valor crítico, rechazamos la hipótesis nula en el nivel del 5%. Si el valor de F1,N - 2 es menor que el valor crítico, no podemos rechazar la hipótesis nula. La prueba F guarda una relación estrecha con la prueba t asociada con la 2 hipótesis nula de que β = 0. De hecho, F1,N - 2 = t N - 2 para cualquier nivel de significancia. Se ha introducido aquí la prueba F debido a que será útil para pruebas conjuntas de hipótesis, incluyendo pruebas de significancia de ecuaciones de regresión múltiple.
EJEMPLO 3.3
Ventas de automóviles al menudeo
Se realizó un estudio de la relación entre las ventas de automóviles al menudeo (variable dependiente) y el nivel de sueldos y salarios agregados en la economía (variable independiente).9 Uno esperaría que un nivel superior de sueldos y salarios conduciría a un incremento en las ventas de automóviles. Lo siguiente es un resumen de la regresión de las ventas al menudeo sobre los sueldos y salarios usando datos de series de tiempo trimestrales. La ecuación que se va a estimar es: S = α + βW + ε donde, S son las ventas trimestrales de automóviles al menudeo, del primer trimestre de 1959 al segundo trimestre de 1995, en miles de millones de dólares y W son los sueldos trimestrales para el mismo periodo en miles de millones de dólares. La recta de regresión ajustada se muestra a continuación. Se ha incluido la estadística t entre paréntesis debajo de los coeficientes estimados y colocado un "sombrero" arriba de la variable dependiente como un recordato-
9 Los datos fueron proporcionados por la base de datos Citibase. Las variables son gastos de consumo personal trimestrales en automóviles nuevos, ajustados estacionalmente (GCDAN) y sueldos y salarios agregados, ajustados estacionalmente (GWY).
CAPÍTULO O 3: El modelo de regresión r de dos variables v
79
rioo de que la ecuación e se uusa para calccular valores estimados dee la variable deependiente.
La constannte positiva (reepresentando el término deel intercepto) implica que, hiipotéticamentte, si no hubieera sueldos en un mes detterminado, loos individuos aúún compraríann automóviless. Puede interppretarse que ell coeficiente de d la variable dee sueldos signnifica que un incremento de d mil millonees de dólares en sueldos y saalarios conduccirá a un increemento de 30 0.8 millones de d dólares en las l ventas.de auutomóviles. (E El modelo poddría usarse parra predecir el nivel futuro de d las ventas dee automóviless condicional a los salarioss futuros.) Obbserve que, enn general, se in nterpreta que el coeficientte de la penddiente mide el e cambio enn la variable deependiente aso ociado con unn cambio pequeño en la vaariable indepeendiente. (De heecho, en el modelo lineal, βˆ = dS/dW se cumple para todos los cam mbios en W.) Ell coeficiente estimado e no eestá libre de un nidades. Su vaalor se relacio ona en forma diirecta con lass unidades dee medición de la variable dependiente S (miles de m millones de dó ólares) y la variable indeependiente W (miles de millones de dó ólares). En estte ejemplo heemos elegido escribir e entre paréntesis la estadística t, enn lugar de loss errores estáándar estimad dos. Usando la estadísticaa t, podemos reechazar la hipótesis nula dee que el interccepto y la penndiente son 0 (tomadas en fo orma individuaal) con un nivvel de significaancia del 1% al igual que del d 5%. La R2 dee 0.91 implicaa que la ecuacción de regresiión explica el 91% de la vaariación en la vaariable depend diente. El valoor F de 1 3788 le permite a uno rechazarr la hipótesis nu ula de que noo hay relación entre las ventas v de autoomóviles y lo os sueldos y saalarios (en el nivel n del 1%)). Si tuviéram mos la certezaa de creer quue la gráfica dde ventas de automóviles coontra sueldos y salarios deebe pasar por el origen, a pesar del hecho de que heemos rechazaado la hipótessis nula de un u intercepto 0, sería natuural correr la reegresión sin unn término connstante. Los reesultados paraa la muestra iddéntica son:
Au unque la prueeba t le permiite a uno rechhazar la hipóteesis nula, la supresión s del térrmino constaante significattivo ha dismin nuido el podeer explicativo o de la ecuació ón.10 Por tantto, estimaríam mos él modeloo de regresiónn con un inteercepto. Sólo si hay una razóón fuerte para forzar la ecuuación a través del origen debería d igualarrse el intercep pto con 0.
10 Cuando see elimina la consstante, la derivacción de R2 debe modificarse. Enn este caso, una coomparación de loss valores pronostiicados de las variiables dependienttes dejó claro quee el poder explicaativo de la ecuacióón había declinaado.
80
PA ARTE UNO: Los fu undamentos del an nálisis de regresió ón
EJEMPLO O 3.4
Usando el prroblema del p romedio de caalificaciones (ejemplo 1.1)) podemos callcular las siguuientes estadíísticas adicionnales: R 2 = .78
F l,6 =221.57
La R 2 de 0.778 nos permitee concluir que la variable del ingreso faamiliar ayudaa a explicar el 78 8% de la variaación en el proomedio de caliificaciones parra la muestra dde ocho individduos. La estaadística F noss permite proobar la hipóteesis nula de no n relación entrre el promedi o de calificacciones y el inngreso familiaar. Para hacerrlo así, usamos una tabla de la distribucióón F para deteerminar el vaalor crítico as ociado con unn nivel de siignificancia del d 5% y 1 y 6 grados dee libertad en el numerador y el denominaador, respectiivamente. (Ell 1 grado de libertad se u sa porque el moodelo incluye una sola variaable explicativva, mientras que q los 6 gradoos de libertad reesultan del heccho de que hayy ocho observaaciones y dos parámetros quue se van a estiimar.) En estee caso el valoor crítico de F en el nivel del d 5% es 5.999. Puesto que l a F calculada de 21.57 es mayor m que el valor crítico, rechazamos la hipótesis nu la con un niv el de significcancia del 5% %.
EJEMPLO O 3.5
Inscripción en n universidade es públicas y privadas
En la sección n 2.6, describbimos dos varriables que carracterizan los niveles de innscripción públlica (PÚBLIC CA) y privada (PRIVADA) en institucionees de educacióón superior (porr cada mil indiividuos) en Esstados Unidoss. Las primeraas universidades en Estados Unidos fuerron escuelas privadas enn el este. Laas instituciones públicas florrecieron en unna época posterior y en coonsecuencia su s mayor creccimiento fue en e el oeste dee Estados Unnidos. De mannera interesannte, los estadoos con inscripciones privadaas considerablles eligieron nno expandir sus s sistemas de d educación púública tan ráppido como lo hicieron h aqueellos con inscrripciones privvadas relativam mente débiles. Este patrón se evidencia con fuerza enn una regresióón de corte trannsversal que reelaciona las in nscripciones ppúblicas con laas inscripcionnes privadas parra los 50 estaddos. La regressión (con estaadística t entree paréntesis) es como sigue:
Hay unaa relación neggativa estadíssticamente siggnificativa enntre las inscrippciones públicas y privadaas. La regresión sugiere quue conforme se incrementaan las inscripcio ones privadass en un estado por 1 (por mil individuo os), las inscripp1 ciones públicas en el estaado disminuyeen casi en 2 . La L estadísticaa t de -3.47 y la estadística F de 12.04 noos dicen que el coeficientee negativo enn PRIVADA es significativaamente diferente de 0 con un u nivel de siignificancia del d 5%.
CAPÍTULO 3: El modelo de re egresión de dos va ariables
81
Para evaluaar más la validdez del modello de regresióón de dos variaables, trazamo os un histograama de los ressiduales en la figura 3.6. Deebido a que lo os residuales de mínimos cuaadrados sumaan cero, no es sorprendentte que la disttribución de loss residuales se s centre en 0. Sin embarrgo, otros atrributos asociaados con la disstribución de residuales sonn bastante infformativos e incluyen i los siguientes: s Meediana Míínimo Mááximo Deesviación estáándar Seesgo Kuurtosis Jarrque-Bera
0.63 --15.4 19.6 7.31 0.21 2.79 0.47
La inscripcción media paara institucion nes públicas es de 39.3 por cada mil habbitantes. Vistoos desde esta perspectiva, los l residuales,, qué van de -15.4 a 19.6, sonn bastante alttos; este ranggo, junto con la desviaciónn estándar relativamente alta de 7.31 es consistente c coon la R2 baja de d 0.20. Es cllaro que hay espacio e para meejorar en el deesarrollo de uun modelo quee explique lass inscripcionees públicas. Por último, podemos preeguntar si la suposición dde errores disttribuidos de forrma normal ess razonable. E El patrón de loos residuales proporciona información i útiil. La medianaa de 0.63 y ell sesgo de 0.221 nos dicen qque la cola suuperior de la disstribución es ligeramente m más gruesa, con c más obserrvaciones quee la cola inferrior. La kurtossis de 2.79 sóólo es ligeram mente inferior qque 3.00, lo que q nos dice quue la distribucción residual ttiene colas quue son ligeram mente más deelgadas que lass normales. Poor último, la estadística e de Jarque-Bera de 0.47 es mu ucho menor quue el valor críttico de la distrribución ji cuaadrada con 2 grados g de libeertad, que es 5.9 99. Por consiguiente, no podemos recchazar la hippótesis nula de que los ressiduales están n distribuidos en forma norrmal y podem mos concluir que q las pruebas t y F que deescribimos con anterioridadd son significcativas.
Figura 3.6 Histograma de e residuales.
82
PA ARTE UNO: Los fu undamentos del an nálisis de regresió n
APÉNDICE E 3.1 Varianza del estimador e de la pendiente de e los mínimos cuadrados
Resultaddo 1
DEMOSTR RACIÓN Recu uerde que βˆ = Σxiyi /Σxi . Seea: 2
(A3.1)
Cada ci es un na constante, ya y que las X soon fijas. Sustittuyendo en la ecuación paraa
βˆ, obtenemoss
(A3.22) lo cual expreesa el estimaddor de la pen ndiente como una suma po onderada de laas observacionees en la variaable dependieente. (Se asum me de maneraa implícita quue todas las sum matorias impplican observaaciones i = 1, 2, ..., N.) En ntonces, (A3.3)
Por consiguiiente,
Pero E(εεi) = 0, de modo que:
El hecho de que q ΣciXi = 1 resulta r en form ma directa de la definición de d ci:
Resultad do 2 DEMOSTRA ACIÓN
CAPÍTUL LO 3: El modelo dee regresión de dos variables
Pero
83
dde la ecuación (A A3.3)
e el resultado 1 de la derivación en
Porr consiguientee,
(A3.4)
Porr suposición laas e, no están correlacionaddas; es decir E E(εi εj) = 0, paara i ≠ j. Por con nsiguiente,
Peero (A3.5)
Porr consiguientee, AP PÉNDICE 3.2 Alg gunas propiedaades de los resiiduales de mín imos cuadradoos
Lass primeras doos de las siguiientes propieddades se cum mplen para loss residuales de mínimos cuadrados tanto en modelos de d dos variablles como en modelos m de reg gresión múltip ple. Ningún reesultado depeende de la norrmalidad del proceso de erro or ni de la suuposición de que los estim madores de m mínimos cuadrados son BL LUE best lineaar unbiased esstimation. Máás bien, resulttan de maneraa directa de las ecuaciones normales n (Al..18) y (Al.19)). Propiedad 1
(A3.6)
DEMOSTRAC CIÓN En el modelo m de dos variables, ŷ i = βˆxi. Por defiinición.
Entonces ya que X = y = 0 cuando los datos esstán en formaa de desviaciiones.
84
PA ARTE UNO: Los f undamentos del análisis a de regresió ón
Propied dad 2 DEMOSTR RACIÓN
(usando o la Propiedadd 1). Entonces, Pero βˆ es e el estimaddor de mínimoos cuadrados,, y βˆ = Σxiyi /Σx / i. Por conssiguiente, 2
Propied dad 3
DEMOSTR RACIÓN
Propieddad 4
s2 es un estimadorr insesgado dee σ2.
DEMOST TRACIÓN Recu uérdese que guiente,,
. Pero yi = βxi + εi. Por connsi-
(Como en el texto hemos h asumiddo de maneraa implícita quue los erroress εi tienen una u media muuestral de ceroo.) Elevando al a cuadrado y sumando toddas las N obbservaciones, encontramoss que:
Ahora, tomando el vvalor esperado o de ambos laados, obtenem mos:
Pero, véase la ecuación (A3.5) véase el resultado 9 del apéndice a 2.1
CAPÍTULO 3: El modelo de re egresión de dos va ariables
Además, = 1 de modoo que
85
Esto resulta de d (A3.3) y deel hecho de qu ue Σcixi y
Combinandoo estos tres reesultados,
o
EJERCICIOS 3.1 Para el ejerciccio 1.1. construuya intervalos de d confianza dell 95% para los parámetros ¿Pu uede rechazar laa hipótesis nulaa de que β = 0? ¿β = 1 ? 3.2 Discuta las diiferencias en laas pruebas estadísticas asociaadas con los parrámetros de unaa regresión cuaando: a) La varianzza del error es conocida o no se conoce. b) El tamañoo de la muestraa es finito o inffinito. 3.3 En vista de quue el error estánndar del coeficciente de regressión βˆ varía invversamente conn la varianza dee X, uno puedee mejorar la sig gnificancia del parámetro estiimado seleccion nando valores de d X en los punt ntos extremos deel rango de valoores posibles. Explique E por quéé esto es verdaddero y discuta si es deseable un procedimieento así. 3.4 Demuestre qu ue la pendiente estimada de la regresión de Y en X será iguaal al recíproco de d la pendientee estimada de la regresión de X en Y sólo si R2 = 1. 3.5 ¿Puede dar unn ejemplo de unn estimador qu ue sea asintóticaamente insesgaado pero no connsistente? 3.6 Cuando la meedia de X es idéénticamente 0, la covarianza eentre la pendiennte estimada y ell intercepto es 0. ¿Puede explicar de manerra intuitiva porr qué es verdad dero esto? 3.7 Suponga que está intentando construir un modelo que exxplique el com mportamiento de los l ahorros agrregados como uuna función deel nivel de las ttasas de interéss. ¿Obtendría su muestra m durantte un periodo dde tasas de interés fluctuantees o durante unn periodo en el que q las tasas dee interés son reelativamente co onstantes? Exppliqúese. 3.8 Demuestre qu ue los residuales estimados de la regresión linneal y los valorres muéstrales correspondienttes de X no esttán correlacion nados; esto es, ∑ ∑X1 ε^ i = 0. Suugerencia: El problema será máás fácil si trabaaja con los dato os en forma de desviaciones. 3.9 Demuestre quue R2 para la reegresión de dos variables no ccambia si se hacce una transform mación lineal enn ambas variablles; es decir, Y** = a1+ a2Y, X* = b1 + b2X. 3.100 Regrese una vez más a los datos del ejerciicio 1.1. Dividaa los datos en dos d grupos de cincco observacionnes cada uno, dde acuerdo con el orden de maagnitud de la variable v indepenndiente (suminiistro de dinero)). En otras palaabras, el primerr grupo deberá contener los cincco puntos muésstrales asociadoos con los cinco valores más pequeños p del suministro de dineero. Calcule ell siguiente paráámetro:
86
PARTE UNO: Los f undamentos del análisis a de regresión
donde el subbíndice se refieere al número del d grupo. (Y2 es e la media dee todas las Y enn el segundo gruppo.) a) Descrriba el procesoo anterior en forma geométricca. ¿En qué sen ntido B es un esstimador de la pendiente? b) Comppare su estimaddor con el estim mador de la penndiente de míniimos cuadrados. ¿Puede demoostrar que B ess un estimador insesgado del parámetro verddadero de la peendiente de la regresión? r c) Demuuestre que la vaarianza del parrámetro B debee ser mayor o iggual a la variannza del estimadoor de mínimos ccuadrados. 3.11 Demueestre que:
donde αˆ es el e estimador deel intercepto de d mínimos cuaadrados. 3.12 Demueestre que:
donde αˆ es el e estimador deel intercepto y βˆ, es el estim mador de la penndiente.
CAPÍTU ULO
4
EL MO ODELO DE D REGR RESIÓN N MÚLTIIPLE
En este capítuloo se mostraráá el modelo de d regresión ccon dos o máás variables inddependientes (además del término consstante); es deccir, el modelo de regresiónn múltiple. Taambién, descrribiremos las suposiciones que subyacen n en el modello de regresióón múltiple cllásico y mosttraremos cóm mo pueden ob btenerse las estiimaciones dell parámetro dee mínimos cuadrados. Lueggo se hará un comentario sobbre la interpreetación de los coeficientes de regresión. Como verem mos, pueden surrgir problemaas debido a laa interacción entre las variiables explicaativas en la ecuuación de regrresión. Pondrremos énfasis particular en las diversas estadísticas de regresión r quee ayudan en la interpretaciónn del modelo,, incluyendo coeficientes c estaandarizados, elasticidades y coeficientees de correlaciión parcial.
1
EL MODELO Exttendemos el modelo m de doss variables asu umiendo que lla variable deppendiente Y es una u función liineal de una sserie de variabbles independdientes X1, X2, … , Xk y un térm mino del erro or. Este moddelo es una extensión e natuural del moddelo de dos varriables y, por tanto, será neecesario derivvar todos los rresultados antteriores con tod do detalle. Escribimos el e modelo de reegresión múltipple como: (4.1)
donnde Y es la varriable dependiiente, las X son las variabless independien ntes y ε es el térm mino del erroor. X2i represeenta, por ejem mplo, la ia obbservación en la variable exp plicativa X2. β1 es el términno constante o intercepto dde la ecuación n. 87
88
PA ARTE UNO: Los fu undamentos del análisis de regresió ón
Las suposiciones del modelo de reegresión múltiiple son bastaante similares a las del modeelo de dos varriables: 1. La relacción entre Y y X es lineal y está dada poor la ecuaciónn (4.1). 2. Las X son s variables no estocásticcas. Además, no existe unaa relación línnea exacta enntre dos o más variables indeppendientes. 3. El errorr tiene un valoor esperado de d cero para toodas las obseervaciones. 4. El térm mino del errorr tiene una vaarianza consttante para toddas las observvaciones. 5. Los errrores correspoondientes a observaciones o diferentes soon independieentes y po or consiguientte no están co orrelacionadoos. 6. El térm mino del error está distribuido en forma normal. Por sim mplificación trabajaremos con un caso esspecial del mo odelo de regreesión múltiplle, el modelo de tres variabbles: (4 4.2)
El procedim miento de mínnimos cuadraados es equivvalente a busccar estimacio-nes del paráámetro que m minimicen la suma de cuaadrados del errror, definidaa como:
Del mismo modo en quee lo hicimos en el capítulo 1, podemos encontrar loos valores de β1, β2 y β3 que minimicen ESS. Suponiiendo que hayy más de tress observacionnes y que las eecuaciones sub byacentes sonn independienttes, la solucióón (véase el appéndice 4.1 paara los detallees) es: (4.3) donde:
(4.4) (44.5) En este modelo de trres variables [ecuación [ (4.22)] el coeficieente β2 mide el e |cambio en Y asociado coon un cambio unitario en X2 con la supossición de que la
CA APÍTULO 4: El mo odelo de regresión múltiple
89
varriable X3 se mantiene m consstante. Del mismo m modo, el coeficientee β3 mide el cam mbio en Y asoociado con un cambio unitarrio en X3 mantteniendo consstante X2. En am mbos casos laa suposición de que los valores v de laas variables explicativas resstantes son coonstantes es ccrucial para nuuestra interprretación de los coeficientess. En el apénddice 4.2 mosttramos y suggerimos seguir con más deetalle cómo, exactamente, see mantienen constantes c lass otras variabbles
EJEMPLO 4.1
Ven ntas de automó óviles
1
Parra predecir las ventas trimeestrales de auutomóviles usaando un modeelo de ecuacióón sencilla, ess probable que sean de valor tres variabbles explicativvas. Uno esperraría que las ventas v se movvieran en la misma m direcciión que el inggreso disponib ble, pero que se relacionaraan en forma inversa i con el costo de peddir prestado din nero para finaanciar la comppra. Por consiguiente neceesitaríamos los siguientes dattos para nuestro modelo: S = consumoo personal trim mestral de auttomóviles nuevos, miles de d millones de dólares actuales Y = ingreso personal YP p trimeestral, miles de d millones de d dólares actuuales R = tasa de boonos de tesorrería a tres meeses, en porcentaje anual CP PI = índice de Precios al Coonsumidor triimestral (19833 = 100) Las variables de ventas, ingresos y taasa de interéss deflactadas desinfladas porr el CPI para ser medidas een términos reeales (por ejeemplo, SR = S/CPI, S YPR/ CP PI, RR = R/CP PI). La ecuaciión que se va a estimar es:
donnde t denota que los datoss son medido os en el momeento t. Usand do datos del perriodo de 1975 5 hasta el seguundo trimestrre de 1995, laa regresión esttimada es: El coeficiennte de ingreso personal sign nifica que un incremento de mil milloness en el ingresoo disponible rreal conduciráá a un incremento de 7 millones en las venntas de autom móviles realess, con los efecctos de todas las otras variiables manten nidos constanttes. Además, si la tasa de interés i se elevva en 1 punto porcentual, lass ventas de au utomóviles diisminuirán enn 1.366 mil millones m de dóólares en el sigguiente trimesstre.
1
Los datos usaados en este ejem mplo fueron obtennidos de la base de d datos Citibasee. Las variables orig ginales fueron GCDAN, GMP PY, FYGN3 y PUNEW. Todoos los datos están e ajustados estaacional-mente. Las L últimas tres variables estánn medidas menssualmente. Usam mos promedios trim mestrales en cadaa caso.
90
4.2
PA ARTE UNO: Los fundamentos del análisis de regresió ón
ESTADÍSTTICAS DE RE EGRESIÓN Para probar la significanccia estadística de coeficienttes de regresió ón individualees, es natural preguntar si ell teorema de Gauss-Markoov se extiendde al modelo de d regresión mú últiple y si unno puede obtener un estimaador insesgado o de la variannza σ2, así como información acerca de la distribución d dee los parámetrros de regresióón estimados. Las L derivacioones de las propiedades estadísticas del d modelo de regresión mú últiple son rellegadas al apééndice 4.3. Aqquí proporcioonamos un ressumen de los resultados r im mportantes: 1. Dadaas las suposiciiones de la 1 a la 5 del moddelo de regresión múltiple, el teorema de Gauss-Markov G v se aplica; ess decir, el estim mador de mín nimos cuadraddos ordinarios dee cada coeficiiente βj = 1, 2, 2 ..., k, es BL LUE. (Cuandoo el término del d error está diistribuido en forma normaal, también es equivalente al estimador de máxima vero osimilitud; véaase el apéndice 2.2.) 2. Un estimador e inseesgado y conssistente de σ2 ees proporcionnado por:
3. Cuan ndo el error está distribuiddo en forma normal, puedeen aplicarse laas pruebas t deebido a que:
En otras paalabras, los parámetros p dee regresión esstimados, los cuales son norman lizados restaando la mediia y dividiend do entre el errror estándar estimado, sigguen la distribución t con N - k ggrados de libeertad. Los errrores estándarr de cada unoo de los coeficientess Sβ^1, Sβ^2, . . . , Sβ^k son derivaddos en el apénddice 4.3, debid do a que su cálculo c involucra laa inversión dee una matriz.. Dado que, dde manera ocasional usareemos el modelo de tres variablees para ejempplos, reproduuciremos aquuí tres fórmulas; las primeras doos calculan la varianza esttimada de cadda coeficientee, y la terceraa da la covarianza entre e los dos::
es la correlaciónn simple entree x2 y x3.
CA APÍTULO 4: El modelo de regresión múltiple
4.3
91
P RUEBAS F , R 2 Y R 2 CORREGIDA C A Paara usar R2 coomo una mediida de bondad d del ajuste en el modelo de d regresión mú últiple, extenddemos la expposición anteriior (sección 33.4) acerca dee la descompo osición de la variación v en lla variable deppendiente Y. Para cada observación, o ppodemos desccomponer la ddiferencia enttre Yi y su meedia Y como sigue: s
Ellevando al cuaadrado amboss lados y sum mando todas laas observacio ones (1 a N), obbtenemos:2
o, usando la terrminología inntroducida en el capítulo 3, TSS Suma del totall de cuadrados
=
ESS
+
Suma de cuadrados de los resiiduales
RSS Sum ma de cuadradoss de rregresión
Enntonces definiimos R2 como: (4.9) La R2 midee la proporcióón de la variiación en Y que q es "expliccada" por la eccuación de reggresión múltipple. R2 a mennudo se usa de d manera infformal como un na estadística de d bondad de ajuste y para comparar c la vaalidez de los resultados r de la regresión bajoo especificaciones alternativ vas de las varriables indepenndientes
te cero, c ya que
e idénticamenPero el último término es
92
PA ARTE UNO: Los fu undamentos del an nálisis de regresió n
en el modeloo. Sin embarggo, existen varrios problemaas con el uso de d R2. Primerro, todos nuestros resultados estaadísticos se derivan de la supossición inicial de que el modelo es
correcto; no tenemos procedimiento qu ue compare especificacion e nes alternativaas. Segundo, R2 es sensible aal número de variables inddependientes incluidas en el modelo de reegresión. Puedde ser que la adición a de máás variables inndependientess a la ecuación de d regresión nnunca dismin nuya a R2 sin eembargo, es probable p que la eleve. (La addición de unaa nueva variaable explicativva no altera la l TSS pero es e probable quee incremente la RSS.) Porr tanto, uno podría p simpleemente agregar más variables a una ecuacción si sólo deesea maximizaar R2. Por últim mo, la interprretación y uso de d R2 se vuelvve difícil cuand do se formula un "œdelo quue es restringiddo a tener un inntercepto 0. Enn tal caso la proporción p dee la suma de cuadrados c de la regresión y la l suma de cuuadrados total no necesita eencontrarse deentro del ranggo de 0 a 1. La dificuultad con R2 ccomo una meddida de bondaad de ajuste ess que R2 sólo se s relaciona conn la variación explicada e innexplicada enn Y y, por conssiguiente, no da d cuenta del núúmero de graddos de libertadd. Una solucióón natural es usar varianzaas, no variacionees, eliminanddo, por tanto, la l dependenciia de la bondaad de ajuste del d número de variables v indeppendientes enn el modelo. (Recuérdese ( q la varianzza que ¯ es igual a la variación divvidida entre loos grados de llibertad.) Defiinimos R 2, o R2 corregida, coomo
donde las vaarianzas muésstrales de ε^ y Y se calculann como sigue:3
donde k es el e número dee variables in ndependientees. Aun cuanndo disminuyya (o permanezzca igual) la ssuma de cuaddrados de resiiduos, o del error, e conform me se agregan nuuevas variablees explicativas, la varianza residual no neecesita hacerloo. Nótese que tanto el num merador com mo el denomiinador en la definición de d Var (e) cambbian cuando se agrega unaa variable adicional al moodelo. Ademáás, observe [de la ecuación (44.9)] que: (4.100)
3 Dividimo os entre N - 1 al calcular c la variannza de Y porque sse usa 1 grado dee libertad cuando se calcula la mediaa de Y. Sin embargo, dividimos en ntre N - k cuando ccalculamos la varrianza de ε^ debiddo ^ a que deben esttimarse k parámeetros del modelo o de regresión anntes de que pueda calcularse ε (ppor tanto la pérdida de k grados de liibertad de la N original).
CA APÍTULO 4: El mo odelo de regresión múltiple
93
Essto nos permiite derivar unaa fórmula4 paara la relaciónn entre R2 y R 2 : (4.11) Sii examina la ecuación e (4.11), verá que: 1. Si k = 1, entonces R2 = R 2 . 2. Si k es mayor m que 1, entonces e R2 ≥ R2 . ¯2 3. R puede ser negativaa. R¯ 2 tiene varias propiedades que la hacenn una medida de bondad de d ajuste más deeseable que R2. Cuando se agregan nuev vas variables a un modelo de d regresión, R2 siempre sé inncrementa, m mientras que R¯ 2 puede elevarrse o disminuir.5 El uso de 2 R elimina al menos algun nos de los in ncentivos para que los investigadores inncluyan numeerosas variablles en un moddelo sin refleexionar muchho respecto a po or qué deberíaan aparecer. U Un ejemplo iluustrativo es unn modelo estim mado con 25 ob bservaciones, con una R2 reeportada de 0.8. Sin embarrgo, este valorr resultó sólo deespués de quee se incluyeronn 17 variabless independienntes en el moddelo. El valor dee R 2 asociado con c el mismo modelo sólo es e 0.4. Es eviddente que la R2 corregida da un n panorama más m preciso dde las limitaciiones de este modelo. La estadísttica F calculadda por la may yor parte de loos programas de regresión pu uede usarse en n el modelo dee regresión mú últiple para prrobar la signifficancia de la esstadística R2. La L estadísticaa F con k - 1 y N - k gradoos de libertadd nos permite prrobar la hipóteesis de que ninnguna de las variables v expliicativas ayudaa a explicar la vaariación de Y alrededor dde su media. En otras ppalabras, la estadística e F prrueba la hipóteesis conjunta de d que β2 = β3 = … = βk = 00 Puede mosttrarse que: (4.12) Sii la hipótesis nula es verddadera, entonnces esperaríaamos que RSS, R2 y, por co onsiguiente, F, F estuvieran ccerca de 0. Po or tanto, un valor v alto de la l estadística F es un fundam mento para recchazar la hipóótesis nula. Unna estadística F no signi4 De la ecuaciónn (4.10) resulta que l - R 2 = [ s 2 /Var (Y)][(N - k)/(N - 1)]. Peero 1- R2 = [s 2 /V ar (Y). Por cons iguiente, 1-R 2 = (1 –R¯ 2 )[(N -k)//(N -1)]. Resolviiendo, obtenemoos R¯ 2 = 1 - (1 -
R2)[(N-1)/(N-k)]]. 5 Si se desea maximizar m R 2 corrregida hay una regla simple: Si las, variables in ndependientes se dej ejan en la ecuacióón de regresión cuando c su estadísstica t es mayor que q 1 y se elimin nan en cualquier 2 otrro caso, entoncess la R corregida será maximizadaa. Para los detallles, véase P.J. Dhhrymes, "On the Gaame of Maximizinng R¯2 ", Australiaan Economic Pap pen, vol. 9, diciem mbre de 1970.
94
PA ARTE UNO: Los fundamentos del análisis de regresión n
ficativamentee diferente dee 0 nos permite concluir quue las variablles explicativaas hacen poco para p explicar laa variación dee Y alrededor de d su media. En E el modelo de d dos variabless, por ejempllo, la estadísttica F pruebaa si la recta de d regresión es e horizontal. En tal caso, R2 = 0 y la regreesión no explicca nada de la variación en la l variable depeendiente. Nóttese que no prrobamos si la regresión passa por el origeen (β1 = 0); nuesstro objetivo ees tan sólo verr si podemos explicar cualqquier variacióón alrededor de la media de Y. La prueb ba F de la signnificancia de una u ecuación de regresión puede permittir el rechazo de d la hipótesiss nula, aun cuando se enccuentre que ninguno n de loos coeficientes de d regresión ees significativvo de acuerdoo con pruebas t individuales. Esta situacióón puede surggir, por ejempplo, si las varriables indepeendientes estáán muy correlaccionadas entree sí. El resultaado puede serr errores estánndar altos parra los coeficienttes y valores t bajos, pero el e modelo en conjunto pueede ajustar bieen los datos. ¿Qué passaría si usáram mos R2 para comparar c la validez v de moddelos de regreesión alternatiivos cuando lla variable deependiente varría de una reg gresión a otraa? Esto ocurre en e la construccción de modelos econométrricos cuando el investigadoor tiene poca información resspecto a la forrma funcionall de la variablle dependientee. Considérensee los siguientes modelos
El modelo I difiere del m modelo II sólo o en la diferenncia de las vaariables depenndientes. (Y poodrían ser loss gastos guberrnamentales tootales, incluyendo subsidioos federales y X2 podrían serr subsidios, haciendo h que la segunda variable v depenndiente sean los l gastos paggados por inggresos recaudaados en formaa local.) Puedde mostrarse (vééase ejercicioo 4.1) que 1. Las medidas m R2 y R 2 .asociadas con c los modellos I y II diferrirán. 2. β1′ =βˆ1, β2′ = βˆ2 – 1 y β3′ = βˆ3. 3. Los errores, los ressiduos de mín nimos cuadraddos y la varian nza residualess serán idénticcos en los dos modelos. Ambas versio ones del moddelo proporcioonan informacción idéntica, pero las meddidas de bondaad de ajuste vvariarán de maanera consideerable de un caso a otro. Poor tanto, R2 no puede p usarse en e forma direecta para comp mparar modelos con variablees dependientess diferentes.
EJEMPLO O 4.1
(continuación)) Ventas de au utomóviles
En nuestro ejemplo e anterrior, de ventaas de automóóviles, los resultados de la l regresión com mpleta son coomo sigue:
CAPÍTULO 4: El modelo de regresión múltiple
Coeficiente
β1 β2 β3
Valor
.60 .0070 -1.366
Error estándar
95
Estadística t
.14 .0028 .688
4.22 2.46 -1.98
Número de variables = 3 (Incluyendo la constante) Número de observaciones = 82 Grados de libertad = 79 R2 = 0.42 R¯2 = 0.40 F(2, 79) = F2, 79 = 28.1 Error estándar de la regresión o regresiones = 0.118 Suma de cuadrados del error = ESS = 1.105
Todos los coeficientes estimados son significativos con un nivel del 5% (o marginalmente significativo en el caso de la variable de la tasa de interés) en vista de que todas las estadísticas t son mayores o iguales a 1.98 en valor absoluto y hay 79 grados de libertad. Por esta razón, ninguna de las variables debe excluirse de la regresión. Las estadísticas R2 y R¯ 2 tienen una magnitud muy cercana, como se esperaba, en virtud de que hay una gran cantidad de grados de libertad en el modelo. La estadística F con 2 y 79 grados de libertad es muy significativa, permitiéndonos rechazar la hipótesis nula de que todos los coeficientes de variables explicativas conjuntamente son 0. Por último, el lector debería verificar la relación entre la suma de cuadrados de los residuales y el error estándar de la regresión: s2 = ESS/79.
EJEMPLO 4.2
Tasas de interés
En este ejemplo, usamos mínimos cuadrados para estimar un modelo que explique el movimiento de las tasas de interés mensuales de enero de 1960 a agosto de 1995. Este ejemplo lo veremos en otros diversos puntos en el libro, como cuando tratemos la correlación serial (capítulo 6), pronóstico de una sola ecuación (capítulo 8), ecuaciones simultáneas (capítulo 12) y pronóstico Arima (capítulo 18). Se cree que las tasas de interés están determinadas por la demanda agregada y suministro de activos líquidos. Las variables que subyacen al modelo de regresión son como sigue:6 R = tasa de bonos de tesorería a tres meses, en porcentaje anual IP = índice del Consejo de la Reserva Federal de producción industrial (1987 = 100) M2 = suministro de dinero nominal, en miles de millones de dólares PW = índice de precios al productor para todas las mercancías (1982 = 100) 6
y PW.
Estas variables se basan en las que se tomaron de la base de datos Citibase: FYGN3, IP, FM2
96
PARTE UNO: Los fun ndamentos del análisis de regresión n
El índicee de producciión industriall proporcionaa una medidaa útil de la deemanda de activos líquidos; es por esto qu ue esperaríam mos que los inccrementos en la l producción implicarían i inncrementos en e la demandda, lo cual a su vez increementaría las tasas de inteerés. El suminnistro de dineero es una addición obvia al a modelo, de modo m que los ccambios en laa política de laa reserva fedeeral que causaan cambios en el e suministro de dinero innfluyen en forrma directa en e las tasas de d interés. Una historia simiilar se aplica a los cambioos en los preccios, ya que un u incremento en e la tasa de inflación con nduciría a un incremento en e las tasas de d interés. Las variaables de cambbio de dinero y precio particulares usadaas en el modello de regresión fueron:
La ecuación estimada (con la estadísticca t entre parééntesis) es:
La producció ón industrial ttiene un efectoo positivo fueerte y significcativo sobre laas tasas de interrés, como se esperaba. Laa variable de inflación, en ntrando con un u rezago de un mes, tambiénn tiene el signoo esperado y es significativaa. Sin embargoo, el signo posiitivo en la varriable de creccimiento del ddinero GM, es e directamentte contrario a nuestras expecctativas. Una preocupación p n más es la R2 relativamentte baja y el erroor estándar reelativamente alto a de la reggresión. El errror estándar de d 2.481 es apro oximadamentte el 40% de la l media, lo ccual es alto para un modello macroeconóm mico de este tipo. t En el cap pítulo 6 verem mos que cuand do mejoramoss la especificaación y usamoos un método dee estimación más m eficiente para p esta ecuaación de la tassa de interés, el e signo de la vaariable del creecimiento del dinero d cambiaará y el ajuste de la ecuacióón mejorará de manera m consiiderable.
EJEMPLO O 4.3
Función de co onsumo
Se pueden ussar tres ecuacciones de regrresión separaddas para ilusttrar algunas de d las cuestionees econométriicas que surgen con la esttimación de una u función de d consumo agrregado simplee, relacionanddo consumo ppersonal (C),, ahorros (S) e ingreso perso onal disponible (Y). Los trres modelos son los siguienntes (los datoos son trimestraales, de 1954--1, el primer trimestre de 1954, a 19955-2, en dólarees actuales):7 7 Los datoss fueron tomadoss de la base de daatos Citibase. Laas variables usadaas son GC y GYD (medidas en milles de millones dde dólares).
CA APITULO 4: El mo odelo de .regresión n múltiple
97
Lo os resultados de regresión se enumerann en el siguiennte cuadro:
El modelo I describe la forma más siimple de la fuunción de connsumo, en la quue el consumo o está determ minado sólo po or el ingreso ddisponible Y en el mismo peeriodo. El coeeficiente de laa variable de ingrese dispoonible mide laa propensión m marginal a conssumir. En el modelo m II se agrega a un térm mino para incluir el efecto deel consumo reezagado sobree el consumo o presente. El término es inncluido para peermitir que ell consumo acctual dependaa del comporttamiento de consumo c recieente al igual que q el del ingrreso. El coeficiente del térm mino del ingresso disponible deebe interpretaarse en formaa diferente en n el modelo III que en el modelo m I. El vaalor de 0.18 en n el modelo III se refiere al cambio en el consumo asociado con un caambio de 1 unnidad en el inngreso disponnible, asumienndo que el coonsumo en el peeriodo previo ha permaneccido inmutabble. Observe que el efectoo total de un caambio en el inngreso disponnible sobre él consumo tenndrá lugar conn el tiempo y sóólo puede med dirse calculando la propenssión marginal a consumir a largo plazo, assumiendo quee el consumo es inmutable a lo largo dell tiempo.8 Resolviendo Ct = Ct - 1, encontrramos que la propensión p m marginal a conssumir a largo plazo implicaada por el modelo II es 0.18/(1 - 0.81) = 0.95. Nótese el ligero l incremeento en R2 deel modelo I all modelo II. Dado D que R2 paara la ecuacióón original yaa es bastante alta, es tentaador suponer que agregar vaariables adicioonales ya no puede añadirr más al poderr explicativo del modelo, peero la estadísttica t significaativa en el térrmino de conssumo rezagad do en el modeelo II muestraa que éste no es el caso. 8 Un análisis detallado d del moddelo II se presentta en el capítulo 9 cuando se expoonen los rezagos disstribuidos.
98
PARTE UNO: Los fundamentos del análisis de regresión
El modelo III representa una función de ahorro, no una función de consumo, pero un examen rápido de los resultados de la regresión muestra que las dos se relacionan en forma estrecha. Esto no es sorprendente, en virtud de que el ahorro es la diferencia entre el ingreso disponible y el consumo. Observe que los coeficientes estimados se relacionan en forma estrecha entre sí. Los interceptes de los modelos I y III sólo difieren por el signo y la suma de los dos coeficientes de pendiente es igual a 1. El lector puede ver por qué es verdad esto sustituyendo Yt – Ct por St en el modelo III y comparando los resultados con el modelo I. Además, la regresión de la suma de cuadrados, el error estándar de las regresiones y los residuales son idénticos en ambos modelos. Lo que parece sorprendente al principio es que la R2 caiga de manera considerable cuando uno pasa del modelo I al modelo III. La razón para este descenso puede verse al recordar que R2 = 1 - ESS/TSS. Dado que los residuales estimados son idénticos en ambas ecuaciones, la suma de cuadrados del error también es idéntica. Sin embargo, la suma de cuadrados total es diferente debido a que las variables dependientes son diferentes. Por tanto, los modelos pueden ser parecidos en casi todos los aspectos pero diferir de manera considerable en R2. En el capítulo 8 veremos que el error estándar de la regresión a menudo es más útil como una medida del poder predictivo de una ecuación de regresión que R2.
4.4
MULTICOLINEALIDAD 4.4.1
Colinealidad perfecta
Una de las suposiciones del modelo de regresión múltiple es que no hay una relación lineal exacta entre cualquiera de las variables independientes en el modelo. Si existe dicha relación lineal, decimos que las variables independientes son perfectamente colímales o que existe la colinealidad perfecta. Supóngase, por ejemplo, que el modelo del promedio de calificaciones del capítulo 1 consistió en las siguientes tres variables independientes: X2 = ingreso familiar, miles de dólares X3 = promedio de horas de estudio por día X4 = promedio de horas de estudio por semana Las variables X3 y X4 son perfectamente colineales debido a que X4 = 7X3 para todos y cada uno de los estudiantes que se investigaron. Cada parámetro tiene un sentido perfecto si sólo aparece una de las variables colineales en el modelo. Cuando aparecen ambas, nos enfrentamos con un problema imposible. El coeficiente de la variable X3 es un coeficiente de regresión parcial que mide el cambio en Y asociado con un cambio unitario en X3 con todas las otras variables constantes. En vista de que es imposible mantener constantes todas las otras variables, no
CAPÍTULO 4: El modelo de regresión múltiple
99
podemos interpretar (o incluso definir) el coeficiente de regresión.9 La colinealidad perfecta es fácil de descubrir debido a que será imposible calcular las estimaciones de mínimos cuadrados de los parámetros. (Con la colinealidad, el sistema de ecuaciones que se resolverá contiene dos o más ecuaciones que no son independientes.) 4.4.2
Los efectos de la multicolinealidad
A menudo, en la práctica, nos enfrentamos con el problema más difícil de tener variables independientes con un alto grado de multicolinealidad. La multicolinealidad surge cuando dos o más variables (o combinaciones de variables) están altamente (pero no perfectamente) correlacionadas entre sí. Supóngase que dos variables están relacionadas de esta manera. Entonces, será posible obtener las estimaciones de mínimos cuadrados de los coeficientes de regresión, pero la interpretación de estos coeficientes será bastante difícil. Se interpreta que el coeficiente de regresión de la primera de las dos variables, altamente correlacionadas mide el cambio en Y y que es debido a un cambio en la variable en cuestión, siendo iguales otras cosas. En el momento en que ocurre un cambio dado en una variable, es probable que se observe en su pareja correspondiente altamente correlacionada, un cambio de una forma predeciblemente similar. Por tanto, la presencia de multicolinealidad implica que habrá muy pocos datos en la muestra para darle a uno confianza respecto a dicha interpretación. No nos sorprende que las distribuciones de los parámetros de regresión estimados sean bastante sensibles a la correlación entre variables independientes, y también a la magnitud del error estándar de la regresión. (Recuérdese que en el 2 modelo de dos variables, la varianza estimada de βˆ es s2/ ∑x i.) Esta sensibilidad se muestra en forma de errores estándar muy altos para el parámetro de regresión. Esto puede verse si examinamos las fórmulas para las varianzas de los parámetros estimados dadas en las ecuaciones (4.6) y (4.7). Ambos denominadores incluyen el término 1 - r2. Cuando X2 y X3 no están correlacionadas en la muestra, r = 0 y las fórmulas son esencialmente idénticas. Sin embargo, cuando r se vuelve alta (cercana a 1) en valor absoluto, la multicolinealidad está presente, con el resultado de que las varianzas estimadas tanto de βˆ2 como de βˆ3 se vuelve muy grande. Esto nos dice que aunque βˆ2 y βˆ3 permanecerán como estimadores insesgados, la confianza que podemos colocar en el valor de una u otra será pequeña. Esto representa un problema si creemos que una o ambas de las dos variables debería estar en un modelo, pero no podemos rechazar la hipótesis nula debido a los errores estándar estimados grandes. Puede ser razonable en tales casos quitar una de las dos variables de la ecuación y volver a estimarla. En el capítulo 7 veremos que esto puede causar tendencia en el
9 Con la colinealidad perfecta, no podemos calcular los estimadores de mínimos cuadrados. Para ver esto, reconsidérense las ecuaciones (4.3) a (4.5) cuandoX2 y X3) son perfectamente colineales. En este caso las ecuaciones (4.4) y (4.5) no serán independientes y no existirá solución.
100
PARTE UNO: Los fundamentos del análisis de regresión
modelo reestimado, pero nos ayudará a determinar el efecto de la multicolinealidad en el modelo original.10 La manera más fácil de decir si la multicolinealidad está causando problemas es examinar los errores estándar de los coeficientes. Si varios coeficientes tienen errores estándar altos, quitar una o más variables de la ecuación disminuye los errores estándar de las variables restantes y, por lo general, la multicolinealidad será la fuente del problema. Un análisis más complejo tomaría en cuenta el hecho de que la covarianza entre parámetros estimados (al igual que los errores estándar individuales) puede ser sensible a la multicolinealidad. Como lo muestra la ecuación (4.8), un alto grado de colinealidad se asociará con una covarianza relativamente alta (en valor absoluto) entre parámetros estimados. Esto sugiere que si un parámetro estimado βˆi sobreestima el parámetro verdadero βi, es probable que un segundo parámetro estimado βˆi subestime a βj, y viceversa (asumiendo que r > 0).
4.4.3
Indicaciones de multicolinealidad
Un modelo estimado con errores estándar altos y estadística t baja podría ser indicativo de multicolinealidad, pero de manera alternativa podría sugerir que el modelo subyacente es deficiente. ¿Cómo puede probar uno la presencia de multicolinealidad? Hemos visto que la multicolinealidad ocurre en una muestra particular cuando dos o más de las variables explicativas están altamente correlacionadas por lo que dificultan la separación de los efectos de una variable explicativa en la variable dependiente de los efectos de las otras variables explicativas. Estas variables explicativas rara vez no están correlacionadas entre sí, y por tanto la multicolinealidad es una cuestión de intensidad; en consecuencia, se usan varios procedimientos para indicar su presencia. 1. Una R2 relativamente alta en una ecuación con una estadística t poco significativa es un indicador de multicolinealidad. De hecho, es posible que la estadística F para la ecuación de regresión sea altamente significativa, mientras que ninguna de las estadísticas t individuales sea significativa en sí misma. 2. Las correlaciones simples relativamente altas entre uno o más pares de variables explicativas pueden indicar multicolinealidad. Sin embargo, las conclusiones sobre la presencia o ausencia de multicolinealidad que sólo se basan en estas correlaciones deben hacerse con cuidado. Es posible que con algunos conjuntos de datos, en especial aquellos que implican series de tiempo, las correlaciones entre muchos pares de variables serán altas, pero los datos le permitirán a uno separar los efectos de las variables explicativas individuales sobre la 10 Para un tratamiento adicional de pruebas para multicolinealidad, véase D.E. Farrar y R.R. Glauber, "Multicollinearity in Regression Analysis: The Problem Re-visited", Review of Economics and Statistics. vol. 49, pp. 92-107, 1967. Véase también D. Belsley, E. Kuh y R. Welsch, Regression Diagnostics: Identifying Influential Data and Sources of Collinearity (Nueva York: Wiley, 1980).
CA APÍTULO 4: El mo delo de regresión múltiple
101 1
vaariable dependiente. Una limitación adiicional es quee un examen de las correlaciones simplees en pares nno permitirá detectar d la muulticolinealidaad que surge deebido a que trres o cuatro variables v estáán relacionadaas entre sí. 3. Se han propuesto p varrias pruebas formales f paraa la multicolinnealidad a lo largo de los añños, pero ninnguna ha enccontrado una aceptación amplia. a Una prrueba implica el cálculo de un número dee condición associado con ell conjunto de daatos de la variiable explicattiva. Un númeero de condición mayor quue 20 o 30 es inndicativo de laa presencia dee multicolineaalidad.11
4.5
COEFICIENTES ESTAND DARIZADOS S Y ELASTIC CIDADES 4..5.1
Coe eficientes estandarizad dos
Lo os coeficientess estandarizaddos describen la importanciia relativa de las variables in ndependientess en un modelo de regresió ón múltiple. Para P calcular coeficientes esstandarizados, tan sólo se realiza r una reegresión lineaal en la que cada c variable ess normalizada a restándole suu media y divvidiéndola enttre su desviacción estándar esstimada. El modelo m de regrresión normaalizado se pressenta como siigue:
Loos coeficientees estandarizaddos guardan una u relación estrecha e con loos coeficientes estimados del d modelo dee regresión múltiple m no norrmalizado oriiginal. No es diifícil demostraar que:12 (4.14) En n otras palabrras, el coeficciente estandaarizado ajustaa el parámetrro de la pendeente estimadoo por el cociennte entre la deesviación estáándar de la vaariable indepeendiente y la desviación eestándar de laa variable deppendiente. Unn coeficiente esstandarizado de d 0.7 signiffica que un caambio de 1 ddesviación esstándar en la vaariable indepeendiente condducirá a un caambio de 0.7 desviación esstándar en la vaariable dependdiente. Tanto los coeficientes c eestandarizadoss como los cooeficientes dee correlación paarcial están coonectados conn la varianza de d Y, la variabble dependiennte. Sin em11
Describimoos esta prueba aquuí sólo en forma breve debido a qque implica álgebbra matricial. Se
expplica en D. Belsleyy, E. Kuh y R. Weelsch, Regression Diagnostics: D Identtifying Influential Data D and Sources of Collinearity (Nuueva York: Wileey, 1980). Para un resumen máss reciente, véasee W.H. Greene, Ecconometric Analyssis, 2a. ed. (Nuev a York: Macmillaan, 1993), secciónn 9.2. 12 Escribiendo o la ecuación (4.113) en forma de desviaciones y multiplicando m ambbos lados por sy, obtenemos yi = β*2 (sY / sx2)x2i + β*3 (sY /ssx3) x3i + • • • + β*k (S Sy/Sxk1) xki + ε*i .de lo cual se deriva nuestro n resultado
en n forma directa.
102
PARTE UNO: Los fundamentos del análisis de regresión
bargo, el reescalamiento asociado con la regresión normalizada posibilita comparar los coeficientes estandarizados de manera directa. Esto no puede hacerse con las X originales, debido a que las variables dependientes están en unidades diferentes con varianzas diferentes. Es interesante señalar que el coeficiente estandarizado de la variable independiente en el modelo de dos variables es idénticamente igual a la correlación simple entre las dos variables. El coeficiente estandarizado del término constante es indefinido, en vista de que el término constante se omite como resultado del proceso de normalización.
4.5.2
Elasticidad
La elasticidad mide el efecto en la variable dependiente de un 1% de cambio en una variable independiente. Esta elasticidad de Y con respecto a X2, por ejemplo, es el porcentaje de cambio en Y dividido entre el porcentaje de cambio en X2. En general, las elasticidades no son constantes sino que cambian cuando son medidas en diferentes puntos a lo largo de la línea de regresión. Las elasticidades que, por lo general, son impresas por programas de computadora se calculan en el punto de la media de cada una de las variables independientes. Para el
coeficiente jésimo la elasticidad es evaluada como:
Los valores de la elasticidad son ilimitados y pueden ser positivos o negativos. Las elasticidades son útiles debido a que están libres de unidades; es decir, sus valores son independientes de las unidades en que son medidas las variables. Por ejemplo, si Ej = 2.0, podemos decir que alrededor de la media de las variables un incremento del 1% en Xj conducirá a un incremento del 2% en Y. Por otra parte, si Ej = -0.5, un incremento del 1% en Xj conducirá a una disminución del 0.5% en Y. En general, las elasticidades grandes implican que la variable dependiente es muy sensible a los cambios en la variable independiente.
4.6
CORRELACIÓN PARCIAL Y REGRESIÓN POR ETAPAS En el modelo de regresión múltiple, es natural extender el concepto de correlación simple para ver cuánto están relacionadas la variable dependiente y una variable independiente después de eliminar completamente el efecto de otras variables independientes en el modelo. Para hacer esto, consideramos el siguiente modelo: Y i = β 1 + β 2 X 2i + β 3 X 3i + ε i El coeficiente de correlación parcial entre Y y X2 debe definirse de tal manera que mida el efecto de X2 en Y que no es explicado por las otras variables en el modelo. De
CAP PITULO 4: El mode elo de regresión múltiple m
103
maanera más esppecífica, el coeeficiente de coorrelación parrcial se calculaa eliminando el efecto lineall de X3 en y (así como el e efecto lineal de X3 en X2) y luego ejeecutando la reegresión aproopiada. Los paasos son los siguientes:
1. Ejecutarr la regresión de Y en X3 y obtener valorres ajustados:
2. Ejecutarr la regresión de X2 en X3 y obtener valores ajustados:
3. Eliminarr la influenciaa de X3 en Y y X2. Se tiene que: q
4. La correelación parciaal entre X2 y Y es, entonces, la correlación simple en ntre Y* y X*2. Para saber por qué la reegresión de Y* Y sobre X*2 nnos dará el cooeficiente de coorrelación parccial deseado, nótese que Y* * y X*2 no estáán correlacionnadas con X3 13 poor construcció ón. Entoncess la regresión de Y* sobre X*2 relaciona la l parte de Y quue no está corrrelacionada con c X3 con la parte de X2 que q no está co orrelacionada coon X3. Denotam mos el coeficciente de correelación parciaal y las correlaciones simples de la siguiiente forma: r
Yx2·x3 =
r
coorrelación parccial de Y y X2 (controlado por X3)
rYX2 = coorrelación simp mple entre Y y X2 x2 x3 = co orrelación sim mple entre X2 y X3
Dada la deefinición de ccorrelación paarcial, no es difícil d derivarr la relación enntre la correlacción parcial y la correlacióón simple. Exxpresamos el resultado r sin prrueba, dado quue los detalles son compliccados: (4.16) (4.17) Laas correlacionnes parciales deben d variar enn valor de -1 a +1, del mism mo modo en quue deben haceerlo las correlaaciones simplles (recuérdesse la derivacióón de la co13 El hecho dee que Y* y X3 (poor ejemplo) no esttén correlacionaddas se deriva en fo orma directa del hecho de que Y* reepresenta el residdual de la regresiión de Y en X3. H Hemos visto en ell capítulo 3 que loss residuales de laa regresión no esttán correlacionaddos con las variabbles explicativas.
104
PA ARTE UNO: Los fu undamentos del análisis de regresió ón
r rrelación simpple). Una corrrelación parciial de cero enntre Y y X2 ind dica que no haay r relación lineal entre Y y X2 ddespués de que el efecto lineall de X3 en cadaa uno había siddo
explicado. Enn tal caso conccluiríamos que X2 no tiene un efecto direecto en Y en el e m modelo. De hecho, h los coeeficientes de correlación c paarcial a menud do se usan parra determinar laa importancia relativa de variables v diferrentes en moddelos de regreesión múltiple. Ahora veeremos la relación entre la correlación c paarcial y R2. Enn el modelo de d dos variables es fácil mostrrar que uno puuede interpretaar R2 como el cuadrado de lla correlación siimple entre laas variables dependiente d e independientte. También ees posible interppretar la correelación parciall entre Y y X2 como la raízz cuadrada deel porcentaje dee la varianza een Y que no es explicada poor X3, pero quue es explicadda por la parte de d X2 que no eestá correlacioonada con X3. Dado este hecho, es posiblle derivar la sigguiente relacióón entre la co orrelación múúltiple y parciial:
A partir de laa ecuación (44.18) puede deeterminarse eel coeficiente de correlacióón parcial toman ndo la raíz cuuadrada del porcentaje p de la varianza en e Y explicadda por X2 (con ambas a variablles ajustadas para p eliminar el efecto de X3). Quizá el uso más freccuente de la correlación c parcial ocurre en el proceddimiento de reg gresión por etaapas. En la reggresión por etaapas se añadenn variables a un u modelo para maximizar m R¯ 2. La correlacióón parcial entrre cada variablle explicativa y la variable deependiente es útil para deteerminar cuál variable v añadirr, debido a quue nos dice si un na variable deeterminada afe fecta a la variaable dependiente después de d que se ha elim minado el imppacto de todas las variables incluidas coon anterioridaad en el modelo. Aunque la reegresión por etapas e puede ser útil para examinar e datoos cuando hay una u gran canntidad de posibles variablees explicativaas, es de pocco valor cuando o uno está inttentando anallizar un moddelo desde el punto de vistta estadístico. La razón es quee las pruebas t y F consideraan la prueba de una hipótesiis nula, bajo la suposición dee que el modeelo está especiificado en form ma correcta. Si S hemos buscad do en un conjuunto grande dee variables, seeleccionando aquellas a que se s ajustan bien,, es probablee que obtengamos pruebaas t significattivas con graan frecuencia. Como C resultaddo, la estadísttica t grande no nos permiite rechazar la l hipótesis nulla con un niveel dado de sig gnificancia. EJEMPLO O 4.4
El valor de los s boletos de fúttbol revendidos s
14
Durante las teemporadas dee 1978 y 19799, el equipo dee fútbol de la Universidad U d de Alabama estuuvo en la peleea por el camppeonato de Esstados Unidoss. Los boletoss 14 Este eje mplo se basa enn Terrence F. Martell M y Hassan Tehranian, "Thee Determinants of o Scalped Ticket Prices", P Northeast Journal of Businness & Economicss, vol. 14, pp. 33--43, otoño/inviernno, 1987-1988.
CAPÍTULO 4: Et modelo de regresión múltiple
105
para la temporada regular estaban agotados y se desarrolló un mercado activo para la "reventa" de boletos. En Alabama, a diferencia de muchos otros estados, la reventa de boletos para eventos deportivos es legal. Cada boleto vendido durante este periodo tenía un precio de lista de 10 dólares, pero los precios del mercado reales variaron en forma considerable debido a los cambios en la demanda de boletos por las personas que no los tenían para la temporada y los cambios en el suministro de boletos revendidos por aquellos con boletos para la temporada. El modelo de regresión relaciona el precio promedio de los boletos revendidos para cada uno de los 22 juegos realizados durante las dos temporadas con diversas variables de demanda y suministro. La ecuación de los boletos revendidos es: Pi = β1+ β2SECi + β3TVi+ β4RANKi + β5LWINi + β6WINi + β7HOMEi + εi donde P = el precio promedio de un boleto revendido SEC = 1 si el oponente está en la Conferencia del Sureste de Alabama; 0 si es de otra manera TV = 1 si el juego se transmite por televisión; 0 si es de otra manera RANK = clasificación de Alabama en la semana anterior en las encuestas de fútbol LWIN = el porcentaje de juegos ganados y perdidos del oponente durante el año anterior WIN = el porcentaje de juegos ganados y perdidos del oponente durante el año en curso HOME = 1 si el juego es local; 0 si es de otra manera Los resultados de la regresión, incluyendo los coeficientes regulares y estandarizados, se muestran en el siguiente cuadro:
Variable Constante SEC TV RANK LWIN WIN HOME
Coeficiente Coeficiente estandarizado 4.64 5.59 -9.21 -1.20 .30 .06 4.97
19.77 13.05 -18.10 -13.87 22.10 9.57 11.28
Estadística t (para coeficientes estandarizados) 1.83 -2.03 -2.03 -2.05 2.68 1.41 1.96
Los coeficientes en la segunda columna nos dicen el efecto sobre la variable dependiente de una unidad de cambio en cada una de las variables indepen-
106
P PARTE UNO: Los fundamentos del análisis de regressión
dientes. Sinn embargo, es difícil com mparar la im mportancia dee las variablees independientes en la determiinación de loss precios de los l boletos rev vendidos, en vista de que varíann las unidades de medicción. Los cooeficientes esstandarizadoss, en la tercera columna, son m más apropiaddos para este propósito. El E determinannte más importante del precio de d reventa ess el porcentajje de juegos ganados y perdidos p del oponen nte en la tem mporada anteerior (el coefficiente estan ndarizado es el más alto de toddas las variabbles independientes). Tennemos que entre mejor es e el récord del opponente, mayyor el precio del boleto. T Todas las varriables restanttes también tienenn los signos que esperaríamos. En orden de impoortancia encontramos que entre mayor m era la clasificación de Alabama, mayor el prrecio del boleeto (una clasificacióón alta signiffica un númeero menor paara la variablle RANK), laa cobertura en la televisión disminuye el precio p del booleto (en vistta de que loss individuos puedeen ver el jueggo en su hog gar), los jueggos de la Connferencia del Sureste son más caaros que los juegos que no n son de la conferencia, los boletos para p los juegos locaales son más costosos quee los boletos para juegos en otras ciuudades y entre mejorr es el récord actual del opponente, mayoor el precio del d boleto.
EJEMPL LO 4.5
Ventas de biienes duradero os
Para predecir las ventass mensuales de bienes duuraderos por medio m de un modelo de regresióón lineal, se usaron los siguientes daatos para el periodo de julio j de 1967 a agossto de 1995:15 1. Variable dependiiente SD = ventas mennsuales al meenudeo de bieenes duradero os (millones de dólares) 2. Variables indepenndientes DI = inventario aal menudeo de d tiendas de departamento d os en bienes dud raderos (milllones de dólaares) IS = proporcionees de ventas de d inventario ppara todos loss bienes duradderos, tiendas al menudeo I = tasa en el mercado m abieerto de papel comercial prreferente a seeis meses (porccentaje) E = ingresos brrutos promediio por hora dee los trabajaddores (dólaress) P = índice de P Precios al Consumidor parra bienes durraderos (19833 =
100)
El modelo se especifica como c sigue:
15 Las sigguientes variabless ajustadas estacioonalmente fueron usadas de la basee de datos Citibase: RTDR, 1VRDR R (IS = IVRDR/RT TDR), FYCP, LEH H y PUCD.
CAPÍTULO C 4: El modelo m de regresió ón múltiple
10 07
Los L resultados de la regressión son los siguientes:
No es unaa coincidenciaa que se haya elegido que ttodas las variaables indepen-ddientes estuvieran rezagadaas al menos un u periodo. E Esto explica laas demoras enn la respuesta mientras m al m mismo tiempoo hacen más ffácil la predicción. Si unoo d desea predecirr ventas menssuales al menu udeo de bienees duraderos en e el momentoo t,, uno tan sóloo usaría la sigguiente ecuacción de regressión:
Para evaluar SD P S en el perioodo t + 1, se sustituyen s valoores para DI dados d 6 mesess p previamente, IS I dado 1 mes previamentee, etc. Si las vvariables indeppendientes noo f fueran retrasad das, sería neccesaria algunaa clase de proceso de extraapolación paraa p pronosticar suus valores anntes de que pudiera p hacerrse una predicción para laa v variable depen ndiente. La columnna denominadda parcial con ntiene la lista dde los coeficieentes de corre-laación parcial, mientras la coolumna denom minada coeficiientes estanda arizados se de-f fine por sí solla. En este ejemplo, los co oeficientes dee la variable independiente i e c la estadísstica t más grrande en valo con or absoluto tieenden a tenerr los mayoress c coeficientes de correlación estandarizadaa y parcial. E El coeficiente estandarizadoo d 0.21 en loss ingresos rezzagados signiffica que un inncremento dee 1 desviaciónn de e estándar en loss ingresos rezzagados conduucirá a un incrremento de 0.221 desviacio-
108
PA ARTE UNO: Los fundamentos del an nálisis de regresión n
nes n estándar en e las ventas al menudeo de bienes duuraderos. El coeficiente c dee correlación c paarcial de 0.31 en la misma variable v de inngresos implicca que el 9.4% % 2 (0.31 ( ) de la varianza de SD D no explicadaa por las otras variables indeependientes ess explicada e por los ingresos. Al examinar las l elasticidaddes, vemos quue las ventas al a menudeo m de bienes b duraderros son sensibbles a los cam mbios en los inngresos brutoss de d los trabajaadores pero nno al índice de Precios all Consumidoor para bieness duraderos. d Si los ingresos sse elevaran en n un 1%, entonnces podríamoos esperar quee las l ventas al menudeo m se inncrementaran poco más dell 0.3%. Pero si s el índice dee Precios P al Co onsumidor see elevara en un 1%, se essperaría que las ventas al menudeo m dism minuyeran alrrededor del 0.02%.
A APÉNDICE 4.1 E Estimación dell parámetro de mínimos cuad drados
Nuestra N meta es minimizaar ESS = ∑(Y Yi - βˆ1 - βˆ2X2i - βˆ3 X3i)2. Poddemos hacerloo calculando c loss derivados parciales con respecto r a los tres parámetrros desconocidos d β1, β2 y β3 igualando caada uno a 0, y resolviendo. Para simplifiicar usamos el e modelo m en forrma de desviaaciones, de modo m que:
E Entonces (A4.1)
(A4.22) Para resolverr, multiplicam P mos la ecuación (A4.1) poor ∑x 23i y mu ultiplicamos laa e ecuación (A44.2) por ∑x2ix3i3 y luego resttamos el últim mo del primerro:
o
Se sigue que:
CAPÍTULO 4: El modello de regresión múltiple
109
Po or último, si establecemos e la derivada de d ESS con reespecto a β1 igual a cero, enccontramos quue:
AP PÉNDICE 4.2 4 Coeficientes de re egresión
Coonsidérese el modelo m de reggresión múltiiple de tres vaariables (A4.3) Exxplicamos en el texto que β2 mide el effecto de X2 een Y, con el efecto e de X3 maantenido consstante. ¿Cómoo se aplica en n realidad estte concepto cuuando obtenem mos estimadoores de mínim mos cuadradoos para β2 (asíí como para β3)? La respuesta es que ell coeficiente estimado e en ell modelo de regresión de trres variables puuede calcularse realizando ddos regresionnes de dos varriables. (Este resultado se gen neraliza a cuaalquier modeloo de regresión n múltiple.) Laa primera regrresión ajusta la variable X2 para p "manteneer constante X3", mientras que la segundda regresión esttima el efecto de esta variabble ajustada enn Y. El proceddimiento se mu uestra en los sigguientes pasos. Paso 1 Reggresar X2 en X3. Cuando se s ha estimaddo la ecuacióón, podemos calcular los valores ajustaados y residuaales del modello. Para simplificar, trabajaremos con n los datos en forma de desvviaciones, de modo que el modelo m es:
Nuestro inteerés se encuenntra en ûi, la cual c representta la porción de d X2 que no está correlaacionada con X3. (Recuerdde que los residuales de regresión r no están correllacionados coon la variablee de la derechha.) De hecho, mantener constante X3 significa eliiminar deX2 el e componentee que está corrrelacionado con X3.
Paso 2
R Regresar Y en û. El modeloo es
Cuuando se estim ma, encontram mos que:
110
PARTE UNO: Loss fundamentos del análisis de regre esión
ŷ representaa el efecto de "X2 ajustada" en Y y de accuerdo con nu uestro argumennto debería med dir el efecto de d X2 en Y manteniendo m coonstante X3 Si S estamos enn lo correcto, deb be ser que γ = βˆ 2 . Para observar esto se nnecesita realizzar los siguienntes cálculos alggebraicos:
Pero
Por consiguuiente,
Ahora, multtiplicando am mbos lados deel cociente poor ∑x 23i y simpplificando, obbtenemos:
APÉNDIC CE 4.3 El modelo de e regresión mú últiple en form ma matricial
REPRESEN NTACIÓN DE EL MODELO O DE REGRE ESIÓN MÚLT TIPLE
El propósitoo de este apénndice es presenntar generalizzaciones de deetalles textualles importantes. Sería difícil lograr esto siin usar álgebra matricial, pero suponemoos que el lectorr tiene este coonocimiento previo. p Comenzzamos represeentando el moodelo lineal en forma matrricial. Se recordará del texto que el moddelo de regressión incluye k + 1 variablees, una variabble dependientee y k variabless independienntes (incluyenndo el términoo constante). E En virtud de quue hay N obseervaciones, podemos p resuumir el modello de regresióón escribiendo una serie de N ecuacioness, de la manerra siguiente:
CAPÍTULO 4: El m modelo de regresión múltiple
111 1
La L corresponddiente formulación matriciial del modeloo es: Y = Xβ+ X ε
(A4.5))
e la cual: en
donde d Y = N x 1 vector de columna de observaciones o de la variablee dependientee X = N x k matriz dee observacionnes de la variaable independdiente β = k x 1 vector collumna de paráámetros descoonocidos ε = N x 1 vector coolumna de errrores En nuestrra representaación matriciaal X, cada componente c Xji tiene doss subíndices, s el primero signiificando la coolumna apropiiada (variable)) y el segundoo significando s la fila apropiaada (observación). Cada coolumna de X representa unn vector v de N observaciones o s de una variiable determinnada, con tod das las obser-vaciones v asocciadas con el iintercepto igu ual a 1. Las supossiciones del modelo m de regrresión lineal cllásico puedenn representarsee c como sigile: i. La esp pecificación ddel modelo esttá dada por laa ecuación (A A4.4). ii. Los ellementos de X son fijos y tienen una vvarianza finitaa. Además, X t tiene rango k,, el cual es m menor que el número n de obbservaciones N. N iii. ε está, distribuida enn forma norm mal con E(ε) = 0 y E(εε') = σ2I, donde I ess una u matriz dee identidad N x N. La suposición de que X tiene un ranngo k garantizza que no estaará presente laa colinealidad c p perfecta. Con esta colinealiidad perfecta, una de las coolumnas de X sería s una com mbinación lineeal de las resstantes colum mnas, y el ranggo de X seríaa menos m que k. Las suposiciiones sobre el e error son laas más fuertes posibles, enn vista v de que garantizan g las propiedades estadísticas aal igual que aritméticas a del proceso p de esttimación de m mínimos cuaddrados ordinarrio. Además de d la normalidad d asumimoss que cada térrmino del erroor tiene mediaa 0, todas las varianzas sonn constantes c y to odas las covariianzas son 0. La L matriz variaanza-covariannza σ2I aparecee de d la siguientee manera:
112
PA A RTE UNO: Los fu undamentos del an nálisis de regresió ón
donde d ε′ es ell vector transppuesto 1 x N de ε. E ESTIMACIÓ ÓN DE MÍNIIMOS CUAD DRADOS ^
N Nuestro objetivo es enconntrar un vecto or de parámettros β que min nimice, (A4.88)
donde,
(A4.99)
y
(A4.100)
^
ε representa el e vector N x 1 de residuales de la regresiión, mientras Ŷ representa el e
vector v N x 1 de valores ajustados aj paraa Y. Sustituyeendo las ecuaaciones (A4.99) y (A4.10) en la ecuación (A4.8), obteneemos:
El E último passo resulta porrque βˆ'X'Y y Y'X βˆ son escaalares ambos y son igualees entre e sí. Paraa determinar los estimadorees de mínimoos cuadrados, minimizamoos ESS E como siggue: (A4..12) La L matriz X′X X, llamada maatriz de produuctos cruzadoss, garantiza teener un inverso debido d a nuesstra suposicióón de que X tiene t rango k.16 16 Las condiciones de segunddo orden para la minimización m de ESS E se derivan deel hecho de que X es una matriiz definida positiiva. X′X
CAP PÍTULO 4: El mod delo de regresión múltiple m
113
Dos resultad dos concernieentes a los resiiduales de mínimos cuadraados pueden serr útiles en alggunas de las ddesviaciones que resultan: (A4.133) (A4.144) El primer resulttado demuesttra que la sum ma de los prroductos cruzzados de las varriables indepeendientes y loos residuales es e 0. Éste es eel análogo muuestral de la supposición de que q E(X'ε) = 00. Ahora conssidérense las ppropiedades del estimadorr de mínimoss cuadrados ^ β. Primero, P podemos demosttrar queβˆ es un u estimador insesgado dee β:
Observando o la ecuación (A4.15), notaamos que Aε= = (X'X)-1X'ε representa r la reggresión de ε en e X. En tantoo los efectos de las variables faltantes estén e distribuiidos en formaa aleatoria inndependientem mente de X y tengan mediia 0, el estimaador de mínim mos cuadradoos del parámeetro será insessgado. El estimado or de mínimoss cuadrados estará e distribuuido en formaa normal, en ^ vissta de que β es e una funciónn lineal de ε y ε está distrribuido en forrma normal. Laas propiedadees de las variianzas de las βˆi individualles y sus covvarianzas se detterminan com mo sigue:
(A4.166) Lo os elementos diagonales d dee V representaan las varianzzas de los parrámetros estim mados, mientras los términoos fuera de laa diagonal reppresentan las covarianzas. c En n ocasiones esscribiremos V = Var (βˆ ). Entonces, E
114
PARTE UNO: Los fundamentos del análisis de regresión
en vista de que A y A' son matrices de números fijos. Pero,
Por consiguiente,
(A4.17)
Ya hemos demostrado que el estimador de mínimos cuadrados es lineal e insesgado. De hecho, βˆ es el mejor estimador insesgado lineal de β en el sentido de que tiene la varianza mínima de todos los estimadores insesgados. Para completar la prueba del teorema de Gauss-Markov, necesitamos mostrar que cualquier otro estimador lineal insesgado b tiene una varianza mayor que βˆ. Recuérdese que βˆ = AY. Sin pérdida de generalidad, podemos escribir (para cualquier matriz C) b = (A + C)Y = AY + CY = βˆ + CY = (A + C)Xβ + (A + C)ε Si b es insesgado, entonces: E(b) = (X′X) -1 X′Xβ + CX β = (I + CX) β = β
(A4.18)
Una condición necesaria y suficiente para que esto se cumpla para todas las β es que: CX = 0 Ahora examinemos la matriz Var (b). Dado que b - β = (A + C)ε,17 Var (b) = B[(b - β)(b - β)′] = E[(A + C)ε][(A + C)ε]′ = E[(A + C) εε' (A + C)'] = (A + C)E( εε' )(A + C)' = σ 2(A + C)(A + C)' Pero
(A + C)(A + C)' = AA' + CA' + AC′ + CC′ = (X'X)-1X'X(X'X)-1 + CX(X'X)-1 + (X'X)-1X'C′ + CC = (X'X)-1 + CC′ dado que CX =X'C' = O
17 En vista de que AX = (X'X)-1X'X = I, b - β = (A + C)Xβ= (A + C)ε – β = AXβ – β + CXβ+ (A + C)ε = (A + C)ε.
CA APÍTULO 4: El mod delo de regresión múltiple m
115
Por consiguientee, (A4.19) Podemos observvar que CC′ es una matrizz semidefinida positiva. Ell único caso en el que la forrma cuadrátiica asociada con esta ma triz será 0 ess cuando C = 0 (todos los elementos soon 0). Cuand do C = 0, el estimador e altternativo se vueelve el estim mador de míniimos cuadrad dos ordinarioos βˆ y el teorrema queda dem mostrado. ES STIMACIÓN DE σ2, PRUE EBAS t
Parra calcular laa matriz de varianza-cova v arianza de loss parámetros estimados, neccesitamos determinar un esstimador para a escalar σ2. U Una elección natural n es:
(A4.20) Es tedioso, peroo no difícil, demostrar que s2 proporcionna un estimad dor insesga-1 do de σ2. Resuulta que s2(X′X X) produce un estimador insesgado de d Var (β). Cuuando s2 se ussa para aproxiimar σ2 nos basamos b en ell uso de la pruueba t. Para haccerlo, empleaaremos los sigguientes resultados estadístticos:
tad d.
1. ε^ ′ε^ /σ2 esstá distribuiddo como ji cuaadrada con N - k grados de libertad. 2. (N – k)s2/σ2 está distribbuido como ji cuadrada conn N - k grados de d liber-
3. (βˆi – βi), para p i = 1, 2,..., k, está disttribuida en forrma normal con c media 0 y varianza σ2Vi, donde Vi es el iésimo elem mento diagonnal de (X'X)-1. 4. (N – k)s2/σ2 y βˆ i – βi están e distribuiidos en formaa independiennte. El resultado es que q
(A4.21)
esttá distribuido en forma t coon N - k gradoos de libertadd. Esto nos peermite construuir intervaloss de confianzza para parám metros de reggresión indivviduales en unaa manera anááloga al procedimiento desccrito en el cappítulo 2. Paraa probar una hip pótesis respecto a un valor pparticular de βi, sustituimoss ese valor en la ecuación (A A4.21). Si el valor v t es lo bastante gran nde en valor absoluto, recchazamos la hip pótesis nula en e el nivel de confianza eleegido de mannera apropiada. Un intervallo de confianzza del 95% paara βi, está daddo por: (A4.22)
116
PARTE P UNO: Los fundamentos del análisis de regressión
donde tc es el e valor críticco de la distribbución t asociada con un nivel n de signifficancia del 5% %. R2, PRUEBA AF Como se expplica en el texxto, nosotros podemos p diviidir la variació ón total de Y en dos porcionees, una repressentando la vaariación expliicada y la seggunda represeentando la varriación inexpllicada. Primerro asumimos que la variab ble Y tiene unna media 0. Enn notación mattricial, la deriivación resulta del hecho de d que podem mos ^ escribir el vector v Y com mo la suma dee sus valores pronosticadoos Ŷ = X β y el vector residdual ε^:
Entonces,
o
TS SS =RSS + ESS E
donde TSS = suma total de cuadradoos RSS = suma de cuuadrados de laa regresión (eexplicados) ESS = suma de cuuadrados del error (inexplicados) Entonces,
(A4.24))
Cuando la variable v depenndiente no tieene media 0, debemos modificar un poco nuestra defiinición de R2. Entonces yi = Yi – ¯Y, de lo cual resultta que:
Ahora, sustrrayendo NY¯ 2 de ambos laddos de la ecuaación (A4.23) y sustituyenddo, encontramos que: (A44.25) Para corrregir la depenndencia de laa bondad de ajjuste de los grrados de liberrtad, definimos R ¯ 2 como
(A44.26)
CAP PÍTULO 4: El modelo de regresión múltiple m
117
Ahora, es apropiado a connsiderar las pruebas p estadíísticas sobre conjuntos c de co oeficientes dee regresión. La L prueba usaada con mayoor frecuencia involucra la prrueba de hipóótesis conjuntaa de que β2 = β3 = = βk = 0. La estadística F ap propiada es: •
••
En n ocasiones se usan otras ppruebas que involucran i coombinaciones de los parám metros de regreesión. Una veez más, supón ngase que Y tiiene una med dia 0. En este caaso podemos usar u el resultado de que:
esstá distribuidaa en forma F con k - 1 y N - k gradoss de libertad. Para probar hipótesis conjuuntas que invvolucran los parámetros p d regresión individuales, de i tan n sólo sustituuimos los vaalores de prueeba apropiadoos por β y evaluamos e la esstadística F. Un U valor sufi ficientemente grande de F nos permitee rechazar la hipótesis nula. EJ JERCICIOS 4.1 Considere lo os siguientes doos modelos:
a) Demuestrre que b) Demuesttre que los resiiduales de mín nimos cuadrados son idénticos, es decir, ε^ i = ε^ ′i para i = 1, 1 2, … , N. c) ¿Bajo qu ué condiciones la R2 asociadaa con el modello II será menoor que la R2 asociada con el modelo m I? 4.22 Considere loos siguientes prrocedimientos experimentalees: 1. Ejecutar laa regresión Yi = β1 + β2X2i + β3 X3i + εi. ^ 2. Ejecutar la regresión X2i = α1+α2 X3i +εε'i , calcular los residuales ε ′i ,y por último ejecutar la l regresión ¿P Puede demostraar que βˆ ′2 = βˆ 2 ? ¿Puede expliicar en forma inntuitiva por quéé es verdadero este resultado? 4.33 Un investigaador algo ingeenuo intenta esstimar una funcción de consum mo agregado paara la economíaa estadounidensse regresando unna variable de cconsumo C sob bre el ingreso disponible Y y loos ahorros S. Ell modelo es C = β 1 + β 2Y + β 3 S + ε
118
PARTE UNO: Los fundamentos del análisis de regresión
¿Qué tan buen ajuste es probable que obtenga este investigador cuando se ejecute esta ecuación? ¿Puede generalizar su conclusión? Sugerencia: Observe que es C = Y - S idénticamente para todas las observaciones. 4.4 Suponga que las varianzas muéstrales (y desviaciones estándar) de todas las variables en un modelo de regresión múltiple son idénticamente las mismas. En este caso, ¿cuál es la relación entre los coeficientes estandarizados estimados y los parámetros de regresión estándar? 4.5 "Los parámetros de regresión estimados, elasticidades, coeficientes estandarizados y coeficientes de correlación parcial siempre tendrán el mismo signo." ¿Esto es verdadero o falso? Explique. 4.6 Explique las diferencias entre los conceptos de correlación simple, correlación parcial y correlación múltiple. ¿Por qué es útil cada uno?
PARTE
DOS MODELOS DE REGRESIÓN DE UNA SOLA ECUACIÓN
La parte dos de este libro extiende el tratamiento del modelo de regresión de una soja ecuación. Comenzamos en el capítulo 5 expandiendo la exposición del modelo de regresión múltiple, enfocándonos en la especificación del modelo y la prueba estadística., Los temas en este capítulo incluyen el uso de formas funcionales diferentes, variables indicadoras y pruebas t y F. Las técnicas de estimación usadas en la primera parte del libro dependen en forma decisiva de varias suposiciones relacionadas con la forma de los datos y la especificación del modelo. Los capítulos 6 y 7 tratan con varias de estas suposiciones. En el capítulo 6 nos enfocamos en la posible existencia de heterocedasticidad y correlación serial, describiendo pruebas de su existencia y correcciones para cuando están presentes. En el capítulo 7 nos ocupamos de las dificultades que surgen en el modelo de regresión. Para corregir estos problemas, se introduce el método de variables instrumentales. Debido a que es probable que las preocupaciones en este capítulo surjan cuando el modelo que se está estudiando es simultáneo, el capítulo 7 también sirve como una introducción importante al material de la parte tres (en especial el capítulo 12). El capítulo 7 se centra en los problemas que surgen cuando los modelos de regresión son especificados en forma incorrecta. En el capítulo 8 se discute el problema de pronosticar con un modelo de una sola ecuación. Se exponen los medios para obtener un pronóstico y alguna medida de la confiabilidad del pronóstico cuando se conocen las variables explicativas, del mismo modo que cuando son desconocidas y cuando los errores del modelo de regresión se correlacionan en forma serial. El material en el capítulo 8 establece las bases para el análisis más avanzado del pronóstico en las partes tres y cuatro.
119
120
PARTE DOS: Modelos de regresión de una sola ecuación
Los tres capítulos restantes en la parte dos contienen material de naturaleza más avanzada que el material en los primeros ocho capítulos del libro. Todos estos capítulos se relacionan con extensiones del modelo de regresión que pueden ser importantes en él trabajo de econometría aplicada. El capítulo 9 contiene un tratamiento de cuatro temas importantes en el modelado econométrico: la especificación y estimación de modelos rezagados distribuidos, pruebas estadísticas de causalidad; el problema de observaciones faltantes y el uso de datos de panel (datos de corte transversal combinados y datos de series de tiempo). En el capítulo 10 se estudia la estimación no lineal y la estimación de máxima verosimilitud. Aquí permitimos que se estimen modelos que son no lineales en los parámetros. La estimación de máxima verosimilitud es una técnica poderosa que se usa en forma amplia en el modelado econométrico. Este capítulo expone también la especificación y estimación de los modelos Arch y Garch, modelos en los que el término del error es heterocedástico condicionalmente y, en particular, la varianza del término del error depende de volatilidades en periodos previos. Los modelos Arch y Garch, que han encontrado aplicaciones amplias en finanzas, son estimados con técnicas de máxima verosimilitud. El capítulo 11 trata de la estimación de modelos en los que la variable que se va a estudiar es cualitativa en lugar de cuantitativa. El capítulo enfatiza la forma en que pueden usarse los modelos de probabilidad lineal, probit, logit y de regresión censurada para estudiar problemas que implican opciones múltiples. El contenido del capítulo 11 es autónomo y puede leerse de manera independiente del capítulo 10.
CAPÍTULO
5
USANDO EL MODELO DE REGRESIÓN MÚLTIPLE
En el capítulo 4 se hizo una introducción del modelo de regresión múltiple, enfatizando la forma en que no interpreta los coeficientes estimados, mide la bondad del ajuste y realiza pruebas estadísticas. En este capítulo nos enfocaremos en e1 uso del modelo de regresión múltiple. Comenzamos considerando la forma funcional, concentrándonos en la distinción entre los modelos lineales y los no lineales. Luego consideramos cómo, puede aplicarse el modelo de regresión cuando una o más de las variables explicativas es una variable indicadora. También se estudiarán las estadísticas t y F apropiadas que se usan para realizar las pruebas de hipótesis que implican grupos de variables independientes.
5.1
EL MODELO LINEAL GENERAL Hemos estado tratando con ecuaciones que son combinaciones lineales de las X. Esta especificación no es tan limitante como podría parecer, debido a que el modelo de regresión lineal puede aplicarse a una clase más general de ecuaciones que son inherentemente lineales. Los modelos inherentemente lineales pueden expresarse en una forma que es lineal en los parámetros al transformar las variables. Los modelos inherentemente no lineales, por el contrario, no pueden transformarse1 a una forma lineal. Suponga que comenzamos con el modelo (no lineal) Y = F(X 2 , X 3 , . . ., X k , ε)
121
122
P PARTE DOS: Mod delos de regresión n de una sola ecua ación
Figura 5.1
Formas funcionales no lineales.
El modelo es e inherentem mente lineal sii puede ser trransformado en: e
La relacción en la ecuuación (5.1) es inherentem mente lineal deebido a que es lineal con resspecto a los paarámetros β1, β2, β3, . . . , βk. Dirigiremoos nuestra atennción a la esttimación de m modelos inherrentemente noo lineales en el e capítulo 100. Por el momeento, sin embaargo, será imp portante obserrvar algunos casos c especiaa-
El modelo I (el modelo poolinomial) pro oporciona un medio m para prrobar si la reíaación entre Y y X2 es no linneal (aunque el e modelo en ssí es lineal en los coeficien-tes). Y se esppecifica para qque sea una función fu cuadráática de X2 (sse muestra unaa en la figura 5.1a). 5 Otra pruueba útil paraa determinar nno linealidadess es proporcioonada por unaa prueba t esttándar de la hiipótesis nula de que β3 = 0. 0 El modeelo II tambiénn es lineal en los l parámetros y usa el logaritmo de cadda variable.1 Au unque la eleccción de la basee de los logarittmos no impoorta de maneraa 1
En vista de que d log Y/d Y = 1/Y, cada parrámetro α 2,α3 , . . . es una elasticidaad.
CAPÍTULO 5: Usando el mod delo de regresión múltiple m
123
coonsiderable (ssólo afecta al término consstante en el m modelo), de manera m típica ussaremos logarritmos naturaales para la baase e (≈ 2.7188) en nuestro análisis. Un ejemplo simplee de la funciónn logarítmica se s ilustra en laa figura 5.1b). El modelo II puuede usarse si s uno tiene razones paraa creer que laas variables entran en la eccuación multiiplicativamennte en lugar de d aditivamennte. Esto puedde verse con m facilidad notando más n que ell modelo II puuede derivarsee del modelo III (el modelo m multiplicativo) tomando los logaritmos dee ambos ladoss.2 La equivallencia de los doos modelos see ve al notar que: q α1 = log γ1
α2 = γ 2
α3 = γ 3
ε = log ε*
El modelo IV parece seer muy similaar al modelo III, pero la semejanza s es enngañosa debiddo a que ninguuna transform mación del moodelo IV propporcionará un m modelo nuevo que sea lineaal en los parám metros. No caiga enn la trampa cuuando consideere las transformaciones quue hacen a los m modelos linealees en los paráámetros. A meenudo se pierdde algo en el proceso. Por ejemplo, considdérese la transformación deel modelo III al modelo II. Si se asume quue el proceso de error ε estáá distribuido en e forma norm mal, el processo de error en ell modelo III (ε*).no ( será nnormal. Por loo general, asuumimos que ε* sigue una diistribución cuuyo logaritmoo en sí mism mo está distribbuido en form ma normales deecir, será lognoormal.3 Algunas esspecificaciones adicionales del modelo, qque son útiles en el trabajo applicado, son como c las siguiientes: V
Modello exponenciaal:
Y = exxp [(β1 + β2X2 + β3X3)]ε
(5.6)
Toomando logarritmos de ambbos lados, este modelo pueede escribirse como: log Y = β1 + β2X2 + β3X3 + lo g ε VI
Modelo recíproco: r
(5.7)
Este modelo puuede transforrmarse en:
V Modelo semilog: VII s
(5.8)
V Modelo de VIII d interacciónn:
(5.9)
2
Nótese N que log Ab = b log A y log AB = log A + log g B para cualquierr A, B y b. Si S ε* es normal, las pruebas de ssignificancia seráán inválidas cuanndo se aplican al modelo II daado que log ε* no o seguirá la distriibución normal. 3
124
PARTE DOS: Modelos de regresión de una sola ecuación
El modelo VIII es digno de atención especial debido a la presencia de la tercera variable de la derecha, el producto de las variables X2 y X 3. Para ver cómo afecta este término de interacción a la interpretación que hace uno de los resultados de la regresión, considérese el impacto de un cambio en X2 sobre Y. Si se omitiera el término de interacción, el efecto sería medido por β2. Sin embargo, con la interacción, el efecto es β2 + β4 X 3 [obtenemos esto diferenciando la ecuación (5.9) con respecto a X2]. Por tanto, el efecto de X2 en Y depende del nivel de la variable X 3. Si β4 es positivo, el efecto de X2 en Y se incrementará conforme se incremente el valor de X 3. Por supuesto, esto puede lograrse con otras formas de ecuaciones, pero el término de interacción es una opción simple y directa.4
EJEMPLO 5.1
Una función de costo para la industria de ahorros y préstamos
La comprensión del aumento progresivo de las ganancias en la industria de ahorros y préstamos es importante para los reguladores que deben decidir si las fusiones y adquisiciones son de interés público, y para los administradores que deben tomar decisiones internas acerca del tamaño eficiente de las operaciones. En ambos casos la estimación empírica de una función de costo puede ser útil.5 La producción Q es medida como las acciones totales (en millones de dólares) de cada asociación de ahorros y préstamos. Los costos operativos promedio a largo plazo LAC, se miden como el gasto operativo anual promedio (en millones de dólares) como un porcentaje de las acciones totales. Usando datos para 86 asociaciones de ahorros y préstamos, se obtiene la siguiente relación: LAC = 238 - .615Q + .00054Q 2 La función LAC estimada tiene forma de U y alcanza su punto de costo promedio mínimo cuando las acciones totales de la asociación de ahorros y préstamos alcanzan 569 millones de dólares.6 Debido a que la mayor parte de los ahorros y préstamos tenían considerablemente menos que 569 millones de dólares en acciones, el análisis de función de costos sugiere que una expansión de los ahorros y préstamos a través de su crecimiento o fusiones podría haber sido valioso.
4 Los términos de interacción pueden combinarse con2términos cuadráticos para producir expre2 siones como Y = β1 + β2X2 + β3X3 + β4X2X3 + β5 X 2 + β6X 3 + ε. Probar la hipótesis nula de que β4 = 0 proporciona una prueba para la interacción, y probar la hipótesis conjunta de que β4 = β5 = β6 = 0 proporciona una prueba de si están presentes no linealidades. Estas pruebas se describen en la sección 5.3. 5 Este ejemplo se basa en J. Holton Wilson, "A Note on Scale Economies in the Savings and Loan Industry", Business Economies, pp. 45-49, enero de 1981. 6 Esto puede verse haciendo la gráfica de la curva o diferenciando la función de costo promedio con respecto a Q, estableciéndola igual a 0 y resolviendo para Q.
CAPÍTULO 5: usando el mod elo de regresión múltiple m
EJEMPLO 5..2
125
Prredicción de prrecios de vinos s
De manera traddicional, el prooceso de valuuación de la caalidad de coseechas nuevas dee vino se habíía dejado a caatadores de viinos expertos.. Esta tradició ón había sido coonmocionada en forma graave por una seerie de análisiis econométriccos recientes dee valuación de d vinos que mostraban m qu ue puede preddecirse el vallor futuro de unna cosecha (añño de recoleccción) de un vin no sólo con baase en el climaa. Un estudio in nteresante en particular p impplica la valuaación de vinoos cosechadoss en diversos caastillos en la región r de Burrdeos de Francia.7 Es bien, saabido en la inndustria vinícola que los precios p de meercado de los viinos produciddos en diferenntes épocas del d mismo caastillo varían mucho. Por ejemplo, los prrecios de subbasta en 1990-1991 en Lonndres para un na docena de bootellas de vinoos Chateau Laafitte 4g la déccada de 1960 variaron de un u mínimo de 2223 dólares parra la cosecha 1968 a un mááximo de 4 3335 dólares parra la cosecha 1,961. Hay doss razones paraa esta variabiliidad; una es que q si los vinoos más viejos y más maduross han de ser guardados g y vendidos v en ell mercado, deeben merecer unna ganancia ecconómica (unn precio superrior) que reflej eje el costo de oportunidad dee guardar el viino, La segunnda razón es qu ue hay una vaariación consiiderable en la caalidad de las uvas usadas para p hacer ell vino. La callidad de las uvas u a su vez deepende en graan medida del .clima. En un estuddio econométrrico del precio o de los vinos ppara 10 cosechhas de 1952 a 19 980 para 60 vinos v diferentees de seis casstillos, Orley Ashenfelter y sus colegas m mostraron que ambas razonnes son apoyadas por la eevidencia estaadística. Los auutores estimarron una regreesión de cortee transversal en la que la variable depeendiente, el logaritmo nattural del preccio de una doocena de boteellas de vino (P PRICE,), fue regresada coontra un térm mino constantee (no. reportaado aquí), la eddad de la coseecha (AGE,),, la temperatuura promedióó durante la teemporada de cuultivo (TEMP P,), la precipittación pluviall en septiembbre y agosto (RAIN,) ( y la prrecipitación pluvial p en los meses anteriiores a la cosecha, de octu ubre a marzo (W WRAIN,). Obtuvieron los ssiguientes resuultados (los errrores estándaar están entre paaréntesis):
Cada uno dejos d coeficieentes de regreesión es estaddísticamente significativo co on un nivel del d 5% usandoo una prueba t. Cada una de las variab bles independiientes tiene un na correlaciónn relativamentte baja con caada una de lass otras variablles independiientes, y por tanto la mullticolinealidadd no es un problema. p El co oeficiente AG GE proporcionna una medidaa de la tasa dee ganancia reeal al guardar viinos de Burdeeos: cada año aadicional de madurez m aumeenta alrededorr de un 2.4% 7 0. Ashenfellter, D. Ashmore y R. Lalonde, "B Bordeaux Wine V Vintage Quality annd the Weather" Chhance, vol. 8, núm m. 4, pp. 7-14, 19995.
126
P PARTE DOS: Mode elos de regresión de una sola ecuacción
el valor del vino. v El coeficciente de temp peratura tienee el signo que predecirían loos expertos en vinos: entre más calurosa la temporaada de cultivo o, siendo otraas cosas igualess, mayor la caalidad de las uvas u que se cosechan. c La variable v TEM MP refleja un asppecto adicionaal del fenómeno de la tempperatura: un peeriodo calurosso justo antes de d la cosecha es importante en especial para la caliddad de las uvaas cosechadas. Por último, laa lluvia previa a la vendim mia es un deteerminante possitivo muy siggnificativo de la calidad de la uva, mienttras que la lluuvia justo antees de la cosechha tiene un efeecto negativoo muy fuerte een la calidad.. La contrroversia que rodea r el uso del d análisis dde regresión para p predecir el precio de lass cosechas de vinos por los lagares surgee debido a que la calidad del d vino puede ser s pronosticaada antes de que la cosechha se complette y, en consecuencia, antees de que cualquier vino en n realidad seaa degustado. Es E por esto quue no es sorprenndente quizá qque el crítico de d vinos Robeert Parker, Jr., haya llamadoo a 8 este enfoque una "forma tiipo Neanderthhal de ver el vino". v Los ecoonometristas sse dan cuenta de d que cualqquier modelo de regresiónn con un ajusste menos quue perfecto gennerará muchoss valores pron nosticados quue son mayores que el valoor real y muchoos que son m menores. De acuerdo a con A Ashenfelter, la l revista Winne Spectator al parecer no enntiende esta affirmación, criticando el enffoque, "las prredicciones se volvieron cieertas con exactitud sólo trees veces en las 27 cosechaas desde 1961... Los precios pronosticados están tanto por p debajo como por encim ma de los precioos reales".
5.2
USO DE VARIABLES V INDICADOR RAS Las variabless usadas en lass ecuaciones de d regresión, ppor lo general, toman valorees a lo largo de un rango conntinuo. Sin em mbargo, esto nno tiene que ser así y a vecees podemos dessear usar una o más variab bles independi dientes que tom men dos o máás valores distinntos. (La estim mación cuand do la variable dependiente es una variabble indicadora see expone en ell capítulo 11.)) Por ejemplo, podemos deesear explicar el hecho de quee algunos inddividuos van a la universiddad y otros no o. Para hacerlo, creamos unaa variable indicadora que toma t el valor de 1 si el inddividuo va a la universidad y 0 si el indiividuo no va.. Las variablees indicadoras son útiles en e particular cuuando se está tratando conn datos cualitaativos. Ahora, suponga s que uuna empresa usa u dos tipos de procesos de producciónn. Bajo la hipóttesis de que laa producción obtenida de ccada proceso está e distribuidda en forma no ormal con vaalores esperaddos diferentees pero variannzas idénticaas, podemos reppresentar el prroceso de prodducción comoo una ecuaciónn de regresiónn: (5.100)
8
1995.
Robert Paarker, Jr., "Wine Equation E Puts Som me Noses Out of Joint", New York Times, T 4 de marzoo de
CAPÍTULO 5: Usando el mod delo de regresión múltiple m
127
doonde Yi es la producción p associada con ell iésimo proceeso de insumoo y Xi es una vaariable indicad dora: 1 0
Xi =
si la pproducción ess obtenida de lla máquina A si la pproducción ess obtenida de lla máquina B
En n este ejempllo bastante sim mple, β1 midee la producción esperada asociada a con laa máquina B, mientras β2 m mide la difereencia en la prooducción asociada con un caambio de la máquina m B a la máquina A. Esto puedde verse tomaando valores essperados en am mbos lados dde la ecuaciónn (5.10) para Xi = 0 y Xi = 1:
Debe quedar claro D c que unaa prueba de laa hipótesis nuula de que β2 = 0 es una prrueba de la hippótesis de quee no hay diferrencia en la prroducción asoociada con las m máquinas A y B. B De hecho, las estimacion nes de mínim mos cuadrados reales de los paarámetros de regresión sonn la produccióón media asociada con la máquina m By laa diferencia en ntre las produucciones meddias de A y B,, respectivam mente. Este proceedimiento pueede modificarrse con faciliddad si están involucrados i m de dos vallores distintoss. Por ejemplo más o, pueden empplearse dos vaariables indicaadoras para exxplicar el heccho de que la producción pproducida porr cada uno de tres procesos (A, B y C) puede no ser idééntica. En el siguiente modelo: (5.11) donde d
X2ii =
1 si laa producción es e obtenida dee la máquina A 0 de lo contrario
X2ii =
1 0
si laa producción es e obtenida dee la máquina B de loo contrario
Po or tanto, los tres t procesos de produccióón están repreesentados porr la siguiente coombinación de d valores tom mados por las variables inddicadoras: Máquina M A B C
X2
X3
1 0 0
0 1 0
Obteniendo loss valores espeerados, podem O mos interpretaar los resultad dos de la regrresión:
128
PARTE DOS: Mode elos de regresión de d una sola ecuacción
β1 representaa el valor espeerado de la prroducción aso ociada con la máquina C, β2 representa la diferencia en n producción asociada a con un u cambio de la máquina C a la máquina A, A y β3 mide el cambio pro omedio en la producción asociada a con un u cambio de laa máquina C a la máquina B. B Una pruebaa de la hipóteesis nula de qu ue β2 = 0 propo orciona una prrueba de la hiipótesis de qu ue no hay difeerencia entre el proceso de producción aso ociado con la máquina A y el asociado con c la máquin na C, mientras que q una prueb ba análoga qu ue compara B con C es prop porcionada po or una prueba t en el coeficieente β3. Observe que los tres prrocesos de pro oducción alterrnativos fueron n representado os por dos variaables indicado oras (con la terrcera implícitaa). La represeentación de este fenómeno haaciendo que u una variable tome t tres valores, por ejem mplo, máquin na A = 2, máquina B = 1, mááquina C = 0, no es equivallente a la técn nica de variab ble indicadora a menos que laas diferenciass entre las pro oducciones aso ociadas con laas comparaciones de la máquiina B con la A y de la máquiina C con la B sean idénticaas. No comeeta el error dee representar el proceso dee variable indiicadora usand do tres variabless de dos vías X2, X3 y X4, do onde X4 tome eel valor de 1 cuando c se usa la máquina C y el valor de 0 de lo contraario. La introd ducción de la variable X4 n no añade más in nformación pero agrega un na ecuación n no independieente en la derrivación de loss estimadores de mínimos cuadrados. c De hecho, hay una u colinealida ad perfecta en el e modelo debido a que X4i = 1 - X2i – X3ii para cada ob bservación i. Supóngaase que deseam mos probar la hipótesis nulaa de que no haay cambio en la producción asociada a con un movimien nto de la máqu uina A a la máquina m B. Para este propósito sería apro opiada una prrueba F de lla hipótesis nula n donde lo os coeficientes de d regresión β2 Y β3 son ig guales. Sin em mbargo, al replantear la ecu uación de regreesión, podem mos hacer la misma m prueba usando la esstadística t pro oporcionada por p los resultaados de la reg gresión estánd dar. Escribimo os el modelo de d regresión com mo: Y i = α 1 + α 2 X 2i + α 3 (X 3i + X 2i ) + ε i Luego consid deramos los trres casos:
La prueba esstá dada por una u prueba t de la hipótessis nula de qu ue α2 = 0. Ahora ex xtendemos la noción de varriables indicad doras al caso más general en e el que algunas de las variiables indepen ndientes son ccontinuas mieentras otras so on indicadoras. Un ejemplo cclásico es el caaso de la funciión de consum mo agregado, en e la que el raccionamiento, las campañaas de ahorro, etc., hacen que q el compo ortamiento de consumo en ttiempo de guerra sea diferrente del comp portamiento en e tiempo de paaz. Distinguirremos entre cinco c casos d diferentes de una u función de d consumo agrregado simplee en la que el consumo agrregado está deeterminado po or el ingreso disponible agreegado sin rezaagos involucraados.
CAPÍTULO 6: Usando el modelo de regresión mú últiple
Caaso I:
Ct = β1 + β2Yt + εt
129
(5.12)
Éstte es el caso en n el que Se suupone que el comportamiennto de consumo en tiempo de paz y en tiem mpo de guerraa es idéntico en todos los aspectos. Caaso II:
C t = β 1 + β 2Y t + αDt+ ε t
(5.13)
donnde Dt es iguaal a 1 si es tieempo de guerrra y es igual a 0 en tiempo o de paz. Al nottar que E(Ct) es igual a β 1 + β 2 E(Yt) enn tiempo de ppaz y es igual a (β 1+ α) + β 2 E(Yt) en tiemp po de guerra, vemos que ell caso II corressponde a la su uposición de quee el interceptoo de la funcióón de consum mo cambia durrante el tiemppo de guerra perro que el parámetro de la pendiente peermanece iguual. Una prueeba de si un cam mbio así es esstadísticamentte significativ vo es proporciionada por un na prueba de la hipótesis h nulla de que α= 0. Caaso III:
C t = β 1 + β 2 Y t + γ(Dt Y t) + ε t
(5.14)
Nóótese que E(Ct) = β 1 + β 2 E(Y E t) en tiempo o de paz y E(C Ct) = β 1+ (β 2 + γ) E(Yt) en tiem mpo de guerrra, de modo quue el caso III corresponde a la suposició ón de que el intercepto ha permanecido coonstante pero la pendiente ha h cambiado. Una prueba de si este cam mbio es signifficativo es proporcionada p a por una prrueba de la hippótesis nula dee que el coefiiciente de DtY t es 0. Caaso IV:
C t = β 1 + β 2Y t + αDt + γ(Dt Y t) + ε t
(5.15)
Aq quí se permitee que cambienn tanto la penddiente como eel intercepto. Sin S embargo,, note que el modelo m todavíía ha sido exppresado en unaa sola ecuacióón en la que se supone que la l varianza deel término del error es la m misma en añoos de guerra y de d paz. La estiimación por m mínimos cuadrrados producee una estimacióón única dell error estándaar de la" regreesión y de las distribucionees de los estim madores de loss parámetros de d la regresióón.
Enn este caso heemos permitiddo que la varrianza del errror varíe de los l años de gueerra a los años de paz, E1 caso c V corresponde a ejecuutar dos regressiones separad das y obtener estimaciones e separadas de los errores esstándar de la reegresión. El lecctor puede veerificar para ver que los parámetros de regresiónn estimados en el caso IV y en el caso V son equivalenntes (βˆ1′ , + βˆ1 , βˆ1*= βˆ1 + αˆ, βˆ2′ = βˆ2 , βˆ2* = βˆ2 + ŷ ). La eleección del moodelo IV o el modelo m V depeende de si unoo cree que la varrianza del errror es constannte a lo largo de d todos los aaños del mod delo.9 9
Es posible proobar la hipótesis nula de que la varianza v del errorr es constante enntre los años de gueerra y paz o, de manera más genneral, cuando ess razonable deciddir asumir que loos modelos de regrresión en verdadd cambian de un periodo a otro. Véase, por ejem mplo, R.E. Quanddt, "Test of the Hyppothesis That a Linear L Regressionn System Obeys Two T Separate Reggimes", Journal of o the American Stattistical Association n, vol. 55, pp. 3244-330, 1960.
130
PARTE P DOS: Mode elos de regresión de d una sola ecuación
EJEMPLO O 5.3
Diferenciales de salarios
Para evaluarr si las mujerres son discrim minadas en la fuerza labo oral en relacióón con los homb bres, pueden estudiarse loss diferencialess de salarios usando u datos de d corte transveersal obtenidoos de la encueesta actual de población deel Bureau of thhe Census de Estados E Unidoos. En este esttudio de regreesión múltiplee se incluyeroon las siguientes variables: W = tasa salarrial de trabajaadores empleados en dólarres por hora SEX X = 1 si la peersona es mujer, 0 si es hom mbre ED D = años de eeducación AG GE = edad dell empleado NONWH H = 1 si la peersona no es hispana h ni es blanca; 0 de lo contrario HISP P = 1 si la peersona es hisppana; 0 de lo contrario Entre los ressultados de reegresión obtennidos para unaa muestra de 206 empleadoos se encontró lo siguiente ((estadística t entre parénteesis): Ŵ = 10 0.93 - 2.73 3 SEX (22 2.10)
R2 = .068
(-3.86)
F(l 20 4) = 14.9
La variable indicadora reepresentando el sexo del em mpleado fue significativa s e en el nivel del 5%. En vista dee que el salario o medio general por hora es de 9.60 dólarees, la variable indicadora i noos dice que el e salario proomedio de la mujer es 2.773 inferior o 6.8 87 dólares. El difereencial salariall significativoo no desapareece cuando ell modelo de rer gresión se expande para tomar en cueenta la edad y educación del d empleado al igual que la raza o etnicidad de la perrsona: Ŵ= -66.41 - 2.76 S SEX+.99ED + .12 AGE --1.06 NONW WH+.24 HISP P (--3.38)
(-4.61)
(8.54)
R2 = .367
(4.63)
(-1.07)
(.22)
F(5 2000) = 23.2
Nótese que aunque a la eduucación y la ed dad son deterrminantes signnificativos de la tasa salarial,, el diferenciaal entre hombbre y mujer siigue siendo esstadísticamennte significativo. Por últim mo, se observaa que el difereencial es inmuutable en gran medida cuanddo se toma en cuenta c la posibilidad de unna relación noo lineal entre AGE y la taasa salarial, com mo en la siguieente regresiónn:
CAPÍTULO 5: Usando el modelo de regresión múltiple
131
Los términos de edad en esta regresión nos dicen que, siendo iguales otras variables, conforme envejecen los trabajadores, su tasa salarial se incrementa (0.62), pero con una tasa decreciente (-0.0063). Un estudio más profundo de esta relación muestra que la tasa salarial se incrementa hasta que se maximiza a la edad de 49.2 años y luego declina en forma constante de ahí en adelante.10
EJEMPLO 5.4
Certificados de depósito
En este ejemplo se estima una ecuación que predice el volumen total de certificados de depósito (CD, certificates of deposit) negociables poseídos por el público con una base mensual.11 La ecuación es una relación de demanda, y esperaríamos que la variable dependiente estuviera supeditada a la riqueza personal total y a la tasa de interés que reciben los individuos cuando parte de esa riqueza es invertida en un certificado de depósito. Por consiguiente, se eligió la tasa de interés primaria sobre certificados de depósito (RCDP, rate on certificates of deposit) como una variable explicativa. Sin embargo, los certificados de depósito deben competir con otras acciones que producen intereses, como los bonos del tesoro y los bonos corporativos. Por tanto, las tasas de interés sobre bonos del tesoro (RTB, rates on Treasury bills) y bonos corporativos (Rbaa, corporate bonds) también son Variables explicativas; cuando se incrementan estas variables, la demanda total de certificados de depósito debería disminuir. Estas variables de tasas de interés son multiplicadas por el ingreso personal (PI, personal income), esta última variable sirve como una representación para la riqueza personal. La diferencia entre la tasa de interés de los bonos corporativos y la tasa de interés sobre papel comercial de primara calidad (RCP, rate on prime comercial paper) también es una variable explicativa, que representadla diferencia entre las tasas de interés a largo y a corto plazo; cuando esta diferencia se incrementa, una inversión a largo plazo (como un certificado de depósito) se vuelve más atractiva. Finalmente, también se introduce la variable dependiente rezagada para reflejar los rezagos (capítulo 9). Dado que el volumen de certificados de depósito, al igual que muchas otras variables financieras, exhibe un comportamiento estacional definido, se introduce un conjunto de variables indicadoras estacionales para explicar tanto de este comportamiento estacional como sea posible. Las variables estacionales (denominadas 53) toman la forma de variables indicadoras mensuales multiplicadas por el ingreso personal. En vista de que la primera indicadora estacional toma el valor de 1 en enero y 0 en otro mes, la primera variable estacional toma el valor del ingreso personal en enero. Hay un total de 12 variables estacionales en el modelo, y el término constante ha sido quitado para eliminar el problema 10
Uno puede encontrar el 49.2 por sustitución o usando cálculo, resolviendo para encontrar la edad a la que la tasa de cambio de la tasa salarial es igual a cero. 11 Este ejemplo ha sido adaptado de R. Pindyck y S. Roberts, "Optimal Policies for Monetary Control", Annals of Economic and Social Measurement, vol. 3, pp. 207-237, enero de 1974.
132
P PARTE DOS: Mode elos de regresión de una sola ecuacción
dee la colinealid dad. La ecuaciión fue estimaada usando míínimos cuadraados ordinarioos coon los siguienntes resultadoss (la estadísticca t se encuenntra entre parééntesis):
Coeeficientes estaciionales Mes Coeficiente Estadística E t Me es Ene. Feb. Mar. Abr.
.01057 .00977 .00974 .00916
2.886 2.768 2.279 2.607
Ma ayo Jun nio Julio Ago o.
Coeficiente e Estadística t Mes Coeficiente Estadístic ca t .00952 .00971 .00163 .01208
2.656 2.659 3.137 3.265
Sept Oct. Nov. Dic.
.01113 3 .01179 9 .01117 7 .01147 7
2.986 3.167 3.016 3.086
Los coefficientes estaccionales son todos t significativos en el nivel n del 5%, lo que sugiere que q las variacciones estacion nales en el voolumen de los certificados dde depósito sonn bastante im mportantes. Los L resultados sugieren qu ue de agosto a enero son loos meses de appogeo para teener cartera ppública de CD D, mientras quue de febrero a julio las cartteras son relattivamente infferiores.
5.3
EL USO DE E PRUEBAS S t Y F PAR RA HIPÓTES SIS QUE INVO OLUCRAN MÁS M DE UN PARÁMET TRO La distribuciión F puede sser útil para prrobar hipótesis en el conteexto del modeelo de regresiónn múltiple. El ejemplo más importante oocurre cuando deseamos prrobar la hipóteesis nula de qque un solo cooeficiente de regresión es igual a cero (o cualquier otrro número). E En este caso, laa prueba, F se reduce a una prueba t, con la estadística t relevante r calcculada como la l proporción del coeficientte estimado coon el error estáándar estimaado. La prueb ba F tambiénn se puede utilizar u cuanddo deseamos prrobar la hipóteesis nula de que q todos los ccoeficientes de d regresión soon iguales a ceero. Aunque éstas é son las dos situacionnes que ocurrren con mayyor frecuencia enn econometríaa, hay ¡otros casos, c que a ccontinuación se nombran, een los que puedden ser útiles las pruebas t y/o F: 1. Prueb bas conjuntass sobre varios coeficientes de regresión 2. Prueb bas que involuucran las funcciones linealees de los coefficientes de reegresión 3. Prueb bas que involuucran la igualldad de coeficcientes de reggresiones difeerentes
CAPITULO 5: Usando el modelo de regresión múltiple
5.3.1
133
Pruebas conjuntas sobre varios coeficientes de regresión
La prueba F en R2 proporciona una prueba de la hipótesis nula de que todos los coeficientes de regresión son cero, pero hay circunstancias en las que podríamos desear probar la significancia conjunta de un subconjunto de todos los coeficientes de regresión. (Las pruebas F conjuntas para muestras grandes son ejemplos de pruebas Wald, las cuales se describen con más detalle en el capítulo 10.) Se proporciona un caso en la exposición de las variables indicadoras. Recuérdese que en el caso IV en la sección 5.2 incluimos una variable indicadora y un término de interacción indicador para permitir un cambio en la pendiente y el intercepto de la función de consumo. Un segundo uso de la prueba conjunta ocurre cuando uno desea ver si un grupo de variables explica el cambio en la variable dependiente. Esto se aplica con frecuencia para modelos que incluyen conjuntos de variables indicadoras, pero también se aplica en forma mucho más general. Para ver cómo funciona la prueba conjunta, reconsidérese el modelo de regresión múltiple Y = β1+ β2X2 + • • • + βkXk + ε
(5.17)
Llamamos a éste el modelo no restringido (UR, unrestricted model), en vista de que no se han hecho suposiciones acerca de alguno de los coeficientes de regresión. Supóngase que deseamos probar si un subconjunto q de los coeficientes de regresión es conjuntamente igual a cero. Para hacerlo es útil volver a plantear la ecuación (5.17), dividiendo las variables en dos grupos, el primero conteniendo k - q variables (incluyendo la constante) y el segundo incluyendo q variables: Y = β1+ β2X2 + • • • + βk - q X k - q + βk – q
+1
Xk-q
+1
+ • • • + βkXk + ε
(5.18)
Si todos los últimos coeficientes q son iguales a cero, el modelo correcto será el modelo restringido (por los coeficientes cero), denominado como R: Y = β1+ β2X2 + • • • + βk - q X k - q + ε
(5.19)
La hipótesis nula, entonces, es que βk – q + 1 = • • • = β k = 0. La prueba de la hipótesis nula es sencilla. Cuando eliminamos las variables q del modelo y estimamos el modelo restringido en la ecuación (5.19), la suma de cuadrados del error (ESSR, error sum of squares) debe ser mayor que la suma de cuadrados del error asociados con el modelo no restringido ESSUR. (Omitimos el caso especial en el que ESSR = ESSUR.) Esto es equivalente al resultado de que R2 siempre se incrementa cuando se agregan variables adicionales al modelo de regresión. Si la hipótesis nula es correcta, la eliminación de las variables q tendrá poco efecto en el poder explicativo de la ecuación y ESSR será sólo ligeramente mayor que ESSUR. Por supuesto, cualquier prueba de la hipótesis nula debe explicar el número de restricciones; es decir, el número de coeficientes
134
PARTE DOS: Modelos de regresión de una sola ecuacción
establecidoss igual a ceroo y el númeroo de grados de d libertad disponible en el modelo de regresión r no rrestringido. La estad dística de prueeba apropiadaa es:
Aquí el num merador es el incremento en n la suma de cuadrados deel error dividida entre el núm mero de restriccciones de paarámetros impplícito en la hipótesis h nula,, y el denominaador es la sum ma de cuadraddos del error en el modelo o no restringiddo original diviidida entre el número de grados de liberrtad en el modelo no restriingido. Si la hipótesis h nulaa es cierta, la estadística dee prueba dadaa en la ecuacióón (5.20) tendrrá una distribbución F con q grados de libertad en el e numeradorr y N - k en el denominadorr.12 La pruebaa F en el subbconjunto de coeficientes de regresión see lleva a cabo igual que la l prueba F een la ecuacióón de regresióón entera. Elegiimos un nivel de d significanccia, digamos 1 o 5%, y luegoo comparamos la estadística de d prueba con el valor críticco de la distribbución F. Si la l estadística de prueba es mayor m que el vvalor crítico, reechazamos laa hipótesis nulla y concluim mos que el subconjunto de vvariables es estadísticamennte significativo. Como unna regla generaal deben estim marse dos ecuaaciones de regrresión separaddas para apliccar la prueba enn forma correcta. Aplicar la prueba F no es lo missmo que haceer un conjuntto de pruebass t individualess en cada unaa de las variabbles en el subbconjunto. No o es improbabble que todas laas pruebas t serán s insignifi ficantes aunquue la prueba F conjunta seerá significativaa. Estamos proobando si el grupo g de variiables es significativo, no las l variables inddividuales en ese e grupo. (En n el apéndice 55.1 estudiarem mos el problem ma especial de probar p cuándoo están involu ucrados grupoos de variables indicadoras.) La prueba F que se aacaba de desccribir es una ggeneralizaciónn de la pruebaa F en R2 que see expuso en ell capítulo 4. Para P verificar lla forma en que qu se relacionnan las dos, nottamos primerro que la prueeba F en un subconjunto de coeficienttes puede escrib birse en funciión de las R2 de las dos ecuaciones de regresión. Paara hacer la com mparación, reccuerde que R2 = 1 - ESS/TSS, donde (TSS, total sum of squares) es la suma de cuuadrados totaal en la regresiión. Entoncess,
Am mbas ecuacioones de regressión tienen laa misma variaable dependieente y por tannto la misma m suma dde cuadrados total, t de modoo que TSSUR = TSSR. Sustittu12 La distrribución F resultaa porque (bajo laa hipótesis nula) ttanto el numeradoor como el denom minador represenntan sumas de vaariables al cuadraado y están distrribuidos (de mannera independiennte) como ji cuadraada.
CAPÍTULO 5: Usando el modelo de regresión mú últiple
135
yenndo las dos eccuaciones antteriores en la ecuación (5.220), encontram mos que la esttadística de prrueba también puede escriibirse como: (5.21) Ahhora el hecho de que la pruueba F en R2 es un caso especial e pued de verse con faccilidad. Para la l prueba en R2, la hipótesiis nula es quee todas las varriables k - 1 disstintas que la constante, soon conjuntam mente iguales a cero. En este e caso, el núm mero de restrricciones de pparámetros se vuelve q = k - 1. Ademáss, el modelo resstringido es la regresión de Y en una constante. Dado que qu R2 es una medida m de la 2 varriación expliccada alrededorr de la mediaa, R es idéntiicamente ceroo en el caso resstringido. La sustitución s de ambas piezass de informacción en la ecuaación (5.21) muuestra que R 2URR =R2.
EJEMPLO 5.5 5
De emanda de vivie enda
Para estudiar laa demanda de vivienda, se especificó el siguiente moodelo de regreesión: log Q = β 1 + β 2 logg P + β 3 log Y + ε doonde Q = meddida de la canntidad de vivieenda en pies cuuadrados conssumidos por cada una de 3 1220 familias po or año P = preccio por unidad de viviendaa en la localiddad de la famiilia Y = meddida del ingreeso familiar Loos resultados de d la estimacción fueron (loos errores esttándar están entre e paréntessis):
Loos resultados implican unaa elasticidad del d precio de la demanda de d -0.247 y unna elasticidadd del ingreso de 0.96. Am mbas elasticiddades son sig gnificativameente diferentees de cero, enn virtud de quue las razoness t son aproxim madamente 14 y 37 en vallor absoluto. Sin embargo o, es más intteresante pregguntar si la elaasticidad del ingreso i de 0.996 es significaativamente diiferente de 1. La estadística correcta es:
136
PARTE DOS: Mod delos de regresión n de una sola ecua ación
o, en estte caso,
En vista de que el valor ccrítico de la diistribución t een el nivel dell 5% es 1.96, no podemos reechazar la hippótesis nula de d que la elastticidad del inngreso de la ded manda es 1. Ahora supóngase s quue deseamos saber si la demanda d de vivienda v de los l negros difiere de la de loss blancos. Porr tanto se expande el modeelo para permiitir diferentes pendientes e innterceptos. Si suponemos qque D represennta una variabble indicadora igual i a 1 paraa las viviendas de negros y 0 de lo contrrario, el modeelo expandido es: e log Q = β1 + α1D + β2 log P + α2D log P + β3 log Y + α3D log Y + ε Cuando se estimó e este m modelo expanddido, los resuultados fueron n
Las pruebass t en los coefficientes indiv viduales de loos términos quue involucrann a las variabless indicadoras m muestran que el primero es insignificantee (en el nivel ddel 5%), el seggundo apenas insignificantee y el terceroo significativoo. Sin embarggo, deseamos probar la hipóttesis nula de que q los coeficcientes indicaadores son toddos conjuntameente igual a ceero; es decir, α1 = α2 = α3 = 0 Debido a quue nuestra infoormación está dada en funcióón de R2, apliccamos la form mu2 lación dadaa en la ecuacción (5.21). En E función dde esa notación, R UR = .3880, 2 R R = .371, N = 3 120, k = 6 y q = 3. La L estadística F apropiada es: e
Esto excedee el valor crítiico de la distriibución F ya ssea en el niveel del 1% o enn el del 5%, y por tanto recchazamos la hipótesis nulla de demanda de viviennda idéntica parra negros y bllancos. Nótesse que con unn conjunto de datos suficieentemente graande no se reequiere demasiado incremento en R2 para permitirnnos rechazar la hipótesis nulla de igualdadd entre un subbconjunto de coeficientes.
CAPÍTULO 5: 5 Usando el mode elo de regresión múltiple m
5..3.2.
137
Prue ebas que in nvolucran fu unciones lineales de los coeficientes de reg gresión
En n ocasiones se puede desear probar hip pótesis que im mplican combiinaciones lineeales de coefiicientes de reegresión. Supó óngase, por eejemplo, que ha estimado un na función de consumo C = β1 + β2YL + β3YNL + ε, don nde YL represen nta el ingreso lab boral y YNL representa el ingreso no laboral. Podría desear probar laa hipótesis de qu ue la propensió ón marginal a consumir es 1; es decir, β2 + β3 = 1. O podría p desear prrobar si las dos propen nsiones marg ginales a con nsumir son iguales; es deecir, β2 = β3. En esta sub bsección se eestudiará cada uno de esto os dos casos especiales. Co omenzaremoss con el modeelo no restring gido de dos v variables: Yi = β1 + β2X2i + β3X3i + εi Co onsidérese prrimero la hipó ótesis nula dee que los dos coeficientes de regresión so on iguales. Si la hipótesis n nula es ciertaa, estimaremo os un modelo de mínimos cu uadrados restrringido, dado por: Yi = β1 + β2 (X X2i + X3i) + εi Laa prueba F aprropiada está d dada por la ecu uación (5.20) o la ecuación (5.21), ( con el nú úmero de resttricciones q ig gual a l . La misma hipótesis h nulaa puede probarse también usando u una pru ueba t. Para haacer la pruebaa, estime la siiguiente ecuacción: Yi = β1 + β2 (X2i + X3i) + γX3i + εi
(5.22)
Sii la hipótesis nula es verd dadera, γ = 0,, lo cual pued de probarse usando u una prrueba t estánd dar del coeficciente estimad do en X3 en laa ecuación (5.22). Ahora, si se s desea prob bar la hipótessis de que β2 + β3 = 1. El modelo no reestringido es como el anteerior. Para esstimar el mod delo restringiido, tan sólo su ustituimos β3 = 1 - β2 en el modelo no reestringido:
Laa estimación de este últim mo modelo resstringido (con n variable dependiente Yi - X3i y variable independientee X2i – X3i) pro oporciona el iinsumo necesaario para una prrueba F. Una vez más hay una restricció ón, así que q = 1.
138
PA ARTE DOS: Mode elos de regresión de d una sola ecuación
EJEMPLO O 5.6
Demanda de vivienda v
Supóngase que q hemos esttimado el mod delo no restriingido del ejeemplo 5.5 (coon una R2 de 0.380). Deseam mos probar laa hipótesis nuula de que la elasticidad deel ingreso de laa demanda parra la viviendaa de negros ess igual a 1. Baajo la hipótesiis nula β3 + α3 = 1. Sustituyenndo α3 = 1 - β3 en el modelo expandido y replanteándolo r o, obtenemos el modelo resttringido: log Q - Dlo og Y = β1 + α1D + β2logP + α2DlogP +β3(log Y - Dlog Y) + ε La R2 asociaada con el m modelo restrinngido (el cuaal tiene una restricción) r ees 0.3785. De la ecuación (55.21), la estaddística F relevvante está dadda por:
Dado que F es mayor quee el valor crítiico con un nivvel de significcación del 5% %, podemos recchazar la hipóótesis nula.
5.3.3.
P Pruebas que e involucran la igualda ad de e coeficienttes de regre esiones dife erentes
En ocasioness uno no estáá seguro de si un modelo sse aplica a doos conjuntos de d datos diferenntes. Por ejem mplo, en la funnción de conssumo usada enn la exposicióón anterior de laas variables inndicadoras. El caso IV ilustrra la formulación del modello en el que un n modelo de regresión se aplica en años de guerra y un segunddo modelo se applica en años de paz. Difierre del caso V en virtud de que asumimoos que los parám metros de penndiente e interrcepto son disstintos pero taambién que loos errores en am mbas ecuacioones tienen la misma variaanza. (En el capítulo 6 mosstraremos cóm mo probar la suposición dee varianza idééntica.) Para probar si la supoosición de quee hay dos moddelos de regreesión diferentees es correcta, comenzamos c con la hipóteesis nula de quue las regresiiones son idénnticas y vemo os si podemos rechazar estaa hipótesis. Parra hacer la prrueba de Chow w, considérensee los siguientees modelos dee regresión:
En la primeraa ecuación poonemos como subíndices lass variables conn i para indicaar observaciones que van dee 1 a N.13 En la segunda eccuación poneemos sub13 Esta pruueba fue diseña da por Gregory C. Chow en "T Tests of Equalityy between Sets of Coefficients in Two T Linear Regrressions", Econom metrica, vol. 28, pp. 591-605, jullio de 1960. Véaase también Frankllin M. Fisher, ""Tests of Equaliity between Setts of Coefficien ts in Two Line ar Regressions: Ann Expository Notee", Econometrica,, vol. 38, pp. 361 -366, marzo de 1970.
CAPÍTULO 5: Usando el modelo de regresión mú últiple
139
índ dices con j parra las variablees que van de 1 a M. Hemos permitido qu ue todos los coeeficientes de regresión difiieran de la eccuación (5.23aa) a la ecuaciión (5.23b). Suupóngase que estimamos ell modelo impllicado por lass dos ecuacion nes aplicando mínimos cuaadrados ordinaarios a cada ecuación e de m manera individdual. Ya que no se han colocado restriccioones en los paarámetros del modelo, podeemos calcularr la suma de cuadrados c no restringida co omo la suma de las sumass de cuadradoss de los errorees de las ecuacciones individduales, ESSUR = ESS1 + ESS S2. El número de grados dee libertad es lla suma del número n de graados de liberttad en cada reggresión indiviidual; es deciir, (N - k) + (M M - k) = N + M - 2k. Supóngase que la hipóteesis nula es verdadera, v es decir, α1= β1, α2 = β2,..., αk = βk , y Var(εi) = Var(εj). Enntonces, el mod delo de regresiión puede escrribirse como la siguiente ecuuación única: Yi = β1 + β2 X2i + • • • + β k Xki +
εi
(5.24)
don nde el subínddice i corre ahhora de la ob bservación 1 a la observación N + M. Ahhora estimam mos la ecuacióón (5.24) usanndo mínimoss cuadrados ordinarios o y callculamos la suuma de cuadraados del error restringida r ES SSR. Si la hipótesis nula es verrdadera, las restricciones no dañarán el poder exxplicativo dell modelo y ES SSR no será muucho mayor quue ESSUR. Como antes, poddemos realizarr una prueba F para p ver si laa diferencia entre las dos sumas s de cuaadrados de los errores es siggnificativa. Puuesto que hayy N + M - 2kk grados de libbertad en la regresión r no resstringida y hayy k restriccionnes, la estadísstica F apropiaada es:14
Si la estadísticaa F es mayor qque el valor crítico de la diistribución F con k y N + M--2k grados dee libertad, poddemos rechazzar la hipótessis nula. Aquíí el rechazo im mplica que debben estimarsee dos regresiones separaddas: los datos no pueden com mbinarse.
EJEMPLO 5.7 7
De emanda de vivie enda
Su upóngase que creemos que la demanda de d vivienda es modelada meejor por dos ecuuaciones, unaa que describee la demanda de d vivienda de los negros y la otra que describe la dem manda de los blancos. (Esto es equivalentte al caso V en n la sección sobbre variables indicadoras.)) El modelo es:
14 La estadísticca sigue una distrribución F debid do a que cada sum ma de cuadrados del error sigue unaa distribución ji cuadrada c (véase el capítulo 2), ell numerador con k grados de liberrtad y el denominnador con N + M - 2k. Dado quee las dos distribucciones son indepeendientes, el cociiente sigue una disttribución F.
140
PARTE DOS: Mod delos de regresión n de una sola ecua ación
Deseamos probar p la hipóttesis nula de que q el conjuntto de coeficieentes en la ecuuación de dem manda de los nnegros es iguall al conjunto de d coeficientes en la ecuación de demandaa de los blanccos. La hipóteesis nula es qque (conjuntam mente): β1 = γ1
β2 = γ2
β3 = γ3
Para reaalizar la pruebba estimamoss primero el m modelo anterioor y agregam mos la suma de cuadrados c dell error en cadaa una de las eecuaciones. En ncontramos que q ESSUR = 13 640. Ahora suuponemos quee la hipótesis nula n es verdadeera. Entonces, el modelo se reduce r a: lo og Q = β1 + β2 log P + β3 log gY+ε
p todas las familias para f
Cuando estiimamos este modelo restriingido, enconntramos que la l suma de cuuadrados del error e es ESSR = 13 838. Daddo que hay k = 3 restriccionnes y en vista de que N + M - 2k = 3 120 - 6 = 3 114 graados de libertaad, la estadísttica F apropiaada con 3 restriccciones y 3 114 grados de libertad es:
Ya que el vaalor de la estaddística F es maayor que el vaalor crítico de la l distribuciónn F en el nivel del 5%, rechhazamos la hiipótesis nula. Es incorrecto asumir coeeficientes iguaales.
La concclusión del ejeemplo 5.7 no es sorprendeente a la luz de d los resultaddos de la pruebaa anterior en los ejemplos 5.5 y 5.6. Loo que podría parecer p sorpreendente es quee la estadísticaa de prueba aqquí es idénticaa a la estadístiica calculada en el ejemplo 5.5. En el m modelo no resttringido del ejemplo e 5.5 permitimos p q que variaran el intercepto i y todos los coefficientes de peendiente, iguaal que lo hem mos hecho aquí, especificanddo dos ecuacioones de demaanda diferentees. Cuando esstimamos usaando la estim mación de mínimos cuadrados ordinarios, ambos pap rámetros serán idénticos, puesto que ambos modelos son analítticamente equuivalentes. Esstos que perm miten que cam mbie el mismoo parámetro, tienen t el mism mo número de grados g de libertad y tienen n los mismos residuales. La L suma de cuuadrados del error e en la especificación de d dos ecuaciiones es la suuma de los ES SS para cada ecuación. Por tanto, aunquee probar subcconjuntos de coeficientes, en general, no será lo mism mo que probaar la igualdadd de coeficienntes entre ecuuaciones, los dos son idénnticos cuando o uno introduuce variables indicadoras de modo que cambien todoss los parámetrros en el modeelo.
CAPITULO O 5: Usando et mod delo de regresión múltiple
5.4
141
REGRESIÓN N LINEAL PO OR SEGMEN NTOS La mayor partte de los moddelos econom L métricos que hhemos estudiado han sidoo c continuos, conn cambios peqqueños en unna variable quue tienen un efecto e mensu-raable en otra variable. v Estaa estructura fuue modificadaa cuando usam mos variabless inndicadoras paara explicar los l cambios en e la pendiennte o en el inttercepto o enn a ambos. Por coonsiguiente ess razonable extender el annálisis un pasoo más permitiiendo cambioos en la penddiente, con la restricción dde que la línea que se estáá e estimando seaa continua. Un U ejemplo simple s se muuestra en la figura f 5.2. Ell m modelo verdad dero es continnuo, con un roompimiento esstructural. Si estuviéramoss e explicando el consumo com mo una funciión del ingresso, por ejempplo, el rompi-m miento estructtural podría ocurrir en algú ún momento durante d la Seg gunda Guerraa M Mundial (o po odría haber doos rompimienttos, uno al priincipio y uno al final). Nó-teese que no hayy una disconttinuidad o cam mbio en el nivvel de consum mo de un año a o Este modeelo lineal por ssegmentos con otro. nsiste en dos ssegmentos de línea l recta. Los modeelos lineales por p segmentoos son casos eespeciales dee un conjuntoo m mucho mayor de modelos o relaciones llaamado funcionnes en tiras. Esstas funcioness tiienen piezas distintas, d peroo la curva quee representa a cada pieza ess una funciónn c continua y no necesariamennte una línea recta. En un caso típico, se s escoge quee laa ranura sea un u polinomio del tercer graado y el proceedimiento garrantiza que laa p primera y seguunda derivadaas serán contin nuas.15 Para estim mar el modelo dado en la fig gura 5.2, conssidérese la sig guiente expresión: s C t = β 1 + β 2 Y t + β 3 (Y t – Y t 0 )D t + ε t
(5.26)
donde d C t = co onsumo Yt = ing greso Y t 0 = in ngreso en el añño en que ocuurre el rompim miento estructural
Para P los años anteriores e iincluyendo ell rompimientoo, Dt = 0, de modo m que: E(Ct) = β 1 + β 2 Y t
(5.27)
S embargo, después del rompimiento, Sin r Dt = 1, de modo que:
(5.28) 15 Véase D.J.. Poirier, The Econometrics of Strucctural Change (A Amsterdam: North--Holland, 1976), o D. Suits, A. Masoon y L. Chan, "Sppline Functions Fitted D F by Standardd Regression Metthods", Review off E Economics and Sta atistics, vol. LX, pp. p 132-139, febreero de 1978.
142
PA ARTE DOS: Mode elos de regresión de d una sola ecuació ón
Figura 5.2 Modelo de regresión r lineal por se egmentos.
Antes del rom A mpimiento la línea tiene unaa pendiente β2, pero despuéés la pendientee c cambia a β2 + β3 (y tambiénn cambia el inntercepto). Obbserve, sin em mbargo, que noo h discontin hay nuidad ya quee,
Nótese N tambi én que cuanddo β3 = 0, la eccuación de coonsumo se red duce a un soloo ^ segmento s de línea recta, dde modo que una prueba t de β3 = 0 prooporciona unaa prueba p simplee para el cam mbio estructur al. ¿Qué pas aría si hubierra dos rompim mientos estruccturales, ocurrriendo en los momentos m t 0 y t 1? Entonce s, el modelo apropiado a seríía:
ddonde Yt1 reppresenta el inggreso en el quue ocurre un segundo rom mpimiento est tructural y
L ecuacionnes de cada unno de los tres segmentos dee línea son enntonces: Las
5.4.1
M Método de regresión co on cambio estructurall
P Pueden haberr situaciones en las que yaa no es apropiiado asumir que q el modeloo d regresión ess continuo. Enn el modelo de regresión con cambio estrucctural más gede
CAPÍTULO 5: Usando el modelo de regresión múltiple
143
neral, se supone que la varianza del término del error es la misma a lo largo del periodo que se está estudiando pero tanto el intercepto como la pendiente pueden cambiar en el punto del rompimiento estructural. Cuando se conoce el punto del rompimiento, el modelo de regresión puede escribirse como: C t = β1 + β2Y t + β3D t + β4D t Y t + ε t
(5.29)
el cual es el modelo que fue presentado originalmente como el caso IV en la sección 5.2 sobre el uso de variables indicadoras. Cuando no se conoce el punto de rompimiento, éste al igual que los parámetros de regresión pueden estimarse usando el método de máxima verosimilitud.16 Al suponer que la varianza del error es igual para el periodo entero en estudio, implica estimar la ecuación (5.29) para diferentes valores del punto de rompimiento estructural t0. Elegimos como el punto de rompimiento el valor de t0 que minimiza la suma de cuadrados de residuales de la regresión (o de manera alternativa que maximiza R2).
5.5
EL MODELO DE REGRESIÓN MÚLTIPLE CON VARIABLES EXPLICATIVAS ESTOCÁSTICAS
Hasta este punto hemos asumido que las variables independientes en el modelo de regresión múltiple eran fijas, es decir, no estocásticas. En ocasiones, sin embargo (como cuando el investigador obtiene muestras de valores tanto para X como para Y), será más apropiado asumir que las X son extraídas al azar de una distribución de probabilidad. Por suerte, podemos hacer esto y aún mantener la mayor parte de los resultados anteriores. Haremos las siguientes suposiciones: 1. La distribución de cada una de las variables explicativas es independiente de los parámetros de regresión verdaderos. 2. Cada una de las variables explicativas está distribuida en forma independiente de los errores en el modelo. Todas las propiedades básicas de los estimadores de mínimos cuadrados continúan manteniéndose. Sin embargo, ahora pensamos en los parámetros de regresión como si se hubieran estimado en forma condicional a los valores dados de las X. 16 El método funciona maximizando la función de verosimilitud usual (véase el apéndice 2.2) y buscando todos los puntos de rompimiento posibles. Para mayores detalles, véase S.M. Goldfeld y R.E. Quandt, "The Estimation of Structural Shifts by Switching Regressions", Annals of Economics and Social Measurement, vol. 2, pp. 475-485, octubre de 1973. Una aplicación interesante que trata de los mercados en desequilibrio se expone en R.C. Fair y D.M. Jaffee, "Methods of Estimation for Markets in Disequilibrium", Econometrica, vol. 40, pp. 497-514, 1972.
144
PARTE DOS: Modelos de regresión de una sola ecuación
Si examinamos las propiedades incondicionales del estimador OLS, la falta de sesgo ya no está garantizada. Sin embargo, afortunadamente todavía es posible mostrar que el OLS es consistente y eficiente para muestras grandes (asintóticamente). Por último, también es cierto que los estimadores de mínimos cuadrados son los estimadores de máxima verosimilitud de los parámetros de regresión verdaderos. Debido a los resultados precedentes concernientes a las variables explicativas estocásticas (y al hecho de que los estimadores a menudo son sesgados por otras razones), los econometristas tienden a enfocarse en propiedades de las muestras grandes de los estimadores como la consistencia. En general, haremos lo mismo, en especial en el capítulo 12, donde se exponen modelos de ecuación simultánea.
APÉNDICE 5.1 Pruebas que involucran coeficientes de variable indicadora
En el análisis de regresión múltiple, los coeficientes en cada variable indicadora miden el impacto diferencial entre la categoría incluida (recibiendo un valor de 1) y la categoría o indicadora que se ha eliminado de la regresión. Como resultado, la prueba t evalúa la hipótesis nula de que la pertenencia a las categorías incluidas y excluidas tendrá un impacto idéntico. Sin embargo, cuando hay dos o más conjuntos de variables indicadoras, los resultados de la regresión se vuelven más difíciles de interpretar y probar. Como un ejemplo, supóngase que estamos prediciendo los gastos totales en vivienda como una función del ingreso y el número de hijos, cada uno de los cuales se ha clasificado en diversas categorías. Para ser específicos, se tiene que: H = Gasto anual en vivienda 1 si el ingreso ≤ 10000 dólares (ingreso bajo) I1 I2
I3 Ct
0 de lo contrario 1
si el ingreso > 10000 dólares pero ≤ 20000 dólares (ingreso medio)
0 de lo contrario 1
si el ingreso > 20000 dólares (ingreso alto)
0 de lo contrario 1
si no tiene hijos
0 de lo contrario
C2
1 si tiene 1 o 2 hijos 0 de lo contrario
C3
1 si tiene más de 2 hijos 0 de lo contrario
CAPÍTUL LO 5: Usando el moodelo de regresión múltiple m
145
Cu uando eliminaamos la prim mera variable indicadora i enn cada categorría pero incluuimos un térm mino constantte, la especifiicación del m modelo es:
Coon esta especcificación β2 mide los gasstos diferenciaales en viviennda para un ind dividuo sin hijos y un ingrreso medio en n relación conn un individuoo sin hijos y coon un ingreso bajo. La pruueba t evalúa la hipótesis nnula de que loos gastos en viv vienda son igguales para am mbos grupos. La comparacción se hace por p tanto en rellación con to odas las categgorías represeentadas por iindicadoras que q han sido eliiminadas del modelo. m Con ffrecuencia estta comparacióón no será útil. Un análisis máás constructivvo podría invvolucrar la medición de loos gastos difeerenciales en vivvienda de un individuo coon ingreso meedio en relaciión con un in ndividuo con inggreso bajo, los cuales tieneen ambos el mismo m númeroo de hijos que el promedio dee todos los inddividuos en laa muestra. Para ver cóómo puede addaptarse la reg gresión múltiiple para mannejar esta situaación, considdérense las siiguientes variiables y la esspecificación del modelo revvisado:
Paara todas las co ombinacioness posibles de características c familiares el valor esperaddo de la variaable dependieente es como sigue: Ca ategoría
Valor esperado E(H)
Ing greso bajo, 0 hijo os
a + b1+ C1
Ing greso medio, 0 hijos Ing greso alto, 0 hijo os Ing greso bajo, 1 o 2 hijos Ing greso medio, 1 o 2 hijos Ing greso alto, 1 o 2 hijos Ing greso bajo, más de 2 hijos Ing greso medio, má ás de 2 hijos Ing greso alto, más de d 2 hijos
a + b2 + C1 a - b1 – b2 + C1 a + b1 + C2 a + b2 + C2 a - b1 - b2 + C2 a + b 1 - C1 - C2 a + b2 - C1 - C2 a - b1 - b2 + C1 - C2
Sii luego sumam mos las nueve categorías, encontramos qque el valor essperado geneeral (el efecto promedio) ess igual a a, el término consstante. Si sum mamos toda
146
PARTE DOS: Modelos de regresión de una sola eccuación
las categoorías tomadas en combinacciones de tres (por ejemploo, 0 hijos, 1 o 2 hijos, máss de 2 hijos), podemos p encontrar el efectoo promedio paara cada categooría o gruppo. La intterpretación dde los coeficieentes es senciilla. Por ejem mplo, b1 mide la extensión con la qque los inddividuos conn ingresos bajos gastaan diferenciaalmente en vivvienda en relacción con el indiividuo promediio en la muestrra. c1 mide el gasto g diferenciial asociado con no tener hij ijos. Para indivviduos sin hijoos y con inggresos bajos, el diferenciaal es b1 + c1. La prueba t asociada coon b1 entoncees proporcionaa una prueba de d la hipótesiss nula de que el gasto de loos individuos de ingresos bajos es diferrente del prom medio, mientraas que la pruebba t asociadaa con c1 pruebaa si las familias sin hijos gaastan en form ma diferente del d promedio. Hay, por supuesto,, una relación n estrecha entrre los coeficieentes en amboos modelos. En particularr, β2
=
b2 - b1
γ2 = c 2 – c 1
β3
= - 2 b1 -
γ3 =
- 2 c1 -
b2
c2
a = a + b1 +
c1
¿Cuál esp pecificación de la forma para variablles indicadorras deberíamoos elegir? Laa respuesta deepende de cuál hipótesis nula n nos gustaaría probar. En E muchos casos c las hipóótesis nulas associadas con la especificacción alternativva son más apropiadas que aquellass que surgenn en forma directa de la especificaación usual dee variable inddicadora. De hhecho, la espeecificación máás nueva pueede ser útil enn especial cuuando hay connjuntos granddes de variables indicadoraas como pronnosticadores, debido a quee hace que suu interpretacióón sea sencillla. Sin embaargo, cuando uno u o más dee los pronostiicadores es unna variable continua, c la interpretación i n se vuelve más m difícil y la ventaja del d procedim miento es limittada. EJERCIC CIOS 5.1 Dado el e siguiente moodelo: l Y = β1 + β2 log X 2 + β3 log X 3 + ε log demuestre que los coeficiientes de regressión estimadoss son las elasticidades asociaddas con Y y cad da una de las X y que estas elaasticidades son constantes a loo largo de la línea de regresióón. 5.2 Deseam mos analizar laa demanda de vivienda estudiaantil en el área del d campus de Ann A Arbor a paartir de los datoos de renta prop porcionados en el cuadro 2.1. Como una meddida de la demaanda para los servicios de unaa unidad, consttruya las variab bles RENT PE ER y ROOM PE ER, definidas coomo sigue: RE ENT PER = RE ENT (por unidaad)/NO (númeroo de personas enn la unidad). (R RENT PER se denota d como RP PP en el capítullo 2.) ROOM PER P = RM (hab bitaciones)/NO O (número de personas). Lueggo se estiman loos modelos:
CAPITULO 5: Usando el modelo de regresión múltiple
147
(En el modelo II, β2 está restringida a ser cero.) a) En el modelo I, pruebe la hipótesis de que β3 = 0 (en oposición a que β3 > O). ¿Esto es lo que esperaría? b) En el modelo I, pruebe la hipótesis de que β4 = 0 (en oposición a que β4 < 0). ¿Esto es lo que esperaría? c) En el modelo I, use una prueba t para probar la hipótesis de que β2 = 0. Ahora, usando la suma de cuadrados residuales de los estimados de los modelos I y II, haga una prueba F para probar la hipótesis de que β2 = 0. Deberá recordar que si X = (ESSII –ESS1)/(ESS1/(32-4)), X sigue una distribución F con (1,28) grados de libertad. ¿Cómo se relacionan las dos pruebas? 5.3 Se sugiere que los hombres y las mujeres pueden no tener la misma apreciación por la espaciosidad (medida por ROOM PER) o por la proximidad al campus (medida por DIST). Estime el modelo III. III
RBNT PER = β1 + β2(SEX) + β3(ROOM PER) + β4(DIST) + β5[(ROOMPER)(SEX)] + β6[(DIST)(SEX)] + ε a) Pruebe por separado la hipótesis de que β5 = 0 y que β6 = 0. b) Use una prueba F para probar la hipótesis conjunta de que β5 = β6 = 0. c) Calcule R2 para los modelos I, II y III.
5.4 Los resultados del ejercicio 5.3 sugieren que la demanda de vivienda de hombres y mujeres es fundamentalmente diferente. Para ver la diferencia, haga lo siguiente. Divida los datos en dos grupos de acuerdo con el sexo y estime los modelos: IV
RENT PER = αo + α1(ROOM PER) + α2(DIST) + ε
sólo hombres
V
RENT PER = γo + γ1 (ROOM PER) + γ2(DIST) + ε
sólo mujeres
a) Pruebe por separado las hipótesis de que γ1 = 0 y que γ2 = 0. b) Pruebe la hipótesis conjunta de que γ1 = γ2 = 0. 5.5 ¿Cómo puede recuperar las estimaciones de γ0, γ1, γ2 (ejercicio 5.4) a partir de las estimaciones de β1, β2, β3, β4, β5 y β6 en el modelo III? 5.6 ¿Cómo interpretaría (desde el punto de vista económico) los coeficientes γ1 y γ2 (del ejercicio 5.5)? ¿Por qué podría ser positivo γ2? 5.7 En el modelo I (ejercicio 5.2), calcule los coeficientes estandarizados asociados con cada variable explicativa. 5.8 En este problema se estudiará la variación de series de tiempo en los gastos de consumo en Estados Unidos durante el periodo de 1977 (primer trimestre) a 1988 (primer trimestre). Un modelo macroeconómico estándar explica el consumo como una función general del ingreso disponible y los valores de consumo previos. Sin embargo, algunos puntos de vista opuestos son los siguientes: 1. El consumo es un proceso interestelar, del cual los economistas saben muy poco, y por tanto es mejor explicar el consumo por una actividad interestelar representativa, como las observaciones de OVNIS.
148
PA ARTE DOS: Modelos de regresión de d una sola ecuació ón
2. Los caambios en el coonsumo son unna actividad inteerestelar, de modo m que el connsumo debería d explicaarse por los valoores de consum mo previos, al igual que por laas observaaciones de OVN NIS. 3. Cuando o las personas deciden cuántoo gastar, sólo consideran c su ingreso i actual, y por tannto el consumoo debería expliccarse sólo por eel ingreso disponible. 4. Las personas revisan sus planes de consumo por medio m de un prroceso aleatorioo, de moddo que el conssumo debería ser igual al connsumo pasado más m una perturrbación. 5. El connsumo es una ffunción tanto del consumo pasado como del ingreso, de d modo que q un incremeento de un dólaar en el ingresoo tiene el mism mo efecto que un u increm mento de un dóllar en el consuumo pasado. Use la sigguiente ecuacióón de regresiónn para investiggar estos puntos de vista:
donde Yt = connsumo estadouunidense en el momento t X2t = inggreso personal disponible estaadounidense enn el momento t X3t = connsumo estadouunidense en el momento t - 1 X4t = obsservaciones de OVNIS en Esttados Unidos een el momento t εt = térm mino de error a) Estim me la ecuación aanterior, usanddo los datos dell ejemplo 4.3 y su propia estimacióón de observaciones de OVNIS. b) Pruebbe las siguientees hipótesis usaando las pruebaas t apropiadass. i. β4 = 0 (modelo tradicional) ii. β2 = 0 (2) c) Pruebe las siguientes hipótesis usaando las pruebaas F apropiadass. i. β2 = β3 = 0 (Opinión 1) ii. β3 = β4 = 0 (Opinión 3) iii. β3 = 1, β2 = β4 = 0 (Opinión 4) iv. β4 = 0, β2 = β3 (Opinión 5) v. β2 = β3 = β4 = 0 (Ningún podder explicativo de alguna de las l X) Indiquue el modelo rrestringido aproopiado para caada una de estaas hipótesis. 5..9 Usted pronto será entrevisttado para el puesto p de anaalista político en una de laas estaciones de televisión t localles. En vista dee que todas lass estaciones de televisión estáán dedicando unaa gran cantidadd de tiempo al aire a a la cobertuura de las eleccciones, su conoocimiento mund dano no será suuficiente para asegurarle el puuesto. En conseccuencia, deberíía considerar cóm mo usar un moddelo de regresióón para respalddar sus opinionnes respecto a laas elecciones legiislativas de 19996. Para llenaar tiempo al airre, necesitará tres t modelos. T Todos los moddelos tratarán de d explicar difereencias entre esttados en el porccentaje de votoos recibidos po or los candidatoos demócratas en ntre todos los vvotos emitidos para candidatoos a diputados en cada estadoo. Por consiguiennte, la variable dependiente tiiene 50 observaciones, una paara cada estadoo. Tiene cuatro tiipos de variables explicativass: 1. La tasaa de desempleoo en cada estad do 2. Variabbles indicadorass regionales po or si el estado está en el nordeste, sur, medio oeste u oeste
CAPÍTULO 5: Usando el modelo de regresión múltiple
149
3. Una variable indicadora por si Bill Clinton apareció en ese estado para hacer campaña por los candidatos a la legislatura 4. Términos de interacción entre las indicadoras regionales y la indicadora de Clinton Sus tres modelos difieren sólo en las variables explicativas que contienen: El modelo I contiene las variables (1) y (2). El modelo II contiene las variables (1), (2) y (3). El modelo III contiene las variables (1) y (4). a) Escriba cada modelo en una ecuación de regresión. Esto puede hacerse en más de una forma; escoja cualquier formulación que prefiera. Asegúrese de definir toda la notación y describa cómo discernirán las variables explicativas los efectos del interés, interpretando los efectos que se van a estimar. b) Usando las variables en estos modelos, indique cómo probaría las siguientes hipótesis. Si propone una prueba F, proporcione las ecuaciones de regresión restringida y no restringida. i. La aparición de Clinton no importa. ii. El regionalismo es insignificante: el país entero votó en forma uniforme, sin diferencias regionales. iii. El nordeste y el medio oeste (el "cinturón congelado") votaron en forma uniforme. iv. El cinturón congelado votó en forma uniforme, el "cinturón soleado" (el sur y el oeste) votó en forma uniforme, pero el cinturón congelado y el cinturón soleado combinados no necesariamente votaron en forma uniforme. v. La aparición de Clinton tuvo el mismo efecto en todas las regiones.
CAPÍTULO
6
CORRELACIÓN SERIAL Y HETEROCEDASTICIDAD
Ahora que se ha completado el estudio del modelo de regresión lineal clásico, revisaremos cada una de las suposiciones del modelo con el objetivo de determinar aquellas situaciones en las que se violan estas suposiciones y encontrar los procedimientos de estimación para mejorar el procedimiento de mínimos cuadrados ordinarios en el momento que dichas violaciones ocurren. Las suposiciones son las siguientes: 1. El modelo se especifica como: Yi = β1 + β2X2i + β3X3i + …+ βkXki + εi
(6.1)
2. Las X son fijas y no existe relación lineal entre dos o más de las variables independientes. 3. Los errores están distribuidos de manera independiente de una pobla-ción normal con valor esperado 0 y varianza constante. En el capítulo 7, nos enfocaremos en la suposición de que el modelo especificado en la ecuación (6.1) es correcto. En la suposición dos se escribe el problema de la colinealidad que ya se detalló en el capítulo 4. La tercera suposición consiste de varias partes importantes. Aun sin normalidad, es posible demostrar que los estimados de regresión de mínimos cuadrados de los parámetros verdaderos son insesgados y consistentes. Sin embargo, sin esta normalidad no se pueden realizar pruebas estadísticas usando las fórmulas estándar para las distribuciones t y F. Por fortuna, las pruebas estadísticas estándar son aproximadamente correctas para tamaños de muestra grandes. 150
CAPÍTULO 6: Correlación serial y heterocedasticidad
151
Aunque hay métodos estadísticos que le permiten a uno probar la normalidad (véase el capítulo 2), estas pruebas estadísticas, generalmente, no se usan.1 Una razón de esto es que las pruebas no son potentes desde el punto de vista estadístico, en el sentido de que a menudo podemos fallar en rechazar la hipótesis nula de normalidad, aun cuando la distribución del error no es normal. Además, si decidimos que la suposición de normalidad es inválida, los procedimientos de estimación y pruebas estadísticas alternativos serían más complicados que aquellos asociados con el modelo de regresión clásico normal. La hipótesis de que el término del error tiene un valor esperado de cero no es importante; pero si el valor esperado no es cero, los parámetros de pendiente de la regresión estimada permanecerán inmutables mientras el intercepto absorverá el efecto. Con esto será imposible diferenciar entre el intercepto verdadero y el valor esperado no cero en el término del error, aunque en la mayor parte de las aplicaciones econométricas el término de intercepto no es de interés. Por último, la suposición de independencia de los errores se considerará en la sección 6.2, y en la sección 6.1 nos centraremos en que los errores tienen varianza constante.
6.1
HETEROCEDASTICIDAD En el modelado econométrico hay ocasiones en que la suposición de varianza del error constante u homocedasticidad, no es razonable. Por ejemplo, si examinamos un corte transversal de empresas en una industria, los términos del error asociados con empresas muy grandes podrían tener varianzas mayores que aquellos términos de error asociados con empresas más pequeñas; es decir, las ventas de empresas más grandes podrían ser más volátiles que las ventas de empresas más pequeñas. Otro ejemplo es el estudio de un corte transversal del ingreso y los gastos familiares.2 Aquí se esperaría que los individuos de ingresos bajos gastaran a un ritmo constante, mientras que los patrones de gasto de las familias de ingresos altos sean relativamente volátiles. Esto sugiere que en un modelo en el que los gastos son la variable dependiente, las varianzas del error asociadas con las familias de ingresos altos sean mayores que sus contrapartes de ingresos bajos. La heterocedasticidad o varianzas desiguales, por lo general, no ocurre en estudios de series de tiempo debido a que es probable que los cambios en la variable dependiente y los cambios en uno o más de las variables independientes sean del mismo orden de magnitud.3 Por ejemplo, en los ejemplos de función de consumo agregado en el capítulo 3, tanto el consumo como el ingreso disponible crecen más o menos en la misma proporción en el tiempo. 1
Un procedimiento de una prueba directa es el siguiente. Calcule los residuales estandarizados de una regresión múltiple dividiendo cada residual entre el error estándar de la regresión. Si los errores son normales, la distribución de residuales estandarizados sería normal unitaria. Véase D.A. Belsley, E. Kuh y R.E. Welsch, Regression Diagnostics (Nueva York: Wiley, 1980), pp. 16-18. 2 Este ejemplo se estudia en detalle en S.J. Prais y H.S. Houthakker, The Analysis of Family Budgets (Cambridge: Cambridge University Press, 1955). 3 Por supuesto las varianzas pueden disminuir con el tiempo conforme mejoran las técnicas de medición.
152
PARTE DOS: Mo odelos de regresión de una sola ecuación
Para un n modelo conn perturbacionnes de error hheterocedásticcas aceptarem mos que cada téérmino del errror εi está distribuido en foorma normal con varianza σ 2i, donde la varianza Var(εεi) = E(ε 2i) = σ 2i no es constante entree observacionnes. Cuando esttá presente laa heterocedastticidad, la esttimación de mínimos m cuaddrados ordinarrios da más ponderación p a las observacciones con vaarianzas de errror grandes quee en aquellas con varianzas de error meenores. La ponnderación ocuurre debido a que q es probabble que la sum ma de residuuales cuadradoos asociada con c términos dee error de varrianza grande sea consideraablemente maayor que la suuma de residualees cuadrados asociada con errores de varrianza baja. La L línea de reggresión se ajuustará para miinimizar la suuma total de residuales cu uadrados, y esto e puede lograarse mejor gaarantizando un u ajuste muyy bueno en laa porción de los datos de vaarianza grandee. Debido a esta e ponderaciión implícita, los estimadoores de parámettros de mínim mos cuadradoss ordinarios son insesgados y consistenttes, pero no sonn eficientes; ess decir, las vaarianzas de loss parámetros estimados e no son s las varianzaas mínimas. A Además, las varianzas v estim madas de los parámetros estie mados seráán estimadorees sesgados de la varianza verdadera dee los parámettros estimados. El hechho de que los estimadores de d parámetross sean insesgaados puede veerse en el contexxto del modeloo de dos variaables con las variables medid das como desvviaciones alreededor de sus medias. Entoonces,
Observe quue las varianzas de los térrminos del errror no desem mpeñan ninguuna función enn la prueba dee que los estim madores de m mínimos cuad drados son inssesgados. La difiicultad con laas varianzas de d los parámettros estimados también puede presentarsee en el caso dde dos variablees. Entonces, a partir de loo estudiado enn el capítulo 3, sabemos quee: (66.2) La varianzza del error see extrajo del signo de sum matoria durannte la derivación debido a qu ue se asumió que la varianzza era constannte. Sin embaargo, cuando está e presente la heterocedastiicidad, la variianza no es coonstante y la derivación noo se cumple. Ell resultado ess que la fórm mula estándar [ecuación (6.2)] conducirrá a estimados sesgados de las l varianzas de cada uno de los parám metros estimaddos. Si se usan estos estimaddos parciales, las pruebas eestadísticas y los intervaloss de confianza serán s incorrecctos.
CAPÍTULO 6: 6 Correlación serial y heterocedasticidad
153
La fórmula para p el error eestándar correecto cuando los l errores sonn heterocedássticos puede derivarse d en una forma siimilar a la deerivación en el e caso del modelo de regresión lineal báásico. Las varianzas de los estimadores de d parámetross están dadas por4:
Hallbert White ha h mostrado que q un estimaador consistennte de las varrianzas correcctas puede ob btenerse susttituyendo ε^ 2i, el cuadrado de cada resiidual de la reggresión, por σ 2i en esta fórm mula.5 Por último, es importantee tener en cueenta que la inneficiencia dell estimador de mínimos m cuad drados surge aun si las varrianzas de los estimados dee parámetro sonn determinadaas en forma coorrecta. En este caso, las varianzas v seráán mayores quee las varianzaas asociadas ccon un estimaador insesgadoo lineal alternnativo, esto se expone e a conttinuación.
6.1 1.1
Correcciones pa ara la heterrocedasticid dad
Exp ponemos la téécnica de estim mación apropiada (la cual ees insesgada, consistente y eficiente) e en dos d casos coonceptualmentte separados. Cada caso se s basa, en niveles diferentees, en informaación previa y muestral, peero ambos im mplican proceddimientos de estimación e reelativamente simples. s Varianzas conocidas c Prrimero asumim mos que se ddispone de sufficiente conoccimiento prevvio para conoocer los valorres de cada una u de las varianzas del erro or. En el trab bajo economéétrico, el caso o de varianzaas conocidas,, ocurre en form ma ocasional pero es importante conoccer cómo haccer la correccción para la heteerocedasticidaad. La técnica apropiada, llaamada mínimos os cuadrados ponderados, p es un u caso especial de una ttécnica econo ométrica más general conoocida como mín nimos cuadrad dos generalizaados. Una deriivación matriccial del proced dimiento de mínnimos cuadraados generalizzados se muesstra en el apéndice 6.1. El procedim miento de estim mación de míínimos cuadraados ponderaddos, el cual pueede derivarse de la funciónn de máxima verosimilitudd, se ilustra mejor m en el modelo de dos variables. El estimador ap propiado se oobtiene minim mizando la exp presión:
4
La derivación resulta en formaa directa de la derrivación dada en eel resultado 2 dell apéndice 3.1.
En esa e derivación, Var( V βˆ) = ∑c2i E (ε 2i ). Sustituir ci = xt /∑x 2i da el resultado. 5 H. White, "A Heteroskedasticit H ty-Consistent Cov variance Matrix Estimator E and a Direct D Test for Heteeroskedasticity", Econometrica, E vool. 48, pp. 817-838, mayo de 1980.
154
PARTE DOS: Modelos de regresión n de una sola ecuación
^
α^ y β son, por supuestoo, los estimados de parám metros deseaddos. Cuando las variables orriginales se esscriben en forrma de desviaciones, el objetivo originall se modifica paara minimizarr la expresión n:6
Resolvienddo para los estimados de paarámetros de m mínimos cuaddrados (como en el capítulo 1),, encontramos que:
De este modo, el procediimiento de esttimación que se desea se lo ogra ponderanndo los datos orriginales y lueego, en el mod delo transform mado, se realiiza la estimación de mínimoss cuadrados oordinarios. Para ussar mínimos cuadrados c pon nderados en eel caso de reggresión múltipple, redefinimoss las variabless en el modelo o de regresiónn original de la l ecuación (66.1) como:
En lugar deel modelo lineal original [eccuación (6.1)] usamos el mo odelo transforrmado:
o, de maneera equivalennte, Nótese quee el término deel error transfformado es hoomocedástico (tiene varianzza constante):
6 Para ser correcta, la form ma de desviacioness debe obtenerse transformando t el modelo (dividienndo entre σ i ) y lueggo sustrayendo laas medias de la variable. v
CAPÍTULO 6: Correlación serrial y heterocedastticidad
155
¿Por qué este procedimiento p produce estim madores de parámetros p efi ficientes? La razzón es que el modelo transsformado por construcción satisface toddas las suposicciones del mod delo de regressión lineal cláásico (que inccluye la variannza del error connstante). Por consiguiennte sabemos (de acuerddo con el teorema t de Gaauss-Markov)) que los estim madores debeen ser eficienttes. Este análisis se limita poorque las variaanzas del errorr individualess no siempre se conocen. De hecho, la infformación neccesaria para lla aplicación de mínimos cuaadrados pondderados es la m magnitud relattiva de las varrianzas del errror. En vista de que hay mucchas situacionnes en las quee no se conocee la magnitudd relativa de lass varianzas deel error, es im mportante connsiderar casos especiales enn los que se disspone de infoormación mueestral suficiennte para hacerr suposicioness razonables de las varianzass del error verrdaderas. Las varianzzas del error varían en forrma directa coon una variab ble indepen-
dieente Una possibilidad es laa existencia de d una relacióón entre las vaarianzas del errror y los valorres de una de las variables explicativas e en el modelo de d regresión. Dee manera espeecífica, suponnga que:
do onde C es una constante no ccero y X2i es una u observacióón en una de las l variables ind dependientes en el modeloo de regresiónn lineal generral:
En ntonces, se prrocede como si las varianzzas fueran connocidas. Paraa hacer esto, reddefinimos las variables en lla ecuación an nterior de la ssiguiente maneera (el valor de la constante C no afecta al procedimiento de mínim mos cuadradoos ponderadoos):
Laa ecuación de regresión traansformada ess:
Po odemos ver que q el términoo del error trransformado es homocedáástico, dado qu ue:
Enn este caso paarticular el térm mino de interrcepto originaal se ha converrtido en un térrmino variable, mientras quue el parámetrro de pendientte asociado coon la varia-
156
PARTE P DOS: Mod delos de regresión de una sola ecuacción
ble X2 se haa convertido en el nuevo término de inntercepto. Loos estimados de d regresión dee mínimos cuuadrados ordiinarios de loss parámetros en la ecuacióón (6.4) produccirán los estim mados de parrámetros aproopiados (eficientes), en vissta de que los errores e en la eecuación transsformada sonn homocedástticos. EJEMPLO O 6.1
Gastos de viv vienda
En este ejem mplo considerramos un estuudio de corte ttransversal dee los gastos dee vivienda anuuales e ingressos anuales de d cuatro gruppos de familiaas:
Se plantea la l hipótesis de que el modelo de gastos de vivienda es: Yi = α + βXi + εi donde Yi sonn los gastos dee vivienda y Xi es el ingresso. Una regressión de mínim mos cuadrados ordinarios prodduce los siguieentes estimadoos de regresióón (la estadística t aparece en ntre paréntesiss):
Un exam men gráfico de los datos y el conocim miento de estu udios de gasttos anteriores suugiere que esstá presente laa heterocedassticidad en el modelo. El modeelo de gastos de vivienda puede p estimarsse con una corrección para la heterocedasticidad. El modelo transformado es:
y los resultaados de regressión son:
CAPÍTULO O 6: Correlación se erial y heterocedassticidad
157
Nótese N que el estimado revvisado del coeeficiente de rregresión asociado con el in ngreso es 0.2449, éste es un incremento soobre el estimaado de mínimoos cuadrados orrdinarios. Com mo se esperaba, el uso correecto de las esttadísticas t y F todavía nos peermite concluuir que todos llos coeficientes de regresióón son significativos en el niivel del 5%. Nótese que lla medida de R2 asociada con el proceedimiento de mínimos m cuadrrados ponderrados es menor que la R2 asociada conn el procedimiento m no pond derado. La dissminución en R2 no debe toomarse como un u indicio de quue la correccción de la hetterocedasticiddad fue incorrrecta, ya quee el procedimiento m de mínnimos cuadraddos ponderaddos implica ell uso de una variable depeendiente transsformada. Por consigu uiente, la R2 reeportada no prroporciona unna medida útil de la bondad dee ajuste para el modelo orriginal. Una medida mejoor resultaría del d uso de la eccuación original y los esttimados de parámetros p efi ficientes para calcular las reesiduales de laa regresión ε^i = Yi -.7529-.249Xi.Entoncces, tenemos dos d opciones paara medir la bondad de ajusste. La primera, es que podeemos usar la fórmula f de R2 2 esstándar para calcular 1 - ES SS/TSS. Esta R no necesariiamente se enccuentra entre 0 y 1. Por tal razón r sugerim mos una segu unda alternatiiva. Ésta es laa de usar los paarámetros esstimados en forma eficieente para esstimar valorees ajustados Ŷi = .7529 + .2249Xi y utilizaar como nuesttra medida dee bondad del ajuste a el cuadrrado de la correlación sim mple entre Yi y Ŷi. En este ejemplo partiicular ambas oppciones produujeron medidaas de ajuste de d 0.92.
Uso de esttimadores coonsistentes dee las varianzaas Con la hetterocedasticidaad, la estimacción sesgada e inconsistentee de las variannzas de los esttimadores de paarámetros de mínimos cuuadrados ordinnarios causa que las inferrencias estadíísticas sean in nválidas. Hal White ha suggerido un méttodo para obttener estimado ores consisten ntes de varianzzas y covarian nzas de estim mados OLS (O Ordinary least sq quares) que prroporcionan ppruebas estadísticas válidas para muestrass grandes.7 El esstimador consisstente de heterrocedasticidad (HCE, heterosscedasticity-conssistent estima-
toor) se basa en el principio dee máxima verosimilitud, el cual se exponne con detalle enn el capítulo 10. 1 Como un ejemplo, recuuérdese que, de la ecuacióón (6.2), en el e modelo de reegresión de doos variables,
geenera un estim mado sesgadoo de la varianzza de β. Un esstimador insessgado, dado enn la ecuación (6.3), es:
7 H. White, "A A Heteroskedasticcity-Consistent Covariance Matrixx Estimator and a Direct Test for Heteroskedasticity", Econometrica, vol. 48, pp. 817-838, mayo de 19880. H
158
PARTE DOS: Modelos de regresión de una sola ecuación
El estimador consistente de heterocedasticidad (HCE) usa la ecuación (6.3) como su base, remplazando la desconocida σ 2i con los cuadrados de los residuales ε^ 2i . El estimador HCE, con frecuencia, se encuentra disponible en la actualidad en muchos paquetes de regresión estadística. Con el uso de la estimación HCE, la R2 para la regresión será la misma, pero todos los estimados de errores estándar y estadísticas relacionadas cambiarán debido a que se generan estimados de varianza consistentes. Sin embargo, esto no proporciona los estimados de parámetros más eficientes. Para una estimación eficiente, debe usarse uno de los procedimientos de estimación de mínimos cuadrados ponderados.
6.1.2
Pruebas para heterocedasticidad
Al exponer las modificaciones del procedimiento de mínimos cuadrados en dos casos separados, es natural para nosotros considerar si pueden encontrarse procedimientos estadísticos apropiados para probar la heterocedasticidad. En cada caso deseamos encontrar una prueba de la hipótesis nula de homocedasticidad, es decir, σ21= σ 22= σ 32 … = σ 2N , donde N es el número de observaciones. La hipótesis alternativa específica, contra la cual se prueba la hipótesis nula, depende del procedimiento de estimación que consideremos que produzca la corrección más deseable para la heterocedasticidad. Aunque hay varias pruebas específicas para la heterocedasticidad, un primer procedimiento útil es el informal, éste examina el patrón de los residuales para ver si las varianzas estimadas difieren de una observación a otra. Para hacer esto, sugerimos calcular los cuadrados de los residuales, ε^ 2i . Si el modelo en cuestión es un modelo de series de tiempo, una gráfica de estos residuales cuadrados contra el tiempo nos dirá si, por ejemplo, las varianzas estimadas se incrementan con el tiempo. Si el modelo se aplica a un corte transversal, una gráfica de los residuales cuadrados contra una o varias variables explicativas, o contra Ŷ, servirá para el mismo propósito. Ahora consideraremos varias pruebas de heterocedasticidad formales, todas las cuales se basan en una forma o en otra en los cuadrados de los residuales. Prueba de Goldfeld-Quandt8 Supóngase que estamos considerando un modelo de dos variables y deseamos probar la hipótesis nula de homocedasticidad contra la hipótesis alternativa de que σ 2i - CX 2i . El procedimiento de la prueba de Goldfeld-Quandt implica el cálculo de dos líneas de regresión de mínimos cuadrados, una usando datos que se consideran asociados con errores de varianza baja y la otra con errores de varianza alta. Si las varianzas de los residuales asociadas con cada línea de regresión son aproximadamente iguales, la suposición de homocedasticidad no puede ser rechazada, pero si la varianza
8
S.M. Goldfeld y R.E. Quandt, "Some Tests for Homoscedasticity", Journal of the American Statistkal Society, vol. 60, pp. 539-547, 1965.
CAPITULO 6: Correlación serial y heterocedasticidad
159
residual incrementa de modo considerable, es posible rechazar la hipótesis nula. La prueba puede realizarse de la siguiente manera: 1. Ordene los datos por la magnitud de la variable independiente X, la cual creemos que se relaciona con la varianza del error. 2. Omita las observaciones de en medio. Podría elegirse, por ejemplo, que d sea aproximadamente un quinto del tamaño total de la muestra. 3. Ajuste dos regresiones separadas, la primera (indicada por el subíndice 1) para la porción de los datos asociados con valores bajos de X y la segunda (indicada por el subíndice 2) asociada con valores altos de X. Cada regresión implicará (N - d)/2 piezas de datos y [(N - d)/2] - 2 grados de libertad, d debe ser lo bastante pequeña para asegurar que se dispone de suficientes grados de libertad para permitir la estimación apropiada de cada una de las regresiones separadas. 4. Calcule la suma de cuadrados residuales asociados con cada regresión: ESS1 asociada con las abajas, y ESS2 asociada con las faltas. (ESS se describe en el capítulo 3.) 5. Suponiendo que el proceso de error está distribuido en forma normal (y no está presente una correlación serial), la estadística ESS2/ESS1 estará distribuida como una estadística F con (N - d - 4)/2 grados de libertad tanto en el numerador como en el denominador. Podemos rechazar la hipótesis nula en un nivel elegido de significancia si la estadística calculada es mayor que el valor crítico de la distribución F. La prueba de Goldfeld-Quandt puede aplicarse con facilidad al modelo lineal general, ordenando las observaciones por la magnitud de una de las variables independientes. El número de grados de libertad en la estadística F será (N - d - 2k)/2, donde k es el número de variables independientes (incluyendo un término constante) en el modelo. Esta prueba funciona porque permite la estimación de la regresión independiente de los datos de observación tanto altos como bajos. Sin embargo, hay un costo importante implicado. Debido a que no se hacen restricciones en los parámetros de regresión (al igual que en las varianzas del error) en cada una de las dos ejecuciones de regresión, se pierde el poder estadístico. Una prueba más poderosa (una que tiene errores tipo II más pequeños) tomaría en cuenta la información de que los parámetros de regresión son idénticos para ambos conjuntos de datos y que sólo ha cambiado la varianza del error. Por último, la selección del número de observaciones de en medio que se eliminan de la prueba es un tanto arbitraria. Si no se eliminan observaciones de en medio, la prueba todavía es correcta, pero la experiencia muestra que la eliminación del procedimiento de prueba de observaciones asociadas con errores de varianza es casi igual mejora el poder de la prueba. EJEMPLO 6.2
Prueba de Goldfeld-Quandt
La prueba de Goldfeld-Quandt puede aplicarse al ejemplo de gastos de vivienda que se usó antes. Los datos se dividen en dos muestras, la primera incluyendo
160
PARTE DOS: Modelo os de regresión de e una sola ecuación
aaquellos con ingresos i de 5 000 y 10 000 dólares y laa segunda inccluyendo a lass f familias con in ngresos superiiores (15 000 y 20 000). No o se eliminan observaciones o s d en medio de de d la muestraa debido a quee se dispone d de un rompim miento naturall e los datos sin que se omiitan observaciiones. El resu en ultado asociad do con las doss e ecuaciones dee regresión sep paradas es co omo sigue (la estadística t aparece entree p paréntesis; los datos están en miles de dólares): d I
Familias de d ingresos baajos:
I II
Familias de d ingresos alltos:
La estadística F que se u sa para probar la suposicción de homo L ocedasticidad d e ESS2/ESS1 = 6.7. Ésta eestará distribuiida bajo la hip es pótesis nula, como c F con 8 g grados de libeertad en el num merador y el denominador. d El examen dee la tabla de laa d distribución F muestra que el valor crítico de F en el niivel del 5% dee significanciaa e 3.44. Conclluimos que podemos rechazzar la hipótesiss nula a favor de es d la hipótesiss a alternativa dee heterocedastticidad.
Prueba de d Breusch-P Pagan9 La pru ueba de Gold dfeld-Quandt es e una pruebaa natural n para aplicarla cuand do se pueden ordenar las ob bservaciones en función dee la l varianza crreciente del téérmino del errror (o una varriable indepen ndiente). Hay y una u prueba alternativa que no requiere dicho d ordenam miento y es fáácil de aplicarr, ésta é es la prueeba de Breusch h-Pagan. Considéreese el siguientte modelo, el cual incluye u una suposició ón general res-p pecto a la relaación entre la varianza del error verdadeera y una variiable indepen-d diente Z: (6.5)) (6.6)) La L ecuación (6.6) ( proporciona la especifficación de laa forma tomad da por la hete-rocedasticidad r d, si es que está e presente en realidad. f( f ) representaa una función n general g que permite, p por eejemplo, tanto o formas lineeales como lo ogarítmicas. Z podría p ser la variable v indep pendiente X o podría representar un grupo de variabless independiente i es distintas a X. 9 Véase T.S. Breusch y A.R R. Pagan, "A Simple Test forr Heteroskedastticity and Ranndom Coefficient C Variattion", Econometriica, vol. 47, pp. 1287-1294, 1 1979.
CAPÍTULO O 6: Correlación se erial y heterocedasticidad
161
Para probbar la heteroccedasticidad, primero calcculamos los residuales r de mínimos cuaddrados ε^i de laa regresión en m e la ecuaciónn (6.5). Al mismo m tiempo u usamos estos residuales r paara estimar:
Ahora A ejecutam mos la siguiennte regresión:: (6.8) Si el término del S d error ε en la ecuación (6.5) está distrribuido en forrma normal y n hay heteroccedasticidad, entonces, unna mitad de laa suma de cuaadrados de laa no reegresión RSS S/2, proporcioona una estaddística de prueba adecuadaa. De maneraa e específica, bajjo la hipótesiss nula de hom mocedasticidadd,
Generalmente, G , cuando hay p variables inndependientes Z, RSS/2 segguirá una dis-trribución ji cuuadrada con p grados de liibertad. Entree mayor sea el e valor de laa suma s de cuadrrados de la regresión, más alto se correlacionará Z co on la varianzaa del d error y, por p consiguiente, será men nos probablee que la hipóótesis nula see mantenga. m Ahora con nsidere que deetectamos la heterocedasti h cidad usando la prueba dee B Breusch-Pagan n, como en laa ecuación (6.8 8) que es el caaso de una sola variable Z. E Entonces un medio m obvio para p corregir la heterocedaasticidad es trransformar laa e ecuación origiinal usando laa variable Z enn lugar de la variable X2 en n la ecuaciónn (6.4).10 Sin em mbargo, cuanndo usamos formas f más ggenerales de la prueba dee B Breusch-Paga an, no hay unna forma natuural por la cual se puedaa hacer dichaa c corrección.
10 Un enfoqu ue mejor implicaríía la estimación po or máxima verosiimilitud. Con heteerocedasticidad laa fuunción de log-veerosimilitud está ddada por:
Supóngase, S por ejjemplo, que la heeterocedasticidad es multiplicativaa, es decir,
Sustituyendo esta expresión en logg (L) y maximizan S ndo con respecto a α, β, γ y δ prodduce estimacioness d máxima verosiimilitud de los paarámetros de reggresión y heteroceedasticidad. de
162
PA ARTE DOS: Modelo os de regresión de e una sola ecuació ón
La prueb ba de Whitee11 La pruebaa de Breusch h-Pagan depen nde en formaa i importante dee la suposición n de un término del error normal. n Hal White W propuso o u prueba esstrechamente relacionada que una q no depend de de manera tan crucial dee l normalidad la d. Supóngasee que en lugar de la eccuación (6.8)) usamos loss r residuales de la regresión para p ejecutar la siguiente rregresión:
a partir de la cual c calculamo os la medida de d la bondad de d ajuste R2. La L prueba de White W se basaa en el hecho de que cuand do hay homoccedasticidad, NR2~X2
(6.10))
con c 1 grado de d libertad. Dee manera máss general, cuan ndo hay p varriables independientes p Z,, la distribució ón tendrá p grrados de liberrtad. Dado quee las pruebas de d White y Breeusch-Pagan sson tan similarres, cualquieraa de d éstas pued de ser una eelección apro opiada, depen ndiendo de laa facilidad dee aplicación. a Paara el procediimiento de prrueba la eleccción de variab bles Z es máss importante. i W White sugieree, que si la heterocedastic h cidad se relacciona con unaa variable v particcular como X, se podrían usar u las variab bles X y X2 paara permitir no o linealidades. l De D manera altternativa, si X y Z fueran d dos variables relevantes, see podrían p usar X2, Z2 y XZ.
EJEMPLO 6.3
P Pruebas de Bre eusch-Pagan y White
Aplicamos tan A nto la prueba de Breusch-Pagan como la de White al ejemplo e de loss g gastos de viviienda (ejempllo 6.1). En am mbos casos ussamos al prin ncipio la supos sición de que la heterocedaasticidad adop ptó la forma:
Para P aplicar la l prueba de B Breusch-Pagaan, ejecutamos la regresión n de Y en X y guardamos g lo os residuales calculados. Encontramos E que σ^ 2 = 0.12523. Luego o regresamos r lo os residuales n normalizadoss en X para ob btener:
La L suma de cu uadrados de laa regresión (laa cual puede calcularse c a paartir de R2 y laa suma s de cuad drados del erro or) fue igual a 13.732. Por consiguiente,, la estadísticaa de d prueba aprropiada es:
11 H. White, "A Heteroskedassticity-Consistent Covariance Matrrix Estimator and a Direct Test for Heteroskedasticit H y", Econometricaa, vol. 48, pp. 8177-838, mayo de 1980.
CAPÍTULO 6: Correlación serrial y heterocedastticidad
163
la cual sigue un na distribuciónn ji cuadrada con 1 grado de libertad. Dado D que el vallor crítico de la ji cuadradaa es 3.84 en ell nivel del 5% %, rechazamos la hipótesis nuula de homoceedasticidad a favor de la prresencia de hheterocedasticcidad. La prueba dee White es aúnn más fácil de aplicar. La R2 asociada con la regresión de los residualess normalizados es 0.36. Peroo ésta es la missma R2 que obbtendríamos si la ecuación no n fuera norm malizada. (Muultiplicar la vvariable depen ndiente por unna constante no n afecta el ajjuste de una ecuación.) e Poor tanto, la esstadística de pru ueba apropiadda es: 20(R2) = 7.20 la cual sigue un na distribuciónn ji cuadrada con 1 grado dde libertad. Una U vez más (daado que 7.20 > 3.84) rechaazamos la hip pótesis nula dde homocedassticidad. Por último, nótese que laa prueba de White W (o la prrueba de Breuusch-Pagan) puueden aplicarsse a casi cuaalquier formaa funcional dee X. Usando una forma cuadrática, calcculamos la reggresión de loss residuales ccuadrados en X y X2, del cual se obtiene el siguiente rresultado: con una R2 de 0.4130. 0 La esttadística de prrueba apropiaada es: 20(R2) = 8.260 la cual sigue unna distribucióón ji cuadrad da con 2 graddos de libertaad. El valor críítico de la ji cu uadrada con 2 grados de lib bertad es 5.999. Tal como anntes se hizo, recchazamos la hipótesis h nulaa de homoceddasticidad (daado que 8.26 > 5.99).
EJEMPLO 6.4 4
Co orrección de la heterocedastic cidad
See podría esperrar que el coonsumo de ennergía a lo laargo del tiem mpo creciera conforme aumeentan la poblaación y el ingrreso, pero quee declinaría, siendo s otras cosas iguales, conforme c se inncrementa el precio de la eenergía. Usan ndo datos de serries de tiempo o anuales de 1960 a 1985, estimamos uuna regresión de mínimos cuadrados ordinnarios utilizanndo las siguien ntes variabless:12 Q = logarritmo de la caantidad de eneergía suministtrada [cuadránngulos (1015 BTU))] Y YEAR = 1 en 1960, . . . 26 en 1985 P = logarritmo del preccio de un cuaadrángulo (dóólares de 1975 5) INC = logarritmo del ingreso por hogaar (dólares dee 1975) 12 Los datos fuueron preparados por el Laboratorrio de Energía dell MIT. Las fuentees originales de loss datos son del U.S. U Departmentt of Commerce Petroleum P and Minerals M Yearboo ok y la Energy Infformation Agency y. Deseamos agrradecer a Daniel McFadden M por prroporcionar las seeries de datos.
164
P PARTE DOS: Modelos de regresión de una sola ecuacción
Los resultaddos de la regrresión (con laa estadística t entre parénteesis) fueron
Es decir todoos los coeficieentes tienen loos signos espeerados, y la reegresión generral se ajusta bieen. No obstannte, nos preoccupamos por la l posibilidad d de que las vav rianzas del error e se increementaran conn el tiempo cconforme se incrementara i el consumo dee energía. Al realizar una prueba de Brreusch-Pagan para heteroccedasticidad, usando u la especificación dee que la variaanza del errorr estaba relaciionada en form ma directa conn el año de laa medición. De manera específica, usamoos los cuadradoos de los residduales como laa variable dependiente (ESQ Q) y estimamoos la siguiente ecuación:
Nuestra estaadística de pruueba calculadda de 4.28 es m mayor que el valor crítico de d la distribución ji cuadradda con 1 grado de libertad en el nivel del d 5% (el vallor crítico es 3.84). Por tantoo, rechazamoos la hipótesiss nula de hom mocedasticidaad. Para mejoraar la eficienciaa se estimó ell modelo OLS S usando míniimos cuadraddos ponderados. Los pesos fueron elegiddos de la reggresión anteriior; de maneera específica, ponderamos p ccada observacción por el invverso de la raaíz cuadrada de d los valores pronosticadoos de la regreesión (cualessquier valoress pronosticaddos negativos erran sustituidos por un núm mero positivo pequeño). Loos resultados de d los mínimoss cuadrados pponderados soon los siguienntes:
Los resultaddos son simillares a aquelllos que obtuvvimos con an nterioridad. Sin S embargo, la significanciaa de varios de los coeficienntes se ha incrrementado y, lo más importaante, los erroores estándar que subyaceen en la signiificancia de los cálculos sonn los correctoss. Por último,, nótese que R2 ha disminuuido un poco, lo cual se espeera cuando lass estadísticas se basan en llos datos origginales (no poonderados).
6.2
CORRELAC CIÓN SERIA AL La suposiciión de que loss errores correespondientes a diferentes ob bservaciones no n están correelacionados, a menudo se viola v en los eestudios de seeries de tiemppo.
CAPÍTULO 6: Correlación serial y heterocedasticidad
165
Recuérdese que cuando los términos del error de periodos diferentes (por lo general adyacentes) están correlacionados, decimos que el término del error está correlacionado serialmente. La correlación serial ocurre en los estudios de series de tiempo cuando los errores asociados con las observaciones, en un momento determinado, son llevados a periodos futuros. Por ejemplo, si estamos prediciendo el crecimiento de los dividendos de acciones, es probable que un sobrestimado en un año conduzca a sobrestimados en-años siguientes. Esto puede ocurrir en forma ocasional en cortes transversales cuando las unidades de observación tienen un ordenamiento natural, por ejemplo, por tamaño o geografía. En esta sección, se estudiará el problema de la correlación serial de primer orden, en la que los errores en un periodo se correlacionan en forma directa con los errores en el periodo siguiente.13 Aunque es posible que la correlación serial pueda ser negativa al igual que positiva, nos interesa, principalmente, el caso de la correlación serial positiva, en la que los errores en un periodo se correlacionan en forma positiva con los errores en el periodo siguiente. La correlación serial positiva se produce con frecuencia en estudios de series de tiempo ya sea debido a la correlación en la medición del componente de error del término del error o, también, debido al alto grado de correlación a lo largo del tiempo que está presente en los efectos acumulativos de variables omitidas. La correlación serial no afecta el insesgamiento o consistencia de los estimadores de regresión de mínimos cuadrados ordinarios, pero afecta su eficiencia.14 En el caso de la correlación serial positiva, esta pérdida de eficiencia estará oculta por el hecho de que los estimados de los errores estándar obtenidos de la regresión de mínimos cuadrados serán menores que los errores estándar verdaderos. En otras palabras, los estimadores de regresión serán insesgados pero el error estándar de la regresión será sesgado hacía abajo.15 Esto puede conducir a la conclusión de que los estimados de parámetros son más precisos de lo que son en realidad. Habrá una tendencia a rechazar la hipótesis nula cuando, de hecho, no debería ser rechazada. No demostraremos estos resultados, pero se puede obtener una sensación intuitiva de por qué son verdaderos al examinar la figura 6.1a) y b). Ambas gráficas ilustran la presencia de correlación serial positiva en un modelo con una sola variable explicativa. En la figura 6.1a) por fortuna, el término del error asociado con la primera observación es positivo. Esto conduce a una serie de términos del error, de los cuales los primeros cuatro son positivos y los últimos dos son negativos. En la figura 6.1b) ha ocurrido el caso opuesto, con los primeros cuatro errores siendo negativos y los últimos dos siendo positivos. En el primer caso la pendiente de la regresión estimada es inferior que la
13
El caso más general puede manejarse con el uso de estimación de mínimos cuadrados generalizados, como se detalla en el apéndice.6.1, y con las técnicas de series de tiempo que se exponen en la parte cuatro del libro. 14 Si el modelo incluye una variable dependiente rezagada, los problemas son mucho más graves. 15 Esto se sostiene a condición de que las X no estén correlacionadas en forma serial negativa.
166
P PARTE DOS: Mod delos de regresión n de una sola ecua ación
Figura 6.1
Correlació ón serial positiva.
pendiente verdadera, v mientras que en n el segundo caso es supeerior. Dado quue ambos casoss tienen igual probabilidad d de ocurrir, loos estimados de d pendiente de mínimos cuaadrados seránn correctos en promedio; ess decir, serán insesgados. Sin S embargo, enn ambos casos las líneas de regresión r de m mínimos cuad drados se ajusttan a los puntoss de los datoos observadoss, en forma más m estrecha que la línea de regresión veerdadera; estoo conduce a una R2 que da un panoraama demasiaddo optimista deel éxito de la regresión de mínimos m cuaddrados. Sin em mbargo, es más m importante notar que loos mínimos cuadrados c prooducirán un estimado de la varianza dell error que ess más pequeñña que la variaanza del errorr verdadera.
6.2.1
C Correccion es para la correlación n serial
Asumimos que cada unoo de los térmiinos del errorr en un modeelo de regresión lineal es exxtraído de una población normal n con vvalor esperad do 0 y variannza constante pero que los errores e no soon independieentes a lo larrgo del tiemppo. Dado que laa correlación sserial, por lo general, g está ppresente en loss datos de seriies de tiempo, usamos u un suubíndice de t (en ( lugar de i)) y asumimoss que el númeero total de obseervaciones ess T. El modeloo es: (6.11) (6.112) donde vi esttá distribuida como N(0,σ 2v) y es indepeendiente de ottros errores a lo largo del tieempo y εt estáá distribuida como c N(0,σ 2ε ) pero no es in ndependiente de otros errores a lo largo ddel tiempo. Ell proceso de eerror como see describe en la ecuación (6..12) se generaa por una reglla que dice quue el error en el e periodo t esstá determinado o por la dism minución en el e valor del error en el periodo p anteriior (multiplican ndo por ρ) y luuego agreganndo el efecto de d una variab ble aleatoria con valor esperaddo 0. Este proceeso autorregreesivo de primerr orden, denotaado AR( 1), es el e
CAPÍTULO 6: Correlación seria al y rteterocedastic ckJad
167
proceso de error autorregresivvo más elemenntal que se exxpone en la paarte cuatro de estee libro. Es fácil veriificar que el efecto de un error en cuaalquier period do dado, se siennte en todos loos periodos fuuturos, con un na magnitud qque disminuyee a lo largo del tiempo. Tan sólo calculam mos las covaarianzas de εt con todos loos periodos prevvios:
Ressolviendo,
(6.13)
Una fórmula útill para el coefi ficiente de corrrelación seriaal de primer orden o p es:
en vista v de que σ 2ε= Var (εt) = Var (εt - 1)). Por tanto, ρ mide el coeeficiente de corrrelación entree errores en ell periodo t y los l errores en el periodo t - 1. Cuando ρ es igual a 0, no n está preseente ninguna correlación serial de prim mer orden, mieentras que un valor grande de ρ implica la existencia de correlacióón serial de prim mer orden.16 Si se conociera p, sería fáácil ajustar el procedimient p o de regresiónn de mínimos cuadrados ordinarios o paraa obtener estim mados de paráámetros eficieentes. Este
16 El término deel error para el prrimer periodo es una u función de loos errores en el peeriodo anterior paraa el que no se disspone de datos. La ecuación (6.13)) sugiere que ε1 esstá distribuido enn forma normal 2 2 conn media cero y varianza v σv /(1 - ρ ).
168
PARTE DOS: Mod delos de regresión n de una sola ecua ación
procedimiennto implica el uso u de diferen nciación generralizada para alterar a el modeelo lineal en un no en el que llos errores son n independienntes. Para desscribir este prrocedimiento,, usamos el hecho h de que el modelo linneal en la ecuuación (6.11) se mantiene pa ara todos los peeriodos. En paarticular, (6.118) Al multiplicar la ecuacióón (6.18) porr ρ y restándoolo de la ecuaación (6.11), se s obtiene la trransformacióón deseada:
son diferenciias generalizaddas de Yt, X2t, …, … Xkt y εt. La ecuación transsformada tiene un proceso de error, por connstrucción, quue está distribbuido en forma independiennte con media 0 y varianza cconstante. Porr tanto la regrresión de mínnimos cuadraddos ordinarios aplicada a a la eccuación (6.19) produce estiimados eficienntes de todos los l parámetros de regresiónn. Por supuestto, el interceppto del modello original deebe calcularse a partir del inttercepto estim mado asociadoo con la ecuación (6.19).17 Se ha reestringido la eexposición dee la correlación serial al casso en el que ρ es estrictamennte menor quee 1. Sin embaargo, el caso en el que ρ es e idénticamennte igual a 1 ess de particulaar interés debiido a que connduce a un prrocedimiento de estimación que se usa comúnmente.188 El proceso de solución, conocido com mo primera dife ferenciación, see aplica si estimamos la ecuuación transfoormada (por annalogía con ell procedimiennto de diferennciación generralizada):
17 La ecu uación transformaada sólo se definee para el periodo 2, 3, ..., t. La elim minación del periodo inicial del proocedimiento de reegresión da como o resultado la péérdida de informaación. Una solucción mejor tomaríaa en cuenta las obbservaciones del primer periodo ccomo sigue:
Por construcciión, 18 Sin em mbargo, observe qque conforme p se aproxima a 1,, la varianza del error e en la ecuacción original se vueelve infinitamentte grande, de moodo que el análisis anterior no es lógico.
CAPÍTULO 6: 6 Correlación seria al y heterocedasticcidad
169
Nóttese que la prrimera diferennciación elimina la necesiddad de un térm mino constantte en la ecuación transform mada. El inteercepto de la ecuación oriiginal debe calccularse por laa ecuación oriiginal cuandoo las variabless son medidass alrededor de sus medias reespectivas.19 S Si se incluyerra un términoo constante, recogería r el efeccto de cualquuier tendenciaa de tiempo prresente en el modelo iniciaal. El procedim miento de diferrenciación gen neralizada sería muy útil si el valor de ρ fu uera conocido a priori. Debbido a que, porr lo general, éste é no es el caaso, examinam mos algunos procedimienttos para estim mar ρ, cada uuno de los cuuales tiene cierrtas ventajas y desventajas de cálculo. Estos proceddimientos prooducen parám metros estimaddos con las proopiedades desseadas cuandoo el tamaño dee la muestra es grande, sin embargo, see sabe poco sobre sus prropiedades de d muestra peq queña.20 El procedim miento de Coochrane-Orcu utt21 Este proocedimiento im mplica una seriie de iteracionnes, cada una de d las cuales produce p un esttimado mejorr de ρ que la anteerior. Es deccir, usa la nooción de que ρ es un coeeficiente de correlación c asociado con errrores de perioodos adyacenttes. En el prim mer paso, de este procedim miento, se usaan los mínim mos cuadradoss ordinarios ppara estimar el modelo origginal [ecuacióón (6.11)]. Enntonces los ressiduales de estta ecuación see usan para reallizar la regressión, (6.21) El valor v estimaddo de ρ se utiliza para reallizar el processo de transforrmación de difeerenciación geeneralizada, y ejecutar unaa regresión nuueva. La ecuaación transform mada es:
La ecuación estiimada transfoormada produuce valores dee parámetros para el interccepto originall βˆ1 y todos loos parámetros de pendientee βˆ2,...,βˆk. Estos esti19
En el modelo de dos variables, por ejemplo, Yt* = βXt*. Para obteener el estimado del d intercepto,
ˆ
estim mamos β y luegoo sustituimos parra obtener αˆ = Y¯ - β X . 20 Una alternatiiva atractiva quee es considerableemente más difícil desde el punto o de vista del cálculo es la estimacción por máximaa verosimilitud co ompleta, en la quue α, β, ρ y σ 2v se s eligen para maxximizar la funciónn de log-verosim militud:
Paraa mayores detalles, véase J. Kmentta, Elements of Econometrics (Nueeva York: Macmiillan, 1986), seccción 8-3. 21 D. Cochranee y G.H. Orcutt,, "Application o f Least-Squares Rcgressions to Relationships Containing Autocorreelated Error Term ms", Journal of th he American Statiistical Associationn, vol. 44, pp. 32-6 61, 1949.
170
PARTE DOS: Mo odelos de regresión n de una sola ecua ación
mados de parámetros p revisados son sustituidos s en la ecuación original o y se obo tienen nuevvos residualess de la regresiión. Los nuevos residuales estimados sonn:
Si ejecutam mos la regresiión,
estos residduales de seggunda vuelta pueden usarsse para obten ner un estimaado nuevo de ρ. ρ Este procesoo iterativo pu uede realizarsee para los passos que se dessee. El procedim miento estánddar es detenerr las iteracionnes cuando loss estimados nuen vos de ρ diffieren de los aanteriores por menos de 0.01 o 0.005, o después d de quee se han obteniido 10 o 20 estimados de ρ. La elección específiica que se haaga depende dee los costos dde cálculo impplicados. Por desgracia, no o hay garantíaa de que el estim mado final de ρ minimizaráá la suma de reesiduales cuaadrados, debiddo a que la técn nica iterativa puede conduucir a un mínnimo local enn lugar de a uno u global. El proocedimiento de d Hildreth-L Lu22 En este procedimiento p o se especificaa un conjunto dee valores en retícula para ρ. ρ Éstos, por loo general, sonn valores espacciados que sirrven como suuposiciones para p el valor de ρ. Si sabeemos que esttaba presente la correlación sserial positivaa, podríamos eelegir valoress en retícula de d p iguales a 0, 0 .1, .2, .3, .44, .5, .6, .7, .8, .9, 1.0. Paraa cada valor de d ρ se estimaa la ecuación trransformada:
El procedim miento seleccciona la ecuacción con la m menor suma dee residuales cuac drados com mo la mejor ecuación. Esste procedimiento puede continuarse ccon nuevos valores en retícuula elegidos enn la vecindadd del valor p que q se seleccioona primero haasta que se alccanza la preciisión deseadaa. Al usar el procedimiento p o de Hildreth-Luu, podemos ellegir cualesquuier límites y cualquier c arreeglo de espaciaado para los vaalores de retícula. La técnicca es práctica y, si se usa con c cuidado suuficiente, haráá posible que se aproxime al a estimador de d máxima veerosimilitud de d ρ. Debe tenerrse cuidado enn la elección de los valorees de retícula, de modo quee la suma de cuuadrados mínnima obtenidaa sea global en e lugar de lo ocal.
6.2.2
Pruebas para la corre elación seriial
Prueba dee Durbin-Waatson Ahora considerarem c os una prueba de la hipóteesis nula de quee no está preseente la correlaación serial (ρ = 0). La hipóttesis alternativva
22 G. Hildreth y J.Y. Lu, "Demand " Relation ns with Autocorr elated Disturbancces", Michigan Sttate University Agrricultural Experim ment Station Techniical Bulletin 276, noviembre n de 1960.
CAPÍTULO O 6: Correlación se erial y heterocedasticidad
171
puede ser que ρ no es cero o, en el casoo de unilaterallidad, que ρ es e positiva (o n negativa). Porr mucho la pprueba más popular para la l correlaciónn serial es laa prrueba de Durbbin-Watson P
La prueba de Durbin-W Watson implicaa el cálculo dee una estadístiica de pruebaa basada b en los residuales deel procedimiennto de regresiión de mínim mos cuadrados ordinarios. o La estadística see define comoo:
Nótese que el numerador noo puede inclu N uir una diferenncia para la prrimera obser-v vación en la muestra, m en vissta de que no se dispone dee una observaación anterior. C Cuando los vaalores sucesivvos de ε^t estánn cerca entre sí, la estadísttica DW seráá b baja, indicanddo la presenciia de correlacción serial poositiva. La esttadística DW W caerá en el raango de 0 a 4, 4 con un vallor cercano a 2 indicando o que no hayy correlación serrial de primerr orden.24 Al hacer h varias aaproximacionees, es posiblee m mostrar que DW W = 2(1 - ρˆ). Por tanto, cuaando no hay ccorrelación serrial (ρ = 0), laa estadística DW W estará cerca de 2. La coorrelación serrial positiva se s asocia conn v valores DW po or debajo de 22, y la correlacción serial neggativa se asociia con valoress D por encim DW ma de 2. La interprretación exactta de la estad dística DW ees difícil, deb bido a que laa seecuencia de lo os términos del error no sólo depende dee la secuenciaa de los ε sinoo taambién de la secuencia s de todos t los valoores X. Por estta razón, la mayor m parte dee lo os cuadros inccluyen estadísticas de prueeba que varíaan con el núm mero de variables b independiientes y el núúmero de obseervaciones.25 Se dan dos líímites, por loo general, g denom minados d1 y du. Si uno estáá investigandoo la posibilidaad de correla-ción serial posiitiva, un valorr para DW porr debajo de d1 lle permite a un no rechazar laa hipótesis h nula de que no hhay correlació ón serial. Si DW es mayo or que du, laa hipótesis h nula se conserva. El rango entrre d1 y du noss deja con ressultados pocoo concluyentes. Para la correllación serial negativa n tan sólo s se ven lass cosas desdee el punto extreemo de 4 en lugar l de desd de el punto exxtremo de 0. La hipótesis nula n se rechazaa si la estadísttica DW es mayor que 4 - d1 y la hipótesiis se acepta sii DW D es menor que 4 - du. Dentro del ranggo entre 4 - du y 4 - d1 la prrueba es pocoo concluyeme. (Véase el ccuadro 6.1 para p un ressumen de laa prueba dee Durbin-Watso D n.)
23 J. Durbin y G.S. Watson, "Testing for Seerial Correlation n in Least-Squarres Regression", Biometrika, B vol. 38 8, pp. 159-177, 1951. Esta pruebaa no es aplicable een forma directa si s la regresión no co ontiene un término constante. 24 La estadísttica DW no pued de usarse si la ecuación de regressión contiene unaa variable depen-diente rezagada. 25 Algunos prrogramas para co omputadora calcu ulan la significan ncia estadística exacta e de la esta-dística de Durbin-Watson.
172
PA ARTE DOS: Mode elos de regresión de d una sola ecuacción
CUADRO 6.1 C RANGO DE LA ESTADÍSTICA D DE DURBIN-WAT TSON
La región n de indeterm minación de laa prueba estadística se deb be al hecho de d que la secuenncia de residuaales es influidda por el movvimiento de la variable indeependiente en la ecuación dde regresión. En E esta regiónn, es posible que q la correlaación aparentee de los errores se deba a la correlación serial de la varriable indepenndiente, no a la correlación serial de lo os términos ddel error.26 Su upóngase, poor ejemplo, que las X siguen un proceso au utorregresivoo de primer orrden, es decir,, xt = rxt -1 + w t
(6.233)
donde 0 ≤ r < 1 y wt es unn término del error aleatoriio (no correlaacionado). Después de ciertas opeeraciones aritm méticas adicioonales, no es difícil mostraar que (6.24) Si el parámeetro de pendiiente estimad do es idénticaamente iguall al parámetro verdadero, enntonces la preesencia de corrrelación seriaal en la variab ble X es irreleevante para ell cálculo de lla estadística DW. A pesarr del hecho de d que βˆ es un u estimador inssesgado de β,, habrá error de muestreo implicado en n el proceso de d estimación, y así βˆ no será idénticameente igual a ββ. Deberá qu uedar claro de d inmediato a partir p de la ecuuación (6.24) que, siendo iiguales otras cosas, c un valoor superior de ρ conducirá a un valor infeerior de la estadística DW. De hecho, un u valor de p cerrcano a 1 puedde empujar a la estadística DW cerca de 0, aun cuanddo los términos del error pueedan no estar correlacionaddos en sí mism mos. Ahora la l razón para loos límites supperior e inferrior asociadoss con la pruebba DW quedda clara. El límiite d1 es el appropiado paraa aplicarse, sii ρ = 1. Cualqquier cosa poor debajo de d1 indica correllación serial positiva. p Por contraste, si p = -1 deberrá usarse el límiite du. Cualquuier cosa por encima de du indica que laa correlación
26 Para mayo ores comentarios de la confiabilidaad de la prueba dee Durbin-Watson. véase R. Bartels y J. Goodhew, "Thee Robustness of tthe Durbin-Watsonn Test", Review of o Economics andd Statistics, vol. 633, pp. 136-139, febrrero de 1981.
CAPITULO O 6: Correlación se erial y heterocedas sticidad
173
serrial positiva no n puede acepptarse. Al trab bajar con seriees de tiempo, es probable qu ue las X esténn autocorrelaccionadas positivamente, dde modo que el límite d1 pu uede ser el máás preciso de los dos.
EJEMPLO 6.5 5
Ca arbón bituminos so
27
See hizo un intennto de explicaar la demandaa de carbón bituminoso (COAL) como un na función dell índice del Coonsejo de la Reserva R Federaal de producciión de hierro y acero (FIS), el índice del Consejo de la Reserva F Federal de prooducción de serrvicios públiccos eléctricos (FEU), el índ dice de precioos al mayoreoo para el carbóón (PCOAL) y el índice dee precios al mayoreo m para eel gas natural (PGAS). La caantidad demanndada de carbbón bituminosso se ajustó esstacionalmentte, y la serie aju ustada se usóó para realizarr una regresióón lineal en llas variables explicativas ennumeradas anntes. Las seriees de tiempo corren c en forrma mensual desde enero dee 1965 a dicieembre de 19722. La produccción de la reggresión original es la siguieente (con la estadística e t enntre paréntesis):
Auunque todas las l estadísticaas t son muy significativass, la estadística DW baja indica que es probable p que esté presente la correlacióón serial en loos residuales estimados. Paraa la correccióón de la pressencia de corrrelación seriaal de primer orrden positiva,, se aplicó el procedimien nto de Hildretth-Lu. Se ejecutaron una serie de regresiiones, cada unna con un valoor elegido differente de ρ. La L búsqueda dee retícula se describe d en el cuadro siguiente:
27
zacción.
Este ejemploo fue construido por p Dynamics Associates, Cambriddge, Mass., y se usa u con autori-
174
P PARTE DOS: Mod delos de regresión n de una sola ecua ación
El valorr final de ρ eleegido fue 0.6, que es el vaalor asociado con la suma de d residuales cuuadrados más pequeña de las l ejecucionees de la regressión. Cuando se asignó al vallor de 0.6 a ρ, se realizó la transformació t ón autorregressiva y se ejecuutó la regresión final, los resuultados fuero on:
Nótese que la estadísticaa DW es conssiderablementte mayor que en la regresióón original y que q todos los coeficientes de regresión estimados coontinúan sienddo significativo os en el nivel ddel 5%.
EJEMPLO O 6.6
Tasas de interés
En este ejem mplo, reconsidderamos el inttento (véase eel ejemplo 4.2 2) de estimar un u modelo de una u sola ecuacción que expliique el movim miento de la taasa de bonos de tesorería Rt como una funnción de la prroducción inddustrial (IPt), la l tasa de creccimiento del suministro s dee dinero (GM22t) y la tasa dde inflación (G GPWt). Recuéérdese que la ecuación estiimada (con laa estadística t entre parénttesis) era:
La estad dística DW baaja de 0.18 suugiere la preseencia de correelación serial de primer orden n positiva. La correlación seerial también puede verse en e forma gráfica notando enn la figura 6.2 que los residuales de regresióón están muuy correlacionaados. Cuando un residual es e positivo (negativo) duraante un perioddo, es probable que permaneezca positivo o (negativo) ddurante el sig guiente. Esto es notorio, espeecialmente, all final de la década d de 1970 y principioss de la de 19880, un periodo de d tasas de intterés nominalles altas. A meenos que se hagan h correcciiones para la presencia dee correlación serial, no sóólo se estimaarán de maneera ineficiente lo os parámetross, sino que es posible que los l pronóstico os subestimen la serie de tasaas de interés reales r en form ma considerabble.
CAPITULO O 6: Correlación serial y heteroceda asticidad
175
Para mejorrar el modelo estimamos dee nuevo la ecuuación de la taasa de interés ussando el proceedimiento de Cochrane-Orc C cutt. Los resulltados son los siguientes:
Esta ecuación se ajusta muccho mejor quee la ecuación no corregida.. Las estadísE ticas t son algoo menores, peero son las esttadísticas corrrectas, estimadas en forma efficiente. (Reccuérdese que lla estadística OLS originall era sesgada..) Nótese por úlltimo que la estadística e DW W de 1.64 esstá considerabblemente por debajo de 2. E sugiere que Esto q podrían esstar presentess formas más complejas dee correlación enntre los residuuales. Verem mos esta posibbilidad en la parte p cuatro.
6.2.3 6
Pru ueba de corrrelación se erial cuando o hay una variable de ependiente rezagada
Cuando están presentes C p unaa o más variabbles endógenaas rezagadas, la estadística D a menudoo, estará cercaa de 2 aun cuan DW, ndo los errorees estén correlacionados en fo orma serial. Por P supuestoo, uno podríaa tan sólo veer que la estaadística DW prroporciona unn indicador dee correlación serial s cuando la estadística DW es baja, peero este enfoque es fuerteemente sesgaddo contra el hallazgo h de laa correlación seerial.28 Por suuerte, una pruueba alternativva relativameente fácil propporcionada 28 Los resultaados básicos son derivados en J. Durbin, "Testingg for Serial Correelation in LeastSqquares Regressionn When Some off the Regressors Are A Lagged Depeendent Variables"", Econometrica, vo ol. 38, pp. 410-4221, 1970.
176
PA ARTE DOS: Mode e los de regresión de una sola ecua ción
por Durbin es e estrictameente válida paara las muesttras grandes de datos perro puede usarse también paraa muestras peq queñas. Para vver cómo se applica la pruebaa, supóngase qu ue hemos estiimado la ecuación (6.25) uusando mínim mos cuadradoos ordinarios: (6.255) La estadísticca de prueba que se usa es e la estadístiica h de Durbbin, la cual sse define como: (6.266) donde Var ( βˆ ) se estima como c el cuaddrado del errorr estándar dell coeficiente de d la variable en ndógena rezaggada, T es el número de obbservaciones y ρˆ es el coefficiente de correlación serial de primerr orden estim mado, ρˆ puedee estimarse en e forma directaa a partir de laa estadística DW W, dado que D DW = 2(1 - ρˆ ). Resolvienddo para ρˆ y sustituyendo, enncontramos que: q
(6.277) En vista de que Durbin ha h mostrado que la estaddística h está distribuida en e forma aproxiimadamente nnormal con varianza v unitaaria, la pruebaa para la correelación serial de primer ordden puede haccerse en form ma directa usan ndo la tabla de d distribución normal. Es imporrtante señalaar que la prueeba h de Durrbin no es váálida cuando T Var (βˆ ) es mayor m que 1. (No podemo os tomar la raaíz cuadrada de un númerro negativo.) Enn este caso D Durbin propon ne una pruebaa alternativa que q sólo es un u poco más com mplicada. Prim mero se obtien ne la variable residual ε^t de la regresión dde mínimos cuaadrados ordinarios y tambiién creamos laa variable ressidual rezagadda ε^ t-1 . Para siimplificar lass cosas, la primera p obseervación debeerá eliminarse. Estimamos la ecuación (66.28): (6.288) Luego hacem mos una pruebba t de la hipótesis nula dee que ρ* no ess significativaamente difereente de 0. Si rechazamos esta hipótesiis nula, conccluimos que lla correlación serial s de prim mer orden estáá presente. Cuando hay h una correelación serial significativa s een la presenciaa de una variaable dependieente rezagadaa, la estimación del parám metro se vuelv ve más difíciil, ya que la esttimación de m mínimos cuaddrados ordinarrios produce resultados r sessgados.
CAPÍTULO O 6: Correlación se erial y heterocedasticidad
EJEMPLO 6.7
177
Co onsumo agrega ado
Estimamos unaa versión simpple y dinámica de una función de consum E mo agregado, en n la cual el consumo acttual C es un na función deel consumo rezagado un trrimestre C-1 y el ingreso diisponible actu ual YD.29 La eecuación de mínimos m cuadrrados estimada (usando ddatos trimestrrales del prim mer trimestree de 1959 al teercer trimestrre de 1995) ees la siguientee (los erroress estándar apparecen entre paaréntesis):
Para probaar la correlacióón serial usam mos la pruebaa h de Durbin.. Dado que el errror estándar del d coeficientee de la variablee dependiente rezagada es 0.0304, 0 DW = 1..569 y T = 14 47, calculamoss que:
En vista de quee 2.79 es mayyor que el valo E or crítico de laa distribución normal en el niivel del 5% (11.645 para unna prueba unillateral), rechazzamos la hipóótesis nula de no o correlaciónn serial. Com mo resultado, es importantte corregir laa correlación seerial, para haccer la estimación de una fun nción de conssumo agregaddo dinámica.
A APÉNDICE 6 6.1 Es stimación de mínimos m cuadra ados generaliza ados
En el apéndicee 4.3 expusim E mos la generallización matriicial del modelo de regresiión múltiple. Entre las supoosiciones del modelo lineaal clásico estaaba la suposiciión de que el término del error no estabba autocorrelacionado y teenía varianza coonstante. En notación n matrricial escribim mos: E(εε') = σ2I do onde I es unaa matriz de iddentidad N x N. En este appéndice generralizamos el modelo m lineall para aplicarllo a casos en loos que la correelación seriall y la heteroceedasticidad esstán presentess. Logramos
29 Usamos lass variables Citibasse GC y GYD, las cuales miden ell gaslo real y el in ngreso en dólares dee 1982.
178
PA ARTE DOS: Modelos de regresión de d una sola ecuacción
esto e alterandoo nuestra supposición respeecto a la matrriz varianza-ccovarianza dee los l términos del d error. Asuumimos que: E(εε') = σ2Ω
(A6.1)
σ2 es desconoocida, pero Ω es e una matriz N x N conociida. Esto es eq quivalente a laa suposición s dee que los elem mentos de Ω son conociddos hasta un escalar multiiplicativo. p La única suposicción que neceesitamos haceer acerca de la l matriz Ω es que q es positivva definida.30 La formaa más generall del caso de heterocedastiicidad ocurre cuando la est tructura del error e es:
La heteroceddasticidad difiiere del modeelo clásico sóólo en el hecho de que laas L v varianzas del error difierenn entre observvaciones. Toddas las covariaanzas del erroor se suponen igguales a 0. Siin embargo, en e el ejemploo de la correlaación serial de d p primer orden,, ninguno de llos elementos de Ω es iguaal a 0. En este caso la matriz v varianza-cova arianza es:
El objetivvo de la estim mación de mín nimos cuadraddos generalizaados es enconntrar estimadoss de parámetrro para el vecttor β en la maanera más efiiciente posiblee, explicando laa información proporcionad da por el conoocimiento de la matriz Ω. Al A suponer que todas t las hipóótesis de míniimos cuadraddos se sostieneen, obtenemoos mejores estim mados de parrámetro insessgado lineal si s transformam mos los datoos originales de modo que la matriz de varrianza-covariaanza de los errrores transforrmados es iguual a σ2I. Unaa vez que se hace esto, laa aplicación del d teorema dde Gauss-Markoov nos dará eel resultado deseado. La suuposición de que Ω es unna matriz definid da positiva ess suficiente para garantizarr que tal estraategia siemprre tendrá éxito. Usamos un teeorema básico de álgebra m matricial quee establece quue existe una matriz m N x N no singular H tal que: HΩH H' = I
(A6.22)
30 Una matrriz A es positiva definida d si y sólo si x'Ax es mayorr que 0, para todass las x no iguales a 0, donde x es unn vector N x 1.
CAPÍTULO 6: Correlación serial s y heteroceda asticidad
179
E Encontraremo os útil replanteear la ecuació ón (A6.2) en la l forma, (A6.3) d lo cual resuulta que: de (A6.4) U Usamos la maatriz H para trransformar el modelo origiinal como siggue: (A6.5)) o
(A6.6))
d donde E término dell error ε˜ es coonsistente, yaa que, a partirr de la ecuació El ón (A6.2),
En vista de quue la ecuaciónn (A6.6) obeddece las supossiciones clásiccas, sabemos E q el estimad que dor (A6.7)) seerá insesgadoo y eficiente. En funciónn de nuestross datos originaales, el estimador de mínim mos cuadra˜ d generalizaados β es dos
(A6.8) L matriz variianza-covariaanza del vectoor del parámetro estimado β˜ es: La (A6.9) Para P ver que los resultados de los mínim mos cuadradoos generalizaddos coinciden co on los mínim mos cuadradoss ordinarios cu uando Ω = I, sustituimos para p Ω en las eccuaciones (A66.8) y (A6.9) y resolvemoss. Para aplicar los mínimoos cuadrados generalizadoos (GLS), neccesitamos un estimado de Ω, Ω y a fin de reealizar pruebaas estadísticas, necesitamoss estimar σ2.
180
PA ARTE DOS: Modelos de regresión de d una sola ecuaci ón
Cuando C Ω ess conocido, ppodemos estim mar σ2 de los residuales de la regresiónn 2 GLS. G Un estimado insesgaado de σ estáá dado por:
donde d u˜ es ell vector de loos residuos GLS en este caaso. Sustituyeendo nos da:
de modo que un estimadoo insesgado dee E[(β˜ - β)(β˜ -ββ)'] está dado o por: (A6.100) ˜
Si ε es normall, β está distriibuida en form ma normal y ppueden aplicarrse las pruebaas estadísticas. Nuestro problema p finaal es encontrarr un estimado consistente de d Ω. Debido a que Ω es una matriz N x N con N(N + 1 )/2 ) elementoss, es imposiblee estimar todoos los elementoos de Ω sólo a partir de N observaciones. Las su uposiciones dde heterocedastiicidad y correelación serial de primer orrden proporciionan dos forrmas útiles dee parametrizarr el modelo, aunque a se disppone de numeerosas alternaativas. Una vez que se ha usaado un estimaador consistennte de Ω, nuestro estimadoor p perderá la proopiedad de serr un estimado or insesgado ppero retendrá una propiedad de muestra grrande apropiaada (algo cercana a la consistencia). Si Ω se estima de d m manera conssistente por uuna matriz V, V el estimaador GLS y su matriz dde v varianza-cova arianza son: (A6.lll)
(A6.122) donde ε^ son los residualees de los mín nimos cuadraddos ordinario os y u˜ son loos residuales dee los mínimoss cuadrados generalizados.. Para com mpletar este appéndice, será útil ú describir la matriz de transformación t n H en los casoos de heteroceedasticidad y correlación c seerial de primer orden. En ell
CAPÍTULO O 6: Correlación se erial y heterocedas sticidad
181
primero es basstante fácil ellegir H de modo m que H'H H = Ω-1. El leector deberá co omprobar paraa ver que
es la elección correcta. c Trannsformar los datos de acuuerdo con la matriz H es eqquivalente al procedimiento p o de mínimoss cuadrados pponderados deescrito en el texxto. La derivación de H en ell caso de la co orrelación seriaal de primer orden o es algo máás difícil. En este caso:
Ell hecho de quee H es la eleccción correcta puede comproobarse evaluaando (H'H) -1 = Ω. La aplicacción de la traansformación H a los datoss es equivalennte a usar el proceso de diferenciación geeneralizada y luego aplicar mínimos cuaadrados ordinaarios. En este sentido, las coorrecciones paara la correlacción serial imp plican el uso dee estimación de mínimos cuadrados poonderados iguual que en ell caso de la heeterocedasticiddad. ¿Qué pasa si se usa la estimación de d mínimos ccuadrados ord dinarios aun cu uando es aproppiada la GLS?? Primero sabeemos que si see conoce Ω, lo os estimados dee parámetro OLS y GLS serrán insesgadoss pero los estiimados de parrámetro OLS tenndrán una varrianza mayor que sus contrrapartes GLS. Sin embargo o, también es veerdad que el estimado e OLS S de la matrizz de varianza--covarianza será sesgada. Paara ver esto, recuérdese quee la matriz dee varianza-covvarianza OLS S es: (A6.13) Si el modelo GLS de hecho fuera correcto o, la matriz dee varianza-covarianza del veector del paráámetro βˆ = (X X'X)-1X'Ysería
182
PARTE DOS: Mode e los de regresión de una sola ecua ción
dado que (A6.144) La matriz dee varianza-covvarianza repoortada en la eccuación (A6.113) puede prooducir un estim mado bastantte pobre de laa matriz de vaarianza-covarrianza correctta para los estim mados de parrámetro de mínimos m cuadrrados ordinarrios como esttá dado por la ecuación e (A6..14). EJERCICIO OS 6.1 Explique de d manera intuuitiva por qué loos mínimos cuaadrados ponderrados producenn estimadores dee parámetro máás eficientes qu ue los mínimoss cuadrados orddinarios cuandoo se sabe que ell término del errror es heteroccedástico. 6.2 Usted esttá estimando uuna regresión de d corte transvversal de una muestra de 1000 ciudades en Esstados Unidos en la que esperra explicar los gastos en educcación como unna función del in ngreso medianoo en la comunid dad, el númeroo de niños en edad e escolar y el nivel de subsid dios estatales y federales recibbidos con propóósitos educativ vos. ¿Usted espeeraría que la heeterocedasticiddad fuera un problema en este caso? De seer así, ¿usaría la l prueba de Golldfeld-Quandt?? ¿Por qué? 6.3 Al estimarr la relación enntre las ventas y los gastos enn publicidad de una empresa en e una industria. Se le hace evvidente que laa mitad de las empresas en la l industria soon grandes en rellación con la otra o mitad, y está preocupadoo por la técnicca de estimacióón apropiada en una u situación así. a Suponga que q las varianzzas del error associadas con laas empresas gran ndes son el dooble de las variianzas del erroor asociadas co on las empresaas pequeñas. a) Si usó mínimos cuaddrados ordinariios para estimaar la regresión de las ventas en e la publicidad (suponniendo que la publicidad p es uuna variable independiente, nno correlaacionada con el e término del error), ¿usted estimaría quee los parámetroos son inssesgados? ¿Connsistentes? ¿Efficientes? b) ¿Cómoo podría revisaar el procedimiiento de estimaación para elim minar o resolveer sus difficultades? c) ¿Puedee probar si es válida v la suposición de variannza del error orriginal? 6.4 ¿Por qué es improbablee que los errorees en los estuddios de corte trransversal estéén correlacionadoos serialmente?? ¿Puede dar un u ejemplo en el e que estará prresente la correelación serial? 6.5 ¿Puede tomar ρ un valorr absoluto que sea s mayor que 1? ¿Qué le dicee esto respectoo a la estabilidad del modelo quue se está estuddiando? 6.6 Usando loos datos de rennta del cuadro 2.1, 2 en el ejerccicio 5.2 estim mamos el modello RENT PER = β1 + β2(SEX) + β3(ROOM PE ER) + β4 (DIST T) + ε. Usando una u prueba F, pruebe la hipóótesis de que: Vaarianza (εhombre) > Varianza (εmujcr) Sugerencia: Ejeecute regresionees separadas de RENT R PER = β1 + β3(ROOM PER) P + β4(DIST T) + ε para homb bres y mujeres. (¿Por qué eliiminaría la variiable SEX paraa estas regresioones?)
CUADRO 6.2 CONJUNTO DE DATOS DE GASTOS E, N, S, W = variable ficticia igual a 1 si el estado está en la región este, norte, sur u oeste, respectivamente; 0 de lo contrario EXP = gastos totales del gobierno estatal y local, millones de dólares PCEXP = gastos per cápita del gobierno estatal y local, en dólares PCAID = ayuda federal per cápita, en dólares POP = población del estado, en miles DEN = densidad de población, en miles por milla cuadrada DPOP = porcentaje de cambio en la población de 1960 a 1970 URB = porcentaje de la población que vive en áreas metropolitanas (SMSA) PCINC = ingreso personal per cápita, en dólares PS = población que asiste a escuelas primarias o secundarias públicas, en miles E
N
DEN
DPOP
Maine
Estado
1
0
0
s
0
w
704
686.16
186
1026
.033182
2.5
21.6
3 664
251
N.H. Vt. Mass. R.l. Conn. N.Y. N.J. Pa. Ohio Ind. III. Mich. Wisc. Minn. lowa Mo. N. Dak. S. Dak. Neb.
1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1
0 0 0 0 0 0 0 0 0 0. 0 0 0 0 0 0 0 0 0
0 0 0
526 411 5166 699 2 546 22 750 5911 8 840 6 ¿67 3 457 8 935 7 799 3 757 3 528 2108 3156 475 521 1052
679.59 893.48 891.30 721.36 826.62 1 238.60 804.33 742,55 640.46 653.99 794.65 865.31 830.09 909.98 730.93 664.84 749.21 766.18 688.48
123 235 190 184 145 240 141 136 112 103 156 147 116 163 113 151 201 195 134
774 460 5 796 969 3 080 18 367 7 349 11905 10 722 5 286 11244 9013 4 526 3 877 2 884 4 747 634 680 1528
.085743 .049639 .74061 .92374 .63348 .38400 .97713 .26476 .26167 .14644 .20169 .15863 .083101 .048897 .051554 .068802 .009152 .008953 .019978
21.5 14.1 10.5 10.5 19.6 8.7 18.2 4.2 9,7 11.4 10.2 13.4 11.8 11.5 2.4 8.3 -2.3 -2.1 5.1
27.3 0.0 84.7 84.7 82.6 86.5 76.9 79.4 77.7 61.9 80.1 76.7 57.6 56.9 35.6 64.1 11.9 14.3 42.8
4279 3 703 4 825 4 513 5 414 5 275 5 379 4 545 4 $72 4 364 5162 4 982 4 279 4343 4 316 4 307 4128 3 766 4 451
168 107 1203 190 665 3 524 1513 2 362 2 422 1221 2 349 2197 995 910 647 1030 142 162 330
ó
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
EXP
PCEXP
PCAID
POP
URB
PCINC
PS
CUADRO 6.2 CONJUNTODE DATOS DE GASTOS (continuación)
Fuente: U.S. Bureau of the Census, Census of Governments and Census of Population, 1970.
CAPÍTULO 6: 6 Correlación serial y heterocedastic cidad
185
6.7 Usando el con njunto de datoss de gastos dell cuadro 6.2, esstime el modello
usanndo mínimos cuadrados c ordinnarios. Luego use u una pruebaa de Goldfeld-Q Quandt para ver si V(ε) ~ POP P2. Si rechaza laa hipótesis nulaa, vuelva a esttimar la ecuacióón en forma eficiente. 6.8 Usando los reesiduales de la estimación OL LS de EXP = β1 + β2 (POP) + β3 (AID) + β4(IINC) + ε, realicce una prueba dde White y unaa prueba de Breeusch-Pagan paara heterocedasticidad, asum miendo que la varianza v del errror es proporciional a POP.
CAPÍTULO
7
VARIABLES INSTRUMENTALES Y ESPECIFICACIÓN DEL MODELO
En el capítulo 6, nos enfocamos en la falla posible de dos suposiciones del modelo de regresión básico: homocedasticidad y no correlación serial. En este capítulo nos centraremos en otros problemas potenciales con el modelo. Comenzaremos con la suposición de que cada una de las variables independientes no está correlacionada con el término del error. Cuando esta suposición no se mantiene, la regresión de mínimos cuadrados ordinarios ya no produce estimadores de parámetro insesgados y consistentes. Una fuente de falla es el error de medición en una o más de las variables independientes. Otra fuente, es cuando una variable independiente es determinada en parte por la variable dependiente, ésta se expondrá en el capítulo 12. En la segunda sección de este capítulo mostraremos que cuando hay error de medición se pueden obtener estimadores consistentes, si variables nuevas llamadas instrumentos remplazan a las variables que fueron medidas con error. La nueva técnica de estimación de "variables instrumentales" sirve como un remplazo para los mínimos cuadrados ordinarios. En la tercera sección consideraremos el problema del error de especificación, es decir, de lo que sucede cuando el modelo es inválido, al excluir una variable apropiada, incluir variables irrelevantes o tener la forma funcional errónea. Esto sirve como una base para el tratamiento breve de los trueques implicados en la construcción de modelos econométricos. La cuarta sección amplía aún más el análisis. Se describe una serie de herramientas diagnósticas que pueden ser útiles para determinar si uno o más puntos de datos tienen una influencia inusualmente fuerte en la línea de regresión estimada. Por último, en la última sección describimos diversas pruebas estadísticas formales que ayudan a evaluar si un modelo está especificado en forma correcta. 186
CAPIT TULO 7: Variables instrumentales y e especificación del modelo
7.1
187
CORRELACIÓ ÓN ENTRE UNA VARIA ABLE INDEP PENDIENTE Y EL TÉRMINO DEL D ERROR R
Laas dificultades que surgen cuando las vaariables indeppendientes y el e error están coorrelacionadoss pueden obseervarse con deetenimiento een el modelo de d dos variablles, con ambas variables m medidas en form ma de desviacciones. El esttimador de la peendiente de mínimos m cuadrrados es:
Suustituyendo y expandiendoo términos, obbtenemos: (7.1) See demuestra, por tanto, quue el estimad dor βˆ, es un eestimador ínssesgado de β cuuando se supoone que las obbservaciones de la variablle X son fijas en muestras reepetidas. La prrueba dependee en gran med dida del hechoo de que el vaalor esperado deel segundo térrmino del laddo derecho dee la ecuación (7.1) es iguaal a 0. Ahora su uponga que cambiamos c nnuestra hipóteesis inicial aasumiendo quue las X son esstocásticas (variables aleattorias). Si asu umimos adem más que E(∑xxiεi) = 0, los reesultados del teorema t de Gaauss-Markov se debilitan aalgo. Ahora ess cierto que P ess un estimadoor insesgado, condicional en X; es deccir, dados los valores particculares de X, βˆ . Sin embarrgo, en muchas situaciones, nos interesarán las propiiedades de E((βˆ) = β independiente de los valores dee X. Además, podemos no deesear hacer laa suposición de d que X y ε no n están correelacionados. En E este escenaario general cambiamos c nuuestro enfoque; en lugar dee concentrarnnos en la preseencia o ausenccia de sesgo, estudiamos laas propiedades de muestra grande de βˆ. De manera específica, buscaamos las suposiciones que sson necesarias para garantizzar que βˆ serrá un estimaddor consistentte. Generalmeente, no hay ggarantía de qu ue X y ε no esttán correlacioonados y por coonsiguiente no o hay garantíaa de que βˆ seerá un estimador consistennte de β. Para veer esto, considdérese el caso en el que se sabe s que X y ε están correlacionados en fo orma positiva sin tomar en consideraciónn el tamaño dde la muestra.. Un examen ráápido de la ecuuación (7.1) hhace evidentee que el térmiino del lado derecho d de la eccuación será positivo p y quee βˆsobrestimaará el valor dee parámetro verdadero v sin im mportar cuál sea s el tamañoo de la muesttra. Por tanto, la correlacióón entre una vaariable indepeendiente y el término del error e conducee, en general, a estimados dee parámetro de d mínimos cuuadrados ordinarios inconsistentes. El ejemplo e particcular que se accaba de usar sse describe en n forma gráfica en la figura 7.1. La línea sóólida represennta la línea de regresión verrdadera, mienntras que la lín nea punteada reepresenta la líínea de regressión de mínim mos cuadradoos ordinarios. Al lograr su ob bjetivo de minnimizar la sum ma de cuadrad dos de los resiiduales estimaados, los
188
PA ARTE DOS: Mode elos de regresión de una sola ecua ción
Figura 7.1
Correlación n entre X y e.
mínimos cuaadrados ordinnarios produccen estimadoss sesgados e inconsistentees del parámetrro de la pendiiente de la reegresión verdadera. En estte caso la penndiente se ha sobrestimadoo. (El estimaddor del interceepto será un estimador sessgado e inconnsistente del intercepto veerdadero, mieentras que el error estándaar estimado de la l regresión y los errores estándar e de loss coeficientes también seráán sesgados e innconsistentes.)
7.2
ERRORES EN E LAS VAR RIABLES Hemos supueesto que todaas las variablees usadas en eel procedimieento de cálcullo de la regresió ón fueron meddidas sin errorr. En la práctiica, es probabble que ocurraan errores de medición (al iggual que errorres creados all especificar mal m el modeloo) y, como vereemos, estos errrores pueden n alterar consiiderablementee las propiedaades de los esstimadores dee los parámetros de la regrresión. Nos abriremos a passo poco a poco a través del problema dell error de meedición considderando varioos casos cada veez más compllejos.
7.2.1
Caso C I: Y ess medida co on error
Supóngase qu ue el modelo de regresión verdadero v (escrito en formaa de desviacioones) es: yi = βxxi + εi
(7.22)
donde εi reprresenta los errrores asociados con la esppecificación del d modelo (loos efectos de vaariables omitiddas, etc.). Ad demás supongga que se obtieene la variablle y*, en lugar de d y, en el prooceso de med dición: yi* = yi+ui
donde Cov (u ( i,xi) = 0
CAPÍTU ULO 7: Variables instrumentales y especificación del modelo m
189
El modelo de reegresión es esstimado con y* y como la vaariable indepeendiente, sin tom mar en cuentaa el hecho de qque y* no es una u medida prrecisa de y. Agregando A el térrmino del erroor de mediciónn ui a cada laddo de la ecuación (7.2), vem mos que esto es equivalente a ejecutar la regresión r sigu uiente: (7.3)
Ob bserve que si ui no tiene m media 0, nuesstra regresiónn estimada neecesitaría un térrmino de inteercepto. En ccualquier caso, mientras ui y xi no esstén correlacio onadas, no haay problema asociado conn ejecutar la regresión deescrita en la ecuuación (7.3). El estimadorr de la pendieente será insessgado [dado que q E( ui xi) = 0] 0 y consistennte. El único efecto de la presencia dell error de meedición en la varriable depend diente es incrrementar la vaarianza del errror. Sin embbargo, la variaanza del error incrementadaa será explicaada en el estim mado de s2, ess decir, en la varrianza residuaal estimada, y se aplicaránn todas las pruuebas estadístticas. (Como reggla general, es e imposible sseparar los effectos de los errores asociiados con el moodelo de regrresión y el errror de medicción, y no see hace ningúnn intento de connseguirlo.) Siin embargo, lla situación no es tan propicia cuando la variable X se mide con error.
7.2.2
Caso o II: X es medida m con n error
Su upóngase que xi* = xi+ vi, donde xi es el e valor verdaadero y xi* es el valor obserrvado. El mod delo de regresión verdaderra es:
miientras la ejeccución de la regresión r reall es: (7.4) Au un si suponem mos que el eerror de mediición en X esstá distribuiddo en forma noormal con med dia 0, no tienne correlaciónn serial y es inndependiente del error en la ecuación verdadera, surgeen problemas al usar mínim mos cuadradoos ordinarios coomo una técnicca de regresiónn. Esto puede verse con máás facilidad nootando que el errror ε* y la varriable x* en laa ecuación (7.4) están correelacionados (o o tienen una co ovarianza no cero). c En partticular,
Poor tanto, los esstimadores dee mínimos cuaadrados de loss parámetros de regresión serán sesgados e inconsistenntes, con el grrado de sesgoo e inconsistenncia estando rellacionado conn la varianza del error de medición. m
190
PARTE DOS: Modelos de regresión de una sola ecua ación
7.2.3
Ca aso III: X y Y son med didas con e error
Este caso noo contiene connclusiones nueevas comparaddo con el caso o anterior, perro será útil examinarlo con ccierto detalle. Las suposiciones son las siguientes:
ui y vi no estáán correlacionnadas entre sí al a igual que coon xi, y cada proceso p de erroor no implica enn sí mismo unna correlación serial. La ecuuación de regrresión estimadda será de la fo orma:
Ahora considérese el estiimador de mín nimos cuadraados ordinarioos βˆ:
^
Dado que xi, ui y vi son toodas estocásticas, no es fáccil evaluar el sesgo de β . La L razón para essto es que el vvalor esperadoo de la razón de d dos variables aleatorias no n es igual a laa razón del vaalor esperado de las variabbles. Sin embbargo, podemoos evaluar la co onsistencia de βˆ evaluandoo la expresión para βˆen el líímite conform me el tamaño dee la muestra sse hace más grande. g Este ccálculo se dennota plim βˆ . En E vista de que ui y vi no esttán correlacioonadas entre ssí al igual quee con xi, resullta que:1 (7.5)
Esto sugiere que la presenncia del error de medición ddel tipo menccionado, conduucirá a una suubestimación del parámetrro de regresióón verdadero si se usan técnicas de mínnimos cuadraddos ordinarioos.
7.2.4
Esstimación de e variables instrumentales
El problemaa de los errorees en la medicción de variabbles de regresiión es muy im mportante, perro los econom metristas no tiienen mucho que ofrecer en e la forma dee 1 Hemos utilizado u un resulttado que para varriables aleatorias Z1 y Z2, plim (Z1/Z / 2) = plim Z1/plim Z2. En este caso o particular dividdimos el numerad dor y el denominnador entre N y usamos u el hecho de que plim ∑x 2i / N = Var(x) y pplim ∑v 2i /N = σ 2v .
CAPÍT TULO 7: Variables instrumentales y e especificación del modelo
191
so oluciones útiles. Generalmente, tendemoos a pasar porr alto el probleema del errorr dee medición, esperando e quee los errores sean s lo bastannte pequeños como c para noo deestruir la validez del proceedimiento de estimación. e U Una técnica quue está disponiible y puede solucionar s el problema dell error de meddición es la técnica de esti-mación m de variiables instrum mentales. Expliicaremos en fforma breve el concepto dee variables instruumentales, enn parte debidoo a que es proobable que sea útil con los errrores de meedición y porrque es impo ortante cuanddo uno está tratando t conn modelos m que consisten c en ssistemas de ecuaciones sim multáneas. El métodoo de variables instrumentales implica la búsqueda de una variable nu ueva Z, que está e altamentee correlacionadda con la variiable independdiente .Y y al mismo m tiempo no está correelacionada con n el término ddel error en laa ecuación (al ig gual que con los l errores dee medición dee ambas variaables). En la práctica, p estamos m interesadoos en la consiistencia de los estimados dde parámetro y, por consiguuiente, nos concentramos c s en la relaciión entre la variable v Z y las restantes variables del modelo m cuanddo el tamaño de la muestraa se hace máss grande. Defiinimos la variiable aleatoriaa Z como un instrumento sii: 1. Las corrrelaciones enntre Z y ε, u y v, respectivaamente, en laa ecuación se approximan a cero c conformee el tamaño de d la muestra se hace más grande.2 2. La corrrelación entre Z y X es no cero c conform me el tamaño de d la muestra see hace más grrande. Si somos lo bastante afortunados a p para ser capacces de elegir entre varios innstrumentos, tan sólo selecccionaremos el instrumentto (o combinaación de instrrumentos) quue tiene la corrrelación máss alta con la vvariable X. Por el mom mento, suponnemos que pu uede encontrarr dicha variabble y que po-d demos alterar el e procedimieento de regressión de mínim mos cuadradoss para obtenerr parámetros esttimados que ssean consisten ntes. Por desggracia, no hayy garantía dee q el procesoo de estimacción produciráá estimadoress insesgados de los pará-que m metros. Para sim mplificar las ccosas, considérrese el caso II, en el que yi = βxi + εi y sóloo x se mide con error (como xx* = x + v). El E estimador de d variables in nstrumentaless co orrecto de la pendiente p de rregresión en el e modelo de ddos variables es:
La elección de esta fórmulla de pendien L nte particularr se hace de modo m que el estimador resuultante sea connsistente. Paraa ver esto, poddemos derivaar la relación
2 Técnicamen nte hablando, neccesitamos referirn nos a las propieddades de estimadoores en el límite en e prrobabilidad.
192
PA ARTE DOS: Modelos de regresión de d una sola ecuacción
entre e el estim mador de variaables instrumeentales y el parámetro de pendiente p verdadero d de un modo similaar a la derivacción en la ecuuación (7.1):
Es E claro que la elección de Z como un insstrumento garrantiza que β* se aproximará a β conforme el tamaño de la muestra se hace más grannde [Cov(z, ε*) se aproxim ma a 0] y, por connsiguiente, es un estimador consistente dee β. No podríaamos preguntaar por p qué la varriable xi* no ffue remplazad da por zi en el denominador del estimadoor de d variabless instrumenttales. El leector deberáá comprobarr, usando el e procedimient p o anterior, quue el estimaddor ∑yiZi /∑z 2i no produce un estimadoor consistente c dee β (véase el eejercicio 7.2).. La técnicca de variables instrumenntales parece proporcionar una soluciónn simple para un u problema ddifícil. Hemoss definido unaa técnica de estimación e que produce p estim madores conssistentes si poodemos enconntrar un instrrumento aproopiado. p Sin em mbargo, es probable que esto sea difíccil cuando esstán presentes errores e de meedición. Concluyeendo con lo annterior, algunoos comentarioss pueden ser útiles. ú Primeroo, la l técnica de estimación e dee mínimos cuaadrados en reaalidad es un caaso especial de d variables v instrrumentales. E Esto resulta po orque en el moodelo de regreesión clásico X no n está correllacionada conn el término del d error y poorque X está correlacionad c da perfectamente p e consigo mism ma. Segundo, si generalizam mos el problem ma del error de d medición m a errores e en m más de una variable v indeppendiente, es necesario unn instrumento i p remplazarr cada una de las variables independientees designadass. para Por P último, repetimos quee la estimacióón de variablees instrumenttales garantiza la l estimaciónn consistente ppero no garan ntiza la estimaación insesgadda.
7.3
ERROR DE ESPECIFIC CACIÓN Nuestra expoosición de la eeconometría se N s ha basado,, en gran med dida, en la suup posición de quue el modelo qque se va a esttimar está esppecificado en forma f correctaa. U vez que se asume la especificaciónn correcta dell modelo, la estimación Una e deel m modelo y la prueba p del moodelo se vuelvven relativameente sencillas.. Sin embargoo, en realidad, nunca n podem mos estar seguuros de que unn modelo detterminado esttá especificado en forma corrrecta. De heecho, los inveestigadores, por p lo generall, examinan máás de una possible especificcación, intenttando encontrrar la especifiicación que deescriba mejorr el proceso bajo estudio. Intentamos daar al lector unna sensación de los peligros iimplicados en n la búsquedaa de un modelo exponiendo los costos aso ociados con lla mala especificación del modelo. Noss preocupamoos con dos tiposs de mala esppecificación, la l primera quue ocurre cuanndo se omitenn v variables releevantes de la regresión linneal y la seguunda que ocuurre cuando se agregan variaables irrelevaantes a la ecuuación. Por úlltimo, haremos una pausaa
CAPÍTU ULO 7: Variables instrumentales i y especificación e del modelo m
193
breeve para comentar el error en la especifficación asociaado con la eleección incorreecta de la form ma funcional..
7.3.1
Varriables omittidas
Coonsidérese priimero el caso en el que unaa variable se omite o sin darsse cuenta de unna especificaciión de modeloo "verdadera"" o correcta. S Supóngase quue el modelo verrdadero está dado d por la ecuación (7.7)), (7.7) miientras que ell modelo de reegresión está dado por:3 (7.8) See postula que to odas las supossiciones del mo odelo lineal clásico se mantiienen para la ecuuación (7.7). Como se deerivó en el caapítulo 1, el parámetro de ppendiente estiimado es: (7.9)
Suustituyendo yi, definida com mo en la ecuacción (7.7), en la ecuación (77.9) y resolvieendo, obtenem mos:
Daado que X2 ess fija y E(εi) = 0, el último o término tiene valor esperaado cero, de moodo que, (7.10)
3 Trabajaremoss con los datos enn forma de desviaaciones y supondrremos que ¯ε = 0 para p simplificar lass derivaciones. Laa mayor parte de los resultados, peero no todos, se mantienen m para el intercepto de la ecuuación. Dado quue el efecto del error e en la especificación del moodelo sobre el inttercepto, por lo gen neral, no es de im mportancia extrem ma, dejamos los detalles al lectorr (véase el ejerciccio 7.3).
194
P ARTE DOS: Mode e los de regresión de una sola ecua ación
En virtud de que q no hay gaarantía de que el segundo térrmino será 0, el estimador de d la pendiente por mínimoos cuadrados de la ecuación (7.9) seráá un estimadoor sesgado del parámetro dee pendiente verdadero v β2. Este sesgo no n desaparecerrá conforme creezca el tamañoo de la muesttra, de modo que q la omisión n de la variabble del modelo taambién produce un estimad dor inconsistennte. El único caso c en el que el sesgo (e inco onsistencia) deesaparecerá po or completo es e cuando Covv(x2, x3) = 0, es e decir, cuanddo x2 y x3 noo se correlaciionan en la m muestra.4 Estte resultado sse generaliza sii hay numerosas variables independienttes. Sólo cuanndo la variable omitida no está e correlacioonada con toddas las variablles independiientes incluidaas desaparece el e sesgo, pero esto es extreemadamente improbable. i La fórmuula en la ecuaación (7.10) es e útil debido a que nos dicce que el signno del sesgo deppende de la coorrelación entrre la variable omitida y tod das las variablees incluidas al igual que dependiendo d del signo deel coeficientee de pendiennte verdadero β3. En la medida en que x2 y x3 estén altamente a corrrelacionadas, el coeficiente de x2 incluirá eel efecto de la variable x3 y será sesgado. Cuando x2 y x3 no están corrrelacionadas, x2 no recoge nada del efecto de x3 y no n existe sesggo. Como una cuuestión prácticca, lo importaante es la extennsión del sesg go de la especcificación. Estto sugiere quue un investiggador cuidaddoso no sólo considerará la cuestión de las l variables faltantes sinoo también su posible correelación con laas variables dell modelo incluuidas. Para com mpletar, conssideraremos el e efecto de laa omisión dee variable en la varianza del estimador dee la pendiente. Primero, verremos el casoo en el que x2 y ^ x3 no están correlacionad c dos. Entonces,, β *2 será un eestimador inssesgado de β2 y ^ tendrá una vaarianza idénticca con β2. La única ú dificultaad con la malaa especificacióón ^ del modelo surge debido a que el esttimador usuall de la variannza de β 2* seerá sesgado.5 Sinn embargo, geeneralmente, cuando x2 y x3 están correelacionados, loos dos estimadoores no tendráán varianzas id dénticas. En el e modelo de dos d variables, la ^ ^ varianza reall de β2* será menor m que la varianza v real de β2, aun cuaando el modeelo esté mal espeecificado.6
7.3.2
P Presencia d una varia de able irrelevvante
Ahora considdérese el casoo en el que unna variable irrrelevante se haa agregado a la ecuación. Assuma que el m modelo verdadero está daddo por: (7.111) y que el moddelo de regressión está dadoo por: (7.12) 4 Una variaanza alta para x2 disminuirá la canntidad de sesgo, ppero el sesgo nunnca llegará a cero , en vista de que hemos asumido una varianza finnita para todas laas x de la muestrra. 5 6
1971).
ˆ
Es pesad o pero no difícil mostrar que la varianza v estimad a de β * ba. 2 será sessgada hacia arrib Esto se muestra m en P. Raoo y R.L. Miller, Applied A Economettrics (Belmont, Calif.: C Wadsworthh,
CAPÍTU ULO 7: Variables in nstrumentales y esspecificación del modelo m
195
La presencia dee la variable iirrelevante x3 implica que no estamos tomando t en cueenta la restricción del parám metro verdadero βˆ3* = 0. E Esperaríamoss que, no tomaar en cuenta to oda la inform mación disponnible respecto al modelo, conduciría c a unaa pérdida de grados g de liberrtad y, por connsiguiente, a una u pérdida dee eficiencia, perro no a una péérdida de conssistencia y dee sesgo. Para ver v la última, calculamos el coeficiente estimado e de la variable x2 en la ecuaación (7.12). Usando la derrivación descrrita en el capítulo 4 [ecuacción (4.4)], enncontramos que: q
Sustituyendo paara yi a partir de la ecuació ón (7.11) y resolviendo, obbtenemos:
de lo cual resultta que (tomanndo valores essperados con x2 y x3 fijos)
Porr tanto, la incclusión de una variable irrrelevante no sesga s los estim madores de la pendiente dee ninguna dee las variablees que apareccen en el mo odelo "verdaddero". No es difícil d mostrarr que el interccepto de la eccuación también es insesgaddo y que el estimado e del coeficiente de d x3 tendrá un u valor espeerado de 0. Dejjamos ambas pruebas al lecctor (véase loss ejercicios 7..5 y 7.6). (Lass pruebas de connsistencia son n parecidas; tan sólo neceesita usar lím mites de probabilidad en luggar de valoress esperados.) La inclusiónn de variabless irrelevantes afecta la eficciencia del esstimador de mínnimos cuadraados, dado quue la varianzaa del coeficiente de la penndiente estimaado βˆ2* en genneral, será m mayor que la varianza v del coeficiente c βˆ2. (El único casso en el que no n ocurrirá unna pérdida de eficiencia ess el caso especial cuando x2 y x3, no estánn correlacionaados, de nuevvo una posibilidad improbbable.) Esta pérrdida de eficieencia hace máás difícil rechaazar la hipóteesis nula de unn parámetro de pendiente cerro. Sin embarrgo, la variannza estimada de d βˆ*2 será unn estimador inseesgado de la varianza v verddadera de βˆ2. Por P tanto, la ppérdida de efiiciencia será tom mada en cuennta cuando se calcule el errror estándar dde la regresióón.
7.3 3.3
No linealidade l s
Otrro error de esspecificación puede ocurrirr cuando el innvestigador ellige estimar un modelo de reegresión lineall que es lineal en las variablles explicativaas cuando el mo odelo de regreesión verdaderro no es lineal. Un ejemploo simple ocurrre cuando el mo odelo verdadeero es de la foorma polinóm mica: (7.13)
196
P ARTE DOS: Mod delos de regresión n de una sola ecu ación
mientras quue el modelo eestimado es: (7.114) Dado quue el modelo en la ecuacióón (7.14) es uun caso especcial de variablles omitidas, la especificacióón de un mod delo lineal cuaando el modello verdadero no n es lineal pu uede conducirr a estimadorres sesgados e inconsistenntes. La mism ma conclusión se mantiene ccuando se usaa una aproxim mación polinóómica para una u ecuación innherentementee no lineal (vvéase la secciión 10.1). Poor esta razón,, a menudo estiimamos ecuacciones polinóm micas tales coomo la ecuaciión (7.13) com mo una prueba para la no linnealidad en laas variables inndependientees.
7.3.4
Eficiencia co ontra sesgo o en la co onstrucción n del modelo
Si no estam mos seguros dee cuáles variaables explicatiivas deberíann aparecer en un modelo, enffrentamos variios trueques. El análisis muuestra que el costo de excluuir una variablee que deberíaa aparecer en n el modelo ees sesgo e incconsistencia. El costo de agrregar una o m más variables irrelevantes ees pérdida de eficiencia. Si el número de observacionees es grande, parece razonnable optar por p el riesgo de agregar variiables irrelevvantes, debido o a que es im mprobable que la pérdida de grados de libertad sea graave. Sin embaargo, si el núm mero de obseervaciones no es grande, la pérdida de eficciencia se vueelve grave. En geneeral, la eleccióón de la form ma del modeloo debe hacersee en función del d trueque sesggo-eficiencia, con el resultaado dependiennte del objetivvo. Si la meta es el pronóstico preciso, miinimizar el errror cuadráticoo medio es un n objetivo razzonable, en viista de que tooma en cuentta tanto el sessgo como la eficiencia.7 Por P tanto, podrííamos estimarr cada uno dee varios moddelos alternatiivos durante un periodo deteerminado y comparar c los errores e cuadrráticos medioss asociados con c cada uno. En térm minos de estaadística clásicca, no es difíccil probar si están presenttes variables irrrelevantes. Enn vista de quee, los coeficienntes de variab bles irrelevanttes tienen valores esperados de 0, aplicam mos pruebas t estándar si deeseamos evaluuar la relevancia de variablees individuales y aplicamos una pruebaa F si deseam mos probar la reelevancia de uun grupo de variables. v Estta prueba fallla por compleeto cuando no estamos e segurros de cuáles variables debberían apareceer en el modelo. Como resulltado, debemoos basarnos en e el uso de técnicas de simulación s paara hacer dichass comparacionnes.8 7 8
Recuérddese del capítulo 2 que el error cuaadrático medio = varianza + sesgoo2. La econometría bayesianna proporciona una u estructura addecuada en la quee pueden verse laas limitaciones dee los métodos clássicos de construccción de modelos y la prueba de moodelos. Véase, poor
ejemplo, A. Zellnner, An Introductioon to Bayesian Infe ference in Economeetrics (Nueva Yorkk: Wiley, 1971), y E. Leamer, Specificcation Searches inn Econometrics (Nu ueva York: Wiley, 1979).
CAPÍTU ULO 7: Variables instrumentales y especificación e del modelo
EJEMPLO 7.1
197
De emanda de din nero
En n un estudio de d la demandda de dinero a largo y a corrto plazos, Grregory Chow esstimó la siguiiente ecuaciónn de demanda (los erroress estándar esttán entre parééntesis y todos los datos soon trimestrales):9
d donde M = log garitmo naturral de la reservva total de diinero Yp = log garitmo naturral del ingreso permanentee Y = loggaritmo naturaal del ingreso o actual R = loggaritmo naturral de la tasa de d interés En n vista de quee Chow ve la ecuación estim mada como una u ecuación a largo plazo paara la demandda de dinero, concluye quee el ingreso permanente ess más importan nte que el dinnero actual coomo la restricción a largo pplazo sobre bienes individuuales. (La varriable Y es inssignificante, mientras m que la l palabra Yp es altamente siggnificativa.) Sin S embargo, uno puede afirmar a que laa ecuación esttimada es de heecho una malaa especificacióón de la ecuacción correcta ppara la demannda de dinero a largo l plazo. Taylor T y Newhhouse afirman n que la especiificación correecta es:10 (7.15) Sii la ecuación (7.15) es corrrecta, esperarríamos que los coeficientess de la ecuació ón estimada de Chow fueeran sesgadoss. Podemos approximar la extensión e de esste sesgo usan ndo nuestros resultados r en los efectos ddel error de esspecificación dee la variable omitida. o Considérese el cooeficiente de ingreso perm manente estim mado, dado quee es importantte para la concclusión de políítica a la que se s llegó. Si el m modelo correctto hubiera siddo,
en ntonces, a parrtir de la ecuaación (7.10), podríamos p cooncluir que ell sesgo en el co oeficiente estimado α^2 de laa ecuación Mt = α1 + α2Ypt sería:
9 G.C. Chow, "On " the Long-Runn and Short-Run Demand D for Moneyy", Journal of Pollítical Economy, vo ol. 74, pp. 111-131, abril de 1966. 10 L.D. Tayloor y J.P. Newhouuse, "On the Lonng-Run and Sho rt-Run Demand for Money: A Coomment", Journall of Polítical Econnomy, vol. 77, pp. 851-856, 1969.
198
PARTE DOS: Mode elos de regresión de d una sola ecuacción
Aunque no lo hemos hecho así enn el texto, es pposible extennder la fórmulla para el sesgoo de la especcificación, parra aplicarla a ecuaciones con c numerosaas variables expplicativas. En nuestro caso el sesgo en el e término de ingreso i permaanente es estim mado por:
donde d2 es el e coeficiente dde Ypt en la reggresión auxiliaar de Mt -1 sobree Ypt, Yt y Rt , es e decir,
Si la variablee Mt -1 no estáá disponible, tendremos t quue especular acerca a de la exxtensión de cuualquier sesgoo de especificcación que estté presente. Sin embargo, en e este ejemplo particular Mt -1 está disponiible, en vista de que implicca un rezago de d un periodo de d una variablle presente en n la ecuación mal especificcada. Dado quue se sabe que Mt -1 y Ypt estánn altamente coorrelacionadoss y esperamos que el signo de d Mt -1 será possitivo cuando se ejecute la ecuación especificada en forma f correctta, predeciríamoos que el sessgo es positivvo y considerrable. En otraas palabras, la extensión dee la importanccia del ingresoo permanente es exagerada debido al erroor de especificaación. Esta suposición s se corrobora cuuando se estiima el modello especificadoo en forma corrrecta. Los resultados son los l siguientess:
El coeficientte Mt -1 es possitivo y signifficativo, mienttras que el cooeficiente Ypt es e positivo peroo es insignificaante en el niveel del 5%. Porr tanto, la concclusión original debería revissarse para establecer que el e ingreso actuual es más imp portante que el ingreso perm manente para explicar la demanda d de dinero a largo plazo.
7.4
11 DIAGNÓSTTICO DE REG GRESIÓN
El modelo de d regresión llineal básico es propenso a diversos errores posiblees distintos a laa inclusión dee variables irrrelevantes o la omisión de variables relevantes. Vimoos en el capíttulo 6 que la correlación seerial o la heteerocedasticidaad pueden cond ducir a estimaddores ineficienntes. De hechho, cualquier patrón p residuaal 11 El materrial en esta sección se basa en grran medida en D..A. Belsley, E. Kuh K y R.E. Welscch, Regression Diagn nostics, Identifyingg Influential Data and a Sources of Coottinearity (Nueva York: Wiley, 1980). Véase también W.S. W Krasker, E. K Kuh y R.E. Welsch h, "Estimation forr Dirty Data and Flavved F Models", en Z. Griliches y M.D. M Intriligator ((eds.), Handbook of Econometrics,, vol. I (Amsterdam: North-Hollannd, 1983), capítulo 11, y A.R. Pagann y A.D. Hall, "D Diagnostics Tests as Residual Anallysis", Econometrric Reviews, vol. 2, pp. 159-218, 19833.
CAPÍT TULO 7: Variabless instrumentales y especificación del modelo
199
innusual, incluy yendo la correelación serial, debería ser una preocupaación, ya que su ugiere que unna o más variables se han omitido en foorma inaproppiada del modeelo de regresiión. En esta seección ampliaamos nuestro análisis del modelo m de reegresión para coonsiderar divversos diagnósticos de regrresión útiles. Estos diagnó ósticos no se deerivan de la teoría estadísttica; en consecuencia, no proporcionan p pruebas p estadíísticas. Más bien, b nos perm miten ver si uno u o más punntos o una o más m variables inndependientess tienen una iinfluencia inu usitadamente grande en loos parámetros dee regresión estimados. Unn punto o variiable con unaa influencia in nusual puede reeflejar un erroor en los datoos: podrían teener un error en la codificaación o en la trranscripción de d los datos. En este caso obviamente se necesitaríaa una correcciión. Sin embaargo, en la mayyor parte de loos casos, las correcciones en e los datos (o laa omisión de puntos) p no sonn necesarias. Una influenciia inusual pueede señalar la faalla del mod delo de regreesión para explicar e un eevento particcular en una ub bicación o periodo particcular, o tan sólo puede reflejar el hech ho de que el téérmino de perrturbación tieene una varian nza grande. La detecciión y evaluación de puntoss influyentes y variables innfluyentes es coompleja. Paraa conocer porqqué, examínesse la figura 7..2. El modeloo de regresión veerdadero tienne una pendieente positiva y está dado por p Yi = α + βXi + εi. Sin em mbargo, se coometió un errror de codificcación en el séptimo s puntoo de datos, el más m grande. Es E evidente quue este punto o es muy influuyente, en vista de que la línea de regressión estimadaa, mostrada por p la línea ddiscontinua α^ + βˆXi, tiene unna pendiente negativa. Pero este puntoo no se muesttra como un punto p atípico debido a que, con la funcióón de pérdida cuadrática implícita en los mínimos cuuadrados, la línea estimaada es forzad da a quedar cerca del puunto. En las su ubsecciones que q siguen suugerimos variias técnicas dde diagnóstico o que pueden seer útiles para detectar datoos influyentess y variables iinfluyentes. 7 7.4.1
Res siduales stu udentizados s
Los L residuales relativamentte grandes pueeden ser útilees como un diiagnóstico de reegresión. Pued den advertirnos que observvaciones partiiculares puedeen ser influFigura 7.2 Un punto influyente.
200
PA ARTE DOS: Mode elos de regresión de d una sola ecuacción
yyentes. O, cuuando son exaaminados com mo un grupo, ppueden usarse para evaluaar la suposición de que la disttribución del error e subyacennte es normal. Sin embargoo, el valor de loos residuales ccomo un dispositivo diagnóóstico es limiitado, debido a que un punto de datos influuyente puedee estar asociaddo con un resiidual pequeñoo. Por esta razónn es útil consiiderar el resid dual que se obbtiene para caada observacióón cuando la líneaa de regresión es e estimada conn esa observaciión particular omitida. o
Por tantoo, para nuestrro modelo de dos variables, supongamoos que β(i) reepresenta la pendiente p de regresión esttimada cuanddo se ha omittido la ¿ésim ma observación. Enfocaremoss nuestra aten nción en el reesidual ε(i) =yyi - β(i)xi. Siin embargo, los residuales son interpretadoos con mayor facilidad cuaando se escalaan para tener una varianza unnitaria (por suppuesto, tambiién tienen med dia cero). Parra muestras granndes, esperarííamos que aquuellos residuaales normalizados siguieraan una distribución normal. S Si no lo hacenn, como lo evvidencia el heecho de que de d manera consiiderable más del d 5% de los residuales normalizados esstán a más de 2 desviaciones estándar de cero, proporcciona evidenccia de que la suposición de d normalidad es e inválida. Para norrmalizar los residuales, r dividimos d el residual r ε(i) entre el erroor estándar estim mado de la reegresión, si(i)), en la que laa iésima obseervación se ha h omitido. El reesidual studenntizado está daado, por tanto,, por: (7.166)
Los residualees studentizaddos que son mayores m que 1.96 1 en valor absoluto (o de d manera más general g mayoores que el vallor crítico aprropiado de la distribución t) t pueden consiiderarse comoo puntos atípiicos y deberíaan recibir atennción especiaal. Sin embargo o, sólo cuandoo hay un porrcentaje mayoor que el esperado de talees residuales deebería cuestioonarse la supoosición de norrmalidad.
7.4.2
DF FBETAS
Con frecuenccia, uno está innteresado en el valor de unn parámetro particular p de un u modelo de reegresión. En este e caso, la cuestión centraal se vuelve, ¿alguna obserrvación tiene una influenccia inusitadam mente grandee en el valor del parámetrro estimado? La respueesta es proporrcionada observando los DF FBETAS paraa cada observaación y cada variable. v DFBE ETAS mide laa diferencia escalada entre el estimado de d mínimos cuaadrados y la eestimación co orrespondientee que se obtieene estimanddo con una obseervación particcular omitida.. La escala ess determinadaa por la desviaación estándarr estimada dee β(i). Para el modelo de doos variables (7.177)
CAPIT ULO 7: Variables instrumentales y e especificación del modelo m
201
Un valor de d DFBETAS mayor que 1.96 1 en su vaalor absoluto demuestra d la prresencia de unna observacióón influyente con respecto a este valor. Suponiendo quue no hay erroores de transccripción de datos, d cualesquuiera de las conclusiones c quue se basen en n el valor estiimado del parrámetro de peendiente partiicular, deberíaan ser calificaadas. Es verdaad como una regla r general que la posibiilidad de que cu ualquier obserrvación particcular que afecctará al parám metro estimado de manera co onsiderable deeclinará confo forme se hagaa más grande el tamaño dee la muestra. Po or consiguientte, una mejor regla empírica es buscar unna observación cuyo valor crítico disminuuye conformee se hace máss grande el tam maño de la muestra. m Una poosibilidad es preocuparse cuando c el vaalor de DFBE ETAS es mayyor en valor abbsoluto que 2/N N . 5.
EJEMPLO 7..2
El efecto de la contaminación c n del aire y el crimen c en el va alor de la prop piedad
Enn un estudio de valores dde la propiedad, Harrison y Rubinfeld d usaron una muuestra de 5066 zonas censaales en la ciuddad de Bostonn para evaluaar la relación en ntre la calidad d de vida en los vecindariios y los valoores de la proopiedad.12 El modelo de regrresión lineal relacionaba el e logaritmo ddel valor meddiano de los hoogares ocupad dos por su prropietario (LM MV) con diveersas variables (14, incluyeendo el términno constante) que describen n la calidad dde los hogares en el vecindaario, la accesibbilidad del vecindario a loss centros laborrales cercanoss y la calidad dee vida en los vecindarios. En este ejem mplo, usado enn el estudio de d HarrisonRu ubinfeld, repo ortamos los reesultados de un u análisis realizado por Beelsley, Kuh y Welsch W de dos variables partticulares del vecindario: v el nivel cuadraddo de óxidos dee nitrógeno, NOXSQ, N y el ínndice de crím menes per cápitta, CRIM. La porción relevante de la l ecuación dee regresión esttimada (con laa estadística t enntre paréntesiis) es:
Debido a que q hay 506 oobservaciones, requeriría deemasiado esppacio enumeraar todas las observaciones o s para las que los residuaales studentizzados fueron m mayores que 1.96 o los DFB BETAS fueronn mayores en valor absolutto que 2/N . 5. Poor consiguientte, hemos enuumerado en ell cuadro 7.1 loos valores dell diagnóstico dee regresión paara las 28 zonnas censales que q excedieronn en magnitud uno de los sigguientes valorres de corte riiguroso:
12 Véase D. Harrison H y D.L. Ruubinfeld, "Hedoniic Housing Pricess and the Demandd for Clean Air", Jou urnal of Environm mental Economics and Management, t, vol. 5, pp. 81-1002, 1978.
202
PARTE DOS: Mode elos de regresión de una sola ecuacción
De los 18 residuales que son mayoores que 2.5 een valor absooluto, las zonaas 372 y 373 so on las más alltas, con valorres t de 4.51 y 4.16, respeectivamente. El E hecho de quee 18/506, o m más del 3% dee los residuales tengan vallores t mayorees que 2.5 sugieere que la supoosición de loss errores norm males puede noo ser apropiadda. Si los erroress estuvieron distribuidos d en n forma normal, sólo 1.24% % de los errorees sería mayor que 2.5 desviiaciones de laa media. Ahora coonsideremos llos DFBETAS. La zona 3881 tiene un DFBETAS D muuy grande para la variable CR RIM; la elimiinación de estta sola zona del d total de 5006 disminuiría el e coeficiente en CRIM en 1.59 desviaciiones estándarr. Una verificación de los datos d mostró qque no había errores e de trannscripción, peero los datos de d crímenes dell FBI son nottoriamente im mprecisos, así que no es so orprendente enncontrar que el e coeficientee en CRIM sea sensible a ppuntos de datoos particularees. Sin embargoo, en el estuddio de valor de d la propiedad original, Harrison H y Ruubinfeld estaban interesadoss en especial en e el coeficiennte de NOXSQ Q. La zona 3881 no presenta problemas p paarticulares parra el coeficiennte NOXSQ, y aunque hayy
CAPÍTU ULO 7: Variables in nstrumentales y esspecificación del modelo m
203
varrios puntos dee datos que tiienen DFBET TAS que exceeden el punto de corte, el maayor (-0.38 para la zona 4413) no es tan n considerablle como paraa causar una preeocupación innusual. En general,, el diagnósticco de regresión sugiere quue los erroress pueden no esttar distribuidoos en forma nnormal, así quue es probablle que la signnificancia de coeeficientes parrticulares sea exagerada. Hay H varios puuntos de datoss particularmeente influyen ntes que haceen peligroso basarse demaasiado en el coeficiente CR RIM. Sin embbargo, el coefficiente en NO OXSQ es muccho menos seensible a los puntos de datos individuales y por consigu uiente es el más m confiable de los dos.
7.5
PRUEBAS R DE ESPECIFIC CACIÓN Accabamos de ver v que las consecuencias c s de los errorres de especiificación en ecoonometría pueeden ser muy graves. La faalla en incluir una variable relevante r en un modelo de reegresión puedde conducir a estimadores e sesgados e incconsistentes, miientras que laa inclusión dde variables inapropiadas i lleva a una pérdida de efiiciencia. Es obbvio que es im mportante podder probar si unn modelo eleggido implica errrores de especcificación. En esta sección exponemos e e ilustramos var arias pruebas que son aplicaables a errores de especiificación. Coomenzamos con c algunas pruuebas que im mplican variabbles omitidass y que se uutilizan en el modelo de reg gresión lineall básico. Lueggo considerarremos una pruueba para errror de medició ón que puedee usarse cuanndo se piensaa que el térmiino del error está correlaccionado con una u o más varriables indepeendientes, o cuuando otras suposiciones s dell modelo básiico pueden faallar.
7.5.1
Prueba para ver si las va ariables deberían omitirse en el modelo m de re egresión lin neal
Annteriormente se s han expueesto las pruebas para los errrores de especificación. Ahhora, supongaa que creemoss que el modeelo apropiadoo está dado po or: (7.18) Si estamos convvencidos de quue la variablee x1 debería esstar en el moddelo pero no esttamos seguross respecto a x2 y x3, entoncces, una pruebba apropiada es e la prueba F que q implica pruebas p conjunntas de varios coeficientes (comentada en e la sección 5.33). La prueba F evalúa la hippótesis nula dee que β2 = β3 = 0 contra la allternativa de que cualquiera o ambas no ssean cero preg guntando si lla suma de cu uadrados del errror asociada con c el modelo restringido (een el que se sostiene la hip pótesis nula) es significativam mente mayor que la suma de cuadradoss del error asoociada con el mo odelo no restriingido que se muestra en laa ecuación (7..18). Del mism mo modo, si x3 fuera la únicaa variable inciierta, una prueeba t de la hippótesis
204
PARTE DOS: Mod delos de regresión n de una sola ecua ación
nula de que β3 = 0 podríía hacerse enn forma direccta usando la producción de d regresión cuuando se estim ma la ecuaciónn (7.18). El métoddo más generral para hacerr las mismas pruebas p que no n utiliza mínnimos cuadraddos y no se basa en la norm malidad del ttérmino del errror (cuando el tamaño de la muestra es grande) es la pruueba de razón de verosimilittud. Esta pruebba se expondrá en el capítuloo 10.13 En la maayor parte dee las situacionnes, en especiial en aquellaas que implicaan tamaños de muestra granndes, las pru uebas F y lass pruebas de proporción de d probabilidadd generan resuultados muy parecidos. p Deependiendo deel software quue se esté usand do, la prueba dde proporciónn de verosimillitud puede seer más difícil dde aplicar, peroo es más atracttiva cuando esstán implicadaas muestras grrandes debidoo a 144 que no se requiere una suuposición de normalidad. n
7.5.2
Prrueba para la presenciia o ausenccia de e errores de e medición
Supóngase que q estamos interesados i en estimar el m modelo de reegresión de doos variables: yi = βx β i + εi pero estamos preocupadoss por la posibilidad de que x podría meddirse con errorr.15 Si xi = xi* - vi, entonces la regresión de d mínimos cuuadrados reall sería: (7.19) donde, 13 Supóngaase que el valor de d la función de log-verosimilitud l d asociada con el modelo no restriin gido está dado por p L(β1, β2 , β3), mientras que el valor v (menor) deel modelo restring gido está dado poor L(β1). Entonces, para muestras grandes, resultaa que:
donde el subínd dice 2 se refiere al número de resstricciones que sson impuestas (β2 = 0 y β3 = 0). La pruebaa de razón de verrosimilitud puedee aplicarse en forrma general. Cuaalesquiera que seean las restriccioness en los parámetroos del modelo (reestricciones de quue las β o la variaanza del error tom man valores particullares), se cumplee que:
donde14r es el núúmero de restriccciones implicadaas. Para unna comparación ggeneral de pruebbas F (un caso eespecial de una prueba p Wald), laas pruebas de propporción de verosiimilitud y una terrcera prueba de m multiplicadores dee Lagrange, véasse Robert F. Englee, "Wald, Likelihhood Ratio, and Lagrange L Multipplier Tests in Ecoonometrics", en Z. Z Griliches y M.D D. Intriligator (eds.), Handbook off Econometrics, vool. II (Amsterdam m: Elsevier Science Publishers, 198 84), capítulo 13. 15 El mism mo enfoque se apllica si estamos prreocupados porquue x podría estar correlacionada con el término del error e debido a sim multaneidad. Parra detalles, véasee el capítulo 12.
CAPÍÍTULO 7: Variables s instrumentales y especificación de el modelo
205 5
Si x se miide con errorr, hemos vistto que se pueede obtener un u estimadorr co onsistente de β usando un iinstrumento z que se correllacione con x* x pero que noo see correlacione con ε y v. Suppóngase que laa relación entrre z y x* está dada d por: (7.20)) Cuando se estiima usando m mínimos cuadrrados, esta reelación se vueelve
o (7.21)) doonde Ŵi son loos residuales dde la regresiónn. La sustituciión de la ecuacción (7.21) enn laa ecuación (7.19) produce lo siguiente: (7.22))
Haya un error de meedición o noo, el coeficieente de x^ i* será estimadoo coonsistentemen nte por los m mínimos cuadrrados ordinarrios, dado quee
De hecho, el esstimador de mínimos D m cuadrrados del coefficiente de x^ *i en la ecuaciión (7.22) es idénticamente i e igual al estim mador de varriables instrum mentales,16 lo cuual está dado [a partir de laa ecuación (7..8)] por βˆ= Σyizi /Σ xi*zi. Paara consideraar el coeficiennte de la variaable ŵi, nótesee que:
Cuando no hayy error de meedición, σ 2v = 0, de modo qque los OLS aplicados a a laa eccuación (7.22 2) generarán uun estimadorr consistente del coeficiennte de ŵi. Sinn em mbargo, cuanndo hay un error e de meddición, el coeeficiente será estimado enn foorma inconsisstente. Esto sugierre una pruebaa del error de medición m relattivamente fáccil. Supóngasee quue δ represeenta el coefiiciente de laa variable ŵi en la ecuaación (7.22).. Su ustituyendo x^ *i = xi* - ŵi, obbtenemos; (7.23)
16
La prueba implica un desarrrollo considerablle de álgebra y see omite aquí.
206
PA ARTE DOS: Mode elos de regresión de d una sola ecuacción
Sin error de medición, δ = β, de mod do que el coefficiente de ŵi sería igual a cero. Sin emb bargo, con error de medicióón, δ ≠ β, y el ccoeficiente seerá (en generall) diferente de cero. Podem mos probar el error de meedición hacienndo un proceedimiento sim mple de dos etaapas. Primera, hacemos la regresión r de x* x sobre z parra obtener los residuales r ŵ. Luego, haceemos la regreesión de y soobre x* y ŵ y realizamos unna prueba t een el coeficien nte de la variable ŵ. Si esttamos preocuupados con el error e de medicción en más de d una variablee de un modello de regresiónn múltiple, pod dría aplicarse una prueba F equivalentee. La pruebba que se acabba de describiir es un caso especial de un na prueba máás general para el error de esspecificación propuesta poor Hausman.177 La prueba de d especificacióón de Hausmaan se basa en el hecho de qque bajo la hipótesis nula el e estimador dee mínimos cuuadrados ordinnarios de los parámetros de d la ecuacióón (7.19) originaal es consistennte y (para muestras m granddes) eficiente, pero es inconnsistente si la hipótesis altternativa es verdadera. v Sinn embargo, ell estimador de d variables insstrumentales [[el estimadorr de mínimoss cuadrados de d la ecuacióón (7.22)] es co onsistente, sea verdadera la l hipótesis nnula o no, auunque es inefi ficiente si la nula n no es vállida. Expondrremos la apliccación generaal de la pruebba Hausman cuaando veamoss el uso de vaariables instruumentales en el contexto de d ecuaciones siimultáneas enn el capítulo 12.
EJEMPLO O 7.3
Prueba para error e de mediciión en un mod elo de gasto p público
Los gastos dee los gobiernos estatales y loocales de Estaados Unidos (E EXP) varían en e forma considderable por esstado y por reggión. Entre laas variables im mportantes quue explican difeerencias en los niveles de gasto g son los subsidios parra ayuda (AID D) federales, el ingreso de loos estados (IN NC) y la poblaación de los estados e (POP). Cuando se esstimó un moddelo que relaciiona la variabble dependientte EXP con laas variables inddependientes AID, A INC y POP P por mínnimos cuadraddos ordinarioss, usando datoss censales parra los 50 estad dos (véase el cuadro 6.2 paara los detallees relativos al conjunto c de datos), d se obtuuvieron los siiguientes resu ultados (con la l estadística t entre parénteesis):
Hay unaa posible e im mportante fuente de error de medición en la variablle AID. Los proogramas de asistencia a estaatal implican sumas fijas de d dinero y poor consiguiente los fondos implicados soon fáciles de medir aun anntes de que se s establezcan los l presupuesstos estatales y locales. Sinn embargo, ottros programaas son abiertos, con la suma real r que recibbe un estado o localidad sieendo una fun17 Véase J.A. J Hausman, ""Specification Teests in Economettrics", Econometrrica, vol. 46, ppp. 1251-1271, noviiembre de 1978.
CAPÍTU ULO 7: Variables in nstrumentales y esspecificación del modelo m
207
cióón de los nivelles de gasto reeales de esos gobiernos. Coomo resultado o, este compon nente de la vaariable AID ppuede estar suujeta a un errror de medició ón considerab ble. Podemos haacer la prueba de especificacción Hausmann para probar la l presencia de error de meddición. Para reealizar la prueeba, usamos lla población de d niños de esccuelas primariias y secundarrias (PS) com mo un instrumeento. (El gastto escolar es el componente mayor de loos gastos púbblicos estatales y locales, y muchos pro ogramas escolares son abieertos.) La pru ueba procede en dos etapass. En la primeera etapa se hace h la regressión de AID sobre s PS, y la variable ressidual ŵi se callcula como siggue:
En la segunnda etapa ŵi see añade a la reegresión origiinal para corregir el error de medición. Laa ecuación ressultante es:
Un na prueba t biilateral de la hipótesis h nulaa de que no hhay error de medición m se aceeptaría en el nivel n del 5%, ya que 1.73 < 1.96. Sin em mbargo, el errror de medició ón sería consiiderado impoortante si estu uviéramos usando ya sea una prueba uniilateral o una bilateral en uun nivel de significancia del 10%. Nóteese, en cualquiier caso, que corregir la posibilidad dell error de meedición ha dissminuido en forrma consideraable el coeficiiente en la varriable AID, loo que sugiere que el error de medición cauusa que el efeecto de AID en el gasto púbblico sea exaggerado.
AP PÉNDICE 7..1 Esttimación de va ariables instrum mentales en fo rma de matriciial
La técnica de variables instruumentales pu uede usarse paara obtener esstimaciones connsistentes de β cuando se sabe que lass variables dee la derecha están e correlaccionadas con el término ddel error com mo un resultaddo de los errrores en las varriables o en ell sesgo de la eecuación simuultánea. Si nueestro modelo original o es: (A7.1) la correlación c d una o más X y el términno del error ε se resume co de omo
(A7.2)
208
PARTE DOS: Mod delos de regresión n de una sola ecuación
La expresión "plim" (proobability limit)) se refiere al límite en pro obabilidad com mo se definió en e el capítulo 2. Para ver laa dificultad que q surge cuanndo la ecuación (A7.2) se soostiene, premuultipliquemoss la ecuación (A7.1) por laa matriz X' paara obtener:
Si plim [(1/N /N)X'ε] = 0, el último términ no va a 0 en eel límite de pro obabilidad y (A77.3) es un estimaador consistennte de β. Sin em mbargo, cuanddo el límite en probabilidad no es cero, la estimación e de mínimos cuaadrados ordinaarios se vuelvve inconsistentte. Estimacciones consisttentes de β puueden obtenerrse por medio o del uso de una u matriz N x k de instrum mentos Z = (Z1, Z2, . .., Zk), donde cada instrumento Zi tiene N obseervaciones. Z satisface s las condiciones neecesarias para ser denominaada una matriz de instrumenntos si se man ntienen las sigguientes condiciones:18 (A77.4) (A77.5) (A77.6) La primera condición gaarantiza que cada instrum mento no está correlacionaado con el término del error,, mientras quee la segunda ggarantiza unaa correlación no cero entre las l Z y las X al igual quee el hecho dee que todas las l Z deben ser s linealmentee independienttes. Por tanto,, no hay razónn por la que no o puedan usarrse algunas de las X originaales como insttrumentos en el proceso dee estimación de variables innstrumentales.. Dados los l instrumenntos apropiaddos, premultipplicamos la ecuación e (A7..1) por Z' para obtener:
de lo cual see deriva que: (A77.7) 18 Con errrores en las variaables, Z tampocoo debe estar relaccionado en el lím mite en probabiliddad con el error dee medición.
CAPITU ULO 7: Variables instrumentales y eespecificación del modelo m
209 será s
un estim mador consisteente de β. βˆ* será s consistennte debido a que: q
Para encontrar laa distribución apropiada dee βˆ*, necesitam mos derivar V, V la matriz de varianza-cova v arianza asintóótica para βˆ*. Para lograr esto, usamos el e hecho de quee:
de lo l cual resultaa, usando las ecuaciones (A A7.5) y (A7.66), que
En la práctica, la matriz de varianza-cova v arianza verdaddera puede esstimarse de mannera consistennte por: (A7.9) donnde s2 es un esstimado consistente de σ2:
Nóttese que s2 se calcula a parttir de los residduales de la eccuación originnal, no de la ecuuación en la que q los instruumentos remplazan a las variables originales de la derecha.
210
PARTE DOS: Mo odelos de regresión de una sola ecu uación
EJERCICIO OS 7.1 Expliquue, brevemente, por qué el errror de mediciónn en las variables de la derechha conducen a estimadores e incconsistentes y sesgados mienntras que el erroor de medición en las variabless de la izquierdda no. 7.2 Muestree en el modelo dde dos variablees que βˆ= Σyizi //Σz 2 (donde z es e un instrumenni to) no produ ucirá un estimador consistennte del parámeetro de pendiennte. ¿Hay alguuna condición bajo la cual el estimador e de vaariables instrum mentales descrrito producirá uun estimador coonsistente de ββ? 7.3 Demuesstre que la omisión de una vaariable de un m modelo de regreesión "verdaderro" conducirá a un estimador ssesgado del inteercepto de la reegresión. ¿Bajoo qué condicionnes especiales laa tendencia se vvolverá cero? 7.4 Suponga que el modello de regresión n verdadero es de la forma
Si se ejecutaa la regresión yi = β *2 x2i + ε*i , ¿qué puede decir acerca de d la dirección del sesgo del cooeficiente de peendiente? 7.5 Demuesstre que el coefficiente de unaa variable irreleevante tendrá un u valor esperaddo de 0. Sugereencia: Usando el análogo de la l ecuación (7..12), resuelva para p el parámettro estimado βˆ*3 y luego tom me valores espeerados. 7.6 Demuesstre que la incluusión de una varriable irrelevannte no hace sesg gado el estimaddor de intercepto o. 7.7 Supongaa que cree que el e modelo verddadero está dadoo por Y = β2X2 + β3X3+ …+ βkXk + ε. ¿Qué se s gana o se piierde al ejecuttar la regresiónn en el modelo o Y = β1 + β2X2 + β3X3 + … + βkXk + ε? 7.8 Expliquue por qué las obbservaciones qu ue caen lejos dee la media de unna variable tiennen más probabiilidad de tener influencia inussual que aquellaas que se encueentran cerca dee la media. 7.9 Considerre el modelo de regresión yi = β1 + β2X2 + β3X3i + εi. Suponga que está preocuu pado de que tanto x2 como x3 son medidas con c error, y quee z2 y z3 son con nsiderados comoo instrumento os posibles paraa x2 y x3, respeectivamente. ¿C Cómo realizaríía una prueba de d especificación Hausman ppara evaluar la presencia o auusencia de erro or de medición??
CAPÍTULO
8
PRONÓSTICO CON UN MODELO DE REGRESIÓN DE UNA SOLA ECUACIÓN
El principal objetivo para construir modelos de regresión de una sola ecuación es pronosticar. Un pronóstico es un estimado cuantitativo (o conjunto de estimados ) acerca de la verosimilitud de eventos futuros, que se elabora con base en información pasada y actual. Esta información está expresada en la forma de un modelo: un modelo estructural de una sola ecuación o, como expondremos en las partes tres y cuatro de este libro, un modelo de ecuación múltiple o un modelo de series de tiempo. Al extrapolar nuestros modelos más allá del periodo durante el cual fueron estimados, podemos hacer pronósticos sobre eventos futuros. En este capítulo mostraremos cómo el modelo de regresión de una sola ecuación puede usarse como una herramienta de pronóstico. Con frecuencia se piensa que el término pronóstico sólo se aplica a problemas en los que predecimos el futuro. Seremos consistentes con esta idea al orientar nuestra notación y exposición hacia el pronóstico de series de tiempo. Sin embargo, enfatizamos, que la mayor parte del análisis se aplica igual de bien a modelos de corte transversal. Pueden ser útiles dos tipos de pronóstico. Los pronósticos de punto predicen un solo número en cada periodo pronosticado, mientras que los pronósticos de intervalo indican un intervalo en el que esperamos que se encontrará el valor futuro. Comenzamos por examinar los pronósticos puntuales, después de lo cual consideraremos cómo los intervalos de confianza (pronósticos de intervalo) pueden usarse para proporcionar un margen de error alrededor de los pronósticos puntuales. La información proporcionada por el proceso de pronóstico puede usarse en varias formas. Los pronósticos, a menudo, son usados como guías para políticas públicas y privadas. Un pronóstico de una tasa alta de inflación que se basa en 211
212
PARTE DOS: Mod delos de regresión n de una sola ecu ación
la suposicióón de un défi ficit presupueestal grande ppuede conduccir a alterar llos planes presuupuéstales dee los que haccen las polítiicas, o un prronóstico de un u incremento en la demannda mundial de petróleo ccrudo puede conducir a los l constructorees de buques a invertir en barcos b petroleeros nuevos. Los L pronósticcos también son n útiles comoo lineamientoos para la coonstrucción de d modelos. Un U pronóstico que q se encuenntra muy desvviado de su obbjetivo, cuanddo se dispone de datos, realees, proporcionna informacióón que puedee conducir a la revisión del d modelo que proporcionó el pronósticoo. Es útil distinguir d entrre el pronóstico ex post y el e ex ante. En n función de los l modelos de series de tiem mpo, ambos producen vallores de una variable v depeendiente más allá a del perioodo usado parra estimar el m modelo. En un u pronóstico ex post, las obsservaciones enn las variabless endógenas y en las variabbles explicativvas exógenas yaa se conocen con certeza durante el peeriodo pronossticado. De esste modo, los pronósticos p exx post pueden n verificarse ccontra los daatos existentess y proporcionaan un medio ppara evaluar un u modelo de pronóstico. Un U pronóstico ex ante tambiénn predice valoores de la varriable dependiente más alláá del periodo de estimación original, peroo usa variablles explicativvas que pueden conocersee o pueden no conocerse c aúnn con certeza. La distinciónn entre el pronnóstico ex posst y ex ante puedde verse en laa figura 8.1. También n puede hacerrse una distin nción entre proonóstico conddicional e incoondicional. Enn un pronóstiico incondicioonal, los valoores para todas las variablles explicativas en la ecuacióón de pronóstiico se conocenn con certeza. Cualquier prronóstico ex po ost es, por suppuesto, un pronóstico inconndicional, peroo los pronósticcos ex ante tam mbién puedeen ser inconddicionales. S Supóngase quue para alguuna industria, poor ejemplo, laas ventas mennsuales S(t) esstán relacionaadas linealmennte con dos variiables X1 y X2, pero con rezzagos de 3 y 4 meses, respeectivamente. (88.1) Si esta ecuaación fuera esstimada, podríía usarse paraa producir proonósticos incoondicionales de d S(t) 1, 2 y 3 meses en el futuro. Poor ejemplo, para producir un pronóstico a tres meses dde S(t), usaríam mos el valor aactual de X1 y el valor del mes m anterior de X2, los cuales son conocidoos. En un pronóstico p conndicional, los valores para una o más vaariables expliccativas no se conocen, asíí que se debeen usar supossiciones (o prronósticos) paara producir un pronóstico dee la variable dependiente. d S Si deseamos usar u la ecuacióón
Figura 8.1 1
Tipos de pronóstico.
CAPÍTULO 8: Pronóstico P con un modelo m de regresió ón de una sola ecuación
213
(8.1) para pronoosticar S(t) cuuatro meses en e el futuro, también tenddríamos que proonosticar Xt(t)) un mes en el e futuro, hacciendo nuestroo pronóstico de d S(t) condiccional a nuesstro pronóstico de Xt(t). Po or supuesto, si el lado deerecho de la ecuuación de pronóstico no coontenía rezago os, por ejemplo, si fuera de la siguiente forrma: (8.2)
cadda pronóstico o ex ante gennerado por laa ecuación serría un pronósstico condicioonal. En este cappítulo, algo muuy importantee es el probleema de evaluaar la naturalezza del error dee pronóstico uusando las pruebas estadísticcas apropiadass. Definimos el mejor m pronósttico como aquuel que producce el error de ppronóstico conn la varianza míínima. En el modelo m de reggresión de unna sola ecuaciión, la estimaación de mínim mos cuadradoos ordinarios pproduce el meejor pronósticco entre todoss los estimadores insesgadoos lineales. E Extenderemos nuestra nociión del mejorr pronóstico en capítulos posteriores p cuuando consid deremos los pronósticos con error cuaadrá-tico meedio mínimo que se basaan en ecuaciones no linneales y en proocedimientos de estimación que no garaantizan estimadores insesggados de los parrámetros. El error aso ociado con unn procedimieento de pronóóstico puede provenir de unna combinació ón de cuatro fuentes distintas. Primeraa, la naturaleza aleatoria dell proceso de error e aditivo en un modeloo de regresiónn lineal garanntiza que los pro onósticos se desviarán d de llos valores veerdaderos aun si el modelo es especificaddo en forma correcta c y suss valores de parámetro p sonn conocidos. Segunda, el pro oceso de estim mar los parám metros de regrresión introduuce error debiddo a que los valores de paráámetro estimaados son variaables aleatoriias que puedeen desviarse de los valores de d parámetro verdaderos. Tercera, en el e caso de unn pronóstico conndicional, loss errores son introducidos cuando se haacen pronósticcos para los vallores de las vaariables expliccativas para el e periodo en qque se hace ell pronóstico. Cuuarta, los erro ores pueden sser introduciddos debido a que q la especificación del moodelo puede no n ser una reppresentación precisa p del m modelo "verdaadero". Continuarem mos con la exxposición del mejor m pronósttico y las proppiedades del errror de pronósttico encontradas en tres caasos diferentees. Abordarem mos primero loss pronósticos incondicionaales generadoss por un modeelo de regresiión lineal en el que el processo de error obbedece a las suuposiciones del d modelo lin neal clásico. Deespués, se trattará el problem ma del pronósstico incondiccional cuando se sabe que el proceso de errror está correelacionado en forma serial. Por último, considerarec moos la dimensió ón agregada de d dificultad que q surge cuaando se intentta el pronóstico condicionall.
8.1
PRONÓSTIC CO INCONDICIONAL Paara producir un u pronóstico incondicionaal a partir de un modelo de d regresión, lass variables expplicativas debben conocerse con certeza ppara el periodo o entero del
214
PARTE DOS: Mod delos de regresión n de una sola ecua ación
pronóstico. Una U forma enn que puede ocurrir o esto ess haciendo quue las variables explicativas aparezcan coon rezagos de tiempo. Aunn si las variablles explicativvas no aparecen con rezagos, podemos serr capaces de ppronosticarlas perfectamentte, generando de d este modo pronósticos incondicionaales para la variable v depenndiente, si ressultan ser varriables estacioonales o variaables demográáficas o econnómicas que cambian en foorma lenta y predecible. Por P ejemplo, los l pronósticoos mensuales a lo largo de unn horizonte dee 1 año los cuaales utilizan laa población y el mes del año o como dos vvariables explicativas seránn incondicionnales, ya que el crecimiento de la poblacción durante este e periodo corto puede predecirse coon precisión y en e vista de quue se conoce con c certeza el mes del año o.
8.1.1
E error de pronóstico El o
Comenzarem mos el análisiss del pronóstiico incondicioonal consideraando el modeelo de regresión n simple de doos variables: (8..3)
Planteamos el e problema ddel pronóstico como sigue: ddado un valorr conocido XT++1 , ¿cuál es el mejor m pronósttico que puedde hacerse parra Y en el periodo T + 1? Al A solucionar ell problema, assumimos que α y β son connocidos. Si ésste es el caso, el pronóstico appropiado paraa XT+1 está daddo por: (8.44) Para ver por qué, considereemos el error de pronósticoo (8.55) Este error dee pronóstico ttiene dos prop piedades deseeables: es insesgado o. 2. La vaarianza del errror de pronósstico
de moddo que el pronóóstico de XT+1
es la variannza mínima eentre todos lo os pronósticos posibles quue se basan en e ecuaciones liineales.1
1
σ, la raaíz cuadrada de la vvarianza del error de pronóstico, es llamada l error está ándar del pronóstiico.
CAPÍTULO 8: Pronóstico con un modelo m de regresió ón de una sola ecu uación
215
Dado que ell error de pronnóstico está distribuido d en forma normall con media 0 y varianza σ2, podemos p realiizar pruebas dee significanciaa en el valor pronosticado de Y calculando el error norm malizado (8.6)
Daado que λ está distribuida enn forma norm mal con media 0 y desviació ón estándar 1, determinamoos un intervaloo de confianzza del 95% ussando el hechho de que: (8.7)
donnde λ.05 se obttiene de una taabla de la distrribución norm mal (usando unna prueba de sig gnificancia del 5%). Escribbimos el intervvalo de confiaanza como: (8.8)
El intervalo de confianza c del 95% para un modelo m de reggresión de dos variables típico se muestrra en la figuraa 8.2. Los intervallos de confiannza proporcion nan una pruebba simple de la confiabilidaad del modeloo de regresiónn. Cuando se obtiene el vallor real de XT+1 T , podemos com mpararlo conn el valor proonosticado coon anterioridaad. Si YT+l see encuentra denntro del intervvalo de confiaanza del 95% %, el modelo ees satisfactorio o, pero si el vallor se encuenttra fuera del iintervalo, el modelo m no se está e desempeñando bien. Al conocer que este desempeño deficientte se debe a un u evento exttraordinario quee no es expliccado por el m modelo, es prob bable que espperemos un seegundo pronósstico antes dee concluir quue el modelo es poco connfiable, pero como regla genneral tomamoos el pronóstiico deficientee como evideencia de la neecesidad de revvisar la estructura del modeelo básico.
Figura 8.2 Pronóstico en el e que se conocen los parámetros de la ecuación.
216
PARTE DOS: Mod delos de regresión n de una sola ecua ación
El uso del d pronósticoo como un meedio para evalluar la confiaabilidad del mom delo es bastaante distinto ddel uso de las estadísticas t, F y R2 clásiccas descritas con anterioridadd en este libroo. Un modelo de regresión de una sola ecuación puede tener una esstadística t siggnificativa y una u R2 alta y aun a así pronoosticar en form ma muy deficiennte. Esto puedde resultar dee un cambio estructural quee ocurre durannte el periodo de d pronóstico que no es exxplicado por eel modelo. Por otra parte, llos buenos pronnósticos pueden venir de modelos m de reegresión que tienen t R2 relaativamente bajas y uno o m más coeficientees de regresión insignifican ntes. Esto pueede suceder cuaando hay muyy poca variacción en la varriable dependdiente, de moddo que aunque no está siendoo explicada biien por el moddelo, es fácil de d pronosticarr. Por lo general, g los paarámetros del modelo de reegresión son variables v aleattorias que se han h estimado. Con frecuenccia tampoco ssabemos la vaarianza del errror σ2, de modoo que ésta taambién es unaa variable aleeatoria estimada. Por consiguiente, se nos n permite rreconsiderar el e problema ddel pronóstico bajo la suposición más reaalista, de que tanto los paráámetros de regresión comoo la varianza del d error deben estimarse. El mejor pronósstico para YT+ 1 es determinado, entoncess, a partir de unn procedimiennto de dos etaapas simple: 1. Estim mamos la ecuaación (8.3) ussando mínimoos cuadrados ordinarios. 2. Elegiimos El error de pronóstico p es entonces; (8.9)) Hay doss fuentes de error implicad das en la ecuacción (8.9), la primera p se deebe a la presencia del d término de error additivo εT+1 y la segundaa, a la natuuraleza aleatoria dee los parámettros de regreesión estimaddos. Mientrass la primera fuente de error see debe a la varianza v en la l variable Y, Y la última fuente de errror es sensible al proceso de estimación e y, por consiguuiente, al núm mero de graddos de libertad. Veeremos esto mientras exaaminamos la distribución n del error dde pronóstico. Para comenzar, el errror de pronósstico se distribbuye en form ma normal, daado que es una función lineaal de α^ , βˆ y εT+1 s cuales están n distribuidos en T , todos los forma norm mal. Segundo, tiene media 0, ya que: (8.110) ^
(Recuérdesee que α^ y β sson estimadorres insesgadoss y que XT+ 1 se s conoce.) Poor último, podeemos determiinar la varianzza de êT+1:
CAPÍTULO 8: Prronóstico con un modelo m de regresió ón de una sola ecu uación
217
Ob bserve que tod dos los términnos de producctos cruzados qque implican parámetros estiimados y εT+1 se vuelven 00, cuando se to oman los valoores esperadoss, dado que α^ -α α y βˆ- β dependen de ε1, . . ., εT, todoos los cuales son indepenndientes de εT+11. Recuérdesee que derivam mos con anterrioridad (capíítulo 3) las vaarianzas de ^ α y βˆal igual que su covariaanza: (8.13) (8.14) (8.15) donnde las sumattorias corren de 1 a T y X es la media muestral de X para las prim meras T obseervaciones. Suustituyendo las l ecuacionees (8.13) a (88.15) en la ecuación (8.12) y manipulanddo términos, obtenemos: o
La ecuación (8.19) nos dicce que el erroor de pronósticco es sensiblee al tamaño de laa muestra usaada en el prooceso de estim mación al iguaal que la variaanza en X y la diistancia entre XT+1 y X.2 Enttonces, siendo o iguales otras cosas, entre mayor sea el taamaño de la muestra y m mayor la variianza en X, sserá menor el e error de pronnóstico. Adem más, el error dee pronóstico es más pequeñño cuando XT+ll resulta ser iguaal a la media muestral m de X X, dado que ell último térmiino entre corcchetes en la ecuaación (8.19) see vuelve 0. Essto sugiere quee los mejores pronósticos reespecto a Y puedden hacerse para p valores dee X alrededor de los cuales se dispone dee 2 La ecuación (8.19) ( muestra ell error para un pronóstico p puntuual. Si pronosticaamos el valor esperrado del resultadoo, la ecuación es modificada omittiendo el 1 en la expresión entre corchetes. c Ese térmiino se añade al valor v esperado de la varianza del error e de pronósticco asociada con laa selección de un soolo pronóstico dee la distribución dde pronósticos poosibles.
218
PARTE DOS: Mo odelos de regresió ón de una sola ecu uación
más información muestraal. Esto no es sorprendente: s conforme el nuevo n valor de d X se aleja de la media, see sale del ranngo de experiencia usado para estimarr el modelo y geenera pronóstticos menos coonfiables. En general, es peeligroso extennder un modelo mucho m más alllá de su rangoo de estimacióón. Cuando loos pronósticoss de series de tieempo implicaan valores de XT+1 que son considerablem mente diferenntes de X, el errror de pronósttico resultantte puede ser ggrande. Si σ2 fuera f conocidda, podríamoss calcular σ2ƒ y luego proceder a constrruir intervalos de d confianza como antes, basándonos b e el conocim en miento de que:: (8.20)
Sin embarggo, generalmeente σ2 no see conoce, así que por cuesstiones práctiicas usamos s2 como c un estim mador insesgaado y consisteente de σ2: (8..21) Como vimoos en el capítuulo 3, esto no os permite callcular intervalos de confiannza usando la distribución d t. Al escribir laa varianza del error de pronnóstico estimaado: (8.222) sabemos quue el error normalizado:
tendrá una distribución t con T- 2 grrados de liberrtad. Por tantoo, el intervaloo de confianza del d 95% paraa ŶT+1 está dado por: (8..23)
Un ejemplo o del intervallo de confianzza del 95% see muestra en la figura 8.3. Los priincipios que se acaban de exponer tam mbién se aplican al modeloo de regresión múltiple. m Los intervalos de confianza paara pronósticoos generados por un modelo de regresiónn múltiple tenndrán la mism ma forma quee los de la figgura 8.3. Sin em mbargo, cuanddo están preseentes dos o más m variables explicativas, las derivacionees algebraicass de la distribuución del erroor de pronóstiico y el intervvalo de confianzza del pronósstico se vuelveen más compplejas. Relegarremos la expoosición formaal del modelo de regresión múltiple al aapéndice 8.1.
CAPÍTULO 8: P Pronóstico con un modelo de regresiión de una sola eccuación
219
Figura 8.3
Intervalos de confianza c del pronóstico o.
8.1.2 Evalua ación de pro onósticos Deespués de quee estimamos uun modelo de regresión y loo usamos paraa pronosticar la variable depeendiente, ¿cóm mo podemos evaluar este pronóstico? Una U estadísticca importante es la varianzaa del error de pronóstico quue acabamos de derivar y el intervalo de confianza c dell 95% asociad do. Este intervvalo de confiaanza proporcio ona una buenna medida de la precisión del d pronósticoo. Además, po odemos simullar el modeloo resolviéndoolo a lo largo del tiempo, usando valores reales para llas variables explicativas. (Si la ecuaciión contenía un na variable deppendiente rezaagada, usaríam mos el valor ppronosticado de d esa variablee, actualizánddolo periodo ppor periodo, para crear unna simulación n dinámica.) Duurante el periodo para el qque tenemos datos, d podríam mos comparaar, entonces, lass series pronossticadas con laas series realess. El objetivo ees ver qué tan cerca está la vaariable pronossticada de su serie de datoss correspondiiente. Pueden usaarse varias esttadísticas dife ferentes para m medir en form ma cuantitativva qué tan cerrca está la varriable pronostticada de los datos reales. Una medida quue se usa a mennudo es la raízz cuadrática media m (rms, rooot-mean-squa are) del error de pronóstico. La L rms del errror para la varriable Yt se deffine como: (8.24) doonde Yts = valo or pronosticaddo de Yt Yta = valoor real T = núm mero de perioddos
220
PARTE DOS: Mod delos de regresión de una sola ecuación
La rms del d error es unna medida de la l desviación de d la variable simulada de su curso en el tiiempo. Por suupuesto, la maagnitud de estte error sólo puede p evaluarse comparándoola con el tam maño promediio de la variaable en cuestió ón. Otra estaadística útil ess el coeficientee de desigualddad de Theil, el e cual se definne como:
Nótese que el numeradorr de U es justto la rms del error de pronnóstico, pero la escala del deenominador ess tal que U sieempre caerá enntre 0 y 1. Si 17 = 0, Yts = Yta para toda t y hay un ajustte perfecto; sii U = 1, el deesempeño quee pronostica del d modelo es taan malo comoo podría ser. Por P tanto, el ccoeficiente de desigualdad de Theil mide la l rms del errror en término os relativos. El coeficciente de desiigualdad de Theil T puede deescomponersee de una maneera útil. Puede demostrarse d een forma algeebraica que: (8.226) donde Ys, Ya, σs y σa son las medias y desviacioness estándar de las series Yts y Yta, respectiivamente y ρ es su coeficiente .de correlación; es decir, ρ = (1/σsσaT)∑(Yts - Ys)(Yta - Y a). Podemoss definir entoonces las prop porciones de la desigualdad como: c
(8.227) (8.228) y
(8.229) Las proporciiones UM, Us y Uc son llam madas las prooporciones de sesgo, variannza
y covarianzaa de U, respecctivamente. Son S útiles com mo medios parra descomponner el error de simulación s en sus fuentes características c s. (Nótese quee UM + Us + Uc = 1.)
CAPÍTULO 8: Pronóstico con un n modelo de regressión de una sola ec cuación
221
La proporción de sesgo UM es un indiccio de error sisttemático, dadoo que mide la exxtensión en laa que los valoores promedioo de la serie simulada s y reaal se desvían enntre sí. Cualquuiera que sea el valor del coeficiente c de desigualdad U, esperaríamos m que UM esstaría cerca dee cero. Un vaalor grande dee UM (arriba de d 0.1 o 0.2) sig gnificaría quee está presentte un sesgo sistemático, así que es necesaria la revisió ón del modeloo. La proporcción de varianzza U s indica la l capacidad ddel modelo paara replicar el grrado de variabbilidad en la vvariable de innterés. Si U s es e grande, siggnifica que la seerie real ha fluuctuado en forrma consideraable mientras la serie simuulada muestra pooca fluctuacióón, o viceverrsa; esto indiccaría de nuevvo que el moodelo debería reevisarse. Por último, la prooporción de covarianza c UC mide el error que no es sistemático; es decir, represeenta el error reestante despuéés de que se han h explicado laas desviacionees de los valorres promedio.. Dado que noo es razonablee esperar que laas prediccionees se correlaciionen a la perrfección con los resultadoss reales, este co omponente deel error es meenos inquietaante que los otros o dos. En efecto, para cu ualquier valorr de U > 0, laa distribuciónn ideal de la ddesigualdad sobre s las tres fuuentes es UM = Us = 0 y UC = 1. EJEMPLO 8..1
Prronóstico de prromedios de ca alificaciones
Reconsidérese el ejemplo deel promedio de R d calificacionnes expuesto en e los capítuloos 1 y 3. En ese e ejemplo estimamos e un na relación linneal entre el promedio p de caalificaciones (Y) y el ingreso familiar (X) para un ccorte transverrsal de ocho inndividuos. Ahoora estamos een posición dee pronosticar el e promedio de d calificacionees de individuuos que no están en la muuestra originaal, dada sólo información soobre sus ingreesos familiarees. En función n de la notación usada en el e capítulo 1, laa información relevante es como sigue: Líínea de regreesión estimadda = Ŷi = 1.3375 + .12Xi V Varianza del error e estimadda = s2 = .109 9 X ¯ = 13.5
2
∑(Xi - X ¯ ) = 162
CU UADRO 8.1 CÁ ÁLCULOS DEL PRONÓSTICO P D DEL PROMEDIO O DE CA ALIFICACIONES S
N=8
222
P PARTE DOS: Modelos de regresión de una sola ecua ación
Figura 8.4
Bandas de confianza cuando se estiman la pendiente y el intercepto.
Vamos a supponer que vaarios individuuos que no están en la mu uestra original reportan su inngreso familiar. Deseamoss predecir el promedio p de calificaciones c y calcular interrvalos de conffianza. Los cáálculos relevanntes se resumeen en el cuadrro 8.1, mientrass que las banddas de confian nza del 95% sse muestran en e la figura 8.44. En el cuadro o 8.1, vemos en la primeraa columna quue el error máás pequeño del d pronóstico see asocia con el ingreso famiiliar de 13 5000 dólares, el ingreso familiaar medio de la muestra origginal. Para esste individuo podemos esttar, razonableemente, confiaados de que eel promedio de calificacionnes final caeráá en el rango de d 2.1 a 3.9. El hecho h de que el e intervalo de predicción deel 95% sea tan n grande, aun en e el punto de error de proonóstico míniimo, sugiere la naturalezaa limitante del modelo de prromedio de caalificaciones. Es E probable que q un modeloo más complejjo (con variablees explicativas adicionales)) y más obserrvaciones muééstrales conduucirían a un inntervalo de prronóstico men nor. Tambiénn debemos nottar que el erroor de pronósticco crece en foorma no lineal conforme los valores para p el ingresso familiar se in ncrementan m más allá de la media. De heecho, el interv valo de pronóstico para el último ú individduo (con ingreeso familiar de 27 500 dólaares) no sólo es e grande sino también t irreaal, dado que el promedio dee calificacionnes de 4.675 no n está dentro de d la experienncia de la muestra originall.
EJEMPLO O 8.2
Pronóstico de tasas de interé és
En este ejem mplo usamos un u modelo de regresión sim mple para pronnosticar la tassa de interés enn bonos de tesorería a tres meses. m Usarem mos el modelo elaborado en e el ejemplo 4..2. Recuerde qque este modeelo relaciona la tasa mensuual de bonos de d tesorería a tres meses (R) con el índicee de produccióón industrial (IP), la tasa de d crecimiento del d suministroo de dinero deefinido en form ma amplia M22 (GM2t = (M M2t - M2t-1) / M2 t-1), y la tasa rezagada r de in nflación de preecios al mayorreo, GPWt =
CAPÍTULO 8: Pronóstico con un u modelo de regre esión de una sola ecuación e
223 3
Figura 8.5 Pronóstico d e la tasa de bonos a trres meses.
(PWt – PWt-1)/PW ) e PW es el ínndice de preciios al producttor para todass t-1, donde laas mercancías. En el ejem mplo 4.2 estim mamos esta eccuación usanddo datos men-suales s durante el periodo dee enero de 196 60 a agosto dee 1995. Los esstimados OLS S (con la estadísstica t entre pparéntesis) fuueron
Ahora usaaremos esta ecuación parra generar unn pronóstico de la tasa dee bonos b de tesorrería para el periodo p de ennero de 1995 a febrero de 1996. 1 (Obsér-vese v que este pronóstico se extiende 6 meses más aallá del perioddo de estima-ción.) c La trayyectoria pronoosticada para la tasa de intterés (línea punteada) p y laa serie s original (línea sólida) se muestran en la figura 88.5. Nótese quue la ecuaciónn predice p en forrma consideraablemente exagerada la tassa de interés a lo largo dell periodo p prono osticado. También calculamos c laa rms del erro or de pronóstiico y el coeficciente de des-igualdad de Theil T junto coon sus compon nentes para eeste pronóstico. Estas esta-d dísticas, las cu uales son útilees para evaluaar el pronósticco, son como la siguiente: Evaluación E del pronóstico p de lla tasa de interrés Raíz R cuadrática media m del error Coeficiente de de C esigualdad de Th heil Proporción de d sesgo Proporción de d varianza Proporción de d covarianza
2.504093 0.187605 0.973300 0.000043 0.026657
Obsérvese quee la proporcióón de sesgo deel coeficiente de desigualdaad de Theil ess O m grande (aalrededor del 97%). Esto taan sólo signiffica que un seesgo sistemamuy
224
PA ARTE DOS: Modelos de regresión de una sola ecuaciión
ttico grande esstá presente (ccomo podemo os observar enn la figura 8.5), así que noo e probable quue el modelo sea confiablee para pronossticar. es Nótese qu ue la estadístiica de Durbin n-Watson para la ecuaciónn de regresiónn fue f 0.18, lo que q indica quue los residuaales están altaamente correllacionados enn forma f serial. Esto E sugiere qque el desemppeño débil paara pronosticaar de este mo-delo d de tasa de interés podrría mejorarse tomando en cuenta c la correelación serial. Exploraremos E s esta posibilidad en la siguuiente secciónn.
8.2
PRONÓSTIC CO CON ER RRORES CO ORRELACIONADOS EN FORMA SERIAL S Cuando C el prooceso de errorr está correlacionado serialm mente en mod delos de seriess de d tiempo, ell problema de determinar el mejor proonóstico y suu distribuciónn apropiada a se vuelve v un pocco más difícil. Considerem mos el modelo de dos varia-bles b en el quee los errores eestán correlacionados seriaalmente en primer orden:
En la sección anterior nuesstro mejor pro E onóstico para YT+1 fue deteerminado asig-n nándole a εT+11 el valor 0 paara el periodo o pronosticadoo. Esto fue raazonable, dadoo q los errorees tenían meddia 0 y eran inndependientess a lo largo deel tiempo. Sinn que e embargo, en el e caso correlaacionado seriaalmente, usareemos nuestro conocimientoo d los errores en periodoos previos al periodo de ppronóstico paara modificarr de n nuestra prediccción del erroor en el perio odo T + 1. Para proseguir con estaa materia, suppóngase que los parámetross de regresiónn α, α β y ρ se coonocen. Proceedemos eligieendo el valor pronosticado de YT+1 de laa siguiente s mannera: (8.30) ^ En lugar de establecer E e εT+1 = 0, como en la secciónn anterior, caalculamos ^εT+11 a partir del téérmino del errror previo. Dado D que ε T+11 = ρεT + vT, elegimos ^εT+11 = ^ ρ ε T (ya quee vt tiene mediia 0 y no estáá correlacionaada a lo largo del tiempo).3 P consiguiennte, Por
(8.31)) Si, en el futurro, continuam S mos con el proonóstico, la innformación proporcionada p a p la correlaación serial see vuelve cada vez menos úútil, dado que por 3
Dado que α y β son conociidas, no hay estim mación implicadaa, de modo que
^
εT = εT.
CAPÍTULO 8: Pronóstico P con un modelo de regresión de una sola eccuación
225
y ρs se aproxim ma a cero confo forme s crece. Observe quue la prediccióón idéntica de YT+l se obtienne cuando escribimos el mo odelo en form ma de diferenccia generalizaada: (8.32) do onde Enntonces el proonóstico aproppiado es: (8.33)
doonde La equivvalencia de lass ecuaciones (8.33) y (8.311) se vuelve ev vidente al escribir:
la cual es idénttica a la ecuacción (8.31). Si α, β y ρ se conocen, eel error de proonóstico está dado por:
Poor tanto, el error de pronósstico está disttribuido en foorma normal con c media 0 y tiene una varrianza:
226
PARTE DOS: Mode elos de regresión de una sola ecua ción
Nótese que este e error de ppronóstico es menor, m por unn factor de 1 - ρ2, que lo quue sería en el caaso contrario si no tomáram mos en cuentta la correlaciión serial. Por lo geeneral, en la práctica los trees parámetros α, β y ρ no see conocen, perro pueden estim marse usando cualquiera de las técnicass de estimacióón descritas en e el capítulo 6. 6 Para produccir el mejor pronóstico, p unno tan sólo usa u la ecuacióón estimada en forma de differencia geneeralizada. En otras palabraas, calculamoos ŶT + 1 a partir de (8.344)
Puede demostrarse quue la media del d error de ppronóstico see aproximará a cero conform me se haga m más grande el tamaño t de la muestra. Es un poco difíccil determinar una u expresiónn explícita para la variannza del error de pronósticco cuando los tres t parámetroos α, β y ρ se han estimaddo, dado quee el proceso de d estimación garantiza g que los parámetro os de pendiennte e interceptto estimados se s correlacionarrán con los reesiduales de la l regresión. E En la prácticaa, para calculaar la varianza del d error de proonóstico (y po or tanto calcullar un intervallo de confianzza en el pronósttico mismo), asumimos quue ρ se ha estiimado exactaamente. En estte caso la varian nza del pronóóstico de la ecuación (8.19)) se aplica a nu uestra ecuacióón estimada en forma f de diferrencia generaliizada (con un .término del error e vt en lugaar de εt). Una vez v más el errror de pronósttico para ŶT + 1 tendrá una varianza v menoor (y de este moodo las bandaas de confianza del 95% serrán más estrecchas) de la quue sería en el caso c si la correlación serrial no fuera tomada en cuenta. c Esto lo l examinaremo os en el conteexto del moddelo de regressión múltiple en el apéndicce 8.1. Ahora analizaremos a un ejemplo de pronósticco en presen ncia de errorees correlacionad dos serialmennte.
EJEMPLO O 8.3
Pronóstico de e tasas de interrés
Regresemos al pronóstico de la tasa de interés del ejeemplo 8.2. El desempeño ddel pronóstico de nuestra ecuuación de regrresión en ese eejemplo fue deficiente, d perro la estadísticaa de Durbin-W Watson baja suugiere que parrte del problem ma podría ser la correlación serial s en el térrmino del erro or. En el ejem mplo 6.6 volv vimos a estimar nuestra ecuaación de tasa de interés orriginal a parttir del ejempllo 4.2 con unna corrección para p la correlación serial de d primer ordden. La nuev va ecuación de d regresión (dee nuevo estim mada durante el periodo dee enero de 19960 a agosto de d 1995) fue:
Observe que el valorr estimado de ρ, el coeficieente de correelación serial, está cerca de 1. El coeficientte para la tasa de crecimiento del sum ministro de diinero ahora es negaativa (lo cual es más consisstente con la tteoría económ mica) y es muyy
CAPÍTULO 8: Pronóstico con un modelo de regressión de una sola eccuación
227
Figura 8.6 Pronóstico de e la tasa de bonos a tre es meses (tomando en cuenta c la correlación serial).
significativo. El E error estánddar de la regresión ahora ees mucho mennor y la estadíística de Durbbin-Watson ess 1.64. Usamos essta nueva ecuuación de reg gresión para generar una vez más un prronóstico de la l tasa de interés para el periodo p de ennero de 1995 a febrero de 19996. Las series pronosticadaa y real se muuestran en la fiigura 8.6. Obsérvese que la seerie pronosticaada ahora estáá mucho máss cerca de la sserie real y quue ya no hay niinguna tendenncia sistemática a sobrepreedecir o subprredecir los dattos reales. El deesempeño meejorado del prronóstico tam mbién es evideente a partir de d la rms del errror de pronósstico y los coomponentes del d coeficientee de desigualddad de Theil qu ue se muestraan a continuación. Evaluación del pronóstico p de la a tasa de Interé és Raíz cuadrática media m del error Co oeficiente de dessigualdad de The eil Proporción de sesgo Proporción de d varianza Proporción de d covarianza
EJEMPLO 8.4
Prronóstico de la a demanda de c carbón
0.309388 0.028608 0.038771 0.060426 0.900803
4
En n este ejempllo construimoos y usamos un u modelo de pronóstico para p predecir, enn una base mensual, la dem manda de carrbón bituminooso. Comenzaamos por espeecificar una eccuación lineall que relacione la demanda de carbón (C COAL) con el ínndice de produucción de aceero y hierro de d la Federal R Reserve Boarrd (FIS) con 4
Este ejemploo se comentó prim mero en el ejempplo 6.5.
228
PA ARTE DOS: Mode elos de regresión de una sola ecuacción
el índice del Consejo C de laa Reserva Federal de produccción de serviicios eléctricoos (FEU), el índdice de precioos al mayoreoo para el carbóón (PCOAL) y el índice de d precios al maayoreo para el gas natural (P PGAS). Usam mos datos mennsuales durantte el periodo dee enero de 19965 a diciemb bre de 1972 y una serie ajuustada estacioonalmente parra la demandda de carbón.. Comenzamoos por estimaar la ecuación usando mínim mos cuadradoos ordinarios. Los resultadoos de la regreesión se muesstran a continu uación, con la estadística t entre parénttesis:
El ajuste de esta ecuacción es bastannte acertado, ccomo puede veerse a partir de d la estadísticaa y en la figuura 8.7, la cuaal compara laa demanda dee carbón real y ajustada duraante un perioodo de tres añños. Sin embaargo, un probblema con estte modelo es la estadística D DW baja, que indica correlaación serial siignificativa. Para mejorar nuestro ppronóstico, esstimamos de nnuevo la ecuaación usando el e procedimientto de regresióón de Hildreth h-Lu. En estee procedimiennto la ecuacióón es transformaada usando diferencias d gen neralizadas:
Dado que no se conoce ρ, Hildreth-Lu realiza regressiones OLS enn esta ecuacióón usando varios valores difeerentes de ρ. Cada C vez que se realiza unaa regresión, see
Figura 8.7 Demanda de d carbón, ajustada co ontra real. Límites de tiempo: enero de 1970 a diciembre de 1972.
CAPÍTULO 8: Pronóstico con un n modelo de regre esión de una sola ecuación e
229 9
caalcula la sumaa de residualess al cuadrado (ESS) ( y el vallor de ρ que prroporciona la ESS menor see usa en el rresultado finaal. Los resultados de la regresión r de Hildreth-Lu H paara nuestra eccuación de deemanda de caarbón son:
Nótese N que la estadística e DW W está más ceerca de 2.0 y que el error estándar e de la eccuación es meenor (998 conntra 1 200 de antes). Todass las variabless explicativas coontinúan sienndo significatiivas. El ajustee de la ecuaciión puede verrse en forma grráfica en la figura f 8.8, la cual comparra las series real r y ajustadda durante el peeriodo de tress años. Una coomparación dee la figura 8.88 con la figuraa 8.7 muestra ell mejor ajustee proporcionaddo por el proccedimiento dee Hildreth-Luu. Ahora geneeraremos pronnósticos ex poost durante el periodo de ennero de 1973 a diciembre dee 1973 y comppararemos esttos pronósticoos con la dem manda real de caarbón durantee ese periodo. Primero usam mos la ecuacióón (8.35) que no explica la co orrelación serrial. Estos ressultados del pronóstico, p juunto con la baanda de confianza del 95% % y la serie real r para la demanda d de ccarbón, se mu uestran en la figura 8.9. Loss resultados soon bastante bu uenos; la seriie real siemprre permanece deentro de la baanda de confiianza del 95% % y de hecho usualmente está e bastante ceerca de la seriie pronosticadda.
Figura 8.8 Demanda de carbón, ajustada conttra real con la correccción de la correlación se erial Límites de tiempo: enero de 1970 a dicciembre de 1972.
230
PARTE DOS: Mode elos de regresión de una sola ecua ción
Figura 8.9
Pronóstico de la demanda de d carbón usando regrresión OLS. Límites de tiempo: t enero de 19 973 a diciembre de d 1973.
Sin embargo, se puedden generar aun a mejores ppronósticos ussando la ecuaación (8.36) enn su forma de diferencia gen neralizada, es decir, aplican ndo la ecuacióón (8.33) o (8.344). Estos resuultados, de nuuevo junto conn la banda dee confianza deel 95% y la serrie real, se m muestran en laa figura 8.10. Observe qu ue la banda de d confianza del 95% es más estrecha e cuanndo se toma enn cuenta la corrrelación seriaal; ya sea que nuuestros pronóssticos sean exx ante o ex posst, tendremos una confianzza mayor en elloos si hemos aajustado nuesstra ecuación para corregir la correlacióón serial en los términos t del error. e Como esperaríamos, e una comparacción de las doos figuras muesstra que la seerie pronosticcada está más cerca de laa serie real (ees decir, los erroores de pronóóstico resultanntes en efecto son menores) cuando se ha h explicado la correlación c seerial.
Figura 8.10 0 Pronóstico de la demanda de d carbón usando la corrección c de la correlación serial. Límites de tiempo: enero de 1973 a diciembre de d 1973.
CAPÍTULO 8: Pronóstico con un modelo m de regresió ón de una sola ecu uación
8.3
231
PRONÓSTICO O CONDICIO ONAL En el análisis an nterior se asum mió que las vaariables expliccativas son coonocidas sin erroor. Ésta puedde ser una supposición irreall durante un pronóstico p exx ante, dado quee algunas variiables explicaativas tengan que ser predecidas en el futuro. f Uno poddría esperar que q la naturaleeza estocásticca del valor ppronosticado de d dichas X connducirá a pronnósticos de Y que son meno os confiables de lo que sonn en el caso de las l X fijas. Veeremos que, enn efecto, los in ntervalos de cconfianza del 95% 9 para el erro or de pronósstico se increementan en tamaño cuanddo las X missmas deben preedecirse. Sin embargo, e debiido a que es muy m difícil derrivar una fórm mula para el erroor de pronóstico en un esccenario generaal, abordarem mos aquí un caaso especial quee será instructtivo.5 Considerem mos el siguientte modelo:
donnde α^ y βˆ son los estimaados OLS dee α y β. El modelo asume a que XTT+1 es pronostticada con unn error de proonóstico con media 0 y variannza constante. Además, se supone s que el proceso de errror asociado conn el pronóstico o de XT+1 es inndependiente del proceso dde error asociaado con cada unaa de las Y en el e modelo. Auun cuando soon de naturaleeza estocástica, todavía se asuume que las X no están corrrelacionadas con el términno de error de la ecuación. La restrictividadd de este modeelo queda clarra cuando connsideramos los medios por los que podrían obtenerse o los valores pronoosticados de XT+1. Un proceedimiento es exttrapolar los vaalores muéstrrales de X. Peero la probabiilidad de que la variable X se autocorrelacioone en un m modelo de seriies de tiempoo sugiere quee el error de proonóstico asocciado con el procedimien nto de extrapolación en sí s mismo es proobable que estté correlacionnado serialmente. El valor proonosticado dee Y en el perio odo T + I estáá definido poor: (8.38) El error de pronóstico es: (8.39) 5 Este caso se describe d en M. Feeldstein, "The Errror of Forecast in Econometric Moodels When the Foreecast-Period Exoggenous Variables A Are Stochastic", Econometrica, E vol. 39, pp. 55-60, enero e de 1971.
232
PARTE DOS: Mod delos de regresión n de una sola ecu uación
Es fácil ver que este erroor tiene mediaa 0:
dado que βˆ y uT+1 no estáán correlacionados. La variaanza del errorr de pronósticco es un pocoo más difícil de d derivar:
Observe, quue al llegar a la ecuación (8.43) sacam mos ventaja deel hecho de qque uT+1 = XˆT+1 - XT+l, de que uT+1 án correlacionaadas y, por últiimo, de que βˆ 2 = T y βˆ no está 2 β + Var ( βˆ ). A continuacción, podemoss usar la ecuacción (8.42) parra simplificar el último térm mino en la ecuuación (8.41):
(El primer término t de laa derecha es cero c por supoosición.) Ahorra, combinanndo términos, enncontramos que: q
Cuando pon nemos esto enn función de nuestros n estim madores de mínimos cuadraados, la fórm mula para la vvarianza del errror de pronóóstico se vuelvve:
CAPÍTULO 8: Pronóstico con un modelo m de regresió ón de una sola ecu uación
233
Un na comparació ón de la ecuacción (8.46) co on la ecuaciónn (8.19) de la sección 8.1 dejja claro que pronosticar X iincrementa el error de pronnóstico. Hay dos d términos no negativos adiicionales impplicados, los cuales sólo sonn minimizadoos cuando el proonóstico de XT + 1 es exactoo. Por desgraccia, es difícil ddescribir los inntervalos de con nfianza más grandes g para eel error de proonóstico condiicional, dado que ŶT+1 no esttá distribuida en e forma norm mal. (Esto invvolucra la sum ma de producttos de variablees aleatorias distribuidas d nnormalmente.)) Aunque loss intervalos de confianza no pueden ser derivados d en fforma analíticca, un estimaddo tosco del intervalo i de connfianza podríía obtenerse de d la siguientee forma: 1. Se calcullan los intervaalos de confiaanza del 95% asociados conn el pronóstico o que se obteendría si selecccionáramos que XˆT+1 estuuviera 2 desviiaciones estánndar arriba o abajo, a es decirr, los intervaloos de confianzza asociados con c Y *T + 1= ^ ^ ** α + βˆ(XˆT+1 + 2σσu) y Y T + 1= α + βˆ(XˆT+1 - 2σσu). 2. La prediccción del inteervalo final see toma como lla unión de loos dos intervallos de confian nza; es decir, contiene toddos los valores de ŶT+1 com munes a amboss intervalos de d confianza. Estte proceso se describe en la l figura 8.11. Los resultaddos de esta seección ayudann a elucidar allgunas de las dificultades imp mplicadas en el proceso de pronóstico. p A si el modeelo de regresiión tiene un Aun bueen ajuste con parámetros significativos desde d el punto de vista estaadístico, los proonósticos inco ondicionales ppueden no seer muy precisos. Pronosticar variables expplicativas intrroduce error dde pronóstico adicional. Unn buen modelo de regresióón en funciónn del pronósticco incondicioonal puede deesempeñarse mal m cuando se intenta un pronóstico conndicional. Po or tanto, uno no debería rechazar r un moodelo con un error e de pronóóstico alto si el e componentee primario de ese error se debbe a un error en la predicciión implicadaa con las variaables explicatiivas. ¡El
Figura 8.11 Aproximación al intervalo de pre edicción para un pronósstico condicional.
234
PARTE DOS: Mod delos de regresión n de una sola ecua ación
problema ess aún más diffícil en el pronóstico macrooeconómico debido d a que un pronóstico condicional c prreciso inicial puede p conduccir a un cambio o en la políticaa y por tanto a un u pronósticoo impreciso!
APÉNDICE 8.1 Pronóstico con c el modelo de d regresión múltiple m
En este apééndice usamos notación matricial m para ggeneralizar laa exposición del d problema deel pronóstico al caso multiivariado. Com menzamos esccribiendo el mom delo lineal general g en forma matriciall. El modelo ccontiene una variable depeendiente y k variables v indeependientes (iincluyendo ell término con nstante) y es ese timado sobrre un total de T observacio ones: (A88.1) Recuerde quue Y es un veector de T x 1 columna de observacionees de la variabble dependientee, X es una maatriz T x k de observaciones o s de la variable independiennte, β es un vecttor de k x 1 ccolumna de paarámetros descconocidos y ε es un vector de T x 1 colum mna de términoos de error. Enntonces el estiimado de mínnimos cuadraddos ordinarios de d β estará daado por: (A88.2) Ahora examinaremo e os las caracterrísticas de un pronóstico reealizado, el cuual usa esta eccuación estim mada. Supóng gase que teneemos un conj njunto nuevo de observacionnes (o incluso pronósticos o suposicionees) para las vaariables indepeendientes paraa el periodo T + 1. Entoncces, el pronóstico para la variable depeendiente en ell periodo T + 1 estará daddo por: (A88.3) Nótese que XT+1 es un vecctor con 1 x k filas, así que ŶT+1 es un esccalar. Del mism mo modo, si deseamos un proonóstico paraa el periodo T + 2, éste estarría dado por: (A88.4) Si todas lass variables inndependientess aparecieran con rezagos mayores quee o iguales a doss periodos, tann sólo podríam mos observar XT+2, pero si alggunas o todas las variables inndependientess no están rezagadas, XT+2 misma tendrá que ser pronosticada y el pronósttico de YT+2 será condicionaal al pronóstico o de XT+2.
CAPÍTULO 8: Pronóstico P con un modelo de regresión de una sola ec cuación
235
Dado que las l ecuaciones (A8.3) y (A A8.4) se aplicaan para cualquuier periodo, elliminamos el subíndice de tiempo y repllanteamos nuestra ecuaciónn de pronósticco como: A8.5) (A
doonde Ŷ es unn pronóstico de Y, para algún a periodoo y X es un conjunto de obbservaciones en las variabbles independ dientes para ese periodo. Por último, deenotamos el vaalor real de Y ccon Ỹ. Entoncees, el error de ppronóstico esttá dado por: (A8.6) D Dado que el vaalor real Ỹ de Y puede escrribirse como: (A8.7) doonde ε es el valor v real del ttérmino del errror aditivo enn el periodo pronosticado, p poodemos escrib bir el error dee pronóstico como: c (A8.8) Suustituyendo laa ecuación (A A8.1) en la ecu uación (A8.8)), tenemos:
La varianza del error de pronnóstico es:
Esstamos suponniendo que loos términos del d error adittivos no estánn autocorrelaacionados, y por p consiguiennte E[εε] = 0. También esttamos suponieendo que los téérminos del errror son homoocedásticos, de d modo que::
Poor tanto podemos escribir la varianza del d error de prronóstico com mo:
236
PA ARTE DOS: Mod delos de regresión de una sola ecuación
Ahora poodríamos pregguntar cuál poodría ser la vaarianza del errror de pronósstico más peqqueña posiblee, es decir, cuuál valor de X minimizaríaa σ 2ƒ. Podemoos responder estta cuestión ressolviendo un problema p de minimizarían m restringida en e el que usamoos el método de d los multiplicadores de Lagrange. L Parra minimizar σ 2ƒ debemos minnimizar el prroducto matriicial en el lado derecho de d la ecuacióón (A8.12); es decir, d deseamoos
La restricciónn de que X 1 = 1 se refiere al hecho de qque el primer elemento de X es el intercepto de la ecuacción de regresiión. Podemos escribir la lag grangiana parra este problem ma como: (A8.133) donde λ es el multiplicadoor de Lagrang ge. Al diferennciar la lagranngiana con resspecto a X y estableciendo e o la derivada igual i a 0 da:
Por tanto X ' es proporcional a la prim mera columna de X'X:
Las sumatoriias en la ecuaación (A8.16) son sobre lass T observaciiones. Desde la l primera fila de la ecuacióón (A8.16), daado que X 1 =1,
CAPÍTULO 8: P Pronóstico con un modelo de regressión de una sola eccuación
237
Ahhora podemoss escribir la eccuación (A8.116) como:
(A8.17)
Peero nótese quee el lado dereccho de la ecuacción (A8.17) ees el vector dee medias. De estte modo, com mo fue el caso en el modelo o de dos variaables, la variannza del error dee pronóstico es minimizadda cuando toodas las nuevvas observaciiones en las vaariables independientes sonn iguales a suus valores meddios. ¿Cuál ess el valor de estta varianza deel error de prronóstico mínnima? Escribieendo la ecuacción (A8.17) coomo:
(A8.18)
y sustituyendo s esto en la ecuuación (A8.122), tenemos
¿Ahora cóm mo se verán nuestras n regio ones de confiaanza del 95% %? Serán una veersión multidiimensional dee la figura 8.33. En el caso dde dos variabbles independientes (ademáás del términoo constante), la región de cconfianza dell 95% estará coonfinada por dos d hiperbolooides. El inteervalo de confianza será menor m en los vaalores medios de X1 y X2.
238
PARTE DOS: Mod delos de regresión n de una sola ecua ación
EJERCICIO OS 8.1 Para el modelo m de regreesión Yt = α + βX β t + εt : a) Supon nga que se conooce α. ¿Cuál ess el método aprropiado para pronosticar YT+l? Demuestre qu ue la varianza ddel error del prronóstico está dada por:
b) Suponnga que se conooce β. Encuentrre el método appropiado para prronosticar YT+l y demuestre que q la varianzaa del error del pronóstico p seráá:
Sugerencia: 1) 1 En el modelo Yt = α + εt, el e estimador dee mínimos cuaadrados de α esstá dado por α^ = (1 / T)∑Yi y laa varianza de α^ = σ2 /T, dondde σ2 = Var(εt). 2) En el modeelo 2 Yt = βXt + εt, el estimador dee mínimos cuaddrados de β estáá dado por βˆ = ∑.XiYi /∑X i y la 2 2 varianza de βˆ = σ /∑X i. 8.2 En la figura 8.5 en el eejemplo 8.2, la serie real paara la tasa de interés i divergee de manera connsiderable de laa serie pronosticada en 1995. Sugiera por quué el modelo dee regresión falló durante este año.
CAPÍTULO
9
ESTIMACIÓN DE UNA SOLA ECUACIÓN: TEMAS AVANZADOS
Los ocho capítulos anteriores conforman el desarrollo del núcleo de la econometría, el modelo lineal general. En este capítulo, continuaremos el análisis de la estimación de una sola ecuación con el estudio de cuatro temas más avanzados. El primero se relaciona con los modelos de rezago distribuido y su estimación. Nos enfocaremos en dos de las estructuras de rezago que con más frecuencia son usadas: el rezago geométrico y el rezago distribuido polinomial. A continuación, se mostrará cómo pueden usarse los modelos de rezago simple para probar la causalidad, es decir, si los cambios en una variable pueden verse como una causa de los cambios en otra variable. En tercer lugar consideraremos varios medios para resolver el dilema que surge cuando hay observaciones perdidas. La reducción en eficiencia que resulta cuando las observaciones se eliminan de la muestra se compara con los riesgos de remplazar observaciones faltantes con sustitutos adecuados. Finalmente proporcionaremos una breve introducción a la estimación de modelos de regresión usando una combinación de datos de corte transversal y de series de tiempo. Se contemplarán varios esquemas alternativos para la combinación de datos y, siempre que sea posible, se describirán las técnicas de estimación correspondientes.
9.1
MODELOS DE REZAGO DISTRIBUIDO En los modelos de series de tiempo puede pasar un periodo considerable entre el periodo de toma de decisiones económicas y el impacto de un cambio en una 239
240
P ARTE DOS: Mode e los de regresión de una sola ecua ación
variable políítica. Si este pperiodo entre la toma de decisiones y suus respuestas es suficientemeente largo, vaalores rezagaados de las vvariables expplicativas debben incluirse en forma explíccita en el moddelo. Como uun ejemplo, considérese c u una función de consumo agreggado que se va v a estimar uusando datos macroeconóm micos trimestraales. Podría esspecificarse ell consumo Ct como una fun nción de ingreeso disponible aggregado rezagaada un trimesttre YT + 1. La eespecificaciónn de la estructuura rezagada de un modelo ess una función de las unidaddes de tiempoo de los datos. Si la misma fu unción de coonsumo fueraa especificadda utilizando datos anuales, podría ser raazonable elim minar el rezag go en la variaable de ingreso, dado que el periodo de medición m es coonsiderablemeente mayor quue el periodo de d reacción. Este ejem mplo simple supone que el e efecto enteero de la variaable explicatiiva ocurre en unn periodo. See podría espeecificar, de m manera más general, g que los l cambios econ nómicos puedden distribuirsse a lo largo de d varios periiodos; ésta ess la base del moddelo de rezagoo distribuido, en e el que una serie de variab bles explicativvas rezagadas exxplica el proceeso de ajuste de d tiempo. El m modelo de rezzago distribuiddo, usualmente, puede escribirse
A menos quee se establezca de otra mannera, supondreemos que el téérmino del errror está distribuiido en forma normal, indeependiente dee X, y no estáá correlacionaado serialmente ni es heteroccedástico. Au unque en mucchos ejemploos implican una u estructura dee rezago finitaa, permitirem mos en este caso que el núm mero de rezaggos sea infinito. Entonces, la estructura deel rezago es innfinita, la secuencia de pessos de rezago quue describe el patrón de la respuesta del rezago debe tener una sum ma finita o el modelo m no tendrá una solucción finita. Si el núm mero de térm minos en el reezago distribuuido es pequeeño, la ecuaciión puede estimarse usando mínimos cuaadrados ordinnarios. Sin em mbargo, cuanndo hay muchos términos y see sabe poco accerca de la forrma del rezaggo, la estimaciión directa usa un u número ggrande de graados de liberrtad y es proobable que essto conduzca a estimados dee parámetro imprecisos i deebido a la muulticolinealidaad. Afortunadam mente, estas ddificultades pu ueden resolveerse si especifficamos algunnas condiciones acerca de la forma del reezago distribuuido. Para prooseguir con este e tema a contiinuación desccribiremos doos de las estruucturas de rezzago planteaddas con mayor frrecuencia.1
1
Para el estudio e más avannzado de los moddelos de rezago distribuido d se hacce referencia de P.
Dhrymes, Distribbuted Lags: Probllems of Estimationn and Formulationn (San Francisco: Holden-Day, 19711), Z. Griliches, "Diistributed Lags: A Survey", Econom metrica, vol. 35, pp. p 16-49, 1967, y M. Nerlove, "Lags in Econometric Behavior", B Econoometrica, vol. 40, pp. 221-251, 19772.
CAPIT TULO 9: Estimació ón de una sola ecu uación: temas avanzados
9..1.1
241
Rezzago geométrico
Ell rezago geom métrico determ mina que los pesos p de las vaariables explicativas rezagaadas son todoos positivos y declinan enn forma geom métrica con el tiempo. El modelo es el siguiente:
(9.2) Ell patrón de paarámetros asoociados con el e modelo se describe en la l figura 9.1 (p para w = 12 ). Aunque A los peesos del modeelo de rezago geométrico nunca n llegan a cero, c disminu uyen, de modoo que más alláá de un tiempoo razonable ell efecto de la vaariable explicaativa se vuelvve insignifican nte. Es útil desccribir la estrucctura del rezaago de un moddelo de rezagoo distribuido en n función de su s rezago meddio y en funcción de la resppuesta a largoo plazo de la vaariable dependdiente ante unn cambio perm manente en una u de las varriables explicaativas. La resppuesta a largo plazo m es el parámetro β veces v la sumaa de los pesos rezagados (∑ws) o β/(l - w),, con m midiendo el cambbio en Y asocciado con un inncremento de 1 unidad en X que perman nece en efectoo durante todoo el tiempo.2 Poor el contrario o, el rezago medio m se definee como un prromedio de tieempo ponderaado para el rezzago, es decirr:
Enn el modelo de d rezago geométrico el rezzago medio es w/( 1 - w), dado d que3
Sii w = 21, por ejemplo, el rezaago medio de 1 sugiere que la mitad del im mpacto de un caambio en Y see sentirá duraante el primerr periodo. En esta forrma el modello de rezago geométrico pparece difícill de estimar, daado que implicca un númeroo infinito de reegresores. Sinn embargo, la forma f para2
Recuerde la suma de una serrie infinita como ∑ws =1/(1- w). Para P demostrar esto, tenemos que s s ∑ S = 0 w = k. Multip plicando por w im mplica que ∑ ∞ S = 1w = kw. Restando, ocbtenemos 1 = k (1 - w) o k = 1// 1- w). 3 El hecho de que ∑ sws = w/(( 1 - w)2 resulta deel desarrollo: ∞
242
PARTE P DOS: Mode elos de regresión de una sola ecuacción
Figura 9.1 Parámetross de rezago geométrico o.
métrica de loss pesos de rezaago permite unna simplificaciión considerabble del modeloo. Para observarr esto, escribirremos de nuev vo el modelo original o [ecuación (9.2)] con todas las obsservaciones reezagadas un periodo: p (9.33) Entonces callculamos la exxpresión Yt – wY w t - 1 para obbtener (9.44) donde ut = εt - wεt - 1. Al eescribir de nu uevo, (9.5 5)
La ecuación (9.5) hace un poco más fáccil medir el effecto de un caambio continuuo de 1 unidad en X en el valor v de Y. En E el primer pperiodo el effecto es β. Siin embargo, en el segundo peeriodo Yt – 1 see ha incremenntado por β, assí que el efectto ahora se ha vuelto β + ββw = β(l + w). w Después dde T periodoos el efecto ees β∑ TS =– 10 ws= β(l β - wT)/(l - w),4 mientrras que la reespuesta a laargo plazo ees β(l - w). En ocasioones, es útil calcular el rezaago mediano, es decir, el vaalor del tiemppo T para el que la fracción de ajuste com mpletado es igual a 1 . Parra encontrar el e 2 rezago mediaano resolverem mos
Resolviendo para T, enconntramos que:
4
De este modo, m una vez m más, se presenta laa suma de una seerie geométrica.
CAPÍT TULO 9: Estimación de una sola ecua ación: temas avan nzados
243
La ecuación n (9.5) puede estimarse conn más facilidaad que la ecuación (9.2), daddo que sólo trres parámetross permanecenn desconocidoos. Sin embarggo, antes de connsiderar más la estimaciónn, necesitamo os asegurar qque la especifficación del moodelo es aprop piada. Moodelo de expeectativas adap ptable El mod delo de expecctativas adaptaable postula quee los cambioss en Y se relaccionan con loss cambios en el nivel "espeerado" de la varriable explicaativa X. Este modelo m se esccribe de la siguiente manerra: (9.6) donnde X* repressenta el nivell deseado o essperado de X. X Por ejemploo, X* puede rep presentar el inngreso permannente en el ejemplo de connsumo agregaado descrito conn anterioridad d, o un precio esperado en un modelo m microeconómico. El nivel espperado de X esstá definido por una segundda relación enn la que se suppone que las exppectativas soon alteradas en e cada periiodo como uun ajuste entre el valor obsservado actuall de X y el vallor esperado previo p de X. Laa relación es la l siguiente: (9.7) Enn ocasiones ess más útil reesscribir la ecuaación (9.7) coomo:
Estto nos dice quue el nivel espperado de X (ingreso permaanente o preciio esperado) es un u promedio ponderado deel nivel presennte de X y el nivel esperaddo previo de X. Los L niveles essperados de X se ajustan peeriodo por perriodo, tomand do en cuenta los niveles preseentes de X Parra plantear el modelo de exxpectativas addaptable, de tal forma que esto permita la estimación ecconométrica, reescribimos la ecuación (9.88) rezagando el modelo peeriodo por peeriodo, y al m mismo tiempo multiplicamo os por (1 - θ)s, donde s es el e número de periodos impplicados en el proceso de rezago: (9.9) Ah hora sustituim mos la ecuacióón (9.9) en la ecuación (9.88) y combinam mos térmi-
ress presentes y previos deX, X, dado que lo os pesos sumaan la unidad [θ∑(1 – θ)s = 1]. 1 Al sustituiir la ecuaciónn (9.10) en la ecuación (9.66), obtenemoss: (9.11)
244
PARTE DOS: Mod delos de regresión n de una sola ecua ación
La equivaleencia de este modelo con el modelo dee rezago geom métrico originnal [ecuación (99.2)] puede verse v si sustituuimos
De este moddo, la estimacción de la espeecificación associada con ell modelo de eexpectativas adaptable a es idéntica i al pro oblema de esstimar el rezaago geométricco, con la ecuacción (9.5) connvirtiéndose ahora a en:
Modelo de ajuste de accciones El moddelo de ajuste de d acopio suppone que el nivvel deseado de Y depende deel nivel actuaal de X, es deccir, (9.113) En el ejemp plo del consuumo Yt* podríía representarr un nivel de gasto deseaddo, mientras quue en el ejemplo de la demaanda puede reppresentar la caantidad deseaada que se va a suministrar o la superficiee en acres deseada que se va v a cultivar. En E cualquier periodo p determ minado, el valor v real dee Y puede no o ajustarse por p completo paara obtener ell nivel o acop pio deseado. La L falta de coonocimiento, las l restriccionees técnicas y otros factores pueden serr responsabless de este ajusste parcial. Pod demos represeentar el proceso de ajuste ccomo: (9.114) La ecuaciónn especifica qque el cambioo en Y respondderá sólo, en forma f parciall, a la diferenciaa entre la reseerva deseada de Y y el valoor pasado de Y, Y con la tasa de respuesta siiendo una funnción del coeeficiente de ajuste a γ. Al sustituir s para Y*t en la ecuaciión (9.14) y reesolver para Yt se produce: (9.115) Una vez máás el modelo dde ajuste de acopio a guardaa una relaciónn estrecha conn el modelo de rezago r geoméétrico. Los doos son equivaalentes en la forma [véase la ecuación (99.5)] si suponeemos que:
Sin embargoo, la equivalenncia de los modelos m no es completa, deb bido a que invvolucra un conjunto difereente de suposiiciones respecto a la estruuctura del erroor. Para observ var esto, reesccribimos la ecuación e (9.155), rezagamos el modelo un periodo y luuego sustituim mos para Yt -1. Iterando I este pprocedimiento o y recolectanndo términos, see obtiene:
CAPÍT TULO 9: Estimación de una sola ecua ación: temas avan nzados
245
A diferencia de la especificacción del errorr original, el pproceso de errror asociado con n el modelo de d ajuste de aacopio es un proceso p de errror de promeddio móvil.
9.1 1.2
Estim mación del rrezago geo ométrico
Enn esta sección analizamos en forma brevee algunos de los l problemass implicados en la estimaciónn del modelo de rezago geoométrico. Reccuerde que unn modelo así puede transform marse en un modelo m autorreegresivo de unna sola ecuación con una solla variable deependiente rezzagada: (9.18)
Deependiendo deel modelo elegido, el proceeso de error puede p seguir varias v suposicciones alternaativas. Considderemos prim mero el caso een el que el término t del errror está distrib buido en form ma normal coon varianza coonstante y no o está correlaccionado en forrma serial. Poor regla generaal la especificcación del rezago geométricco introducirrá correlaciónn serial si ell error originnal especificaado no está auttocorrelacionnado. Sin embbargo, el procedimiento dde transformaación puede eliminar de manera imaginaable cualquierr correlación serial que see presentara oriiginalmente.5 Por tanto, la ppresencia de una u variable deependiente rezzagada en el mo odelo causa que q las estimaaciones de loos parámetros por mínimoss cuadrados ord dinarios sean sesgadas, auunque permannezcan consisttentes. Ahora analiccemos el probblema de estimación cuanndo el términ no del error siguue el patrón suugerido por ell Rezago geom métrico y porr los modelos de expectativas adaptable: ut = εt – wεt -11. En este casso las estimacciones por míínimos cuadrad dos ordinarios se vuelven inconsistentees y sesgadas. La dificultaad surge debido o a que ut y Yt -1 están corrrelacionados y esta correlaación no desap parece conform me aumenta el e tamaño de la muestra (een el límite en e probabilid dad). Disponem mos de varios procedimient p os de estimacción que impliican el uso de una técnica de variables insstrumentales o máxima verosimilitudd, pero son demasiado com mplejas para presentarlas p enn detalle aquí.6 Quizá el prrocedimiento más simple seríaa usar la estim mación' de varriables instrum mentales con Xt -1 sirvienddo como un
5 Si εt = wεt -1+ ut, el proceso dde transformaciónn producirá el prooceso de error ut, el cual no está auto ocorrelacionado. 6 Véase, por ejeemplo, J. Kmentaa, Elements of Eco onometrics (Nuev a York: Macmillaan, 1986), secciónn 11-4.
246
PARTE DOS: Mod delos de regresión n de una sola ecuación
instrumento para Yt -1. Essto produciría estimadores consistentes pero p no es prrobable que seean ineficienttes. Por últim mo, consideraaremos una teercera especifi ficación del errror que impliica correlación serial de prim mer orden, es decir,
Sin embarggo, una vez m más, las estim maciones de llos parámetro os por mínim mos cuadrados ordinarios o seráán inconsistenntes y sesgadaas, con la direección del sesgo de muestra grande relacionado en forma directa ccon el signo de ρ.7 Tanto la estimación de variables iinstrumentalees como la estimación de máxima m verosimilitud son n alternativas disponibles. El proceso de estimació ón de variablles instrumentaales produce eestimadores co onsistentes, ppero tienden a ser ineficienttes dada la pressencia conocidda de correlacción serial. Ell instrumento para remplazzar Yt -1 puede obtenerse de una regresióón de primeraa etapa en laa que Yt -1 es la variable deppendiente y unna serie de vaalores rezagaddos de X form ma las variablles explicativass. La eficienciia de este estiimador puedee mejorarse sii se usan las eestimaciones del interceptoo y la pendieente, para obttener un estim mado del coeficiente de coorrelación seriial ρ. Hacemoos esto calculaando los residduales asociaddos con la estim mación del intercepto y la pendientte. Una regr esión de u t en e ut -1 producee una estimaciión del coeficiiente de correelación serial. Una vez que se estima p, el proceso de ddiferenciación n generalizadaa puede usarsee para reestim mar los parámettros de la ecuaación originaal (véase el caapítulo 6).
9.1.3
R Rezago distrribuido pollinomial
La formulacción del rezaggo geométrico o es limitada ddebido a que plantea la hippótesis de un conjunto de pesos de rezzago declinanntes.8 Una foormulación más m general es ell modelo de rrezago distribu uido polinomiaal. Este modeelo establece qque los pesos deel rezago puedden ser especificados por unna función continua, la cuaal a su vez puede ser aproxximada al evaaluar una funnción polinom mial en punttos discretos apropiados en eel tiempo. Por ejemplo, poddríamos determ minar, que wi = c0 + c1i + c2i2 para i = 0, 1, 2, 3, .. ., 6 y wi = 0 para i menor que 0 y mayor quee 6. Esto especiffica pesos de rrezago que siguen un polinnomio de segu undo grado paara los primeross seis valores rezagados y son s 0 de otra m manera. Los pesos p de rezago podrían apaarecer como sse muestra en la figura 9.2. Cuando o se especificaa un modelo de d rezago distrribuido polinóómico, debem mos asegurarnoss de que el graado del polinoomio es menoor que el número de términnos en el rezagoo distribuido menos m 1 o no habrá reducción en el núm mero de pa7 Véase Z. Z Griliches, "A N Note on the Seriall Correlation Biass in Estimates of Distributed Lagss", Econometrica, vol. v 29, pp. 65-73, 1971. 8 Es posibble, por supuesto,, permitir que los primeros términnos de rezago seann estimados libree mente e impon ner la suposición de rezago geoméétrico en valores rrezagados de la variable v explicativva más allá de loss primeros términnos.
CAPÍT TULO 9: Estimación n de una sola ecuacción: temas avanza ados
247
Figura 9.2
Pesos de rezag go distribuido polinominal.
rám metros de rezaago que se esttimarán.9 Sin embargo, la elección de reestricciones de puntos extreemos es opcional. Si no deseamos d lim mitar a que loos pesos de rezzago sean 0 fuuera del intervvalo de rezagoo, una o ambaas restriccionees de puntos exttremos puedeen eliminarse.. Para comprender cómo se s estima el modelo m de rezzago distribu uido polinomiaal, considérese el caso de uun polinomio de d tercer grado con un rezaago de cinco perriodos (sin resstricciones de puntos extrem mos). La especificación dell rezago es:
Suppóngase que:
Al sustituir y reeescribir, se obbtiene;
Combinando loss términos, teenemos:
9 Además, el nú úmero de observaaciones disponible debe ser mayorr o igual al grado del polinomio máss 2. Las dos observaciones extra son necesarias si s los puntos extrremos del rezago o son fijos por suposición.
248
PARTE DOS: Modelos de regresión de una sola ecuación
La ecuación (9.22) se puede estimar por mínimos cuadrados ordinarios. Si el término del error obedece las suposiciones clásicas de la econometría, las c estimadas serán mejores estimados lineales insesgados.10 (Una vez que se conocen las c, el cálculo de los pesos de rezago originales, las w, es un procedimiento simple.) Los errores estándar para cada uno de los pesos de rezago pueden obtenerse de la matriz varianza-covarianza de las c, pero los cálculos son demasiado complicados para ser incluidos aquí. Las pruebas estadísticas que se realizan, en general, deben hacerse por medio de la ecuación estimada [ecuación (9.22)] y no en forma directa por medio de la ecuación especificada [ecuación (9.21 )].11
9.1.4
Elección del número de rezagos
Cuándo especificamos un modelo de rezago distribuido (polinomial o de otra clase), ¿cómo debe decidirse cuántos rezagos incluir? Ésta es una pregunta de especificación del modelo y, como tal, no tiene una respuesta clara o simple. Con frecuencia el número de rezagos a incluir en el lado derecho de una ecuación puede determinarse, al menos en forma aproximada, a partir de la teoría. Por ejemplo, podríamos esperar que la demanda de un producto fuera dependiente de los precios rezagados al igual que del precio actual del producto, pero que sólo los precios rezagados que se remontan hasta seis meses afecten la demanda. Sin embargo, en muchos casos, no queda claro con base sólo en la teoría cuántos rezagos incluir en una ecuación. Entonces, debemos observar los datos para determinar el número "correcto" de rezagos. Hay varias formas para establecer esto. Nos podemos enfocar en el uso de la R2 corregida para determinar cuántos rezagos agregar. Recuerde que en el capítulo 4 se señala que un problema por el uso de R2 ordinaria como una medida de la bondad del ajuste es que no explica el número de grados de libertad. (Agregar variables adicionales en el lado derecho de una regresión siempre incrementará la R2.) La R2 corregida mide el pori
_______________________
10 Como se escribió, es imposible estimar β en forma directa. Uno tan sólo supone que β = 1, al permitir que los pesos de rezago estimados incorporen el efecto del parámetro verdadero β. Para estimar con restricciones en los puntos extremos necesitamos agregar restricciones a la ecuación (9.21) antes de hacer la estimación en la ecuación (9.22). Por ejemplo, para determinar la cola = 0, estableceremos ws = 0 en la ecuación (9-20). Luego sustituimos esta restricción en la ecuación (9.21) y obtendremos una versión nueva de la ecuación (9.22). 11 Pueden hacerse formulaciones de rezagos más complejas con el uso de rezagos distribuidos racionales. Véase A. Pagan, "Rational and Polynomial Lags", Journal of Econometrics, vol. 8, pp. 242-254, 1978. La literatura sobre expectativas racionales en econometría sugiere diversas especificaciones de rezago posibles todas las cuales tienen la propiedad de que los parámetros de la distribución rezagada son endógenos y pueden cambiar con el tiempo. Véase R.J. Barro, "Unanticipated Money Growth and Unemployment in the United States", American Economic Review, vol. 67, pp. 101-115, 1977.
CAPIT TULO 9: Estimacción de una sola eccuación: temas avaanzados
249
cenntaje de variaanza en la varriable dependiiente (en oposición a la vaariación) expliicada por las variables v independientes:
Viimos en el cappítulo 4 que laa R2 corregidaa se relacionaa con la R2 de la siguiente maanera:
donde N es el número n de obsservaciones y k es el númeero de variablles independieentes. Por connsiguiente, cuuando agregaamos variablees independientes adicionales a una regresión, R ¯ 2 puuede incremenntarse o dism minuir. Por tannto, un métoddo para selecccionar el núm mero de rezagoos en un moddelo de rezagoo distribuido es tan sólo agreegar rezagos aadicionales haasta que la R2 corregida deeja de incremeentarse. Otro proceddimiento es usaar el criterio de d informaciónn Akaike (AIC)):
doonde Σε^ i2 es laa suma de ressiduales cuadrrados. El AIC difiere de la R2 corregida en que penalizaa más fuerte lla adición de variables en el lado dereccho (lo cual redduce el númerro de grados dde libertad). En E principio, ppodemos seleeccionar una esttructura de rezago incremeentando el núm mero de rezaggos hasta el punto p en que el AIC alcanza un u valor míniimo. Otra estadísstica que se rellaciona en forrma estrecha ccon el AIC es el e criterio de Sch hwartz:
Essta fórmula taambién penalliza la adición de variablees en el lado derecho en forrma más fuerrte que la R2 ccorregida. Obsérvese que la R2 corrregida, el AIIC ni el SC pproporcionan una prueba esttadística claraa para la compparación de esspecificacionees de modelo alternativas. Noo obstante, esstas estadísticas proporcionnan información que, cuanndo se combin na con el juiciio, puede ayuudar a determiinar la especifficación de unna estructura de rezago.
250
PARTE DOS: Mod delos de regresión n de una sola ecu ación
EJEMPLO O 9.1
Función de c onsumo
En el modello de la función de consum mo agregado, es mejor asumir que el coonsumo en el periodo pressente Ct es unna función directa del ingrreso disponibble personal Yt en e el periodo presente y en n periodos paasados, y la taasa de interés rt. Esperaremos que una tasa de interés más m alta, sienddo otras cosass iguales, estaará asociada conn más ahorross y menos connsumo. Si regrresáramos Ct en e Yt y rt,, resuultaría una estadística DW W baja, señalaando la presenncia de correllación serial de primer orden n positiva. Poor esta razón, se tomó la deecisión de estimar una form ma elemental dee la función dde consumo aggregado usanddo primero diiferencias y una u formulaciónn de rezago distribuido d po olinomial. El modelo, estiimado desde el primer trimeestre de 19500 hasta el prim mer trimestre de 1995, es:12
donde Ct = gastos de coonsumo persoonal trimestralles (miles de millones m de ddólares) ∆Ct = Ct - Ct - 1 Yt = ingreso i personnal disponiblee trimestral (m miles de millonnes de dólaress) ∆Yt = Yt - Yt - 1 rt = promedio p trim mestral de las tasas de interrés diarias de bonos de tesoorería Un primer intento i para estimar e el mod delo usando uun polinomio de tercer graddo de cinco peeriodos sin restricciones dee puntos extremos produjoo los siguienttes resultados de d la regresiónn (estadísticaa t entre parénntesis):
Los coeeficientes de loos rezagos pu ueden interprettarse de la sigguiente maneraa. Un incrremento de m mil millones de dólares enn el cambio trimestral t en el ingreso dispponible en eel tiempo preesente resultaará en un inccremento en el cambio en el e consumo dee 329 milloness en el primerr trimestre, 247 millones enn el segundo trim mestre, 181 millones m de dóólares en el terrcer trimestre, etc. La tasa de interés está relacionada inversamente i con los cam mbios en el coonsumo, pero el coeficiente no n es significcativo desde el e punto de viista estadístico. ____________ 12
Este ejeemplo se basa en las variables GC, GYD y FYGM33 de la base de daatos Citibase.
CAPÍÍTULO 9: Estimación de una sola ecuación: temas ava anzados
251
Si creemoss que el efectto de los cam mbios en el inggreso disponiible personal so obre los cambbios en el connsumo no se sentirán s despuués de cuatro periodos, es raazonable estabblecer la colaa de la distribuución de rezago igual a 0 en e el periodo t - 5. Con prop pósitos ilustraativos, hemoss estimado de nuevo el moodelo usando laa restricción de d la, cola ceroo. Los resultaados exhibidos en el siguien nte resultado dee regresión muestran m que laa restricción de d la cola ceroo tiene relativ vamente poco effecto, dado quue los pesos dde rezago veciinos ya están cerca de ceroo. Ésta es una coonsecuencia natural n del heecho de que las funcioness polinomialees son continuuas.
Po or último, connsidérese el reesultado de reegresión en el que tanto la cola c como la caabeza de la diistribución dee rezagos se asume a igual a 0:
La restricción del cero een la cabeza de d la distribución ha alteraddo un poco el paatrón de los pesos p de los rrezagos. Si see hace una grráfica, los peesos ahora se ap proximarían a una estructuura en U invertida. Una vvez más la restricción del ceero y la contiinuidad del poolinomio son determinantees decisivos del d patrón de reezago.
EJEMPLO 9.2
In nversión en inv ventario
En este ejempllo construimoos un modelo de regresión de una sola ecuación e que co ontiene rezaggos distribuidoos polinomialles. El ejempllo estima el cambio c mensuual en los inventarios de faabricantes en las industriass de bienes duuraderos IND (v valor en libross al final del periodo) p como o una funciónn de los embarrques SHD,
252
PARTE DOS: Mode e los de regresión de una sola ecua ción
los pedidos no n despachadoos UNOD y ell índice de preecios al mayorreo WHD.13 S Se han usado loss datos mensuuales de enero de 1983 a maayo de 1987 y se ha llevado a cabo una regrresión de rezaago distribuiddo polinomial.. En la figura 9.3 se presentta una gráfica de los valorees estimados y reales del cambio en los l inventarioos duraderos dee los fabricanntes. A continnuación se muuestran los reesultados de la l estimación, con c la estadísstica t entre paaréntesis:
Obsérvesse que la form ma final de laa ecuación exxpresa la relaación de invenntarios con em mbarques com mo un polinom mio de tercer grado; el pollinomio definne, entonces, 25 coeficientes dde embarquess actuales y reezagados. Se incluye i el nivvel rezagado de inventarios, se introduce el índice de pprecios al maayoreo como el cambio mensual (promeddiado durante dos meses) y se agregan los pedidos no n despachadoss usando el caambio mensuual (promediaado durante seeis meses).
13 Se usaroon las siguientes series de datos Cittibase: inventarios de fabricantes de d bienes duraderoos (IVMD), embarrques de bienes duraderos (MD DS), pedidos no despachados dee bienes duraderoos (MDU) y el índdice de precios al productor para todos t los bienes duraderos d (PWM MD).
CAPÍT TULO 9: Estimación de una sola ecua ación: temas avan nzados
253
Figura 9.3
Cambio en los inventarios del fabricante en industrias de bienes duraderros (millones de dólares).
Un examen n del patrón dde los coeficieentes de rezaago muestra que q hay una resspuesta rezagaada de inventaarios de los faabricantes a loos cambios enn los embarquees de bienes duraderos. d Loos inventarioss declinan al pprincipio peroo luego son aum mentados en forma f gradual con el paso del tiempo, allcanzando su máximo 10 meeses después de d un increm mento en los embarques. Luuego, los inveentarios declinnan en formaa continua a lo l largo de loos 14 meses rrestantes. Obbserve en la figgura 9.3 que lo os valores proonosticados dee la regresión son en cierta medida una verrsión "suavizada" de la serrie real. Éste es un patrón típico cuanddo se usa un rezzago distribuido largo com mo parte de la especificacióón de un modeelo.
9.2
PRUEBAS R PA ARA CAUSA ALIDAD Unn problema coomún en econnomía es determinar si los cambios en una u variable son n una causa dee los cambioss en otra. Por ejemplo, e ¿los cambios en el suministro de dinero causaan cambios enn el PIB, o ell PIB y el suuministro de dinero d están detterminados am mbos en form ma endógena?? Un proceso para resolverr problemas de este tipo es la l prueba paraa causalidad introducida i por Granger y Sims.14 La idea básiica es muy sim mple: si X cau usa Y, entonces los cambioss en X deben preeceder a los cambios en Y. En particular,, para decir quue "X causa Y',', deben 14 Véase C.W.J. Granger, "Inv estigating Causal Relations by E Econometric Mod dels and CrossSpeectral Methods", Econometrica, vol. v 37, pp. 424-4 438, 1969, y C.A A. Sims, "Moneyy, Income, and Cauusality", American n Economic Revieew, vol. 62, pp. 540-552, 1972. Paraa un ejemplo de suu relación con la literratura de expectaativas racionales, véase T.J. Sargennt, "A Classical Macroeconometric M c Model for the Uniited States", Journnal of Political Ecconomy, vol. 84, pp. 207-238, 1976, y T.J. Sargent,, "Estimation of Dynnamic Labor Dem mand Schedules unnder Rational Exppectations", Journal of Political Eco onomy, vol. 86, pp. 1009-1044, 19788.
254
PARTE DOS: Mod P delos de regresión n de una sola ecua ación
cumplirse do os condicionees. Primera, X debe ayudar a predecir Y; es decir, en una u regresión dee Y contra vallores pasadoss de Y, la adicción de valorees pasados dee X como variaables indepen ndientes debeerá contribuirr de manera significativa al poder expliccativo de la rregresión. Seg gunda, Y no d debe ayudar a predecir X. La razón es quee si X ayuda a predecir Y y Y ayuda a pred decir X, es pro obable que unaa o más variablles distintas, de hecho, esstén "causand do" los camb bios observad dos tanto en X como c en Y. Para ev valuar si cadaa una de estaas dos condicciones se cum mple, deseam mos probar la hiipótesis nula de que una variable v no ay yuda a predeccir a la otra. Por P ejemplo, paara probar la hipótesis nulla de que "X X no causa Y"", regresamoss Y contra valorres rezagados de Y y valorees rezagados d de X (la regressión "sin restrricción" ) y lueego ejecutarem mos la regresión de Y sólo ccontra valoress rezagados dee Y (la regresión n "restringida"). Una prueb ba F simple pu uede usarse paara determinarr si los valores rezagados r de X contribuyen de manera sig gnificativa al poder p explicatiivo de la primeraa regresión.15 Si lo hacen, po odemos rechazzar la hipótesiis nula y conclluir que los dato os son consisteentes con que X causa Y. La hipótesis nu ula de que "Y no causa X" see prueba luego o de la mismaa manera. Para prrobar si X caausa Y, procederemos de la l siguiente forma. f Primerro, probaremoss la hipótesis nula "X no caausa Y" ejecu utando dos reg gresiones: Regresión sin restricción: r
(9.23 3a)
Regresión resttringida:
(9.23 3b)
y usamos laa suma de ressiduales cuadrrados de cadaa regresión paara calcular u una estadística F y probar ssi el grupo de d coeficientess β1, β2, …, βm son signiificativamentee diferentes dee cero. Si lo son, s podemoss rechazar la hipótesis h de que q "X no causaa Y". Segund do, probaremos la hipótesis nula de que ""Y no causa X" X ejecutando las mismas regrresiones anterriores, pero co onmutando X y Y y probando si los valo ores rezagados de d Y son sign nificativamentte diferentes d de cero. Paraa concluir quee X causa Y, debemos rechazzar la hipótesiis "X no causaa Y" y aceptaar la hipótesis "Y no causa X". Nótese que el númerro de rezagoss m en estas rregresiones ess arbitrario y se reduce a un n problema dee juicio. Por lo l general, es mejor ejecuttar las pruebaas 15
Recuérrdese del capítuloo 4 que la estadísttica F es como siggue:
donde ESSR y ESSUR son las sumas de residuuales al cuadrado en las regresionnes restringida y sin restricción, resppectivamente; N es el número de observaciones; k es el número dee parámetros estim mados en la regreesión sin restricciión; y q es el núm mero de restricciiones del parámeetro. Esta estadísttica está distribuida como F(q, N - k).
CAPÍT TULO 9: Estimació ón de una sola ecu uación: temas avan nzados
255
parra unos cuanttos valores differentes de m y asegurarsee de que los reesultados no sonn sensibles a la elección de d m. Ademáás, observe quue una debiliidad de esta pruueba de causaalidad es que una u tercera vaariable Z podrría estar causaando Y pero podría también estar correlaccionada conteemporáneameente con X Un na forma de ocu uparse de estaa posibilidad es ejecutar reegresiones en las que los valores v reza16 gad dos de Z tambbién aparezcaan en el lado derecho. d
EJEMPLO 9.3 3
El petróleo y la economía e
Du urante las déccadas de 19700 y 1980 el mundo m experim mentó cambios abruptos en el precio del d petróleo. Debido al papel p importante que dessempeña el petróleo en las economías inndustrializadaas, esta "conm moción petroolera" puede tenner implicacciones macrroeconómicass importantees. Considerremos, por ejeemplo, las reccesiones de 19975 y 1980. Los L saltos proonunciados enn los precios del petróleo, qu ue ocurrieronn en 1974 y 1979-1980, contribuyeron en forma claara con aqueellas recesionnes, y lo hiccieron en divversas formaas. Primero, cau usaron una reducción enn los ingresos nacionalees reales de los países im mportadores de d petróleo. S Segundo, con ndujeron a "eefectos de aju uste", inflació ón y un desceenso mayor en el ingresó y producción reales resultantes de las rig gideces que im mpidieron quue los salarioos y los preciios que no erran de energéticos entrarann en equilibriio con rapideez.17 Los precioss del petróleoo habían flucctuado antes del salto quee ocurrió en 19 974. En un estudio del imppacto macroeeconómico, Jaames Hamilto on demostró qu ue los datos ap poyan la hipóttesis de que los cambios enn los precios del petróleo habían sido unaa causa de loos cambios enn el PIB y ottras variabless macroeconóómicas clave a lo largo del pperiodo de possguerra.18 Aquuí reportamoss sus pruebas de causalidad reelacionando loos cambios en e el precio ddel petróleo, ∆P ∆ t , con los cam mbios porcenntuales en el PIB real, log(P PIBt/PIB t -1). Hamilton ejjecutó la regresión OLS:
16 Para un exaamen crítico de llas pruebas de caausalidad Granger-Sims, véase R. L. Jacobi, E.E. Leaamer y M.P. Ward d, "The Difficultiees with Testing fo or Causation", Ecoonomic Inquiry, vool. 17, pp. 401 4133, 1979, y E.L. Feige y D.K. Pearrce, "The Causal Relationship betw ween Money andd Income: Some Cavveats for Time Series Analysis", Reeview of Economiics and Statistics, vol. 61, pp. 521-5 533, 1979. Además, para una expliccación más generral y reciente de las l leyes causaless y su observaciónn, véase C.W.J. Graanger, "Some Reccent Developmentts in a Concept off Causality", Jourrnal of Econometrrics, vol. 39, pp. 1999-211, 1988; A. Zellner, "Causality and Causal Lawss in Economics", JJournal of Econom metrics, vol. 39, pp. 7-21, 1988; y J.W W. Pratt y R. Schllaifer, "On the Intterpretation and O Observation of Laaws", Journal of Eco onometrics, vol. 39, pp. 23-52, 1988. 17 Para una exp posición detallad a de estos efectos, véase R.S. Pin dyck y J.J. Roten nberg, "Energy Shoocks and the Maccroeconomy", enn A. Alm y R. Weeiner (eds.), Mannaging Oü Shockss, Cambridge: Balllinger, 1984. 18 J.D. Hamiltoon, "Oil and the Macroeconomy M sinnce World War II ", Journal of Poliitical Economy, voll. 91, pp. 228-2488, 1983.
256
P PARTE DOS: Mod delos de regresión n de una sola ecua ación
primero estaablecemos quee zt = ∆Pt y xt = log(PIBt /P PIBt -1) y luegoo viceversa. Los L resultados para p dos muesstras previas a 1973 de datoos trimestralees, primero paara m = 4 y lueg go para m = 8, se muestraan de la siguieente manera:19
Obsérveese que la hippótesis H2, que los cambioss en el precio del petróleo no causan los cambios c en el e PIB real, ess rechazada fu fuertemente en ambos casoos, mientras quee la hipótesis H1 , que los caambios en el P PIB real no caausa los cambiios en el precioo del petróleoo, no puede reechazarse. Estos resultados, junto con los l otros que presenta p Ham milton, proporrcionan evideencia de una relación fuerrte entre los preecios del petróleo y la econ nomía.
EJEMPL LO 9.4
¿Cuál fue primero: la gallin na o el huevo? ?
Ésta es unaa pregunta que. ha atormen ntado a los huumanos desdde los días de la primera torttilla de huevoo. Un estudio de Thurman y Fisher, en el e cual se usarron pruebas de causalidad, yya ha arrojadoo por fin algunna luz sobre el e problema.20 El estuddio hace uso de datos anuaales sobre dos variables: producción p tootal de huevo enn Estados Unnidos (EGGS S) de 1930 a 1983 y prod ducción total de gallinas en Estados Uniddos (CHICKE ENS) para el m mismo perioddo. La prueba es simple. Se ejecuta e la reggresión de EG GGS sobre EG GGS rezagadaa y CHICKEN NS rezagada; sii los coeficienntes en CHIC CKENS rezaggada son signnificativos com mo grupo, enton nces las gallinnas causan a los huevos. P Para concluir, cuál de los dos d "fue primero o", es necesarrio encontrar causalidad unnidireccional, es decir, rechhazar la no cauusalidad de unno hacia el ottro y al mismoo tiempo fallaar en rechazarr la no causaliddad del otro hacia el uno. Los ressultados de T Thurman y Fisher F fueron dramáticos. Si se usan los l rezagos quee variaban de 1 a 4 años, obbtuvieron un rechazo claroo de la hipótesis de que los huevos h no cauusan a las galllinas pero fueeron incapacees de rechazarr la hipótesis dee que las galliinas no causaan a los huevoos. ¡Por tanto o, pudieron cooncluir que el huevo fue prrimero! Thurmaan y Fisher suugieren que esta metodología podría applicarse tambiién a otras cuestiones fundamentales. Por P ejemplo, podrían usarrse pruebas de d 19 La 20
e s t a d í s t i c a r e p r e se n t a u n a p r u e b a F d e b 1 – b 2 = … = b m = 0 . Este ejeemplo fue extraíddo de W. N. Thurm man y M. E. Fishher, "Chickens, Eg ggs, and Causalityy, or Which Carnee First?", Americaan Journal of Agrricultural Ecanom mics, pp. 237-238,, mayo de 1988.
CAPÍT TULO 9: Estimació ón de una sola ecu uación: temas avan nzados
257
cau usalidad paraa probar si es verdad que "El " que ríe al último ríe mejor" m y para proobar la multivvariada "El orggullo precedee a la destrucciión, y un espíritu altanero preecede a una caída". c Esperaamos reportarr los resultadoos de estas prruebas en la sig guiente edicióón de este librro.
9.3
OBSERVACIO B ONES FALTA ANTES Co on frecuenciaa el trabajo em mpírico se coomplica, por el hecho de que pueden falltar las observ vaciones paraa una o más variables. v Daddo que no hayy una mejor maanera para traatar con el prooblema de las observacionees faltantes, prrocedemos a exponer algunaas de las cuesstiones relevaantes y sugerrimos algunass soluciones po osibles. Supóngase que el modello de regresióón está dado por: p (9.24) Si se dispone dee N observaciiones tanto paara X como paara Y, el estim mador de mínim mos cuadradoos de la penddiente es:
(9.25)
dó ónde X ¯N y Y ¯ N representan las medias muéstrales m calcculadas para las primeras N observacioness. Supóngase que se dispon ne dé M obserrvaciones adiccionales para la variable depeendiente pero que hay M observaciones o faltantes paraa la variable ind dependiente.211 Una solucióón sencilla paara el problem ma de las obbservaciones falltantes es sim mplemente no considerar lass últimas M oobservacioness de Y. Si las ob bservaciones eliminadas e soon aleatorias, el estimador dé la pendiennte de mínimo os cuadrados seguirá sienddo un estimad dor insesgadoo y consistentte de β2 Y el ún nico efecto de eliminar las observacionees es una pérddida de eficien ncia. En general, entre máss cerca están llas X faltantess dé la media m muestral y enttre menor es la varianza muuestral de las X faltantes, será menor la pérdida de d eficiencia cauusada por elim minar las observaciones. Si faltan muchas m observvaciones, la péérdida de eficciencia potenccial necesita unna alternativa a sólo eliminnar las observvaciones incom mpletas. Si see dispone de alg gún conocimiento a priori, la mejor alterrnativa puede ser asignar valores para 21
En la mayorr parte de los estuddios de corte transsversal la falta dee disponibilidad dee observaciones de la variable dep pendiente hace qque sea inútil Cualquier C inform mación acerca dee las variables expplicativas. En el análisis a de series de tiempo, las obbservaciones de la variable depenndiente faltantes preesenta un problem ma serio y necessita una solución.
258
PARTE DOS: Modelos de regresión de una sola ecuación
las observaciones faltantes. Si no se dispone de información a priori, debe encontrarse otra solución. El procedimiento más natural es remplazar las observaciones faltantes por la media muestral de las observaciones de X disponibles. Este enfoque de orden cero es equivalente a hacer la regresión de X en una constante y asignar, a cada observación faltante, el coeficiente estimado. Dentro del modelo de dos variables no es difícil mostrar que la sustitución de las medias de las variables por las observaciones faltantes no cambia al estimador de pendiente de mínimos cuadrados o su varianza. Sin embargo, se puede observar que si generalizáramos el modelo a uno que contuviera diversas variables independientes, sólo una de las cuales tuviera observaciones faltantes, el procedimiento de sustitución descrito aquí podría producir estimadores de pendiente diferentes y una mejora en la eficiencia.22 En la práctica, es improbable que sea realista la suposición de que las observaciones faltantes son aleatorias. Por ejemplo, en un estudio en el que se relacionan los gastos en automóviles con el ingreso, puede haber observaciones faltantes para los individuos de bajos ingresos, quienes tienden a gastar poco en automóviles. Eliminar las observaciones o usar la media muestral de X para remplazar observaciones faltantes no es un procedimiento correcto, debido a que no se toma en cuenta la correlación conocida entre el ingreso y los gastos. De manera equivalente, al hacer análisis de series de tiempo, debemos tomar en cuenta el hecho de que la mayor parte de las variables de series de tiempo tienden a experimentar tasas de crecimiento relativamente predecibles. Para hacer esto, debemos buscar variables sustituías que estén altamente correlacionadas con las variables cuyas observaciones faltan. Una solución elemental para el problema de las series de tiempo implicaría remplazar las observaciones faltantes con observaciones sustituías obtenidas de ajustar la regresión de los valores conocidos de la variable independiente sobre el tiempo y luego remplazar las observaciones faltantes con los valores ajustados de la regresión. Este procedimiento sólo es uno de varios métodos en los que se pueden remplazar las observaciones faltantes por medio de la interpolación de la variable X. Si la variable de tiempo no está correlacionada con el término del error en la ecuación original produce estimadores consistentes de los parámetros. Este proceso es más útil debido a que sugiere un enfoque de primer orden más general para el problema de las observaciones faltantes. Supóngase que un conjunto de "instrumentos", Z2, …, Zk, está disponible con respecto a la variable con observaciones faltantes. Se presume que los instrumentos están altamente correlacionados con la variable X y no están correlacionados con el término del error ε. Para poder incrementar la eficiencia de los estimadores de los parámetros originales mientras mantenemos la consistencia se procede de la siguiente forma: 22 Véase Y. Haitovsky, "Estimation of Regression Equations When a Block of Observations Is Missing", Proceedings of the American Statistical Association, Business and Economics Statistics Section, 1968; A. A. Afifi y R. M. Elashoff, "Missing Observations in Multivariate Statistics II. Point Estimates in Simple Linear Regression", Journal of the American Statistical Association, vol. 62, pp. 10-29, 1967; y M.G. Dagenais, "The Use of Incomplete Observations in Múltiple Regression Analysis", Journal of Econometrics, vol. 1, pp. 317-328, 1973.
CAPÍT TULO 9: Estimació ón de una sola ecu uación: temas avan nzados
259
Primero, lleevamos a caboo la regresión n de X sobre eel conjunto dee instrumentoss para todas laas observacioones con inforrmación comppleta:
Luuego calculam mos valores ajuustados para las l observacioones faltantes:23
En ntonces podem mos volver a estimar e la ecuuación final coomo sigue: (9.27) donnde
(9.28) En n tanto los insstrumentos seean elegidos en e forma corrrecta, la estim mación de la ecuuación (9.27)) producirá unn estimador de d pendiente consistente. Hay varios problemas p asoociados con este procedimiento. Uno de ellos es que lass varianzas de d error asociiadas con observaciones faltantes f seráán mayores que las varianzaas de error restantes; [de laa ecuación (99.28)]:
Un na técnica máás refinada usaaría mínimos cuadrados poonderados parra ajustar la pérrdida de eficiiencia asociadda con heteroccedasticidad. Otro problem ma es la posibbilidad de quee falten obserrvaciones para más de unaa variable inddependiente. Lu uego debe ejeecutarse una sserie de regreesiones para llenar las observaciones falltantes. Por desgracia, el oorden de estos procedimieentos puede afectar a a los parrámetros estim mados. Por últtimo, a menuddo es difícil la elección de innstrumentos aprropiados. Si uno u o más insstrumentos esttán correlacioonados con el término del errror, se introduucirá el error dde medición (una ( forma dee errores en laas variables) cuaando las obseervaciones faaltantes son remplazadas r ppor observacciones de la varriable sustituíía construida.. Para mayorres detalles, el e lector podrrá revisar el cap pítulo 12, en el que se exxponen los errrores en las vvariables y laas variables insstrumentales. 23
En el análisiss de series de tiem mpo es improbablee que falte el últim mo conjunto de obbservaciones. El anáálisis es bastante general, g sin embaargo, debido a quee tan sólo necesitaamos reacomodarr la numeración de las observacionees de manera aproopiada y todos lo os resultados se dderivarán.
260
P PARTE DOS: Mod delos de regresión n de una sola ecua ación
EJEMPLO O 9.5
Ayuda a los estados e
Para entendeer cómo la ayyuda federal a los estados affecta sus decisiones de gastto, los economiistas de finannzas públicas a menudo esstiman modelos de regresióón en los que lo os gastos estaatales (y/o locaales) son deteerminados porr diversas caraacterísticas finnancieras y demográficas importantes dde un estado particular. Una especificación bastante simple de ese modelo es:
donde EXP = gastos estattales agregado os en 1972 POP = población del estado enn 1972 AID = subsidios federales f totaales para cada estado en 1972 INC = ingreso peersonal agregaado en el estaado en 1970 Estimamos el modelo dee determinanttes del gasto usando u datos para los 50 eestados en Estados Unidoss, obteniendo el siguiente rresultado (esttadística t enttre paréntesis):
Luego, com mo una demosstración de la forma de trattar el problem ma de las obseervaciones falltantes, asum mimos que lass cinco últimaas observacioones en INC no estaban dispponibles. Por consiguientee, intentaremoos tres proced dimientos. Enn el primero, tann sólo eliminam mos las cincoo últimas obseervaciones dell modelo. Mieentras que en el segundo ccaso, remplazzamos las observaciones faltantes f con la media de IN NC dentro de lla muestra conocida de 45 observacionees. Para el terccer ejemplo, se usará el procceso de primeer orden sugerrido para rem mplazar observvaciones faltanntes llevando a cabo la regrresión de INC C sobre POP y AID dentro de la muestra de d 45 observaaciones. (La reegresión fue IINC = -.7 x 109 + 4.63AID D+ 4 162POP.) Luego pronoosticamos INC C para las cinnco observacioones restantess y remplazamoos las observaaciones faltanttes con los vaalores pronosticados. Los rer sultados de la regresión een cada uno de d los tres procedimientos de d corrección se incluyen jun nto con los reesultados origginales en el ssiguiente cuaddro.
CAPÍTULO 9: Estimación de una sola ecuación: temas avanzados
261
En este caso en particular (nuestros resultados no siempre se sostienen), encontramos que el primer procedimiento de omitir las observaciones tuvo relativamente poco efecto en los resultados de regresión. Sin embargo, remplazar las observaciones faltantes por la media de INC tuvo un impacto considerable, causando que los resultados estimados difirieran de los originales. Finalmente, el procedimiento de primer orden produce resultados muy buenos, con el coeficiente en AID volviéndose muy cercano al coeficiente asociado con la muestra completa. ¿Por qué el segundo procedimiento no funcionó en este caso? Una respuesta parcial puede obtenerse comparando los valores usados para remplazar las observaciones faltantes con los datos originales (todos los valores están en miles de millones de dólares).
Observación 46 47 48 49 50
INC
Orden cero
15.7 9.5 103.8 1.7 4.2
17.9 17.9 17.9 17.9 17.9
Primer orden 15.4
9.4 102.1 .5 2.4
Es evidente que, en este caso (con INC variando en forma tan amplia de un estado a otro), los valores pronosticados de INC están mucho más cerca de los originales que la media de INC, y el procedimiento de primer orden funciona mejor. Sin embargo, enfatizamos que este ejemplo no se generaliza. Definir cuál de estas técnicas elementales es más apropiada depende de la capacidad del modelo de uno para explicar en primer lugar por qué ocurrieron las observaciones faltantes. Además, en todos los procedimientos de corrección se consumió información muestral y, por consiguiente, grados de libertad. Por tanto, en el segundo y tercer procedimiento se exagera la significación estadística de los resultados debido a que no explican, en forma directa, el hecho de que las regresiones preliminares fueron ejecutadas para obtener los datos faltantes.
9.4
EL USO DE DATOS DE PANEL Un conjunto longitudinal, o datos de panel, es el que incluye una muestra de individuos (hogares, empresas, ciudades, etc.) durante un periodo. Como resultado, este conjunto puede incluir numerosas observaciones sobre cada individuo en la muestra. Un conjunto de datos de panel puede ser útil debido a que le permite al investigador clasificar efectos económicos que no pueden distinguirse sólo con el uso de datos de corte transversal o de series de tiempo.
262
PARTE DOS: Modelos de regresión de una sola ecuación
Como un ejemplo, supóngase que estamos modelando la rentabilidad de empresas en una industria. En una regresión basada en datos de corte transversal para un solo año se podrían incluir variables explicativas como la calidad de la administración, la cantidad de capital físico, el empleo de mano de obra y el grado de ventaja financiera. Este modelo de corte transversal como inicio puede tomar en cuenta cualesquiera economías a escala que la empresa pueda disfrutar. Sin embargo, el modelo no puede explicar ninguna rentabilidad incrementada que pueda ocurrir con el tiempo conforme se hacen mejoras tecnológicas en la industria. En principio, el uso de datos de panel puede permitir al investigador separar el impacto de las economías a escala del impacto del cambio tecnológico. En efecto, el conjunto de datos de panel nos permite estudiar tanto los cambios en los beneficios de una sola empresa a lo largo del tiempo como la variación en los beneficios de muchas empresas en un punto dado en el tiempo. El uso de datos de panel también puede tener otras ventajas. La primera, es que los conjuntos de datos de panel, por lo general, proporcionan un número incrementado de puntos de datos, y esto genera grados de libertad adicionales. En la segunda, la incorporación de información que relaciona a variables de corte transversal y de series de tiempo puede disminuir de manera considerable los problemas que surgen cuando hay un problema de variables omitidas.24 Por ejemplo, tenemos que un investigador está interesado en que las empresas que disfrutan de mejoras tecnológicas son capaces de incrementar el uso de capital físico en su producción. Un análisis de corte transversal, el cual no podría explicar el progreso tecnológico, puede estimar en forma imprecisa el efecto del incremento de capital en la rentabilidad de una empresa. Sin embargo, con los datos de panel, el componente de series de tiempo de los datos puede usarse para incorporar el efecto de la mejora tecnológica en la rentabilidad y por tanto desaparece el problema potencial de las variables omitidas. El proceso de combinar datos de corte transversal y de series de tiempo para formar un panel se llama combinación. De manera característica, los parámetros de corte transversal pueden cambiar con el tiempo de una manera que no se refleja en la elección de variables explicativas de series de tiempo, o los individuos pueden variar en formas importantes dentro del corte transversal de tal forma que no se refleja en la elección de variables de corte transversal. Como resultado, el uso de datos de panel añade una dimensión de dificultad nueva al problema de la especificación del modelo; con los datos de panel es probable que el término de perturbación consista en perturbaciones relacionadas con la serie de tiempo, perturbaciones del corte transversal y una combinación de ambas. En las subsecciones siguientes consideramos varias alternativas que han demostrado ser útiles en el estudio de los datos de panel. La presentación se confina a una especificación de regresión de dos variables para mantener las cosas lo más simples posible.
24 Para una exposición minuciosa de los datos de panel, véase C. Hsiao, Analysis of Panel Data (Cambridge: Cambridge University Press, 1986).
CAPÍTU ULO 9: Estimación de una sola ecuación: temas avanzzados
9.4 4.1
263
Estim mación de m modelos con n datos de p panel
La primera técnnica para el uso de datos de d panel tan sólo combinaa todos los dato os de series dee tiempo y corrte transversall y luego estim ma el modelo subyacente utiliizando mínim mos cuadradoss ordinarios. Un U segundo pprocedimientoo implica el recoonocimiento de d que las varriables omitid das pueden coonducir a cam mbios en los inteerceptos del coorte transverssal y de la seriie de tiempo. Los L modelos con c efectos fijoss agregan varriables indicaadoras para permitir estos interceptos cambiantes. c Unaa tercera técnnica mejora laa eficiencia del d primer prooceso de estim mación por mínnimos cuadraddos explicanddo las perturbbaciones del ccorte transverrsal y de la serie de tiempo. El modelo dee efectos aleattorios es una variación del proceso de estimación por mínimos m cuadrrados generaliizados descritoo en el apéndiice 6.1. Por últim mo, consideraaremos técnicas que explicaan el hecho dee que el términ no del error pueeda estar correelacionado a llo largo del tiempo y a lo largo de las unnidades del cortte transversall. Una vez más m una variaación de la estimación e po or mínimos cuaadrados generaalizados proporciona una solución s útil aal problema. Connsidérese el modelo m de doss variables:
don nde N es el núúmero de uniidades del corrte transversaal (individuoss) y T es el núm mero de periodos. Si se cum mplen todas las l suposicionnes del términno del error clássico, podríam mos estimar regresiones de corte transverrsal separadass, con cada regrresión implicaando N observvaciones. Paraa el periodo t = 1 la regresión de corte trannsversal sería
Porr tanto, se tiene un total de T de estas ecuaaciones. Del m mismo modo, podríamos estimar N regresiiones de seriees de tiempo con c T observaaciones en cad da una. Sin emb bargo, si tantoo α como β sonn constantes a lo largo del ttiempo y a lo largo l de las unid dades del corrte transversall, pueden obteenerse estimaadores de los parámetros p máss eficientes all combinar toddos los datos de d modo que se ejecute unna regresión com mbinada grandde con NT obbservaciones. En esta técniica de combinnación más elem mental habrá NT - 2 gradoos de libertadd (dado que laa estimación de los dos parámetros usa 2 grados de liibertad).
9.44.2
Modeelo de efectoos fijos
La dificultad con el procedim miento de com mbinación dee mínimos cuuadrados es quee la suposició ón de interceppto y pendiennte constante ppuede ser no razonable. La generalización obvia es inttroducir variab bles indicadorras que permittan que el
264
PARTE DOS: Modelos de regresión de una sola ecu uación
término del intercepto vaaríe a lo largo del tiempo y a lo largo de las unidades del d corte transv versal. Si las pendientes variaron v tambbién, cada reggresión de coorte transversal separada im mplicaría un modelo m distinnto y la com mbinación seería inapropiada.25 Escribimoss el modelo de efectos fijos dde la siguiente forma: (9.229) donde
Se ha agreggado (N - 1) + (T - 1) vaariables indicadoras al moodelo y tambiién hemos omitido las doss restantes, dado que suu adición ressultaría en una u colinealidad d perfecta enttre las variablles explicativaas. Si este moodelo fuera esstimado usand do mínimos ccuadrados orddinarios, se obbtendrían estiimados insesggados y consiistentes de toddos los parám metros (incluyyendo la penddiente β). Estaaría implicado un u total de NT T - 2 - (N - 1) - (T - 1), o NT N - N - T, graados de libertad. Los coeficieentes de la vaariable indicad dora mediríann el cambio en n los intercepptos del corte traansversal y laa serie de tiem mpo (con respeecto al primerr individuo enn el primer periiodo). Para ver esto, podeemos eliminarr las variablees indicadorass y reescribir ell modelo asocciado con cad da una de las N NT observaciiones:
25 La conncesión para la vaariación aleatoria en parámetros dee pendiente se hacce en la literaturaa del modelo de coeeficientes aleatoriios. Véase, por ejjemplo, W. H. Greene, G Econometric Analysis (Nuueva York: Macmillan, 1990), seccióón 16.4.
CAPÍT TULO 9: Estimació ón de una sola ecu uación: ternas avan nzados
265
El efecto de loss coeficientes δ1 y γ1 faltan ntes es explicaado en el paráámetro α, el cuual es el interccepto de la priimera ecuacióón. Luego, cadda uno de los δ es medido lueego en funcióón de las desvviaciones de δ1 (y los γ en función de desviaciones d dee γ1) Y por tannto del interceepto "verdadeero" α. La decisiónn de agregar variables inddicadoras pueede tomarse con c base en pruuebas estadístticas. La pruebba implica unaa comparaciónn de la suma de d cuadrados deel error asociaada con las doos técnicas de estimación. Dado que ell modelo de míínimos cuadraados ordinariios incluye más m restriccionnes de parám metros que el moodelo de efecctos fijos (loss interceptos estarán e restrinngidos a ser iguales a lo larrgo del tiempo o y entre indivviduos), esperraríamos que la suma de cu uadrados del errror fuera mayyor para el moodelo de míniimos cuadradoos ordinarios.. Si el incremeento en la sum ma de cuadraddos del error no es significcativo cuandoo se agregan lass restriccionees, concluimoos que las resstricciones soon apropiadass, y pueden applicarse los mínimos cuadrrados ordinariios. Si la sum ma de cuadraddos del error cam mbia en form ma considerablee, optamos po or el modelo de d efectos fijos. La prueba esttadística aproopiada es:
doonde, ESS1 y ESS E 2 son la suuma de cuadrrados del erroor en los que se s utilizan el mo odelo de míniimos cuadraddos ordinarios y el modelo de efectos fijos, respectivaamente. En la hipótesis nulla de que las restriccioness de interceptoo igual sean coorrectas, la estadística e F sigue la di stribución F con N+T-22 y NT-N-T graados de liberttad, Hay varios problemas associados con el uso del moodelo de efecctos fijos. El priimero, es que el uso de inddicadoras no iddentifica en foorma directa lo l que causa qu ue cambie la lín nea de regresiión a lo largo del d tiempo y eentre individuoos. Segundo, la técnica de vaariables indicaadoras usa un na cantidad coonsiderable de d grados de libbertad (N + T - 2 en nuuestro modeloo). Por ejempplo, el uso de d variables ind dicadoras parra un estudio de 15 empressas a lo largo de un perioddo de 4 años im mplicaría una reducción r de grados de libeertad de 58 a 41, que no ess un número inssignificante. Siendo S esto así, a los investtigadores, conn frecuencia, especifican mo odelos que sóólo incluyen eefectos fijos de d corte transvversal.
9.4.3
Modelo de efecctos aleatorios
Daado que la inclusión de vaariables indicaadoras representa una faltaa de conocimiiento acerca del d modelo, ees natural desscribir esta faalta de conociimiento por
266
PARTE DOS: Mod delos de regresión de una sola ecua ación
medio del téérmino de perrturbación. Po or tanto, podrríamos desearr elegir un moodelo de corte transversal y serie de tieempo combinnados en el quue los términoos del error pueeden correlacionarse a lo largo del tiem mpo y de las unidades u indivviduales. Esto se puede reallizar con el modelo m de efecctos aleatorioss (o modelo de d componentees del error) de la siguientee manera:26
d donde
= componente del error del corte transveersal = componente del error de lla serie de tieempo = componente del error com mbinado
Ademáss, suponemos que los com mponentes del error individduales no estáán correlacionaados entre sí y no están autocorrelacio a onados (tanto a lo largo ddel corte transveersal como a lo largo de laas unidades dde la serie de tiempo). t La relación entre el m modelo de efecctos aleatorioss y el modelo de efectos fijoos puede verse tratando t los téérminos del inttercepto en el modelo de efeectos fijos com mo dos variablees aleatorias, uuna es la variiable de la serie de tiempoo y la otra es la variable del corte transversal. Si se suppone que ambbas variables aleatorias a estáán distribuidas en forma normal, los graados de libertaad se guardann debido a quue necesitamos preocuparnoos sólo con laa media y la varianza v de cada c uno de loos componentees del error. La form mulación de efeectos aleatorioos se obtiene ddel modelo dee efectos fijos al asumir que el e efecto mediio de las variaables aleatoriaas de la serie de d tiempo y del d corte transvversal se incluuyen en el término del inttercepto, y laas desviaciones aleatorias alrrededor de laa media son ig gualadas a loss componentes del error, ut y vi, respectivvamente. Paraa ver esto conn mayor clariidad, supóngaase que no haay componentee del error en la serie de tieempo. El uso de variables indicadoras no n forzará restriicciones en ell patrón de cam mbio de intercceptos de regrresión, mientrras que el modelo de efectos aaleatorios asuumiría que el patrón p sigue una u distribucióón normal. De manera m especcífica, asúmasse que los inteerceptos del corte transverssal tienen mediaa αu y varianza σ2u. El componente del errror combinad do tiene mediaa 0 y varianza σw2. Estas dos suuposiciones son equivalenttes a la suposiición de que el componentee del error tieene varianza σ2u + σw,2 dadoo que
El efecto dee la media de los intercepto os distribuidoos en forma normal n (αu) seerá explicado po or la inclusiónn de un término constante en la ecuació ón de regresióón 26 Véase G. G S. Maddala, "T The Use of Variannce Components M Models in Poolingg Cross Section and a Time Series Datta", Econometricaa, vol. 39, núm. 2, 2 pp. 341-358, 19971.
CAPÍTU ULO 9: Estimación n de una sola ecua ación: temas avan nzados
267
com mbinada. Si los intercepttos de la seriie de tiempo también hubbieran sido aleeatorios, distriibuidos en forrma normal con c media αv y varianza σ2v, podríamos perrmitir que el efecto e medio dde los intercepptos aleatorioos (αv) fuera reecogido por el término t consttante. Al missmo tiempo el término dell error consisttiría de tres com mponentes y tendría variannza: (9.31)
La relación entre el modelo dde efectos aleaatorios y el m modelo combin nado en los quee se usan los mínimos cuaadrados ordinaarios puede vverse en formaa directa en la ecuación e (9.31). Si tanto σ2u como σ2v son 0, el término del error consiste de una solla perturbación combinada y el procedim miento correctto es aplicar reegresión de mín nimos cuadraados ordinarioos a los datoss combinados. El modelo de efectos alleatorios puedde estimarse como una reegresión de mínnimos cuadraados generalizzados. La estimación ponddera a las obsservaciones invversamente a sus varianzass. Para lograrr la ponderaciión, debe empplearse una estiimación en dos d etapas, daado que las diiversas variannzas del compponente del erro or típicamentte no se conoccen. En la prim mera etapa see estima la mu uestra combinnada entera ussando mínimoos cuadrados ordinarios. (T También podrría usarse el moodelo de efectos fijos.) Loos residuales de mínimos cuadrados orrdinarios se usaan para calcullar estimacionnes muéstralees de los com mponentes de la l varianza. Esttas varianzas estimadas see usan luego en e la segundaa etapa, en la que se obtiennen estimacioones de parámetro de mínnimos cuadraados generaliizados.27 Si uno o está dispuessto a asumir qque los compoonentes del errror están disttribuidos en forrma normal, entonces toddos los parám metros relevaantes pueden n estimarse porr el método de d máxima vverosimilitud, el cual se ddescribe en deetalle en la seccción 10.2. De manera interesante, i ell estimador deel parámetro dde la pendientte, obtenido cuaando el componente del errror combinaddo σw,2 es igual a cero, se aprroximará al estimador obtennido del moddelo de efecttos fijos. Estee resultado no n nos sorpreende, puesto que q este modello ignora la po osibilidad de pperturbacionees conjuntas dell corte transveersal y de la serie de tiemppo. De manerra alternativaa, cuando el com mponente del error combinnado se vuelvee arbitrariamente grande, ell modelo de efeectos aleatorioos se aproxim ma al modelo o de datos combinados c d mínimos de cuaadrados ordin narios. Esto sugiere que ell modelo de eefectos aleato orios puede verrse como un modelo interrmedio que see encuentra eentre el extrem mo de cero com mponente dell error combiinado y un coomponente coombinado inffinitamente graande. ¿Cuál deberría preferirse, el modelo dee efectos fijoss o el modelo o de efectos aleatorios? Com mo se mencionnó antes, el modelo de efecctos aleatorioss usa menos graados de liberttad y tiene un u atractivo conceptual c coomo una caraacterización am mplia de las fuentes de errorr en un conjunnto de datos ggrande con un na variación connsiderable en las series de tiempo y los cortes transveersales. Sin em mbargo, el 27
Para detalles, véase, por ejempllo, Greene, op. citt., sección 16.4.3, o Hsiao, op. cit., sección s 3.3.2.
268
PARTE DOS: Mod delos de regresión n de una sola ecu ación
modelo de efectos e fijos también tiene ventajas. Perrmite al investtigador analizzar el grado en el que la variable dependieente para cadaa unidad del corte c transverssal difiere de laa media globaal del corte traansversal. Addemás, no reqquiere la suposición de que los efectos inndividuales quue son incorpoorados en el téérmino del errror no están corrrelacionados con las variaables explicatiivas en el modelo, una supposición que puede p no ser válida v y por consiguiente c ppuede causar que los estim madores del paarámetro seann inconsistentees.28
EJEMPLO 9.6
Aplicaciones de patentes y gasto en inves stigación y des sarrollo
Las empresaas que están iinvolucradas en forma actiiva en el desaarrollo de tecnnología nueva con frecuenccia invierten sumas s considderables de dinnero en invesstigación y dessarrollo (R&D D). Una medid da imperfecta de la efectividdad de ese gassto es el número de solicituddes de patentees que hace unna empresa. (Una ( estadístiica más significcativa, el valoor neto presen nte del torrente de gananciaas que generaa la R&D, es muucho más difícil de medir.) La relación entre e el logaritmo del númeero de solicitudees de patente (P) y el logarritmo de los gastos g en R&D D (RND) se han h evaluado ussando datos dee panel para 45 4 empresas durante d un perriodo de 7 añoos. Los datos de d R&D estánn rezagados 5 años para reeflejar el intervalo largo que q pasa antes de d que la inveestigación se traduzca en una u solicitud de patente reeal. (Todas las empresas e en lla muestra tuvvieron un núm mero positivo o de patentes en cada año,)29 El modelo de regresiión básico esttá dado por:
donde i se refiere r a las empresas e y t se refiere al tiempo. t El prrocedimiento de mínimos cuuadrados ordinnarios en el quue se usa el coonjunto de daatos combinaddos (con 315 obbservaciones)) generó los siguientes s ressultados (conn la estadísticaa t entre parénttesis):
28 La supo osición de que loss errores no están n correlacionados con las variables explicativas pued de demostrarse co on la prueba de e specificación de Hausman para comparar los paráámetros estimado os usando el modelo de efectos fijos con los parám metros obtenidos del desarrollo dee los estimados de mínimos cuadrrados generalizad dos del modelo de d efectos aleatorios. 29 Los dato os de patentes fueeron obtenidos de la Office of Tech hnology Assessmeent and Forecastin ng. Una versión antterior de este estu udio se reportó en Bronwyn H. Halll, Zvi Griliches y Jerry J A. Hausman n, "Patents and R& &D: Is There a Laag?", Internationa al Economic Revieew, vol. 27, pp. 26 65-283, 1986. Véaase también Bound y cois., "Who Do oes Patents and Wh ho Does R&D?", en Z. Griliches (ed.). R&D, Patentss, and Productivitty (Nueva York: N National Bureau of o Economic Reseearch, 1984).
CAPÍTU ULO 9: Estimación n de una sola ecua ación: temas avan nzados
269
Esta regresiión muestra uuna relación positiva p fuertee entre R&D y las solicituddes de patenttes. En promeedio en la muestra, las soolicitudes de patentes se inccrementaron en e 0.845% poor cada increm mento del 1% en gastos de R&D. Este compoortamiento dell patentado vaaría entre emppresas en form ma considerab ble, y es esta variación la que nos propporciona el rresultado anteerior. No es sorrprendente, poor consiguiennte, que una reegresión del número medioo de patentes (prromediadas a lo largo del tiempo) en la l R&D meddia produzca el siguiente ressultado "entree individuos":
Debido a qu ue este segunddo modelo noo permite difeerencias en la solicitud de pattentes específficas de cada empresa e que no n se deban a diferencias en e los gastos en R&D, es basttante posible que q el modeloo sobres time el impacto dee R&D. Esta hippótesis es connfirmada cuanndo agregamoos un conjuntoo de indicadooras de corte traansversal a la especificaciónn, es decir, cu uando se estim ma un modelo o de efectos fijo os. En el modeelo de efectos fijos el estimaado del impactto de R&D en n las patentes es considerablemente menorr:
No o se han incluiido los coeficiientes de la vaariable indicaddora individuaal asociados conn cada una de d las empressas. Sin embaargo, realizam mos una prueeba F de la hippótesis nula dee que todos loos coeficientess son iguales a cero en form ma conjunta. Coon una estadísstica F de 27.779 con 24 y 26 69 grados de llibertad, rechaazamos esta hippótesis en un nivel del 5% %. Por último, estimamos un modelo de d efectos aleatorios perm mitiendo un com mponente de error en el corrte transversall y un componnente de error combinado, conn los siguienttes resultadoss:
Este modello estima un efecto e considderablemente mayor que ell modelo de efeectos fijos. ¿C Cuál debería preferirse? Hicimos H una pprueba de esp pecificación de Hausman de la hipótesis nula n de un moodelo de efectoos aleatorios en e comparacióón con la hipóótesis alternativa de un moddelo de efectoos fijos. La esstadística ji
270
PARTE DOS: Mod delos de regresión n de una sola ecua ación
cuadrada ressultante de 322.627 con 1 grrado de libertaad es significaativa en un niivel del 5%. Estoo apoya la conclusión de que, q de estos ccuatro modeloos, el modeloo de efectos fijoss caracteriza en forma más m precisa laa relación enntre R&D y las solicitudes de d patentes.
9.4.4
M Modelo de autocorrela a ción de serries de tiem mpo
La especificcación de efecctos aleatorioss tiene la proppiedad de quee la correlacióón de perturbacciones a lo larggo del tiempo o es independiiente de la disttancia temporral entre los térrminos de peerturbación. Otra O especificcación predecciría una decllinación en laa correlación ddel error a lo largo del tiem mpo. Esto suggiere que debberíamos conssiderar la com mbinación de los datos de corte c transverrsal y series de d tiempo bajoo suposicionees de error quue implicarann autocorrelaación de seriees de tiempo (oo corte transvversal) al igual que heteroocedasticidad de corte trannsversal (o de series de tiem mpo). Como un u ejemplo dee cómo podría lograrse estto, considérese el siguiente modelo: m
Las suposiciiones implicaan que aunquee las perturbacciones del corrte transversall no están correlaacionadas y ttienen varianzza constante, las perturbacciones de la seerie de tiempo están e autocorrrelacionadas.. Permitimos que ρ varíee de una uniddad individual a otra, pero fijamos cada esstructura de errror que impllique correlacción serial de prim mer orden. Dee este modo se pueden obteener estimadoores eficientess de los parámettros usando una variantee de mínimoos cuadradoss generalizaddos. Estimaremos cada ρi y luego l usarem mos la ρ^ i estim mada como una u base paraa la regresión dee mínimos cuuadrados geneeralizados. Paara estimar ρi, i = 1, 2, ...,, N, estimamos la muestra combinada completa usando u mínimos cuadraddos ordinarios. Dado que loos estimadorees de los parámetros son consistentes (al igual que innsesgados), poodemos usarloos para calcullar los residuaales de regressión ^ ε it . Luego estimamos e cadda ρi de manerra consistentee como sigue:
CAPÍTU ULO 9: Estimación n de una sola ecua ación: temas avanzzados
271
Procederemos fo ormando la forma fo de diferrencia generaalizada del modelo m originaal:
La forma de difeerencia generaalizada puedee estimarse ahhora aplicand do mínimos cuadrados ordinaarios al modello combinado o. Se usan NT T - N observacciones en la estimación, dadoo que se elimiina una obserrvación de cada unidad ind dividual en el proceso p de differenciación ggeneralizada. Las L correccionnes para heterrocedasticidad d o correlaciónn de corte traansversal entrre unidades inndividuales procederían p en forma similaar a la que see acaba de describir. Si laa heterocedassticidad se pressentara en el modelo de laa ecuación (9.32), por ejem mplo, usaríamoos los residuaales del modeelo de la diferrencia generaalizada (combbinada) para estimar e las variianzas del erro or individual y luego aplicar mínimos cuuadrados ponnderados en la teercera etapa del d proceso de estimación..
EJEMPLO 9.7
Ayuda extranjera
30
Un problema de naturaleza em mpírica importante que ennfrentan los ecconomistas del desarrollo see refiere al efeecto de la ayu uda extranjeraa en los gastos de inversión n de los paísess menos desarrrollados (LDC C). Algunos ecconomistas haan afirmado quee la afluencia de d capital extrranjero a los LDC L no conduuce a un increm mento en la inveersión, sino que q en lugar dde ello conduucen a un inccremento en el e consumo púbblico y privadoo. Para abordaar este tema, see desarrolló unn modelo econ nómico que exp plica Ja interreelación entre llas decisioness fiscales, de gasto g y de sollicitudes de présstamo. El moodelo asume qque los funcioonarios locales buscan max ximizar una funcción objetivo que es influiida por eleccio ones de asignnación entre el e consumo privvado, el consuumo "civil" público, p el connsumo "sociooeconómico" público, la inveersión pública con propóssitos de desaarrollo y los préstamos públicos de fuenntes nacionalles. La maximización de esta funciónn objetivo suj ujeta a una resttricción presuupuestal produuce una serie de cinco ecuaaciones simulltáneas que deb ben cumplirsee si se ha de lograr la maxiimización. Paara simplificaar las cosas exaaminaremos dos d de esas cinnco ecuacionees:
30 Este ejemplo se adaptó de P. S. Heller, "A Model M of Public F Fiscal Behavior inn Developing Counntries: Aid, Investtment, and Taxatiion", American Economic Review, vol. 65, pp. 368--379, junio de 1975.
272
PARTE DOS: Mo odelos de regresió ón de una sola ecu uación
donde Tt = nivel de ingrresos fiscales y no fiscales en el momen nto t It = inversión púública con pro opósitos de deesarrollo en el momento t Gc,t = consumo "civvil" público (administracióón gubernamenntal, servicio de la deuda, policía, ejército o) en el momeento t Gs,t = consumo "soocioeconómicoo" público (esscuelas, hospittales, carreteraas, proyectos aggrícolas) en ell momento t A1t = subsidios al sector público en el momeento t A2t = préstamos al sector públicco en el momeento t Yt = producto inteerno bruto enn el momento t Mt = importacionnes en el mom mento t La muestraa de LDC inclluía 11 países africanos: Niigeria, Ghana,, Zambia, Kennia, Uganda, Taanzania, Malaawi, Liberia, Etiopía, E Túnezz y Marruecoss. Se disponíaa de datos de seeries de tiemppo de todas laas variables ppara periodos de aproximaadamente 6 añños. Debido a que el sistem ma de ecuacionnes es simultááneo, se eligióó la técnica de mínimos cuadrados de dos etapas para estimar cadaa ecuación. AdeA más, se tom mó la decisiónn de usar un modelo m de efeectos aleatorioos con dos coomponentes de d error, un téérmino del errror de corte transversal y un término del error combiinado, εit = ui + wit . Se supusso de manera iimplícita que los l interceptoss de la serie de tiempo permaanecieron con nstantes durannte el periodoo de estudio. Sin embargo, el e componentte de error de d corte transsversal explicca la naturaleza aleatoria dee los intercepptos del corte transversal. El procceso de estim mación proced dió en dos pasos. p En el primer p paso, las ecuaciones de forma redducida se estiimaron usando mínimos cu uadrados ordiinarios. Los vaalores ajustadoos de las variabbles endógenaas de la derechha se calcularoon y sustituyeroon en las ecuaaciones estruccturales. En laa segunda etappa, luego de este e procedimieento de mínim mos cuadradoss generalizadoos de dos pasos, fue estimaada usando unaa variante deel procedimieento 2SLS deescrito en el texto. t Para caada ecuación, se calculó la l proporción n del corte transversal con c la variannza combinadaa θ: θ = σ2u, / σw2, . Las ecuacciones estimaadas (con la estadística t enntre paréntesis y los términoos constantes eliminados) son:
La prim mera ecuaciónn verifica el reesultado esperrado de que mayores m subsiddios y préstamos conducen a menores ingrresos recolectaados en formaa nacional (auun-
CAPÍTULO 9: Estimación n de una sola ecua ación: temas avanzados
273
quee el término de d subsidios ees insignificannte). La inverrsión gubernaamental y el con nsumo civil gubernamenta g al tienen un efecto e positivvo fuerte en los ingresos fisccales, pero éstte es compenssado en ciertaa medida por el e coeficiente negativo en el término t de co onsumo sociooeconómico público. p Los resultados r de la segunda ecu uación indicann que la ayudaa extranjera tuuvo un efectoo positivo en la inversión, perro siendo el vaalor menor quue 1 indica qu ue parte de estta ayuda se prooporciona a otrras áreas de gasto. g Concluuimos que laas ecuacioness estimadas verifican v la inteerdependenciia fiscal asociiada con los presupuestos p actual y de capital. c Los prééstamos extrannjeros puedenn afectar y afeectan al consuumo público y a la inversiónn.
AP PÉNDICE 9..1 Esttimación de inttervalos de con nfianza para ellasticidades a largo plazo
Suppóngase que hemos h estimaado un modelo de rezago distribuido d conn un rezago geoométrico, espeecificado com mo:
donnde Q es canttidad, P es prrecio y Y es in ngreso. Para eesta ecuación las elasticidaddes de precioo e ingreso a corto plazo son s β2 Y β3 reespectivamennte, pero las elaasticidades a largo plazo son::31
El problema p es esstimar los erroores estándar (y ( por tanto loss intervalos de confianza)
parra estos estim mados de elastticidad. El procedim miento es el siguiente. Suppóngase que ddeseamos obttener un intervalo de confiianza del 90% % para el estiimador de elaasticidad dado o por el cocieente βˆ2/(l - βˆ4), donde d βˆ2 y βˆ4 sonn los valores esstimados de β2 y β4. Entonces formamos la combinación c lineal:
31 Si la ecuaciónn (A9.1) estuvieraa en forma lineal en lugar de logarrítmica, las elasticcidades estarían daddas por:
donnde una barra ind dica el valor meddio.
274
PARTE DOS: Mod delos de regresión de una sola ecuacción
donde z toddavía está porr determinarsse. Ahora nóttese que la varianza v de essta combinación n lineal es:
Si z es laa proporción vverdadera β2/(ll - β4), entoncees ф tendrá unaa media de cerro. Si el númerro de gradoss de libertad es muy grannde, la distribbución de ф es aproximadaamente normaal, de modo que q la probabbilidad es del 90% de que el valor muestrral de ф está ddentro más o menos m 1.645 veces v su desv viación estándar, donde 1.6455 se obtiene dde la tabla no ormal. Por tannto,
con probabiilidad 0.90. A Ahora, para ob btener el interrvalo de conffianza, tratam mos la ecuación (A9.4) ( como una u igualdad, es e decir, como una ecuación cuadrática enn z. En otras palaabras, sustituyaa los estimadoss βˆ2, βˆ4, Var (ββˆ2), Var (βˆ4) y Cov C (βˆ2, βˆ4) en la ecuación (A A9.4) y resuelvva la ecuaciónn cuadrática resultante paraa z. El resultaddo será de la foorma:
donde η ess el valor esp erado de la elasticidad e [yy no necesariiamente igua l a βˆ2 /(l - βˆ 4 ),] y ±u es el inttervalo de connfianza del 900%.
EJERCICIO OS 9.1 Supongaa que la ecuación que se va a estimar es:
Al investigaddor le faltan las últimas cinco o observacionees para X4, peroo tiene disponibble una variable Z que se sabe está altamentee correlacionadaa con X4. ¿Quéé debería hacerr el investigador y cuáles supossiciones deben mantenerse paara que éste seea un buen proccedimiento? 9.2 Considerremos los modeelos Yt = α + βX Xt + εt y Zt = γ + δYt + ut. a) Suponga que está trratando de esttimar α y β perro falta la últim ma observación (Tésim ma) en Xt . ¿Quué debería haceer? b) Supon nga ahora que está interesado o en pronosticarr Zt y conoce γ,, δ y Xt para t ≤ T y Yt para p t ≤ T - 1. ¿¿Qué debería hacer? h 9.3 Demuesttre que al rempplazar la obserrvación X faltaante en el modeelo descrito enn la parte a) del ejercicio e 9.2 ussando el tiempoo t como un innstrumento prodducirá un estim mador de pendiente consistentte. ¿Qué suced derá si el términno del error esttá correlacionaado serialmente?
CAPÍT TULO 9: Estimacción de una sola eccuación: temas avaanzados
275
9.4 4 Considere el siguiente s modeelo:
Sup ponga que se sabe s que los in nterceptos de laa serie de tiem mpo son constaantes. ¿Cómo harría la prueba parra ver si se debe usar el modello de efectos fijos para tomar en e cuenta que los interceptos deel corte transveersal varían? 9.5 5 ¿Cómo estim maría un modelo o combinado dee serie de tiemp po y corte transsversal cuando se sabe que ell componente de error del co orte transversaal es heteroced dástico? ¿Un méétodo similar fu uncionaría cuan ndo es el compo onente de la serrie de tiempo el e que se sabe quee es heterocedáástico? 9.6 6 Usted está esstimando un modelo m con dos variables exp plicativas, cad da una de las cuaales tiene un reezago geométrico. Derive un na ecuación parra estimarse cu uando ambos rezzagos tienen pesos idénticos. 9.7 7 Considere el siguiente modeelo:
Mu uestre cómo esttimar el modelo o con el uso deel modelo de rezzago distribuid do polinomial y un u polinomio de d segundo grad do si a) No hay reestricciones de puntos extremo os. b) Se asume que la cola y la cabeza de la diistribución son iiguales a 0 (w-11 = w4 = 0). 9.8 Deseamos ex xaminar varias alternativas paara estimar una ecuación en prresencia de dattos faltantes. El modelo que d deseamos estim mar es: EXP = β1 + β2POP + β3AID A + β4INC + ε don nde se sabe (vééase el capítulo 6) que VAR(εε) = C(POP2). a) Transform me cada variable, dividiendo entre e POP. Deffina:
Usanddo todos los datos, d encuentree estimados efficientes de β1, β2, β3 y β4 regresandoo PCEXP en PO OP1, PCAID y PCINC (con uun término consstante incluido). Estos estimados son nuestro conjunnto de referenciaa para el resto del d problema. A A A A Determíneelos por β1 , β2 , β3 , β4 . Para el e resto de estee problema asum mimos que falttan las últimas cinco observaciones en e INC. b) Usando só ólo las primerass 45 observacio ones y los datos transformado os, estime el B B B B modelo. Denomine D los eestimados β1 , β2 , β3 , β4 . c) Usando laas observacionees 1 a 45, encu uentre el promedio de INC; lláámelo INC. Defina PC CINCC por:
276
PARTE DOS: Modelos de regresión de una sola ecua ción
Ejecutte la regresión de d PCEXP sobree POP1, AID y PCINCC. Denoomine los estimaados βC1 , βC2 , βC3 , βC4 . d) Lleve a cabo la regressión de INC sobbre POP y AID usando u las obseervaciones 1 a 45. 4 Usanddo lo anterior, pprediga INCt paara t = 46 a 50. D Denomine los valores v predichhos INCt. Defina:
y efectúe la regresiónn de PCEXP sobbre POP1, PCA AID y PCINCD. Denomine a loos D D D coeficcientes estimaddos βD 1 , β 2 , β 3 , β4 . e) Usando las primeras 445 observacionnes, encuentre el e promedio de PCINC. Denotte esto con c PCINC. Deefina:
Realicce la regresiónn de PCEXP soobre POPÍ, PCA AID y PCINCE E. Denomine los l
estim mados βE1 , βE2 , βE3 , βE4 , βE5 .
f) Usandoo las observaciiones 1 a 45, ajjuste el modeloo de regresión de PCINC sobbre POP1 y PCAID. Ussando lo anteriior, prediga PC CINCt para t ≥ 46. Llame a los l valorees pronosticadoos PCINCt. Deffina:
Lleve a cabo la regressión de PCEXP P sobre POP1, P PCAID y PCINC CF y denomine a F
F
F
F
los cooeficientes estim mados β1 , β2 , β3 y β4 . g) Coompare y contrraste los resulttados de los pprocedimientos a) a f). ¿Cuálles pareceen ser los métoodos más razonnables para trattar las observaaciones faltantees? ¿Por qué? q
CAPÍTULO
10
ESTIMACIÓN NO LINEAL Y DE MÁXIMA VEROSIMILITUD
Los avances tecnológicos en las capacidades de las computadoras han permitido a los econometristas elaborar y utilizar técnicas cada vez más complejas para la estimación de modelos econométricos. Hace varias décadas la estimación de un modelo inherentemente no lineal podía ser costoso en forma prohibitiva, pero en la actualidad esto puede lograrse con facilidad. Como resultado, ahora los econometristas tienen acceso a un conjunto mucho mayor de herramientas estadísticas. Sin embargo, la elección de la técnica más apropiada aún es una preocupación. En este capítulo nos enfocaremos en tres técnicas avanzadas de estimación. Comenzaremos con una introducción a la estimación no lineal y expondremos algunas técnicas alternativas para estimar ecuaciones no lineales en los parámetros. Además se mostrará cómo se pueden usar estas ecuaciones para el pronóstico. En la segunda parte del capítulo se describe la técnica de estimación de máxima verosimilitud, una alternativa útil a los mínimos cuadrados. En la tercera parte mostraremos cómo se pueden emplear los métodos de estimación no lineal para estimar modelos en los que la varianza del error depende de la volatilidad de errores pasados (modelos Arch) y modelos en los que el patrón de varianzas de errores pasados sigue un rezago distribuido (modelos Garch). El apéndice 10.1 contiene una introducción breve a un método generalizado de estimación de momentos, una técnica muy general que incluye como casos especiales la estimación de variables instrumentales no lineales y estimación de mínimos cuadrados generalizados no lineales.
277
278
10.1
PARTE DOS: Mod delos de regresión n de una sola ecua ación
ESTIMA ACIÓN NO LIINEAL Todos los modelos m de reggresión de unna sola ecuacióón que hemoss estudiado haasta este punto, han sido lineeales en sus coeficientes, y por tanto po odrían usarse los mínimos cu uadrados ordinnarios o las variaciones en los mínimos cuadrados orrdinarios paraa estimarlos. E En esta seccióón examinareemos el probllema de estim mar ecuaciones que son no linneales en sus coeficientes. c A Aunque estoss procedimienntos para la estiimación no liineal pueden ser costosos desde el punnto de vista del cálculo, inccrementan enn gran medidaa el alcance dde las estructturas de modeelo que pueden n usarse para ajustar los daatos. Nos enffocaremos haacia las ecuaciiones que sonn inherentemen nte no linealees. Por ejemploo, las siguienttes ecuacionees
no pueden transformarse t e en ecuacion nes lineales y por tanto no se prestan a lla regresión lineal. De mannera específicaa, considerareemos ecuacionnes de la form ma (100.1) donde f es una u función nno lineal de lass k variables iindependientees X1, ..., Xk y los p coeficienttes β1, .... βp. El criterio usado para deteerminar los vaalores estimaddos para los coeeficientes es eel mismo que se usa en unaa regresión lin neal; es decir,, la minimizacióón de la suma de cuadrados del error. Si ttenemos T obsservaciones enn Y, X1, ..., Xk , podemos p escriibir la suma de d cuadrados del error com mo: (100.2) Llamamos βˆ 1,..., βˆ p a las estimaciones de mínimos cuadrados c no lineales l de β1, .... βp; es decirr, los valores de β1, .... βp que minimizaan la suma de d cuadrados del d error S. En el caso c de una reegresión lineaal es sencilloo, desde el puunto de vista del cálculo, obttener las estim maciones de mínimos m cuaddrados. Sin em mbargo, para una u ecuación noo lineal, hay m métodos de cálculo c alternaativos para enncontrar estim maciones de coeficiente quee minimicen la suma de cuuadrados del error e en la ecuuación (10.2)..
10.1.1
Métodos de cálculo para la estimación no o lineal
Hay tres ennfoques generrales para la solución del problema de laa estimación no n lineal. La mayor m parte dee los métodos numéricos n de estimación in nvolucran a unno
CAP PÍTULO 10: Estima ación no lineal y de e máxima verosim militud
279
o un na combinación de dos dee estos enfoqu ues. Como veeremos, la eleección del enfooque dependee del tipo de eecuación que se esté estim mando. Primero, puedde usarse una búsqueda direecta; en este caso c se evalúaa la función de la suma de cuuadrados del error para coonjuntos alterrnativos de valores v del coefficiente. Aqueellos valores que den com mo resultado uun mínimo son n elegidos com mo las estimacciones. Este m método puede ser efectivo si sólo debenn estimarse uno o dos coeficieentes. Sin em mbargo, si están n implicados más de dos cooeficientes (lo cual sucede con frecuenccia), debe haacerse un núúmero extrem madamente grannde de cálculoos, y por tantoo el método see vuelve muyy costoso desdde el punto de vista v del cálcuulo. Por ejem mplo, si deben n estimarse ccuatro coeficientes y se conssideraran 20 valores v alternaativos para caada coeficiente, la suma de cuadrados del error e debe callcularse (20)4 = ¡160 000 veces! v Por connsiguiente, esste método casi no se usa, y no lo comenttaremos más. Un segundo enfoque impllica la optimiización directta. Las estimaaciones de paráámetro se obtiienen diferencciando la funcción de sumaa de cuadrados del error con respecto a caada coeficientte, establecien ndo las derivaadas iguales a cero (definieendo de este modo un mínimo) m y ressolviendo el conjunto resu ultante de ecuaaciones no linneales (las cuaales son llamaadas ecuaciones normales). Tomando las derivadas d de la ecuación ((10.2) con resspecto a β1, ..., βp y estableeciéndolas iguaales a cero, enncontramos quue las ecuacio ones normalees son:
Estaas ecuaciones no lineales ddeben resolveerse en formaa simultánea para p β1, ..., βp, dado d que cadaa ecuación pueede contener todos t los p cooeficientes. Coomo podría espeerarse, este enfoque puedee presentar dificultades d dde cálculo y por p consiguieente rara vez se aplica en forma directaa. Una variación de este enfoque, el cual hace factible realizar r el cálcuulo, es el métod do de descensoo de pendiente máxima. m El méto odo funciona moviéndose dde un conjunto o de pruebas dde valores de coeficiente c paraa β1, ..., βp a un u nuevo conjjunto de tal foorma que las derivadas - ∂S/∂/ ∂ β1, ..., - ∂S S/∂/βp son tan grandes com mo es posible, dando comoo resultado unn progreso rápiddo para los valores v de β1, ..., βp que miinimizan S (yy para los cuaales las derivaddas son cero). El tercer enfo oque para sollucionar problemas de estiimación no lin neal es un métoodo iterativo de d linealizacióón en el que la ecuación no llineal es lineallizada alrededo or de algún co onjunto iniciaal de valores de d los coeficieentes. Luego se s realizan los mínimos m cuaddrados ordinaarios en esta ecuación lineeal, generand do un conjunto o nuevo de vaalores de los coeficientes. c L ecuación nno lineal es rellinealizada La alred dedor de estoos nuevos valoores de los cooeficientes, see vuelven a reealizar los míniimos cuadradoos ordinarios ppara generar nuevos n valores de los coeficcientes y la ecuaación es relinnealizada alreddedor de estoos valores. Esste proceso itterativo se repitte hasta que see alcanza la cconvergencia; es decir, hastta que los valo ores de los coefficientes no caambian, de manera m consideerable, despuéés de cada nuueva regresiónn de mínimos cuadrados orrdinarios.
280
PARTE DOS: Mo odelos de regresión n de una sola ecua ación
Este en nfoque tiene cciertas ventajaas, la primera es la eficienccia de cálculo. Si la ecuación n que se va a esstimar es apro oximada en foorma cercana por p una ecuacción lineal, pued den ser necesaarias muy poccas iteracioness. Una segundda ventaja es que q proporcion na un lineamiiento claro paara hacer pruuebas estadístticas que, porr lo general, sólo se aplican a la regresiónn lineal. Dadoo que se realizza una regresión lineal en cada iteracción, puedenn usarse pruuebas estadíísticas estánndar (R2, estadísstica t, etc.) para p evaluar el ajuste de la ecuación linealizada l finnal. Debido a qu ue este enfoquue se ha usadoo en programaas de cómputoo para modelaado econométriico, a continuuación se exam minará con más m detalle. Usamoos el hecho dee que cualquieer función no lineal puede expresarse e coomo una expanssión de series Taylor. Podeemos escribir,, específicameente, la ecuacción (10.1) en una u expansiónn alrededor de d un conjuntoo de valores iniciales β1,0, ..., βp,0 para lo os coeficientees β1, ..., βp (En ( este puntto no es importante cómoo se obtuvieron estos valoress iniciales; suppongamos, enntonces, que representan r conjeturas de los l valores veerdaderos.) Laa ecuación exxpandida seríaa:
Aquí el sub bíndice 0 en las derivadass parciales denota que estaas derivadas son s evaluadas enn β1 = β1,0, ..., βp = βp,0. Una ap proximación llineal a nuesttra función noo lineal es proporcionada por los dos prim meros términos en la expaansión de seriees Taylor. Al eliminar los tért minos de segundo s ordenn y de orden superior y reeescribir la eccuación, obteenemos:
Obsérvese que la ecuacción (10.3) tieene la forma dde una ecuación de regressión lineal. En el e lado izquieerdo hay una variable depeendiente consstruida y la paarte derecha co onsiste (además del términno del error additivo) en un conjunto de coeficientes desconocidos d (β1, ..., βp) quue multiplicann al conjunto de variables independienttes construidaas. De este moodo, los coefiicientes puedeen estimarse ejee cutando unna regresión dde mínimos cuadrados c orddinarios. Los vaalores de los coeficientes c esstimados paraa β1, ..., βp, loss cuales se deenominan β1,1, ..., βp,1, se usan como un conjunto c nuevvo de estimaciiones iniciales, y la ecuaciónn no lineal es reelinealizada allrededor de esstos valores. Ell resultado es una u ecuación de d regresión liineal nueva
CAP PÍTULO 10: Estimación no lineal y de e máxima verosimilitud
281
A esta e ecuación,, se le aplicann los mínimoss Cuadrados oordinarios obbteniéndose un nuevo n conjuntto de estimaciiones de los coeficientes c β1,2, ..., βp,2. El proceso de relinealización se s repite hastaa que ocurre la l convergenccia; es decir, hasta h que
don nde δ es un número n pequeeño cuya eleccción dependde en parte deel costo de cálcculo. No obstante,, no tenemos garantía de que q este proceeso iterativo convergerá c en la l estimaciónn de máxima vverosimilitudd de los coeficcientes. Pero puede, por ejem mplo, converg ger en un mínnimo local, en oposición a uuno global, dee la función de suma s de cuaddrados de los errores. Unaa forma de veer si ha ocurrido esto es repeetir la estimacción, comenzzando con un conjunto difeerente de conj njeturas inicialles para los cooeficientes. El hecho de que el processo iterativo pu uede no conveerger en absolluto es muy imp portante. Las estimaciones subsecuentess de los coeficcientes puedeen diferir, y el lado izquierdo de la ecuacción (10.4) puede p hacersee más grandee con cada nueeva iteración (es ( decir, el prroceso puede divergir). Si ocurre diverg gencia, uno pueede comenzarr el proceso ootra vez, usanndo un conjunnto nuevo de conjeturas inicciales para los coeficientes. Si el proceso aún no conveerge, puede seer necesario inteentar un métoodo de estimaación diferentte. Un método alternativo a im mplica una varriación en el m método de linnealización iteraativo. En lugaar de usar lass estimacioness sucesivas reesultantes de cada linealizaación, las estim maciones sonn calculadas a partir de:
donnde βˆ i , j+ 1 es laa estimación dee mínimos cuaadrados de la (j + 1 )ésima itteración y a es un u factor de amortiguamie a ento (0 < α< 1). El factorr de amortiguuamiento α pueede elegirse para p evitar rebbasar los lím mites del míniimo de la funnción de la sum ma de cuadrad dos de los erroores.1 Hay otros métodos m de esttimación no lineal que estáán disponibles y pueden propporcionar esttimaciones coonvergentes cuando c fallann los métodos descritos antees.2 Sin embaargo, en realiddad no hay un u método meejor, dado quee, mientras unoo puede convverger con máás facilidad otro o puede im mplicar menoos costo de cálcculo. A menudo se usan m métodos alternaativos como uuna forma de comprobar quee se ha alcanzado el mínim mo global de laa función de lla suma de cuuadrados de los errores. 1 El factor de am mortiguamiento taambién puede usaarse para cambiar ar el paso β ˆ i , j+ 1 - βi , j de modo que sus valores se encuentren e en algún a lugar interrmedio que sería indicado por el e método de lineaalización y que sería s indicado por el método de descenso d de penddiente máxima. Ésta É es la base paraa el método de Maarquardt. Véase D. D W. Marquardt, "An Algorithm for f Least Squaress Estimation of
Nonllinear Parameters", Journal of the Soociety of Industrial and Applied Mathhematics, vol. 2, p. 431, 1963. 2 Para un anális is de varios métoodos de estimaciión alternativos y sus propiedades estadísticas, véase T. Amemiya, "N Nonlinear Regresssion Models", enn Z. Griliches y M M. Intriligator (ed ds.), Handbook of Ecconometrics, vol. 1 (Amsterdam: North-Holland, N 19 991), capítulo 5.
282
PARTE DOS: Mo odelos de regresió ón de una sola ecu uación
10.1.2
Evaluación de ecuac ciones de re egresión no o lineal
Las pruebaas estadísticass usadas para evaluar el ajuuste de una eccuación de reggresión lineal no son apliccables en form ma directa a una regresióón no lineal. Por ejemplo, unna estadísticaa F no puede usarse para ej ejecutar una prueba p de signnificancia en el ajuste genneral de una regresión no lineal, ni puueden usarse las estadísticass t de la manerra usual. Una razón para essto es que no podemos p obteener una estimación insesgadda de σ2, la varianza verdaddera del términno del error ε,, de los residuaales de la reggresión. Aun si ε está distrribuido en foorma normal con c media 0, loos residuales εˆt dados por: (100.5) no estaránn distribuidoss en forma noormal (ni tenndrán media 0). Por tantoo, la suma de reesiduales cuaddrados no seguuirá una distrribución ji cuaadrada, los cooeficientes estimados no esstarán distribu uidos en form ma normal y las l pruebas t y F estándares no podrán applicarse. Sin em mbargo, las pruuebas t y F se pueden realizzar en la regresión lineal quue se aplica a la liinealización finnal del proceso o iterativo. Espperaremos que esta linealizacción proporcion nará una aproxximación razo onable a la ecuuación no lineeal y que ajusttará los datos. Si S no ajusta llos datos (com mo lo indicann las estadístiicas), habrá dduda en el ajuste de la ecuuación no linneal en su coonjunto. Sienndo esto así, los programas de computaddora que reaalizan estimacción no lineaal por medio del enfoque dee linealizaciónn por lo generaal calculan esttadísticas t y errores e estándaares asociados para p la últimaa linealización. (Estos erroores estándarees son estimaados en forma consistente. c ) A diferrencia de las ppruebas t y F, la R2 puede aplicarse a en su u sentido convvencional a unna regresión nno lineal. Reccuérdese que la R2 se calcu ula a partir dee:
(donde yt se s mide en forrma de desviaaciones) y reprresenta la fraccción de la vaariación en yt que es "expliicada" por la regresión. Laa R2 retendráá este significado cuando la ecuación es no n lineal, si los l residuales son calculaddos a partir dee la ecuación (110.5).
10.1.3
Pronóstico o con una ecuación d de regresión no lineal
Una vez quue se ha estim mado una ecuaación de regreesión no lineaal, puede usarrse para obtener pronósticoos. Un pronósstico de Yt estáá dado por:
CA APÍTULO 10: Estim mación no lineal y d de máxima verosim militud
283
Enn el capítulo 8 se observó qque para una regresión linneal un pronóóstico así es inssesgado y tienne el error cuuadrático medio mínimo. Sin embargoo, no puede haccerse esta afirrmación paraa un pronósticco generado a partir de unna regresión no lineal, como en la ecuacióón (10.6). La razón para esto es que loss errores de pro onóstico no estarán e distribbuidos en form ma normal coon media 0 como c fue el casso para una eccuación lineall. En tal caso no podemos determinar sii el error de proonóstico es menor m que el errror generado o por un conjuunto diferentee de estimacioones de los coeficientes. Además, lass fórmulas paara el error esttándar de pronóstico (es deecir, la desviaación estándaar del error dee pronóstico) y los corresppondientes in ntervalos de con nfianza que see derivaron enn el capítulo 8 para el casoo lineal no se aplican a la ecuuación (10.6). De hecho no hay ningunna fórmula annalítica que pu ueda usarse parra calcular enn forma direccta intervaloss de confianzza de pronósttico para la ecuuación no lineeal general. U Una solución involucra la ggeneración dee intervalos de confianza porr medio del usso de pronóstiico Monte Carrlo, el cual se describe en el capítulo c 14. Éste, É sin embaargo, requiere que los coeficcientes estén distribuidos en forma normaal (lo cual no es el caso) y que se disponnga de estimaaciones para loss errores estánndares de los ccoeficientes y el error estánndar de la ecuuación en sí (lo cual tampocco es el caso)). Por tanto, las l técnicas Monte M Carlo (simulación ( esttocástica) no son s aplicablees aquí en form ma directa. Se sugiere el e siguiente enfoque. Se realliza un pronósstico Monte Carlo usando errrores distribuiidos en formaa normal para los coeficienttes y el términno del error adiitivo, pero conn los resultadoos de la regressión lineal de la última iteraación con el fin de proporccionar estimaaciones para los errores estándares. Como una ilustración, conssidérese la sigguiente ecuacción de regressión no lineall:
Deespués de que se ha estimaddo la ecuaciónn y se ha calcuulado un pron nóstico ŶT+1, se calcula el error estándar dee pronóstico como c sigue: 1. Se reescrribe la ecuacióón como:
don nde se estableece que η0, η1, η2 y εt son varriables aleatorrias distribuid das en forma norrmal con meddia 0 y desvviaciones están ndar iguales a los errores estándares calcculados a partirr de la regresióón lineal corresppondiente a la última iteración n del proceso
de estimación. 2. Se generran números aleatorios (dee las distribucciones normaales apropia dass) para η0, η1, η2 y εT+l paara usarlos paara el pronóstico ŶT+1. Se calcula c este proonóstico comoo correspondee. 3. Repítasee el paso 2 unnas 100 o 200 veces. Usee la desviacióón estándar mu uestral de la distribución d reesultante de valores v para ŶT+1 como el error estándarr del pronóstico. Entonces, este error estándar aprooximado del pronóstico pueede usarse paara calcular inntervalos de confianza. c
284
PARTE DOS: Mod delos de regresión n de una sola ecua ación
No hay y garantía de que este métoodo proporcioonará incluso o una aproxim mación cercanna al error estáándar de pron nóstico verdaddero. Sin emb bargo, al mennos proporcionaa alguna meddida de la connfianza del proonóstico.
EJEMPL LO 10.1
Función de consumo c
En este ejem mplo se estim ma una función n de consumo que es no linneal en los coeeficientes. El objetivo o es reelacionar el coonsumo real aagregado (dólar constante)) C con el ingreeso disponiblee real agregaddo YD en Estaados Unidos, usando datos de series de tieempo trimestrrales. También n nos gustaríaa probar la hip pótesis de quee la propensión marginal m a connsumir (MPC, marginal prop opensity to con nsume), la cuall se
define comoo:
declina connforme se incrrementa el ing greso disponibble. Esta hipóótesis es fácil de apoyar conn el uso de ddatos de cortee transversal (ejecutando la l regresión del d consumo co ontra el ingreeso para grupoos con niveless diferentes de d ingreso), peero no usando datos de seriees de tiempo.. De mannera típica, sse estima la siguiente funcción de consuumo, la cual es lineal en loss coeficientess: C = α0 + α1YD Y + α2YD2 + ε Esperaríam mos que α1 sea positiva. Si se s estima la eccuación usanddo datos de coorte transversal,, por lo geneeral, resultaráá un valor siggnificativo y negativo de α2, mientras quue si se usan llos datos de series de tiemppo, la estimacción de α2 pueede ser positivaa. Como alternativa, a estimamos la siguiente s funcción de consu umo no lineall: (100.7) Los datos de d series de tieempo trimestraales que se esttán usando abbarcan el perioodo 1947-1 a 19995-3. La estiimación se reaaliza mediantte el proceso de d linealiza-ciión iterativa. Usaremos U el valor 1.0 coomo una connjetura iniciaal para los ttres coeficientess (esperaríamos que α1 y α2 estén cerca de d este valor, pero p no tenem mos expectativa respecto al vaalor de α0). La connvergencia ocurre después de 22 iteraciiones. La ecu uación no lineeal estimada ess: (100.8)
CA APÍTULO 10: Estim mación no lineal y de máxima verosimilitud
285
Lo os errores estáándares para αˆ0, αˆ1 y αˆ2 son 16.71, 0.02211 y 0.0126, respectivameente. Como reesultado, cadaa una de las esstimaciones dee coeficiente es e altamente siggnificativa en el nivel del 55%. Además, R2 es igual a 00.999. Por comparración, tambiéén se estimó la l siguiente reegresión lineaal (los erroress estándares están e entre paaréntesis): Cˆ = -14.9255 + .918 YD D (7.031)
R2 = .998
(10.9)
(.0030)
s = 39..23
Nóótese que la MPC M para esta ecuación lineal es una consstante, 0.918. Para P nuestra ecuuación no linneal, sin embaargo, la MPC es:
El valor medio de d YD es 21655 y en este valoor MPC es 0.9917. Obsérvesee que MPC declina conform me se incremeenta YD; para YD igual a 6600, MPC es 0.805. 0
10.2
ESTIMACIÓ ÓN POR MÁ ÁXIMA VERO OSIMILITUD D El enfoque de máxima m verossimilitud se describe en forrma breve en el apéndice 2.22. En esta seccción mostrarremos, en form ma amplia, cóómo puede applicarse este priincipio básicoo a la estimaciión de modeloos econométrricos. En los capítulos c 6y 7 se observó que q la estimaación de mínnimos cuadraados ordinariios produce esttimadores que en ocasionees son ineficiientes o inconnsistentes. Aqquí veremos qu ue una gran veentaja de la estimación de máxima veroosimilitud es que bajo un conjunto amplioo de condicioones los estim madores de los parámetros son consistenntes y (para muestras m granndes) asintóticcamente eficientes. A conttinuación se describe la apliccación del ennfoque de máx xima verosim militud a modeelos lineales y luego l a modelos no linealees.
10 0.2.1
El enfoque de máxima verosimilitu v ud
Coomenzamos el e análisis conn el modelo dee regresión linneal
286
PARTE DOS: Mod delos de regresión de una sola ecuación
Sabemos quue cada Yi esstá distribuidaa en forma normal con media m α + βX Xi y varianza σ2. La distribuciión de probabbilidad puede escribirse en forma explícita como:
La función de verosimilitud es el prooducto de las probabilidad des individualles tomando toddas las N obseervaciones. Enn este caso la función de veerosimilitud ess:
Con la estim mación de máxima verosiimilitud, ahorra nuestra meeta es encontrrar los valores de d los parámettros α, β y α2 que q tienen mayyor probabilidaad de generar las observacionnes muéstraless Y1, ..., YN. Esto E se logra maximizandoo la función de verosimilituud dada antes con respecto a cada uno de d los parámeetros. Para haccer esto es más conveniente ttrabajar con el e logaritmo dee la función de d verosimilituud. LA función lo og-verosimilittud está dada por: p
Maximizar log L es equiivalente a maaximizar L debbido a que la transformaciión logarítmica es monótonaa y creciente [para dos vallores cualesqu uiera de la fuunción, c1 y c2, si c1 > c2, entonces log g(c1) > log(c2))]. Para enconntrar el máxim mo diferenciareemos la funcióón log-verosim militud con reespecto a cadaa uno de los trres parámetros desconocidoss, luego iguallaremos las derivadas d a ceero y resolverremos. Diferen nciando parciaalmente la ecuuación (10.10), con respectto a α, β y σ2 y estableciend do las derivaddas igual a cerro se obtiene:: (10.111)
(10.112)
(10.113)
CAP PÍTULO 10: Estima ación no lineal y de e máxima verosim militud
287
Laa solución a laas ecuaciones (10.11) a (10.13) produce los l siguientes estimadores de máxima veroosimilitud:
Ess evidente quee los estimadorres de máxim ma verosimilituud de α y β sonn idénticos a loss estimadores de mínimos cuadrados. c Poor consiguientte, da como reesultado que α' y β' son mej ejores estimaddores insesgaados lineales. Sin embargoo, σ2' es un esttimador sesggado (aunquee consistente) de σ2. Para obtener unn estimador inssesgado, neceesitamos diviidir el numerrador entre N - 2, ajustan ndo para los graados de libertaad, como se eexpuso en el capítulo 3. La aplicación dell enfoque de mááxima verosim militud a la esstimación de modelos m no liineales se muuestra a continnuación: Supóngase que un modeelo general esstá dado por
do onde ε está disstribuido en foorma normal y satisface toddas las otras suposiciones s del modelo dee regresión liineal básico. Entonces, ppara cada un na de las N ob bservaciones en e Y y las X coorrespondienttes, podemos escribir la disstribución de proobabilidad dee Y, dadas las X y β, como:
do onde exp repreesenta la funcción exponenncial. Entoncees, la función log- verosimiilitud para tod das las N obseervaciones esstá dada por:
(T Todas las sum matorias son calculadas c sob bre las observvaciones i = 1, 2, ..., N.) Al diferencciar la ecuacióón (10.14) coon respecto a cada una dee las β y σ2, igu ualando a 0 y resolviendo, obtendremo os un sistemaa de p + 1 ecu uaciones no lin neales con p + 1 incógnitas.. Si estas ecuaaciones son linneales, como en e el modelo de regresión básico, será fáciil calcular lass soluciones; ees decir, las estimaciones e de máxima veroosimilitud parra cada uno de d los parámeetros. Sin embbargo, si las ecu uaciones no son s lineales, el proceso de solución s es m más complejo y deberemos usaar un procediimiento numéérico similar al a de la seccióón 10.1.1.
288
PARTE DOS: Mod delos de regresión de una sola ecua ación
Cualquiiera que sea el procedimiennto numérico que se utilicee para encontrrar la solución, el estimador de máxima verosimilitud v tiene varias propiedades p d deseables: 1. El esstimador es coonsistente. 2. El esstimador es assintóticamentte eficiente. 3. Las estimaciones e de las variannzas (asintóticcas) de los esstimadores puueden determiinarse como uun subproduccto del processo de estimaciión. Las estimacciones de la vvarianza de la l estimación de cada paráámetro βi esttán dadas por:
el cual es ell valor esperaado de la seguunda derivadaa de la función log-verosim militud con resspecto a βi. Las L estimacionnes de covariaanza entre esttimaciones dee βi y βj se obtieenen del mism mo modo diferrenciando la ffunción log-veerosimilitud con c respecto a βi y luego con rrespecto a βj. La función I(•), la cuaal describe loss componentess de la matriz de informacióón, proporcionaa una medida de la curvatuura de la funcción log-verosimilitud. Enttre mayor sea esta e curvaturaa las varianzaas estimadas sserán mayores.
10.2.2
L prueba de razón de La d verosimiilitud
Supóngase que q se está usando la estim mación de mááxima verosim militud y deseeamos probar si ciertas resstricciones dee parámetro están apoyadaas por los datoos. Por ejemplo o, si queremoos probar la hipótesis h nula de que algunnas de las β son iguales a 0, tenemos una pprueba útil y muy m convenieente, llamada prueba p de razzón de verosimillitud. Para apllicar esta prueeba, suponga qque L(βUR) reppresenta el vaalor máximo de la función loog-verosimilitu ud cuando noo se aplican laas restriccionees, mientras quee L(βR) repressenta el valor máximo m cuanddo se aplican las l restricciones. La razóón de verosim militud está daada por:
El denoominador se bbasa en un modelo m sin restricciones; como c resultaddo, debe ser al menos tan ggrande como el numeradoor. Por consigguiente, λ deebe encontrarse entre 0 y 1. S Si la hipótesis nula es verdaadera, esperarremos que λ esté cerca de 1; si no es verdadera, esperarremos que λ esté cerca de 0. Por lo tannto, podríamos rechazar r la hiipótesis nula cuando λ es ssuficientemen nte pequeña. La prueeba de razón de verosimillitud que pueede aplicarse para evaluar la hipótesis nu ula se basa enn el hecho dee que para muuestras de tam maño grande..
CA APÍTULO 10: Estim mación no lineal y de máxima verosimilitud
289
don nde m es el nú úmero de restrricciones. Paraa hacer la prueeba tan sólo comparamos el valor v calculad do de χm2 anterrior con el valor crítico en, por ejemplo, un nivel de sig gnificancia del 5%. Si χm2 ees mayor que el valor crítiico, podemos rechazar la hip pótesis nula dee que las restriicciones no see aplican, es decir, que las β no son 0. Supóngase el caso de (co omo en la seccción 7.5) quee estamos esttimando el mo odelo (10.15) y deseamos d prob bar las restriccciones de que β2 = 0 y β3 = 0. 0 Entonces, el e modelo resstringido está dado por: (10.16) El valor de L(βUR) se obtiene maximizando m la función de verosimilitud d consistente con n la ecuación (10.15), mien ntras que el vaalor de L(βR) está dado maxiimizando la fun nción de verosimilitud asocciada con la ecuación e (10.16). En la mayo or parte de laas situaciones que implican modelos lineales, en esp pecial aquello os que implican muestras de d tamaño grrande, las pru uebas F más tradicionales (ex xpuestas en el capítulo 5) y las pruebas -d de razón de veerosimilitud deb berían generaar resultados muy parecid dos. Dependieendo del pro ograma para com mputadora qu ue se utilice, lla prueba de razón de vero osimilitud pueede ser más diffícil de aplicaar, pero es m más atractiva cuando están n involucradaas muestras graandes, en parte debido a qu ue no requieren n dé una supo osición de norrmalidad.3
10 0.2.3
Un na aplicació ón: el mode elo de Box--Cox
Un n modelo no lineal l interesaante, atribuid do a G.E.P. Box y D.R. Co ox, para el mo odelo de dos variables v está dado por la siguiente s ecuaación:4
3 Para una com mparación generall de las pruebas F (un caso especiial de una pruebaa de Wald más genneral), las pruebas de razón de verrosimilitud y las pruebas del multtiplicador de Lag grange, véase Robben F. Engle, "W Wald, Likelihood Ratio, and Lagraange Multiplier Tests T in Economeetrics", en Z. Grilliches y M.D. Inttriligator (eds.), Randbook R of Econnometrics, vol. II (Amsterdam: Elssevier Science Pub blishers, 1984), caapítulo 13. 4 Véase G. E. P. Box y D. R. Coxx, "An Analysis off Transformationss", Journal of the Royal R Statistical Socciety, Serie B, vol. 26, pp. 211-243, 1964.
290
PARTE DOS: Mod delos de regresión n de una sola ecua ación
Cuando λ = 1, esto se redu duce a:
el cual es el modelo de regresión lineall básico (con variable v depeendiente Y- 1 y variable inddependiente X - 1). λ Sin embbargo, cuandoo λ = 0, el an nálisis es más complejo poorque (Yi - 1))/λ parece indeterminada. Noo obstante, ob bsérvese que ppodemos usarr una expansióón λ en series de Taylor T para exxpresar Yi co omo:
Resulta que::
Y, para λ = 0, 0
Por tanto o, en el caso eespecial en ell que λ = 0, laa transformaciión de Box-Coox produce el modelo m log-linneal log Yi = α + β log Xi + εi El modeelo de Box-Coox es una espeecificación noo lineal generaalizada, y com mo tal tiene variios usos. Prim mero, uno puede hacer estim mación de mááxima verosim militud para en ncontrar los pparámetros dee un modelo no n lineal en ell que las poteencias de cadaa una de las vvariables sonn estimadas enn lugar de seer especificaddas arbitrariameente. De hechho, en un moddelo más geneeral, puede peermitirse que el parámetro λ varíe de una vvariable a otra. Segundo, uuno puede usaar estimación de máxima verrosimilitud paara probar si el modelo liineal o el moodelo log-lineeal proporciona una mejor esspecificación del modelo. E En cualquier caso, c la funcióón log-verosim militud apropiaada está dada por:5
5 El primeer término surge ddebido a que hay y un cambio de vaariables al moverrse de la función de λ-1 distribución de ε a la función de distribución de Y. Y De manera esppecífica, dε/dY = Yi , de modo que q log(dε/dY) = (λλ - l)log Y.
CAPÍTULO 10: Estimación no lineal y d de máxima verosim militud
291
Unna comparació ón de los valorres de L cuanddo λ = 0 y λ = 1 nos permite elegir el mo odelo que se ajuste a mejor a los datos. Supóngase que no se diispone de un programa dee máxima veerosimilitud com mpleto y que sólo s estamos interesados en n elegir entre los modelos lineal l y loglineeal. En este caso c particularr, puede usarrse un enfoque de mínimoss cuadrados parra solucionar el problema. Para hacerloo renormalizam mos las obserrvaciones Y origginales por laa media geom métrica de Y, Yg. Entonces,, se define Yg de manera imp plícita por la siguiente ecuuación:
Lass variables Y normalizadas n se vuelven ahhora:
Asíí podemos coomparar el meejor ajuste dee los siguientees modelos liineal y loglineeal en forma directa (asum miendo que loos errores estáán distribuidoos en forma norrmal): Lin neal:
Y* = α' + β'X* + ε'
Logg-lineal:
log Y* = α + β log l X* + ε
La comparación n directa es poosible debido a que:
De este modo ell primer térmiino en la funcción log-verossimilitud asocciada con la esp pecificación dee Box-Cox es igual a 0 paraa la versión log-lineal del modelo. m Pero el primer p términno también es 0 para la verrsión lineal, dado que en esste caso λ = 1. Como C resultad do, la estimacción de máxim ma verosimilittud y mínimoss cuadrados proodujeron resulltados idénticos cuando loss datos son noormalizados. (Lo mismo dem mostró ser cieerto en el apééndice 2.2 cuaando se comppararon la esttimación de mín nimos cuadraados y la de m máxima verossimilitud.) Laa ecuación coon la menor sum ma de cuadrad dos del error o, de maneraa equivalente, con la mayorr R2 dará la mejjor especificacción.6
6 Las técnicas de mínimos cuaadrados como laas que se describben aquí generann estimaciones sesggadas de los erro ores estándares. V Véase John J. Sp pitzer, "Variancee Estimates in Models M with the Box x-Cox Transform matíon: Implicationns for Estimationn and Hypothesis Testing", Review w of Economics andd Statistics, vol. 666, pp. 645-652, nooviembre de 1984 4.
292
PARTE DOS: Mod delos de regresión n de una sola ecua ación
EJEMPLO O 10.2
Energía, clim ma y el valor de e la vivienda re esidencial
El valor de las residenciaas unifamiliarres es determiinado en partee por los costtos de producciión de viviennda y por el suministro s y demanda d de atributos a de las l mismas casaas, o el vecinddario local, y de d la región enn la que se loccalizan las casaas. Como parte de un estudioo más amplio de d la relación entre los costoos de energía, el clima y la demanda d de vivienda, J. M. Quigley y D. D L. Rubinfelld estimaron un u modelo de valor v de la vivvienda usando o la especificaación de Box--Cox.7 El modeelo relaciona el e valor en el mercado de un u hogar unifaamiliar V con un conjunto de atributos de tamaño y callidad h1, un coonjunto de atrributos de callefacción, airee acondicionado y atributoss estructuraless relacionadoss h2 y un par de medidas clim máticas W dee la siguiente manera:
El modelo fue f estimado uusando una muestra m de 5 900 9 casas (co on un valor prromedio de 788 000 dólaress) localizadas en 25 áreas m metropolitanaas en 1980. L Los coeficientess y las corresppondientes razzones t generaadas por el método m de máxxima verosim militud para loss atributos im mportantes se dan en el cuaadro que siguee:
Estimaciones s de máxima verrosimilitud Variable
Coeficiente Razón t
Tamaño y atrib butos de calidad d Año de con nstrucción Número de e baños Número de e habitaciones
Cochera (11 sí, 0 no) Plagas presentes (1 sí, 0 no) Vecindario (4 = excelente) Atributos de ca alefacción y aire acondicionado Sótano (1 sí, s 0 no) Aire acondicionado central (1 sí, 0 no) Estufa cale entadora de aire (1 sí, 0 no) Calefactor de vapor (1 sí, 0 no) Atributos de clima Clima cálido (núm. días gra ados) Clima frío (núm. ( días grado os) Intercepto
λ
2
R = .48
.115 .124 .194 .047 .028 .058
2.61 2.36 2.71 2.11 1.90 2.27
.027
2.21
.059 .045 .084
2.25 1.77 2.06
.048
1.42
.042 6.007 -.10
1.52 6.14 2.62
7 John M. Quigley y Danniel L. Rubinfeldd, "Unobservablees in Consumer Choice: C Residenttial Energy and the Demand for Com mfort", Review of Economics and SStatistics, vol. 71, pp. 416-425, agoosto de 1989.
CAPÍTULO 10: Estimación no lineal y de máxima verosimilitud
293
La mayor parte de los atributos de vivienda individuales son estadísticamente significativos y tienen el signo que se esperaría. Las habitaciones adicionales, en particular baños, aumentan de manera considerable el valor de la casa. Un sistema de calefacción central (aire caliente o calor por vapor) es bastante valioso, al igual que el aire acondicionado central. Por último, las casas que se encuentran en climas más moderados son considerablemente más costosas que las que están en climas muy cálidos o muy fríos. El valor estimado del parámetro de Box-Cox λ es bastante pequeño, -0.1, pero es, en forma significativa, diferente de 0. Esto sugiere que una especificación log-lineal proporcionaría una aproximación razonablemente cercana al modelo no lineal de mejor ajuste.
10.2.4
Prueba del multiplicador de Lagrange
Se han analizado dos procedimientos para probar hipótesis: la prueba F o la prueba de Wald (capítulo 5) y la prueba de razón de verosimilitud. Recuérdese que la prueba de Wald comienza con un modelo no restringido y pregunta si la imposición de un conjunto de restricciones (por ejemplo, que un grupo de parámetros de regresión es igual a cero) disminuye de manera significativa el poder explicativo del modelo de regresión. Desde la perspectiva de la prueba de Wald, la hipótesis nula la aportó el modelo restringido y la hipótesis alternativa está dada por el modelo sin restricción. En la estructura de la regresión lineal, la significancia se evalúa usando una prueba F. La prueba de razón de verosimilitud también proporciona una prueba de la hipótesis nula dada por el modelo restringido pero lo hace usando una prueba que depende de la distribución ji cuadrada. La prueba de razón de verosimilitud (LR, likelihoodratio) es atractiva porque depende del principio de máxima verosimilitud. El análisis de la prueba del multiplicador de Lagrange (LM, Lagrange multiplier) comienza con la hipótesis nula que es proporcionada por el modelo restringido. Esta prueba examina si un movimiento en la dirección de la hipótesis alternativa puede mejorar en forma significativa el poder explicativo del modelo restringido. La prueba LM se basa en la técnica de maximización restringida, en la que se usa un multiplicador de Lagrange para proporcionar una estimación del grado en el que la imposición de una restricción altera las estimaciones de máxima verosimilitud de un conjuntó de parámetros. Consideremos que βUR es el estimador de máxima verosimilitud de los parámetros del modelo sin restricción y supongamos que βR representa los parámetros asociados con el modelo restringido. Entonces nuestro objetivo es maximizar ln L(βUR) sujeto a la restricción de que βUR = βR. Esto equivale a maximizar ln L(βUR) – λ(βUR – βR) donde λ es el multiplicador de Lagrange. De manera intuitiva, el valor máximo de esta función se logrará cuando la restricción se cumpla en forma exacta. El
294
PARTE DOS: Mod delos de regresión n de una sola ecua ación
multiplicadoor de Lagrangge mide la "vaaluación" marrginal asociadda con la restriicción: entre mayor m es λ, seerá mayor la reducción r en eel valor máxim mo de ln L(βUUR) a medida quue la restricciión se cumplaa. Para observar esto dee manera form mal, nótese quue una de las condiciones c dde primer ordeen para la maxximización ess:
de modo quue λ es la penndiente de la función de vverosimilitud.. Si la hipótesis nula de quee las restriccioones son váliddas no se rechhaza, los paráámetros restriingidos estaránn cerca de los parámetros siin restricciones y el valor dee λ será pequeñño. Sin embarggo, si las resttricciones se cumplen significativamennte, el costo de imponer la restricción, r el cual está dad do por λ, será ggrande. La pru ueba LM, quee se basa en la magnitud m de λ,, en ocasioness es llamada pprueba de punntuaciones.8 La prueeba del multipplicador de Lagrange L puede aplicarse con c facilidadd al caso especiaal en el que se considera laa posibilidad de agregar vaariables expliccativas adicioonales a un m modelo de reggresión.9 Supponga que se ha estimado el modelo resttringido: (10.117) y se consideera la posibiliddad de agregaar algunas o toodas las q variables adicionaales que están coontenidas en el modelo sinn restriccionees: (10.118) La prueeba del multipplicador de Laagrange de la hipótesis de que q cada una de las q variablles adicionalees tiene un coeeficiente de 0 se realiza calcculando primeero los residuales del modeloo restringido dado por la eecuación (10.17). De maneera específica.
Ahora conssideraremos la regresión de d estos residuuales en todaas las variablees explicativass en el modeloo sin restricciiones:
8
En geneeral, la estadísticaa de prueba para la prueba LM esttá dada por:
donde λ e I( ), la matriz de infoormación, se calcuulan por diferencciación de la funcción de log-veros imilitud. 9 Véase, por p ejemplo, R. Raamanathan, Statistical Methods in E Econometrics (Sann Diego: Academ mic Press, 1993), pp. p 276-277.
C CAPÍTULO 10: Estiimación no lineal y de máxima verosim militud
295
Si to odas las variaables adicionnales fueran "irrelevantes",, los coeficien ntes serían ceroo en las variab bles k – q que se agregan cuuando se pasaa del modelo restringido r al modelo m sin resstricciones. Sinn embargo, sii algunas o todas las variab bles adicionalees en el modelo sin restriccciones son detterminantes siignificativas de d Y, esperam mos que sus cooeficientes seaan estadísticam mente significcativos y, porr tanto, que la ecuación (10.119) se estimaará con un bueen ajuste. La prueba del d multiplicaador de Lagraange se deterrmina con baase en una prueeba de significancia de la regresión r en la ecuación (10.19). Especííficamente, la estadística de la prueba LM M, la cual estáá dada por: (10.20) sigu ue una distribu ución ji cuadrrada con q (el número de rrestricciones)) grados de 2 libertad. N es el tamaño t de la m muestra, R0 ess la R2 asociadda con la regrresión en la 10 ecuaación (10.19). Si la estadísstica de pruebba calculada es mayor quue el valor críítico de la distrribución ji cuuadrada, se reechaza la hipó ótesis nula dee que el modeelo restringido o es válido. Al A hacerlo, hayy que concluirr que algunas de las variab bles adicionalees deberían haberse h incluiido en el moddelo de regreesión. Un exaamen de la estaadística t asocciada con la eecuación (10.19) puede daar un indicio de cuáles variiables podrían n elegirse, perro no hay unn acuerdo conn la elección de d la regla emppírica que debbería usarse. La prueba deel multiplicaddor de Lagrange se usa coon frecuenciaa como un meddio para probaar la heteroceedasticidad; que q está dada por la pruebaa de White en la sección 6.1.. Para generallizar un poco a partir de esaa exposición, supóngase que uno ha estim mado una regreesión lineal y que nos interresa saber si la l varianza del error es una función f de cuualquiera de dos d variables exógenas, e X o Z. White sugiiere que se esppecifique la hheterocedasticiidad como la siguiente función de las variianzas del erro or:
La hipótesis h nulaa de no heteroocedasticidad está dada porr β1 = β2 = β3 = β4 = β5 = 0 en la ecuacióón (10.21). Paara realizar la prueba p de Whhite usamos el e cuadrado de los l residuales de la ecuacióón original coomo estimaciiones de σ2. De D acuerdo con la prueba dell multiplicadorr de Lagrangee, calculamos NR2 a partir de d la regresión n asociada con n la ecuación (10.21). Éstaa seguirá una distribución ji cuadrada con 5 grados de libertad, el núúmero de restricciones asoociadas con laa hipótesis nulaa.
10
Para una deriv vación de esta pruueba, véase Engle, op. cit.
296
PARTE DOS: Mo odelos de regresió ón de una sola ecu uación
10.2.5
Comparacción de las pruebas de e Wald, de razón de verosimilittud y del multiplicadorr de Lagrange
En su form ma más generral la prueba de d Wald guarda una relacióón estrecha taanto con la prueeba de razón de d verosimilittud como con la prueba dell multiplicadoor de Lagrange,, dado que taambién se bassa en la diferrencia entre las l estimacioones de parámeetro restringidas y sin restriicción.11 En el e caso especial del modeloo de regresión lineal, l la prueeba de Wald, como se desccribió en el caapítulo 5, se sims plifica en una u prueba F F:
donde R2URR es R2 para el modelo sin reestricciones y dde manera corrrespondiente ppara R2R. En el caso especiaal en el que el e modelo sin restricciones es el modeloo de regresión lineal l de dos variables y q = 1, la prueba de Wald se s simplifica más a:
En el casoo equivalente,, la prueba LM M está dada por: p
2
donde R0 se s calcula a paartir de la regresión de los residuales dee una regresiónn de Y sobre unna constante (las ( desviacio ones en Y) y soobre la variabble independiente X. Por úlltimo, la prueeba de razón de verosimillitud en este caso simple está dada por: LR = – N ln (1 – R 2 UR ) Es imp portante señaalar que las trres pruebas qque se acaban n de describir son todas asinttóticamente eequivalentes; es e decir, daránn resultados de d prueba iguuales si se permiite que el tam maño de la mueestra se increm mente sin lím mite. Sin embaargo, como reglaa general, difi fieren dentro de d las muestraas y pueden geenerar pruebaas de significanccia diferentes y en ocasionees conflictivass.12 En la meddida en que eestas pruebas diifieren para uuna muestra determinada d y el modelo es e lineal, la 11 La prrueba de Wald esstá dada por W = (βˆUR – ˆβ R)2 I(βˆUR), donde I( ) es la matriz m de informaación. La estadísticaa de prueba siguee una distribucióón ji cuadrada conn grados de liberrtad iguales al núúmero de restriccionnes. 12 Son equivalentes e cuanndo la función loog-verosimilitud ees cuadrática, com mo por ejemplo, en el caso de errorres distribuidos een forma normall.
CAP PÍTULO 10: Estima ación no lineal y de e máxima verosim militud
297
prueeba de Wald siempre daráá la estadísticca de prueba mayor y la prueba p LM siem mpre dará la menor. m Por coonsiguiente, siempre s que laa prueba LM rechaza la hipóótesis nula de que el modelo restringidoo es válido, tam mbién lo haráán las otras prueebas.13 Cuando estáán implicadoss modelos linneales, es fáccil aplicar la prueba de Walld debido a quue es más sim mple estimar los l modelos rrestringido y sin restriccionnes. Sin embaargo, cuando eestán implicaddos modelos m más generaless, la prueba del multiplicadoor de Lagrangge puede prooporcionar unna alternativaa atractiva, dado que dependde en forma directa d sólo dee la estimacióón del modeloo restringido. Además, debbido a que se construye sobbre los residuuales del modeelo restringidoo, puede usarrse como un m medio para verificar v la ro bustez del modelo m ante una variedad de alternativas. a S Se ha observaado cómo pueede usarse la prueba p LM com mo una pruebaa de especificcación que im mplique variaables omitidass. También puede usarse com mo una pruebba para la heteerocedasticidaad, sesgo de ecuaciones e simuultáneas o la presencia de no linealidades, como lo illustra el siguiiente ejemplo.
EJEMPLO 10.3 3
Prue eba de la linea alidad de una fu unción de cons sumo
En el e ejemplo 100.1 se muestraa cómo se usan los mínimos cuadrados no n lineales paraa estimar unaa función de cconsumo no lineal l de la foorma
Con nsidérese que deseamos proobar la hipótessis nula de que la función de d consumo es liineal; es decirr, que α2 = 1. La prueba dee Wald se apllica con bastante facilidad; en este caso la prueba de Wald W es equiv valente a unaa prueba t en la que el valoor t está dadoo por:
donnde el error esstándar se calcula a partir de la última iiteración lineaalizada del proccedimiento de estimación de mínimos cuadrados noo lineales. Daado que es mayyor que el vallor crítico de la distribucióón t, 1.96 paraa una prueba de d muestra grannde bilateral con c un nivel dde significanciia del 5%, se rrechaza la hippótesis nula de una u función de d consumo llineal a favorr de la especiificación no lineal. l Esta prueeba de Wald, en particular, es un caso esspecial de unaa prueba ji cuaadrada más general; se calccula que la estadística ji cuadrada ees 202.83, lo l cual es aprooximadamente igual al cuaadrado de 14,,25. Como enn el caso de laa prueba t, rechhazamos la hippótesis nula de un modelo lineal l con un nivel n de signifficancia del 5%. 13 Véase Engle, op. cit., quien seeñala las complejidades involucraddas al decidir cuáál de las tres prueebas es la más appropiada.
298
PARTE DOS: Mod delos de regresión de una sola ecua ción
Para prrobar la lineaalidad usando o una prueba de razón dee verosimilituud, estimaremoos las formas lineal y no liineal de la fuunción de connsumo haciendo uso de un prrocedimiento de máxima veerosimilitud. La L prueba LR R está dada poor:
la cual, aun nque menor qque la estadísstica ji cuadrrada asociadaa con la prueba de Wald, sig gue siendo alttamente signifficativa con ell nivel del 5% % con 1 grado de libertad, de acuerdo con la tabla de laa distribuciónn ji cuadrada. Por últim mo, se realizaa una prueba LM L de la supoosición de linealidad. En esste caso, se obttiene una estaadística ji cuad drada de 194.6, la cual tam mbién es signiificativa.
10.3
MODELO OS ARCH Y GARCH En el capítu ulo 6 se expuuso el problema de la heterocedasticid dad y se mosttró cómo las coorrecciones paara las perturbbaciones del error heteroceedástico puedden conducir a estimaciones e de parámetroo más eficientees. Aquí nos enfocaremos en gran medidda a situacionees en las que la varianza del d término deel error varía en forma direccta con una o más variabbles independdientes. Por ejemplo, en la siguiente eccuación de reggresión: (10.222) la varianza de εt puede ser s proporcionnal a X22t. En este caso pod dríamos usar un procedimiennto de mínimoos cuadrados ponderados een el que dividdimos las varriables de la izzquierda y dee la derecha en ntre X2t y lueggo estimamoss la ecuación de regresión trransformada
con mínimo os cuadrados oordinarios. El término t del err rror transformaado ε*t = εt /X2t es homocedásttico y, por tannto, los mínim mos cuadradoos ordinarios producirán p esstimaciones de parámetro eeficientes. En alguunas aplicacioones puede haaber razones para p creer quee la varianza del d término dell error no es una función de una variaable independdiente sino que q varía con ell tiempo de tall forma que depende d de lo grande que fu ueron los errorres en el pasado o. Como ejem mplos de esto se s incluyen loos modelos dee inflación, tassas de interés y rendimientoos en el merccado de valorres. Con frecuencia en esttas aplicaciones hay evidenccia de un "agruupamiento" dee errores granndes y pequeñoos. En el modeelado de tasas de interés, po or ejemplo, ess probable quue se encuentrren periodos dee volatilidad aalta (y erroress grandes) segguidos por peeriodos de
CA APÍTULO 10: Estim mación no lineal y d de máxima verosim militud
299
vollatilidad baja (y errores meenores). En ottras palabras, hay una classe particular de heterocedastiicidad presennte en la que la l varianza deel error de reegresión depennde de la volaatilidad de loss errores en el e pasado recieente. Un modelo que se usa enn forma extennsa, para esa forma de hetterocedasticiddad fue elaboraado por Roberrt Engle,14 quiien sugirió quue el uso de unn modelo de hetterocedasticid dad condicionnal autorregreesiva (Arch) conduciría a un incremeento de la eficciencia. El moodelo funcion na de la siguieente manera: Comenzarem mos con la eccuación (10.222) relacionanndo una variaable dependieente con (en este e caso) dos variables inddependientes. Luego escrib biremos una seg gunda ecuació ón relacionanddo la varianzaa del término del error con la cantidad de volatilidad v ob bservada en peeriodos recienntes. La más simple de estas ecuaciones serría: (10.23) La ecuación (100.23) dice quee la varianza de d εt , σt2 , tienne dos componentes: una connstante y las noticias n respeecto a la volaatilidad del úlltimo periodoo, lo cual es moodelado como o el residual cuadrado deel último periiodo (el térm mino Arch). Obbsérvese que enn este modelo εt es heteroced dástico, condiccional en εt -1. Tomando T en cueenta esta infoormación acerrca de la heteerocedasticidaad condicionaal de εt , se pueeden obtener estimaciones más eficientees de los paráámetros β1, β2 Y β3. La estimaciión de las ecuuaciones (10.2 22) y (10.23)) con frecuenncia se hace conn máxima verrosimilitud. D Dado el bajo costo c del poder de cálculo, esto no es muuy difícil. Porr consiguientee, los paquetees de program mas de econom metría para com mputadora máás usados haccen posible estimar modeloos Arch de estta clase con muucha facilidad d. Dado que la l varianza dde εt en la eccuación (10.223) sólo deppende de la vollatilidad del último ú periodoo, nos referirem mos a este moodelo como Arch( A 1). De maanera más geeneral, la varrianza podría depender dee cualquier cantidad c de vollatilidades rezzagadas. Escriibiremos el modelo m Arch(ρρ) como: (10.24) Nó ótese que en este e caso los parámetros p + 1 del prooceso de variaanza deben estimarse junto con los paráámetros β1, β2 y β3 de la regresión, unna vez más usaando estimaciión de máxim ma verosimilittud. A menudo hay razón para p esperar que q la variannza de εt deppenderá de vollatilidades paasadas que se remontan a una u gran canttidad de perioodos. (Esto succede en particcular en apliccaciones de fiinanzas que implican i el usso de datos diaarios o semanaales.) El probblema en este caso es que ddeben estimarse una gran canntidad de paráámetros, y estto puede ser difícil de haccer con algunaa precisión. Sin n embargo, si reconocemos que" la ecuaación (10.24) tan t sólo es unn modelo de rezzago distribuiddo para σt2, vem mos que podem mos remplazaar muchos de estos e valo14 R. Engle, "A Autoregressive Coonditional Heterooskedasticity withh Estimales of thee Variance of U.K K. Inflation", Econnometrica, vol. 500, pp. 987-1008, 1982.
300
PARTE DOS: Mode elos de regresión de d una sola ecuacción
res rezagadoos de εt2 con ssólo uno o doos valores rezzagados de σt2. (Recuérdesee el análisis del modelo m de rezago geométrrico en el cappítulo 9.) Estoo nos conducee al modelo de heterocedastici h idad condicioonal autorregreesiva generaliizado (Garch)), el cual tambiénn puede estim marse por máxima verosimiilitud.15 El moodelo Garch más m simple es el modelo Garcch(l,l):
Ahora la varrianza del térm mino del errorr tiene tres com mponentes: unna constante, la volatilidad del d último periodo (el téérmino Arch)), y la variannza del últim mo periodo (el término t Garch). Recuerde que, en el m modelo de rezaago distribuiddo geométrico, mientras λ1 sea menor que 1, podem mos reescribbir la ecuacióón (10.25) comoo:
En otras palaabras, la variaanza de hoy depende de toddas las volatiliidades pasadaas, pero con ponnderaciones qque declinan en forma geoométrica. En geneeral, se puede tener cualquier número de términos Arch y cualquiier número de téérminos Garcch. El modelo Garch (p,q) se s refiere a la siguiente ecuuación para σt2:
Por últim mo, la ecuación (10.27) puede p generalizarse aún más m incluyenddo una o más vaariables exógeenas o predeteerminadas com mo determinanntes adicionalles de la variannza del error. Por ejemploo, si X3t fueraa una variablee exógena, ppodríamos inclluirla como pparte del siguuiente modeloo Garch(l,l): (10.228) Sin embargo o, la adición de d variables exógenas e o prredeterminadaas a la ecuacióón para σt2 debee hacerse conn cuidado. Sii X3t toma vaalores negativvos, esto puedde causar que la varianza sea negativa paara algunas obbservaciones.. Del mism mo modo com mo se puede introducir varriables exógeenas o predeteerminadas en el lado derecho de la ecuaación que describe σt2, podeemos incluir σt2 (o, de maneera alternativaa, la desviación estándar σt) en el ladoo derecho de la ecuación de regresión [eccuación (10.22 2)]. En este caaso, se puede hacer esto si el propósito dee la regresiónn es explicar los rendimienntos de acciones financierras como valores o bonos. La razón para essto es que uno esperaría quee el rendimiennto sobre una accción financiiera fuera prooporcional al riesgo de la acción. a Por 15 Este mo odelo fue introduucido por Tim Bo ollerslev, "Generaalized Autoregre ssive Conditionaal Heteroscedasticiity", Journal of Ecconometrics, vol. 31, pp. 307-327. 1986.
CA APÍTULO 10: Estimación no lineal y de máxima veros similitud
301
ejeemplo, se puuede modelarr el rendimien nto nominal en un índice de valores, coomo el índice S&P 500 (RET TURNt), com mo dependientee de un términ no constante, la tasa de inflacción, y la variianza condiciional: (10.29) Enntonces, se puuede describir lla varianza σt2 como un procceso Garch (pp,q), como en la ecuación (100.27). Un moodelo de este tipo (en el que q el riesgo esperado es su ustituido por la l varianza coondicional) see llama modeelo Arch-M (A Arch en mediaa).16
EJEMPLO 10 0.4
Ta asas de interéss a largo plazo
Enn este ejemploo modelamoss el comportam miento de la ttasa del bonoo corporativo AA AA relacionáándola con vallores actualess y pasados dee una tasa de interés libre dee riesgo a cortto plazo (la taasa de bonos de tesorería a tres meses) al igual que coon el índice de d Produccióón Industrial y la tasa dee inflación dee precios al maayoreo. La figgura 10.1 muestra la tasa del d bono corpporativo AAA A y la tasa de bo onos de tesoreería a tres messes desde 196 60 hasta princcipios de 19966. Obsérvese qu ue la tasa del bono, b por lo general, g es maayor que la tassa de bonos de d tesorería y tam mbién tiende a suavizar las fluctuacionees a corto plaazo en la tasa de bonos de tessorería. La tasa del bono rrefleja expectativas de valoores futuros de d la tasa de bo onos de tesoreería (y por tantto, debería ser menos voláttil que esa tasa) y también inccluye una peequeña primaa de riesgo que q refleja la probabilidadd de incumpliimiento. Figura 10.1 Tasa de bonos s de tesorería a tres s meses y tasa del bon no corporativo AA AA.
16 Ha habido muchas m aplicacionnes de los modeloos Arch y Garch een las finanzas. Paara un panorama y esbozo e de estas applicaciones, véasee Tim Bollerslev,, Ray Chou y Kennneth Kroner, "A Arch Modeling in Finnance: A Review of the Theory and Empirical Evídence", Journal off Econometrics, vool. 52, pp. 5-59, 1992.
302
PA ARTE DOS: Mode elos de regresión de d una sola ecuaciión
Ejecutareemos la regressión de la tasaa del bono AA AA (RAAA) contra valorees actuales a y rezzagados de la tasa t de tesorería (R3), valores actuales y rezagados deel índice í de Prodducción Indusstrial (IP), la tasa t de crecim miento del índdice de Precioos al a Productor para p todas lass mercancías [GPW = (PW W – PW-1)/PW W-1] y el valoor rezagado r de la tasa del bono AAA. (L La inclusión de la variablle dependientte rezagada r imppone una estrructura de rezzago que decllina geométriicamente, esta estructura e suaaviza las flucttuaciones a coorto plazo en las otras variiables explicaativas.) t Despuéés de algunoss ensayos se eligió e la siguieente ecuación, estimada conn mínimos m cuadrados ordinaarios (las estaadísticas t esttán entre parééntesis):
La figuraa 10.2 muestraa los residuales de esta reggresión. Obsérrvese el "agruupamiento" dee la volatilidadd; hay periodoos extendidoss en los que laa volatilidad es e bastante bajaa (por ejemploo, de 1962 a 1967) y perioddos en los quee la volatilidaad es bastante allta (por ejempplo, de 1980 a 1988). Estoo sugiere que el término deel error es cond dicionalmentee heterocedásttico y, por tannto, puede ser representaddo por un modello Arch o Garrch. Para expplorar esta posibilidad, se reestimó la eecuación (10.330) usando uun modelo Garcch(l,l) simplee para represeentar la variaanza del térm mino del errorr. Los resultadoos se muestraan a continuacción:
Figura 10.2 2 Residualess de la regresión de d la tasa del bono AAA. A
CA APÍTULO 10: Esttimación no lineal y de máxima verossimilitud
303
Obsérvese que al incluiir esta represeentación Garcch de la variannza del error tuuvo muy pocoo impacto en cualquiera dee las estimaciiones de coefiiciente. Adem sólo uno de los coeficiientes en la eccuación Garcch es estadísticamente sigmás, niificativo. Nóteese también qque el error esstándar de la rregresión se ha h incrementaado (de 0.0011830 a 0.0018836). Esto noo significa quue el modelo no explique taambién la tasaa de interés. Tan sólo reflejaa el hecho de que cuando se s estima una eccuación con errores e heteroccedasticos con n mínimos cuuadrados ordinnarios (OLS, orrdinary least squares), loss errores estánndares estimaados serán sessgados. (Este puunto se analizzó en el capíttulo 6.) Para exploorar el patrón de heteroceddasticidad máss a fondo, agrregamos una vaariable exógenna a la ecuaciión Garch. Reetuvimos la estructura Garcch (1,1) pero taambién incluim mos en esta ecuación el cambio en el vaalor rezagado de la tasa de boonos de tesorrería a tres meses. Los resuultados de esstimar este moodelo fueron loos siguientes:
El cambio rezzagado en la tasa de bono os de tesoreríía a tres meses se añade, siignificativameente, a la expplicación de los cambios een la varianzaa del término deel error de la regresión. r Addemás, los coeeficientes en los l términos Arch A y Garch ah hora son altam mente significativos desde el e punto de vissta estadísticoo. Por último, haay un cambiio pequeño ppero notorio en la magnnitud de alguunos de los co oeficientes enn la ecuación de regresión n, y muchas dde las estadísticas t se han inncrementado.
304
PA ARTE DOS: Modelo os de regresión de e una sola ecuació ón
EJEMPLO 10.5
Rendimiento R de e acciones
Como C un seg gundo ejemploo estudiaremos el rendimiiento mensuaal en el índicee de d valores S& &P 500. Prim mero calculareemos este renndimiento usaando datos dee Citibase C en ell índice S&P 5500 (FSPCOM M) y el divideendo produciddo en el índicee S&P S 500 (FSD DXP). Entoncces, el rendim miento mensuaal se calcula como: c
Comenzaremo C os por ejecutar una regressión OLS sim mple del rendim miento contraa una u constantee y dos variablles que en teooría tenderían a reducir el reendimiento: eel cambio c en la tasa t de interéss de bonos dee tesorería a trres meses, ∆R R3t (los precios de d acciones deberían d refleejar el valor presente desscontado de las gananciass futuras f esperaadas y, por taanto, un increemento en la tasa de descuuento, en estee caso c la tasa de interés dee los bonos de d tesorería, debería reduucir este valor presente) p y laa tasa de infllación de preecios al mayooreo, GPWt (la cual puedee reducir r los renndimientos de acciones orrdinarias desppués de impueestos y que enn diversos d estuddios se ha dem mostrado quee se correlacioona en formaa negativa conn los l rendimienntos de las acciones). La ecu uación de regrresión (con las estadísticas t entre e paréntesis) es: RETURN NSPt = .0120 - .8270∆R3t - .8551GPWt (6.83)
R2 = .0549
s = .00329
(-2.70)
DW = 1.52
(10.366)
(-3.64)
log - vverosimilitud = 867.1
Obsérvese quue la R2 de esta regresión es baja; los rendimientoss de accioness, O i incluso los reendimientos en e un índice de acciones, son muy vollátiles, y muyy p poca de la varrianza de estoos rendimientoos puede expllicarse con vaariables económ micas (o de otra índole). N No obstante, loos coeficientess de ∆R3 y GPW G tienen los s signos esperaados y son estadísticamentee significativoos. La figura 10.3 muestraa los residualees de esta regrresión. Una veez más hay unn " "agrupamient to" de la volatilidad. (Quizá el ejempllo más conoccido de dichoo a agrupamiento o es la volatiliddad incrementtada asociada con la quiebrra del mercadoo d valores enn octubre de 1987.) de A continuuación reestim mamos este modelo m con ell uso de una especificación e n G Garch(l,l) para la varianzaa del error:
CAPÍTULO 10: Estimación E no linea al y de máxima verrosimilitud
305
Figura 10.3 Residuales de d la regresión de el rendimiento de S&P 500.
Nótese N que lo os coeficientess Arch y Garrch y los coefficientes en laa ecuación dee regresión r son estadísticameente significaativos, estos coeficientes c en la ecuaciónn de d regresión han h cambiadoo notablemennte, pero una vez más tiennen los signoss negativos n espeerados. La R2 dde la regresiónn ha disminuido, y el error estándar e se haa in ncrementado. Dado que lla estimación n OLS maxim miza la R2, corrigiendo c laa heterocedastic h cidad (y obtenniendo por co onsiguiente eestimaciones de parámetroo diferentes) d puede causar quue R2 disminuuya. (Éste es un u ejemplo de d la forma enn 2 que q la R puedde tener sólo uun valor limittado en la evaaluación de un na regresión.)) Como C para el incremento een el error esstándar, recuéérdese que, coon los erroress heterocedástic h cos, los errorees estándaress estimados bajo OLS son sesgados. Ell valor v de la funnción log-verrosimilitud see ha incremenntado. El rendim miento esperaado por poseer acciones puede com mpensar a loss inversionistass por el riesggo que tienen éstas accionnes. Por consiguiente, unaa v variable expliccativa lógica para agregar a la ecuaciónn de regresión n es la desvia-c ción estándar o varianza deel término dell error mismoo. Por tanto esstimaremos ell s siguiente moddelo Garch en medía; el cuaal incluye la deesviación estáándar, σt, en laa e ecuación dé reegresión: RETUR RNSPt = -.00017 - .9935∆R R3t (-.23))
(- 3.23))
8796GPWt + .48855σt (10.39)
(- 4.97 7)
(1.90 0)
σt2 = .000145 + .11821 εt2-1 + .66929 σt2-1 (2. 28)
R2 = .0507
s = .00332
(44. 32)
DW = 1.49
(10.40))
(88. 07)
log - vverosimilitud = 886.6
Obsérvese O quue el coeficiennte de la desv viación estánddar condicion nal σt tiene ell signo s correctoo, aunque sóllo es marginaalmente significativo desd de el punto dee vista v estadísticco.
306
PA ARTE DOS: Modelos de regresión de e una sola ecuació ón
Por últim mo, considerareemos una estrructura Garchh más compliccada. Despuéss dde algunos ennsayos se estim mó el siguientee modelo Garcch (4,2), una vez v más con laa d desviación esstándar condiccional incluidda en la ecuacción de regressión:
Obsérvese O que el coeficient nte sobre la desviación estánndar condicionnal en la ecuaación c de regresión es ligeraamente menorr en magnitudd pero ahora es e estadísticaamente m significcativo. De estee modo, también son signifficativos dos de d los términos Arch A y ambos términos Gaarch. Aunque no es probabble que este modelo m sea útiil como c un pronnosticador de los rendimienntos de las accciones, demueestra que estos rendimientos r en efecto ddependen del riesgo al iggual que deppenden de los cambios c en laas tasas de innterés y en la inflación en uuna forma qu ue es pronosticada c por la teeoría.
A APÉNDICE E 10.1 Estimación po or el método dee momentos geeneralizado
Los adelantos tecnológicoos recientes enn las computaadoras y en sus L s programas h ayudado a popularizarr un estimado han or no lineal quue asegura estimaciones dee p parámetro coonsistentes baj ajo una amplia variedad dee condicioness y que no reequiere la supo osición de norrmalidad. En esta sección ddaremos un bosquejo b brevee de este métoddo de momenttos generalizaado (GMM).177 Comenzaaremos con el estimador dell método de momentos m más básico, el estiim mador de la media de una variable aleeatoria X. Nuuestro objetivoo es elegir unn estimador Xˆ que es consisstente. Una co ondición necessaria para la consistencia c es que: E(X i – Xˆ ) = 0
17 La estim mación GMM fuee originada por Hansen H y Singleeton. Véase L. P. P Hansen, "Larg ge Sample Propertiees of Generalizeed Method of Moments M Estimattors", Econometrrica, vol. 60, pp p. 1029-1054, 1992 2, y L. P. Hansen y K..J. Singleton n, "Generalized In nstrumental Variaable Estimation of o N Nonlinear Ration nal Expectations M Models, Economettrica, vol. 56, pp. 1269-1286, 1988 8. Véase también J. J D Hamilton, Tim D. me Series Analysiss (Princeton: Prin nceton University y Press, 1994).
CAPÍTULO 10: Estimación no lineaal y de máxima vero osimilitud
307
El equivalente muestral de esta condició ón necesaria ees:
Reesolviendo, encontramos e que Xˆ = (l/N N) ΣXi = X, el e estimador de la media muestral m que exxpusimos prim mero en el cappítulo 2. X ess un estimador del método dee momentos debido a quee se deriva de d la condicióón necesaria para la consisstencia asociaada con el priimer momento de la distribbución de proobabilidad de X. En este casoo, no es necessaria ninguna otra informacción acerca de la distribución de probabiilidad (por ejem mplo, momenntos superioress o la forma fuuncional de la diistribución dee probabilidadd) para obten ner estimacionnes de la meddia. También se s puede usarr el enfoque del d método dee momentos para p obtener esstimadores coonsistentes paara el modelo de regresiónn múltiple. Suupóngase que deeseamos estim mar el modeloo de regresiónn de variable k
Para que cada uno de los parámetros p βj, j = 1, 2, ..., k, sea estimaado en forma co onsistente, see requieren lass siguientes condiciones c (X X1i =1):
E análogo muuestral de estaas ecuaciones teóricas es: El
Estas ecuacionnes pueden paarecer familiarres. Recuérdeese que cuanddo derivamos E ell estimador dee mínimos cuuadrados ordin narios (apénddices 1.2, 4.1 y 4.3) resolviimos una seriie de "ecuacioones normalees" de la siguiiente forma:
paara obtener cada c una de las estimacionnes de parám metro de penddiente individu uales βˆ 1, ..., βˆ k. Una vezz más, debido a que estaas condicionees normales innvolucran la esperanza e o prrimer momen nto de una varriable aleatoriia, el estimadoor resultante, en este caso mínimos cuaadrados ordinnarios, tambiéén es un estim mador GMM. Los estim madores de variables instrrumentales ttambién son estimadores G GMM. Para veer por qué, coonsidérese quee deseamos esstimar el mod delo de regresiión múltiple de d la variablee k, pero nos preocupa (deebido a la sim multaneidad o errror de medicción) que las X puedan estar correlacioonadas con ell término del errror. También supóngase que estamoss conscientess de un instruumento para caada Xj, designnado Zj. Esto asciende a a unn total de k insstrumentos, cada uno de
308
PARTE DOS: Mod delos de regresión n de una sola ecuacción
los cuales esstá correlacionnado al menos con una Xj, pero no está correlacionaddo con el términno del error. L Las condicionees necesarias para p que βˆ j seea un estimadoor consistente para p cada j soon las siguienntes:
El análogo muestral m de esstas k ecuacioones está dadoo por:
Éstas son lass "ecuaciones normales" associadas con el e procedimieento de estimaación de variables instrumentalles. Como hemos h mencioonado, la mayyor parte de los estimadoores que se haan analizado en n este libro soon estimadores GMM. Por ejemplo, los estimadores de d máxima vero osimilitud son estimadores del método de momento os, ya que éstoos involucran la solución dee las ecuacion nes
para la funciión de verosim militud L = Σf Σ (Y, X1, X2, ..., Xk , βl, β2, ..., βk). Esttas ecuaciones pueden p verse como análoggos muéstralees de las ecuaaciones de moomento subyaacentes
Por último, todos t los estim madores de mínimos m cuadrrados generallizados tambiéén son estimadores del métoodo de momeentos dado quue pueden derrivarse como la solución a una u serie de eccuaciones norrmales en las que las X esttán ponderadas por el inversso de la matriz de varianzaa-covarianza de d los errores (apéndice 6.11). En todos lo os casos quee se acaban de describir, el número de ecuaciones normales es exactamente igual al númeero de parámeetros que se vaan a estimar; es decir, las eccuaciones sonn identificadass exactamentee. Sin embarg go, como reggla general, cuaando los modeelos son no liineales, puedee haber más ecuaciones e noormales que paarámetros, en cuyo caso el modelo está sobreidentificcado. El estim mador GMM proporciona p uun estimador consistente qque usa toda la informacióón disponible de una manera que explica mejor m las restrricciones que están e implícitas en un conjunnto sobreidenntificado de ecuaciones.
CA APÍTULO 10: Estim mación no lineal y de máxima verosim militud
309
Para ver cóm mo puede usaarse el estimaddor GMM, enn forma globaal, para estimaar una sola ecu uación,18 supóóngase que se desea estimarr un modelo no lineal con k variables expliicativas:
Suppóngase que para p cualquiera de las razoones posibles (por ejemplo,, no linealidadd, error de meedición o simuultaneidad) nos preocupa qque algunas de d las variablees explicativaas originales puedan estarr correlacionaadas con el término t del erro or. Consideree, por último, que se tiene la opción de k + 1 instrum mentos posiblees (algunos dee los cuales poodrían incluirr las variabless explicativas originales). Enttonces, en unn mundo ideall, estos k + 1 instrumentos se usarían coomo la base de las "ecuacionnes normales""
don nde fj represennta ∂f ( )/∂Xj, es decir, las βj. Debido a qu ue este sistem ma de ecuaciones está sobreidentificado (hay k + 1 ecu uaciones en k desconociddos), no todass las igualdaades pueden mantenerse m exaactamente. Su upongamos quue uji represen nta el "error" asociado a con cada c una de las ecuaciones normales: n
Porr tanto, un ennfoque de estiimación posib ble, consistennte con los míínimos cuadraados ordinarioos, es elegir llas β que min nimicen la suuma de los cuuadrados de estos errores, coon la suma suustituyendo toodas las obserrvaciones (i) y todas las varriables (j). Del mismo modo en que tos mínimos cuadrados geeneralizados son s preferiblees a los mínim mos cuadradoss ordinarios, porque p pondeeran las observvaciones en prooporción inversa a las variaanzas de los errores e asociaados, el estim mador GMM pon ndera los erroores u por suss varianzas esstimadas. Si ssuponemos quue wji represennta la matriz de d varianzas y covarianzass estimadas asociadas con ui y uj, el 2
estiimador GMM M minimiza Σuu i j / wji. Debe señalaarse que, a parrtir de la deriv vación dada aantes, el estim mador GMM es un u estimadorr de variables instrumentalles no linealees. Cuando el número de insstrumentos ess igual al núm mero de parám metros que se va a estimar, la suma de erroores ponderaados será idénnticamente iggual a cero (ddado que cad da ecuación norrmal se man ntendrá exacttamente). Sinn embargo, cuando la ecuación es sob breidentificadda, la suma seerá positiva. Podemos P proobar las restricciones sobreeidentificadoras, con el heccho de que el término t minim mizado por ell estimador 18 El estimador GMM también tiiene una aplicabillidad amplia com mo un estimador dee un sistema de ecuuaciones simultánneas.
310
PARTE DOS: Mod delos de regresión n de una sola ecua ación
GMM siguee una distribuución ji cuadrrada con el núúmero de graados de liberttad igual al núm mero de restriccciones sobreiddentificadas. (É Ésta es la prueba J de HanseenSingleton.)
La elección de pondderaciones cuando el modeelo está sobreeidentificado es más un arte que una cienncia. Una razóón para esto ees que las ponnderaciones que q se van a uttilizar con GM MM dependeen de las estiimaciones de parámetro, las l cuales a su vez dependenn de las pondderaciones eleegidas. Un prrocedimiento es iniciar el moodelo con ponnderaciones igguales y luegoo usar la estim mación resultannte de los parám metros para calcular c una matriz m ponderrada actualizaada.
EJERCICIO OS 10.1 Expand da la función de consumo C = a1 + a2 YD
a3
en una expannsión de serie dee Taylor alrededdor de alguna coonjetura inicial para a1, a2 y a3. Establezca laa ecuación de reegresión lineal. Explique cómoo sería relinealizzada la ecuacióón alrededor de las estimacionnes OLS a partiir de la primeraa regresión. 10.2 Escribaa la función de suma de cuadrrados de los errrores S para la función de connsumo no lineeal C = a0 + a1 YD
a2
Tome las derrivadas de S coon respecto a a0, a1 y a2 para obtener o las ecuaaciones normalles. Describa cóm mo podrían resoolverse estas eccuaciones norm males para prodducir estimacionnes de a0, a1 y a2. 10.3 En el ejjemplo 10.4 se especificó e que la l tasa del bonoo AAA (RAAA A) era una funcióón de los valorees actuales y reezagados de la tasa de bonos de tesorería (R R3), el índice de d Producción Industrial I (IP), la tasa de creecimiento del ííndice de Preciios al Productoor (GPW) y el valor rezagadoo de la tasa dell bono AAA. Una U especificaación alternativva omitiría la vaariable que refleja la tasa de bonos de tesorerría (K3). Usanddo a) una pruebba de Wald, b) una u prueba de rrazón de verosimilitud y c) unna prueba del multiplicador m d de Lagrange, deetermine si es aapropiado omittir esta variablee del modelo. 10.4 Recuerrde que el moddelo Garch(l,l) está dado por:
Muestre quee esto es equivvalente a un modelo m Arch de orden infinitto con pesos que q declinan geo ométricamente en las volatiliddades pasadas. 10.5 Recuerd de que en el ejjemplo 10.4 esstimamos ecuaciones de regresión para la tasa del bono corrporativo AAA A que incluían una representtación Garch de d la varianza del error. Una versión v del modelo tenía unaa estructura Gaarch(l,l) pero taambién incluíaa el cambio en ell valor rezagado de la tasa de bonos de tesorrería a tres messes en la ecuación para la variannza del error. a) ¿Pued de mejorar estee modelo especiificando una esstructura Garchh más complicaada, como Garch((2,2)? (Use loss datos proporccionados en el ddisquete de dattos que viene con c este libro.) Trate T además dee incluir valorees adicionales de d la tasa de boonos de tesorerría
CAPÍTULO 10: Estimación no lineal y de máxima verosimilitud
311
rezagada en la ecuación para la varianza del error. ¿Puede mejorar el ajuste general y el desempeño pronosticador del modelo? ¿Por qué sí o por qué no? b) Si la tasa del bono corporativo AAA refleja el riesgo de poseer bonos corporativos y, en particular, la volatilidad de los precios de los bonos, la ecuación de regresión en sí misma puede mejorarse incluyendo la varianza rezagada. Reestimamos este modelo usando una especificación Garch en media, la cual incluye ya sea la desviación estándar 2 σt o la varianza σ t – 1 en el lado defecto de la ecuación de regresión. ¿Son estadísticamente significativas la desviación estándar o la varianza? ¿Mejora el ajuste de la ecuación?
CAPÍTULO
11
MODELOS DE ELECCIÓN CUALITATIVA
En este capítulo se construirán modelos en los que la variable dependiente implica dos o más elecciones cualitativas. Estos modelos son valiosos en el análisis de datos de encuestas. En la mayor parte de las encuestas las respuestas conductuales son cualitativas: por ejemplo, uno vota sí o no en una elección; usa el tren subterráneo, el autobús o el automóvil; es parte de la fuerza de trabajo o está desempleado, etcétera. Expondremos en un principio la especificación y estimación de tres modelos de elección binaria: el modelo lineal de probabilidad, el modelo probit y el modelo logit. Luego dirigiremos nuestra atención a extensiones de los modelos probit y logit que implican elecciones múltiples, en lugar de binarias. También se analizará el modelo de regresión censurada.
11.1
MODELOS DE ELECCIÓN BINARIA Cuando una o más de las variables explicativas en un modelo de regresión son binarias, podemos representarlas como variables indicadoras y proceder como en el capítulo 5. Sin embargo, es más compleja la aplicación del modelo de regresión lineal cuando la variable dependiente es binaria. Los modelos de elección binaria asumen que los individuos1 se enfrentan con una elección entre dos alternativas y que la elección depende de características identificables. Supóngase, por ejemplo, que deseamos hacer predicciones acerca de cómo votarán los 1
312
Hogares, ciudades y empresas son considerados individuos en la exposición que sigue.
CAPITULO 11: Modelos de elección cualitativa
313
individuos en una elección local. Se podría determinar que el ingreso del individuo sea un determinante primario de la elección del voto y que (siendo iguales otras cosas) los individuos con ingresos altos tienen mayor probabilidad de votar sí en una cuestión de bonos gubernamentales que los individuos con ingresos bajos. Mientras que esperar una relación directa entre el ingreso y el comportamiento del voto es razonable, no podemos estar seguros de la forma en qué votarán todos y cada uno de los individuos. Un objetivo más plausible es predecir la probabilidad de que un individuo con un ingreso determinado votará que sí. Por tanto, el propósito de un modelo de elección cualitativa es determinar la probabilidad de que un individuo con un conjunto determinado de atributos hará una elección en lugar de la alternativa. Un modelo adecuado es uno que nos permita hacer afirmaciones del siguiente tipo: "La probabilidad de que un individuo con un ingreso de 15 mil dólares votará que sí en el próximo sufragio acerca de bonos gubernamentales es de 0.6." De manera más general, deseamos encontrar una relación entre un conjunto de atributos que describen a un individuo y la probabilidad de que el individuo hará una elección determinada.2 Para simplificar el análisis, señalaremos que la probabilidad de que un individuo haga una elección determinada es una función lineal de los atributos individuales. Surgen especificaciones alternativas del modelo debido a que es posible hacer varias suposiciones acerca de la naturaleza probabilística del proceso de decisión. Iniciaremos con la especificación más elemental de un modelo de elección binaria: el modelo lineal de probabilidad.
11.1.1
Modelo lineal de probabilidad
Comenzaremos por examinar el modelo lineal de probabilidad. La forma de regresión del modelo es: Yi = α + βXi + εi
(11.1)
donde Xi = valor del atributo, por ejemplo, ingreso, para el iésimo individuo
Yi
=
l si se elige la primera opción (comprar un automóvil, votar sí) 0 si se elige la segunda opción (no comprar, votar no)
εi = variable aleatoria distribuida independientemente con media 0 2 El problema de la estimación del modelo y su relación con la teoría de la elección se describe en forma minuciosa en D. McFadden, "Conditional Logit Analysis of Qualitative Choice Behavior", en P. Zarembka (ed.), Frontiers in Econometrics (Nueva York: Academic Press, 1973), y T. Domencich y D. McFadden, Urban Travel Demand: A Behavioral Analysis (Amsterdam: North-Holland, 1975).
314
PARTE DOS: Mo odelos de regresió ón de una sola ecuación
Para interpretar la ecuacción (11.1) tom maremos el vaalor esperado de cada obseervación de la l variable deppendiente Yi: E(Y i ) = α + βXi
(111.2)
Dado que Yi sólo puede tomar dos vaalores, 1 y 0, ppodemos desccribir la distriibución de proobabilidad de Y suponiendoo que Pi = Proob (Y = 1) y 1 – Pi = Prob (Yi = 0). Enton nces,
En el ejemplo e la eccuación de reggresión descriibe la probabilidad de quee un individuo votará v sí, dadaa la informaciión acerca de su ingreso. Laa pendiente de la recta mide el efecto de un cambio unnitario en el iingreso en la probabilidadd de votar sí. El E modelo linneal de probaabilidad a meenudo se escrribe en la forrma siguiente, lo cual perm mite que la vaariable dependdiente sea intterpretada coomo una probabbilidad:
La disttribución de pprobabilidad del d término deel error en el modelo es deeterminada por la sustitucióón de los vallores de Yi (11 y 0) en la ecuación (11.1), exhibidos en e el cuadro 11.1. Podemoos ver la relacción entre la probabilidad p Pi y Xi suponienndo que el errror tiene meddia 0. Por connsiguiente:
Resolvienddo para Pi , enncontramos quue
CUADRO 11.1 DISTRIBUCIÓ ÓN DE PROBAB BILIDAD DE
εi
CAPÍÍTULO 11: Modelo os de elección cua alitativa
315
Ahhora puede caalcularse la vaarianza del téérmino del errror:
Essto demuestraa que el térmiino del error es heterocedáástico. Las ob bservaciones paara las que Pi está cerca de d 0 o cerca de 1 tendránn varianzas reelativamente baajas, mientrass que las obseervaciones coon Pi más cercca de 12 tendrán varianzas m mayores. La heterocedasticiidad deriva en e una pérdidda de eficienccia, pero los m mínimos cuadrrados permannecen consisteentes e insesggados. Una formaa obvia de corrregir la heterrocedasticidadd es estimar las l varianzas dee cada valor de d Yi y luego aplicar la estiimación de m mínimos cuadrrados ponderaados. Para haccer esto realizzamos mínim mos cuadradoss ordinarios en e el modelo orriginal y estim mamos cada uuna de las varrianzas del errror como sigu ue: (11.3) Laa dificultad co on los mínimoos cuadrados ponderados ees que no hay garantía de quue el valor prronosticado Ŷi se encontrrará en el inttervalo (0, 1). Si algunos vaalores de Ŷt se encuentrann afuera del rango r (0, 1), las observacciones deben eliminarse del modelo o debben estableceerse de manerra arbitraria iguales a números m como 0.0 01 y 0.99. En cualquier casso el procedim miento de míniimos cuadradoos ponderado os no será eficiente para muestras m finitas. Dado quee el procedimiento m de mínnimos cuadraados ponderad dos también es sensible a errores de : esspecificación, no aconsejam mos su uso. Supóngasee que deseamoos usar el moddelo lineal de probabilidad para predicción. Una desv ventaja seria del d modelo su urge cuando el e valor pronosticado cae fuuera del rango o (0, 1). Esta posibilidad p see describe en la figura 11.11. Incluso si
Figura 11.1 Predicción co on el modelo lineal de probabilidad.
316
PA ARTE DOS: Mode elos de regresión de d una sola ecuacción
el modelo linneal de probaabilidad es coorrecto, es posible que un valor muestraal dado de X se precipite fuerra del intervallo (-2, 2). El vvalor ajustadoo de Y asociaddo con esta obseervación en X será mayor que q 1 o menorr que 0. La co orrección obviia para este pro oblema es estaablecer prediccciones extrem mas iguales a 1 o 0, restrinngiendo, de este e modo, quue las probab bilidades pronnosticadas esstén dentro deel intervalo (0, 1). Sin embarrgo, esto no es e muy satisfaactorio, debidoo a que podríaamos predecirr una ocurrenncia con una probabilidad p de 1 cuando es posible quue pueda no ocuurrir, o podríam mos predecir una ocurrenciia con una proobabilidad de 0 cuando en veerdad podría ocurrir. Aunqque el proceddimiento de estimación bieen puede produccir estimacionnes insesgadaas, las prediccciones obteniddas del processo de estimación están sesgaadas en formaa clara. Un método alternativoo es reestimarr los parámetrros α y β sujettos a la restriccción de que 0 ≤ Ŷi ≤ 1. Daado que no haay garantía dee que las estim maciones seráán insesgadas,3 parece más aapropiado usaar la versión dde mínimos cuadrados orddinarios del moodelo lineal dde probabilidaad. Al final surge s un probllema serio deb bido a que pueeden extraersee observacionees en forma exccesiva de los atributos cuyos valores son extremos. Supóngase, S poor ejemplo, que varias observvaciones estánn fuera del inteervalo (-2, 2) mostrado en la figura 11.1. Esta E posibilidaad se describee en la figura 111.2. En este caso, c el modello de regresión verdadera asocia una probbabilidad de 1 con valoress de X mayorees que 2 y unna probabiliddad de 0 coon valores dde X menorees que -2. La L muestra conttiene varios vvalores de X mayores que 2 para los cuales c se eligiió la primera oppción y varioss valores de X menores quee -2 para los cuales c se eligiió la segunda oppción. La estiimación de la pendiente dee mínimos cuaadrados ordinaarios resultannte será sesgaada, dado quee subestimaráá la pendientee de regresiónn
Figura 11.2 2
Pendiente subestimada. s
3
Véase Do omencich y McFaadden, op. cit., cap pítulo 5.
CAPIT TULO 11: Modelos s de elección cualitativa
317
Figura 11.3
Pendiente sobrestimada.
veerdadera. Sin embargo, si llos datos de atributo a son aagrupados en forma algo diferente, la peendiente puedde ser sobrestiimada, como se muestra enn la figura 111.3.
EJEMPLO 11 1.1
Prredicción de incumplimiento de bonos
Unn medio útil para p predecir el incumplim miento de bonnos es analizaando los factorres que se coorrelacionan altamente a conn los incumpliimientos de bonos b verdadeeros.4 Si vemoos la decisión de incumplir y la decisión de d no incumpplir como dos oppciones para los gobiernos locales, se puuede estimar lla probabilidaad de incumplimiento usando el modeloo lineal de proobabilidad. E En una muestrra de 35 comuunidades de Massachusett M ts, varias de las l cuales en verdad incum mplieron, se utiilizó un estudiio de corte trannsversal con datos d de 1930.5 El objetivo era e encontrar unn conjunto dee característiccas de comunnidades que nos permitierran predecir mejor la probabbilidad de inccumplimiento. El modelo ees:
doonde P = 0 si la municipaliidad incumpllió y 1 en casoo contrario TAX = prom medio de tasass fiscales de 1929, 1 1930 y 1931 INT = porccentaje del presupuesto asiignado al paggo de interesees (1930) AV = porcentaje de creccimiento en ell valor de la prropiedad valuuada (192519300) DAV = razóón de la deuda total entre la l valuación eevaluada total (1930) WELF = porccentaje del preesupuesto de 1930 asignaddo a beneficenncia, pensiones y beneficios de los soldados 4 Ocurre un inncumplimiento enn bonos cuando hay h una demora en e el pago ya seaa del principal o de los intereses en un bono. Algunnos tenedores de bonos son comppensados por la pérdida parcial o total t de intereses y pagos, pero sóólo, después de trranscurrido algúnn tiempo. 5 Véase D.L. Rubinfeld, R "An Econometric E Anallysis of the Markket for General Obligation O Municip pal Bonds", diserrtación doctoral ssin publicar, M.I..T., junio de 19722.
318
PARTE DOS: Modelos de regresión de una sola ecuación
Los resultados de la regresión fueron los siguientes (los errores estándares están entre paréntesis): Pˆ = 1.96 - .029TAX - 4.86INT + .063AV + .007DAV - .48WELF (.29)
(.009)
(2.13)
(.028)
(.003)
(.88)
R 2 = .36 La R2 de 0.36 sugiere que una buena cantidad de varianza en el modelo aún no está explicada. No obstante, uno puede usar todavía los resultados del modelo para estudiar varios factores económicos que se correlacionan altamente con los incumplimientos. El coeficiente de la variable de la tasa fiscal es negativo y significativo, lo que implica que, ceteris paribus, un incremento en la tasa fiscal de un dólar por mil aumentará la probabilidad de incumplimiento por 0.029. El porcentaje del presupuesto asignado a los pagos de intereses también parece ser un buen pronosticador de incumplimientos, con la participación presupuestal de intereses mayores estando correlacionada positivamente con la probabilidad de incumplimiento. El porcentaje de presupuesto actual asignado a beneficencia guarda la misma relación con la probabilidad de incumplimiento que la participación presupuestal de intereses pero no es significativa. La tasa de crecimiento de valuación real evaluada es significativa y se relaciona inversamente con la probabilidad de incumplimiento. Una base fiscal creciente implica una probabilidad baja de incumplimiento, al menos a corto plazo. Por último, la razón de la deuda con la valuación estimada está relacionada inversamente con la probabilidad de incumplimiento. Este resultado contrario a lo intuitivo sugiere que la política, no sólo la economía/es un pronosticador importante de los incumplimientos de bonos.
11.1.2
Modelo probit
Dadas las dificultades asociadas con el modelo lineal de probabilidad, es natural transformar el modelo original de tal forma que las predicciones caigan en el intervalo (0, 1) para todas las X. El requerimiento de un proceso así es que traslada los valores del atributo X, los cuales pueden variar sobre toda la línea real, a una probabilidad que varía de 0 a 1. También nos gustaría que la transformación mantenga la propiedad de que los incrementos en X están asociados con los incrementos (o decrementos) en la variable dependiente para todos los valores de X. Estos requerimientos sugieren el uso de la función de probabilidad acumulativa, F.6 La distribución de probabilidad resultante podría representarse como: 6 Recuérdese que una función de probabilidad acumulativa se define como el valor que tiene la probabilidad de que un valor observado de una variable X (para cada X) será menor o igual a una X particular. El rango de la función de probabilidad acumulativa es el intervalo (0, 1), dado que todas las probabilidades se encuentran entre 0 y 1.
CA APÍTULO 11: Mode elos de elección cu ualitativa
Pi = F(α + βX β i) = F(Zi)
319 9
(11.4))
Bajo la su uposición de q que transform mamos el mod delo usando una u función dee probabilidad acumulativa p a u uniforme, obteenemos la verssión restringid da del modelo o lineal de probaabilidad Pi = α + βXi (véasse el ejercicio 11.3). Aunqu ue son posibless v varias alternattivas de funciones de probaabilidad acum mulativas, sólo o considerare-m dos: la no mos ormal y la logís ística. El modelo o de probabilid dad probit se asocia a con la función f de pro obabilidad normal m acumulattiva. Para enttender este modelo, m supón ngase que exiiste un índicee continuo c teóriico Zi, el cual está determin nado por una variable expllicativa X. Porr tanto, t podemo os escribir: Z i = α + βXi
(11.5))
Las L observaciiones en Zi no o están dispon nibles. En su u lugar, se tien nen datos quee sólo s distingueen si las obserrvaciones indiividuales están n en una cateegoría (valoress altos a de Zi) o en una segun nda categoría (valores bajo os de Zi). El análisis a probitt resuelve r el prroblema de có ómo obtener estimaciones e para los paráámetros α y β, mientras m que al mismo tiem mpo se obtien ne información n respecto al índice subya-cente c Z. Para enfo ocarnos en estte problema consideraremo c os un análisiss del compor-tamiento t del votante v en un na elección. Se S supone quee el individuo o vota sí o no o cuando c se enffrenta con la elección de uno u o dos can ndidatos para un cargo. En n este e caso, el ín ndice Zi repressentará la fuerzza del sentimiento del indiv viduo i hacia el primer p candid dato para el cargo. c Supón ngase que sab bemos que ell índice de laa fuerza f del sen ntimiento es u una función lineal del ingreeso X. Entoncces, el modelo o probit p proporcciona un med dio adecuado para estimarr los parámetrros de la pen-diente d y el inttercepto de laa relación entrre el índice y el ingreso. Supongam mos que Y rep presenta una variable indiccadora, la cuaal es igual a 1 c cuando es selleccionado ell primer cand didato y 0 cu uando se elig ge al segundo o c candidato. Luego supongam mos que, para cada votante individual, Zi* representa el v valor de corte crítico que traaduce el índice subyacente een una decisió ón de voto. Dee m manera especíífica,
El modello probit asum me que Zi* ess una variablle aleatoria distribuida d en n forma f normal, de modo qu ue la probabiliidad de que Zi* sea menor que q (o igual a)) Zi puede calcu ularse a partir de la función de probabilid dad normal acu umulativa. Laa función f normal acumulativ va estandarizaada se escribee:
(11.7))
320
PARTE DOS: Modelos de regresión de una sola ecuación
donde s es una variable aleatoria que está distribuida en forma normal con media cero y varianza unitaria. Por construcción, la variable Pi se encontrará en el intervalo (0, 1). Pi representa la probabilidad de que ocurra un evento, en este caso la probabilidad de que el individuo vote por el primer candidato. Dado que esta probabilidad se mide por el área bajo la curva normal estándar desde –∞ hasta Zi, entre más grande sea el valor del índice Zi será más probable que el evento ocurra. El cuadro 11.2 describe la relación en la ecuación (11.7) para valores particulares de Z. La función normal acumulativa se muestra en forma gráfica en la figura 11.4, en la cual se comparan los modelos probit y lineal de probabilidad. Para obtener una estimación del índice Zi aplicamos el inverso de la función normal acumulativa a la ecuación (11.7): (11.8) Podemos interpretar la probabilidad Pi resultante del modelo probit como una estimación de la probabilidad condicional de que un individuo votará sí (o un individuo asistirá a la universidad), dado que el ingreso del individuo es Xi. Esto es equivalente a la probabilidad de que una variable normal estándar será menor o igual a α + βXi. La pendiente de la función probit como se muestra en la figura 11.4 es mayor que la pendiente de la función lineal de probabilidad en el rango medio pero menor en los extremos del intervalo (-2, 2). Fuera del intervalo (-2, 2) el modelo lineal de probabilidad tiene una pendiente de 0. La gráfica sugiere algunas de las dificultades asociadas con un modelo lineal de probabilidad mal especificado. En dado caso que la especificación probit sea correcta, la estimación del modelo lineal de probabilidad conducirá a la inferencia falsa de que la pendiente es constante cuando de hecho el cambio en la probabilidad asociado con un cambio en X depende del valor de X seleccionado. Aunque el modelo probit es más atractivo que el modelo lineal de probabilidad, por lo general, implica estimación de máxima verosimilitud no lineal.
CUADRO 11.2
Z
F(Z)
Z
-3.0 -2.5 -2.0 -1.5 -1.0 - .5 .0
.001 .006 .023 .067 .159 .309 .500
1.0 1.5 2.0 2.5 3.0 3.5
.5
F(Z) .691 .841 .933 .977 .994 .999 ,999
CA APÍTULO 11: Mod delos de elección cualitativa c
321 1
Figura 11.4 Pendiente Prrobit.
Además, la ju A ustificación teeórica para em mplear ejempplo probit es un u poco limi-tada. Despuéss de revisar las limitacionnes en un ejem mplo, consideeraremos unaa e especificación n de modelo unn poco más attractiva, el moodelo logit.
EJEMPLO 11.2
C Comportamien nto de la votación
En un estudioo de la votaciión en la eleccción presideencial de 19772 en Estadoss E U Unidos, se usó ó un modelo probit p para exxplicar la probbabilidad de que q un ciuda-7 d dano votara por p George McGovern. M Loos autores dee este estudio suponen quee h un índice Zi subyacentte, la "propennsión" a votarr por McGoveern, la cual ess hay u función lin una neal de las poosturas políticas que los vottantes apoyan n. El problemaa e transformarr la relación lineal entre el es e índice Zi y la informacción sobre lass p posturas polítiicas para obteener probabilidades pronosticadas de la votación paraa M McGovern. Se obtuvieron resultados probit p por meedio de una serie s de datoss e extraídos de laa encuesta de 1972 del Cenntro para Estuddios Políticos de la Univer-s sidad de Mich higan. Los reesultados de la estimaciónn probit y dee la regresiónn c comparable d modelo linneal de probaabilidad se muuestran en ell cuadro 11.3. del C Cada una de laas variables exxplicativas ess una represenntación a escalla de la propiaa o opinión del individuo respeecto a lo que sentía s sobre una u cuestión particular. Los coeficcientes de reggresión nos in ndican la relaación lineal entre e el índicee e estimado Zi y las variables de la postu ura. (La razónn del coeficieente estimadoo e entre el error estándar estiimado se aprroximará a laa distribuciónn normal paraa m muestras granndes, así que pueden p aplicaarse las pruebaas normal o t usuales.) Loss r resultados sug gieren que la opinión de uh u votante sobbre temas, talles como em-p pleos federales, impuestos y Vietnam, así como la deesignación liberal o conser-v vadora autoiddentificada, sirve s mejor para p explicar por qué el votante v puedee h haber elegido votar por MccGovern o no. Estos resuultados no sonn muy diferenntes de los reesultados del modelo m lineall de d probabilidaad, excepto poor la importanncia de la cuestión del transsporte públi7 J. Aldrich y C.F. Cnudde, "Probing the Bo unds of Conventtional Wisdom: A Comparison o f Regression, Probiit, and Discriminnant Analysis", American Journal of Political Scieence, vol. 19, ppp. R 5 571-608, 3 de agoosto de 1975.
322
PA ARTE DOS: Modelos de regresión de e una sola ecuació ón
CUADRO 11.3 C C COMPARACIÓN DE PREDICCIO ONES DE MODE ELO LINEAL DE PROBABILIDAD DY P PROBIT: PROBA ABILIDAD DE VO OTAR POR MCG GOVERN, 1972
Escala de siete e puntos
Modelo
M Modelo lineal
probit Zi
de e probabilidad
Coeficiente
SE
Coefficiente
SE E
Empleos federalles Impuestos Vietnam Mariguana Transporte públiico Derechos de lass mujeres Derechos de loss acusados Ayuda a las min norías Liberal o conserrvador Constante
-.37 5 -.25 7 -.59 3 -.075 - .205 -.038 -.04 6 -.13 6 -.639 - .713
.082 .066 .092 .058 .083 .046 .068 .072 .113
- .087 - .050 - .145 - .019 - .067 - .010 - .011 - .030 - .168 .303
.018 8 .01 14 .020 0 .014 4 .019 9 .011 1 .015 5 .017 7 .025 5
N = 1 130
R = .530
2
2
R =
.347
co. c Sin embarrgo, el modeloo produce resultados difereentes cuando interpretamoss las l implicacioones numéricaas de los coefficientes estim mados. Cuandoo observamoss coeficientes c inndividuales, lo que importaa es su magniitud relativa, no su tamañoo absoluto. a Por ejemplo, cuaando se estim mó el modelo lineal de proobabilidad, ell coeficiente c libberal-conservvador fue 3.4 veces el tamaaño del coefiiciente de im-puestos, p mienntras que la razzón sólo fue de d 2.5 cuandoo se usó estimación probit.
1 11.1.3
M Modelo log git
El modelo loggit se basa en la E l función- de probabilidad logística acum mulativa y se e especifica com mo:
En esta notaciión, e represennta la base dee logaritmos nnaturales, la cual es aproxi-E m madamente iggual a 2.718. Pi es la probbabilidad de qque un indiviiduo hará unaa d determinada e elección, dadoo Xi. Para teneer una impressión de la funnción logísticaa a acumulativa, examínese ell cuadro 11.4.. El cuadro m muestra que laas formulacio-n logit y proobit son bastaante parecidass; la única differencia es quue la logísticaa nes t tiene colas un n poco más grruesas.8 Debiddo a que es sim milar a la fun nción normal 8 E.A. Hanush hek y J.E. Jacksoon, Statistical Metthods for Social Scientists S (Nueva York: Academic, 11977), p. 189, seññala que la distribbución logística se parece en form ma estrecha a la distribución d t conn 7 grados de liberttad.
CAP PÍTULO 11: Modelos de elección cua alitativa
323
CUADRO 11.4
accumulativa peero más fácil dde usar desde el e punto de vista del cálculoo, el modelo lo ogit se usa a menudo m comoo un sustitutoo del probit. Para mostrrar cómo puedde estimarse el modelo esppecificado enn la ecuación (111.9), primeroo multiplicamoos ambos ladoos de la ecuacción por 1 + e - zi para obteener: z
(1 + e – i ) P i =1 Dividiendo D enttre Pi y luegoo restándole 1 nos conducee a
Siin embargo, por p definición, e - zi = l/ e zii, de modo quue,
A Ahora, tomanddo el logaritm mo natural de ambos a lados,
o [a partir de la ecuación (111.9)] (11.10)
324
PA ARTE DOS: Mode elos de regresión de d una sola ecuación
La variabble dependiennte en esta ecuuación de regrresión es el lo ogaritmo de laas posibilidadess de que se haará una eleccióón particular. Una ventaja importante deel modelo logitt es que transforma el probblema de preddecir probabiilidades dentrro de un intervaalo (0,1) en unn problema dee predecir las posibilidadess de que ocurrra un evento deentro del ranngo de la líneea real. La peendiente de la l distribucióón logística acum mulativa es mayor m en P = 21. Esto impllica que los cambios c en laas variables inddependientes tendrán t su mayor m efecto een la probabillidad de elegiir una opción determinada d een el punto medio m de la distribución. Las L pendientees bajas cercanaas a los puntoss extremos im mplican que soon necesarios cambios granndes en X paraa producir unn cambio pequueño en la proobabilidad. Si Pi ressulta ser iguall ya sea a 0 o a 1, las posibilidades, Pii/(l - Pi), seráán iguales a 0 o al infinito y el logaritmo de las posibilidades será indefinido. i Poor tanto, se observa claramente que la applicación de estimación de mínimos cuaadrados ordinarios a la ecuuación (11.10) es inapropiaada. La estim mación correctta del modelo loogit puede enntenderse mejoor si se distingguen los estuddios en los quue las observacciones individduales son laas unidades básicas b de análisis y en loos que el análisis implica el uso de datos agrupados. Considérrese primero el e caso en el quue conocemoss la frecuenciaa de ocurrenciia de un eventto en un subbgrupo deterrminado de lla población pero no haay conocimientoo acerca del coomportamientto de cada inddividuo en esee subgrupo. De D mañera especcífica, supónggase que una sola variable explicativa coomo el ingresso es representaada por G vallores diferentees en la muesstra (por ejem mplo, 5 mil, 110 mil dólares), con n1 indiviiduos con un ingreso X1, n2 individuos con c un ingresso X2 y así en foorma sucesivaa.9 Además, establezca e quee r1 representaa el número de d veces que se elige la primeera alternativaa por individuuos con ingresso X1 (votar síí), r2 representa el número dee veces que laa primera alteernativa es eleegida por inddividuos con inngreso X2, etcc. Entonces, parece p lógico utilizar u un moodelo logit quue estime la probbabilidad de ccada elección para cada grrupo de indiviiduos idénticoos. De manera esspecífica, aprroximamos Pi como:
Entonces po odemos estim mar el modelo de probabiilidad logit de d la ecuaciónn (11.10) por:
La ecuacción (11. 11) ees lineal en loss parámetros y puede estim marse por mediio de mínimos cuadrados orddinarios. Paraa muestras peequeñas los paarámetros pueeden estar sessgados, pero cconforme se incrementa i ell número de observaciones o s 9
Para detallles, véase D.R. Coox, Analysis of Biinary Data (Londdres: Methuen, 1970).
CAPITULO 11: Modelos de elección cualittativa
325
asocciado con cad da uno de los niveles de X, los resultadoss mejoran. Dee hecho, los paráámetros estim mados son coonsistentes cuuando cada grrupo se hace grande en form ma arbitraria.. Este procediimiento de aggrupamiento taambién puedee usarse con observacioo nes individualess; dividimos la l variable inndependiente (o variables)) en forma arbiitraria en gruppos y calculaamos frecuenccias dentro dee cada grupo.. Por ejemplo,, supóngase que q estamos annalizando el comportamiennto de voto conn base en el ingrreso (bajo, allto) y el tamaaño de la fam milia (pequeñña, grande).10 Para cada disttrito electorall obtenemos datos d sobre ell número de vvotantes regisstrados que votaron por un candidato deeterminado asociado con cada una de las cuatro com mbinaciones posibles p de caaracterísticas del d votante (ffamilia pequeñña, ingreso bajoo; familia peqqueña, ingreso alto, etc.). Los L datos poddrían ser de la l siguiente form ma: Pˆ1 = fracción n de votantes de ingreso baajo y familia pequeña p que votaron v por el candid dato Pˆ2 = fracción n de votantes dde ingreso bajo y familia grrande que votaaron por el candidatto Pˆ3 = fracciónn de votantes de ingreso altto y familia peequeña que votaron por el candid dato Pˆ4 = fracciónn de votantes dde ingreso altto y familia grrande que vottaron por el candidatto Dad do que hay cuatro c gruposs, la regresiónn de mínimoss cuadrados tendrá t seis obsservaciones. Las L observaciones de la varriable dependdiente serán:
Lass variables inddependientes serán s una seriie de variabless indicadoras definiendo la categoría c a la que pertenecce cada observvación. Por taanto, si suponnemos que, X2 =
X3 =
1 para p votantes de d ingreso altto 0 en cualquier ottro caso 1 ppara votantes con familia ggrande 0 en e cualquier otro o caso
10 Esto es equivaalente al análisis logit l de tablas de contingencia y se describe en H. Theil, T "On the Estim mation of Relationnships Involving Qualitative Q Variables"', American Joournal of Sociologgy, vol. 76, pp. 103--154, julio de 19770, y L. Goodmaan, "The Multivarriate Analysis off Qualitative Dataa: Interactions amon ng Múltiple Classsífications", Journnal of the America an Statistical Assoociation, vol. 65, núm. 329, pp. 226--256, 1970.
326
PARTE DOS: Mod delos de regresión n de una sola ecua ación
el modelo loogit será estim mado como: (11.112) Suponiendo por el m momento que cada Pi midee con precisió ón la frecuencia del grupo en e la poblacióón, la interpreetación del moodelo logit ess sencilla: Zˆ 1 ≈ Z1 = β1 = posibilidaades pronosticcadas de votacción favorablee para votantees de ingreso bbajo y familiaa pequeña Zˆ 2 ≈ Z2 = β1 + β3 = posibiilidades prono osticadas de vootación favoraable para votanntes de inngreso bajo y familia grannde Zˆ 3 ≈ Z3 = β1 + β2 = posibilidades pronoosticadas de vootación favoraable para votanntes de inngreso alto y familia pequueña Zˆ 4 ≈ Z 4 = β1 + β2 + β3 = pposibilidades pronosticadas p de votación faavorable para votantes de ingreso i alto y familia gran nde Por tanto, si s deseamos examinar e el im mpacto que tiiene en la votación el poseer una familiaa grande en luggar de una pequeña, indepeendientementte del ingresoo, el efecto es meedido por el cooeficiente β3. Del D mismo moodo, β2 mide laa diferencia enn el logaritmo de d las posibilidades de la vootación entre familias pequ ueñas de ingreeso alto y bajo. Debidoo a que Pˆi no es e igual a Pi, hay h algunos prroblemas con la estimaciónn de mínimos cuuadrados ordinnarios en este caso de datoss agrupados. Si S asumimos que q cada una dee las observaciiones individuuales en un grrupo es indepeendiente (y siggue una distribu ución de probbabilidad binomial), la vaariable dependdiente estimaada, log [ri/(ni – ri)], estaará (para muestras m granndes) distribuuida en forrma aproximadaamente norm mal con mediaa 0 y varianzaa (11.133) Como resulltado, el térm mino del error en la especifficación lineaal de la ecuaciión (11.12) es heterocedástiico. La variannza en cada uno de los su ubgrupos estará relacionadoo inversamentte con el núm mero de obserrvaciones en cada celda ni y también varriará con el núúmero de voto os favorables ri. La correcciión obvia paraa la heterocedassticidad es uusar mínimos cuadrados pponderados, donde d cada obo servación es e multiplicadda por el pesso 1/√Vi. Sinn embargo, see han propuesto otras correccciones, de manera m principal para ayuudar con las propiedades de muestra peq queña del prooceso de estim mación.11 11 Un ajusste sugerido por C Cox, op. cit., y porr Domencich y McFadden, op. cit., es usar la siguiennte ecuación:
CAPÍT TULO 11: Modelos s de elección cualiitativa
327
Si se desea medir el ajustte asociado co on el modelo dde regresión agrupado, a se pueede usar la estadística R2 calculada. No N obstante, uuna estadística preferible obsserva las difeerencias entree las frecuencias reales en cada subgruppo y las frecueencias estimaddas. De manera específica, supongamos que Pi* es la probabilidad p esttimada calcullada para caada observación a partir de la ecuacción (11.9). Enntonces la estad dística12
esttá distribuida (para muestrras grandes) de d acuerdo coon la distribución ji cuadraada donde el número de grrados de liberrtad es el núm mero de subcategorías G meenos el númerro de parámeetros estimadoos. Entre mennor es el valoor de s, será meejor el ajuste del d modelo. La aproxim mación que connduce a la esppecificación dde la ecuaciónn (11.12) es razzonable sólo cuando c ocurreen suficientess repeticioness. De hecho, cuando c sólo unaa elección esttá asociada coon cada conjuunto de variabbles explicatiivas, el lado izqquierdo de la ecuación (11.12) es indefiinido, de moddo que la apro oximación a la ecuación e (11..10) no es de utilidad. Unaa regla empíriica útil para laa aplicación de la aproximaciión de mínimos cuadrados es que para caada valor de X, X ni debería serr al menos iguual a 5, pero una u regla máss precisa expllicaría el hechho de que la aprroximación de mínimos cuuadrados es más m deficientee para niveles de X en los quee la frecuenciia de una eleccción determinnada está cercca de 0 o de 1. Esto puede verrse en la ecuuación (11.13)). Cuando ri /n / i se aproxim ma ya sea a 0 o a 1, la exppresión para Vi se hace aarbitrariamen nte grande. D Debemos seññalar que la aprroximación im mplícita en laa ecuación (111.12) no es estrictamentee apropiada cuaando la variab ble explicativva es continuaa, dado que laa variable conntinua debe divvidirse, este proceso p introdduce error de medición en el problema. Con variablles continuas en modelos con varios aatributos sirviiendo como varriables expliccativas, puedee ser necesariio estimar unn modelo logiit en el que sóllo una opciónn está asociadda con cada conjunto c de vvariables indeependientes. Afo fortunadamentte, hay un proocedimiento de d estimaciónn de máxima verosimilitud d que puede aplicarse a al modelo m en la ecuación e (11.12). (Véase el apéndice 11..1 para hacer un breve bossquejo del proocedimiento y las pruebas estadísticas asoociadas con él.) é Debido a que es posibble demostrarr que siemprre existe un mááximo único para p el modello logit, la esttimación de m máxima verossimilitud es en particular atraactiva. De heccho, la estimacción de máxim ma verosimilittud produce estimadores de parámetro coonsistentes, y el cálculo dee la estadísticaa apropiada parra muestra graande no es diffícil. Por tantoo, la única dessventaja de laa estimación log git no lineal es e su costo. L Los estudios de d muestra pequeña sugieeren que los siggnos (y con frrecuencia las magnitudes relativas) r de los parámetross estimados obttenidos de modelos m lineaales de probaabilidad y loos estimadorees logit de mááxima verosim militud, por llo general, so on iguales. E Esto respaldaa el uso del mo odelo lineal de probabilidaad, al menos como c una técnnica explicatiiva. 12
Véase Theil, op. o cit., y McFaddden, op. cit., para detalles. d
328
P PARTE DOS: Mod delos de regresión de una sola ecuacción
EJEMPLO O 11.3
Votación para a un presupue sto escolar
En una escuuela en Troy, Michigan, M en 1973 se usó el modelo log git para estudiiar las decisionees de votaciónn de 425 indiv viduos en un rreferéndum fiiscal local.13 Las L respuestas a la encuestaa proporcionaan una lista dde atributos de d los votantees, estimaciones de ingreso familiar y el precio de la eeducación, medidos m como el costo para ell individuo dee apoyar con un u dólar adicioonal por alumn no de la escueela gastado en la l comunidadd. El modelo adopta la form ma
donde las Z representan los atributos de la votacióón enumerados en el cuaddro 11.5 y Probb (sí) represennta la probabilidad de que un votante appoye el referééndum fiscal. La ecuaciónn estimada aparece a a continuación, con c los errorres estándares asintóticos a (m muestra grandee) entre parénntesis (* = sig gnificativo en el nivel del 5% %). Dado que las observaciones son de inndividuos y no n están agruppadas, nótese que el modello logit se esttimó usando un u procedimiento de estim mación de máxxima verosimilitud. -23.15* + .24 SEX + 1.13 MAR + 1.09 OTHE R + .08 A35-49 (3.84)
(.24)
(1.13)
(1.47)
(.30)
+ .61 A50-64 A + 1.0 04 A65 + 1.4 44* PUB1 + 1 1.39* PUB2 + 1.30* PUB3 3 (.41)
(.799)
(.34 4)
((.35)
(.42)
+ 2.00** PUB4 + 2.116* PUB5 - .556 PRIV - .022* YEARS (.58)
(.799)
(.42)
((.01)
+ 3.07* * SCHOOL + 2.14* (log IN NC) - 1.21* (log PRICE) (.84)
(.37)
(.44)
La variaable indicadora de género se incluyó paara permitir laa posibilidad de que debido a que las muujeres tiendeen a tener unaa participacióón mayor en la responsabiliidad del cuidaado de los hijjos, podrían valorar v los ben neficios asociiados con el sistema s educattivo más alto que los hombbres. El coeficciente fue insiignificante aqquí, pero fue ssignificativo, como se espeeraba, en una elección postterior. Cuando los niños esttán en edad esscolar, hay m mayor probabillidad de que las l familias estéén conscientes de los costoos y beneficios asociados con un voto paara impuestos escolares más altos. Se espeeraba la presenncia de al men nos un hijo enn la escuela públlica y tuvo unn impacto posiitivo significaativo en la proobabilidad de un u voto favorab ble. La presenncia de hijos en edad escoolar adicionalees no incre-
11 D.L. Ruubinfeld, "Voting inn a Local School Election: E A Micro Analysis", Review w of Economía andd Statisücs, vol. 59, 5 núm. 1, pp. 300-42, febrero de 1977. 1
CAPÍTULO 11: Modelos de elección cualitativa
329
CUADRO 11.5 DEFINICIÓN DE VARIABLES
1 SEX MAR OTRO A35-49 A50-64 A65 PUB1 PUB2 PUB3 PUB4 PUB5 PRIV SCHOOL
Si es mujer Si está casado con cónyuge presente Si está separado, divorciado o es viudo Si su edad está entre 35 y 49 años Si su edad está entre 50 y 64 años Si su edad es de 65 años o mayor Si tiene 1 hijo en escuela pública Si tiene 2 hijos en escuela pública Si tiene 3 hijos en escuela pública Si tiene 4 hijos en escuela pública Si tiene 5 o más hijos en escuela pública Si la familia tiene 1o más hijos en escuela privada Si el individuo está empleado como maestro (público o privado)
0 Si es hombre En cualquier otro caso En cualquier otro caso En cualquier otro caso En cualquier otro caso En cualquier otro casó En cualquier otro caso En cualquier otro caso En cualquier otro caso En cualquier otro caso En cualquier otro caso En cualquier otro caso En cualquier otro caso
YEARS = número de años viviendo en la comunidad de Troy Log INC = logaritmo natural del ingreso familiar anual, en dólares Log PRICE = logaritmo natural del precio de la educación pública, en dólares
mentó la probabilidad de un voto con sí hasta que, como se esperaba, más allá del quinto hijo, la ganancia marginal de reasignar el presupuesto familiar hacia gastos privados sobrepasó la ganancia de los gastos públicos y la probabilidad de un voto favorable declinó. Sin embargo, la presencia de un hijo en una escuela privada tuvo un efecto negativo fuerte. Es probable que las familias que envían a sus hijos a escuelas privadas perciban poco beneficio del sistema de educación pública mientras enfrentan una carga fiscal considerable asociada con él. El número de años de residencia también se incluyó como una variable explicativa en el modelo logit. Los resultados sugieren que conforme se incrementa el tiempo de residencia, los votantes tienden a votar que no, ya sea como crítica al sistema educativo o posiblemente en oposición a la carga creciente de impuestos locales. La variable indicadora escolar altamente significativa se incluyó para explicar el hecho de que la muestra de los que respondieron estaba representada en exceso por maestros de escuela y sus cónyuges. Como se esperaba, es más probable que los maestros voten que sí en la elección en relación con individuos con atributos similares. Con la suposición de que la educación de escuelas locales es un bien normal, esperábamos, quedando iguales otros aspectos, que el ingreso y la demanda de escuelas públicas estarían correlacionados en forma positiva. En las ecuaciones estimadas la variable de ingreso fue positiva y significativa, consistente con una elasticidad de ingreso positiva de la demanda de educación. Conforme se elevó el precio de la educación, siendo iguales otras cosas, esperábamos que la cantidad de gastos educativos por alumno demandada dis-
330
P PARTE DOS: Mod delos de regresión n de una sola ecua ación
minuiría, all igual que laa probabilidad d de votar sí en la elecció ón. A pesar del d hecho de qu ue los pagos d de impuestos prediales esttán correlacio onados en form ma positiva con n el ingreso, eencontramos que q el coeficiente de la varriable del preccio de la educaación fue neg gativo y signiificativo, de acuerdo con una elasticid dad negativa en el precio de la demanda de d educación.
EJEMPL LO 11.4
Predicción del d comportam iento de asiste encia a la unive ersidad
En un estudiio de elección n de universidaad14 se constru uyó un modelo o para predecirr si los estudian ntes que asistíaan a la univerrsidad elegiríaan vivir en el campus c o viajjar, esta elecció ón está condiicionada por la informaciión respecto a los atributtos individualess y de la univeersidad particu ular. El modeelo es
donde Pi = probabilidad p de que el estu udiante elegirrá vivir en el campus c Y = logaritmo l (baase 10) del ing greso familiarr X = distancia d del hogar al cam mpus I1 = (100 ( - X)(5 - Y)/500 I2 =X X(5-Y)/500 I3 = (100 - X)Y//500 I4 = X Y / 5 0 0 D = porcentaje dee estudiantes en e la universid dad que viven n en el campu us S = 1 si es mujer y 0 de lo con ntrario R = 1 si el estudiiante dijo qu ue prefería viv vir en el cam mpus y 0 de l o contrario El modelo logit l se estim mó usando la rutina r de estim mación de mááxima verosim militud y una muestra de 1 10 600 estudiaantes que en realidad asisttían a la universidad. Los resultados r de la estimación n (con los errrores estándarres entre parééntesis) son:15
14 M.G. Kohn, K C.F. Mansski y D.S. Munddel, "An Empiriical Investigation n of Factors Whhich Influence Colleg ge Going Behavioor", Rand Corporaation Report R14770-NSF, Santa Mó ónica, CA, septiem mbre de 1974. 15 Omitim mos el "sombreroo" sobre el valor pronosticado p paraa simplificar la presentación p y conntinuaremos haciiéndolo así a lo laargo del resto dell libro.
CAPÍT TULO 11: Modeloss de elección cualitativa
331
Figura 11.5
Probabilidad de d vivir en el campus (para hombres, que asisten a a una universidad con capacidad d de dormitorios de el 50%, que prefieren vivir en el campus).
Laas variables de d la interacciión entre disttancia e ingreeso son algo difíciles de intterpretar por sí s solas. Sin embargo, la figgura 11.5 muuestra que la probabilidad p de vivir en el caampus se incrrementa con la l distancia deel campus y es e mayor en tod das las distanccias para estuudiantes con in ngresos familliares superiores. La probabbilidad de ressidencia en ell campus se incrementa i coon el porcentaje de estudiaantes que viv ven en el cam mpus sin limittaciones monnetarias. Por último, ú hay una probabilidaad ligeramentee mayor, pero o insignificantte, de vivir enn el campus parra los hombrees que para laas mujeres. Para interprretar el efectoo de un cambiio en D sobree la probabilid dad de residenncia en el cam mpus, necesitaamos resolver el cambio enn la probabilid dad ∆P de la sig guiente manerra:
Parra simplificarr, utilizamos eel hecho de quue para cualquuier variable continua c x, ∆ log l x = ∆x/x y el hecho de qque log (x/y) = log x - log yy. Entonces,
Daado que hemoos elegido ∆D = 1, resulta que q
Si Pi fuera igual i a 0.5, por ejemplo, ∆P ∆ i sería iguall a 0.076. Qu uizá el único vallor más útil dee Pi para elegiir esta interpreetación es la media, m pero unn examen de lass respuestas en e la elecciónn del campuss para numeroosos puntos de d la distribución de probaabilidad puedde ser esclareccedor.
332
PARTE DOS: Modelos de regresión de una sola ecuación
El modelo de elección del campus puede usarse con facilidad para hacer predicciones. Supóngase, por ejemplo, que deseamos predecir la probabilidad de que un estudiante varón cuyo ingreso familiar es de 6 mil dólares y quien ha manifestado su preferencia para vivir en el campus en lugar de en su hogar, en efecto vivirá en el campus. Supondremos que el estudiante asiste a una universidad cercana a su hogar en la que el 50% de los estudiantes viven en el campus. Para predecir las posibilidades de vivir en el campus, evaluamos el lado derecho de la ecuación estimada cuando I1 = .2(5 - log10 6 000) = .2444 I3 = .2(log10 6 000) = .7556
D = 50 S=0
I2 = I 4 = 0
R= 1
El logaritmo (base e) de las posibilidades es -2.10. Tomando los antilogaritmos y resolviendo, encontramos que Pi = 0.108. Por tanto, predecimos que el estudiante vivirá en el campus con una probabilidad de 0.108. Para observar cómo la probabilidad de que el estudiante viva en el campus cambia conforme se incrementa la distancia entre la universidad y el hogar, calculamos Pi para diferentes valores de distancia X: Distancia Probabilidad de vivir en el campus
0
10
20
30
40
50
60
70
.108
.258
.500
.742
.892
.960
.986
.995
Nótese que una vez que el hogar del estudiante se encuentra a más de 50 millas del campus, es casi seguro que elegirá vivir en el campus.
11.1.4
Pronóstico: bondad de ajuste
Como una regla general, los modelos desarrollados en este capítulo pueden aplicarse en forma directa para el pronóstico de la probabilidad (o las posibilidades) de que se hará una elección determinada. Por ejemplo, en el caso de la votación asumimos que la probabilidad pronosticada asociada con una observación nueva es 0.8. Se puede interpretar 0.8 como la medición de nuestro mejor pronóstico de la probabilidad de que un individuo con un ingreso determinado votará que sí en una elección.16 Por supuesto, si estamos pronosticando el comSupóngase que nuestro objetivo es minimizar la varianza del error de pronóstico. Sea Pˆ el valor de pronóstico de la probabilidad de que se hará una elección determinada. Entonces, el error de pronóstico será 1 – Pˆ si ocurre el evento y 0 - Pˆ , en cualquier otro caso. La varianza del error de 2 2 pronóstico es σE = P( l - Pˆ )2 +(1 - P)(- Pˆ )2. Minimizando σE con respecto a Pˆ produce Pˆ = P. 16
CAP PÍTULO 11: Mode elos de elección cu ualitativa
333 3
poortamiento exxplícito de un solo individuuo, un pronósttico de 0.8 nunnca puede serr coorrecto ex posst. Si deseamoos pronosticar elecciones inddividuales, es probable quee prredigamos unn resultado de 1 (votar sí) si s la probabiliddad pronosticcada es mayorr quue 0.5 y un reesultado de 0 si la probabiilidad pronostticada es men nor que 0.5. Esto sugieere un problem ma con el uso de R2 como uuna medida dee ajuste. En ell modelo m de reg gresión clásicoo R2 puede vaariar en valorr entre 0 y 1, con un valorr ceercano a 1 que q indica unn buen ajuste. Sin embarggo, no es proobable que ell modelo m de varriable dependiiente binario produzca unaa R2 cercana a 1.17 Si esta-bleciéramos, por p ejemplo, qque las probaabilidades verrdaderas de que q ocurra unn evvento estabann distribuidass de manera uniforme u a loo largo de un intervalo de-teerminado, seríía posible mosstrar un límitee superior paraa R2 de 1/3. Po or tanto, no ess so orprendente que q al estimar un modelo liineal de probaabilidad es pro obable que see ob btenga18 una R2 baja. Una altern nativa adecuadda para R2 com mo una medidda de bondad de d ajuste es ell ínndice de razónn de verosimilittud. En el anállisis de la secciión 10.2 el índdice se basa enn foorma directa en la estimacción de máxiima verosimillitud. Supónggase que L(0) reepresenta el valor v de la funnción log-veroosimilitud cuaando todos loos parámetros so on iguales a 0 y supóngase que L(β*) representa ell valor cuanddo la funciónn lo og-verosimilittud ha sido maximizadaa. Entonces, el índice de d razón dee verosimilitud ρ se define coomo:
Por construcción, si el proceeso de maxim P mización sugieere que no haay ganancia all cambiar cualqquiera de los parámetros estimados e desde cero, enttonces ρ seráá iggual a 0 también. Sin embaargo, si somoss afortunados de estimar un na función dee v verosimilitud que predice cada elecciónn en la muesstra en formaa correcta, laa fu unción de verrosimilitud esstimada sería 1 y el índice log-verosimiilitud sería 0. C L(β*) = 0,, resulta que ρ = 1. Con De este modo, m el rangoo del índice lo og-verosimilittud varía de 0 a 1, de iguall fo orma que R2. También com mo R2, es impprobable estaar cerca de 1 cuando estánn im mplicadas eleecciones binarrias; del mism mo modo, cuallquier valor numérico n par-tiicular de ρ ess difícil de innterpretar. Noo obstante, ell valor de ρ nos n da algúnn inndicio de cuáánto puede gaanarse con la adición de vvariables nuevvas a un mode 19 delo.
17 Este probllema se expone een D.G. Morrison n, "Upper Boundss for Correlationss between Binaryy Outcomes and Prob O babilistic Predictioons", Journal of th he American Statiistical Association n, vol. 67, 1972. 18 Hay medid das alternativas de bondad de ajuuste para dichos modelos. Una medida m útil es laa en ntropía condicional promedio descrita por H. Theil en Economics annd Informational Theory T (Chicago: R Rand McNally, 19967; Amsterdam: North-Holland, 1967). 19 Para comeentarios adicionaales sobre la mediición de la bondaad de ajuste, véas e Kenneth Train, Q Qualitative Choice Analysis (Cambriidge, Mass.: M.I.T T. Press, 1986), o G.S. Maddala, Limited-Dependentt annd Qualitative Va ariables in Econom metrics (Cambridg ge, UK: Cambridgge University Presss, 1983).
334
11,2
PA ARTE DOS: Modellos de regresión de e una sola ecuació ón
MODELOS S DE ELECC CIÓN MÚLTIPLE Ahora considderaremos la ggeneralización A n de los resultaados de la seccción anterior a casos en los que los indivviduos hacen elecciones enntre tres o máás alternativaas m mutuamente excluyentes. Hay varias formas fo en las que se puedee analizar estte p problema; no os enfocaremoos aquí en el caso en el quue las alternaativas no estánn categorizadass.
11.2.1
Modelo line eal de prob babilidad
Primero, consideraremos lla extensión del d modelo linneal de probabbilidad al casoo de eleccioness múltiples. Si S hay tres opcciones j = 1, 22, 3, escribim mos
Pji es la probaabilidad de quue el individuo o i elegirá la jjésima opciónn, mientras quue Xi es el valorr de X para ell iésimo indiv viduo. Para estimar e cada una u de las trees ecuaciones e en n el modelo por mínimoss cuadrados oordinarios, noo es necesario ejecutar e las trres regresionees lineales de probabilidad. Dado que laas probabilidaades d estimadas están restringidas para sumar s 1, los interceptos estimados e parra sumar s 1 y loos parámetros de pendiennte para sumaar 0. Para deemostrar estoo, usamos u el heccho de que caada observaciión es asignadda a un grupoo y sólo a unoo. Entonces, E P1i + P2i + P3i = 1. Después de d promediar todas t las obserrvaciones en el e grupo, g resulta que P¯ 1 + P¯ 2 + P¯ 3 = 1 y p1i1 + p2i + p3i = 0 (pji = Pji – P¯ j). Primero examinamos e la suma de las estimacionees de pendientte de mínimoss cuadrados:
Por contrastee, los intercepptos suman 1, dado que
De este modoo, sólo necesiitaremos ejecuutar dos de laas tres regresiiones de míniimos cuadraddos. Una soluución para los parámetross de la tercerra ecuación se deriva de las primeras doss.
CAPÍÍTULO 11: Modelo os de elección cua alitativa
335
Si las variables X en caada ecuación no son idéntticas, el análissis se vuelve más m difícil. Es decir, las proobabilidades suman s 1 y loss mínimos cuaadrados ordinaarios ya no so on la técnica más adecuad da. Un métodoo útil para solucionar este prroblema es prroporcionado por Zellner y Lee, quienees proponen que q se use un prrocedimiento de estimaciónn de mínimoss cuadrados ggeneralizados para explicar laa correlación entre los térm minos del errror asociadoss con cada eccuación en el modelo m de eleccción múltiple.20
11.2.2
M Modelo logit
El ampliar el modelo m logitt en una man nera análoga a la del modelo lineal de prrobabilidad es e bastante prromisorio.21 Por P ejemplo, para extendeer el modelo lo ogit de eleccióón binaria al ccaso de tres elecciones, por ejemplo, esccribimos (11.15) Ell subíndice i, que designa las observaciiones individuuales, se ha eliminado por sim mplicidad. Enn este caso Pj, j = 1, 2, 3 inndica la probaabilidad de quue se haga la jésima elección n. Cada ecuacción asume qu ue el logaritm mo de las possibilidades de un na elección reelativa a la segunda eleccióón es una funnción lineal deel atributo X. Esstas posibiliddades dependeen de las posibilidades asoociadas con las l dos ecuaciones restantes sólo en el ssentido de que el sistema ddebe restringiirse de modo qu ue la suma de las probabiliddades individduales sea iguaal a 1. Como en el modelo linneal de probaabilidad, es innnecesario esstimar cada una u de las tres ecuaciones po or separado. Podemos P simpplificar esto ex xplicando el hecho h de que la l elección de la forma logit fuerza las limitaciones del d modelo quue reducen el e número de paarámetros a estimarse de sseis a cuatro. Para ver por qué, nótese que, q
Esto crea doos restriccionnes de parámeetro adicionalees:
20
Véase A.. Zellner y T.H. L Lee, "Joint Estimaation of Relationsships Involving Discrete D Random V ariables", Econom metrica, vol. 33, pp. p 382-394, abriil de 1965. 21 Véase McFadden, M op. cit..; H. Theil, "A Multinomial M Extennsión of the Lineaar Logit Model", Innternational Econo omic Review, vol. 10, pp. 251-259, 1969; H. Theil, "O On the Extensión of o Relationships Innvolving Qualitatiive Variables", Am merican Journal of o Sociology, vol. 76, pp. 103-154, 1970.
336
PA A RTE DOS: Mode elos de regresión de d una sola ecuacción
Es un poco más fácil vver la forma del d modelo loggit si redefinimos todos loss parámetros desconocidos d ccomo: (11.166)
Entonces, el sistema del modelo m de la ecuación e (11.15) puede reeescribirse
(11.177)
Dado que loss parámetros de la tercera ecuación pueeden calcularsse una vez quue conocemos los l parámetroos de las prim meras dos ecuaaciones, la terrcera ecuacióón no necesita estimarse. e Supóngaase que se disspone de suficientes repetiiciones; enton nces, podemoos usar la aproxximación de m mínimos cuaddrados ordinaarios para el procedimient p to de estimación correcto. Estimamos las siguientes doos ecuacioness (i se refiere a cada uno de los k niveles de X para loss que se dispoone de repeticciones, no a laas observacionees individualees):
(11.188)
Los parámettros estimadoos determinarán el efecto de los cambiios en X en eel logaritmo dee las razones de las probabbilidades. Si sse necesitan las l magnitudees reales, debe tenerse t en cueenta la restriccción de que llas probabilidaades estimadaas suman 1. Estto puede haceerse renormallizando los vaalores de los parámetros p esstimados desp pués de que se ha ejecutaado la regresión de mínim mos cuadradoos inicial. Sin em mbargo, es proobable que loss errores sean hheterocedásticcos. Además, lla correlación del d error de la ecuación cruzada debbería ser expplicada usanddo mínimos cuaadrados generralizados. Si los coostos del cálcuulo no son unn problema y no n se disponee de suficientees repeticiones deberá usarsee una versión generalizada del procedim miento de máxima verosimillitud, debido a que garantizza estimacionees de parámetrro consistentees y estadísticass de muestra grande correcctas.
CAP PÍTULO 11: Modelo os de elección cua alitativa
EJEMPLO 11 1.5
337
Lo ogro ocupacion nal
See construyó un u modelo lo git múltiple para p analizar el logro ocuupacional de individuos,22 Ell objeto era predecir la proobabilidad rel ativa de que un u individuo es té en cada unna de las cincco categorías ocupacionalees: profesionaal, oficinista, arttesano, obreroo o servicio doméstico, d co n base en la raza, r género, educación y exxperiencia en el e mercado labboral del indivviduo; se usaroon 1 000 obse rvaciones de 19970, cada una pertenecient e a un miemb ro de la fuerzza de trabajo que q laboraba tieempo completto. Se estimó el siguiente modelo:
doonde subíndicce 1 = ocupaciión de serviciio doméstico subíndicce 2 = ocupacción de obreroo subíndicce 3 = ocupacción artesanall subíndicce 4 = ocupacción de oficinnista subíndicce 5 = ocupacción profesionnal Ei = años de d escolaridadd del individuuo i Xi = años dde experienciaa laboral del i ndividuo i (e dad - E - 5) Ri = raza deel individuo i (1 si es blannco, 0 si no ess blanco) Si = géneroo del individuuo i (1 si es hhombre, 0 si es e mujer) Loos coeficientees estimados se s dan en el cuadro.11.6. c Los resultaados demuestrran que mienttras más educcación se tengga, hace más prrobable que coloque c en unna ocupaciónn de numerac ión alta. Pro bablemente, esto es lo que see espera; la edducación nos permite p ascendder en la escalla laboral. La únnica excepciónn es que entree más educaci ón hace menoos probable paara uno estar enn una posiciónn de obrero quue en una posicción de serviccio doméstico . Los efectos dee la experienciia en el mercaado laboral so n mucho mennos fuertes a loo largo de las occupaciones e indica i que loss obreros tiennden a tener ppoca experienccia mientras quue los profesiionistas tiendden a tener muucha más expperiencia.
22 P. Schmidtt y R.P. Strauss, "The Predictionn of Occupation Using Múltiple Logit Models", Intternational Econo omic Review, vol. 16, núm. 2, pp. 471-486, 1975.
338
PARTE DOS: Modelos de regresión de una sola ecua ación
CUADRO 11.6 COEFICIENTES S ESTIMADOS
* Significativo en el e nivel del 5%.
Los resultados para ell género son evidentes. e Si ordenamos o lass ocupacioness de la siguiente manera: m Oficinista Servicio doméstico Profesion nal Obrero Artesano o entonces, maanteniendo coonstantes otros aspectos, ser mujer (ho ombre) causaa mayor probabbilidad de colocarse en cuaalquier grupo oocupacional in nferior (superrior) en la lista enn relación conn cualquier otrro grupo ocuppacional. Porr último, si ordenamos laas ocupaciones de la siguiente forma: Servicio doméstico Obrero Profesion nal Artesanoo Oficinista entonces, no ser blanco (ser blanco) hace más probaable estar en cualquier c gruppo inferior (superior) en la liista en relació ón con cualquuier otro gruppo. En esenciia estos resultad dos demuestrran que no serr blanco hacee más probablle estar en unno de los gruposs menos deseables desde el e punto de vista económico: servicio dooméstico u obrrero. Ademáss, se encuentraa la peor discrriminación enn las posicionees de oficinista y no como aalgunos podríían haber esperado, en las posiciones dde artesano.
CAPÍTULO C 11: Mod delos de elección cu ualitativa
11.2.3
339
Modelo prob bit ordenad do
Una U extensión interesante ddel modelo proobit se aplica a modelos enn los que hay unn ordenamiennto en las caategorías asoociadas con lla variable deependiente.23 Su upóngase, po or ejemplo, quue estamos esstudiando un proceso de vootación en el quue tres partidoos ofrecen caandidatos paraa un cargo. Ell primer cand didato es conseervador, el seggundo es liberral y el terceroo es un socialista. Supóngasse que hay un ín ndice subyaceente Z para cada votante individual i que mide la exttensión en la quue cada canddidato siente qque deberíam mos basarnos een el sistemaa de mercado co ompetitivo. La L variable deppendiente obsservada se miide como Yi = 3 si es conseervador, 2 si es e liberal y 1 si s es socialistaa. El modelo pprobit ordenaddo asume que haay puntos de corte Z* y Z*** que definen n la relación entre las variiables dependiientes observaadas y no obsservadas. De manera m especíífica, Zi = α + βXi , y
Como en el e modelo proobit de dos categorías, loss parámetros y los errores esstándar asintóóticos son estiimados usand do el método de máxima verosimilitud. v L pruebas noormales estánndares puedenn aplicarse paara probar la significancia Las dee coeficientess individuales.
EJEMPLO 11.6
Vo oto del Congre eso sobre Med dicare
McKelvey y Zavoina M Z usaroon un modelo probit ordennado para anallizar la votaciión del Congreeso sobre el prroyecto de leyy de Medicare en 1965.24 An ntes de que el prroyecto de leey fuera anunnciado por ell comité, se rrechazó una moción para vo olverlo a som meter a una coomisión y por tanto debilitaar el proyecto. Los autores deel modelo anaalizaron los vvotos en estas dos ocasionees separadas para p determinaar un índice de d la posiciónn de cada dipu utado sobre M Medicare. Huubo tres combiinaciones de votación: v la pposición de mayor m apoyo fuue adoptada por p diputados quue votaron co ontra volverlo a someter a una u comisión y a favor de la l aprobación deel proyecto; la segunda pposición interrmedia fue addoptada por aquellos a que vo otaron a favo or de la reconsideración y a favor de la aprobación; y la posición m débil fue adoptada más a por aquellos que votaron a favvor de la reconnsideración y enn contra de la l aprobaciónn. Las variabbles explicativvas usadas fu ueron las sigu uientes: Partido =
23
1
si es reepublicano
2
si es ddemócrata
Región =
1
si es del surr
0 en cualquierr otro caso
Esta técniica se expone en R.D. R McKelvey y W. Zavoina, "A Statistical Modell for the Analysis off Ordinal Level D ependent Variable es", Journal of'M Mathematical Socioology, vol. 4, pp. 103-120, 1 1975. 24 McKelveyy y Zavoina, op. ciit.
340
PA ARTE DOS: Mode elos de regresión de d una sola ecuacción
CUADRO C 11.7 COMPARACIÓN C N DEL ANÁLISIS S DE REGRESIÓ ÓN Y PROBIT
Emplleo = % de deesempleo en el distrito eleectoral Ancianiddad = % mayoor de 65 años Poblacióón = densidadd de poblacióón, miles por milla cuadraada El cuadro o 11.7 muestraa los resultadoos de estimar el modelo pro obit. Como unn medio m de com mparación loss datos tambiéén se usaron ppara estimar un modelo dee regresión r lineeal en el que lla variable deependiente eraa VOTE = 2 si era fuerte a favor f de Mediicare como see describió anntes, 1 si era débil d a favor y 0 si estaba enn contra. c Para comparar c los coeficientes resultantes ccon el modelo o probit, cadaa variable v fue normalizada n ppara tener meedia cero y vaarianza unitarria. Obsérvesee que q la importaancia y signifiicancia relativvas de cada varriable varía cuuando se usa eel modelo m probiit estandarizaado, en opossición al uso del modelo de regresiónn estandarizado e o. En el análissis de regresióón, el partido y la región so on con muchoo los l pronosticadores más importantes i d la postura sobre Mediccare, mientras de que q en el anállisis probit el empleo y en especial e la pobblación se vollvieron muchoo más m importan ntes. ¿Cuál técnnica analítica es la más adeccuada? La estaadística R2 callculada para eel modelo m probitt mide la porcción de la varriación en la eescala subyaceente explicadaa por p el modello y por tantoo es más o menos m compaarable a su contraparte c dee regresión r lineeal. Sin embarrgo, dado que el modelo dee regresión lin neal aquí tienee en e esencia los mismos deffectos que el modelo lineaal de probabiilidad descritoo antes, a es prefferible probit. En efecto, sii se fueran a comparar loss modelos conn base b en la bon ndad de ajustte (R2), probitt dominaría een forma clara.
11.3
MODELOS S DE REGRE ESIÓN CENS SURADA Todos T los probblemas de eleección cualitattiva que hemoos analizado enn este capítuloo tratan t de variiables dependdientes que soon discretas, ggeneralmentee tomando
CA APÍTULO 11: Modellos de elección cua alitativa
341
sóllo dos o tres valores. v Sin em mbargo, hay ocasiones o en llas que la variiable dependieente se ha connstruido con base en una variable conttinua subyaceente para la quee hay una varriedad de obsservaciones soobre las que nno tenemos in nformación. Suupóngase, porr ejemplo, quue estamos esstudiando los salarios de las l mujeres. Coonocemos los salarios reales de aquellas mujeres que están e trabajan ndo, pero no connocemos el "salario de resserva" (el sallario mínimo por el que trrabajaría un inddividuo) para aquellas que no trabajan. El E último gruupo tan sólo es e registrado com mo que no está trabajando. O también podríamos p esttudiar el comp portamiento de compra de au utomóviles usando una enncuesta aleatoria de la pobllación. Para loss que comprarron un automóvil podemoss registrar su gasto, g pero paara aquellos quee no han com mprado no tennemos medidaa de la cantiddad máxima que q estarían disspuestos a pag gar en el mom mento de la encuesta. e En ambos ejemplos e que se acaban dee describir, laa variable deppendiente es cennsurada: faltaa la informacióón para la varriable dependiiente, pero la información i corrrespondientee para las variaables indepenndientes está presente. p (Si faltan fa ambas claases de datos, describimos a la variable dependiente ccomo truncadda.) En esta seccción mostrarremos que la estimación de d mínimos ccuadrados orddinarios del moodelo de regreesión censuraada generará estimaciones e de parámetroo sesgadas e incconsistentes. Entonces, E seññalaremos un n estimador dde máxima veerosimilitud connsistente com mo una alternaativa preferible adecuada. Supóngase que la versióón continua suubyacente dell modelo estáá dada por: (11.19) Y* podría repressentar el gastto en compraas de automóvviles para loss individuos quee compran unn automóvil o el gasto de reserva para aquuellos que no compran, y X* podría repreesentar el ingrreso familiar. Para las perrsonas que no o han compraado un autom móvil, Y* no puuede medirse y se establecce igual a 0. Como C resultad do, la variablee dependientee observada está dada por: (11.20)
Laa ecuación esttimada real apparecerá entonces de la sigguiente formaa: Yi = α + βX Xi + εi
(11.21)
El modelo en e la ecuaciónn (11.21) en ocasiones o es lllamado modeelo Tobit, en recconocimiento de su desarroollo por el ecoonomista Jamees Tobin. Dessafortunadameente, la estimaación de mínim mos cuadradoos ordinarios del d modelo To obit produce esttimaciones sessgadas e incoonsistentes de α y β. Esto ppuede verse coon facilidad callculando la media m de εi. Para que los mínimos m cuaddrados sean in nsesgados y con nsistentes, estaa media debe ser igual a cerro, pero sabem mos que Yi ≥ 0.. Resulta, en forrma directa, quue εi ≥ - α - βX Xi. Para cualqquier valor parrticular de Xi , la media de εi puede p ser posiitiva, negativaa o cero. El caaso de una meedia positiva se s
342
PARTE P DOS: Mod delos de regresión n de una sola ecu ación
Figura 111.6 La función n de densidad de probab bilidad de una variable aleatoria a normal.
representa en e la figura 11.6. Aquí se muestra m la funnción de denssidad de probbabilidad del término t del eerror verdaderro ε (distribuuida en formaa normal), junnto con el área sombreada, s laa cual señala toodos los valorres para los qu ue εi ≥ - α - βX Xi. A partir de esta figura se s puede detterminar la fuunción de deensidad de prrobabilidad deel término deel error censurado de la sigguiente maneera:
El denominaador en la exppresión de la derecha d tan sóólo es el área sombreada s enn la figura. Dividir entre esta área normaliza la función de densidad de modo que el área total baajo la funciónn de densidadd de probabiliidad es igual a 1. Como un u paso final podemos p evalu uar la media del d término dell error truncaddo. De manera específica, e (11.222)
donde λi = f(α f( + βXi)/F(α + βXi), σ es la l desviación estándar e del téérmino del errror verdadero εi*, f es la función de densiddad de probabiilidad de una variable v norm mal estándar y F es la funciónn de distribucción acumulattiva corresponndiente.25 λi en occasiones se llaama tasa de riesgo. Si tennemos estimaaciones de λi, se puede usar para normaliizar la mediaa de εi a cero y por consigguiente obtenner estimadoress consistentes de α y β. Jam mes Heckmann ha diseñadoo un proceso de estimación de d dos etapas relativamentee simple que producirá p estim maciones conn-
25 J.J. Heck kman, "Sample Seelection Bias as a Specification Errror", Econometricca, vol. 47, pp. 1553161, enero de 1979, expone la derivación de estte resultado.
CAPÍTULO 11: Modelos de elección cualitativa
' 343
sistentes de α y β.26 En la primera etapa estimamos λi utilizando el modelo probit Pi = F(α + βXi) = F(Yi* )
(11.23)
El modelo probit es estimado por el método de estimación de máxima verosimilitud (véase el apéndice 11.1) distinguiendo aquellas observaciones para las que Yi* ≤ 0 de aquellas para las que Yi* ≤ 0. (También podría usarse un modelo lineal de probabilidad con Zi= 1 si Yi* ≤ 0 y Zi = 0 si Yi* ≤ 0, pero permanecerían todas las dificultades mencionadas antes en este capítulo.) A partir de los parámetros estimados αˆ y ˆβ del modelo probit, es sencillo calcular λˆi. Usamos una tabla para la distribución normal o nos basamos en un paquete estadístico para hacer el cálculo. La segunda etapa de la estimación de dos etapas utiliza el siguiente modelo: Y i = α + βX i + σ λˆi + u i
(11.24)
en el que se ha agregado λˆi como una variable explicativa adicional. Debido a que λˆ i se aproxima a λi conforme se hace grande el tamaño de la muestra y λi normaliza la media de εi a cero, la estimación de mínimos cuadrados ordinarios de la ecuación (11.24) produce estimaciones consistentes de α y β. Lamentablemente, el estimador de dos etapas (como el estimador lineal de probabilidad) implica errores heterocedásticos (la varianza del error depende de Xi al igual que de que Y= 0), así que las pruebas t usuales están sesgadas. Además, el estimador no es tan eficiente como el estimador de máxima verosimilitud. Por consiguiente, por lo general, es mejor usar estimación de máxima verosimilitud si se dispone de un programa con facilidad. Sin embargo, el método de estimación de dos etapas puede ser útil en el proceso de desarrollo del modelo.27
EJEMPLO 11.7
La demanda de escuelas públicas
En el ejemplo 11.3 se mostró cómo podía usarse el modelo logit para explicar la decisión de votar que sí en una elección escolar como una función de varias características individuales y del hogar. La variable dependiente se basaba en una variable binaria YESVM, la cual era igual a 1 si el individuo votaba sí y a 0 si el individuo votaba no. Usando una ecuación de gasto en escuelas que relaciona el logaritmo de gasto escolar por alumno con una multitud de variables de demanda, hemos construido una variable dependiente nueva, LOGEDUC, la cual mide el logaritmo de cada nivel deseado de gasto escolar por alumno del individuo. Para simplificar el análisis que sigue, hemos asumido que el precio (log PRICE) y el ingreso (log INC) son las únicas dos variables explicativas. 26
27
Ibid.
Para una exposición más completa del modelo Tobit, véase T. Amemiya, "Tobit Models: A Survey", Journal of Econometrics, pp. 3-61, enero/febrero de 1984.
344
PARTE DOS: Modelos de regresión de una sola ecuación
Si conocemos el valor de gasto deseado de todos los que responden, la demanda de gasto escolar por alumno podría estimarse usando el método de mínimos cuadrados ordinarios. Aprovechando las 95 observaciones del estudio de Troy, Michigan, del ejemplo 11.3, obtuvimos los siguientes resultados (las estadísticas t están entre paréntesis): LOGEDUC = 5.89 - .31 log PRICE + .38 log INC (4.23) (-2.07)
R2 = .11
(3.18)
F = 5.95
Supóngase, que la única información de gasto provenía de aquellos individuos que en realidad votaron que sí en la elección escolar. Entonces se construiría la variable dependiente truncada YSTAR como el producto de LOGEDUC y YESVM. Si se usaran mínimos cuadrados ordinarios para estimar el modelo truncado, obtendríamos los siguientes resultados: YSTAR = 1.77 - 3.03 log PRICE + (.17)
(-2.65)
R2 = .11
2.40 log INC (2.63)
F = 5.60
El estimador de mínimos cuadrados ordinarios sesgado de una etapa, se desempeña en forma bastante deficiente en relación con el modelo verdadero. Tanto el término de precio como el de ingreso tienen el signo correcto, pero ambos son considerablemente grandes, y además el término de precio es demasiado grande en relación con el término de ingreso. (Las estadísticas t significativas son engañosas debido a que el estimador es inconsistente.) Estos resultados no son sorprendentes debido a que las estimaciones del coeficiente fueron ambas sesgadas e inconsistentes. Para obtener estimaciones de parámetro consistentes usamos el procedimiento de dos etapas sugerido por Heckman. En la primera etapa estimaremos el siguiente modelo probit: Prob (Votar sí) = .090 - 2.12 log PRICE + .86 log INC (.022)
(-2.41)
(2.34)
A partir de estos resultados de regresión calcularemos el índice de riesgo λˆ i. Luego utilizaremos el índice de riesgo estimado para calcular la segunda etapa del proceso de estimación, con el método mínimos cuadrados ordinarios, se tienen los siguientes resultados: YSTAR = 3.26 - .61 log PRICE + .81 log INC + .41λˆi (1.15)
(-1.32)
R2 = .13
(1.74)
F = 2.74
(.69)
CAPÍT TULO 11: Modeloss de elección cualita ativa
345
Nóteese que el pro ocedimiento de d dos etapass consistente genera coeficientes de precio e ingreso (éstos puedenn interpretarsse como elastticidades) quee tienen el signoo correcto y la magnitud reelativa correctta. Sin embarggo, ambos son n mayores que los coeficienttes verdadeross y son estadísticamente inssignificantes en e el nivel del 5%. 5 Por supu uesto, se obtenndría un conjunto de estim maciones máss preciso y más eficiente si usáramos u el prrocedimiento de estimación de máxima verosimilitudd.
APÉ ÉNDICE 11..1 Estim mación de máx xima verosimilitud de los mo odelos logit y p probit
Cuanndo se usan ya y sea el moddelo probit o el modelo loogit con obseervaciones indivviduales, la téécnica de estim mación más adecuada a es laa de máxima verosimilitudd. Supóngase que deseamos estimar los parámetros ddel modelo loggit28
Las Pi individuales no son observadas; en su lugar, teneemos informaación para cadaa observación sobre si se seleccionó la prrimera o la seggunda opción. La variable dependiente d medida m es Yi = 1 si se hace la primera ellección y 0 si se hace la segu unda. Nuestro objetivo es enncontrar estim madores de paarámetro para α y β que hagaan más probaable que las elecciones enn la muestra hubieran occurrido. Si asum mimos que la primera alternnativa es eleg gida n1 veces y la segunda es elegida n2 veeces (n1 + n2 = N) y si orddenamos los datos de moddo que las prrimeras n1 obseervaciones esttén asociadas con la primeera alternativaa, la función de verosimilittud tiene la foorma (A11.2) Ahoora, tomando en cuenta el hecho de quue la probabillidad de que se elija la seguunda alternativva es igual a 1 menos la proobabilidad de qque se elija laa primera y usanndo П para reepresentar el producto de varios factorees, la funciónn de verosimiilitud se reducce a:
28
La estimaciónn de máxima veroosimilitud del moodelo probit es parecida a la del modelo m logit, exceppto que Pi represeenta las probabiliddades asociadas con c la función noormal acumulativ va en lugar de con laa función logísticca acumulativa.
346
PARTE DOS: Mo odelos de regresión de una sola ecuación
La última expresión e resuulta porque Yi = 1 para las prrimeras n1 obsservaciones y 0 para las últtimas n2 obserrvaciones. Maxim mizamos el loggaritmo de L sustituyéndol s o para la funcción de probabbilidad logísttica de la ecuación (A11.1). Nótese prim mero que
Para obtener los estimaddores αˆ y ˆβ diiferenciamos log L con resspecto a α y β, establecem mos los resultaados igual a cero c y resolveemos:
El proccedimiento de estimación de máxima vverosimilitud tiene varias prop piedades estadísticas e deeseables. Tod dos los estimaadores de loss parámetros son consistentees y eficientess asintóticameente. Además, se sabe que todos los estimadores de loos parámetros son (asintóóticamente) noormales, de modo m que puuede aplicarse ell análogo de laa prueba t de regresión. r Si se s desea probaar la significanncia de todos o un subconjunnto de los coeeficientes en el e modelo loggit o en el moddelo probit cuanndo se usa máxxima verosim militud, entoncees puede apliccarse la pruebaa de razón de veerosimilitud dde la sección 10.2. Para obtener o una m medida de bon ndad de ajustte análoga a R2, son posibbles varias opciiones. Una ess calcular 1 - Lo/Lmáx, dondde Lo es el valor v inicial dee la función dee verosimilituud y Lmáx es el e valor más alto. Una segunda opciónn es calcular los residuales εˆ i = Yi – Pˆi. Todos T estos reesiduales seráán positivos para p aquellos quue hagan la pprimera eleccción y negativvos en cualquuier otro casoo, al igual que serán s correspoondientementte más pequeños en valor absoluto confforme el mod delo explique cada vez mejjor las eleccioones que se haacen. A partirr de estos residduales es fácil calcular un análogo a de R2. Se tiene quee:
CAPÍTULO 11: Modelo os de elección cua alitativa
347
EJ JERCICIOS 11.1 Al corregir el modelo lineeal de probabiliddad para la heteerocedasticidadd, ¿por qué no puueden usarse enn forma directaa los residualess de mínimos cuadrados c paraa calcular una esttimación de la varianza del errror σi2 en lugarr de usar la fórrmula de la ecuuación (11.3)? 11.2 ¿Qué les suucedería a los cooeficientes del modelo lineal de d probabilidadd si la variable deependiente bin naria fuera reppresentada por una variable (0, 2) en lugaar de por una vaariable (0, 1)? ¿Qué ¿ le sugierre esto acerca de la interprettación de los parámetros p de míínimos cuadraddos estimados?? 11.3 Demuestre que la transforrmación del modelo m de probaabilidad descritto en la ecuacióón (11.4) usand do una funciónn de probabilid dad uniforme acumulativa a prroduce la versió ón restringida del d modelo lineeal de probabillidad. 11.4 Considere el ejemplo de incumplimien nto de bonos m municipales (ejjemplo 11.1). Exxplique cómo podría p reinterppretar el problema del incum mplimiento de los bonos en funnción de un moodelo probit. ¿Cuáles son alggunas de las veentajas y desvenntajas de usar la especificación n probit en lugaar de la especifficación lineal de d probabilidadd? 11.5 El modelo logit de la ecuuación (11.9) es lineal en los parámetros y, sin embargo, deebe (por lo gen neral) estimarse usando un paquete de estim mación no lineeal. Explique estta inconsistenccia aparente. 11.6 Usando loss siguientes seis puntos de daatos, estime un modelo lineal de probabilidaad con el uso dee mínimos cuaadrados ordinarrios:
X Y
-1 0
-2 0 0 0
1 1
1 1
1 1
Caalcule R2 para el e modelo. Lueggo use el modeelo estimado paara clasificar a los l individuos en n dos categoríaas. Calcule el nnúmero de classificaciones coorrectas usandoo la siguiente reg gla de clasificacción:
Diiscuta las ventaj ajas y desventajas de usar R2 o el porcentaje dde clasificacion nes correctas como una medidda de la bondadd del ajuste en el modelo lineeal de probabilidad. 11.7 Refiérase all conjunto de ddatos en el .cuaadro 11.8. a) Utilizandoo procedimientoos OLS, probit y logit, estime los l parámetros en e el modelo Prob (YESVM ( = 1) = F
(PUB1&2, PUB3&4, PUB5, PRIV, YEAR RS, SCHOOL, loog INC, PTCON N)
¿C Cómo se compaaran los resultaados? b) Usando laas estimacionees OLS, pronosstique YESVM M para cada casso. ¿Cuántos casos resultan en n realidad en prredicciones fueera del rango de 0 a 1? Haga un u análisis.
348
PARTE DOS: Mod delos de regresión n de una sola ecua ación
CUADRO 11.8 CONJUNTO DE E DATOS DE VO OTACIÓN Variables como o en el cuadro 11 1.5 con adición de d PTCON = log garitmo natural de d impuestos prediales pagad dos por año, en dólares; YESVM M = variable indiccadora igual a 1 si el individuo votó sí en la ele ección v 0 si el individuo votó no o.
CAP PITULO 11: Mode elos de elección cu ualitativa
CU UADRO 11.8 CO ONJUNTO DE DA ATOS DE VOTA ACIÓN (Continua ación)
349 9
PARTE
TRES MODELOS DE ECUACIONES MÚLTIPLES
En los siguientes tres capítulos tratamos los modelos que constan de más de una ecuación. En un modelo de regresión de una sola ecuación la variable dependiente se relaciona con un conjunto de variables explicativas; por ejemplo, una tasa de interés puede relacionarse con el PIB, la tasa de inflación y el suministro monetario. Sin embargo, los modelos de una sola ecuación no explican las interdependencias que pueden existir entre las variables explicativas, o mostrar cómo estas variables explicativas se relacionan con otras variables. Además, los modelos de una sola ecuación explican la causalidad en una sola dirección; es decir, las variables explicativas determinan una variable dependiente, pero no hay relación de retroalimentación entre esta variable y las variables explicativas. Los modelos de simulación de ecuación múltiple nos permiten explicar las interrelaciones dentro de un conjunto de variables. Con frecuencia estos modelos están formados por un conjunto de ecuaciones de regresión que, después de ser estimadas, son resueltas de manera simultánea en una computadora. Sin embargo, los modelos de simulación también pueden incluir ecuaciones que no son estimadas, como las identidades de contabilidad y las reglas empíricas conductuales. En el capítulo 12 describiremos algunos de los problemas de estimación implicados en los modelos de ecuación múltiple al igual que el problema de la identificación del modelo. También examinaremos algunas técnicas de estimación que se han elaborado para modelos de ecuación múltiple, incluyendo mínimos cuadrados de dos y tres etapas. En los capítulos 13 y 14 expondremos algunos problemas generales implicados en la construcción, evaluación y uso de modelos de simulación. En el capí-
351
352
PARTE TRES: Modelos de ecuaciones múltiples
tulo 13, describiremos cómo se lleva a cabo en realidad la simulación de un modelo, cómo puede evaluarse un modelo de simulación y cómo el método de estimación particular usado para un modelo afecta su desempeño en la simulación. También analizaremos las autorregresiones vectoriales: modelos no estructurales en los que un conjunto de variables se relaciona con valores rezagados. En el capítulo 14 examinaremos el comportamiento dinámico de los modelos de simulación, métodos de ajuste de modelos de simulación y el uso de simulación estocástica para determinar intervalos de confianza para pronósticos con modelos.
CAPÍTULO
12
ESTIMACIÓN DE ECUACIONES SIMULTÁNEAS
En las dos primeras partes de este libro nuestro principal interés eran los modelos de una sola ecuación. Encontramos que en muchos casos la estimación de mínimos cuadrados ordinarios es el procedimiento de estimación más apropiado. En este capítulo dirigiremos nuestra atención a los modelos consistentes de varias ecuaciones, en los que el comportamiento de las variables se determina en forma conjunta. Quizá el ejemplo más simple de un modelo de ecuación simultánea es el modelo de dos ecuaciones de la demanda y la oferta del mercado, donde tanto el precio como la cantidad son variables endógenas. Los ejemplos más complejos incluyen modelos económicos industriales, regionales y nacionales. Todos estos ejemplos se parecen en que cada modelo incluye diversas variables endógenas que son determinadas en forma simultánea por una serie interrelacionada de ecuaciones. La presencia de dos o más variables endógenas necesita alguna construcción de modelo y herramientas de estimación adicionales. Por ejemplo, la simultaneidad puede causar que los estimadores de los parámetros por mínimos cuadrados ordinarios sean inconsistentes, de modo que debe usarse un método de estimación alternativo. Desarrollaremos dichas herramientas trabajando con ejemplos simples de tal forma que sea lo más comprensible posible. Los apéndices 12.1 a 12.3 contienen un desarrollo matemático más completo de muchas de las técnicas descritas en el texto. Este capítulo comienza con una explicación de la inconsistencia de los mínimos cuadrados ordinarios, cuando se utilizan para estimar una ecuación que es parte de un sistema de (dos) ecuaciones determinadas de manera simultánea. La segunda sección expone el problema de identificación, siendo el principal problema la determinación de las condiciones bajo las cuales pueden esti353
354
PA ARTE TRES: Modelos de ecuacione es múltiples
marse de man m nera consistennte los parám metros estructuurales de una ecuación. Coon estos anteced dentes describbiremos los mínimos m cuadrrados de dos etapas, e un tippo de estimador de variables instrumentales usado conn frecuencia. Luego L mostraar remos cómo estimar e modeelos de ecuacioones simultánneas con correelación serial y u variable dependiente una d r rezagada. Porr último, analiizaremos los problemas p quue implican sisteemas de ecuaaciones. Descrribiremos loss métodos porr los que todaas las ecuacionees en un sistem ma del modeelo son estimaadas de maneera simultáneaa, p proporcionan ndo, por consiiguiente, una mejora en laa eficiencia.
12.1
INTRODU UCCIÓN A LO OS MODELOS DE ECU UACIONES S SIMULTÁNE EAS Con frecuenccia en el modeelado de negoocios y económ mico, el proceeso o procesoos b bajo estudio pueden repreesentarse mejo or con una seerie de ecuaciones simultááneas interdeppendientes. Loos ejemplos más m comunes de tales ecuaaciones son loos modelos de oferta o y demaanda, en los que q el precio de un produccto es determiinado de mannera simultáneea por la inteeracción de prroductores y consumidorees en un mercad do, y los modelos de deteerminación del d ingreso macroeconómi m ico, en los quee el consumo agregado y el e ingreso dispponible agreggado son deterrminados en forma f simultáánea. Usarem mos estos moddelos para iluustrar el hechho de que la estim mación de mínnimos cuadraddos ordinarioss de ecuacionees individualees en un modello de ecuacioones simultán neas puede cconducir a estimadores de d p parámetro seesgados e incoonsistentes. Luego L exponddremos los procedimiento p os alternativos de d estimaciónn de una solaa ecuación quue producen estimadores e d de p parámetro coonsistentes.
12.1.1
Sistemas S de e ecuacione es simultáneas
Desde este puunto en adelaante pensarem mos en los moodelos como consistentes c d de una serie de ecuaciones, e uutilizando cada una de éstass para explicaar una variablle que está deterrminada en el modelo. Por esta e razón seráá útil remplazzar los términoos variable indep ependiente y variable depeendiente con alguna termin nología nuevaa.
Considérese un modelo de oferta y dem manda de trees ecuaciones descrito de la l siguiente mannera: Oferta: Demanda: Equilibrio: La ecuación de oferta, laa ecuación dee demanda y la condiciónn de equilibrio determinan ell precio del mercado m y la caantidad abasteecida (y deman ndada) cuando el mercado está e en equillibrio. Por essta razón las variables Q Dt , Q St y Pt a menudo son llamadas l variaables endógennas; están determinadas den ntro del siste--
CAPÍTULO 12: Estimación de e ecuaciones simultáneas
355
ma de ecuacionnes. El modeelo contiene taambién dos vvariables cuyoos valores no m esstán determinaados en formaa directa dentrro del sistemaa. Estas variab bles predeterm minadas ayudaan a causar ell movimiento o de las variabbles endógenaas dentro del sistema. Pt - 1 y Yt son variablles predeterminadas en el m modelo. Hay, por p supuesto, un na diferencia importante entre e las dos variables v preddeterminadass. La primera vaariable Pt - 1 está e determinnada dentro del sistema, poor valores paasados de las vaariables. Por taanto, las variabbles endógenaas rezagadas sson variables predeterminap daas.1 Por últim mo, la variablee Yt está determ rminada por completo c fueraa del sistema deel modelo y ess llamada variiable exógena. Se puede ver, v en forma ggráfica, la end dogeneidad dee las variabless Pt y Qt en la figura 12.1. See muestran la curva de dem manda D1 y laa curva de ofeerta S para el peeriodo t y poor consiguientte para valores particularees de las variiables predeteerminadas Pt - 1 y Yt . Ahoraa suponga quee consideramoos la demanda y la oferta en ottro periodo, digamos d t + 11, en el que el e ingreso Yt + 1 se ha increementado. El in ncremento en n el ingreso ccausará que la l curva de la demanda cambie c hacia arrriba y a la derecha d de D1 a D2, lo cuual a su vez cconducirá a un u precio de eqquilibrio Pt +1 y a una canntidad Q t +1 mayores. m Debido a que q Pt y Qt son endógenass, la aplicacióón de mínimoos cuadrados orrdinarios a laa estimación de d la ecuaciónn de oferta (oo demanda) generará g estim madores sesgad dos e inconsiistentes. Para demostrar estto, ajustaremoos el modelo orriginal, elimin nando el térm mino de preciio rezagado dde la ecuaciónn de oferta y suustituyendo paara los valores de equilibrio o de Q tSy Q tD(representadoos como Qt ). El modelo es el e siguiente: Oferta: O Demanda: D Paara simplificaar nuestro análisis, tendrem mos la oportuunidad de usaar el modelo coon todas las vaariables mediddas en forma de d desviacionnes, obtenidas sustituyendo q t =Q t – Q¯, y t =Y t -Y¯ y pt =P t - P¯ en la l ecuación (12.1): ( Oferta: O Demanda: D Este modelo see llama modello estructural, debido a quee su forma esttá dada por la teeoría subyaceente. Un moddelo estructurral contiene vvariables endóógenas en el laado izquierdo y (si es simuultáneo) tambbién contiene éstas como variables v predeeterminadas en e el lado derrecho. 1
En la mayo or parte de este ccapítulo considerraremos todas lass variables endóggenas rezagadas co omo predeterminaadas. Esta suposicción es razonablee en tanto no hayaa correlación seriaal asociada con el térrmino del error en la ecuación que contiene la variable endógeena rezagada. Exxpondremos los prroblemas específi ficos asociados coon la correlación n serial y las variiables endógenas rezagadas en la seección 12.5.
356
P PARTE TRES: Mod delos de ecuacion nes múltiples
Figura 12.1 1
Un cambio o en la demanda.
Al resolv ver las ecuaciones en la ecuuación (12.2)) para cada unna de las variaables endógennas como unaa función úniccamente de las variables prredeterminadaas en el modeloo apoyará el estudio e de las propiedades del d sistema de ecuaciones y las derivacionnes. La llamada solución de d forma reduccida se enumera a continuaación, primeroo en función de d variables orriginales [ecuaación (12.3)] y luego cuanddo las variables son medidas como desviacciones alrededdor de sus meedias [ecuacióón (12.4)].2
El uso de varriables mediddas en forma de d desviacionnes elimina el término consstante en cadaa una de las eecuaciones enn forma reduccida pero no altera a los otroos parámetros de d ninguna m manera. 2 Para obteener la forma redducida en el últiimo caso, por ejemplo, estableceemos igual el laddo derecho de ambaas ecuaciones en la ecuación (12.22); es decir, α2 pt + εt = β2 pt + β3 yt + ut . Resolvienddo para p1 , obtenem mos la segunda ecuación. e Entoncces, al sustituir essta ecuación en qt = α2 pt + εt en la ecuación (12.2),, obtenemos la prrimera ecuación.
CAPÍTULO 12 2: Estimación de e ecuaciones simultá áneas
357
Supóngase que q estimamoos la ecuaciónn de oferta en la ecuación (112.2) con el usoo de mínimos cuadrados orrdinarios. La estimación e dell parámetro de d pendiente serrá: (12.5)
Susstituyendo qt en el sistem ma de ecuacion nes (12.2), enncontramos quue:
Si el e término ∑ppt εt /∑p2t en ell lado derecho o se iguala a 0 en promedio o, sabríamos quee los mínimos cuadrados oordinarios sonn insesgados.. Del mismo modo, m si la sum ma se aproxim mó a 0 conforrme el tamañoo de la muestrra aumentaba, sabríamos quee la estimació ón de mínimoos cuadrados ordinarios o fuee consistente. Desafortunad damente, ning guna de estass condicioness es cierta en general. En modelos m de ecuuaciones simu ultáneas, donnde las variabbles (endógennas) en una ecuación e se retrroalimentan como c variablees de otra ecuación, los térm minos del erro or se correlacionan con lass variables enndógenas y lo os mínimos cuuadrados son sesgados e incconsistentes. En el caso del d modelo de oferta y demaanda no siemppre es posiblee predecir la direección del sessgo y la inconnsistencia que resulta del usso de la estimaación de los mín nimos cuadrad dos. Sin embaargo, se conooce la direccióón de la inconnsistencia al usaar mínimos cuuadrados paraa estimar unaa función de cconsumo agreegado en un moodelo simple de determinaación del ing greso nacionaal. Escrito enn forma de dessviaciones, el modelo estruuctural es c t = Byy t + ε t
yt = ct + it + g t
(12.7)
donnde c = consuumo agregadoo i = inverssión g = gasto gubernamen ntal y = ingresso nacional p = propennsión marginal a consumirr (0 < β < 1) it y gt son variabbles exógenas,, y ct y yt son endógenas. e La forma reducida r del modelo contiene dos ecuaciones conn variables end dógenas ct y yt en el lado izqquierdo y las variables v exóggenas it y gt enn el derecho. Resolvemos susstituyendo parra yt en la ecu uación de connsumo para obbtener:
358
P PARTE TRES: Moodelos de ecuacionnes múltiples
De este moodo, con el usso de mínimoss cuadrados ordinarios, o tennemos
Pero
sustituyendo a partir de la eccuación (12.8)
Aquí, con sólo s una ecuaación estructuural contenieendo un térmiino de error, la dirección deel sesgo es claara. Los mínim mos cuadradoos ordinarios sobrestimarán s n el valor verdaddero de la proopensión marrginal a consuumir.
12.2
EL PROB BLEMA DE LA L IDENTIFICACIÓN Suponga quue conocemoss la forma reducida de unn sistema de ecuaciones. e ¿ ¿Es suficiente para p permitirnnos discernir el e valor de loos parámetross en el conjunnto original de ecuaciones e esstructurales? El E problema dde determinarr las ecuacionnes estructuraless, dado el conocimiento de la forma reduucida, se llamaa el problema de la identificaación. Esto es equivalente, en el ejemploo de la oferta y la demandaa, a preguntar sii podemos deeterminar las ecuaciones dee demanda y oferta si se nos n da conocimiiento de P y Q Q. La conssideración dell problema dee identificacióón viene antes de la considderación del problema p de eestimación. Una U vez que see ha especificcado un modeelo estructural, debemos veriificar si podemos obtener el conocimien nto de los parrámetros estruucturales unaa vez que se ha h estimado laa forma reduccida. Decimo os que una ecuuación no esttá identificadaa si no hay fo orma de estim mar todos los paarámetros estrructurales a paartir de la form ma reducida. Una U ecuaciónn es identificada si se pueden obtener valorres de los paráámetros a partiir del sistema de ecuaciones de d forma reduccida. Una ecuaación es identifficada exactam mente si existe un valor de parrámetro único y está sobreiidentificada sii se puede obttener más de un valor para algunos paráámetros. Aun nque nos hem mos concentraado en la ideentificación de d ecuaciones sencillas en un sistema dde ecuacioness estructural, es importante darse cuenta de que dentro o de un modeelo estructuraal dado, algunnas ecuaciones pueden p ser iddentificadas mientras m otras no. De hecho o, dentro de una u ecuación sencilla es posiible que algunnos parámetroos puedan esttar identificaddos mientras qu ue otros puedan permaneceer sin identifi ficar.
CAPÍTULO 12: Estimación de d ecuaciones sim multáneas
359 9
Continuarem mos con la exxposición del problema de la identificación consideranndo los modeelos de oferta y demanda que q describimoos con anteriooridad. Considderaremos priimero un moddelo de seriess de tiempo dde oferta y dem manda en el quue no hay variiables predeteerminadas: Offerta: Deemanda:
(12.9)
Assumimos quee el mercado eestá en equiliibrio en cada periodo, de modo m que la caantidad demanndada iguala a la cantidadd suministradaa (ya hemos eliminado e la eccuación de equilibrio por sustitución). s L clave paraa entender el problema La p de ideentificación en e el contextoo de este moodelo es enfocarse en la condición c de eqquilibrio. En cada c periodo hay un valor del precio P y un valor dee la cantidad veendida Q. En otras o palabrass, los únicos datos d disponibbles para el ecconometrista soon los valoress de mercado (para cada periodo) p de P y Q. Los errrores en las ecuaciones haceen probable quue los valoress de P y Q obttenidos no serrán idénticos, peero es probablle que todos llos valores caaigan cerca dee los valores de d equilibrio dee P y Q determ minados por lla solución diirecta de las eecuaciones enn el modelo. Essta situación es e descrita en la figura 12.2 2. El punto E rrepresenta el equilibrio e de offerta y demandda. Cuando see trata de estim mar las ecuaciiones de ofertaa y demanda separadas usanndo los datos de mercado, obtenemos reesultados sin sentido. No haay forma de asegurar a las ppendientes dee oferta y dem manda verdadderas fijando sóólo los datos de d equilibrio. De hecho, laa única razónn por la que es e posible la estimación es que q los errorees aparecen en ambas ecuaaciones. (De otra manera todos los datoss puntuales esstarían en el punto p E.) El modelo que estamos describiendoo es uno en el que tanto la curva c de la offerta como la curva de la demanda no esstán identificaadas. Ningunaa está iden-
Figura 12.2 Modelo de ofe erta y demanda.
360
PARTE TRES: Mod delos de ecuacion nes múltiples
tificada debiido a que no hay forma de d obtener loss valores de los parámetroos estructuraless (las pendienntes e interceeptes de las ccurvas de ofeerta y demandda individuales)) de las ecuaciiones en form ma reducida. (L La forma reduucida tan sólo es la ecuación que describee el punto dee intersecciónn de las curvvas de oferta y demanda con errores vinnculados.) Laas ecuaciones de forma reeducida para la forma de dessviaciones sonn:
Debe ser eviidente a partirr de un exam men de la figurra 12.2 que cuualquier par de d curvas de deemanda y oferrta que se inteersecten en ell punto E poddrían haber siddo con igual faccilidad las currvas de demaanda y oferta "verdaderas".. En otras pallabras, hay unn número infiinito de modeelos estructurrales (curvas de demanda y oferta) que son consistenttes con la mism ma forma redducida (valor de d equilibrio dde P y Q). El problema p no se debe a unna carencia dee datos. Podríamos tener un u número infinnito de datos puntuales paara el análisiss econométricco, pero en ese caso lo mejorr que podríam mos hacer seríaa estimar los vvalores de equuilibrio de P y Q con mayor precisión; las ccurvas de dem manda y ofertaa aún serían no n identificadaas. (Por supuestto, las ecuacioones de formaa reducida pueeden usarse en forma direccta si el objetivoo es la prediccción, debido a que no se reqquiere la identtificación.) Debería ser claro quue la identificación de eccuaciones en un modelo de d ecuaciones simultáneas s nnecesita mayor informaciónn. Considérese el sistema de d oferta y dem manda: Oferta:
(12.100)
Demanda: Bajo la supoosición de quee β3 ≠ 0 y quue Yt varía de manera considerable con el tiempo, no podemos p trazzar una curvaa de demandaa y una curvaa de oferta paara todos los perriodos. Debiddo a que el inggreso determinna la demandda y varía con el tiempo, debeemos explicarr el hecho de que la curvaa de demandaa cambie con el tiempo. Un conjunto de curvas de deemanda posibbles se describbe en la figuura 12.3. (Son posibles p otros conjuntos dee curvas de deemanda.) En la figgura 12.3 los vvalores de equiilibrio determ minan el camino de la curva dde oferta subyacente. La curvva de oferta es identificadaa debido a quee los parámetros de la oferta pueden p deduccirse de la form ma reducida ((el movimientto del equilibrrio de P y Q). Nótese que es e el movimieento de Y conn el tiempo (oo a lo largo de d observacionees en un análisis de cortee transversal) el que es neecesario para la identificacióón de la ecuacción de oferta.. Reiteram mos que la ideentificación se hace posiblle por la existtencia de infoormación prevvia acerca de laa variable exóógena Y. La eccuación de offerta es identi--
CAPÍTULO O 12: Estimación d de ecuaciones simultáneas
361 1
Figura 12.3
Curva de oferta identificada.
fiicada debido a que la variaable exógena Y fue excluidaa de la ecuaciión de oferta. La L ecuación dee demanda noo es identificada debido a qque no se disppone de información m previaa que permita la determinaación única dee la relación de demanda. Si consideráraamos un modeelo en el que la relación dee la oferta es determinada por la temperaatura T en la rregión y la currva de la dem manda no lo ess, entonces la in nformación prrevia respectoo a la variablee exógena excluida (tempeeratura) en la eccuación de deemanda nos ppermitiría ideentificar la cuurva de demannda. Es posiblee, por supuestto, que tanto la l curva de demanda comoo la curva de oferta sean ideentificadas. E El siguiente modelo m de ofeerta y demannda tiene esta propiedad: O Oferta:
(12.11)
D Demanda: Si T y Y varíann con el tiemppo (y no están S n correlacionaadas perfectam mente), camb biarán las relacciones de la ddemanda y de la oferta. El m movimiento de d los valores d equilibrio de de d P y Q es baastante compleejo, dado que éste deriva dee los cambios d temperaturra e ingreso, pero si se dispone de d de suuficientes dattos podemos d determinar loss valores estruucturales de los l parámetroos de demandda y oferta en fo orma única. El E cambio en lla curva de offerta asociadoo con los camb bios en T nos ayyudan a trazaar la curva dee demanda all mismo tiem mpo que los caambios en la d demanda (cam mbios en Y) nos permiten trazar t la curvva de oferta. Por último o, considerem mos la situación n en la que laa curva de dem manda es unaa fu unción no sólo del ingreso sino también de la riquezaa (se supone que q las dos no están altamentee correlacionaadas). En este caso la curva de demanda cambia c con el tiiempo como reesultado de loos cambios en dos variables.. La ecuación de oferta estáá soobreidentificaada debido a que hay doss variables exxógenas en el e sistema de ecuaciones de oferta y demaanda que son excluidas de la ecuación de d oferta. Esto im mplica que al menos hay ddos formas en n las que se puueden obtenerr los parámetrros estructuraales a partir dde los parámetros de formaa reducida.
362
PA ARTE TRES: Modelos de ecuaciones s múltiples
En el anáálisis se ha inccluido en form ma implícita una u búsquedaa de condiciones n que son necesarias n parra garantizar la identificacción de una eccuación en unn sistema s de do os ecuacioness. Esta búsqueeda puede forrmalizarse en función de laa condición c de orden o para la identificación n. La condicióón de orden esstablece que si s una u ecuación ha de identificarrse, el número de d variables preedeterminadass excluidas de laa ecuación e debe ser s mayor o iguual al número de d variables enddógenas incluiddas menos 1. Laa
lista l de variaables endógennas incluidass deberá conttener variablees en el ladoo izquierdo i y en el lado derrecho de la eccuación. Paraa algunos proppósitos es útiil expresar e la coondición de orrden en una fo orma un poco diferente pero o equivalente: una u condició ón necesaria para que unna ecuación ssea identificaada es que el e número n de to odas las variaables excluidaas de la ecuaación sea may yor o igual al a número n de vaariables endógenas en el sistema del modelo menos 1. La dificulltad con la conndición de ordden es que no ees una condición suficientee; es e decir, es posible p que laa condición sea s satisfechaa y que la ecu uación no seaa identificada. i A Aunque la coondición de orden es una rregla empíricaa satisfactoriaa para p la identifficación, existe la posibiliddad de que faalle en ocasion nes. La extennsión s de la con ndición de orrden para inclluir condicionnes suficientes y necesariass para p la identifficación es unn poco difícil. Dado que im mplica una com mprensión deel rango r de una matriz, dejam mos esta expoosición para el e apéndice 122.1. Como un n ejemplo, reggresemos al modelo m de ofeerta y demandda de la ecua-c ción (12.1): O Oferta: D Demanda:
ddonde P es prrecio, Q es caantidad y Y es ingreso. La eecuación de demanda d no es i identificada por p la condiciión de orden, dado que no se excluyen variables pred determinadas. . Se satisface la condición necesaria paraa que la curvaa de oferta seaa i identificada, y que hay doos variables en ya ndógenas y uuna variable prredeterminadaa e excluida. La condición suuficiente tamb bién se mantendrá cuando o β3 ≠ 0. Estoo t tiene sentido intuitivo, i dado que β3 = 0 implicaría i quee la restricciónn de exclusiónn d cero origiinal no tiene fuerza en ell modelo. Conn β3 = 0 no hay forma dee del d distinguir enttre las ecuaciones de ofertta y demanda. Este sencillo ejemplo es e útil debido o a que sugierre que el prob blema de idenntificación t no debe enfocarse de una manera m rígida. Supóngase que hay muyy poca p variabiliidad en la varriable de ingrreso Y y que eel coeficiente asociado estáá cerca c de 0. Auunque las regglas estrictas para p la identifficación estaráán satisfechass, todavía t será difícil d distinguuir la ecuacióón de oferta dde la ecuación n de demandaa. Esto E sugiere que q los intenttos para garan ntizar la idenntificabilidad en cada ecuaación c del modelo por adicióón y eliminacción de variabbles al azar muy m probablemente m crearánn problemas. Aunque el orrden estricto y las condicioones de rangoo pueden p satisffacerse con uun proceso assí, es improbbable que el modelo m tengaa mucho m poder predictivo, ddado que algun nas o todas laas variables agregadas a pueeden d tener pocco efecto en laas variables endógenas e corrrespondientees.
CAPÍTULO 12: 1 Estimación de ecuaciones simulttáneas
12.3
363
ESTIMACIÓN CONSISTE ENTE DE LO OS PARÁME ETROS Reegresemos al ejemplo e de la oferta y la deemanda de la eecuación (12.2 2) y concentréémonos en la estimación coonsistente de los l parámetroos de la ofertaa. Por convenieencia, a contiinuación se reeproducen loss sistemas de ecuaciones en e forma estru uctural y redu ucida: M Modelo estructuural: Oferta: (12.12) Demanda: M odelo de form ma reducida:
Ell análisis de las l variables instrumentale i es en el capíttulo 7 sugieree un proceso paara resolver ell problema dee la estimacióón. La estimación por variables instrumeentales es razonable en d contexto.dee modelos dee ecuaciones simultáneas deebido a que laas variables prredeterminadaas en el modeelo sirven com mo variables insstrumentales excelentes. e Ell hecho de quue estén presenntes en el mo odelo sugiere qu ue están correlacionadas coon las variablees endógenas, y si están prredeterminadaas garantiza (ppor suposicióón) que no esttán correlacioonadas con el término del errror. En el ejem mplo de la offerta y la dem manda, la variaable yt podría servir como un n instrumentoo adecuado, produciendo p el e siguiente eestimador con nsistente del paarámetro de pendiente p de lla oferta.
Aunque el uso de variaables instrum mentales es appropiado, a menudo m nos ennfrentamos coon el problem ma de elegir entre e varios innstrumentos disponibles. Poor esta ratón, examinarem mos algunas téécnicas alternnativas de estimación de un na sola ecuación, cada una de las cuáles incluye de manera m implíciita diferentes suuposiciones accerca de la eleección de insttrumentos. Coomo un primeer paso, considdérese el sisteema de ecuaciiones en form ma reducida dee la ecuación (12.4). ( Dado qu ue las ecuacioones de formaa reducida sóólo contienen variables exóógenas en el laddo derecho, es claro que loos mínimos cuuadrados ordinnarios estimaarán la forma red ducida de maanera consisteente y sin sessgo. Examineemos las estim maciones de esttos coeficientes πˆ 12 y πˆ 22 máás de cerca. Nótese N que π12//π22 es idénticaamente igual a α2. Esto sugieere que podem mos estimar α2 de manera consistente c esstimando las eccuaciones de forma reduciida usando mínimos m cuaddrados ordinarrios y luego ressolviendo paara obtener laas estimacionnes del parám metro de penddiente de la offerta αˆ 2* * = πˆ 12 / πˆ 22. Estee procedimiennto, llamado estimación por p mínimos cuuadrados indirrectos, puede usarse para obtener o estimaadores consisttentes de los paarámetros.
364
PA ARTE TRES: Mod delos de ecuacione es múltiples
Cuando es posible laa estimación por mínimoss cuadrados indirectos i y se s dispone de una u estimaciónn única del paarámetro estruuctural, no ess difícil demostrar que la esstimación por mínimos cuaadrados indireectos es idéntiica a la estimaación por variiables instrum mentales eligiiendo como eel instrumentoo a yt. Para obbservar esto, suustituya para πˆ 12 / πˆ 22:
Desafortuunadamente, el ejemplo annterior no puedde generalizarrse. En algunoos casos no sonn posibles los mínimos cuaadrados indireectos, y en otrros conducen a varias estimaaciones de penndiente distintaas. Considerem mos primero el e mismo ejem mplo de ofertaa y demanda ppero suponga que q se desea eestimar el parrámetro de penndiente de la ecuación e de deemanda. Esto implicaría i usarr los parámetrros estimados de d la forma reduucida para obttener una estim mación del parrámetro β2. Peero una revisióón breve al sistem ma de ecuacioones (12.4) mo ostrará que estto es imposiblee; no hay form ma de que el parrámetro estrucctural pueda obtenerse o por medio m de unaa estimación del d sistema de forrma reducida. Sin embargo, considérese el sistema de offerta y demandda cuando la eccuación de ddemanda se ha h modificadoo para incluiir una segundda variable exóg gena W (de riqqueza). Las eccuaciones estru ructurales y lass ecuaciones de d forma reduciida se enumerran a continuaación, con toddas las variabbles medidas en e forma de desvviaciones: Modelo estruuctural:
(12.133)
Modelo de forma fo reducidda:
Una vezz más las ecuuaciones de forma f reducidda pueden serr estimadas een forma consisstente usandoo mínimos cuaadrados ordinnarios. Sin em mbargo, nos ennfrentamos coon dos opciones de estimaadores de penndiente de laa oferta cuanddo intentamos usar u la técnicca de mínimo os cuadrados indirectos. Los L dos estimadores son πˆ 12 / πˆ 22 (com mo antes) y πˆ 13 / πˆ 23. En ggeneral, amboos estimadorees producirán estimaciones e c consistentes d parámetroo verdadero, pero del p las estim maciones no seerán idénticass en cada mu uestra. De estte modo, si inntentamos usar mínimos cuaadrados indirrectos, nos ennfrentaremos con dos opcciones, cualeesquiera de éstas puede impllicar una pérd dida de inform mación importaante respecto al modelo que se está estimando.
CAPÍTULO 12: Estimación de e ecuaciones simu ultáneas
365
En la seccción que siguee describiremo os un procediimiento de esstimación quee ev vita cualquierr pérdida de innformación. Siin embargo, pprimero vale laa pena señalarr q hay un casso especial enn el que los mínimos que m cuadrrados ordinarrios producenn estimaciones de d parámetro consistentes. Decimos quee un sistema de d ecuaciones es recurrente si cada una de las variab bles endógenaas puede determinarse enn fo orma secuenccial y los erroores de cada ecuación sonn independien ntes entre sí. C Consideremos el modelo O Oferta: D Demanda: En la ecuación E n de la oferta la cantidad suministrada s d depende sólo del nivel dell precio en el añño anterior (como podría esperarse e con productos aggrícolas). He-m escrito la ecuación de lla demanda coon Pt como laa variable dependiente paraa mos d demostrar que el precio de mercado del producto estáá determinado o una vez quee see ha suministtrado la cantiddad. Tambiénn hacemos la suposición im mportante dee q Cov(εt, ut) = 0; es decirr, que las dos ecuaciones noo están vinculadas por unaa que co orrelación enntre las variables omitidas. Aunque esste sistema dee ecuaciones puede pareceer simultáneoo, en realidadd es recurrente. Dados los vaalores para Pt - 1 , podemos resolver en forma f directaa para Qt en la eccuación de ofeerta. Entoncess, conocer Qt nnos permite reesolver para Pt en n la ecuación de demanda. Debido a que la variable dee precio está rezagada r en laa eccuación de oferta, no hay h retroalim mentación dirrecta de la ecuación dee d demanda a la ecuación e de oferta. o En cuaalquier modello recurrente de esta clase,, loos mínimos cuadrados c orddinarios (OL LS) es el proccedimiento de d estimaciónn ap propiado. OLS S claramente ees adecuado para p la primeraa ecuación, daado que Pt - 1 ess predeterminada y, por consiiguiente, no está e correlacioonada con εt. OLS tambiénn es apropiado para p la segundda ecuación debido d a que Qt no está co orrelacionadoo coon el término o del error ut (dado que el único ú término de error que afecta a Qt ess εt , y εt no estáá correlacionaado con ut).
12.4
MÍNIMOS CUADRADO C OS DE DOS S ETAPAS Los L mínimos cuuadrados de doss etapas (2SLS S, Two-stage leeast squares) prroporcionan unn
procedimiento p o de estimacióón muy útil paara obtener loss valores de lo os parámetross estructurales en ecuacionees sobreidenttificadas. Laa estimación de mínimoss cuuadrados de dos d etapas utiliza la inform mación disponiible de la espeecificación dee un u sistema de d ecuaciones para obtenner una estim mación únicca para cadaa parámetro p estrructural. De m manera intuitivva, la primeraa etapa de 2SL LS implica laa creación de unn instrumento,, mientras la segunda s etapaa implica una variante de laa estimación dee variables innstrumentales.. Describimoos en forma muy m breve ell fuuncionamientto de 2SLS y delineamos algunas a de suus propiedadees.
366
PAR RTE TRES: Mode elos de ecuaciones s múltiples
12.4.1 1
E Estimación
C Considérese e siguiente m el modelo de ofeerta y demandda. M Modelo estrucctural: Oferta: Demanda:
(12.15))
F Forma reducidda: (12.16)) La L ecuación de d oferta en la ecuación (12.15) ( está ssobreidentificcada en formaa clara, c de moddo que los mínnimos cuadraddos indirectoss no producen n estimaciones de d parámetro únicas. Otro proceso de estimaación recomenndado es el dee las variables instrumentaales. l Sin embaargo, si eligiééramos el enffoque de variiables instrum mentales, tenndríamos d que elegir e entre dos d estimadorres del parám metro α2. (El primero p usaríaa yt como un insstrumento, y eel segundo usaaría wt.) Dadoo que ambos estimadores e dee parámetro p sonn consistentess, necesitamoss un criterio ppara elegir enttre los dos. Unn procedimiento p o razonable ((y eficiente) implica i elegirr como un in nstrumento unn promedio p ponnderado de las dos variablees predetermiinadas, eligieendo los pesos para p maximizar la correlación entre el innstrumento nuuevo y pt. Parra obtener estee instrumento, i t sólo realiizamos la reg tan gresión pt en yt y wt , y calculamos los valores v ajustaados pˆt. El esttimador es obbtenido entoncces como:
De D manera forrmal, el proceeso de mínimoos cuadrados dde dos etapas funciona de laa siguiente s man nera: 1. En la primera etapa, la ecuación de forma rreducida paraa pt cutando laa rregresión de pt en todas laas variables predeterminad p das en el sisttema de ecuaac ciones. A parrtir de la regrresión de la primera etapa,, se determinaan los valores a ajustados de la l variable deependiente pˆ t.3 Los valoress ajustados pˆ t por construccc ción serán inddependientess de los térmiinos del errorr et y ut (estrrictamente haab blando, esta independenciaa sólo se cum mple en muesttras grandes, de modo que
3 A partir dee la ecuación (122.16), p ˆ t = πˆ 22yt + parámetro p de mín nimos cuadradoss ordinarios.
πˆ 23Wt, donde πˆ 22 y πˆ 23 son lass estimaciones dee
CAPÍTULO 12: Estimación de ecuaciones e simulttáneas
367
esttamos obligaddos a dependerr de la propieddad de consisteencia de los 2S SLS). Así, el prooceso de la prrimera etapa nnos permite construir una vaariable que se relaciona en forrma lineal con las variabbles del moddelo predeterrminado (porr medio de esttimación de mínimos m cuaddrados) y quee es depurada de cualquier correlación coon el término del error en lla ecuación de d la oferta. 2. En la reggresión de la ssegunda etapaa, se estima laa ecuación de la oferta del mo odelo estructuural remplazando la variaable pt con laa variable ajuustada de la priimera etapa pˆt. El uso dee mínimos cu uadrados orddinarios en essta segunda etaapa produciráá un estimadoor consistentee del parámetrro de oferta α2. Si aparecieeran variabless predeterminnadas adicionaales en la ecuaación de ofertta, los mínimo os cuadradoss de dos etappas también estimarían e esos parámetroos en forma consistente. Por constru ucción, 2SLS elimina el prroblema de unn suministro excesivo de insstrumentos coon el uso de combinacion nes de las vaariables predeeterminadas paara crear un innstrumento nuuevo.4 Cuandoo una ecuacióón es identificcada exactameente, la estimaación 2SLS es idéntica a lo os mínimos cuuadrados indirrectos y a la esttimación de variables insstrumentales. Para observvar esto, reex xamínese el mo odelo descritoo en las ecuaciiones (12.2) y (12.4). La esttimación 2SLS S procedería dee la siguiente manera: 1. Se usan OLS para esttimar la seguunda parte de la ecuación (12.4). ( Despu ués se calculan n los valores ajustados
2. Se usan OLS para esttimar la ecuacción
En ntonces, usando mínim mos cuadradoos indirectos usando variaables instrumeentales De este mo odo, se obtenddrán estimacioones de parám metro idénticas si la ecuacióón es identificaada exactameente cuando see, usan técnicaas de estimación de 2SLS, míínimos cuadraados indirectoos y de variabbles instrumeentales. En el caso sobreideentificado hem mos visto quee el procedimiiento de mínim mos cuadradoos indirectos yaa no es válido. Sin embargoo, todavía es posible p mostrrar que 2SLS y variables 4 Cuando el núúmero de variablles predeterminadas es bastante ggrande, puede usaarse la técnica de componentes priincipales para redducir la dimensionnalidad del probleema.
368
P PARTE TRES'. Modelos de ecuacion nes múltiples
instrumentalles son proceddimientos de estimación eqquivalentes coon la condicióón de que la priimera etapa dde los mínimoos cuadrados de dos etapas incluya todas las variabless predeterminnadas en el siistema y que el instrumennto usado en el procedimiennto de variablles instrumenntales es el vaalor ajustado de la regresióón de la primerra etapa. ¿Qué le sucede a los 22SLS cuando la ecuación dde oferta no esstá identificadda, por ejemplo,, cuando las variables v y y w aparecen en la ecuación? La respuesta es que cuando la l ecuación noo está identificada, 2SLS es imposible. Esto E es bastannte fácil de visuualizar si uno rrecuerda que la variable deel valor ajustaado usada en la regresión dee la segunda eetapa es un prromedio pondderado de loss valores de las variables predeterminadaas en el sistem ma. En nuesttro ejemplo, la ecuación de d oferta incluyye las variables y y w. Cuanndo se intenta ejecutar la reggresión de qt een pˆt , yt Y wt en e la segunda etapa, la coliinealidad perffecta entre lass variables hacce imposible laa estimación. EJEMPLO O 12.1
Demanda de electricidad
La elasticidaad del precio de d la demandda de electriciddad es un parrámetro políticco importante para p aquellos interesados en e la política de energía de d Estados Unnidos. Una elaasticidad bajaa (en especial a la larga) siggnifica que seerán necesarioos incrementoss considerablees en el preciio para desaleentar la demaanda del consuumidor. El siiguiente modelo de la dem manda de elecctricidad prop porciona dichha estimación de d la elasticidaad del precio..5 El modelo se s especifica como: c
donde Q = promedio p de vventas, anualees de electriciidad residenciial por clientee P = precio p marginal de la electrricidad residenncial (en térm minos reales; es e decir, d deflacioonados por el índice í de Preccios al Consu umidor) Y = ingreso anual pper capita (reeal) G= precio p para toodos los tipos de gas resideencial D= días d por gradoos de calefaccción J = teemperatura promedio p de julio R = porcentaje p de la población que vive en áreas á rurales H = tamaño t promeedio de la cassa
5 Este ejem mplo fue tomado de R. Halvorsen, "Residential Dem mand for Electricc Energy", Review w of Economics and Statistics, vol. 577, pp, 12-18, 19755. Nos hemos tom mado la libertad dee simplificar un pooco el modelo y la presentación p paraa aclarar la exposición.
CAPÍTULO 12: 1 Estimación de ecuaciones simultáneas
369
T= tiem mpo L = costo de la manoo de obra K = porccentaje de genneración prod ducida por instalaciones de d propiedad púb blica F = costto del combustible por kiloovatio-hora de generación I = razó ón de las venttas industrialees totales entrre las ventas residenciales r totaales La primeraa ecuación es una ecuación n de demandda residencial en la que la caantidad demaandada es unaa función dell precio y dee un montón de variables reelacionadas coon la demandda. Sin embarrgo, la segundda ecuación no n es la relación de oferta usual u que se ppuede esperarr; en su lugar se asume quee la oferta de electricidad es fija. La segunnda ecuación surge debido a que la enerrgía eléctrica see vende en blo oques de tarifa fa, con el preccio al consumiidor cayendo conforme se in ncrementa el volumen v de vventas. Por tan nto, el precio de la electriccidad es en sí unna función de las ventas. L Las otras variaables en la ecuuación del preecio se incluyeen para contro olar factores que q afectan al a precio de laa electricidad.. Visto como o un sistema dde ecuacioness, el modelo tiiene dos variaables endógenaas, P y Q, y ess simultáneo, ddado que Q ap parece en el laado derecho de la ecuación deel precio y P aparece en ell lado derecho o de la ecuaciión de demannda. La ecuación de la demaanda es identifficada debido a que hay cincco variables ex xógenas en la eccuación del prrecio (L, K, F,, I, T) que no aparecen en lla ecuación dee la demanda (dde hecho, estáá sobreidentifiicada). La ecu uación del preecio es identifficada debido a que hay cinco o variables exxógenas en la ecuación e de laa demanda (Y Y, G, D, J, H) laas cuales no apparecen en laa ecuación del precio. Ambas ecu uaciones fueron estimadass usando 2SLS. En la prim mera etapa se lleevaron a cabo o regresiones de d las variables endógenass contra todas las variables ex xógenas en el modelo. En lla segunda etaapa las ecuaciones estructuurales fueron esstimadas con el uso de los valores pro onosticados de d la primera etapa como innstrumentos en e lugar de laas variables endógenas dell lado derecho. Los datos soon de una com mbinación dee datos de co orte transverssal y de seriees de tiempo soobre 48 estadoos para los añoos de 1961 a 19 969. Nótese taambién que deebido a que el m modelo es espeecificado en foorma logarítm mica, todos los coeficientes incluyendo el téérmino del precio p son eelasticidades. Los resultaados estimadoos (con los errrores estándaares entre parréntesis) son:
370
PARTE TRES: Modelos de ecuaciones múltiples
Los resultados de la estimación de mínimos cuadrados de dos etapas de la ecuación de demanda muestran que la elasticidad directa a largo plazo de la demanda con respecto al precio de la electricidad es un poco mayor que uno (1.15) en valor absoluto, una elasticidad mucho mayor de la que se habría esperado a corto plazo. Con base en la evidencia detallada de las tendencias en los precios de la electricidad, los resultados sugieren que el crecimiento pasado de la demanda residencial de energía eléctrica se debía en buena parte a la declinación en el precio real de la electricidad. Supóngase que se deseaba examinar el efecto sobre la demanda a largo plazo de un impuesto sobre el uso de electricidad. El impacto inicial será medido por la ecuación de la demanda, pero la ecuación del precio también debe tomarse en consideración ya que mide el efecto secundario en el precio de un cambio en la cantidad comprada. Para medir la elasticidad a largo plazo total de la demanda, y así el cambio a largo plazo en las ventas, la elasticidad debe calcularse a partir de la ecuación de forma reducida. Cuando se calcula a partir de la forma reducida, la elasticidad total resulta ser -3.70, un valor mucho mayor que el efecto directo dado por la ecuación estructural.
12.4.2
Una prueba de simultaneidad
Hemos visto que cuando está presente la simultaneidad, una o más de las variables explicativas será endógena y, por consiguiente, estará correlacionada con el término de perturbación. Por eso, es natural probar la presencia de simultaneidad en la misma forma en que probamos el error de medición en el capítulo 7. Si no hay simultaneidad, los mínimos cuadrados ordinarios generarían estimadores de parámetro eficientes y consistentes. La estimación de variables instrumentales (incluyendo 2SLS), por el contrario, será consistente pero ineficiente. Sin embargo, si hay simultaneidad, los mínimos cuadrados ordinarios serán inconsistentes, mientras que la estimación de variables instrumentales será consistente y eficiente. Podemos formular una versión de la prueba de especificación de Hausman apropiada en el contexto del modelo de oferta y demanda de la ecuación (12.15).6 Supóngase que estamos interesados en estimar la ecuación de la oferta: Oferta:
q t = α 2 p t + εt
Sabemos (por la especificación de la ecuación de la demanda) que yt y wt son exógenas y por consiguiente son elecciones apropiadas para instrumentos. La
6 Esta aplicación particular se basa en D.E. Spencer y K.N. Berk, "A Limited Information Specification Test", Econometrica, vol. 49, pp. 1079-1085, julio de 1981. Véase también J. Kmenta, Elements of Econometrics (Nueva York: Macmillan, 1986), p. 718.
CAPÍTULO O 12: Estimación de ecuaciones simu ultáneas
371
hipótesis h nulaa de no simuultaneidad esppecífica que pt y εt no están e correla-cionadas. Bajoo la hipótesis alternativa están correlaciionadas y se requiere r esti-mación m de varriables instrum mentales. Para realizzar la prueba de Hausman, tomaremos een cuenta la especificación e n de d forma reduucida para pt ddada por la eccuación (12.16). Cuando see estima, éstaa produce: p
d modo que, de
(12.17))
La sustituciónn de la ecuaciión (12.17) en la ecuaciónn de oferta prroduce lo siL g guiente:
Para hacerr la prueba de especificacióón, usamos loss residuales dee la ecuación (12.17) y lueggo estimamos la siguiente ecuación e de rregresión: (12.18)) Bajo B la hipótesis nula de noo simultaneidaad, la correlacción entre el reesidual vˆ2t y ell téérmino del errror εt se irá a cero conform me el tamaño dde la muestra aumente. Porr tanto, cuando o la hipótesis nula se cump ple, la estimaación de la eccuación (12.18) generaará un estimaador consisteente de α2. Siin embargo, por p construc-ción, c δ, la cuaal es igual a α2, también será estimada en forma con nsistente. Porr supuesto s que α2 será estimaada en forma ineficiente, dado d que se haabrá usado unn grado g de liberrtad (innecesaario) para estiimar δ. Esto sugieere una pruebba relativamen nte fácil para la simultaneiidad. Reescri-b bimos la ecuación (12.18), sustituyendo pˆt = pt - vˆ2t: q t = α 2 p t + (δ - α 2 ) vˆ2t +
εt
(12.19))
Bajo B la hipótesis nula, δ= α2, de modo que q el coeficieente en vˆ 2t deb bería ser iguall a 0. Sin embaargo, bajo la hhipótesis alteernativa δ ≠ α2 y el coeficiiente será (enn general) g difereente de 0. Por consigguiente, podeemos probar la l simultaneiddad con un procedimiento p o de d dos etapas simple. Prim mero, llevamoss a cabo la reggresión de p en y y w paraa obtener o los ressiduales vˆ2. Luuego realizamoos la regresiónn de q en p y vˆ2 y realizamoss una u prueba t en el coeficieente de la vaariable vˆ 2. Si estamos inteeresados en laa endogeneidad e d de más de una variablee, el análisiss se vuelve un u poco máss complicado, c p pero puede applicarse una prrueba parecidda. Por últimoo, nótese quee la prueba id déntica puedee realizarse dee una maneraa u poco diferrente. Sustituyya vˆ2t =pt - pˆt en la ecuación (12.19) paara obtener: un q t = δp t - (δ - α 2 ) pˆt +
εt
(12.20))
372
PARTE TRES: Modelos de ecuaciones múltiples
Una prueba t en el coeficiente de la variable pˆ t proporciona la prueba de especificación apropiada. Bajo la hipótesis nula el coeficiente será cero; de lo contrario no lo será.
EJEMPLO 12.2
Gasto público
En el ejemplo 7.3 estimamos un modelo de gastos públicos del gobierno estatal y local (EXP) que tomó la siguiente forma: EXP = β1 + β2AID + β3INC + β4POP + ε donde AID es el nivel de subsidios de ayuda federales, INC es el ingreso de los estados y POP es la población estatal. En ese ejemplo nos interesaba la posibilidad de que AID fuera medida con error. Supóngase que el error de medición no es una preocupación pero que la simultaneidad sí lo es, dado que se considera que AID está determinada por el nivel de gastos públicos (para algunos programas la cantidad de ayuda está relacionada positivamente con el esfuerzo estatal y local en recaudar fondos). Por consiguiente, AID puede estar determinada por la misma EXP al igual que por la población de niños de primaria y secundaria (PS). Si el modelo es simultáneo, la segunda ecuación en el sistema que determina EXP y AID está dada por: AID = γ1 + γ2EXP + γ3PS + u Para probar la simultaneidad con respecto a la variable AID, procedemos como sigue. En la primera etapa se lleva a cabo la regresión de AID en INC, POP y PS (la forma reducida) y se calcula la variable residual ŵ (las estadísticas t están entre paréntesis): ŵ = AID - 41.61 + .000036INC + .175POP - .833PS (.84)
(2.72)
(1.39)
(-2.16)
R2 = .93
En la segunda etapa se agrega ŵ a la regresión original para "corregir" la simultaneidad. La ecuación que resulta es: EXP = -89.41 + 4.50AID - 1.39ŵ + .00013INC - .518POP (-1.04)
(5.89)
(-1.73)
(3.06)
(-4.63)
R2 = .99
Una prueba t bilateral de la hipótesis nula de que no hay simultaneidad sería rechazada en un nivel del 10%. Sin embargo, no sería rechazada en el nivel del 5%. Una comparación del modelo corregido con la versión de mínimos cuadrados del ejemplo 7.3 demuestra que cuando es tomada en cuenta la simultaneidad, la variable AID se vuelve menos significativa pero es mayor en magnitud.
CAPÍTULO 12 2: Estimación de e ecuaciones simulttáneas
12.5
373
ESTIMACIÓ ÓN DE ECUA ACIÓN SIMU ULTÁNEA CON C CORRE ELACIÓN SERIAL S Y VA ARIABLES DEPENDIENT D TES REZAGA ADAS
Muuchos modeloos contienen vvariables dep pendientes rezzagadas para explicar los ajuustes que tienen lugar con el paso del tiempo. OLS generan g estim madores consisstentes pero sesgados cuanndo hay variaables dependiientes rezagaddas siempre que no esté preesente una coorrelación seriial. Pero la correlación seerial es muy com mún en modeelos de series de tiempo y, por desgraciaa, ni los OLS ni los 2SLS sonn consistentess cuando la eecuación que se va a estim mar contiene una u variable dep pendiente rezzagada y el térrmino del erroor está correlaacionado seriaalmente. En estta sección suggerimos por quué tanto OLS como 2SLS sson inconsisteentes y en el últtimo caso suggerimos el usoo de un estimaador consistennte alternativo propuesto oriiginalmente por p Fair.7 Para comennzar, considérrese el siguiennte modelo de ecuación senncilla (en el quue las variablees aparecen enn forma de deesviaciones): (12.21) Enn general, si se s usaran mínnimos cuadraados ordinarios para estim mar el parámeetro de pendieente, se obtenndrían resultaddos inconsisteentes y sesgaddos. Recuérdese que:
Laa covarianza de d yt - 1 y εt no es cero, dado o que
Peero Poor consiguientte, (12.22)
7 R.C. Fair, "Thhe Estimation of Simultaneous S Equ uation Models witth Lagged Endogeenous Variables and d First Order Seriially Correlated E Errors", Econometrica, vol. 38, pp . 507-516, mayo de 1970.
374
PARTE TRES: Mod P delos de ecuacion nes múltiples
La razón de esta covariannza con la varrianza de yt - 1 no será cero aun sin correelación serial. (Cuando ρ = 0, βˆ estará sesgada debiddo a que E[C Cov(yt - 1, εt)/V Var (yt - 1)] no seerá igual a 0.)) De este moddo, la presenccia de correlacción serial y una u variable deppendiente rezzagada hace que el estim mador de mín nimos cuadraddos ordinarios seea sesgado e inconsistentee. De manera intuitiva, la presencia p de correlación serrial y una vaariable dependiente rezagaada produce un u problema de identificacióón del parám metro. Si los mínimos m cuaddrados ordinaarios se utilizzan para estimarr la ecuación (12.21), será imposible deecir en qué medida m la estim mación del paráámetro reflejaa la presenciaa de una pendiiente que no es e cero y en qué q medida hay correlación serial en el moodelo. Ahora consideremos c lo que sucedee en un modeelo de ecuacioones simultáneas en el que haay una variabble dependiennte rezagada y correlación serial. Para hah cerlo, reexam minaremos unn modelo de oferta o y demaanda básico enn el que la ecuuación de la offerta es identifficada y contiiene un términno del error au utorregresivo.. El modelo estáá dado (en forrma de desviaaciones) por: Oferta:
(12.23) (12.224)
Demanda:
(12.225)
donde ut y vt son indepenndientes con el e tiempo y noo están correllacionadas enntre sí. Si sustiituimos la eccuación (12.24) en la ecuación (12.23)) y resolvem mos, obtenemos: (12.26) Supóngase inicialmente i qque se conoce ρ. Dado que pt es endógenna, la estimacción OLS de la ecuación e (12..26) generará una estimaciión inconsisteente de α2. Pero un procedim miento 2SLS que remplazza pt con un iinstrumento pˆ t (obtenido de llevar a caboo la regresiónn de pt en qt – 1, qt - 2 y yt ) será consistennte dado que por p construcción n pˆt no estará correlacionadda con vt. Sin embargo, deb bido a que noo se conoce ρ, debemos d expllicar la posib bilidad de quee nuestra estiimación del coeficiente dee correlación serial, r, no será igual a ρ. En este caso c la ecuación (12.26) se vuuelve:
Ahora, un u procedimiento 2SLS quue remplaza pt con pˆt ya no n es consisteente debido a que εt - 1 está ccorrelacionadoo con pt - 1 y eesta correlacióón no se elim mina cuando pt es e remplazadaa con su instruumento.
CAPÍTULO 12: 1 Estimación de ecuaciones simultáneas
375
Para obtenner un estimaddor consistennte, Fair propoone el siguiennte procedimiento: Prrimera etapa: estimaremoss la ecuación de d "forma reduucida" (12.28) y calcularemoss los valores pronosticados p pˆt . Seegunda etapa:: estimaremoss la ecuación "estructural" " m modificada (12.29) do onde ŵt = pt - pˆt es el residdual de la regrresión de la pprimera etapa. Esto puede haacerse usandoo un método de Hildreth-L Lu u otro sim milar que realiice una búsqu ueda sobre r para p encontraar el valor quee minimiza laa suma de ressiduales cuadrrados. Para mostrrar por qué este procedimieento generaráá un estimadorr consistente paara α2, reescriibimos la ecuaación (12.23) rezagada un periodo: (12.30) Poodemos ver quue εt - 1 y ŵt noo están correlacionados debbido a que cad da una de las vaariables del laado derecho een la ecuaciónn (12.30) aparrece en la reg gresión de la prrimera etapa. Además, εt - 1 y vt no están correlacionaddos por supossición. Como reesultado, la suuma de residuuales cuadrado os en la ecuacción (12.29) será s minimizaada cuando r = ρ. El térm mino del errorr resultante, vt +α2ŵt , no estará e correlacionado con el e lado derechho de la ecuación (12.29) poor las razones establecidas anntes (recuérdeese qué los residuales de la primera ettapa ŵt no esstarán correlaacionados conn los regresorees de la primeera etapa). Obsérvese que es importtante que pt - 1, qt - 1 y qt - 2 see utilicen en laa regresión de la primera etappa. Si no es aasí, ε t - 1 y ŵt no estarán coorrelacionadoos, y la suma m mínima de resiiduales cuadrrados no se logrará cuanddo r = ρ. De manera más geeneral, si se ha h de lograr laa consistenciaa, es esencial cuando se applique el métoodo de Fair inccluir como "instrumentos" en la primeraa etapa la varriable dependiiente rezagada al igual quue los valoress rezagados ((un periodo) de todas las vaariables endóggenas y exógeenas incluidass. (La variablee dependiente rezagada en el lado derechoo ahora estaráá rezagada doos periodos.) El procediimiento de Faair con frecuuencia es de valor cuando o se estiman modelos m de eccuaciones sim multáneas. Ilu ustramos su uuso en un moodelo macro peequeño en el apéndice a 14.11. 1 2.6
MÉTODOS S DE ESTIM MACIÓN MÁ ÁS AVANZA ADOS Nos N hemos conncentrado hassta este punto en modelos dde dos ecuacioones que son dee naturaleza simultánea. s E En la primeraa parte de estaa sección máás avanzada
376
PARTE TRES: Mod delos de ecuacion nes múltiples
describiremoos un modeloo que puede estimarse e de m manera eficieente cuando se s trata como un u sistema de ecuaciones. En E la segundaa parte describbiremos proceedimientos dee estimación qque son consiistentes y eficcientes ya sea que el sistem ma de ecuacionees sea en verdaad simultáneo o no. Algunoss comentarios breves sobre la elección de procedimiento p os de estimaciión aparecen en la tercera subsección. s
12.6.1
E modelo aparenteme El a ente no rela acionado
El modelo ap parentemente nno relacionadoo (SUR, seem mingly unrelateed model) es uun
modelo recuurrente que occurre de maneera ocasional en el modelaamiento de neegocios y ecoonómico. Consiste de una serie s de variabbles endógenaas que son connsideradas como un grupo debido a quee tienen una rrelación conceptual estrechha entre sí. Un ejemplo de uun modelo así es:
Las ecuaciones repreesentan un coonjunto de dos d ecuacionees de demandda para productoos relacionadoos. De hecho, si las perturbbaciones de caada ecuación no n están correlaacionadas, no hay relación entre las ecuaaciones y la estimación OL LS es apropiadaa. Sin embargoo, si los térmiinos del errorr están correlaacionados, pueeden obtenersse estimacionnes eficientess usando una técnica de estimación e máás compleja, coomo lo expondremos en la siguiente subbsección.
12.6.2
E Estimación de sistemas s de ecuaciones
Los estimado ores de mínim mos cuadrados de dos etapaas y de variab bles instrumenntales producen estimacionnes de parám metro consistenntes cuando los l sistemas dde ecuaciones son s simultáneoos. Sin embarrgo, como unaa regla generaal, cada técnicca de estimación produce esttimaciones ineeficientes debbido a que estaas técnicas sólo se aplican a una ecuaciónn sencilla den ntro del sistem ma de ecuacioones. Por tantto, toman en cuuenta el hechho de que un na o más variiables predeterminadas soon omitidas de la l ecuación quue se va a estim mar, pero no sse toma en cueenta el hecho de d que también puede haaber variablees predeterm minadas omittidas de otraas ecuaciones. Una U fuente allternativa de ineficiencia i suurge debido a que la estimación de una sola ecuaciónn sencilla no explica e la corrrelación de eccuación cruzadda entre erroress. En cualquieer caso, el prooblema de la pérdida de efficiencia puedde resolverse usando cualquuiera de los varios v métodoos para estim mar sistemas de d ecuaciones en e los que los parámetros p paara todas las eecuaciones son n determinadoos en un solo procedimientoo. Una form ma útil de enttender las com mplejidades dde la estimaciión de sistemaas es comenzarr con el casoo especial en el que hay uuna correlacióón del error de d ecuación cru uzada pero dee otro modo no hay simultaaneidad. Por tanto, t tratamoos
CAPÍTULO 12: 1 Estimación de ecuaciones simultáneas
377
el modelo SUR R, el cual consiste de una seerie de ecuacioones que estánn vinculadas po orque los térmiinos del error a lo largo de las ecuacioness están correlaccionados.8 El méétodo SUR im mplica estimaación de mínim mos cuadradoos generalizaddos (véase el appéndice 6.1) y logra una meejora en la efi ficiencia tomaando en cuentta de manera exxplícita el heccho de que laas correlacionnes del errorr de ecuacionnes cruzadas pu uede no ser ceero. Para ver có ómo y por quué funciona ell estimador, cconsidérese el modelo de do os ecuaciones:: y 1 = αx + u 1 y 2 = βz + u 2 Sii los términos del error en las dos ecuacciones no estáán correlacionnados, obtendrríamos estimaaciones eficieentes de α y β realizandoo estimación de mínimos cuuadrados ordin narios en cadda ecuación seeparada, usanndo N observaaciones para caada regresión. Sin embargoo, bajo la supoosición de quee u1 y u2 están n correlacionaadas para uniddades idénticaas de corte tran nsversal, podeemos mejorar la eficiencia dee mínimos cuaadrados ordinnarios al escrib bir el sistemaa de ecuacionees como una eccuación combbinada, estim mando esta eccuación con el uso de estimación de mínimos cuadrados generaliizados. Para escrib bir el sistemaa como una eccuación grande en lugar de d dos ecuacioones pequeñaas, es necesarrio distinguir entre observvaciones asocciadas con la prrimera ecuacióón y observacciones asociad das con la seguunda ecuaciónn. Para hacer esto debemos reclasificar r lass observacionnes, asignandoo de manera arbitraria a las obbservaciones 1 a N a las vaariables de la primera ecuaación y las ob bservaciones N + 1 a 2N a las variabless de la segunnda ecuación. Ahora definnimos cuatro vaariables nuevaas:
Coon esta nuevaa notación puuede escribirsee la ecuación combinada
Laa aplicación del procedim miento de mín nimos cuadraados generalizzados a esta eccuación nos permite p obteneer estimacionnes de parámeetro para α y β. β Ya que el 8 Véase A. Zeellner, "An Efficient Method of Estimating E Seemiingly Unrelated Regressions R and Teests for Aggregatio on Bias", Journal of the American Statistical S Association, vol. 57, pp. 348-368, 3 1962.
378
PARTE TRES: Mod P delos de ecuacion nes múltiples
álgebra impllicada es conssiderable (a peesar del hechoo de que estam mos trabajanddo con los datoss en forma dee desviacioness), aquí sólo presentamos p l resultadoss: los
donde
Este ejemploo es instructiivo, debido a que nos perrmite ilustrarr los dos casoos importantes en los que la eestimación SU UR y la estimaación de míniimos cuadradoos ordinarios soon idénticas. L La primera sittuación, y la más m obvia, occurre cuando la covarianza de d ecuacioness cruzadas es idénticamentte 0 (σ12 = 0). 0 La segundda situación, meenos obvia, oocurre cuando las dos variaables explicatiivas (x y z) soon idénticas. Loos detalles dee estas derivacciones se dejaan al lector. La aplicaación de míniimos cuadrad dos generalizados necesita la l obtención de d estimacioness de las covarrianzas del errror entre ecuuaciones. Estaas estimacionees se obtienen estimando prrimero cada ecuación e senccilla con el uso de mínimoos cuadrados orrdinarios. Lass varianzas y covarianzas de los residuuales estimadoos proporcionann, entonces, estimadores e coonsistentes dee las varianzass y covarianzas del error. En el ejemploo de dos ecuaaciones estim maríamos σ21 , σ22 y σ12 de la siguiente maanera:
Como una cuuestión práctiica, la estimacción SUR es un u procedimieento de estim mación de dos etapas. See puede mosstrar que es consistente al igual quue (asintóticam mente) eficientte. Tambiénn se puede loggrar una ganaancia en eficiencia aplicanndo métodos de d estimación de d sistemas a modelos dee ecuaciones simultáneas. La extensióón natural de la estimación SUR S es la técnnica de mínim mos cuadradoss de tres etapaas (3SLS).9 3SL LS implica la aplicación dee estimación dde mínimos cuadrados genneralizados a un u sistema dee ecuaciones,, cada una dee las cuales se s ha estimaddo primero usanndo 2SLS. Enn la primera ettapa del procee.so se estimaa la forma reduucida del sistema de modeloos. Los valorees ajustados dee las variabless endógenas see 9 Véase A. A Zellner y H. Theil, "Three-S Stage Least Squuares: Simultaneous Estimation of Simultaneous Reelations", Econom metrica, vol. 30, pp. p 54-78, 1962.
CAPÍTULO 12: 1 Estimación de ecuaciones simultáneas
379
ussan luego paraa obtener estim maciones 2SL LS de todas lass ecuaciones en e el sistema. Unna vez que se han calculadoo los parámetrros 2SLS, se usan u los residuuales de cada eccuación para estimar e las vaarianzas y cov varianzas de ecuaciones cruuzadas, igual quue en el proceso de estimaación SUR que q se describbió antes. En la tercera y últtima etapa deel proceso dee estimación, se obtienen las l estimacionnes de parámetro de mínim mos cuadradoos generalizaddos. Se puedee demostrar que q el procedim miento 3SLS S produce esttimaciones dee parámetro más m eficientees que 2SLS deebido a que tooma en cuentaa la correlacióón de ecuacioones cruzadass. Si se consiidera aplicar 3SLS, maniffestarán ser valiosos varioss detalles de innformación. Primero, P todaas las identidades deben eeliminarse deel sistema de eccuaciones antees de que se use u el proceso o de estimacióón. Segundo, la l aplicación dee la tercera ettapa del proccedimiento noo alterará las estimaciones 2SLS en el caaso especial enn el que todass las covarian nzas dé ecuaciones cruzadaas son 0. Por último, cualquiier ecuación que q no esté id dentificada deebe eliminarsee del sistema dee ecuaciones antes de qque se apliquuen los 3SL LS. (Recuérdeese que las esstimaciones de d parámetro de 2SLS no pueden obtennerse para eccuaciones no identificadas.)
EJEMPLO 12 2.3
As sistencia públic ca
Ell crecimiento de los pagoss de beneficeencia pública ha sido aten ndido por los ecconomistas prrofesionales desde d hace muucho. En un intento i por in ncrementar el co onocimiento del d problema de la beneficcencia públicaa, Brehm y Saaving usaron daatos estatales para estudiarr la demanda de asistencia pública.10 See recopilaron daatos sobre el número de receptores de d asistencia general en una u base de prromedio por mes, m en formaa anual por estado e para el periodo 1951-1959. Una eccuación que se estimó es dde la siguientee forma:
do onde i = 1,2, …, 48 se reffiere a las obsservaciones enntre estados j = 1, 2,, ..., 9 se refiere a observaaciones a lo llargo del tiem mpo Nij = porccentaje de la ppoblación dell iésimo estaddo que recibióó pagos de asisttencia generall (GAP) en el jésimo año Pij = prom medio mensuaal de GAP enn el iésimo esttado para el jéésimo año Wij = prom medio mensuaal de salarios por manufacttura en el iésiimo estado paraa el jésimo añño Uij = tasaa de desempleo en el iésimoo estado para el jésímo añoo Aij = emp pleo no agrícoola como porccentaje de la ppoblación en el e iésimo estado para el jésimo añoo
10 C.T. Brehm m y T.R. Saving, "T The Demand for General G Assistancce Payments", Ameerican Economic Reeview,vol. LIX, ppp. 1002-1018, 19664.
380
PARTE TRES: Modelos de ecuaciones múltiples
Brehm y Saving pudieron predecir que el porcentaje de la población que recibió asistencia se relacionaría en forma directa con los pagos de asistencia mensual promedio y se relacionaría en forma inversa con la tasa de salarios actual. El último resultado se espera debido a que mayores salarios implican un mayor costo de la oportunidad de elegir si se recibe asistencia pública en lugar de trabajar. La tasa de desempleo aparece en el modelo debido a que mide el número de individuos cuya alternativa para la asistencia general es un salario cero (o muy bajo). Se podría esperar que las tasas de desempleo y las tasas de receptores de asistencia pública estuvieran relacionadas en forma positiva. Por último, la tasa de empleo no agrícola se incluye como una variable sustituía por la facilidad de obtener nóminas de asistencia general. Se espera que el coeficiente sea positivo ya que estudios previos han demostrado una relación directa entre el grado de urbanización en un estado y la tasa de receptores de asistencia de ese estado. Brehm y Saving estaban interesados en los vínculos potenciales que podrían existir entre las nueve relaciones de corte transversal individuales. El vínculo primario es generado por el efecto de la migración de individuos de estados con nivel de asistencia general bajo a alto que tuvo lugar durante un periodo de años. Debido a que no se incluyeron rezagos de manera explícita en el modelo, es razonable esperar que los términos de perturbación para un estado en un año dado se relacionarán en forma positiva con los términos de perturbación para ese estado en años anteriores al igual que en los futuros. Brehm y Saving decidieron mejorar la eficiencia del proceso de estimación usando la técnica SUR en lugar de mínimos cuadrados ordinarios. Los resultados de sus estimaciones se enumeran en el cuadro 12.1. El término P/W, por lo general, es el más significativo de todas las variables (significativamente diferente de 0 en el nivel del 5% en todos los casos excepto uno). En todos los casos el coeficiente tiene el signo esperado. El coeficiente de la variable de desempleo es significativo en tres de los nueve años, aunque tuvo un signo inesperado sólo una vez. Por último, la variable sustituía para la facilidad de convertirse en un receptor de asistencia general tuvo el signo esperado CUADRO 12.1 RESULTADOS DE ESTIMACIÓN APARENTEMENTE NO RELACIONADA Constante Año
P/W Coeficiente
U
Coeficiente
SE
SE
1951 1952 1953 1954
-.730 -.812 .067 -.139
.481 .423 .555 .499
.068 .031 .080 .100
.024 .019 .025 .018
.141 .195 .093 .044
1955 1956
-.224 .210
.504 .498
.096 .072
.018 .017
-.042 .040
A
Coeficiente SE
Coeficiente
SE
.067 .051 .076 .038
.064 .066 .017 .025
.016 .014 .019 .017
.051 .046
.043 .025
.016 .014
1957
.286
.537
.073
.017
.058
.039
.019
.016
1958 1959 Media
-.880 -1.030 -.361
.832 .901 .078
.082 .095 .103
.025 .027 .040
.179 .218
.055 .089
.054 .051
.029 .033
CAPÍTULO 12: 1 Estimación de e ecuaciones simu ultáneas
381
enn todos los cassos y es signiificativamentee diferente dee 0 en cuatro de d los nueve caasos. Los resuultados del esstudio dan appoyo adicionaal a la opiniónn de que las vaariables relaciionadas con el e ingreso com mo la razón dee los pagos poor asistencia enntre la tasa sallarial son deteerminantes im mportantes de los niveles de d recepción. Laas variables reestantes tienenn un efecto unn poco menor. Brehm y Sav aving concluyeeron que los reeceptores de aasistencia gen neral no son diiferentes de laa mayoría de los consumidorres en el senntido de que reaccionan r enn formas esperadas a los inccentivos econnómicos que existen. e
EJEMPLO 12 2.4
Mo odelo macroec conómico
En n su artículo original que trataba de la estimación de d mínimos cuadrados de trees etapas, Zelllner y Theil proporcionarron un ejempllo imaginativvo ilustrativo enn el que se com mparan estimaaciones de 2SL LS y de 3SLS S de un modello macroeco1 nóómico simple.11 El modelo, conocido com mo Modelo I dde Klein, inclu uye tres ecuacioones conductuuales y tres iddentidades.12 Las L ecuaciones conductualles son de la sigguiente maneera: Coonsumo: In nversión: Demanda de mano m de obra:
do onde C = connsumo П= ganaancias W1 = factturación de saalarios privado os W2 = factturación de saalarios gubern namentales I = inveersión G = gasto gubernameental K = reseervas de capittal Y = ingrreso nacional T = imp puestos indireectos t = tiem mpo, años Laas tres ecuaciiones conducttuales están vinculadas v poor tres identidades:
11 12
Zellner y Thheil, op. cit. Tomado de L.R. Klein, Econoomic Fluctuationss in the U.S., 1921-1941 (Nueva Yorrk: Wiley, 1950).
382
PARTE TRES: Mo odelos de ecuacion nes múltiples
CUADRO 12.2 ESTIMACIONE ES DE PARÁMETROS DE MÍNIM MOS CUADRAD DOS DE TRES ETAPAS E YDE DOS ETA APAS
En total, el modelo m incluyye seis variab bles endógenaas y ocho variiables predeteerminadas. Las tres ecuacioones conductuuales están soobreidentificaadas. Los resuultados de las estimaciones e de 2SLS y 3S SLS se proporrcionan en el cuadro c 12.2. El E lector deberáá poner atencción particulaar en las variaanzas de los estimadores e dde coeficiente asociados a conn ambos proccesos de estim mación. En todos los casoos (como lo garrantiza el procceso de estim mación), las esstimaciones de d parámetro de d 3SLS tienenn varianzas menores que suus contrapartees de 2SLS. La L ganancia en e eficiencia associada con 3S SLS, por lo general, g está en la vecindadd del 5%.
12.6.3
C Comparació ón de estim madores altternativos
Ahora se ha completado c unna revisión enn conjunto de vvarios de los procedimiento p os de estimació ón de una soola ecuación y de sistemaa. Es útil haacer una paussa momentáneaa y preguntarnnos cómo haccer la seleccióón entre las téécnicas alternativas de estim mación. La reespuesta es diffícil por dos rrazones. Primera, la eleccióón de un proced dimiento de estimación e puede dependerr en parte del propósito parra el que se usarrá el sistema dde ecuacioness estimado. Enn el capítulo 13, por ejemplo, veremos quee la elecciónn de una técnnica de estim mación puedee tener efectoos considerablees en las propiiedades dinám micas del moddelo estimadoo. Segunda, laa
CAPÍTULO 12: Estimación de ecuaciones simultáneas
383
mayor parte de nuestro conocimiento sobre las propiedades de estimadores se relaciona con muestras grandes; es decir, sabemos que estos estimadores serán consistentes y (en ocasiones) asintóticamente eficientes. Sin embargo, sabemos poco sobre las propiedades de estos estimadores en muestras pequeñas. Algunos estudios de muestra pequeña examinan la sensibilidad de parámetros estimados ante diferentes técnicas de estimación usando datos del mundo real y modelos desarrollados previamente, mientras que otros aplican las técnicas de experimentación Monte Carlo a estructuras de modelos artificiales conocidas. Aunque los resultados de los estudios son variados y difíciles de resumir, vale la pena mencionar algunas de las cuestiones que se presentan a partir de ellos. Dado un sistema verdadero de ecuaciones simultáneas, sabemos que la estimación de mínimos cuadrados ordinarios es inconsistente al igual que sesgada. Los mínimos cuadrados de dos etapas y las variables instrumentales proporcionan estimadores consistentes de los parámetros de modelos de una sola ecuación, pero también son sesgados. Por otra parte, los estudios sugieren que las estimaciones de 2SLS tienen una varianza mayor que las estimaciones de OLS. De este modo, si el criterio de uno es minimizar el error cuadrático medio (el cual combina sesgo y varianza), es concebible que la estimación OLS será más adecuada que la de 2SLS y otras técnicas consistentes para modelos de una sola ecuación. No obstante, los estudios también sugieren que los métodos de estimación de sistemas producen estimaciones de varianza menor que los métodos para una sola ecuación. Puesto que la mayor parte de los paquetes de cómputo permiten el uso de estimación de mínimos cuadrados generalizados, no es inusual que uno tenga que pagar el costo agregado de realizar la estimación SUR y 3SLS. Sin embargo, la dificultad con todas las técnicas de estimación de sistemas, es que las estimaciones de parámetro individuales (por construcción) son sensibles a la especificación del sistema del modelo entero. Un error de especificación serio en una ecuación puede afectar las estimaciones de parámetro en todas las ecuaciones del modelo. Así, la decisión de usar estimación de sistemas implica un intercambio entre la ganancia en eficiencia y los costos potenciales del error de especificación.
APÉNDICE 12.1 El problema de la identificación en forma matricial Representación del modelo de ecuaciones simultáneas Para considerar el problema de identificación en su forma más general, necesitamos distinguir entre variables endógenas y exógenas al igual que entre formas estructurales y reducidas. Asumimos que el modelo bajo investigación consiste de G ecuaciones. Cada ecuación contiene G variables endógenas (algunas pue-
384
PARTE TRES: Mo odelos de ecuacion nes múltiples
den tener coeeficientes quee se sabe son iguales a 0), K variables prredeterminadaas y un términoo del error disstribuido en foorma aleatoriaa. Escrita ecuaación por ecuación, la form ma estructural del modelo es:13
para i = 1, 2,, .. ., N. Comoo se señaló enn el texto, las y son variablees endógenass y las x son lass variables prredeterminadaas. En cada eecuación alguunos de los cooeficientes son n iguales a 0, y se elige que una de las vvariables endóógenas tenga uun coeficiente de d 1. La variabble con el coeficiente 1 es vvista como la variable v depenndiente. El coonjunto de ecuaciones daddo antes puedee escribirse en e forma matrricial como:
donde yi = vector v G x 1 de d variables enndógenas xi = vector v K x 1 de d variables predeterminad p das ui = vector v G x 1 dde términos de d perturbacióón B = matriz m G x G de coeficientes de variablee endógena Γ = matriz m G x K de coeficienttes de variable predeterminnada Si se dessea incluir toddas las N obseervaciones dissponibles parra cada y y cadda x y usar la notación matriicial, podemo os reescribir eel modelo com mo: BY + ΓX = U
(A12..2)
13 Hemos elegido una notaación que es casi consistente con la notación usadaa en otros libros de texto de econom metría. En esta nootación las letrass minúsculas no implican i que las variables se midden como desviacion nes alrededor de ssus medias. Véasee para mayores deetalles F.M. Fisheer, The Identificatiion Problem in Econ nometrics (Nueva Y York: McGraw-H Hill, 1966).
CAPÍTULO 12 2: Estimación de ecuaciones e simulttáneas
385
donde Y = matrriz G x N X= matrriz K x N U = matrriz G x N
La ecuaciónn estructural coontiene G ecuuaciones y G ddesconocidos. Si se conocenn todas las β y γ, podemos resolver para los valores dee cada una de las y, dados vallores de las x predetermina p adas. Para hacerlo, asumim mos que B no es e singular y ressolvemos parra obtener laa representaciión de formaa reducida del d modelo. Preemultiplicando o ambos ladoos de la ecuaciión (A12.1) ppor la matriz B- 1, obtenemoos: o donde π = - B- 1ui es una maatriz G x K dee coeficientess de forma redducida
y v, v = - B- 1Γ es un vector G x 1 de perturb baciones de foorma reducidaa. La forma redducida del mo odelo es:
Enn función de to odas las N ecuaciones, rescribiríamos el e sistema de ecuaciones e com mo; Y = πX + V doonde Y = matrriz G x N π = matrriz G x K
X = matriiz K x N V = matriiz G x N
(A12.3)
386
PARTE TRES: Mo odelos de ecuacion nes múltiples
Para compleetar nuestra descripción deel modelo de ecuaciones siimultáneas, nen cesitamos esspecificar las ssuposiciones que q implican el término deel error ui. Asu umiríamos qu ue: E( ui) = 0 y
E(uiu′i) = Σ
donde Σ es una u matriz G x G de varianzaas y covarianzzas entre térmiinos del error d de observaciones idénticas eentre ecuacion nes. También suponemos que: q
Esta suposicción elimina to odas las correelaciones entree errores asocciadas con differentes observ vaciones tanto o dentro de laas ecuaciones como entre diferentes d ecu uaciones. También n es útil relaccionar el térm mino del error de la forma reducida r con el término del error estructu ural. Los erro ores de la forrma reducida tienen mediaa 0 dado que:
La matriz dee varianza-co ovarianza de los errores en forma reduciida Ω es: (A12.4) Condicionees para la ideentificación La presenciaa de variables endógenas e en el lado derech ho en el modello de ecuacion nes simultáneas indica que llas estimacion nes de OLS de la forma estructural del d modelo pued den ser incon nsistentes. Sin n embargo, lass estimacionees de OLS de la forma reduccida serán con nsistentes, yaa que sólo apaarecen variab bles predeterm minadas en el lado derecho o de las ecuaaciones de fo orma reducidaa. Por tanto, es natural preg guntar si es p posible obteneer informació ón acerca de parámetros ese tructurales, dadas las esttimaciones co onsistentes dee parámetros de forma red ducida. El prob blema de exp presar las β y γ en función de los coeficiientes de form ma reducida (lass π) es el prob blema de iden ntificación. Diiríamos que un u parámetro ese tructural es identificado si s y sólo si pu uede ser deterrminado de manera m única del d conjunto de parámetros d de forma redu ucida. En nuesstra notación el e vínculo enttre las formas estructural e y rreducida es prroporcionado por dos ecuaaciones:
π = - B- 1Γ
(A12.5)
Ω = - B- 1 Σ(B')-1
(A12.6)
CAPÍTULO 12: Estimación de e ecuaciones simultáneas
387
Ell conocimientto de la formaa reducida es proporcionado p o por los elem mentos G x K dee π. Desafortuunadamente, una de nuestrras metas es determinar loos elementos G x G de B y los elementtos G x K de d Γ. Para estto, lo que see requiere es innformación reespecto a laas restriccionnes en los pparámetros de d la forma esstructural. Laas restriccioones pueden implicar reelaciones linneales entre paarámetros estrructurales al igual que restricciones enn elementos de la matriz vaarianza-covariianza de las perturbacione p s estructuralees. Nos enfocaaremos en la foorma más prevaleciente dee restricción de d la identificcación: la resttricción cero enn los parámetrros de la form ma estructurall. Nos concenntraremos, sinn perder la genneralidad, en la identificaciión de la prim ecuación. Además, asuumimos que las variables ccon restriccionnes de coefimera cieente 0 están ag grupadas desppués de las varriables con coeficientes quee no son cero. Asumimos quee de las G variiables endógeenas en la prim mera ecuación n, la primera G* tiene coeficiientes que no son cero, mieentras que se ssupone que laa restante G** tieene coeficienttes 0. Ademáás, K0 de las variables v preddeterminadas tienen t coeficieentes que no son cero, mieentras que K00 son iguales a 0. En otras s palabras, la 0 prrimera ecuacióón tiene G** variables v endóógenas excluiddas y K00 variiables predeterrminadas exclluidas. La prim mera ecuaciónn puede escribbirse, entoncees,
Es útil represen ntar la ecuación como: (A12.7) do onde y* = vecctor G* x 1 dee observacion nes en variablees endógenass incluidas y** = veector G** x 1 dde observacion nes en variablles endógenass excluidas β* = veector 1 x G* dee coeficientess que no son cero c β** = veector 1 x G** de d ceros
γo = veector 1 x Ko dee coeficientes que no son ceero γ00 = vecctor 1 x Koo de ceros x0 = vecctor Ko x 1 dee observacionnes en variabbles predeterm minadas incluuidas x00 = vecctor Koo x 1 dee observacionnes en variablees predetermin nadas excluuidas
388
PARTE TRES: Mod delos de ecuacion nes múltiples
Eliminando el subíndice i para simpliificar la notacción, podemoos reescribir la l primera ecuaación como: (A12.88) eliminando lo os términos con c coeficientees 0. Usando una notaciónn similar, podeemos reescribbir la ecuaciónn de forma redducida como::
En la matriz dividida de ccoeficientes de d forma reduucida el primeer subíndice se s refiere a las variables v endóógenas y el seegundo se refi fiere a las variiables predeterminadas: π* ,0 = matriz G* x Ko π* ,00 = matriz G* x Kooo π** ,0 = matriz G** x Ko π** ,00 = matriz G** x Koo v* = vector G* x 1 de las prim meras G* pertuurbaciones dee la forma reduucida v** = vector G** x 1 de las restaantes perturbaaciones de la forma f reducida Ahora se pueede examinarr las condicion nes que son nnecesarias y suficientes s parra identificar loos parámetross estructuralees. Para hacerrlo, reescribirremos la ecuaación (A12.5)) como: Bπ = -Γ
(A12.99)
y luego reesccribimos la eccuación (A12.9) sólo en funnción de la prrimera ecuacióón del sistema de d ecuacioness simultáneass:
Es útil dividdir la ecuaciónn previa en suubecuaciones separadas: (A12.100) (A12.l l) Previamente normalizamoos una de las β en la primera ecuación para que fuerra igual a 1. Enntonces, la ecuuación (A12.10) tiene G* - 1 β desconocidas y K0 γ deesconocidas. La L ecuación ((A12.ll) sólo incluye las G* - 1 β descconocidas. Noos enfocaremos por el momennto en la segu unda ecuación,, la cual consisste de K00 ecuaaciones indiviiduales. Sabem mos que una condición c neccesaria para laa existencia de d
CAPÍTULO 12: Estimación de ecuaciones simultáneas
389
una solución para la ecuación (A12.11) es que haya al menos G* - 1 ecuaciones. Esto conduce en forma directa a la condición de orden para la identificación: K00 ≥ G* - 1
(A12.12)
donde K00 es el número de variables predeterminadas excluidas y G* es el número de variables endógenas incluidas. La condición de orden no es condición suficiente para la identificación, debido a que no todas las K00 ecuaciones necesitan ser independientes entre sí. Esto sugiere que una condición necesaria y suficiente para la identificación será una que garantice que G* - 1 de las K 00 ecuaciones de hecho son independientes. Esta condición, a menudo llamada la condición de rango, puede establecerse de la siguiente manera: rango [π*,oo] = G*-1
(A12.13)
Una vez que las G* - 1 β desconocidas son determinadas a partir de la ecuación (A12.ll), no hay dificultad para resolver la ecuación (A12.10) para los coeficientes de las variables predeterminadas.
APÉNDICE 12.2 Mínimos cuadrados de dos etapas en forma matricial
Recuérdese del apéndice 12.1 que la determinación de los coeficientes estructurales desconocidos depende de una solución de la ecuación β* π*,oo = 0
(A12.14)
Dado que una β se ha establecido igual a 1, buscamos (en forma directa) obtener valores para las restantes G* - 1 β desconocidas. Existirá dicha solución si el rango es [π*,oo] = G * - 1. Si la condición de rango se satisface y K00 = G * - 1, la primera ecuación es identificada de manera exacta. Sin embargo, si K00 > G* - 1, la ecuación está sobreidentificada. La sobreidentificación ocurre debido a que hay más que G* - 1 ecuaciones en la ecuación (A12.14) de las cuales deseamos encontrar estimaciones de las G* - 1 β desconocidas. Hay varias formas de combinar el conjunto de ecuaciones para obtener el valor de β*. En el caso sobreidentificado, 2SLS se vuelve un procedimiento de estimación apropiado. 2SLS usa toda la información disponible en el sistema de ecuaciones (A12.14) para obtener estimaciones de parámetro estructurales únicas. Describiremos la aplicación de 2SLS para la estimación de la primera ecuación estructural, la cual asumimos que está sobreidentificada. Para hacer esto, es útil alterar la notación del apéndice 12.1, expresando la primera ecuación como: Y1 = Y1β1 + X1γ1 + u1
(A12.15)
390
PARTE TRES: Mod delos de ecuacion nes múltiples
donde y1 = veector N x 1 dee observacionees en la variab ble endógena con c coeficiente de d 1 en la prim mera ecuación n Y1 = matriz m N x (G* - 1) de observ vaciones en vaariables endóg genas incluidaas e la primera ecuación (en en n el lado dereccho) Β1 = veector (G* - 1) x 1 de coeficieentes para variiables endógen nas incluidas X1 = matriz m N x Ko de observaciiones en variaables predeterminadas incluidass γ1 = vector v Ko x 1 de d coeficientees de variable predeterminaada u1 = vector v Nx1d de perturbacio ones asociadaas con la prim mera ecuación Como se describió en el teexto, la aplicacción de mínim mos cuadradoss ordinarios a la ecuación (A1 12.15) produccirá estimacion nes de parámeetro inconsistentes debido al hecho de qu ue Y1 y u1 esstán correlacionadas (asinttóticamente). 2SLS producce estimacioness consistenttes depurando Y1 dell componen nte que esttá correlacionad do con u1 y lueego volviendo o a ejecutar la nueva n regresió ón con el uso de d OLS. En la prrimera etapa, se realiza laa regresión dee cada una de las variablees endógenas deel lado derech ho sobre el con njunto entero d de variables prredeterminadaas en el modelo o. Esto es equ uivalente a estimar las ecu uaciones de forma f reducid da asociadas co on las G* - 1 variables endógenas d del lado dereecho. Podemo os representar esto e como:
o donde X2 = matriz m N x K000 de observacciones en variaables predeterrminadas excluidas de la primera ecuación π1 = matriz K0 x ((G* - 1) de coeeficientes de la l forma reduccida π1 = matriz K00 x (G* - 1) de co oeficientes dee la forma red ducida V = matriz m N x (G G* - 1) de pertu urbaciones dee la forma red ducida El estimadorr de primera eetapa resultan nte es: (A12.16 6) a partir de laa cual calculamos los valorres ajustados para Y1: (A12.17 7) En la seg gunda etapa lleevamos a cabo o un procedim miento de míniimos cuadrado os ordinarios dee y1 sobre Ŷ1 y yX1. Los coefi ficientes estimados son las estimaciones e d de parámetro dee 2SLS de β1 y γ1. En función de nuestrra formulación n matricial, lo os estimadores de la segundaa etapa son: (A12.18 8)
CAPÍTULO 12: Estimación de e ecuaciones simultáneas
0
391
(A12.19)
Poodemos reescrribir los estim madores de 2S SLS en una foorma más útil tomando en cu uenta el hecho de que los residuales de la regresiónn de la primeera etapa no esstán correlacioonados con toodas las variaables predeterrminadas; es decir, d (A12.20) Addemás,
(A12.21)
daado que Ŷ1 es e una combiinación lineaal de variablees predeterm minadas. Por taanto, Ad demás, Poor consiguientte, podemos rreescribir la ecuación (A122.19) como: (A12.22) Co omo una com mparación dell estimador de 2SLS, el leector puede enncontrar útil exxaminar los esstimadores innconsistentes que q se obtenddrían si se apllicara OLS a la ecuación esttructural en foorma directa. Los estimadoores son: (A12.23) De maneraa incidental, noo es difícil moostrar que 2SL LS es un estim mador de variaables instrum mentales dondde los valoress ajustados de d la primera etapa y las vaariables predeeterminadas iincluidas de la l primera etaapa son los in nstrumentos appropiados. Paara observar eesto, escribireemos el estim mador de variaables instrum mentales de la siguiente forrma:
Ex xpandiendo los términos y simplificanddo, encontram mos que:
392
PARTE TRES: Mod delos de ecuacion nes múltiples
Para delineaar una derivacción de la maatriz de variannza-covarianzza asintótica de d los parámettros estimadoos, podemoss usar la fóórmula para la matriz de d varianza-covvarianza del estimador de variables v instrrumentales coomo se describbe en el apéndicce 7.1. En nuuestra notación la matriz dee varianza-coovarianza es:
Pero Expandienddo la expresiión para βˆ 1 usando ell resultado anterior, a obteeγˆ1 nemos:
En la prácticca, σ2 es estim mado por:
Nótese que lo os residuales utilizados u parra calcular s2 nno vienen sóloo de la regresióón de la segund da etapa sino que son calcuulados de la ecuación e estruuctural originnal con los parám metros estimaddos remplazanndo a los parám metros verdadderos. La matrriz de varianza--covarianza, ppor otro lado o, toma en cuuenta el uso de los valorees ajustados de d segunda eetapa para Y1 como se ve por el hecho h de quue Y1′ Y1 - V ˆ'′ Vˆ' (= Ŷ1′ Y1) apparece en la matriz m que se va v a invertir (een lugar de sóólo Y1′ Y1). APÉNDICE E 12.3 Estimación de regresión ap parentemente no n relacionada en forma matrricial
Como se describió en el texto, la estim mación SUR tan sólo es laa aplicación de d estimación de d mínimos cuuadrados generalizados a un u grupo de ecuaciones e aparentemente no n relacionadaas. Las ecuaciones están reelacionadas poor medio de laas covarianzas no cero asociiadas con los términos t del eerror a lo larggo de diferentees ecuaciones en un punto determinado o en el tiemppo. Podemos generalizar el modelo aparrentemente noo relacionadoo escribiendo el sistema dee G ecuacionees de la siguien nte manera: Y i = X i βi + u i
i = 1, 2,,…, G
(A12.255)
CAPÍTULO O 12: Estimación d de ecuaciones simu ultáneas
393
do onde Yi = vecctor N x 1 Xi = maatriz N x Ki βi = vecctor Ki x 1 ui = vecctor N x I Seerá útil escribbir el modelo en forma abreeviada como Y = Xβ + u, o
do onde Y = mattriz GN x 1 X = maatriz β= mattriz u = mattriz GN x 1 De acuerdo conn las suposiciiones del moddelo aparentemente no relaacionado, no haay autocorrelaación dentro dde las ecuacionnes, pero exisste correlaciónn de ecuacionees cruzadas; es e decir,
(A12.27) doonde I es una matriz de ideentidad N x N. Esta relaciónn se aplica a las l covarianzaas entre dos eccuaciones arbbitrarias en el sistema de G ecuaciones. Para P generalizzar este resulttado en forma matricial escrribimos
Su ustituyendo de d la ecuaciónn (Al2.27), obbtenemos:
394
PA ARTE TRES: Modelos de ecuacione es múltiples
Toda la infoormación acerrca de las covvarianzas dell error está coontenida en la l matriz Ω. Laa estimación m más eficiente de la ecuacióón (A12.26) se obtiene apliicando la estimación de mínimos m cuadrrados generaliizados para obtener o (A12.288) (A12.299) En la práctica, debenn estimarse loos elementos de Ω. Esto se s logra con el e empleo de loos residuales oobtenidos cuan ndo se aplicó la l estimación de OLS a cadda una de las G ecuaciones:
Hay dos casos importtantes en los que q la estimacción SUR es equivalente e a la l aplicación dee OLS ecuación por ecuaciión. El primerr caso ocurre cuando σij = 0 para toda i y j, i ≠ j. Entonnces, Ω se sim mplifica a (A12.300) El uso de állgebra matriccial simple [ssustituyendo lla ecuación (A12.30) ( en la l ecuación (A A12.29)] es ssuficiente paara demostrarr el resultadoo establecidoo. Un segundo caso, menos obvio, ocurree cuando Xi = X para todaa i = 1, 2, ..., G (Ki = K estáá implícito). E Esto ocurre cuando c el connjunto idénticco de variablees independienttes aparece enn cada ecuaciión. Una vez más la pruebba implica unna aplicación diirecta de las ttécnicas del állgebra matricial. EJERCICIO OS 12.1 Considerre el modelo C t = α1 + α2 Y t + ε t
It = β1 + β 2Yt + β3Gt - 1+ ut
Y t = C t + It + Gt
a) Constrruya el sistemaa de forma redu ucida del modeelo. A partir dee la forma reduucida determinne la respuestaa de C en los primeros p dos pperiodos a un cambio c de unaa unidad en G. b) ¿Está identificada laa ecuación de la función de consumo? ¿Esstá sobreidentiifícada?
CAPITULO 12: Estimación de ecuaciones simultáneas
395
c) ¿Está iden ntificada la ecu uación de inverrsión? ¿Está so obreidentificadaa? d) ¿Qué le podría p suceder a su propensión marginal a co onsumir estimaada sí se ha esttimado con el empleo e de OLS S en una ecuació ón de la forma Ct = a + bYt + εt? 12 2.2 Considere el e modelo de offerta y demand da
do nde E( ε i ε j ) = 0, 0 i ≠ j, y E( ui uj ) = 0, i ≠ j. a) ¿Está iden ntificada la ecu uación de la ofe ferta? ¿Qué succedería si la ecu uación de la ofeerta fuera estim mada usando O OLS? b) ¿Está iden ntificada la ecu uación de la dem manda? ¿Qué sucedería s si la ecuación e de la demanda fueraa estimada usan ndo OLS? c) Si se le pidiera p que esttimara la ecuaación de la ofeerta empleand do variables insstrumentales, ¿qué ¿ haría? Seaa explícito. d) Si se le piidiera que estim mara la ecuació ón de la oferta usando 2SLS, ¿qué haría? ¿C Cómo se relacio ona esto con el inciso c)? e) ¿Podría usar u mínimos ccuadrados indirrectos para estiimar la ecuació ón de la de maanda? ¿Por quéé sí o por qué n no? f) ¿Serían diferentes sus reesultados si sup piera que e estaaba autocorrelacionado? 12 2.3 Considere el e sistema del m modelo de dos ecuaciones Y1 = a1Y2 + a2 Z1 + u1
Y2 = b1Y1 + b2Z2 + u2
(S u p onga que Z1 ≠ Z 2 . ) a) ¿Bajo quéé condiciones lla estimación de d OLS de la prrimera ecuación n conduciría a esttimadores de paarámetro consistentes? Sugereencia: Hay doss condiciones, una u relacionada con los valorees de parámetro o y la otra relaccionada con lass varianzas y covarianzas de loss errores. b) ¿Bajo quéé suposiciones eestá identificadaa la primera ecu uación? Sugeren ncia: Una vez máás hay dos con ndiciones, la prrimera relacion nada con los vaalores de parám metro y la segu unda relacionad da con las covaarianzas del erro or. 12 2.4 Considere el e modelo de un n sistema de do os ecuaciones Y1 = a1 + a 2Y2 + u1
Y 2 = b 1 + b 2 Y 1 + b3Z1 + b 4 Z 2 + u 2
Evaalúe los siguien ntes enfoques a la estimación n de la primeraa ecuación en función f de un sesg go, inconsisten ncia y eficienciia posibles.; ¿C Cuáles de los estimadores e son n estimadores de variables v instrum mentales? ¿Cóm mo se relaciona el último proceeso de estimació ón con los tres anteeriores? a) Estimació ón OLS de la primera ecuació ón b) Estimació ón de mínimoss cuadrados ind directos de la primera p ecuació ón c) Estimació ón de variables instrumentales usando Z1 ccomo un instrum mento en la priimera ecuación n d) Estimació ón 2SLS de la primera p ecuació ón e) Estimar laa primera ecuacción como Ŷ1 = c1 + c 2 Z 1 +c3Z2
396
PA ARTE TRES: Mode elos de ecuacione es múltiples
12.5 Expliquee de manera inttuitiva (utilizan ndo un modelo de tres ecuacio ones) por qué laa omisión de un na variable de ccada ecuación en un sistema de d ecuaciones es insuficientee para garantizaar que cada ecu uación en el sisstema está iden ntificada. 12.6 Demuestre que las dos formas de la condición c de orrden para la ideentificabilidad d que se describ ben en el texto son equivalenttes. 12.7 Considere el sistema del d modelo de tres t ecuacioness
¿Cuáles de las ecuacioness anteriores (sii es que hay allguna) no están n identificadass? ¿Exactamentee identificadas?? ¿Sobreidentifficadas? 12.8 Considerre el siguiente modelo macro oeconómico sim mple de una eco onomía:
¿Cuáles de las l ecuaciones eestán identificaadas? ¿No identtificadas? ¿Cóm mo podría estim mar las ecuacioness identificadas?? 12.9 Considerre el siguiente modelo recurrente de dos ecu uaciones:
a) Expliq que por qué OL LS es la técnicaa de estimación n apropiada (asu umiendo que u1 y u2 no están correlacionadas c s). b) Supon nga que un inveestigador ingen nuo, viendo Y1 een el lado dereecho de la segú únda ecuación, intenta i estimarlla usando 2SLS S; es decir, llev vando a cabo laa regresión de Y2 sobre los valo ores ajustados de Y 1 determiinados usando OLS en la prrimera ecuació ón. ¿Cuál será el resultado de diicho intento? ¿Cómo se podríía obtener un valor v para βˆ2 si se usara un procedimiento así?? c) ¿Cómo diferirían lass respuestas en n b) si la segun nda ecuación co ontuviera a X de d manera explíccita como una v variable indepeendiente? 12.10 Usando o el ejemplo 12 2.3, demuestre que la estimación de regresió ón aparentemen nte no relacionadaa se reduce a una u estimación OLS cuando laa varianza del error e de ecuació ón cruzada es 0 y cuando las vaariables indepeendientes en caada ecuación son s idénticas. 12.11 Consid dere el siguientte modelo de offerta y demand da de dos ecuacciones: Demanda:
P t = α 1 + α 2 Q t + u 1t
Oferta:
Qt = β1 + β2Pt-1 + β3Wt + u2t
a) Discutta la identificab bilidad de cadaa ecuación. b) ¿Bajo qué condicion nes es recurrentte el modelo?
CAPÍTULO 12: 1 Estimación de ecuaciones simultáneas
397
c) Si el moddelo es recurrennte, ¿cómo se podría p estimar la ecuación dee la demanda? d) Si el mod delo no es recurr rrente, ¿cómo see podría estimarr la ecuación de la demanda? 122.12 Explique por p qué el procceso simple de rezagar r todas laas variables del lado derecho en n un sistema dee ecuaciones sim multáneas no necesariamente n e hace recurrentte al modelo. 122.13 Consideree el modelo
Su uponga que ha estimado la forrma reducida de este modelo, primero con ell uso de OLS y luuego utilizandoo estimaciones 2SLS de los parámetros esstructurales paara resolver la fo orma reducida. Explique por qqué diferirán estas estimacionnes.
CAPÍTULO
13
INTRODUCCIÓN A LOS MODELOS DE SIMULACIÓN
En los capítulos 13 y 14 estudiaremos la construcción, evaluación y análisis de los modelos de simulación de ecuaciones simultáneas y su aplicación en el análisis y pronóstico de políticas. Aquellos que construyen o usan estos modelos deben ser capaces de evaluarlos de manera apropiada y entender su comportamiento. La mayor parte de los ejemplos aquí explicados serán modelos de simulación econométricos, los cuales consisten de ecuaciones que (con excepción de las identidades de contabilidad) se estiman empleando las técnicas econométricas estándares descritas en los capítulos anteriores. Estos modelos se han usado en forma extensa en el diseño de políticas públicas.1 Sin embargo, es importante señalar que estas técnicas de construcción de modelos también pueden aplicarse a otros tipos de modelos, incluyendo modelos de corporaciones2 y modelos de comportamiento social o político.3 Además de los economistas, los planificado-res corporativos, sociólogos, científicos políticos y otros también han manejado estos modelos de simulación como una estructura para el análisis y la predicción. Uno de nuestros objetivos es explicar cómo se construye un modelo de simulación, ya que implica más que tan sólo reunir varias ecuaciones sencillas estimadas en forma individual. Veremos que cuando ecuaciones de regresión individuales, las cuales pueden ajustarse muy bien a los datos históricos, se combinan para formar un modelo de ecuaciones simultáneas, los resultados de la
398
1 Para una exposición de aplicaciones de políticas, véase M. Greenberger, M.A. Crenson y B.L. Crissey, Models in the Policy Process (Nueva York: Russell Sage Foundation, 1976). 2 Véase, por ejemplo, J.W. Elliott, Econometric Analysis for Management Decisions (Homewood, I11.: Irwin, 1973), capítulo 13, y T.H. Naylor, Corporate Planning Models (Reading, Mass.: Addison-Wesley, 1979), capítulos 4 y 9. 3 Véase, por ejemplo, R.D. Brunner y G.D. Brewer, Organized Complexity (Nueva York: Free Press, 1971).
CAPÍTULO 13: Introducción a los modelos de simulación
399
simulación pueden tener poco parecido con la realidad. La dificultad surge debido a la estructura dinámica del sistema que resulta cuando se combinan ecuaciones individuales. Para construir y utilizar los modelos de simulación, debemos ser capaces de comparar modelos alternativos del mismo proceso. Por tanto, enfocaremos nuestra atención desde una etapa temprana de la evaluación y validación de modelos de simulación de ecuaciones simultáneas. La validación del modelo presenta un problema menos serio en el caso de regresión de una sola ecuación, dado que se puede observar un conjunto de estadísticas como R2 y las estadísticas t para hacer un juicio acerca de la bondad de ajuste de la ecuación. En un modelo de ecuaciones múltiples cada ecuación individual puede tener un ajuste estadístico muy bueno, pero el modelo en su conjunto probablemente haga un trabajo pobre en la reproducción dé los datos históricos. También puede suceder lo contrario: que las ecuaciones individuales en un modelo simultáneo tengan un ajuste estadístico malo, pero el modelo en su conjunto reproduzca las series de tiempo históricas en forma muy cercana. Otro de nuestros objetivos es comparar los beneficios de un modelo de ecuaciones simultáneas con los costos de construir uno. Si nuestra intención es, por ejemplo, pronosticar una tasa de interés a corto plazo, sabemos que será más fácil producir un pronóstico usando un modelo de regresión de una sola ecuación que usando un modelo de simulación de ecuaciones múltiples del mercado de dinero. La cuestión es si el beneficio agregado (medido en función de un pronóstico mejorado) del modelo de ecuaciones simultáneas supera al costo agregado implicado en construirlo. En este capítulo primero se analiza el proceso de simulación. Luego veremos el problema dé evaluar modelos de simulación y expondremos varios criterios de evaluación útiles. Más adelante, estos criterios Se usarán para evaluar métodos (y ejemplos) alternativos de construcción de modelos. En la siguiente sección compararemos métodos alternativos para estimar un modelo de ecuaciones simultáneas y examinaremos cómo puede afectar el método de estimación al desempeño de simulación del modelo. También se estudian los modelos no estructurales, en particular la estimación y uso de autorregresiones vectoriales, en las cuales se ejecuta una regresión de un conjunto de variables contra sus propios valores rezagados. Terminamos el capítulo con una breve exposición de procedimientos alternativos para la construcción de modelos. 13.1
EL PROCESO DISIMULACIÓN La simulación, en el significado que le damos, tan sólo es la solución matemática de un conjunto simultáneo de ecuaciones de diferencia.4 Un modelo de simulación 4 Una ecuación de diferencia relaciona el valor actual de una variable con los valores actuales y pasados de otras variables. Buenos ejemplos de ecuaciones de diferencia son proporcionados por los modelos de rezago distribuido comentados en el capítulo 9.
400
PARTE TRES: Modelos de ecuaciones múltiples
se refiere a ese conjunto de ecuaciones. Como un ejemplo, considérese el modelo macroeconómico extremadamente simple representado por: C t = α 1 + α 2Y t-1
(13.1)
I t = b 1 + b 2 (Y t-1 - Y t-2)
(13.2)
Yt= Ct + It+ Gt
(13.3)
donde C = consumo I = inversión Y = producto interno bruto G = gasto gubernamental y se suprimen los términos del error. C, I y F son las variables endógenas, mientras que G es una variable exógena. Éste es el modelo multiplicador-acelerador estándar que se estudia en los libros de macroeconomía elemental. El consumo es proporcional al PIB (el multiplicador); pero la inversión es proporcional a los cambios en el PIB (el acelerador). Si se dan valores para los parámetros a1, a2, b1 y b2, se especifican valores iniciales para las variables C e I, y se define una ruta de tiempo para la variable exógena G, entonces la solución simultánea de estas tres ecuaciones nos dará rutas de tiempo para cada una de las variables endógenas C, I y Y. Esto es lo que se quiere decir con proceso de simulación. Dado un modelo cuyos parámetros han sido estimados (o sus valores numéricos han sido suministrados de cualquier otra manera), dados valores iniciales para las variables endógenas (es decir, valores con base anual) y dada una serie de tiempo para las variables exógenas (ésta puede ser una serie histórica o puede representar hipótesis acerca del comportamiento futuro de la serie), el modelo es resuelto sobre algún rango de tiempo para producir valores para cada una de las variables endógenas. El modelo anterior puede resolverse de manera analítica sustituyendo las ecuaciones (13.1) y (13.2) en la ecuación (13.3) y reordenando: Y t - (a 2 + b 2 )Y t-1 + b 2 Y t -2 = (a 1 + b 1 ) + G t
(13.4)
El resultado es una ecuación de diferencia de segundo orden cuya solución dependerá de dos condiciones iniciales al igual que de todos los valores futuros de la variable exógena Gt.5 Observaremos en el capítulo 14 que la solución para Yt puede no ser estable (es decir, puede crecer sin límite) o puede oscilar. En el caso de un modelo simple, es fácil determinar las condiciones que deben cumplirse para que el modelo sea estable, mientras que en un modelo más complejo (que puede ser no lineal), las condiciones para la estabilidad pueden ser difíciles de comprobar. 5 Para una introducción a las ecuaciones de diferencia y su solución, véase A.C. Chiang, Fundamental Methods of Mathematical Economics (Nueva York: McGraw-Hill, 1984).
CAPÍTULO 13 3: Introducción a loss modelos de simu ulación
401
Figura 13.1 Soluciones esttable e inestable.
La estabiliddad del modelo es importannte debido a quue creemos quue el mundo reaal (o al menos la mayor paarte de él) es estable. Si, ppor ejemplo, el e PIB se ha moovido durantee los pasados 20 años de acuerdo a con lla línea punteeada A en la figgura 13.1, se podría p esperaar que un moddelo que expllica el PIB prrodujera una sollución qué see moviera en la misma forrma, tal vez ccomo se repreesenta en la lín nea sólida R. La L línea sólidda C represen ntaría una soluución inestablle, dado que div verge cada vezz con mayor raapidez del ran ngo real de valoores del PIB. Son S posibles otrros modelos de comportaamiento no reepresentativos como las oscilaciones am mortiguadas dee la línea sólidda D en la figu ura 13.2 y las ooscilaciones exxplosivas de la línea E en la misma m figuraa. Por supuesto o, en algunos casos las oscilaciones no exp plosivas pued den ser una solución deseeable; si, porr ejemplo, el modelo en cueestión se está usando para explicar ciclo os de negocioss para alguna mercancía
Figura 13.2 Soluciones osccilatorias.
402
PARTE TRES: Modelos de ecuaciones múltiples
y la frecuencia de las oscilaciones concuerda en forma estrecha con la frecuencia de los ciclos reales. Las características de la solución son importantes y se estudiarán con mayor detalle en el capítulo 14. Sin embargo, por ahora nos limitaremos al problema de obtener una solución; es decir, llevar a cabo una simulación. Si se conocen los parámetros para un modelo pequeño de ecuaciones (13.1) a (13.3), la solución puede obtenerse en forma analítica. Para un modelo mayor, quizá no lineal, las ecuaciones simultáneas deben resolverse en forma numérica. Hay varios programas para computadora que facilitan la simulación incluso de un modelo muy grande. La mayor parte de estos programas obtienen soluciones usando un procedimiento iterativo en el que el modelo no lineal es linealizado en forma repetida, quizá renormalizado, y luego resuelto. Las simulaciones de un modelo pueden realizarse debido a una variedad de razones, incluyendo la prueba y evaluación de modelos, análisis de políticas históricas y pronósticos. Por lo general, el horizonte de tiempo sobre el que se realiza la simulación depende del objetivo de la simulación. En la figura 13.3, T1 y T2 representan los límites de tiempo sobre los que se estiman las ecuaciones de un modelo hipotético (el periodo de estimación). T3 representa el tiempo presente. El modo de simulación inicial es llamado simulación ex post o histórica. La simulación comienza en el año T1 y corre hacia delante hasta el año T2. Los valores históricos en el año Tl son suministrados como condiciones iniciales para las variables endógenas, y las series históricas que comienzan en T1 y terminan en T2 se usan para las variables exógenas. Las variables endógenas no se reinician; después del año T 1 los valores para las variables endógenas son determinados por la solución de la simulación. Si el modelo es simulado durante un periodo en el que se dispone de datos históricos para todas las variables, una comparación de la serie de datos originales con la serie simulada para cada variable endógena puede proporcionar una prueba útil de la validez del modelo. Las simulaciones ex post también pueden ser útiles en el análisis de políticas. Al cambiar los valores de los parámetros o suponer que las variables de política exógenas siguen diferentes rutas de tiempo podemos examinar lo que puede resultar de políticas alternativas. Puede usarse un modelo macroeconómico para examinar, por ejemplo, las consecuencias que podrían resultar de los cambios en el nivel de gasto gubernamental, tasas fiscales o el suministro de dinero. Del mismo modo, los modelos para la industria pueden Figura 13.3
Horizontes de tiempo de la simulación.
CAPÍTULO 13: Introducción a tos modelos de simulación
403
emplearse para estudiar los efectos de políticas reguladoras gubernamentales alternativas o el impacto del crecimiento macroeconómico y las fluctuaciones en la industria.6 El pronóstico involucra una simulación del modelo adelante en el tiempo y fuera del periodo de estimación. Es evidente que, antes de que se pueda hacer un pronóstico, debemos tener datos de series de tiempo para el periodo de pronóstico entero para todas las variables exógenas. En el modelo macroeconómico simple de las ecuaciones (13.1) a (13.3), por ejemplo, uno debe predecir primero (o al menos hacer alguna suposición al respecto) valores futuros del gasto gubernamental Gt. Con frecuencia, generamos un conjunto de pronósticos alternativos, cada uno de los cuales es condicional a un conjunto de suposiciones acerca de las variables exógenas. Como se vio en el capítulo 8, se puede distinguir entre dos tipos de pronósticos. Si el periodo de estimación no se extiende hasta el año actual (es decir, T2 es menor que T3), se podría comenzar el pronóstico al final del periodo de estimación y extenderlo hasta el presente, quizá comparando los resultados con los datos disponibles. Esto se llama pronóstico ex post y a menudo se realiza para probar la precisión de pronóstico de un modelo. Un pronóstico que se hace comenzando la simulación en el año actual y extendiéndola hacia el futuro se llama pronóstico ex ante.
El pronóstico no sólo es útil con propósitos predictivos sino también sirve para el análisis de sensibilidad y análisis de políticas. Los pronósticos pueden usarse para estudiar los efectos de cambios en variables exógenas o parámetros particulares y para comparar los efectos de políticas alternativas que son planteadas como movimientos en variables exógenas controlables (como Gt en nuestro ejemplo) o como cambios en los valores de los parámetros de política (como las tasas fiscales). En ocasiones es de interés simular un modelo retrocediendo en el tiempo, comenzando al inicio del periodo de estimación. Se puede hacer esto para probar la estabilidad dinámica de un modelo o para analizar hipótesis acerca de eventos que se realizaron antes del periodo de estimación. En un retropronóstico comenzamos con condiciones iniciales para todas las variables en el periodo T1 (véase de nuevo la figura 13.3) y luego, usando datos para las variables exógenas antes del periodo T1, se resuelve el modelo hacia atrás un periodo a la vez.
6 Pueden encontrarse ejemplos en T. Naylor, Computer Símulation Experiments with Economic Systems (Nueva York: Wiley, 1971). Para un ejemplo detallado de una aplicación de un modelo econométrico en el ámbito industrial para el análisis de la política reguladora de precios del gobierno, véase P.W. MacAvoy y R.S. Pindyck, "Alternative Regulatory Policies for Dealing with the Natural Gas Shortage", Bell Journal of Economics and Management Science, vol. 4, otoño de 1973, pp. 454-498, y P.W. MacAvoy y R.S. Pindyck, The Economícs of the Natural Gas Shortage (Amsterdam: North-Holland, 1975).
404
13.2
PARTE TRES: Modelos de ecuaciones múltiples
EVALUACIÓN DE MODELOS DE SIMULACIÓN Hemos visto que en el caso del modelo de regresión de una sola ecuación hay estadísticas (R2, prueba F, pruebas t, etc.) que se pueden usar para juzgar la significancia (en un sentido estadístico) del modelo y sus coeficientes estimados individuales. Hay otras estadísticas (por ejemplo, la estadística DW) para probar las suposiciones subyacentes del modelo. Sin embargo, incluso con estas pruebas, la elección de aceptar o rechazar un modelo de una sola ecuación no es sencilla, en especial si se compara con otros modelos de una sola ecuación. Debemos decidir si la especificación estructural del modelo es razonable y si los coeficientes estimados tienen sentido. La evaluación del modelo también depende del propósito para el que se construyó el modelo. Un modelo diseñado con propósitos de pronóstico tendrá un error de pronóstico estándar lo más pequeño posible, mientras que las estadísticas t son más importantes en un modelo diseñado para probar una hipótesis específica. Las mismas consideraciones se aplican a un modelo de simulación de ecuaciones múltiples, con la excepción de que los criterios de evaluación se vuelven más complicados. Con varias ecuaciones, la significancia estadística alta en algunas se podría nivelar con la significancia estadística baja de otras. Fundamentalmente, el modelo en su conjunto tendrá una estructura dinámica que es mucho más rica que la de cualquiera de sus ecuaciones individuales. Por tanto, incluso si todas las ecuaciones individuales se ajustan bien a los datos y son estadísticamente significativas, el modelo en su conjunto, cuando es simulado, puede no seguir aquellas series de datos en forma cercana. Por último, es posible que en una simulación ex post (histórica) algunas de las variables endógenas seguirán a las series de datos originales en forma muy cercana mientras otras no lo harán. Como con el modelo de una sola ecuación, la evaluación del modelo de ecuaciones múltiples depende del propósito para el que fue construido. Algunos modelos se construyen esencialmente para pronóstico, mientras otros son construidos con propósitos descriptivos y prueba de hipótesis, por lo tanto se aplicarán criterios diferentes. Examinaremos los criterios que pueden usarse para evaluar modelos de ecuaciones múltiples, comenzando con las ecuaciones individuales de un modelo. ¿Las ecuaciones, en una base una por una, se ajustan bien a los datos? Esta pregunta puede responderse aplicando los mismos criterios (estadísticos y de otra índole) que se usaron en la construcción y evaluación de modelos de regresión de una sola ecuación, incluso si se manejó un procedimiento de estimación de ecuaciones múltiples. Al examinar las ecuaciones de un modelo, encontramos con frecuencia que algunas de las ecuaciones se ajustan bien a los datos mientras que otras no. Por tanto debe hacerse un juicio conforme se construye el modelo respecto al ajuste estadístico general. En la práctica, puede ser necesario usar especificaciones para algunas de las ecuaciones que son menos deseables desde un punto de vista estadístico pero mejoran la capacidad de similación del modelo (de acuerdo con los criterios que se expondrán a continuación). De este modo, el cons-
CAPÍTULO 13 3: Introducción a loss modelos de simu ulación
405
tru uctor del modeelo es obligado a hacer com mpromisos, debbido a esto aceepta algunas ecuuaciones quee no tienen uun buen ajusste estadísticco a fin de construir c un mo odelo estructuural completoo. Otro criterioo que se usa ppara evaluar un u modelo de ssimulación ess el ajuste de lass variables indiividuales en unn contexto de simulación. s See espera que lo os resultados de una simulaciión histórica cconcuerden con c el comporrtamiento del mundo real en forma muy cercana, c por cconsiguiente se s realizará a menudo unaa simulación hisstórica y luego se examinaará qué tan cerrca sigue cadaa variable enddógena a los dattos históricos. Por lo tanto es deseable teener alguna medida m cuantittativa de qué tann cerca siguen n las variabless individuales a sus corresppondientes serries de datos. Enn el capítulo 8 vimos, en el contexto del pronóstico coon un modelo de una sola ecuuación, que una u medida ussada en formaa amplia es eel error de sim mulación rms (raaíz cuadrática media). m Se reccordará que el error e de simulación rms parra la variable Yt se define com mo: (13.5) do onde Yts = vaalor simuladoo de Yt Yta = vaalor real T = núúmero de periiodos en la sim mulación El error rms es una u medida de la desviacióón de la variabble simulada de d su ruta de tieempo real. Por supuesto, laa magnitud dee este error sóólo puede evaaluarse si se compara con ell tamaño prom medio de la vaariable en cueestión. Una estadísstica del error de simulacióón que hace essto es el errorr porcentual rm ms, el cual se define d como:
(13.6) Ottras medidas inncluyen el errror de simulacción medio, ell cual se definee como: error de sim mulación medioo =
(13.7)
y el e error porcenntual medio, el cual se defin ne como:
error porrcentual medioo =
(13.8)
El problema coon los erroress medios es que q pueden esstar cerca de 0 si errores poositivos grand des cancelan a errores negativos grandees. En la figuura 13.4, por ejeemplo, el erroor de simulaciión medio proobablemente estaría cerca de 0, mien-
406
PA ARTE TRES: Mod delos de ecuacion nes múltiples
Figura 13.4 Error de simulación medio cerccano a cero
tras que el errror de simullación rms auunque grande sería una meedida mejor del desempeño de d la simulacción.7 Sin embbargo, los errrores medios a menudo soon útiles como un u indicio dee un sesgo sisttemático. En ocasiiones una sim mulación histórica muestra que algunas variables v endóógenas tienen n un error dee simulación rms pequeñoo mientras quue otras tieneen errores granddes. En este caso la evaluacción del modeelo implicará una consideración de cuálees variables soon más críticaas al igual quee las razones por p las que haan ocurrido erroores grandes. P Para hacerlo se s puede expllorar a través de d la estructurra del modelo para averiguuar por qué ciertas variabbles divergenn de sus rutaas históricas du urante la simuulación. A menudo, el deseempeño de la simulación ddel modelo pued de mejorarse sustituyendo formas de eccuación nuev vas que puedeen tener ajustess estadísticos malos pero que mejorann la estructuraa dinámica del modelo. Los errorres de simulacción rms bajo os sólo son unna medida desseable de ajusste de la simulacción. Otro criiterio importaante es lo bieen que simulaa el modelo loos puntos de vira aje en los datoos. Considéresse la figura 13.5, donde la líínea punteada A representa laa serie de tiem mpo históricaa para alguna variable enddógena X, y laas líneas sólidass B y C repressentan valores simulados uusando dos modelos m diferenntes. A partir de esta solaa figura, prob bablemente prreferiríamos el modelo quue produjo la línnea C, dado quue a pesar de su error de sim mulación rmss mayor duplicca el cambio maarcado que occurrió en la vaariable X. El m modelo que produjo p la líneea B siguió a los datos histórricos en formaa aproximadaa durante el reesto del perioddo de simulacióón, pero cualqquier modelo de tendenciaa simple podríía haber hechho esto. Si el moddelo ha sido diiseñado con prropósitos de ppronóstico, el error e de pronóóstico rms ex post p es otro criiterio fundamental de desem mpeño. En unn pronóstico exx
7 También pueden calcularrse los errores medios m absolutos (y los errores poorcentuales mediios absolutos) para evitar e el problem ma de la cancelaciión de errores positivos y negativoos, pero los errorres rms se usan más a menudo en laa práctica, dado que q se sancionann con más fuerzaa los errores indivviduales grandes. Véase el ejerciciio 13.1.
CAPÍTULO 13:: Introducción a loss modelos de simu ulación
407
Figura 13.5 Puntos de viraje e simulados.
posst los resultaddos pueden com mpararse con datos recientes. El error dee pronóstico rms, es decir, el error de simuulación rms caalculado sobree el rango del pronóstico, prooporciona unaa medida de laa capacidad deel modelo parra pronosticarr. Es posible quee algunas vaariables endóggenas tengann errores de pronóstico rm ms grandes mieentras que otras o tengan errores e pequeños. A mennos que el objetivo o del proonóstico esté centrado sóloo en una o do os variables, ttodos los erro ores de pronósstico rms debben evaluarse en forma con njunta. Como vimoos en el capítuulo 8, una estaadística de sim mulación útil relacionada r con n el error de sim mulación rms es el coeficiennte de desigualldad de Theil:
(13.9)
Reccuérdese que el numeradorr de U es el error de simulaación rms, peero la escala dell denominador es tal que U siempre caerrá entre 0 y 1. Si U = 0, Yts = Yta para tod das las t y haay un ajuste pperfecto. Si U = 1, el desempeño preedictivo del moodelo es extrem madamente m malo. Cuando U = 1, los vaalores simuladdos siempre sonn 0 cuando loss valores realees no son ceroo, o se han heecho prediccioones que no sonn cero cuando los valores reeales son cero y por consiguuiente fáciles de d predecir, o lo os valores sim mulados son ppositivos (neg gativos) cuanddo los valoress reales son neggativos (positiivos).8
8 El coeficiente de desigualdad fuue introducido en H. H Theil, Economiic Farecasts and Policy P (Amsterdam m: North-Holland d, 1961), pp. 30--37, y se exponee en H. Theil, A Applied Economiic Forecasting (Am msterdam: North -Holland, 1966) , pp. 26-35. Theeil también dem muestra que si U no es grande (diggamos, debajo dee 0.3), su varianzza puede ser apro oximada por Varr (U) = U 2 /T.
408
PARTE TRES: Mod P delos de ecuacion nes múltiples
En el caapítulo 8 se vvio que el coeeficiente de ddesigualdad de d Theil puedde descomponeerse de la mannera siguientee: (13.10) donde Ys, Ya, σs y σa son las medias y desviacioness estándar de las series Yts y Yta, respectivvamente, y ρ es e su coeficien nte de correlacción.9 Entoncees, definimos las l proporciones de desigualdadd como:
(13.11) (13.12)
(13.133)
Y M
S
C
Las proporcio ones U , U y U son llamadaas las proporcioones del sesgo, de la varianzaa y
la covarianzaa, respectivam mente, y nos peermiten dividirr el error de sim mulación en suus fuentes caraccterísticas. La propo orción del sesggo UM es un inndicio de error sistemático, dado d que mide el grado en quee los valores promedio de laas series simullada y real se desvían d entre sí. s Cualquiera que q sea el vallor del coeficiiente de desiggualdad U, esperamos que el valor UM seaa cercano a cero. Un valorr grande de UM (arriba de 0.1 o 0.2) serría bastante prooblemático, daado que signiificaría que está e presente un sesgo sisttemático, de modo m que seráá necesaria laa revisión del modelo. La propo orción de variaanza Us indicaa la capacidad del modelo paara reproducir el grado de varriabilidad en la l variable dee interés. Si Us es grande, significa s que la serie real ha h fluctuado de manera considerable c mientras la serie simuladda muestra pocaa fluctuación,, o viceversa. Esto tambiénn sería problem mático y podrría conducirnoss a una revisióón del modeloo. Por últim mo, la propoorción de covvarianza midee el error no sistemático; es decir, repressenta el error restante desppués de que se s han explicaado los valorres promedio. Dado D que es poco p razonablle esperar preedicciones quee estén correllacionadas en forma perfeccta con los ressultados reales, este compoonente del errror es menos preeocupante. Enn efecto, paraa cualquier vaalor de U > 0,, la distribucióón ideal de la desigualdad d soobre las tres fuentes f es UM = US = 0 y UC = 1. Sería úttil tener una medida m de deesempeño asoociada con unn pronóstico ex ante para un modelo de eccuaciones múltiples. Vimoss en el capítullo 8, por ejem m-
9
s
Es decir, ρ = (1 / σ s σ a T)Σ Σ( Yt -
Y s)( Yta - Ya ).
CAPÍTULO 13: Introducción a tos modelos de simulación
409
pío, que para un modelo de regresión de una sola ecuación pueden calcularse un error estándar de pronóstico y su Correspondiente intervalo de confianza. Por desgracia, no hay una forma simple de calcular intervalos de confianza para el pronóstico de un modelo de ecuaciones múltiples, debido a que los errores de pronóstico pueden estar compuestos de una manera compleja por la estructura de retroalimentación del modelo. Sin embargo, se pueden calcular intervalos de confianza con el uso de la simulación estocástica, como se comentará en el capítulo 14. A menudo se utilizan errores de pronóstico rms ex post como criterios para el desempeño del pronóstico. No obstante, uno debe recordar que es probable que los errores ex ante sean mayores que los errores ex post. Incluso si un modelo se considera bueno; es decir, tiene errores de simulación y de pronóstico rms pequeños para la mayor parte de las variables endógenas o todas, también sería deseable investigar si respondió a los estímulos (por ejemplo, cambios grandes en variables exógenas o parámetros de política) de una manera consistente con la teoría y con la observación empírica. Por ejemplo, en el caso de un modelo macroeconométrico, la simulación de un incremento de 10 mil millones de dólares en los gastos gubernamentales debería dar como resultado cambios en el PIB que más o menos concuerden tanto con nuestras expectativas teóricas como con las observaciones recientes. De este modo la respuesta dinámica del modelo (que se expone en el capítulo 14) es otro criterio de evaluación. Un criterio adicional del desempeño del modelo es la sensibilidad general del modelo a factores como el periodo inicial en que se comenzó la simulación, cambios menores en los coeficientes estimados y cambios pequeños en las rutas de tiempo de las variables exógenas. Si, por ejemplo, un modelo se estimó con datos de 1955 a 1995, esperaríamos que la simulación histórica se ajustara bien ya sea que hubiera comenzado en 195,5 o en 1960. También se podría esperar que los cambios pequeños en los coeficientes del modelo (al menos dentro de un medio del error estándar estimado para el coeficiente) no afectarán al desempeño de simulación del modelo en forma muy drástica. Entonces, otra prueba de sensibilidad, implica volver a simular el modelo después de hacer cambios pequeños en los coeficientes individuales. Una tercera prueba de sensibilidad significa alterar las rutas de tiempo para variables exógenas sobre el periodo de estimación. Una vez más, los cambios pequeños en estas rutas de tiempo para las variables exógenas no deberían afectar de forma radical el desempeño de la simulación. Se ha observado que hay muchos criterios que se pueden aplicar para evaluar el desempeño de un modelo de simulación, pero pueden surgir problemas en el uso dé estos criterios.10 ¿Qué pasa si los errores de simulación rms son todos muy pequeños pero el modelo es muy sensible a la fecha de arranque inicial en la simulación? ¿Qué pasa si los errores de pronóstico rms ex post son
10 Para un tratamiento detallado de los criterios de evaluación para modelos econométricos, véase D. Belsley, E. Kuh y R. Welsch, Regression Diagnostics (Nueva York: Wiley, 1980).
410
PARTE P TRES: Mo odelos de ecuacion nes múltiples
todos pequeeños pero el modelo fallaa al reproduciir los puntos de viraje? ¿Qué ¿ pasa si el coeeficiente de deesigualdad de Theil U es mu uy pequeño peero el compon nente de sesgo UM es grande? Deesafortunadam mente, no hay fórmula algun na que nos ind dique qué hacer en n casos como o éstos. Parte del arte de la l construcció ón de modelo os es aprender a in ntercambiar criterios c altern nativos en dife ferentes formaas.
13.3
UN EJEM MPLO DE SIIMULACIÓN N Como un ejeemplo simplee de un modello de simulacción de ecuaciiones múltiples veremos un modelo macrroeconómico lineal pequeñño, el cual esttá dado por las ecuaciones (13.14) a (13.117). (El lectorr puede verifiicar que todass las ecuaciones están identifficadas.)
donde C = consumo c perssonal agregaddo real 1 = inversión i nacional bruta reeal Y = PIB P real (netoo de exportaciiones e imporrtaciones) G = gasto g gubernamental real M = reserva r moneetaria real, deefinida en form ma estrecha (MI) ( R = tasa de interéés en bonos de d tesorería a tres meses C, Y, I y G están e medidass todas en milles de millonees de dólares de 1982, mieentras que R esstá dada en poorcentaje por año. a Las ecuaaciones fueronn estimadas coon datos de seriies de tiempoo trimestrales de 1950 hasta el final de 1985. 1 Se mueestran las estaddísticas t (enttre paréntesis debajo de caada coeficientte estimado), la R2, el error estándar e y la estadística DW D para cadaa ecuación. Laas ecuacioness
CAPITULO 13 3: Introducción a lo os modelos dé sim mulación
411
(113.14) y (13.1 16) contienenn variables dep pendientes rezzagadas, de modo m que sus esstadísticas DW W están sesgaadas hacia 2; por p consiguieente también calculamos c la esstadística h de d Durbin para esas ecuacciones. Con eexcepción dee la ecuación (113.17), la cuaal es una identtidad, todas laas ecuacioness fueron estim madas usando m mínimos cuadrrados ordinarrios. La ecuacióón (13.14) parra el consumoo agregado coonsiste de un multiplicador m co on una distrib bución rezagaada geométrica. La ecuaciión de inverssión contiene taanto un multipplicador como un aceleraddor, con la invversión depenndiendo tambiién de la tasaa de interés a corto plazo R, con una demora d de mu ucho tiempo. También se esttimó una ecuaación para estta tasa de interrés, la cual see relaciona en foorma positiva con el PIB y los cambios en e éste, y se reelaciona en foorma negativa co on los cambio os en la reserrva monetariaa. Por último, el modelo ess completado co on la adiciónn de la identidad que expllica el PIB enn la ecuaciónn (13.17). El m modelo se basaa, de este moddo, en cuatro variables v endóógenas y cuatrro ecuaciones all igual que dos d variables exógenas: laa reserva monetaria y el gasto gubernaamental. A pesar dee la simplicidaad de este mod delo, el desem mpeño de su simulación s es soorprendentem mente bueno. R Realizamos una u simulaciónn ex post (hisstórica) sobre ell periodo de estimación e 19550-1 a 1985-44, con los valoores históricoss para las dos vaariables exógenas: gasto guubernamentall y el suministro de dinero.. Los resultadoos se muestraan gráficamennte en las figuuras 13.6 a 133.9, en las cuaales se trazan laas series real y simulada paara cada variaable endógenaa en el mismo o conjunto de ejjes. Observanddo las figuras 13.6 a 13.9, vemos v que lass series simulladas parecen reeproducir el comportamien c nto a largo plaazo general de las series reeales, aunque laas fluctuaciones a corto plaazo en las seriees reales no se reproducen bien y faltan allgunos de los puntos de viraje. (Nótese,, por ejemploo, que el modeelo no reproduuce las declinnaciones aguddas en el gasto de inversión que ocurrió ó durante las
Figura 13.6 Simulación histórica del consumo..
412
PA ARTE TRES: Mod delos de ecuaciones múltiples
Figura 13.7 7 Simulación n histórica de la inverssión.
recesiones de d 1975 y 19882.) Tambiénn se puede exaaminar los errrores rms y de d simulación media m y los errrores porcenntuales de sim mulación para cada variablee, los cuales see muestran en e el cuadro 13.1 junto coon el valor medio m de cadda variable. Algunos de estos errorres son granddes (en especiaal para la inveersión y para la l tasa de interés), pero estoo no es sorpreendente dadaa la naturalezaa simplista deel modelo. Reccuérdese quee el modelo fue estimadoo con el usoo de mínimoos cuadrados orrdinarios. En la l siguiente seección veremoos que el uso de métodos de d estimación alternativos a puuede derivar en e un desemppeño de la sim mulación mejoorado. Entretaanto, ilustrareemos el uso de d este modello para pronóóstico.
Figura 13.8 8 Simulación n histórica de la tasa de d interés.
CAPÍTULO 13 3: Introducción a lo os modelos de simulación
413
Figura 13.9 Simulación his stórica del PIB.
Comenzareemos con un ppronóstico ex post en el quue el modelo es simulado haacia delante coomenzando aal final del peeriodo de estim mación (19855-4) y continuuando hasta laa fecha de la ssimulación (enn éste caso 19988-1). Los reesultados de estta simulaciónn se muestran en las figurass 13.10 a 13.13. También se expone un ressumen de las estadísticas para p cada varriable endógenna en el cuaddro 13.2.
414
P PARTE TRES: Mo odelos de ecuacion nes múltiples
Figura 13..10 Pronóstico o ex post de consum mo.
Observee que mientrass que los erroores rms en occasiones son menores m que los l de la simulaación históricca, los erroress medio, por lo general, son s mayores en magnitud. Por P ejemplo, el modelo so obrepredice grravemente la inversión paara todo el perioodo de pronósttico de dos añ ños. Esto a su vez v causa que sobreprediga el PIB y, durannte 1987, la tasa de interéss. Podemoos llevar este eejemplo un paaso adelante y usar el modello para produccir un pronóstico ex ante. Para hacer esto, e comenzaaremos la sim mulación en el segundo trim mestre de 19888 y continuaaremos hasta el cuarto trim mestre de 19889. No obstantee, para realizzar esta simullación, debe hacerse algú ún pronóstico o suposición reespecto a las vvariables exóggenas Gt y Mt. Asumiremos que Gt creceráá
Figura 13.11 Pronóstico o ex post de inversión.
CAPÍTULO 13: Introducción a los s modelos de simu ulación
415
Figura 13.12
Pronóstico ex post de la tasa de in nterés.
a una u tasa del 3.2% por año, lo cual es cerrcano a su tasaa de crecimiennto histórica proomedio, Asuumiremos quee Mt crecerá a una tasa dde 1% anual, lo cual (en térrminos reales) está un pocco por debajo de su tasa dee crecimientoo histórica y, po or tanto, repreesenta una poolítica monetaria estricta. Los resultaados de este pronóstico p paara la inversióón y la tasa de d interés se muuestran en lass figuras 13.14 y 13.15. Obbsérvese que la tasa de inteerés pronosticcada crece en forma constaante, alcanzand do un nivel por encima dell 11%. Aunquue la tasa de bonos b de tesoorería a tres meses m se elevvó más del 8% % en 1988 y priincipios de 1989, no alcannzó los nivelees mostrados en la figura 13.15. Para meediados de 19 989 la política monetaria dee la Reserva Feederal se habíía relajado, y estta tasa se estaabilizó alrededdor del 8%.
Figura 13.13 Pronóstico ex post del PIB.
416
PARTE P TRES: Mo odelos de ecuacion nes múltiples
Figura 13.14 Pronóstico o ex ante de inversió ón.
13.4
ESTIMACIÓN DEL MODELO M En esta seccción examinarremos cómo los l métodos alternativos a puueden afectar al desempeño de la simulación y del pronnóstico de un modelo. El modelo m dado por p las ecuacionnes (13.14) a (13.17) fue estimado e usanndo mínimos cuadrados c orddinarios (OLS S), lo cual puuede derivar en e estimacionnes inconsistenntes y sesgaddas de los coeficcientes. Veam mos cómo afeccta la elecciónn del método de d estimaciónn al desempeño del modelo ccuando es sim mulado en connjunto. Para hacerlo, primero estimaremoos el modelo por medio dee mínimos cuuadrados de doos etapas (2SL LS). Nótese quue el modelo es de bloque recurrente r (assumiendo térm minos del errror independientes). De m manera específfica, la tasa de d
Figura 13 3.15 Pronóstico o ex ante de la tasa a de interés.
CAPÍTULO 13: Introducción a loos modelos de simu ulación
417
intterés aparece como una varriable explicaativa sólo en lla ecuación de d inversión, y aparece a ahí co on un rezago en el cuarto trimestre. Coomo resultadoo, no necesitam mos preocupaarnos por la. innconsistencia en las estimaaciones OLS de d los coeficieentes de la eccuación de la tasa de interéés. Sólo las ecuaciones de consumo e inv versión necesiitan ser estimaadas por 2SLS S. Esto se realliza usando lo os siguientes insstrumentos: Ct - 1 (Yt - 1 - Yt - 2 ), Yt - 1 , Gt , (Mt - Mt - 1 ), (Rt - 1 + Rt - 2 ), Rt - 4 . Las esttimaciones 2S SLS de las ecuuaciones de consumo c e invversión son
El uso de 2SLS 2 reduciráá la posibilidaad de inconsisstencia introduucida por la sim multaneidad del d modelo. Estas E ecuacion nes son lógiccas, excepto que q la ecuacióón (13,19) parra inversión tiene t una estaadística DW bbaja, lo cual inndica correlacción serial en los términos del error. Si esta ecuaciónn pudiera reesstimarse por meedio de una trransformacióón autorregressiva para corrregir esta corrrelación seriaal, se obtendríían estimacionnes más eficiientes. El usoo de un proceddimiento de Co ochrane-Orcuttt iterativo paara reestimar esta ecuacióón da el resulltado que se muuestra a continuación:
Ahora se tieenen tres versiiones de este modelo, m la priimera estimadda con OLS, la segunda estim mada con 2SL LS y la tercera combinando 2SLS con unaa corrección auttorregresiva para p la ecuaciión de inversiión. Estos moodelos se usarron para generrar un pronósstico ex post sobre el perioddo de dos añoos de 1986-1 a 1988-1. Se callcularon los errores e de sim mulación rmss y los errorees porcentualees rms para cad da variable enndógena; los resultados see muestran enn el cuadro 13 3.3. Obsérvese que q el pronósttico generadoo por la versióón 2 SLS del modelo m produuce errores de simulación rrms menores que q la versiónn OLS para todas las variaables. La versión 3, que coontiene la corrrección autorrregresiva paraa la correlacióón serial en ell término del eerror de la ecuuación de invversión, resultaa aún mejor. Esta corrección mejora el deesempeño del modelo debido a que le agrega informaación. Aun cuuando no connozcamos por qué el términno del error aditivo a en la ecuuación de invversión se com mporta comoo lo hace, se puede p observaar que está
418
PARTE TRES: Modelos de ecuaciones múltiples
CUADRO 13.3 RESUMEN DE ESTADÍSTICAS PARA PRONÓSTICO EX POST Versión 1, OLS error rms Producto interno bruto Y Consumo C Inversión I Tasa de interés R
87.89 37.02 64.44 1.40
Versión 2, 2SLS
error porcentual rms
2.22 1.48 9.60 23.69
error rms
68.39 26.70 58.54 1.25
error porcentual rms
1.73 1.07 8.82 21.26
Versión 3, autorregresivo error rms
35.03 23.84 31.05 1.04
error porcentual rms
.89
.95
4.75 17.74
correlacionado serialmente e incluimos esta información en el modelo y el pronóstico. En la parte cuatro de este libro expondremos modelos de series de tiempo, los cuales describen y predicen el comportamiento de procesos aleatorios. La corrección autorregresiva que empleamos para estimar la tercera versión de nuestro pequeño modelo hace la suposición implícita de que los términos de error aditivos son de la forma
εt
= ρ
ε t – 1 + ε t*
(13.21)
donde ε t* es la parte no correlacionada de ε t . La ecuación (13.21) en realidad es un modelo de series de tiempo simple para ε t (para ser precisos, un modelo autorregresivo de primer orden). Si combinamos este modelo con las relaciones estructurales de cada ecuación, puede mejorarse el desempeño predictivo del modelo en su conjunto. De hecho, puede usarse un modelo de series de tiempo más complicado que el de la ecuación (13.21) para "explicar" el comportamiento del término del error aditivo, y veremos en el capítulo 19 que el resultado puede ser una mejora aún mayor en el desempeño del modelo. Un punto importante por ahora, es que la capacidad de un modelo para pronosticar bien puede depender del método usado para estimar sus coeficientes. Sólo se han examinado dos alternativas a los OLS, pero se dispone de una variedad de otros métodos. R. Fair hizo una comparación de diez métodos de estimación alternativos." Cada método se usó para estimar las siete ecuaciones de comportamiento de un modelo de pronóstico macroeconómico que se había elaborado con anterioridad. Luego se llevaron a cabo simulaciones históricas con cada una de las diez versiones resultantes del modelo, y se compararon los
11 Véase R. Fair, "A Comparison of Alternative Estimators of Macroeconomic Models" International Economic Review, vol. 14, núm. 2, pp. 261-277, junio de 1973.
CAPÍTULO 13: Introducción a los modelos de simulación
419
errores de simulación rms para cada variable endógena. Nueve de los métodos de estimación fueron los siguientes:12 1. 2. 3. 4. 5. 6. 7. 8. 9.
Mínimos cuadrados ordinarios (OLS) Mínimos cuadrados de dos etapas (2SLS) OLS más corrección autorregresiva de primer orden (OLSAUTO1) 2SLS más corrección autorregresiva de primer orden (2SLSAUTO1) OLS más corrección autorregresiva de segundo orden (OLSAUTO2) 2SLS más corrección autorregresiva de segundo orden (2SLSAUTO2) Máxima verosimilitud con información completa (FIML) FIML más corrección autorregresiva de primer orden (FIMLAUT01) FIML más corrección autorregresiva de segundo orden (FIMLAUT02)
A continuación se exponen los errores de simulación rms para una variable, PIB, para el periodo muestral completo (42 observaciones) y para un pronóstico de cuatro trimestres:
1 OLS 2 2SLS 3 OLSAUTO1 4 2SLSAUTO1 5 OLSAUTO2 6 2SLSAUTO2 7 FIML 8 FIMLAUTO1 9FIMLAUTO2
Período completo
Cuatro trimestres
8.45 8.07 8.61 8.27 8.40 7.78 7.38 6.55 6.99
7.51 7.21 6.44 6.42 6.14 5.90 5.34 4.79 4.95
Obsérvese que es con el pronóstico de cuatro trimestres cuando es más crítico el método usado, con el rango de errores rms extendiéndose de 7.51 (OLS) a 4.79 (FIMLAUTO1). Debido a que la mayor parte del pronóstico se hace en un plazo corto, los resultados para los primeros cuatro trimestres se presentan por separado de aquellos para el periodo muestral entero. Sin embargo, en ambos casos, el uso de FIMLAUTO1 parece producir el mejor resultado. Este método explica las correlaciones entre términos del error a lo largo de las ecuaciones al igual que la correlación serial de primer orden en los términos del error individuales. No obstante, los resultados no demuestran que un método sea mejor que cualquier otro; tan sólo demuestran el uso de métodos alternativos con un modelo en particular. 12 El décimo método fue un procedimiento experimental que explicaba la estructura dinámica de las ecuaciones en una base de una por una. Este método se ha usado rara vez, y por tanto no lo describiremos aquí.
420
13.5
PARTE TRES: Modelos de ecuaciones múltiples
MODELOS NO ESTRUCTURALES: AUTORREGRESIONES VECTORIALES La mayor parte de los modelos econométricos que se han considerado hasta este punto, ya sean de ecuación sencilla o de ecuaciones múltiples, son estructurales. Con esto queremos decir que las relaciones específicas entre variables se fundamentan (ya sea de manera formal o informal) en la teoría económica. Por ejemplo, en una ecuación de regresión para describir o pronosticar el consumo agregado se puede incluir el ingreso disponible como una variable explicativa, pero también podrían incluirse un rezago distribuido de ingreso (o consumo rezagado) al igual que una medida de la riqueza acorde con las teorías del ingreso permanente o del ciclo de vida del comportamiento del ahorro y el consumo. Además, la forma funcional de la ecuación se puede derivar como la solución a un problema de maximización de la utilidad del consumidor, o tan sólo puede especificarse en una forma que sea consistente con una teoría del comportamiento del consumo. La estimación de tal ecuación proporcionaría entonces un medio para probar la teoría específica. Se ha visto que la mayor parte de los modelos también son dinámicos. Incluso en modelos de una sola ecuación, la estructura de rezago y el ajuste dinámico que implican, pueden ser un aspecto importante de la especificación y prueba del modelo. Como veremos en el capítulo 14, con los modelos de ecuaciones múltiples la estructura de rezago de las ecuaciones individuales puede afectar de manera crítica el comportamiento del modelo. (Por ejemplo, en un modelo de oferta y demanda de dos ecuaciones de un mercado de bienes los coeficientes de variables rezagadas determinarán si las simulaciones del modelo predicen el comportamiento cíclico de los precios.) Un econometrista puede especificar estructuras de rezago alternativas, y el comportamiento dinámico del modelo puede estar dictado considerablemente por esta especificación. Por consiguiente, el econometrista debe estar seguro de que la especificación está bien fundamentada en la teoría. Desafortunadamente, la teoría económica puede no ser suficiente para determinar la especificación correcta. Por ejemplo, la teoría puede ser demasiado complicada como para permitirle a uno derivar con precisión una especificación de los principios primordiales, de modo que debe hacerse alguna especificación aproximada o ad hoc. O la teoría puede ser consistente con varias estructuras de rezago alternativas, pero estas estructuras de rezago pueden dar como resultado modelos con comportamientos dinámicos muy diferentes. Por último, puede haber desacuerdo respecto a cuál es la teoría correcta. Como resultado, hay ocasiones en que se debería permitir que los datos, en lugar del econometrista, especifiquen la estructura dinámica de un modelo. Las autorregresiones vectoriales (VAR) proporcionan el medio para hacer esto.13 Una VAR hace demandas teóricas mínimas a la estructura de un modelo. Con
13 Las autorregresiones vectoriales fueron introducidas como un enfoque alternativo al modelo de ecuaciones múltiples por medio del trabajo de Sims. Véase C.A. Sims, "Macroeconomics and Reality", Econometrica, vol. 48, pp. 1-48, 1980.
CAPÍTULO 13: In ntroducción a tos m modelos de simulación
421
una VAR; sólo necesitamos n esspecificar doss cosas: 1) las variables (enndógenas y exóggenas) que see cree que inteeractúan y quue, por tanto, ddeberían incluuirse como partte del sistemaa, económicoo que se está tratando de modelar y 2)) el mayor núm mero de rezaggos necesarioss para capturaar la mayor pparte de los efectos e que tieneen las variablles entre sí,14 (Por ejemplo, si estamos modelando m el comportamiennto dinámicoo de un mercaado de bieness, las variablees endógenas relevantes podrrían ser precio, producciónn y niveles dee inventario, y las variabless exógenas relev vantes pueden n ser el ingresso agregado, el e clima, etc. C Con datos meensuales, es probbable que sean n suficientes rrezagos de hasta 6 o 12 meeses.) Las ecuaaciones del mod delo están lim mitadas a ser linneales, y así no n necesitamoos preocuparnoos respecto a lass formas funccionales. Se tiene quee x1, x2, …, xn son las variiables endógeenas y z1, ..., zm son las variables exógenaas, una VAR eestá dada por el siguiente conjunto de n ecuaciones e lineaales:15
14
En las VAR como las formulló Sims, se asum me que todas las variables son en ndógenas. La especcificación para quue algunas de lass variables sean exógenas e introduuce restricciones en e el modelo, debiddo a que tales vaariables podrán afectar a las varriables endógenaas sólo de manerra directa, no indireectamente a trav vés de la retroalim mentación de lass mismas variablles endógenas. Un U purista podría afirmar a que las restricciones r de esta clase son un na imposición innjustificable de los l prejuicios teóriccos del modeladoor e impiden que los datos hablen n con libertad. Seeñalamos que no hay nada que nos im mpida hacer enddógenas todas lass variables. 15 La ecuación (13.22) puede eescribirse de maanera mucho máás compacta usanndo notación matriicial:
dond de A0 es un vectorr n x l de términnos de intercepto,, A1, …, Ap son m matrices n x n dee coeficientes que relacionan r valoress rezagados de lass, variables endóggenas con los valoores actuales de esas e variables, B0, ...., Br son matricees n x m de coefi ficientes que relaccionan los valorees rezagados y acctuales de las variaables exógenas coon los valores acctuales de las vaariables endógenaas y εt es un vecctor n x 1 de térmiinos del error.
422
PARTE TRES: Modelos de ecuacio ones múltiples
Aquí, p es el número dee rezagos paraa las variabless endógenas y r es el núm mero de rezagos para las variables exógennas. Este modelo puede ser estimado por p OLS. Debiddo a que no hay h variables endógenas e sinn rezagos en el e lado derechho y en vista de que las variaables del lado derecho son las mismas en n cada ecuaciión, OLS es un estimador coonsistente y efficiente. No hhabría gananccia, por ejempplo, al usar estimación de reegresión apareentemente noo relacionada. Cuandoo se elige p y r, se prefiereen rezagos lo bastante larggos para captuurar por compleeto la dinámiica del sistem ma que se estáá modelando. Por otra paarte, entre más largos sean llos rezagos, mayor m será el número de parámetros que q deben estim marse y menoos los grados de libertad. [N Nótese que en las ecuaciones anteriores hay un total de n(1 + np + rm) parám metros. Incluuso sin variabbles exógenas, si s n = 4 y p = 12, entonces, ¡tendríamos que estimar 196 1 parámetroos!] Por lo tantoo, se debe negociar tener unn número suficciente de rezaagos y un núm mero suficiente de d parámetross libres. En effecto, ésta es uuna debilidadd de las VAR. En la práctica, encontramos necesario resstringir el núm mero de rezagos para que sean menos que lo ideal dada la naturaleza de la dinámica. Como resulltado, podríam mos terminar teeniendo que hhacer justo loo que las VA AR pretenden evitar: impooner restriccionees estructuralees a priori (y a menudo add hoc) en el modelo. En el análisis a de loss modelos de rezago distriibuido en el capítulo c 9 vim mos que la deteerminación deel número de rezagos puedde ser asistidaa por el uso dee la R2 corregida a, o el criterioo de informació ón Akaike (AIC). Recuérdese que el AIC está e
dado por:
donde Σεεˆ2i es la suma dde cuadrados de los residuuales. Tanto la R2 corregidda como el AIC A son mediidas de bondaad de ajuste que q corrigen la pérdida de grrados de liberrtad que resullta cuando se agregan rezagos adicionaless a un modeloo. Estas estaddísticas puedeen usarse paraa ayudar a detterminar el núúmero de rezaagos a incluir en una VAR.. En efecto, en n muchas apliicaciones de VAR V el criteriio de informaación Akaike sse usa como una u forma "obbjetiva" para determinar d ell número de rezagos r que sse incluirán.
EJEMPL LO 13.1
Modelado d e la dinámica del mercado de d la calefacci ón con petróle eo
El petróleo para la calefa facción domésstica es un bieen comerciadoo en forma acttiva en Estadoss Unidos. Debbido a que loss cambios ineesperados en el clima puedden tener un im mpacto considderable en la demanda d y quue el precio deel petróleo cruudo (del cual see hace el petróóleo para la caalefacción) ess volátil, el prrecio del petróóleo para calefaacción con freecuencia flucttúa en forma dramática. Supóng gase que se ddesea elaborarr un modelo ddel mercado del d petróleo para p calefacción n que podría uusarse para prronosticar preecios. Podríam mos especificaar y estimar unn modelo estrructural que describiera d laa dinámica dee la demandaa, la oferta y el mantenimiennto de inventtarios, pero es e probable que q este modeelo
CAPÍTULO 13: Introducción a los modelos de simulación
423
fuera complicado y es improbable que produjera pronósticos estrictos del precio, dada la incertidumbre sobre los patrones climáticos futuros y los precios del petróleo crudo. Una autorregresión vectorial proporciona una forma mucho más simple de modelar la dinámica de este mercado. Como un ejemplo de una VAR, relacionaremos tres variables endógenas entre sí: precio del petróleo para calefacción (PHO), producción (QHO) e inventario (NHO). Usaremos datos mensuales que cubren el periodo de enero de 1980 a junio de 1988. (Los datos reales, que se muestran en el cuadro 13.6 al final de este capítulo, comienzan en enero de 1979, a fin de permitir rezagos en el modelo.) Estableceremos el número de rezagos p en 8. También se incluirá una variable exógena, la tasa de crecimiento del índice de Producción Industrial (IPI), sin rezagos.16 Debido a que cada una de las tres ecuaciones en esta VAR contiene las mismas variables en el lado derecho, OLS es un estimador eficiente. Los resultados de estimar estas ecuaciones con OLS se exponen en el cuadro 13.4. Nótese que sólo alrededor de un cuarto de las variables rezagadas son significativas en cada ecuación. Esto es típico de una VAR; en lugar de elegir rezagos específicos para cada variable, tan sólo incluimos todos los rezagos (hasta ocho) para cada variable. La variable exógena IPI es insignificante en las tres ecuaciones y, por tanto, esta variable puede dejarse fuera del modelo. (O podríamos incluir rezagos de esta variable e introducir variables exógenas alternativas, como el precio del petróleo crudo.) No obstante, trabajaremos con el modelo tal como está. CUADRO 13.4 ESTIMACIONES DE PARÁMETRO VAR* Variable explicativa PHO-1 PHO -2 PHO-3 PHO -4 PHO-5 PHO -6 PHO -7 PHO- 8 QHO-1 QHO-2 QHO-3 QHO-4 QHO-5 QHO-6 QH0 -7 QHO-8
Variable
Variable
Variable
dependiente, PHO
dependiente, QHO
dependiente, NHO
.7248 ( 6.10) .3591 ( 2.27) -.33 48( - 1 .9 9) .0633 ( .37) -.0650 ( -. 39) -.0332 ( -.20) .0639 ( .42) .0680 ( .61) -.0266 ( -.18) -.3933 ( -2.27) .0231 ( .12) .2952 ( 1.54) -.2525 ( -1.27) -.0163 ( -.08) -.1017 ( -.55) -.0291 ( -.21)
.3041 ( -.2988 ( .0062 ( .0536 ( -.1256 ( -.0629 ( -.0106 ( .1012 ( .6691 ( -.2514 ( .1895 ( -.0222 ( .0576 ( .0235 ( .2004 ( -.2425 (
3.33) -2.46) .05) .41) -.97) -.50) -.09) 1.18) 5.97) -1.89) 1.26) -.13) .38) .16) 1.40) -2.29)
.4863 ( -.2416 ( .0320 ( -.2464 ( - .11 25 ( - .0083 ( .1988 ( .0282 ( .3880 ( -.5611 ( .1738 ( .3507 ( -.0042 ( .2533 ( .2008 ( -.0277 (
3.46) -1.29) .16) -1.22) -.5 6 ) .04) 1.10) .21) 2.25) -2.73) .75) 1.55) -.02) 1.09) .91) -.17)
16 Éste es un modelo crudo en extremo y está diseñado sólo para mostrar cómo se estima y se analiza una VAR. Nótese que para pronóstico, la tasa de crecimiento del índice de Producción Industrial tiene que pronosticarse, quizá usando un modelo macroeconómico.
424
PARTE TRES: Modelos de ecuacio ones múltiples
CUADRO 13.4 4 ESTIMACIONES DE PARÁME ETRO VAR' (Con ntinuación)
* Las estadística as t se encuentran n entre paréntesis.
La figu ura 13.16 mueestra los valorres reales y ajustados, al iggual que los reesiduales, paraa la ecuación de precio. Essto sugiere unn buen ajuste, pero nótese que q ésta no es una u simulacióón dinámica; es e decir, los vvalores reales del precio, pproducción e inventario i rezzagados se usan u para calccular el preciio ajustado paara cada perioddo. Una medida mejor de ajuste a se obtieene a partir de d la simulacióón Figura 13 3.16 Precio de el petróleo para cale efacción: real, ajustado y residuales.
1981 1
1982
1983
1984 4
1985
1986
1987
1988
CAPÍTULO 13:: Introducción a loss modelos de simu ulación
425
Figura 13.17 Precio del petrróleo para calefacció ón: real contra simulado.
din námica de las tres ecuacionnes. La figuraa 13.17 exponne los resultaddos de dicha sim mulación para la variable dee precio. Obséérvese que el precio simulaado sigue al preecio real duraante los prim meros seis meeses más o m menos pero deespués sólo capptura la tendencia en el preecio real y cassi ninguna de las fluctuacio ones a corto plaazo. Esto es frecuente fr paraa una VAR y esperaríamoss que el modeelo sea útil
Figura 13.18 Precio del petró óleo para calefacció ón: real contra pronostiicado.
26
PARTE P TRES: Mod delos de ecuacion nes múltiples
Figura 13 3.19 Producció ón del petróleo para p calefacció ón: pronóstico contra rea al.
Figura 13 3.20 Inventario o de petróleo para caleffacción: pronóstico o contra real.
sólo para prronóstico a corto plazo. Lass figuras 13.188 a 13.20 señalan los pronóósticos dentro o de la muesttra del precio o, la produccción y el inveentario para los l primeros seiis meses de 11988. Aquí el modelo hacee un mejor traabajo al capturrar los puntos de d viraje en loos datos.
CAPÍTULO 13: Introducción a los modelos de simulación
13.6
427
MODELADO CON DATOS LIMITADOS Nuestro análisis de los modelos de simulación de ecuaciones múltiples se ha enfocado en gran medida en modelos econométricos. Uno de los criterios que usamos para juzgar o evaluar un modelo de simulación fue el grado de ajuste estadístico de las ecuaciones individuales del modelo, Señalamos que si el modelo contenía varias ecuaciones que no se ajustaban bien a los datos o eran de algún otro modo insignificantes desde el punto de vista estadístico, se podría cuestionar la validez del modelo en su conjunto. Sin embargo, esto no significa que la estimación econométrica sea esencial para la construcción de un modelo de simulación. Hay otros enfoques del modelado. Una aplicación fundamental de la simulación de ecuaciones múltiples es en la planificación financiera corporativa. En un modelo de simulación financiera las ecuaciones describen la estructura contable financiera de una corporación particular, junto con algunas reglas de decisión que describen pagos de dividendos, problemas de bonos, etc. Dado que todas las ecuaciones son relaciones contables o reglas de decisión (en oposición a las relaciones de comportamiento), el modele consiste en un conjunto de identidades y no hay una estimación implicada. Los modelos de simulación financiera pueden ser útiles para pronosticar y analizar el impacto de las estrategias financieras alternativas en el desarrollo de una compañía. Al simular un modelo así en el futuro usando suposiciones diferentes sobre capitalización, deuda, flujos de ingresos futuros, etc. podemos generar hojas de balance pro forma y declaraciones de ingresos que pueden proporcionar un insumo útil para la planificación corporativa.17 Se puede presentar el caso en el que un modelo de simulación se construya sin el uso de estimación econométrica. Supóngase que se desea construir un modelo para ser simulado sobre un horizonte temporal muy largo, quizá 100 años. Un modelo así se puede usar para explicar el crecimiento económico a largo plazo, los cambios en las tasas de población y de fertilidad, o algún otro proceso económico, social o político que evolucione despacio durante un periodo largo. Pero podrían no existir datos para muchas de las variables en un modelo así. Una razón para esto podría ser que algunas de las variables son inobservables y por tanto inmensurables; un ejemplo son algunos parámetros de actitudes en un modelo sociológico. Por otra parte, la variable puede ser observable, pero quizá nunca se recopilaron datos, como sucede a menudo en países menos desarrollados. Por último, los datos pueden estar disponibles, pero sólo por un periodo corto, digamos 10 o 20 años. Aun si los datos se usaran para estimar los coeficientes del modelo, las estimaciones resultantes podrían tener un significado limitado cuando el modelo se simulara por un periodo largo. En esta situación el constructor del modelo puede comenzar por especificar un conjunto de relaciones hipotéticas. En el caso de un modelo econométrico, estas relaciones se estimarían y probarían ajustándolas a los datos disponibles.
17 Para un ejemplo de un modelo de simulación financiera, véase J.M. Warren y J.P. Shelton, "A Simultaneous Equation Approach to Financial Planning", Journal of Finance, diciembre de 1971.
428
PARTE TRES: Mod delos de ecuacion nes múltiples
Si no se disp pusiera de dattos, se podríaa especificar vvalores para los l coeficientes con base en datos individduales esporáddicos promeddio, o quizá enn la opinión de d "expertos". Un probblema que preesenta esta téccnica de modeelado es que no proporcionna una verificaación de la seensatez de laas relaciones individuales que forman el modelo. Daddo que el consstructor del moodelo es libre de seleccionaar los valores de d coeficiente en e lugar de ajuustados a los datos, se vueelve posible ajjustar los coefficientes hastaa que el modello logra reprod ducir los datoss históricos. En E un caso así el modelo pueede parecer siimular bien aun a cuando las relacioness que van en él son en grann medida inváálidas, de moodo que el m modelo en sí es inválido en e función de sus s pronósticoos o implicaciiones políticaas. Cualquiera que consttruya un moddelo economéétrico debe saaber que ajusttar las relacionees hipotéticas a los datos reeales proporciiona una verifficación impoortante a los constructores c del modelo, obligándolos a probar esstadísticamennte cada una de las relacionees especificaddas en forma ooriginal. Estaa comprobacióón falta en el enfoque del m modelado sin datos, de modo que este enfoque e debeerá usarse sólo con c una gran pprecaución.18 Los moddelos de simuulación han enncontrado aceeptación y aplicación en unna amplia varieedad de discipplinas de las ciencias socialles. Se han coonstruido moddelos de simullación sociolóógica y políticca combinandoo los métodoss de estimacióón econométricca con las técnnicas sin datoos descritas anntes. En algunnos casos estoos esfuerzos dee modelado hhan dado com mo resultado aavances metoodológicos paara poder abordaar situacioness cuando los datos d son limittados o poco fiables. f Aunquue la perspectiv va de este libbro se limita en gran meddida a modellos econométrricos de la ecconomía, merrcados individduales y emppresas individduales, el lecttor deberá estar consciente dde que la apliccabilidad de laas técnicas quue estamos prresentando es bastante ampplia. EJERCICIO OS 13.1 El error de simulaciónn rms sanciona fuertemente los errores indiviiduales grandess. En qué casos es un criterio de desempeñoo más o menos recomendablee que el error de d media absoluta (MAE), el ccual se define como: c
13.2 El error medio puede sser pequeño au un cuando el errror rms es gran nde si los errorres positivos y neegativos se canccelan. ¿En qué situación el errror medio propporciona inform mación útil paraa evaluar un moodelo que no es e proporcionaddo por el error rms? 18 Uno dee los defensores más prominentees del método dee modelado sin datos d ha sido J.W W. Forrester, quienn ha construido m modelos de, entre otras cosas, la diinámica del creciimiento urbano y el uso de recursos mundiales. Véasse J.W. Forrester,, Urban Dynamiccs (Cambridge, Mass.: M M.I.T. Preess, 1969); J.W. Forrrester, World Dynnamics (Cambridgge, Mass.: Wright--Allen, 1971), y D. D Meadows y cols., The Limits to Grrowth (Cambridgge, Mass.: Wright--Allen, 1972). El trabajo de Forresster ha sido criticaado debido a que muchas m de las relaaciones usadas enn sus modelos no han sido justifficadas o validadaas; véase, por ejem mplo, W.D. Norddhaus, "World Dynamics: D Meassurement withoutt Data", Econom mic Journal, vol. 266, diciembre de 19974.
CAPÍTULO 13 3: Introducción a lo os modelos de sim mulación
429
133.3 A continuacción se presentaan dos conjunttos de series reaales y pronosticadas. Nótese quue las series en el segundo coonjunto son igu uales al primer conjunto increementadas por 10 00.
Caalcule los errorees de simulacióón rms y los cooeficientes de desigualdad d de Theil para las doos variables xt y yt. Descompoonga los coeficcientes de desiggualdad en las proporciones UM, Us y Uc e inteerprete los resuultados. 13.4 Reexaminee la simulaciónn histórica del modelo m macroeeconométrico dee cuatro ecuacio ones en las figuuras 13.6 a 13.99. Basado en essta simulación histórica (y en el modelo en sí) explique por qué q el pronósticco ex post (figuuras 13.10 a 133.13) sobrepreddice el PIB. 13.5 Especifique, estime y sim mule su propio modelo m macroeeconométrico. Use U el conjunto de datos del cuadro c 13.5; [L Las ecuaciones (13.14) a (133.17) se puedeen usar como pu unto de partida.]] Realice pronóósticos ex post y ex ante y evaalúe dichos pron nósticos. Si es posible, experimeente con técniccas de estimaciión alternativass. Intente mejoorar el desempeñ ño del modelo de cuatro ecuaciones en el texxto. (La experieencia obtenida en esta clase de ejercicios es in nestimable en el aprendizaje del arte de la cconstrucción dee modelos.) 13.6 Considere un u sistema de ε ecuaciones. Demuestre D que ssi cada una de las ε ecuaciones tiene exactam mente el mismoo conjunto de variables v en el lado derecho (incluyendo el miismo número de d rezagos), laa estimación apparentemente no relacionadaa produce las miismas estimacioones de coeficiiente que los OLS. O 13.7 Como se puuede esperar, laa demanda de petróleo p para la l calefacción tiene t un compo onente estacion nal fuerte. Com mo resultado, ess probable quee un modelo deel mercado de pettróleo para callefacción (sea estructural o una u VAR) se ddesempeñe mejjor si en él se inccluyen variablees indicadoras estacionales. e U Usando el conjuunto de datos qu ue aparece en el cuadro 13.6, construya una V VAR para el prrecio, producciión e inventario o del petróleo parra calefacción,, que incluya vvariables indicaadoras mensualles para los térrminos del interrcepto en cada una de las tress ecuaciones. Además, A experiimente con differentes cantidades de rezagoss. ¿En qué meddida cambian los l pronósticoss de las tres vaariables endógennas si el númerro de rezagos sse extiende de, digamos, ,8 a 12 meses?
CU UADRO 13.5 CO ONJUNTO DE DA ATOS MACROE ECONÓMICOS O Obs.
C
19 950-1 19950-2 19950-3 19950-4
711.9 725.8 754.8 740.5
I
201.9 226.1 241.6 270.3
R
11.117 11.166 11.232 11.353
PIB B
G
M
1139.7 7 1173.3 3 1226.0 0 1257.2 2
225.9 221.4 229.6 246.4
4449.5 4453.7 450.3 445.0
430
PARTE TRES: Modelos de ecuaciones múltiples
CUADRO 13.5 CONJUNTO DE DATOS MACROECONÓMICOS (Continuación)
Obs. 1951-1 1951-2 1951-3 1951-4 1952-1 1952-2 1952-3 1952-4 1953-1 1953-2 1953-3 1953-4 1954-1 1954-2 1954-3 1954-4 1955-1 1955-2 1955-3 1955-4 1956-1 1956-2 1956-3 1956-4 1957-1 1957-2 1957-3 1957-4 1958-1 1958-2 1958-3 1958-4 1959-1 1959-2 1959-3 1959-4 1960-1 1960-2 1960-3 1960-4 1961-1 1961-2 1961-3 1961-4 1962-1 1962-2 1962-3 1962-4 1963-1 1963-2
C 754.4 740.3 747.8 752.3 754.7 768.1 772.7 790.0 799.8 803.7 803.1 803.3 807.1 814.3 827.3 842.3 855.3 869.1 878.0 892.7 895.1 896.5 899.2 908.4 914.3 916.2 922.6 925.7 916.5 926.0 939.7 949.4 964.3 977.2 986.3 989.6 997.1 1009.8 1005.7 1007.8 1009.5 1023.5 1024.6 1042.9 1053.6 1063.6 1072.8 1085.8 1094.1 1100.2
I
R
241.6 249.0 233.8 216.2 219.9 199.9 206.6 220.8 222.3 225.1 217.4 201.5 203.2 206.4 215.0 225.7 245.1 260.8 264.3 268.9 262.1 258.3 257.1 253.8 248.6 245.3 249.2 230.3 210.9 206.2 222.2 246.4 261.7 283.1 262.4 274.1 288.7 261.4 258.3 233.6 238.3 249.1 270.5 278.4 287.7 291.2 294.7 280.7 291.9 306.9
1.400 1.532 1.627 1.649 1.640 1.677 1.828 1.923 2.047 2.202 2.021 1.486 1.083 .814 .869 1.036 1.256 1.514 1.861 2.349 2.379 2.596 2.596 3.063 3.171 3.157 3.382 3.343 1.838 1.017 1.710 2.787 2.800 3.019 3.533 4.299 3.943 3.092 2.390 2.360 2.376 2.324 2.324 2.475 2.739 2.716 2.858 2.803 2.909 2.941
PIB 1281.9 1307.6 1329.6 1335.3 1351.7 1355.6 1376.0 1409.1 1434.0 1449.0 1440.9 1428.3 1407.7 1399.7 1414.7 1432.9 1465.2 1488.2 1505.5 1520.6 1517.2 1519.7 1518.7 1529.8 1542.3 1543.1 1553.9 1537.2 1513.9 1524.9 1559.0 1600.5 1625.3 1659.1 1645.8 1659.0 1681.0 1673.8 1670.8 1651.5 1667.5 1695.0 1721.8 1760.9 1787.3 1801.7 1819.6 1819.1 1841.2 1861.5
G 285.9 318.3 348.0 366.8 377.1 387.6 396.7 398.3 411.9 420.2 420.4 423.5 397.4 379.0 372.4 364.9 364.8 358.3 363.2 359.0 360.0 364.9 362.4 367.6 379.4 381.6 382.1 381.2 386.5 392.7 397.1 404.7 399.3 398.8 397.1 395.3 395.2 402.6 406.8 410.1 419.7 422.4 426.7 439.6 446.0 446.9 452.1 452.6 455.2 454.4
M 432.8 433.0 439.1 439.4 442.5 445.7 447.6 452.1 453.8 455.1 455.3 454.0 450.9 453.0 459.1 464.6 469.6 473.0 474.6 474.2 475.4 472.9 468.7 467.5 464.6 461.1 457.0 453.0 447.4 449.6 454.2 458.5 464.0 466.3 467.1 460.0 459.2 455.7 459.4 455.8 458.0 461.5 462.2 465.4 467.3 468.4 466.4 467.7 471.9 474.8
CAPÍTULO 13: Introducción a los modelos de simulación
CUADRO 13.5 CONJUNTO DE DATOS MACROECONÓMICOS (Continuación)
Obs. 1963-3 1963-4 1964-1 1964-2 1964-3 1964-4 1965-1 1965-2 1965-3 1965-4 1966-1 1966-2 1966-3 1966-4 1967-1 1967-2 1967-3 1967-4 1968-1 1968-2 1968-3 1968-4 1969-1 1969-2 1969-3 1969-4 1970-1 1970-2 1970-3 1970-4 1971-1 1971-2 1971-3 1971-4 1972-1 1972-2 1972-3 1972-4 1973-1 1973-2 1973-3 1973-4 1974-1 1974-2 1974-3 1974-4 1975-1 1975-2 1975-3 1975-4
C
I
R
PIB
G
M
1115.5 1123.6 1145.2 1164.4 1184.8 1188.0 1208.2 1221.7 1242.3 1273.2 1287.6 1293.1 1305.5 1309.5 1319.4 1336.5 1343.3 1351.5 1378.1 1396.7 1421.5 1427.1 1442.9 1451.7 1459.9 1472.0 1481.5 1488.1 1501.3 1497.2 1520.9 1533.0 1541.0 1560.1 1581.8 1607.9 1629.9 1667.8 1689.9 1687.2 1694.5 1686.8 1667.5 i 677.2 1686.7 1664.7 1677.1 1706.0 1723.9 1740.4
315.6 314.0 324.7 323.6 324.5 330.8 362.1 364.3 369.9 371.8 396.9 390.9 389.1 385.2 368.7 361.7 378.8 388.4 387.7 397.2 392.0 390.2 412.0 409.1 419.5 400.5 379.9 376.4 390.6 379.3 415.5 423.1 425.9 412.8 439.5 462.3 473.8 486.0 515.7 521.7 511.4 534.2 501.1 496.5 465.5 462.2 370.6 358.1 394.4 410.1
3.280 3.499 3.538 3.481 3.504 3.685 3.899 3.879 3.859 4.158 4.630 4.597 5.047 5.246 4.533 3.657 4.344 4.787 5.064 5.510 5.226 5.580 6.137 6.240 7.046 7.317 7.262 6.752 6.374 5.358 3.863 4.206 5.050 4.234 3.435 3.748 4.241 4.851 5.639 6.608 8.388 7.461 7.600 8.268 8.286 7.336 5.873 5.400 6.336 5.684
1895.2 1903.1 1939.1 1960.7 1979.6 1989.9 2039.9 2066.8 2103.7 2150.8 2198.0 2207.4 2236.5 2246.4 2257.3 2271.3 2301.2 2323.1 2355.9 2394.4 2414.5 2416.3 2448.1 2456.8 2469.8 2457.8 2440.0 2434.2 2463.5 2447.1 2504.0 2520.1 2533.8 2540.3 2597.7 2644.3 2669.8 2719.9 2778.1 2777.5 2761.7 2785.2 2736.4 2753.9 2724.8 2699.0 2625.2 2641.3 2700.4 2737.3
464.1 465.5 469.2 472.7 470.3 471.1 469.6 480.8 491.5 505.8 513.5 523.4 541.9 551.7 569.2 573.1 579.1 583.2 590.1 600.5 601.0 599.0 593.2 596.0 590.4 585.3 578.6 569.7 571.6 570.6 567.6 564.0 566.9 567.4 576.4 574.1 566.1 566.1 572.5 568.6 555.8 564.2 567.8 580.2 572.6 572.1 577.5 577.2 582.1 586.8
477.6 479.8 481.8 484.7 491.3 495.5 498.2 497.6 501.7 507.8 511.8 511.8 506.2 503.1 507.1 510.7 518.0 521.3 521.9 525.4 528.3 533.7 536.5 532.7 527.6 523.2 521.4 518.0 519.3 521.2 524.7 530.8 534.1 536.5 542.5 547.7 554.3 562.5 565.2 560.0 556.1 548.4 542.1 532.8 522.7 511.9 505.2 506.7 505.4 500.9
431
432
PARTE TRES: Modelos de ecuaciones múltiples
CUADRO 13.5 CONJUNTO DE DATOS MACROECONÓMICOS (Continuación)
Obs.
C
I
1976-1
1777.5
444.7
1976-2 1976-3 1976-4 1977-1 1977-2 1977-3 1977-4 1978-1 1978-2 1978-3 1978-4 1979-1 1979-2 1979-3 1979-4 1980-1 1980-2 1980-3 1980-4 1981-1 1981-2 1981-3 1981-4 1982-1 1982-2 1982-3 1982-4 1983-1 1983-2 1983-3 1983-4 1984-1 1984-2 1984-3 1984-4 1985-1 1985-2 1985-3 1985-4 1986-1 1986-2 1986-3 1986-4 1987-1 1987-2 1987-3 1987-4 1988-1
1790.4 1809.9 1837.8 1863.7 1869.0 1888.0 1914.2 1923.0 1960.8 1970.3 1989.7 1997.5 1994.1 2007.9 2018.0 2015.4 1974.1 1996.3 2015.6 2022.9 2022.4 2031.5 2020.0 2031.2 2041.0 2051.8 2078.7 2094.2 2135.1 2163.0 2191.9 2212.1 2246.7 2257.3 2281.1 2314.1 2337.0 2376.1 2383.2 2409.7 2434.3 2477.5 2480.5 2475.9 2487.5 2520.7 2504.6 2527.9
454.9 452.8 461.8 492.0 519.0 546.9 527.2 544.0 584.6 583.3 595.8 582.2 590.1 575.7 552.9 556.7 499.2 467.7 513.5 552.3 551.2 560.7 517.9 464.2 467.5 448.6 408.8 427.1 486.9 524.8 577.2 655.2 658.4 664.2 655.7 632.1 645.7 623.2 643.3 674.4 665.6 645.0 631.0 671.8 673.7 681.9 723.1 741.8
R
PIB
G
M
4.953
2804.6
582.4
502.2
5.168 5.168 4.698 4.624 4.828 5.472 6.137 6.408 6.481 7.315 8.680 9.357 9.372 9.631 11.804 13.459 10.049 9.235 13.709 14.369 14.829 15.087 12.023 12.895 12.359 9.705 7.935 8.081 8.419 9.186 8.793 9.133 9.843 10.343 8.973 8.183 7.523 7.103 7.146 6.886 6.130 5.533 5.340 5.533 5.733 6.033 6.003 5.760
2825.6 2842.1 2878.6 2935.9 2975.5 3029.8 3035.0 3059.5 3146.7 3165.1 3196.6 3186.4 3191.1 3194.9 3182.6 3189.9 3098.4 3085.1 3147.0 3201.5 3200.0 3222.4 3173.8 3130.0 3138.2 3142.9 3147.6 3170.5 3272.9 3341.4 3411.3 3520.3 3585.3 3606.0 3630.0 3649.6 3694.8 3737.9 3780.2 3821.7 3851.5 3879.7 3883.3 3907.3 3927.9 3974.3 4016.6 4035.7
580.3 579.4 579.0 580.2 587.5 594.9 593.6 592.5 601.3 611.5 611.1 606.7 606.9 611.3 611.7 617.8 625.1 621.1 617.9 626.3 626.4 630.2 635.9 634.6 629.7 642.5 660.1 649.2 650.9 653.6 642.2 653.0 680.2 684.5 693.2 703.4 712.1 738.6 753.7 737.6 751.6 757.2 771.8 759.6 766.7 771.7 788.9 766.0
505.5 502.6 505.3 508.1 507.7 509.4 513.0 513.6 514.1 512.5 509.6 503.3 496.1 497.2 487.6 473.9 451.1 464.9 465.3 455.3 453.7 448.9 447.1 451.2 447.1 449.1 464.9 475.8 484.3 493.6 496.4 497.4 500.4 501.5 502.1 510.9 518.1 533.8 543.2 553.4 576.7 598.0 620.0 631.8 634.8 630.1 630.5 631.5
CAPÍTULO 13: Introducción a los modelos de simulación
433
CUADRO 13.6 CONJUNTO DE DATOS DE PETRÓLEO PARA CALEFACCIÓN Obs. 1979-01 1979-02 1979-03 1979-04 1979-05 1979-06 1979-07 1979-08 1979-09 1979-10 1979-11 1979-12 1980-01 1980-02 1980-03 1980-04 1980-05 1980-06 1980-07 1980-08 1980-09 1980-10 1980-11 1980-12 1981-01 1981-02 1981-03 1981-04 1981-05 1981-06 1981-07 1981-08 1981-09 1981-10 1981-11 1981-12 1982-01 1982-02 1982-03 1982-04 1982-05 1982-06 1982-07 1982-08 1982-09 1982-10 1982-11 1982-12 1983-01 1983-02 1983-03 1983-04 1983-05 1983-06 1983-07 1983-08 1983-09
Precio 53.08 62.67 60.01 57.82 99.50 88.01 76.76 74.72 81.17 83.52 88.51 79.67 77.26 71.07 74.42 77.20 75.75 74.89 75.74 73.80 77.21 81.16 90.33 94.49 102.61 99.90 92.04 92.88 90.21 90.11 92.13 92.77 94.07 98.39 102.54 98.27 89.75 94.47 79.66 91.89 91.79 93.39 88.13 93.33 99.57 99.35 89.86 83.38 77.57 75.04 74.83 86.56 77.51 80.03 81.72 83.38 80.11
Producción 94.33 80 86 93.58 88.35 95.04 94.59 102.42 102.96 100.60 100.70 97.17 99.85 93.43 80.21 79.29 73.83 76.69 79.41 83.39 76.32 80.58 80.29 81.09 89.62 92.65 78.65 77.00 72.54 76.07 75.03 74.24 82.33 78.30 77.03 81.48 88.53 80.32 67.95 70.92 70.74 81.15 81.87 84.75 77.71 79.71 87.97 85.80 82.30 71.95 59.78 61.78 65.13 75.76 76.38 80.72 81.06 82.17
Reservas 175 127 112 1)5 123 141 171 195 220 231 236 228 212 192 178 177 183 197 214 226 232 226 222 205 179 173 164 165 172 180 186 200 207 201 200 192 164 147 126 108 114 124 148 159 161 170 186 179 168 148 118 103 109 114 131 142 154
Obs. 1983-10 1983-11 1983-12 1984-01 1984-02 1984-03 1984-04 1984-05 1984-06 1984-07 1984-08 1984-09 1984-10 1984-11 1984-12 1985-01 1985-02 1985-03 1985-04 1985-05 1985-06 1985-07 1985-08 1985-09 1985-10 1985-11 1985-12 1986-01 1986-02 1986-03 1986-04 1986-05 1986-06 1986-07 1986-08 1986-09 1986-10 1986-11 1986-12 1987-01 1987-02 1987-03 1987-04 1987-05 1987-06 1987-07 1987-08 1987-09 1987-10 1987-11 1987-12 1988-01 1988-02 1988-03 1988-04 1988-05 1988-06
Precio 78.91 80.40 86.82 99.87 79.29 78.22 86.13 80.07 76.66 70.38 77.33 81.47 76.58 79.31 72.68 75.95 80.60 79.39 78.42 70.30 68.30 68.94 76.96 82.53 87.40 93.19 84.40 61.97 59.95 37.04 48.32 37.99 36.85 31.77 42.05 39.88 39.32 43.27 48.40 55.03 43.25 50.02 49.82 49.51 53.43 53.95 51.66 53.52 57.59 58.16 53.40 49.81 49.37 47.58 54.02 46.31 40.52
Producción 83.11 80.40 78.18 80.32 83.14 76.84 70.26 81.34 86.40 84.28 82.49 81.21 83.42 84.78 86.73 81.56 70.11 70.27 74.70 83.26 79.41 82.02 80.35 77.82 89.96 93.06 98.45 89.86 71.76 81.93 83.64 88.59 81.87 84.01 90.58 85.95 84.22 87.51 91.23 85.99 72.07 73.90 76.59 79.51 80.67 83.70 84.04 82.50 86.11 91.29 100.42 93.24 77.80 84.32 86.07 90.86 86.79
Reservas 163 161 140 119 132 110 98 98 113 124 133 143 152 161 161 142 121 99 97 104 110 116 114 117 123 140 144 136 112 99 96 99 108 119 138 152 152 158 155 141 124 110 100 102 104 115 125 127 121 129 134 127 110 89 94 104 111
CAPÍTULO
14
COMPORTAMIENTO DINÁMICO DE LOS MODELOS DE SIMULACIÓN
En este capítulo nos enfocaremos en el comportamiento dinámico de los modelos de simulación de ecuaciones múltiples. Debido a que un modelo de simulación es un conjunto de ecuaciones de diferencia que pueden resolverse en forma simultánea a lo largo del tiempo, es importante conocer las propiedades de las soluciones de ecuaciones de diferencia. Deseamos saber, por ejemplo, qué hace oscilar a la solución de una ecuación de diferencia (o un conjunto de ecuaciones de diferencia), ya que el comportamiento oscilatorio es fundamental en un modelo diseñado para explicar (o pronosticar) fenómenos de mercado cíclicos. Comenzaremos, entonces, por revisar las ecuaciones de diferencia y sus soluciones. Los modelos de simulación a menudo se usan para analizar y comparar las respuestas a corto y a largo plazo de una variable a otra variable. La segunda sección de este capítulo estudia los multiplicadores dinámicos y la respuesta dinámica. Podremos conocer, por ejemplo, que un cambio en el precio puede dar como resultado un cambio en la demanda de algún bien, pero ¿cuánto tiempo le toma a ese cambio en la demanda para ocurrir? Sabemos que un incremento en los gastos gubernamentales da como resultado un incremento en el PIB con un efecto multiplicador, pero el tamaño de ese multiplicador depende de cuánto tiempo pase después de que se incrementa el nivel del gasto gubernamental. En la exposición de los multiplicadores dinámicos y las elasticidades dinámicas, se puede observar el uso de los modelos de simulación como una herramienta para analizar la respuesta dinámica de un conjunto de variables económicas a los cambios en otras variables. También veremos, en la sección 14.3, cómo se puede usar la función de respuesta al impulso para analizar el comportamiento dinámico de una autorregresión vectorial. En la cuarta sección de este capítulo describiremos cómo se puede ajustar un modelo de simulación para mejorar su capacidad de pronóstico o su capaci434
CAPÍTULO 14: Comportamiento dinámico de tos modelos de simulación
435
dad para proporcionar información respecto a políticas alternativas. Como veremos, la mala especificación o la estimación sesgada en una parte de un modelo puede causar que el modelo completo se desempeñe en forma deficiente en un contexto de simulación. El capítulo finaliza con un breve análisis de la simulación estocástica. Dado que las ecuaciones de un modelo econométrico se estiman ajustándolas a los datos, los estimadores de los parámetros resultantes son en sí mismos variables aleatorias. Además, cada ecuación tiene un término del error aditivo implícito asociado con ella. La simulación estocástica nos permite reconocer, en forma clara, este carácter aleatorio del modelo, junto con los errores de simulación que implica. Asimismo, esta simulación es útil cuando se emplea un modelo para pronóstico, ya que nos permite obtener intervalos de confianza para el pronóstico.
14.1
COMPORTAMIENTO DEL MODELO: ESTABILIDAD Y OSCILACIONES La riqueza estructural de un modelo de simulación de ecuaciones múltiples dificulta un poco construirlo, analizarlo, evaluarlo y usarlo. En un mundo de ecuaciones sencillas la vida es relativamente simple; de manera que una ecuación de regresión puede evaluarse con facilidad con base en su ajuste estadístico y puede usarse directamente para producir un pronóstico. Sin embargo, las cosas pueden no ser tan simples en el caso de un modelo de simulación. Cada una de las ecuaciones de regresión que forman el modelo pueden tener un ajuste estadístico excelente, pero cuando son reunidas y simuladas, los resultados pueden carecer de significado. La razón para esto puede ser que se incorporó en el modelo una inestabilidad estructural que sólo aparece cuando se combinan las ecuaciones y se resuelven en forma simultánea. En esta sección presentaremos las condiciones para determinar la estabilidad (y las oscilaciones) en los modelos lineales simples. En particular, mostraremos cómo estas condiciones no sólo dependen de la estructura del modelo, sino también de los valores estimados de los coeficientes de las ecuaciones individuales. Expondremos, en forma breve, los modelos no lineales, dado que hay pocas herramientas analíticas disponibles para explorar sus propiedades dinámicas. 14.1.1
Modelos lineales
Decimos que un modelo es lineal si todas las ecuaciones de diferencia que lo constituyen son lineales. Los conjuntos de ecuaciones de diferencia lineales pueden resolverse con bastante facilidad, y la determinación de la estabilidad del sistema es relativamente sencilla. Comenzaremos con la demostración del análisis de un modelo lineal para determinar si es estable y/u oscilatorio. Para
436
PARTE TRES: Modelos de ecuaciones múltiples
ilustrar este método consideraremos el ejemplo del modelo simple multiplicador-acelerador de tres ecuaciones que se presentó al principio del capítulo 13: Ct = a1+ a2Yt-1 I t = b 1 + b 2 (Y t - 1
−
Yt-2)
a2 > 0
(14.1)
b2 > 0
(14.2)
Yt = C t + I t + G t
(14.3)
donde C = consumo I = inversión G = gasto gubernamental (exógeno) Y = PIB El análisis comienza combinando las tres ecuaciones en una sola ecuación de diferencia a la cual llamamos ecuación dinámica fundamental. Sustituyendo las ecuaciones (14.1) y (14.2) en la ecuación (14.3), se obtiene como ecuación dinámica fundamental la siguiente ecuación de diferencia de segundo orden para Yt : Y t − ( a 2 + b2)Y t - 1 + b 2 Y t - 2 = ( a 1 + b1) + G t
(14.4)
Nos corresponde determinar si la variable endógena Yt alcanza un valor de equilibrio nuevo en respuesta a un cambio en la variable exógena Gt y cómo lo realiza. En otras palabras, si en el momento t = 0, Gt se incrementa en 1 y luego permanece fija en ese nivel superior, ¿qué le sucederá a Yt durante todo el tiempo futuro? Por tanto estamos interesados en el patrón por el que Yt alcanza un valor de equilibrio nuevo (si en efecto alcanza un valor de equilibrio nuevo). Este patrón, el cual es llamado solución transitoria para Yt, se obtiene estableciendo el lado derecho de la ecuación dinámica fundamental igual a 0: Y t − ( a 2 + b2)Y t - 1 + b 2 Y t - 2 = 0
(14.5)
y luego asumiendo que la solución de esta ecuación tendrá la forma: Y t = Aλ'
(14.6)
Si la ecuación (14.6) es una solución, deberá satisfacer la ecuación (14.5). Al sustituir la ecuación (14.6) en la ecuación (14.5) y dividir la ecuación entera entre Aλ-2, se obtiene la ecuación característica para nuestro modelo: λ 2 - (a 2 + b 2 )λ + b 2 = 0
(14.7)
Las soluciones a la ecuación característica, a las cuales se les denomina raíces características del modelo, determinan las propiedades de la solución del modelo.
CAPÍTULO 114: Comportamiennto dinámico de loss modelos de simuulación
437
En el ejemplo laa ecuación caaracterística es e cuadrática, y por tanto las raíces caraacterísticas soon fáciles de eencontrar: (14.8) t
Ahora, se tiennen dos soluciiones al modelo: Yt = A1λ1 y Yt = A2λt2, doonde A1 y A2 son s constantes que dependeen del valor innicial que adoopte Yt. Se asuume que las soluuciones tienenn la forma Aλλt pero debido o a que λ1 y λ2 satisfacen la l ecuación t caraacterística, set puede verificcar que A1λ1 y, A2λt2 en efecto son solu uciones. Si susttituimos A1λ1 por Yt en la ecuación (144.5), obtendreemos la ecuacción característica en funciión de λ1 dadoo que se sabe que λ1 es unna solución a la l ecuación t caraacterística, se puede asegurrar que A1λ1 es una soluciónn. De hecho, es fácil ver t t quee si A1λ1 y A2λt2 son solucioones a la ecuacción (14.5), laa suma Yt = A1λ1 + A2λt2 t tam mbién es una solución. s El leector puede veerificar esto sustituyendo A1λ1 + A2λt2 porr y, en la ecuaación (14.5). Dependiendo o de los valorres de a2 y b2, el comportam miento de la solución s se pueede caracterizzar en cuatro formas posibles: 1) la soluución puede ser s estable, con nvergiendo sinn oscilación. Esto E requiere que q tanto λ1 coomo λ2 sean menores m que 1 en n magnitud y no tengan ccomponente im maginario. 2)) La solución n puede ser estaable, converggiendo con ooscilaciones amortiguadas. a Esto ocurree si ambas solu uciones de laa ecuación carracterística so on menores qque 1 en maggnitud pero tiennen componenntes imaginariios. 3) La solu ución puede sser inestable y no oscilatoriia. Esto resultaa si las soluciones de la ecuuación caracteerística son mayores m que 1 en n magnitud pero p no hay ccomponente im maginario. 4)) La solución n puede ser inesstable y oscilaatoria (es deccir, exhibe osccilaciones siempre divergeentes). Esto se produce p si unna o ambas dde las raíces características c s son mayorees que 1 en maggnitud y hay un componennte imaginariio. Es fácil ver cómo estas condiciones, en las raícess característiccas λ1 y λ2 deteerminan el coomportamientto del modeloo, si se recuerrda que la soluución transito oria a la ecuacción dinámica fundamentaal está dada ppor: t
t
Y t = A 1 λ1 + A2 λ2
Es claro que si λ1 o λ2 son mayores m que 1 en magnitudd, la solución crecerá en form ma explosiva,, y si λ1 y λ2 son complejaas (es decir, tiienen componnentes imaginaarios), la solu ución será sinuusoidal (es deecir, oscilará)).1 El tipo de soolución que reesulta dependeerá de los valores de los doos parámetross a2 y b2. Por ejjemplo, si a2 y b2 toman los valores 0.6 y 0.1, respectivaamente, las raícces característticas estarán dadas por:
1 Si las raíces características soon complejas, serán de la forma λ1, λ2 = α ± βi. Estas raíces t t com plejas, cuando so on sustituidas en Yt = A 1 λ1 + A2 λ2 , darán como rresultado una sollución para Y t que será una función n sinusoidal de tiiempo.
438
PARTE TRES: Modelos M de ecuacio ones múltiples
Dado que laa raíz mayor tiene un valoor de 0.5 y que ninguna raííz tiene un componente imaaginario, la soolución será esstable y no osscilatoria. Si a2 y b2 tienen los valores 0.6 y 0.8, respecttivamente, las raíces caraccterísticas seráán:
Ahora, las raíces r caracteerísticas son menores m que 1 en magnitudd, pero tienen un componente imaginario, de modo qu ue la solucióón será establle, sin embarrgo oscilará. El lector puede ver que los valores v de a2 y b2 son 0.6 y 1.5, respectivvamente, y quue darán com mo resultado una u solución que q es inestabble (explosivaa) y oscilatoria, mientras que los valoress de 0.6 y 3.00 darán una solución s que es inestable y no oscilatoriaa. De hecho, en e tanto que a2 y b2 sean menores m que 1,, la solución seerá estable, enntre tanto que si cualquieraa es mayor quue 1, la soluciión será inestab ble. También se puede encoontrar una relación algebraaica entre a2 y b2 que determinará si la sollución es osciilatoria. Las rraíces caracterrísticas [véasee la ecuación (114.8)] tendránn un componente imaginaario si ( 144.9) o
(14.10)
En la figuraa 14.1 el planno está divididdo en regionees que indican n el rango de los valores de los parámetrros que resulttarían en cada uno de los cuatro tipos de soluciones. La región quue indica los valores v de a2 y b2 que daríían una soluciión estable y no o oscilatoria aaparece somb breada.
Figura 14.1 Comporttamiento de la solució ón para el modelo multiplicadorm acelerad dor simple.
CAPÍTULO 1 14: Comportamiento dinámico de loss modelos de simu ulación
439
En la figuraa 14.2 y en el cuadro 14.1 se muestran cuatro c solucioones para Y, corrrespondientes a los cuatroo pares de vallores para a2 y b2 perteneccientes a las cuaatro regiones de d la figura 144.1, es decir, (a ( 2, b2) = (0.6, 0.1), (0.6, 0.88), (0.6, 1.5) y (0.6, ( 3.0). Esstas solucionees comienzann con las conndiciones inicciales Ct = 90,, It = 0, Gt = 10 y Yt = 100. Después de trres periodos Gt se incremennta a 12, y se obttiene una soluución para los ssiguientes 30 periodos. p En cada c caso los valores v 30 y 0 se s usan para loos parámetross a1 y b1, resppectivamente. Para obteneer la ecuacióón dinámica fundamental f para el moddelo de tres ecuuaciones (y poor tanto, las raaíces y la ecuaación características), podrííamos haber com menzado por combinar laas ecuaciones del modelo para cualquiier variable enddógena. Si, poor ejemplo, huubiéramos susstituido las ecuaciones (14..2) y (14.3) Figura 14.2 Simulaciones del d modelo multiplicadoracelerador: Caso I: b2 = 0.1 1; Caso II: b2 = 0.8; Caso III: b2 = 1.5; 1 Caso IV: b2 = 3.0. 3
440
PARTE P TRES: Mod delos de ecuacion nes múltiples
CUADRO 14.1 SIMULACIONE ES DEL MODELO O MULTIPLICAD DOR-ACELERAD DOR
en la ecuaciión (14.1) paraa Ct , tendríam mos la siguiennte ecuación dinámica fundaamental en función fu de Ct:
Es fácil verr que esto prooduce la mism ma ecuación característicaa que la que se origina conn la ecuación (14.7) y porr tanto las m mismas raíces característicaas. También se puede verificcar que resultaaría la misma ecuación e característica si laas
CAPÍTULO 14: Comportamientto dinámico de los modelos de simulación
441
ecuuaciones (14.1 1) y (14.3) fueran sustituiddas en la ecuacción (14.2) paara producir unaa sola ecuación dinámica fundamental en función dde la inversiónn It. Supóngase que q estimamoos los coeficieentes de nuestro modelo y obtenemos vallores para a2 y b2 que dan ccomo resultaddo una solucióón oscilatoriaa (pero establee). ¿Cómo debbería interprettarse el modeelo? Si las osccilaciones en el PIB pronossticadas por el e modelo en una simulaciión histórica no se parecenn al pasado com mportamientoo real del PIB,, deberemos dudar d de la vaalidez del moddelo (aun si las ecuaciones in ndividuales tieenen un buenn ajuste estadísstico). Sin em mbargo, si la perriodicidad y magnitud m de las oscilacionees pronosticaddas por el moodelo tienen un parecido razzonable con eel comportam miento real dee la economíaa, podemos conncluir que la estructura diinámica del modelo m es reepresentativa de la de la ecoonomía real. Por P ejemplo, se s puede trataar de explicar la presencia de d ciclos de neggocios en la econom mía estadoun nidense usaando una interacción muultiplicador-accelerador. A ppartir de la ecuuación (14.8) podríamos en ncontrar un ran ngo de valorees para a2 y b2 que resultaaría en oscilaaciones con periodicidad p cerrcana a la obsservada en loos ciclos de negocios. n Entoonces, podríann realizarse pruuebas estadíssticas para determinar si los datoos podrían apoyar a los vallores de a2 y b2 en ese rangoo. Es probablee qué un modeelo multiplicaador-aceleradoor simple, no fuera suficiente para expliicar los ciclos y otras fluctuuaciones en la economía. Siin embargo, loss mismos prin ncipios se apliican para mod delos más graandes y compllicados.
14 4.1.2
Aná álisis de mod delos más grandes g
Coonforme se haccen más granddes los modelos, se vuelve más difícil un n análisis de su comportamieento dinámicoo y de sus proopiedades. Mientras el moddelo permanezzca lineal, pueede derivarse una ecuaciónn característica, aunque unaa solución a esaa ecuación puede p ofrecerr problemas computacionnales. Considdérese, por ejeemplo, el moddelo macroecoonómico de cuatro c ecuacioones construiddo en el capítu ulo 13 [ecuacciones (13.14)) a (13.17)]. Si S se combinaan las ecuacioones en una solla ecuación diinámica funddamental para Y, la ecuacióón de diferenccia será del quiinto orden: (14.13) La ecuación carracterística tam mbién será dee quinto ordenn y tendrá cin nco solucioness. Una ecuacióón de quinto orden o es más difícil d de resolvver analíticam mente que la ecu uación caracteerística simplee de la ecuación (14.7). Poor tanto, si ell modelo es graande, se vuelvve más difícill un análisis de d sus propieddades. Pueden usarrse programass de cómputo para resolverr ecuaciones característic cass de orden sup perior. De heccho, algunos de d los paquetees para compuutadora que se han escrito para p resolver m modelos de simulación s tam mbién proporrcionan una sollución de la ecuación e caraccterística, ya sea en formaa directa, si ell modelo es lineeal, o para unna linealizacióón del modeloo alrededor dde una solucióón de simulación particularr si es no lineal. Por consig guiente podem mos examinarr las raíces
442
PARTE TRES: Modelos de ecuaciones múltiples
características de un modelo; aquellas raíces que excedan de 1 en magnitud producirán inestabilidades en el modelo, y aquellas que son complejas (es decir, que tienen componentes imaginarios) contribuirán al comportamiento oscilatorio. Un modelo grande puede tener algunas de sus raíces características mayores que 1 (y algunas que son complejas) pero todavía son útiles como una herramienta de pronóstico. Si hay un número reducido de raíces que sólo son ligeramente mayores que 1, sus efectos desestabilizadores pueden ser mínimos, volviéndose evidentes sólo si el modelo es simulado por un horizonte temporal largo. Es decir, la importancia de la estabilidad del desempeño de pronóstico de un modelo depende de la longitud del pronóstico. En el modelo simple de las ecuaciones (14.1) a (14.3), es fácil determinar si la solución fue estable y si un cambio pequeño en uno de los coeficientes (es decir, a2 o b2) puede cambiar la solución característica de estable a inestable. Supóngase, por ejemplo, que los valores estimados de a2 y b2 producen una solución estable y no oscilatoria y queremos saber si un cambio pequeño en a2 dará como resultado un comportamiento inestable. Es muy fácil determinar de manera analítica si éste sería el caso, dado que sólo es necesario observar la forma en que cambia la solución de la ecuación característica como resultado del cambio en a2. Sin embargo, este análisis es difícil si el modelo es grande. Aun si se pueden determinar las raíces características para el modelo, es probable que no podamos determinar cómo se relacionan esas raíces características con los coeficientes individuales en el modelo. Por lo general, no se puede decir, sin llevar a cabo una simulación, si un cambio pequeño en uno de los coeficientes moverá la solución de estable a inestable o de no oscilatoria a oscilatoria. Si el modelo es no lineal, la situación es aún más difícil, debido a que no se puede usar la solución de una ecuación característica para que nos diga sobre la estabilidad de la solución. La mayoría de los algoritmos para modelos no lineales implican soluciones iterativas en las que se hace una linealización en cada iteración. Por lo tanto, lo mejor que se puede hacer es derivar un conjunto de raíces características basándose en una linealización respecto a alguna vía de solución nominal. Si estas raíces características son todas menores que 1 en magnitud, la linealización del modelo no lineal (es decir, sobre la vía nominal particular) es estable. Sin embargo, aún no se tiene garantía de que el modelo no lineal completo presentará estabilidad. Los métodos para determinar la estabilidad de modelos no lineales son analíticos y no pueden aplicarse a modelos de tamaño razonable. Como resultado no tenemos una forma simple y directa de determinar la estabilidad de un modelo no lineal.2
2 La mayor parte de los métodos analíticos provienen del campo de la teoría del control. Un enfoque que han considerado de los economistas (llamado metido directo de Lyapunov) proporciona una condición suficiente para la estabilidad en la forma de un teorema de existencia. Si se puede demostrar que cierta función (llamada función Lyapunov) existe para un modelo dado, está garantizado que el modelo es estable. Para un tratamiento detallado del análisis dinámico de los modelos lineales y no lineales, véase G.C. Chow, Analysis and Control of Dynamics Economic Systems {Nueva York: Wiley, 1975).
CAPÍTULO 14: Comportamiento dinámico de los modelos de simulación
443
¿Cómo se pueden determinar las propiedades de solución para un modelo de ecuaciones simultáneas no lineal grande? Por lo general, en un modelo se realizan una serie de simulaciones a lo largo de diferentes periodos y usando diferentes vías de tiempo para las variables exógenas. Si el modelo es no lineal y complejo, lo que se puede hacer para determinar si es estable a largo plazo es simular durante un periodo largo. Del mismo modo, al analizar la sensibilidad del modelo a los cambios en los parámetros, a menudo lo más simple (y lo más revelador) es hacer experimentos de ensayo y error con valores de parámetro. Después de experimentar con modelos durante un periodo, normalmente, se obtiene una sugerencia de las características del modelo y la forma en que se determinaron.
14.2
COMPORTAMIENTO DEL MODELO: MULTIPLICADORES Y RESPUESTA DINÁMICA Con frecuencia construimos modelos para predecir cómo es probable que afecte un cambio en una variable a otras variables a lo largo del tiempo. Por ejemplo, se puede construir un modelo macroeconómico, para determinar cómo los cambios en los gastos del gobierno afectarán a los valores futuros del PIB y sus componentes: precios, empleo, etc. También podríamos construir un modelo microeconómico de una industria para pronosticar el impacto futuro en el equilibrio del mercado de cambios en el ingreso personal (u otras variables exógenas determinantes de la demanda), los cambios en la demanda de exportaciones o (si la industria es una regulada) los cambios en la política reguladora del gobierno. En cada caso deseamos hacer afirmaciones acerca de la respuesta dinámica —de la macroeconomía, de una industria o de una empresa—, a los cambios en variables particulares. Una forma de cuantificar esas afirmaciones es calcular y examinar los multiplicadores asociados con las variables exógenas del modelo. En el caso del modelo multiplicador-acelerador de tres ecuaciones simple, las ecuaciones (14.1) a (14.3), se puede determinar qué cambio en Yt resultaría de un cambio de un dólar en Gt (o podríamos determinar el cambio correspondiente en Ct o It). Suponiendo que los parámetros del modelo son tales que la solución de la simulación es estable, podríamos esperar que el incremento inicial en Gt diera como resultado incrementos siempre disminuidos en Yt. Estos cambios en Yt son llamados multiplicadores dinámicos. El cambio inicial (primer periodo) en Yt se llama multiplicador de impacto, mientras que el multiplicador a largo plazo total es la suma de todos los multiplicadores dinámicos a lo largo del tiempo. Por tanto, el multiplicador a largo plazo indica el cambio total a largo plazo en Yt que resulta de un cambio unitario en Gt.
14.2.1
Multiplicadores dinámicos
Regresemos al modelo simple de las ecuaciones (14.1) a (14.3) con valores de parámetro a1 = 30, a2 = 0.6, b1 = 0 y b2 = 0.1. Se pueden obtener los multiplica-
444
PA ARTE TRES: Modelos de ecuacione es múltiples
dores dinám micos en formaa directa de nuestra n simullación del mo odelo en la quue incrementam mos Gt por 2. Tomando T los cambios c en Yt y dividiéndoloos entre 2 (parra corresponderr a un increm mento en Gt de 1), obtendremos los multiplicadore m es dinámicos, taabulados en eel cuadro 14.22. También, en este cuadroo 14.2 se muestran los mulltiplicadores ddinámicos quue resultan paara a2 = 0.6 y b2 = 0.8, loos cuales son oscilatorios. o E multiplicad El dor de impaccto es el camb bio del primeer periodo iniciial en Yt (1.0)), y el multiplicador total a largo plazoo es la suma dde todos los muultiplicadores ddinámicos. Nóótese que en aambos casos el e multiplicadoor total a largo plazo p es 2.50. Las dos solucciones son basstante diferenttes, pero ambaas le dan a Yt ell mismo valorr de equilibrioo. El multiiplicador de im mpacto tambbién puede determinarse enn forma alge-braica. Primeero, reescribim mos la ecuaciión (14.4) com mo: (14.144) Ahora, tomaando las primeras diferencias a lo largo de esta ecuacción, (14.155) vemos que para p ∆Gt = 1 eel cambio dell primer perioodo en Yt tambbién será 1. En E general, se pueden p obtenner los multiplicadores de impacto en forma f directa a partir de la versión v de forrma reducida de un modeloo (el coeficiennte de la form ma reducida de cada variablee exógena no rezagada r es eel multiplicador de impactoo
CUADRO 14.2 MULTIPLICADO ORES DINÁMICO OS PARA EL MO ODELO MULTIPL LICADOR-ACELE ERADOR
CAPÍTULO 14: Comportamiento dinámico de los modelos de simulación
445
de esa variable). Sin embargo, los multiplicadores dinámicos restantes, no pueden determinarse por inspección. En su lugar, se debe realizar una simulación en la que cada variable exógena es incrementada en forma apropiada y los cambios resultantes en las variables endógenas se encuentran a partir de la solución de la simulación. Téngase en cuenta que si un modelo es no lineal, los multiplicadores dinámicos dependerán del tamaño de la variación de la variable exógena particular al igual que de los valores iniciales de todas las variables endógenas. El modelo simple de las ecuaciones (14.1) a (14.3) es lineal, de modo que se pueden obtener los mismos multiplicadores incrementando Gt por 4 que los que se obtienen incrementándola por 2 (tan solo dividiríamos los cambios en Yt entre 4 en lugar de 2). Además, los multiplicadores son los mismos, sin importar cuáles sean los valores iniciales de Yt y sus componentes. Sin embargo, esto no sería así, si el modelo fuera no lineal. Con un modelo no lineal, un incremento grande en Gt podría producir multiplicadores diferentes que con un incremento pequeño en Gt , y aquellos multiplicadores también diferirían para diferentes valores iniciales de Yt. Por esta razón, los multiplicadores dinámicos para modelos no lineales deberían presentarse junto con información acerca de la forma en la que fueron calculados.
EJEMPLO 14.1
Modelo St. Louis
Una aplicación de los multiplicadores dinámicos es proporcionada por el modelo St. Louis de Andersen y Carlson del Banco de la Reserva Federal de St. Louis.3 Ellos se propusieron probar la posición monetarista de que sólo el suministro de dinero (y por consiguiente la política monetaria) tiene algún impacto a largo plazo en el PIB y que los gastos gubernamentales casi no tienen un impacto a largo plazo. El modelo incluía, como variables exógenas, los gastos gubernamentales y el suministro de dinero. Se usaron simulaciones para determinar los multiplicadores dinámicos y totales a largo plazo correspondientes a cada una de estas variables exógenas. El resultado fue que el multiplicador total a largo plazo para los gastos gubernamentales estuvo cerca de cero, mientras que el del suministro de dinero fue grande. Este resultado es en gran medida el producto de sólo una de las ocho ecuaciones del modelo, la cual relaciona los cambios en el gasto total ∆Y (en dólares actuales) con los cambios en el suministro monetario ∆M y los cambios en los gastos gubernamentales ∆G. La forma estimada de esta ecuación usa rezagos distribuidos polinómicos, y restringe para que cada una de las variables inde-
3 L.G. Andersen y KM. Carlson, "A Monetarist Model for Economic Stabilization", Federal Reserve Bank of St. Louis. Monthly Review, abril de 1970.
446
PARTE TRES: Mod delos de ecuacion nes múltiples
pendientes se encuentre en un polinom mio de cuarto grado g con la cabeza c y la coola establecidas en 0. La ecuuación se mueestra a continuuación, con laas estadísticass t entre parénteesis:4
Como puede p verse a partir de laa ecuación (14.16), un inccremento en G tendrá iniciaalmente un pequeño impacto positivo een Y, pero deespués de doss o tres trimestrres tendrá un impacto negaativo, con un iimpacto total (a largo plazzo) que está cercca de cero. El suministro dee dinero, en coomparación, tiiene un impaccto a largo plazoo significativoo (Σmi = 1.127 7).
14.2.2
E Elasticidade es dinámicaas
Al construirr un modelo microeconomé m étrico, por lo general estam mos interesaddos en describir la respuesta dinámica d de un na industria particular. p Corrrespondiendoo a los multiplicadores dinámiicos, calculam mos elasticidaddes dinámicas. Una elasticiddad dinámica noss dice cómo ccambiará la deemanda de un bien a lo larggo del tiempo en e respuesta a un cambio enn el precio o en los ingreesos de los coonsumidores. A menudo haccemos afirmaciones sobre la elasticidadd del precio o ingreso de un u bien sin recoonocer de mannera explícitaa que el valor de la elasticiddad depende de d cuánto tiemppo se permitee que transcurrra después dde que el precio o el ingresso
4 Esta ecuaación es de la verrsión de abril de 1979 1 del modelo, estimado por el periodo p de 1953-1 a 1978-4. La form ma de la ecuaciónn difiere sólo ligeeramente de la deel modelo originaal (las tres variables están ahora en cambio porcentuual en lugar de laa forma de primeera diferencia). Para P una exposiciión de cambios en la l especificación, véase K.M. Carlsson, "Does the St. Louis Model Noow Believe in Fiscal
Policy?", Federaal Reserve Bank of St. Louis Review w, vol. 60, febrero de 1978.
CAPÍTULO O 14: Comportamiento dinámico de los modelos de sim mulación
447
Figura 14.3 Elasticidad dinámica.
haan cambiado.5 De hecho, ess más significcativo observaar una elasticiddad dinámica,, coomo: (14.177) Aquí, ∆Pt es unn cambio en ell precio (que ocurre A o en el m momento t) y Qt - τ – Qt es el caambio en canntidad demanddada después de que ha traanscurrido un intervalo de tiempo τ. Otrras elasticidades dinámicaas (ingreso, precio cruzaado, etc.) se puueden definirr de la mismaa forma. Al simularr el modelo ((con un camb bio en el precio), podemoos calcular y trrazar la elasticcidad como una u función del d intervalo dde tiempo τ. Comúnmente C poodemos esperrar que la elastticidad crezcaa monótonameente y se aprooxime a algún vaalor asintótico o, como en la figura 14.3. No N obstante, ees muy posiblle, qué como reesultado de la estructura deel modelo (la cual c esperamoos que refleje la estructura veerdadera del mercado) m la eelasticidad osccilaría (todavía aproximánndose a algún vaalor a largo plazo p asintóticco en tanto que q el modeloo sea estable),, como en la figura 14.4. El comporrtamiehto de llas elasticidad des dinámicass es importannte si un modeelo se está ussando para proonosticar o annalizar el imppacto de un inncremento de prrecio, o un caambio en el pprecio de un bien competiidor, en las ventas de una inndustria (o de una compañíía). El impactto debe descriibirse en térm minos dinámicoos. Es posiblee que un increemento en el precio p originee una caída enn la demanda, peero sólo desppués de que haya transcuurrido un periiodo largo. Sin S embargo, pu uede dar com mo resultado una caída innicial grande en la demanda pero más taarde (despuéss de que las peercepciones de d los consum midores sobre los precios P ∆Q Por definiciión, la elasticidaad del precio de la l demanda = E p = . La elasticidad del I ∆Q Q ∆P in ngreso = E t = . El problem ma es que dada al guna ∆P (o ∆I), ¿cuánto tiempo deberíamos d perQ ∆I m mitir que transcurrra antes de medirr ∆Q? 5
448
PA ARTE TRES: Mode elos de ecuacione es múltiples
Figura 14.4 4 Elasticidad dinámica oscilatoria.
relativos hann cambiado) un incremeento en la demanda, de modo que el e decremento neto n es pequeeño. El tiempo o requerido ppara que ocurrran estos cam mbios es probabble que varíe en e forma conssiderable de unna industria a otra. Debido a esto, una com mpañía que eestá tratando de planear ssu producciónn y comerciaalización anticcipando un cambio prograamado en loss precios debee tener algunna idea de cuántto tiempo pasará antes de que q experimennte un cambio o resultante enn las ventas.
EJEMPLO O 14.2
Demanda de automóviles a
Las caracteríísticas dinámiicas de las elaasticidades soon muy imporrtantes al anaalizar la demaanda de autom móviles. Paraa ver por qué,, examinarem mos un modelo trimestral de la demanda de d automóvilles construidoo por Saúl Hyymans.6 La demaanda de autos (una variable de flujo) deppenderá de las existencias en circulación en e ese momennto, esto propoorciona un meedio para ajusttar las existenncias a algún nivel n deseadoo o de equilibrrio. Por consiiguiente, com menzaremos esscribiendo unaa ecuación parra las existenciias deseadas de d automóvilees KA*: (14.188) donde DI = in ngreso personnal disponiblee, neto de transsferencias, dó ólares de 19588 UM = tasa t de desem mpleo para hom mbres de veinnte años de ed dad en adelantte, p porcentaje PA = un u índice de prrecios real (dóllar constante) de automóvilees (1958 =1.0))
6 S.H. Hymans, "Consumer D Durable Spending: Explanation andd Prediction", Broookings Papers on Economic Activitty, núm. 2, pp. 1733-199, 1970.
CAPÍTULO 1 14: Comportamien nto dinámico de los s modelos de simu ulación
449
Dada esta existencia e deseeada, los gastoos reales brutoss en automóvilles (CARK) puueden describirrse por: (14.19) do onde KA = exxistencias de automóviles real w = taasa trimestral de ajuste enttre existencias deseadas y reales v = taasa trimestral de depreciacción de las exxistencias reales Laa ecuación (14 4.18)'puede suustituirse, enttonces, por KA A* en la ecuaación (14.19) paara producir una u ecuaciónn nueva para CARK. Hym mans agregó una u variable inndicadora liaraa explicar las huelgas conttra General M Motors en 19664 y Ford en 19967 y obtuvo la siguiente ecuación e estimada usandoo datos trimesstrales desde 19954-1 hasta 19 968-4 y una ccorrección Hilldreth-Lu paraa correlación serial:7
Para simular el modelo y pronosticarr los efectos qque producen los cambios dee precio o ing greso, la ecuaación (14.20) se combina ccon la siguiennte identidad paara la existenccia de automóóviles: KA At = (1 - v)KA At - 1 + CARK Kt
(14.21)
Hymans usa un n valor calculado de 0.078 para la tasa de d depreciacióón trimestral v. Las ecuacion nes (14.20) y (14.21) consttituyen, por taanto, un modeelo de simulaación de dos ecuaciones e paara gastes en automóviles. a Este modello implica quee las elasticiddades de preciio e ingreso a largo plazo soon menores enn magnitud que q las elasticcidades a cortto plazo. En particular, p la elaasticidad del precio p a cortoo plazo (impaccto) es -1.07, mientras m que la l elasticidad a largo l plazo es -0.36. La elassticidad de inggreso a corto pplazo es 3.08, mientras m que la elasticidad a largo plazo ees 1.02. La razzón, por supueesto, es el efeecto de ajuste dee las existenccias. Cuando los precios see elevan (o eel ingreso dissminuye) los co onsumidores pueden p reduccir inicialmen nte en forma drástica las compras de au utomóviles nuuevos. Sin em mbargo, despuués de que pasan algunos años, a los automóviles viejo os se habrán ddepreciado, de modo que lass compras de automóviles nuuevos aumentaarán, alcanzanndo un nivel de d equilibrio nnuevo que estáá por debajo, peero no tan abaajo, del que había h antes dee que el preciio aumentara..
7
STRIKE = -2 2 en 1964-4, 1 en n 1965-1 y 1965-2 2, -1 en 1967-4 y 1/2 en 1968-1 y 1968-2.
450
PARTE TRES: Mod delos de ecuaciones múltiples
EJEMPLO O 14.3
Otro modelo o macroeconom métrico
Para otro ejeemplo macroeeconométrico,, observemos un modelo trrimestral consstruido por Kmenta K y Smiith.8 Las ecuaaciones, las cuales fueron estimadas coon datos trimesttrales a lo larrgo de un periodo de 19554 a 1963, usando mínimoos cuadrados dee tres etapas, se muestran a continuaciónn con los erroores estándarees entre parénteesis:
donde Y = producto inteerno bruto C = gastos de connsumo 8 J. Kmentaa y P.E. Smith, "A Autonomous Exp penditures versus Money Supply: An A Application off Dynamic Multip pliers", Review of Economics E and Sttatistics, vol. LV, pp. 299-307, agosto de 1973.
CAPÍTULO 14: Comportamien nto dinámico de lo os modelos de sim mulación
451
Id = dessembolso del productor enn instalacionees y equipo duuradero Ir = con nstrucción ressidencial Ii = inccremento en iinventarios G = com mpras gubernnamentales dee bienes y serrvicios más in nversión extraanjera neta S = ven ntas finales de bienes y serrvicios t = tiem mpo en trimeestres (primerr trimestre dee 1954 = 0) r = renndimiento de todos los bonnos corporativvos, porcentaaje anual M = sum ministro de dinero, es deciir, demanda para p depósitoss más dinero enn circulación ffuera de los bancos TD = deppósitos a plazzo en bancos comerciales c L = suuministro de ddinero más deepósitos a plaazo en bancoss comerciales (reepresentando la riqueza líqquida) Todas las variiables exceptoo t y r se midden en miles de millones de T d dólares de 1958, y las vaariables G, M, TD y t son consideradas exógenas. No o se incluyen p precios ni salarrios en el moddelo, dado quee durante este periodo los precios fueron reelativamente estables. Para exam minar las caraccterísticas dinnámicas de estte modelo, coomenzaremos por escribir la ecuación de forma f reducidda para el PIB B. Ésta se encuuentra expresaando las variaables endógennas actuales en e la ecuaciónn (14.27) en fu unción de las v variables exóggenas y endóggenas rezagad das. Al hacer estas sustituciones se proporciona la sigguiente ecuación de forma reducida:
De D acuerdo coon esta ecuacción, el efectoo de impacto de un increm mento de mil millones m de dóólares en los ggastos gubernnamentales Gt es incremenntar el PIB en 1.1427 mil milllones, mientrras que el efeccto de impactto de un increm mento de mil millones m de dólares d en el suministro de d dinero Mt es incrementtar el PIB en 0.3649 0 mil milllones (0.31688 más 0.0481, dado que Mt es un compoonente de Lt). Antes A de exam minar los mulltiplicadores dinámicos, d deeterminaremos qué tipo de so olución tendrrá el modelo,, encontrandoo las raíces ccaracterísticas. Primero, al su ustituir Ct -1, St -1, Ct -2, Itd-1, Itr-1 e Iti-1 en la eccuación (14.300) obtendremoos la ecuación dinámica d funddamental, la cual c expresa el e PIB actual en función dee sus propios valores v rezagaddos y de los vvalores actualees y rezagadoss de las variabbles exógenas:
452
PA ARTE TRES: Mode elos de ecuaciones múltiples
A partir de laa ecuación (144.31) determinaremos la eccuación caraccterística del m modelo: λ5 - 3.0716λ4 + 3.6561λλ3 - 2.0850λ2 + .5585λ - .00535 = 0
(14.32)
L raíces carracterísticas ((es decir, las soluciones Las s a eesta ecuación)) son: λ1 =.20081
λ2,2 3 = .8475 ± .0809i
λ4,5 = .5843 ± .1156i
Debido a que todas las raícees son menorees que 1 en m D magnitud (λ2 y λ3 tienen unaa magnitud de 0.8513) yya que cuatroo de ellas son complejas, laa solución seráá CUADRO 14.3 C MULTIPLICADO M ORES DEL PIB D DINÁMICOS
Multipllicadores de R Rezago k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Gt - k
Mt - k
Lt - k
t-k
1.14271 .98001 .21029 .03086 - .01519 - .02878 - .03352 - .03539 - .03604 - .03592 - .03520 - .00396 - .03227 - .03024 - .02795 - .02552 - .02303 - .02056 - .01816 - .01589
.3168 83 .2233 30 .1528 87 .1137 72 .0872 22 .0677 75 .0529 91 .0413 35 .0321 10 .0248 87 .0819 96 .0141 10 .0103 36 .0072 29 .0048 86 .0029 95 .0014 48 .0003 37 -.0004 44 -.0010 02
.04811 .04126 .00885 .00130 -.00064 -.00121 -.00141 -.00149 -.11052 -.00151 -.00148 -.00143 -.00136 -.00127 -.00188 -.00107 - .00097 - .00086 - .00076 - .00067
.10341 .11262 .09459 .07525 .05920 .04660 .03679 .02908 .02298 .01808 .01412 .01091 .00820 .00619 .00448 .00312 .00204 .00120 .00055 .00006
CAPÍTU ULO 14: Comportam miento dinámico de los modelos de sim mulación
453
esttable y observvaremos oscillaciones amorrtiguadas. Loss multiplicado ores dinámicos también exh hiben oscilacciones amortigguadas y convvergen hacia 0 conforme la longitud del rezago r de tiem mpo se increm menta, como puede verse en e el cuadro 14.3. Al sumar los l multipliccadores enum merados en ell cuadro, vem mos que el mu ultiplicador tootal a largo plazo para los gastos guberrnamentales es e 1.8406, el del suministro de d dinero (el efecto combiinado de Mt y Lt) es 1.22770 y el de la tenndencia temp poral es 0.63663. Estos resu ultados son bbastante difereentes de los del modelo St. Louis y apoyyan la opiniónn de que tantoo los gastos gubernamentalles como el suuministro de ddinero son efeectivos como instrumentoss políticos.
14.3
LA FUNCIÓ ÓN DE RESP PUESTA AL IMPULSO Y AUTORRE EGRESIONE ES VECTORIAL LES
Loos multiplicaddores dinámicos son una forrma de caractterizar el compportamiento dinnámico de un modelo de siimulación, perro éstos sólo ddescriben la respuesta del moodelo ante caambios en lass variables ex xógenas. Otroo enfoque ess determinar có ómo responde cada variablee endógena a lo largo del tiempo t a un shock s en esa vaariable y en toddas las otras vaariables endógeenas. La funcióón de respuestta al impulso rasstrea la respuuesta de las vaariables endóggenas a esos shocks. Como un ejjemplo, regressemos al moddelo macroecoonométrico sim mple de cuatroo ecuaciones (tres ( identidaddes comportam mentales y unna identidad explicativa) e inttroducido en la sección 13.3. Ese modelo puede escrribirse de la siiguiente maanera:
doonde el consum mo C, la inverrsión I, la tasaa de interés R y el PIB (netto de exportacciones e imporrtaciones) Y sson variables endógenas, e y el e suministro de dinero M y el e gasto guberrnamental G son exógenass. Ahora, connsideremos loss efectos de un u shock, o ccambio en ε1, ε2 y ε3. Un caambio en ε1 afectará a de inmediato al coonsumo y, poor medio de la identidad ex xplicativa del PIB [ecuación (14.36)], a Y. Como resuultado, tambiéén tendrá un efe fecto inmediatto en I y R, coomo puede verrse a partir dee las ecuacion nes (14.34) y (144.35). Habrá mayores cam mbios en todaas las variablles con el traanscurso del tieempo conform me los efectoss iniciales del shock se extiiendan por el modelo. En co omparación, un u cambio en ε3, tendrá un efecto e inmediiato en R peroo afectará a
454
PARTE TRES: Modelos de ecuaciones múltiples
I, y por tanto a C y Y, sólo después de cuatro periodos. Más adelante tendrá mayores efectos en R, a través de la dependencia de R de y, y así en forma sucesiva. La respuesta al impulso es el rastreo de estos efectos. De manera ideal, nos gustaría identificar shocks con variables endógenas específicas de modo que determinemos cómo un cambio inesperado en una variable afecta a todas las variables a lo largo del tiempo. Si el modelo es lineal y si los términos del error no están correlacionados entre sí, esto es sencillo. En un modelo no lineal puede no ser posible, debido a que puede no aparecer una sola variable endógena en el lado izquierdo de cada ecuación. Incluso en un modelo lineal, si los errores están correlacionados, no hay forma simple de identificar sin ambigüedad los shocks con variables específicas. La razón para esto es que los errores tendrán componentes comunes que afectan a más de una variable. Siendo éste el caso (como sucede a menudo), el procedimiento usual es atribuir arbitrariamente todos los efectos de estos componentes comunes a la variable que aparece primero en el sistema. Por ejemplo, si ε1 y ε2 estuvieran correlacionados, atribuiríamos todo el componente común de un shock al consumo y nada de éste a la inversión. Un problema con este procedimiento es que las respuestas al impulso dependerán del orden particular de las ecuaciones en el modelo. Por ejemplo, si la ecuación de inversión hubiera aparecido primero, todos los componentes comunes del shock se habrían atribuido a la inversión en lugar de al consumo. De hecho, para calcular la respuesta al impulso, el modelo debería estar en un equilibrio estable. (Si es necesario, mantener constante cualquier variable exógena y simular el modelo durante un periodo lo bastante largo como para que todas las variables endógenas dejen de cambiar.) Ahora se introduce un shock de un periodo en una de las variables endógenas. Por ejemplo, se incrementa ε1 en, digamos, 1 desviación estándar en el momento t = 0. (El shock se mantiene sólo por un periodo y por lo tanto es un "impulso".) En la medida en que esta variable endógena (en este caso el consumo) afecta a otras variables endógenas, el shock se filtrará por todo el modelo, afectando a todas las variables. Incluso en periodos posteriores puede tener un efecto mayor en la variable endógena original que al principio debido a los efectos de retroalimentación a través de las otras variables. Después se introduce un shock de un periodo a la siguiente variable endógena (por ejemplo, incrementando ε2 en 1 desviación estándar durante un periodo) y de nuevo se rastrean los efectos en todas las variables en el modelo, y así en forma sucesiva para las otras variables endógenas. Este procedimiento en particular es muy adecuado para estudiar autorregresiones vectoriales. Recuerde del análisis en la sección 13.5 que una VAR proporciona un medio que permite que los datos, en lugar del econometrista, determinen la estructura dinámica de un modelo. Por tanto, después de estimar una VAR, es importante poder caracterizar su estructura dinámica con claridad. Las respuestas al impulso hacen esto al mostrar cómo los shocks en cualquier variable se filtran a través del modelo para afectar a todas las demás variables y con el tiempo retroalimentan a la misma variable original.
CAPÍTULO 14: Comportamiento dinámico de lo os modelos de simulación
EJEMPLO 14 4.4
455
Co omportamiento o dinámico dell mercado del petróleo p para lla calefacción
Enn el ejemplo 13.1 desarrolllamos una au utorregresión vectorial paraa modelar el mercado m de pettróleo para callefacción dom méstica. La VA AR que estimaamos relacionaaba valores dee precio actuaales y rezagado os, producciónn e inventario o. Para ver lo quue nos dice el e modelo aceerca de la din námica del m mercado de petróleo p para caalefacción, esstudiaremos laa respuesta dee cada variabble endógena a los shocks en n esa variablee y en las otraas variables enndógenas. Para calcullar estas respuuestas al impu ulso incremenntamos, sólo por p 1 mes, el término del errror en la prim mera ecuación (es decir, la ecuación paraa PHO) en 1 deesviación estáándar y luego calculamos loos efectos inm mediatos y futturos de este caambio de preccio, produccióón e inventario o. Luego repeetimos esto paara un incremento m de 1 dessviación estánndar en el térm mino del errorr en la segunda ecuación y poor último para el término del error en la tercera ecuuación. Por consiguiente, c neecesitaremos conocer las covarianzas estimadas enntre los tres términos t del errror. Las covaarianzas estim madas son las siguientes:
Nótese que loss residuales dde la tercera ecuación N e se ccorrelacionan fuertemente co on los de las primeras p dos ecuaciones. Por P tanto, un shock en ε1, por p ejemplo, teendrá un compponente comúún con ε3. Coomo se expliccó antes, este componente co omún se atribuye al precio. La figura 14.5 1 muestra la l respuesta dee cada variablle a un shock de 1 desviaciión estándar en e el precio; es decir, a un u incrementoo de un perioodo en ε1 de (225.85)1/2 = 5..08 centavos por galón. Es claro quee al inicio, el e precio se in ncrementa en 5.08 centavoss. De igual foorma, el invenntario cae al principio p debiido a la covarrianza negativva de ε1 y ε3. Durante los siguientes cuuatro o cinco peeriodos el precio desciendee y el inventarrio se eleva, pero p hay pocoo efecto en la prroducción hastta que han passado unos 14 periodos. Al ffinal, los cambbios en todas laas variables se aproximan a cero conform me se amortiguuan los efectos del shock. Las figurass 14.6 y 14.7 ppresentan la respuesta r de ccada variable a shocks de 1 desviación esstándar en la producción p y el inventario, respectivam mente. Nótese quue aunque loss efectos inicciales de un shock s en la producción p see concentran prrincipalmentee en la produccción, despuéés de tres o cuuatro periodo os la producciión regresa ceerca de su valor inicial, perro hay un efeccto sostenido en el inventaario; En contraste, los efectos de un shoock en el inveentario se lim mitan en gran paarte al inventaario. Este shocck induce cicllos en el invenntario, los cuaales se amortigguan en form ma lenta.
456
P PARTE TRES: Mo odelos de ecuacion nes múltiples
Figura 14.5 5 Respuesta a un shock de 1 desviación estándar en e el precio.
Figura 14..6 Respuesta a a un shock de 1 desviación estándar en e la producción.
Otra form ma de caracteerizar el compportamiento dinámico d del modelo es poor medio de un na descomposiición de variaanza. Ésta seppara la variannza del error de d pronóstico para p cada variaable en compponentes que ppueden atribuuirse a cada unna de las variablles endógenass. El cuadro 144.4 muestra laa descomposicción de varianzza para el preciio. La segundda columna en e el cuadro pproporciona los l errores
CAPÍTULO 14: 1 Comportamiento dinámico de los s modelos de simu ulación
457
Figura 14.7 Respuesta a un n shock de 1 desviació n estándar en el inventario.
esstándares dell pronóstico ppara horizontes de un messados meses, etc. Para el prronóstico de un u mes, el errror estándar sólo s es 5.08, la l desviación estándar de ε1. Para el proonóstico de dos d meses, el error estándaar es 6.54, deebido a que inncluye los efeectos de la inncertidumbre sobre s los pronnósticos de un u mes de la prroducción y el e inventario. La tercera columna del cuadro 14.4 muestra m el poorcentaje de laas varianzas deel pronóstico del precio quue pueden atrribuirse a shoocks sólo en el e precio, en opposición a la producción p y el e inventario. La cuarta collumna presentta el porcentajje de las varianzas del prronóstico, del precio que pueden ser atribuidas a a sh hocks en la pro oducción, y laa quinta colum mna muestra el e porcentaje atribuible al invventario. Porr ejemplo, si eel modelo se usa para haccer un pronósstico a cinco meeses del precioo, 87.9% de laa varianza del pronóstico p serrá atribuible a shocks en el prrecio, 8.4% a shocks en la producción p y 3.7% a shockks en el invenntario. No es so orprendente que q entre maayor sea el horizonte h de pronóstico es e mayor la prroporción de varianza v del ppronóstico quue se deberá a las variabless que no son dee precio.
14.4
AJUSTE DE E MODELOS S DE SIMUL LACIÓN Sii ajustamos unn modelo de ssimulación, enn ocasiones puuede mejorarsse su desempeeño de pronósstico. Es decirr, puede ser quue en estructurra del modeloo su compor-
458
PARTE TRES: Modelos de ecuaciones múltiples
CU ADRO 14. 4
DESCOMPOSICIÓN DE LA VARIANZA DE PHO
Periodo
S.E.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
5.08 6.54 7.80 8.27 8.63 8.96 9.15 9.45 9.73 9.97 10.18 10.38 10.63 10.88 11.16 11.43 11.68 11.91 12.10 12.26 12.40 12.53 12.66 12.80
PHO
QHO
NHO
100.00 96.95 91.88 88.43 87.92 84.21 81.92 77.71 73.85 71.57 69.89 69.26 69.07 69.07 68.51 67.62 66.62 65.66 64.88 64.11 63.33 62.57 61.78 61.02
.00 .39 5.30 8.26 8.38 9.75 10.64 13.64 15.91 16.98 16.94 16.35 15.65 14.96 14.22 13.63 13.25 12.97 12.84 12.68 12.65 12.76 13.00 13.32
.00 2.66 2.83 3.31 3.69 6.03 7.44 8.65 10.24 11.46 13.17 14.40 15.27 15.98 17.27 18.75 20.13 21.37 22.28 23.21 24.01 24.67 25.22 25.66
tamiento dinámico se inclina a ser inestable y que existan cambios menores suficientes para estabilizar el comportamiento. O que dé un sesgo en un coeficiente estimado individual se puede derivar una subpredicción o una sobrepredicción consistente por parte del modelo en su conjunto, lo cual puede corregirse con un ajuste en el valor del coeficiente. Consideremos la estimación de una ecuación de regresión para pronosticar una tasa de interés. El resultado podría haber sido la ecuación (13.16). La selección de esta ecuación podría haberse basado sólo en fundamentos estadísticos, es decir, R2, estadísticas t, etcétera. Supóngase que usamos la ecuación para producir una serie pronosticada para la tasa de interés durante el periodo histórico. Puede ser que la serie pronosticada esté cerca de la serie de la tasa de interés real durante los periodos en los que la tasa de interés no cambia mucho, pero durante los periodos en que la tasa de interés está cambiando con rapidez la serie pronosticada pierde los virajes en la serie real. Así, aunque el ajuste global de la ecuación sea bueno, la ecuación puede no recoger los virajes en la variable que se está explicando. Si éste es el caso, podríamos cambiar la ecuación, quizá introduciendo variables explicativas adicionales o cambiando la forma funcional o la estructura de rezago. El resultado puede tener un ajuste estadístico global que no sea tan bueno pero que puede ser más útil para propósitos de predicción o análisis.
CAPÍTULO 14: Comportamien nto dinámico de loss modelos de simu ulación
459
Una vez quue se ha constrruido un modeelo de regresióón de ecuaciónn sencilla, es probable que no o se desee caambiar ningun no de los valoores de coeficiente que se haan estimado (aaunque se pueeden usar técn nicas de estim mación alternaativas). Esto po odría no suceeder con un modelo de simulación. Consideremoos como un ejeemplo el moddelo de cuatro ecuaciones del d capítulo 133; es decir, lass ecuaciones (13.14) a (13.177). Suponga quue queremos usar u este moddelo para pronnosticar la tasa de interés. Poodríamos acep ptar cada una dde las ecuacio ones tomadas por p sí solas, pero rechazar el desempeño de d la simulacción del mod delo en su connjunto. Puedee ser que el moodelo sea sensible en formaa excesiva a los cambios enn una variablee exógena, o tan n sólo podría ser inestablee u oscilar. Una U forma parra mejorar su desempeño (coomo se expusso en el capítuulo 13) es usaar métodos dee estimación alternativos. a Ad demás del uso o de mínimos cuadrados dee dos etapas ppara asegurar consistencia (annalizado con detalle en el ccapítulo 12), vimos v en la seección 13.4 que q el uso de téccnicas de estiimación simple de una sola ecuación taales como unaa corrección au utorregresiva (para términnos del error correlacionaados serialmeente) puede meejorar en grann medida el desempeño de pronóstico dee un modelo y que el uso dee técnicas de información i c completa pueede producir una u mejora aú ún mayor. Hay otras técnicas t dispoonibles que originan o cambbios en el moodelo, y con freecuencia se ussan en forma independientee. La primera de estas técnnicas implica an nalizar todas las espiras de refroalimentaación y proaliimentación enn el modelo. Essto se realiza comenzando c coon un diagram ma de bloque del d modelo. Un n ejemplo de estte diagrama para p nuestro m modelo de cuaatro ecuacionees simple se muestra m en la fig gura 14.8, y presenta p todoos los flujos causales c entree variables y bloques de vaariables. Las espiras e de retrroalimentaciónn son en esenncia flujos cauusales circularres; por ejempplo la figura 114.8 ilustra laa espira entre el consumo y el PIB; el Figura 14.8 Diagrama de bloque b para un mode elo simple de cuatro ecua aciones.
460
PARTE TRES: Modelos de ecuaciones múltiples
consumo está determinado al menos en parte por el PIB, pero también es un componente del PIB (y por consiguiente ayuda a determinarlo). Puede usarse un diagrama de bloque para identificar mecanismos en el modelo que pudieran provocar un desempeño inestable. Por ejemplo, en el modelo de cuatro ecuaciones, el consumo y la inversión dependen del PIB total pero al mismo tiempo contribuyen a éste. Por tanto, si los coeficientes multiplicadores en estas ecuaciones fueron demasiado grandes, podría resultar una espira de retroalimentación que amplificara en forma continua cambios pequeños en el consumo o la demanda de inversión en cambios muy grandes en el PIB. Si sucede así, se podría reestructurar una de las ecuaciones de demanda para reducir la dependencia del PIB total. En este caso se podría introducir otra variable explicativa que eliminaría algo de la dependencia del PIB del consumo. Nótese que la reestructuración de ecuaciones individuales se realizará por razones diferentes a la de un modelo de una sola ecuación. En un modelo de ecuación sencilla, por lo general, estamos interesados sólo en el ajuste estadístico, ya sea global o en puntos de viraje particulares. Sin embargo, en un modelo de simulación, también nos interesa la interacción dinámica de las ecuaciones que componen el modelo. Por tanto, podemos reestructurar una ecuación, si queremos, aun cuando tenga un ajuste estadístico muy satisfactorio. Hay un segundo método que se usa a menudo para hacer ajustes menores en modelos econométricos grandes, en particular en aquellos que se usan con propósitos de pronóstico. Éste consiste en hacer cambios pequeños en algunos de los coeficientes del modelo e introducir parámetros ajustables en puntos clave en el modelo para mejorar su capacidad para pronosticar. Supóngase que una de las variables en un modelo es simulada en forma consistente por encima de sus valores reales. Pueden existir varias razones para esto: uno o más de los coeficientes en la ecuación de consumo pueden estar sesgados, o algunos de los coeficientes en otras ecuaciones que se alimentan en la ecuación de consumo pueden estar sesgados, o la estructura del modelo tan sólo puede incorporar una tendencia ascendente en esa variable particular. Una forma de abordar este problema es ajustar algunos de los coeficientes en la ecuación para la variable que está simulando mal. Al ajustar algunos de los coeficientes, debe hacerse con cuidado, ya que el analista puede hacer que el modelo siga los datos históricos muy bien aun cuando en realidad sea una representación muy deficiente del mundo real, con poco valor predictivo. Es decir, los coeficientes deben ajustarse sólo con gran precaución y sólo si no son estadísticamente significativos. Un coeficiente estadísticamente significativo indica que los datos tienen información que transmitir, y esta información debería tomarse en cuenta cuando hacemos un pronóstico. Relacionada con él problema de ajustar un modelo para mejorar su desempeño de pronóstico está la cuestión de qué tan literal deben considerarse los pronósticos de un modelo. Los pronosticadores y elaboradores de políticas, por lo general, permiten una cantidad considerable de interacción entre sus modelos y su juicio. De esta forma un modelo se vuelve más que sólo una herramienta de pronóstico matemático; sirve como un medio de procesar y poner a disposición información que no estaba contenida originalmente en el modelo.
CAPÍTULO 14: Comportamiento dinámico de los modelos de simulación
14.5
461
SIMULACIÓN ESTOCÁSTICA En el capítulo 8 vimos que los pronósticos producidos por un modelo de regresión de una sola ecuación están sujetos a cuatro fuentes de error: 1. La ecuación de regresión contiene un término de error aditivo implícito. 2. Los valores estimados de los coeficientes de la ecuación son en sí mismos variables aleatorias y, por consiguiente, diferirán de los valores verdaderos. 3. Las variables exógenas tienen que ser pronosticadas en sí mismas, y estos pronósticos pueden contener errores. 4. La ecuación está mal especificada; es decir, la forma funcional puede no ser representativa del mundo real. En el capítulo 8 se expuso cómo podíamos calcular un intervalo de confianza de un pronóstico que explicaría las primeras tres fuentes de error. (No podemos explicar la cuarta fuente de error y, por tanto, nuestros intervalos de confianza se calculan bajo la suposición de que el modelo está especificado en forma correcta.) En el caso de un modelo de simulación de ecuaciones múltiples las cuatro fuentes de error todavía se aplican, aunque ahora la mala especificación no sólo puede ocurrir en las ecuaciones individuales sino también en la estructura dinámica contenida en el modeló en su conjunto. Además, aun si el modelo está especificado en forma correcta, los errores de los primeros tres tipos en cada ecuación pueden multiplicarse a lo largo de las ecuaciones y de este modo ampliarse. Como un ejemplo, consideremos el modelo de cuatro ecuaciones de las ecuaciones (13.14) a (13.17), junto con el correspondiente diagrama de bloque en la figura 14.8. Cuando se simula el modelo, la ecuación de consumo genera una predicción del consumo que será, errónea como resultado tanto del término del error aditivo implícito en esa ecuación y del hecho de que los coeficientes de la ecuación no se conocen con certeza. Debido a que el consumo es un componente del PIB, el error en el consumo contribuirá a un error en el PIB, y este error contribuirá al término de error en la predicción de la inversión (junto con el término de error aditivo y los errores del coeficiente en la ecuación de inversión). La inversión también es un componente del PIB, de modo que el error en la inversión también contribuirá a un error en el PIB. Del mismo modo, el consumo es una función del PIB, por tanto el error en el consumo se volverá aún mayor como consecuencia del error acumulado en el PIB. Si el modelo es lineal, las varianzas del error de pronóstico final asociadas con cada variable endógena pueden calcularse con exactitud, aunque hacerlo no es trivial desde el punto de vista del cálculo. Por lo general, un método más fructífero (en particular para modelos no lineales) es realizar una simulación estocástica (también llamada simulación de Monte Carlo). Esto se hace especificando, para cada ecuación del modelo, una distribución de probabilidad para el término del error aditivo y para cada coeficiente estimado. A continuación, se realiza un gran número de simulaciones (digamos 1 000). En cada simulación.
462
PA ARTE TRES: Mod delos de ecuacione es múltiples
los valores para p los térmiinos de error aditivos y lo os coeficientes estimados sse escogen al azar a de las distribuciones d de probabiliidad correspo ondientes. Parra cualquier varriable endógena particular, los resultado os de la simulaación produceen puntos que trazan t una distribución dee probabilidad d del valor prronosticado de d esa variable. Por tanto, pueede usarse la dispersión d de los pronóstico os alrededor de d su valor med dio para defin nir un intervalo de confian nza del pronósstico. Si se haan obtenido estimaciones insesgadas i y consistentes para todos lo os coeficientes del modelo, es sencilla laa determinaciión de las disstribuciones d de probabilidad apropiadas para p los coeficcientes estimaados. Para cad da ecuación, se s puede asumiir que el errorr aditivo está distribuido d en n forma norm mal con media 0 y desviación n estándar igu ual al error estándar e de laa regresión. Puede P tambiéén suponerse qu ue los coeficieentes de cada ecuación sigu uen una distriibución normaal conjunta, don nde la media de cada coefiiciente está daada por su vallor estimado, la l desviación estándar de caada Coeficientte está determ minada por su u error estándaar estimado y las covarianzzas entre coeeficientes estáán fijadas por la matriz d de covarianza estimada. Para ilusstrar esta técniica, tomemos el modelo dee cuatro ecuacciones como un u ejemplo. Parra realizar unaa simulación estocástica, e laas ecuaciones del modelo se s escribirían:
En la primerra ecuación deebería suponeerse que los "ttérminos del error" e v11, v12 y v13 siguen un na distribució ón normal con njunta. En alg gunas situacio ones puede seer difícil, desdee el punto dee vista compu utacional, generar número os aleatorios a partir de distrribuciones con njuntas, y si laas covarianzass son pequeñaas, es razonablle realizar la sim mulación esto ocástica bajo la l suposición de aproximacción de que laas covarianzas entre e coeficien ntes son cero.. Sin embargo o, es importantte recordar qu ue ignorar las covarianzas entre coeficientes, por lo o general, no os conducirá a sobrestimar el e tamaño de llos errores de pronóstico deel modelo. La mayoría de laas covarianzas estimadas e usu ualmente son negativas y cancelan partee de la varianzza en cada coefi ficiente. Por taanto ignorar laas covarianzass tiende a con nducirlo a uno a enfatizar en forma excesiiva el grado de d fluctuación n en los coefficientes, y lo os intervalos dee confianza deel pronóstico obtenidos dee esta forma serán s algo con nservadores.
CAPÍTULO 14: Comportamiento dinámico de los modelos de simulación
463
Ignorando las covarianzas para los propósitos de este ejemplo, se asume que el término del error v11 es una variable aleatoria distribuida en forma normal con media 0 y una desviación estándar de 4.70 (la cual es el error estándar estimado del coeficiente -9.454 en la ecuación de consumo). Del mismo modo, v12 está distribuido en forma normal con media 0 y una desviación estándar de 0.0169 y v13 está distribuido en forma normal con media 0 y una desviación estándar de 0.025. El término del error aditivo ε1t es, para cada periodo t, una variable aleatoria distribuida en forma normal con inedia 0 y una desviación estándar de 11.23 (el error estándar de la ecuación). Los términos del error restantes en las ecuaciones (14.38) y (14.39) se definen en forma similar. Ahora supóngase que nos gustaría obtener un pronóstico estocástico en un periodo delante de la tasa de interés Rt (bajo la suposición de que las variables exógenas Mt y Gt se conocen con certeza); Hacemos esto realizando varios cientos de simulaciones del modelo un periodo adelante. En cada simulación seleccionamos al azar un valor para v11 de una distribución normal con media 0 y desviación estándar 4.70, seleccionamos al azar un valor para v12 de una distribución normal con media 0. y desviación estándar 0.0169, etcétera. El resultado de estas simulaciones tendrá un-sango de valores pronosticados de Rt. Este rango tendrá alguna media muestral, y los varios cientos de valores simulados determinarán una distribución de probabilidad alrededor de esta media (si el modelo es no lineal, esta distribución de probabilidad no será normal). A continuación, podemos calcular la desviación estándar de esta distribución muestral, la cual nos dará un valor estimado para el error estándar del pronóstico. Entonces, podemos usar este error estándar de pronóstico como lo hicimos en el capítulo 8 para determinar intervalos de confianza del pronóstico. Si el modelo es lineal, entonces conforme el número de simulaciones incluidas en la muestra se hace más grande, la media muestral se aproximará al pronóstico determinista (el pronóstico correspondiente a todos los parámetros aleatorios establecidos en 0). Sin embargo, si el modelo es no lineal, no hay garantía de que la media muestral se aproxime al pronóstico determinista conforme aumente el tamaño de la muestra y de hecho usualmente no lo hará. Además, puede ser necesario que se realice un número inaceptablemente grande de simulaciones antes de que las medias muéstrales para cada variable converjan. Por lo tanto centramos nuestros intervalos de confianza en el pronóstico determinista en lugar de en la media muestral de las simulaciones estocásticas. El proceso sería exactamente el mismo si deseáramos pronosticar durante un horizonte de tiempo más largo que un periodo. Para cada simulación tan sólo seleccionamos un valor aleatorio diferente para ε1t , ε2t y ε3t para cada periodo, pero usamos el mismo valor aleatorio para v11, v12, etc., durante la simulación entera (dado que las ecuaciones del modelo fueron especificadas y estimadas bajo la suposición de que los coeficientes son constantes a lo largo del tiempo). Además, si los valores futuros de las variables exógenas Gt y Mt no fueran conocidos con certeza sino que tuvieran que ser pronosticados, los errores estándares podrían asociarse con sus pronósticos. Entonces, las variables exógenas podrían tratarse cómo variables aleatorias distribuidas en forma normal (con medias iguales a sus valores pronosticados y desviaciones estándares iguales a sus erro-
464
PARTE TRES: Modelos de ecuaciones múltiples
res estándares de pronóstico) en nuestra simulación estocástica. Por ejemplo, la ecuación (14.40) podría reescribirse para incluir un término del error asociado con Gt (el cual ahora debe ser pronosticado en sí mismo): Yt = Ct + I t + (G ˆ t + ηt)
(14.41)
Aquí, G ˆ t es un pronóstico de Gt y ηt es una variable aleatoria distribuida en forma normal (definida para cada periodo t) con media 0 y desviación estándar igual al error estándar del pronóstico G ˆ t . Nótese que nuestro pronóstico ahora es un pronóstico condicional. APÉNDICE 14.1 Un modelo macroeconómico pequeño
Presentamos, como un ejemplo más detallado de la construcción y simulación de un modelo, un modelo estructural simplificado de la economía estadounidense.9 Éste es un modelo altamente agregado de producto nacional bruto (PNB) real y sus componentes principales, está de acuerdo con los modelos IS/ LM tradicionales presentados en varios libros de texto de teoría macroeconómica intermedios. Aunque no representa lo más actualizado del modelado y pronóstico macroeconómicos, proporciona un punto de partida útil para los estudiantes interesados en el desarrollo y uso de modelos de ecuaciones múltiples. ESPECIFICACIÓN y ESTIMACIÓN DEL MODELO El modelo contiene 11 ecuaciones comportamentales y dos identidades: una para el ingreso disponible real y la identidad explicativa para el PNB real. En este modelo cada ecuación se estimó usando mínimos cuadrados de dos etapas.10 En el cuadro A14.1 se especifican todas las variables endógenas y exógenas en el modelo." El PNB real y sus componentes son medidos en función de miles de millones de dólares de 1992 con una base de ponderación fija, en lugar de ponderación encadenada, para conservar la identidad explicativa del PNB con la que están familiarizados la mayoría de los estudiantes. Estas medidas de producción
9 Michael Donihue, profesor asociado de Economía en el Colby College, construyó el modelo y escribió esté apéndice. 10 En "The Estimation of Simultaneous Equation Models with Lagged Endogenous Variables and First Order Serially Correlated Errors", Econometrica, vol. 38, pp. 507-516, 1970; Ray C. Fair mostró que las variables dependiente e independiente rezagadas deben incluirse como instrumentos para obtener estimaciones de parámetro consistentes cuando las perturbaciones autocorrelacionadas crean un problema. El método de Fair se usó en el capítulo 12 para la estimación de dos etapas de aquellas ecuaciones que exhibían perturbaciones correlacionadas serialmente. 11 Puede encontrarse un listado completo de todos los datos en el disco de datos que acompaña a este texto.
CAPÍTULO 14: Comportamiento dinámico de los modelos de simulación
465
CUADRO A14.1 VARIABLES EN EL MODELO Variables
Definición
Endógenas C PNB INFL INR INV IR M RL RS TAX UR WINF YPD
Gastos de consumo personal Producto nacional bruto Tasa de crecimiento del I PC Inversión fija no residencial Cambio en los inventarios de negocios Inversión fija residencial Importaciones de bienes y servicios Rendimiento promedio en bonos corporativos AAA Tasa de interés en bonos de tesorerías tres meses Pagos de impuestos personales y comerciales indirectos Tasa de desempleo civil Inflación salarial Ingreso personal disponible
Exógenas G PNBPOT M2 NETWRTH OIL PRFT PROD TR X
Compras gubernamentales de bienes y servicios PNB potencial Reserva de dinero Valor neto doméstico Tasa de crecimiento de los precios del petróleo Ganancias corporativas Tasa de crecimiento de la productividad laboral Pagos de transferencias a personas Exportaciones de bienes y servicios
Número de ecuación (A14.4) (A14.1) (A14.13) (A14.6) (A14.8) (A14.7) (A14.5) (A14.10) (A14.9) (A14.3) (A14.11) (A14.12) (A14.2)
real son reportadas en forma trimestral por el Departamento de Análisis Económico (BEA: Bureau of Economic Analysis); sin embargo, ahora la medida con ponderación encadenada del PNB real es la medida usada por el BE A debido a los problemas que surgen al hacer comparaciones a largo plazo del PNB real cuando se usan índices de precios con ponderación fija en un ambiente de precios que cambian con rapidez. PNB REAL CON PESOS FIJOS CONTRA PONDERADO EN CADENA Antes de 1996 el BEA empleaba un cálculo del PNB real usando ponderaciones de precio fijas basadas en un año particular, por ejemplo, 1987. Cada 5 años el BEA renueva los puntos de referencia de sus cálculos de los componentes del PNB real, actualizando las ponderaciones de los precios en el proceso. En general, las medidas de PNB en dólares constantes calculadas con los precios de un año base más reciente se incrementarán menos que los cálculos que se basan en
466
PARTE TRES: Modelos de ecuaciones múltiples
precios de un año anterior. Esto ocurre debido a que la producción crece más rápido para aquellos productos que tienen los menores incrementos en precio. Cuando se calcula el PNB real usando precios recientes, los bienes y servicios con crecimiento de producción fuerte recibirán menos peso que si esos bienes y servicios fueran valuados usando precios de un periodo anterior. Por tanto, el crecimiento real en producción agregada será menor de lo que sería si se usaran precios anteriores.12 Los economistas reconocen que esto representa un problema para las comparaciones del PNB a lo largo del tiempo. Sin embargo, la diferencia en el efecto de usar un conjunto de precios sobre un conjunto anterior, por lo general, fue considerada tan pequeña como para carecer de importancia. Dos factores causaron que el BEA replanteara su enfoque hacia el cálculo del PNB real. Primero, las conmociones de los precios de energéticos de la década de 1970 y las fluctuaciones más recientes en los precios de los alimentos fueron tan grandes que la elección de ponderaciones para los precios tuvo un impacto significativo en la medición del crecimiento del PNB real. Segundo, dado que las reducciones dramáticas de mediados de la década de 1980 en los precios de las computadoras han derivado en una diferencia de 0.3% anual en la tasa de crecimiento del PNB real cuando se calculaba usando ponderaciones de precios de 1987 contra precios basados en 1982. Con la renovación de los puntos de referencia de 1995 de las cuentas de ingresos y productos nacionales, el BEA comenzó a usar una nueva medida del PNB real que refleja con más precisión el crecimiento de la producción en un ambiente de precios que cambian con rapidez. Esta medida se conoce como PNB real con ponderación encadenada.
Un problema que enfrentan los modeladores económicos es que el nivel del PNB real con ponderación encadenada no es igual a la suma del consumo, la inversión, el gasto gubernamental y las exportaciones netas con ponderación encadenada. Sin embargo, la tasa de crecimiento del PNB real con ponderación encadenada es igual a la tasa de crecimiento de sus componentes reales con ponderación encadenada.13 Para simplificar la especificación del modelo aquí y conservar la identidad explicativa del PNB real en términos de nivel, se usó la medida con renovación de los puntos de referencia del BEA del PNB basado en precios de 1992 con ponderación fija. ECUACIONES DEL MODELO
El diagrama de flujo en la figura A 14.1 presenta un esquema para la especificación del modelo. El PNB real con ponderación fija es desagregado en componentes endógenos que incluyen consumo real (C), inversión fija no residencial real
12 Para una exposición minuciosa de las nuevas medidas del PNB del BEA, véase el artículo de Allan H. Young listado al final de este apéndice. 13 En términos nominales la conocida identidad explicativa del PNB siempre se cumple.
CA APÍTULO 14: Comportam miento dinám mico de los modelos m de simulación s
467
F Figura A 14. 1
U Un modelo m macroeconó ómico p pequeño.
(INR R) y residdencial (IIR), inveersión enn inventarrio real (INV) e im mportaciiones realees (M). Los L compponentes rrestantess, compraas gubernnamentalees reales (G) y expoortacionees reales (X), son tratados como vaariables exógenas.. La idenntidad del P PNB es especificaada por taanto comoo: PNB Bt = Ct + INRt + IR Rt + INVt + Gt + Xt - Mt
(A A14.1)
468
PARTE TRES: Mod delos de ecuacion nes múltiples
Cada eccuación compportamental en e el modeloo es estimadaa con el uso de d datos trimesttrales desde eel primer trim mestre de 19600 hasta el últim mo trimestre de d 1995. Comoo se muestra en la figura A1 14.1, en este modelo m el ing greso disponibble real es una variable v impoortante, debidoo a que determ mina los gasttos de consum mo personal, lass importacionnes de bienes y servicios y la demanda de dinero. Unna identidad cercana en térm minos nominalles, calcularíaa el ingreso diisponible com mo el producto nacional n brutoo menos las ganancias corpporativas, sum mando los pagoos de transferenncias y restanndo los pagoss de impuestoos comercialees y personalees. Para este mo odelo, el ingreeso disponible real se calculla en la ecuaciión (A14.2) coon valores realees para el PN NB, los impueestos y los paagos de transfferencias, y las l ganancias coorporativas. T Tanto los paggos de transfeerencias comoo las ganancias corporativass son tratados como variables exógenas.. YP PDt = PNBt − PRFTt + TRt − TAXt
(A14.2)
El mecannismo fiscal een el modelo ess muy simple. Los impuesto os comercialess y personales totales t se esttimaron de la l siguiente fforma (las esstadísticas t se encuentran entre parénteesis):
El consuumo personal representa do os tercios del P PNB y, de maanera apropiadda, también reppresenta una ecuación e com mportamental cclave en este modelo. Com mo se esperaba,, el ingreso diisponible es un u determinannte importantte del consum mo. El valor netto doméstico (activos men nos pasivos) también t es un u determinannte positivo del consumo. Al elevar los réd ditos de los ahhorros e increementar el cossto de los préstamos, las tasas de interés a corto plazoo más altas tiienen un efeccto negativo en el consumo. Por tanto, laa función de consumo c estimada para esste modelo maccro simple es:
La demanda de impoortaciones reales de bienes y servicios es endogenizadda relacionandoo los cambios en las importtaciones con el e nivel de ingrreso disponiblle. Sin embargoo, para facilitar la simulaciión del modello, construimos nuestra
CAPÍTULO 14 4: Comportamiento o dinámico de los modelos de simula ación
469
ecuuación de importaciones enn función del nivel n de impoortaciones, ressultando la siguuiente ecuació ón estimada: (A14.5) R2 = 0.997
s = 10.779
D = 1.693 DW
Instrumeentos: constante, C, G G, PNB, PNBPOT, IN NFL, INR, INV, M2, RL, RS, X, YPDt -1
Después, coontinuamos coon el sector de d inversioness, donde la in nversión no resiidencial depennderá de mannera positiva de d la actividadd económica agregada y dep penderá en forrma negativa del costo de oportunidad de la inversióón. De este modo, se estima que la inverssión fija no reesidencial reall es una función positiva del PNB y una función f negattiva de las tasas de interés a largo plazo o:
La inversión n residencial es una variabble procíclica que refleja la l demanda dom méstica de cassas nuevas. Poor lo tanto, la inversión en estructuras e reesidenciales se estima como una funciónn del ingreso disponible real r y el costto de pedir prééstamos. Para conservar sim mple el modello, se usan lass tasas de inteerés a corto plaazo como un sustituto s paraa las tasas de interés hipoteecarias:
El cambio enn los inventariios en los negocios cada trim mestre es iguaal al exceso de producción p reelativo a la deemanda. Investigaciones han demostraddo que gran parrte de la variacción en el creccimiento de la producción reeal en el transccurso de un cicllo de negocioos puede atribbuirse a variaaciones en la tasa de acum mulación de inv ventario. Así, el cambio enn los inventarrios de negocios se estimaa como una funnción del cam mbio en la difeerencia entre la l producciónn total y el connsumo:
470
PARTE TRES: Modelos de ecuaciones múltiples
El secto or monetario de nuestro modelo consiste en una curvva LM estándaar y una ecuacióón de estructuura de términoo simple. Lass tasas de interrés a corto plaazo son modelaadas como unna normalizaciión de una ecuuación de dem manda de dinero tradicional.. La demandaa de dinero se incrementa ccon el ingreso o pero disminuuye cuando las tasas de interéés a corto plazzo reales se ellevan conform me se incrementa el costo de la oportunidaad de tener diinero. Por tannto, las tasas de d interés reaales deberían seer una funciónn positiva del ingreso dispoonible y una función f negattiva del suminisstro de dineroo. Ex post, la tasa de interéés real será iggual a la tasaa de interés nom minal menos la tasa de inflaación. De estee modo, las taasas de interéés a corto plazo o son estimaddas por:
Las inffluencias en llas tasas de innterés a corto plazo se transmiten en forrma contemporáánea y con unn rezago a las tasas a largo plazo. El térm mino de la eccuación de esttructura de nuuestro modeloo es:
La tasaa de desempleeo es determinnada de acuerrdo con una eccuación de la ley de Okun trradicional quee relaciona lo os cambios enn la tasa de desempleo conn la brecha en el e PNB:
Nótese quee la estadísticaa R2 para la ecuuación (A14.111) es mucho menor m que enn las otras ecuacciones como resultado dell hecho de quue la variablee dependientee es medida en función de caambios trimesstrales.14 Las últtimas dos ecuuaciones en ell modelo preddicen la inflacción del salariio y los precios. La tasa anuaal de crecimien nto en los salaarios será una función posittiva de la inflacción de precioss global, una función f negatiiva de la tasa de d desempleoo (el exceso de oferta o de manno de obra pone una presióón descendentte en el 14
La esttadística R2 calcullada para el nivel de la tasa de deseempleo es igual a 0.966.
CAPÍTU ULO 14: Comportam miento dinámico de lo os modelos de simu ulación
471
creecimiento salaarial) y una fuunción positivaa del crecimieento de la productividad. Nu uestra ecuacióón estimada paara el crecimiiento salarial global es:
Se estima quue la tasa anuual de crecimiiento en el índdice de precioos al consumid dor es una fun nción de la innflación salariial, la demandda del consum midor y los preecios del petróóleo:
SIM MULACIÓN DEL MODEL LO Ahora el modeloo puede simullarse como unn sistema com mpleto. Se reallizaron, dos sim mulaciones hisstóricas y un pronóstico ex post para eevaluar la cap pacidad del moodelo para repplicar los datoos reales.15 La L primera sim mulación abarrca todo el perriodo de estim mación (1960-22 a 1995-4). La L segunda abbarca los 10 úlltimos años de los datos históricos en la muestra, m desdee el primer triimestre de 19986 hasta el cuaarto trimestre de 1995. Lueego, para realiizar un pronósstico ex post, cada ecuaciónn del modelo fue reestimaada con datos del primer triimestre de 19 960 hasta el cuaarto trimestre de 1993, trunncando el periiodo de muestra por 2 añoss. Después, fuee simulado ell modelo durante los ochoo últimos trim mestres para los que se dispponía de datos (1994-1 a 1995-4), con el e uso de valorres históricos reales para las variables exóógenas se resoolvieron los valores v de las variables enddógenas. El cuaadro A14.2 reesume los resuultados de esttas simulacionnes. Se presentann la raíz cuaddrática media del error (rm ms) y los errores medios parra cada experiimento. Los errores e medios proporcionaan una medida del sesgo de los valores prronosticados ppor el modeloo para cada vvariable; una entrada e negatiiva corresponnde a un sesgoo positivo parra esa variablee. Durante el periodo de muuestra completto el modelo produce erro ores medios rrelativamente pequeños, subbprediciendo el e PNB real, eel consumo, las l tasas de innterés y el dessempleo en pro omedio. Los errrores rms repportados aquí son algo mayyores que los que q podríamos esperar con los modelos macroeconóm micos a gran escala e usados para pro15 Las simulaciiones aquí son d dinámicas en el sentido s de que valores v simuladoss (en lugar de reales) para las variaables endógenas een un periodo daado se usan como o entradas cuando o el modelo se resu uelve en periodoss futuros.
472
PARTE TRES: Modelos de ecuaciones múltiples
CUADRO A14.2 ERRORES DEL MODELO DE SIMULACIÓN Simulaciones históricas 1960-2-1995-4 Errores medios
c
PNB INFL INR INV IR M RL RS TAX UR WINF YPD
Errores
rms
Simulación
1986-1-1995-4 Errores medios
Errores
rms
ex post
1994-1-1995-4 Errores medios
Errores rms
0.712
75.910
-44.838
73.884
1.970
18.524
0.437 -0.350 -5.482 -0.030 0.622 -4.615 0.224 0.071 -0.166 0.572 -0.438 0.603
124.857 3.440 49.027 23.814 30.825 42.036 1.842 2.491 43.305 1.121 3.559 97.843
-104.954 -1.688 -90.569 -4.449 -17.149 -52.050 -0.607 -1.348 -31.290 -0.266 -2.047 -73.664
136.777 4.695 99.722 27.573 30.887 66.422 1.198 2.444 41.595 0.763 4.790 99.886
14.919 -4.095 34.681 18.707 11.507 51.946 0.735 -0.637 -0.870 -0.549 -3.780 15.790
34.828 4.378 40.365 26.119 12.246 56.455 1.032 0.715 12.488 0.590 4.244 40.429
nóstico y análisis de políticas, principalmente como resultado de la falta de detalle en el alcance de este modelo y lo simplificado de la especificación de las ecuaciones. Los errores para la submuestra de datos son considerablemente mayores conforme el modelo tiende a exhibir un sesgo negativo (sobrepredicción) para cada una de las variables endógenas. Las figuras A14.2 a A14.11 ilustran los valores reales y simulados para las variables endógenas en el modelo para la simulación histórica que abarca el total de la muestra. Estas figuras ilustran los sesgos reportados por las estadísticas del error en el cuadro A14.2. En la figura A14.2 observamos que los valores pronosticados por el modelo siguen a los valores reales para el PNB real muy de cerca pero pierden los puntos de viraje importantes del ciclo de negocios. El modelo no percibe la recesión de 1990-1991 por completo, sobreprediciendo el consumo y la inversión no residencial y residencial. En la actualidad los economistas señalan un colapso en los negocios y en la confianza del consumidor como un factor contribuyente importante para la última recesión, un componente inobservable en nuestro modelo. La figura A14.ll presenta que gran parte del error histórico subyacente en la inflación del IPC se debe a sobrepredicciones coincidentes con los cambios rápidos en los precios del petróleo que ocurrieron en 1974 y 1986. Las figuras A14.10 y A14.11 ilustran también el rompimiento reciente en la relación histórica entre los salarios y los precios y las presiones de la demanda en el resto de la economía. A mediados de la década de 1990 muchos economistas esperaban que la inflación de salarios y precios fuera mucho mayor de lo que fue debido a un periodo extendido de crecimiento de la producción por encima del potencial y tasas relativamente bajas de desempleo. Las simulaciones ex post ilustradas en
CAPÍTULO 14: Comportamientto dinámico de los modelos de simula ación
Figura A14.2 Simulación histó órica del PNB.
Figura A14.3 Simulación histó órica del consumo.
473
474
PARTE TRES: Modelos de ecuaciones múltiples
CAPÍTULO 14: Comportamientto dinámico de los modelos de simu ulación
Figura A14.6 Simulación his stórica de la inversión n en inventario.
Figura A14.7 Simulación histórica de la tasa de interés i a corto plazo.
475
476
PA ARTE TRES: Mod delos de ecuacione es múltiples
Figura A14 4.8 Simulación n histórica de la tasa de d interés a largo plazzo.
Figura A14 4.9 Simulación n histórica de la tasa de d desempleo.
CAPÍTULO 14: Comportamiento dinámico de loss modelos de simu ulación
Figura A 14.10 0
Simulación histórica de la inflación salarial.
Figura A 14.11
Simulación hisstórica de la inflación del IPC.
477
478
PARTE TRES: Modelos de ecuaciones múltiples
las figuras A14.12 a A14.15 muestran este hecho y representan un rompecabezas actual para los economistas que creen en las teorías tradicionales del comportamiento macroeconómico. Antes de usar el modelo para realizar algunos experimentos de políticas simples, es útil calcular los multiplicadores del PNB dinámicos que corresponden a los cambios en el gasto gubernamental (G) y el suministro de dinero (M2). Estos multiplicadores totales, los cuales representan el cambio en el PNB después de que ha transcurrido el número especificado de periodos, se muestran en el cuadro A14.3. Los multiplicadores del gasto gubernamental se obtuvieron incrementando G en nuestro modelo en mil millones de dólares por encima de su camino histórico, comenzando en el primer trimestre de 1986. Los valores simulados para el PNB correspondientes a las series históricas para el gasto gubernamental fueron luego restados de las series simuladas para el PNB que deriva del valor superior de gasto gubernamental. Nótese que el impacto inicial del cambio en el gasto gubernamental produce un multiplicador de 2.16. El multiplicador del gasto gubernamental a largo plazo para este modelo es de alrededor de 1.4. Del mismo modo, el suministro de dinero fue incrementado en mil millones de dólares en el primer trimestre de 1986 y en todos los trimestres siguientes, y los cambios correspondientes en el PNB se calcularon luego. En la figura A14.1 vemos que en este modelo simple los cambios en el suministro de dinero afectan al PNB en forma indirecta por medio de los componentes del gasto que son sensibles al interés. Por tanto, el multiplicador del impacto inicial de un cambio de mil millones de dólares en el suministro de dinero es de 0.03 mil millones (dólares de 1992). A largo plazo el cambio en el PNB resultante de un cambio de mil millones de dólares en M2 es de alrededor de 0.36 mil millones de dólares. Pronóstico y análisis de políticas A continuación demostraremos el uso de este modelo para realizar algunos experimentos estándares de pronóstico y políticas. En cada experimento simulamos el modelo tres años hacia el futuro, comenzando en el primer trimestre de 1996. Los cuatro experimentos esbozados a continuación son representativos de aplicaciones de modelos macroestructurales que son realizados comúnmente por pronosticadores comerciales y elaboradores de políticas del gobierno. Experimento 1: Pronóstico de línea base Una vez que se ha especificado y
estimado el modelo, el primer paso para producir un pronóstico implica proponer proyecciones para las variables exógenas en el modelo. Por definición, estas variables son determinadas fuera del modelo, y por tanto el juicio subjetivo del pronosticador desempeña una función crítica. Las proyecciones del presupuesto gubernamental publicadas y los objetivos de crecimiento para el suministro de dinero ayudarán al pronosticador, por ejemplo, en la determinación de las rutas futuras para estas variables. Otras variables, sin embargo, requieren una conjetura instruida de parte del pronosticador. Como resultado, el pronóstico final
CAPÍTULO O 14: Comportamie ento dinámico de lo os modelos de sim mulación
Figura A14.1 12 Pronóstico exx post del PNB
Figura A 14.13 Pronóstico ex post de la tasa de e interés a corto plazo.
479
480
PA ARTE TRES: Mode elos de ecuacione es múltiples
Figura A14..14 Pronóstico ex e post de la tasa de e desempleo
Figura A14.15 Pronóstico ex e post de la inflación del IPC.
CAPÍTULO 14: Comportamiento dinámico de los modelos de simulación
481
CUADRO A14.3 MULTIPLICADORES DINÁMICOS ∆PNB Trimestre 0 2 4 6 8 10 12
∆PNB
De ∆G
De ∆M2
Trimestre
2.16 1.67 1.54 1.49 1.48 1.47 1.47
0.03 0.19 0.23 0.27 0.30 0.32 0.34
16 20 24 28 32 36
De ∆G
De ∆M2
1.45 1.43 1.41 1.39 1.37 1.35
0.36 0.36 0.37 0.37 0.36 0.36
Los multiplicadores en este cuadro son dinámicos en el sentido de que muestran el cambio en el PNB que resultan de un cambio de mil millones de dólares en la variable exógena dentro de n trimestres después de que ocurre el cambio.
reflejará la habilidad y experiencia del modelador. Para nuestro pronóstico de línea base empleamos un enfoque menos subjetivo estimando un modelo autorregresivo de primer orden para cada una de las variables exógenas y luego usando las ecuaciones resultantes para producir pronósticos trimestrales hasta el final de 1998. (La parte cuatro de este libro nos presenta modelos de series de tiempo más complejas que podrían usarse para pronosticar estas variables exógenas.) Las ecuaciones de regresión OLS usadas para pronosticar las variables exógenas se muestran en el cuadro A14.4. CUADRO A14.4 ECUACIONES DE PRONÓSTICO PARA VARIABLES EXÓGENAS Variable G PNBPOT M2 NETWRTH OIL PRFT PROD TR X
Intercepto
Coeficiente
R2
9.171
0.995
0.997
(2.197)
(237.9)
22.62
1.002
(6.064)
(1267)
12.46
1.007
(5.379)
(843.4)
9.398
1.007
(0.133)
(221.7)
3.515
0.271
(1.043)
(3.334)
10.67
0.976
(1.149)
(36.66)
1.709
0.027
(4.975)
(0.318)
3.336
1.005
(2.052)
(334.9)
-0.787
1.018
(-0.508)
(243.9)
0.999 0.999 0.997 0.074 0.904 0.001 0.999 0.998
Las estimaciones presentadas en este cuadro corresponden a estimaciones de los parámetros para la ecuación de pronóstico autorregresiva Yt = α + β Yt - 1 + εt. Las estadísticas t se dan entre paréntesis.
482
PA ARTE TRES: Mode elos de ecuacione es múltiples
Experim mento 2: Gastto gubernam mental constan nte En este experimento e s se
establece quee el gasto guubernamental real permaneece constante a lo largo deel horizonte de pronóstico, iigual a su valor en el cuartto trimestre de d 1995. Todaas las otras variables exógenaas siguen las mismas m rutas que siguieronn en el pronósstico de línea base. El objeetivo es exam minar cómo unn nivel inferio or de gasto guubernamental, sin tendenciaa, afectará al PNB, P a los preecios y a las ottras variables. Experim mento 3: Crecimiento del suministro s dee dinero del 10% 1 En el proo-
nóstico de línnea base M2 crece a una tasa anual del 4% cada trim mestre. En estte experimento se supone quue M2 crece a una tasa anuual del 10% cada c trimestree. Un crecimiennto más rápiddo del suminisstro de dineroo sería expanssionista, danddo como resultaado un mayorr crecimientoo de la producción, tasas de d interés máás bajas y tasas más altas dee inflación. Experim mento 4: Redu ucción de im mpuestos En lla ecuación (A A 14.3) la tassa
fiscal promedio estimadda es 0.196. En este expperimento disminuimos la l tasa fiscal proomedio a 0.1667 en un intennto por simulaar el efecto dee una reduccióón de impuestoss del 15%. Unna reducción de impuestoss como ésta deebería ser muuy expansionistta. Los resuultados de estos experimenntos se muestrran en las figguras A14.16 a A14.19 y sonn consistentess con los modelos keynesiaanos tradicionaales. En el proonóstico de líínea base lass compras guubernamentalees reales creccen a una tassa anual de máss o menos 0.88% cada trimeestre. Mantenner constante el e gasto guberrnamental enn términos reales reduce la l demanda aagregada, dissminuyendo eel PNB y sus componentes. Las tasas de interés caen ccomo una dism minución en el e ingreso dispoonible dando como resultaddo una demannda de dineroo inferior mienntras el sumin nistro de dineero permanecce igual comoo en el pronóóstico de líneea base. La tasaa de desempleoo se eleva en forma f relativaa respecto a laa línea base coon la disminución en la producción por debajo del ppotencial, y laa inflación caae ligeramente. Figura A14 4.16
Pronóstico os de políticas alternativass del PNB.
CAPÍTULO O 14: Comportamiento dinámico de los modelos de sim mulación
Figura A14.1 17 Pronósticos de d políticas alternativas de d tasas de interés a cortto plazo.
Figura A14.1 18 Pronósticos de d políticas alternativas de d la tasa de desemple eo.
483
484
P PARTE TRES: Mod delos de ecuacion nes múltiples
Figura A14 4.19 Pronósticos s de políticas alternativass de la inflación de el IPC.
El increm mento de la taasa de crecimiiento del sum ministro de din nero disminuyye en forma connsiderable las tasas de interéés a corto plazzo y a largo plazo, lo que da d como resultaado más inverrsión y gasto o del consumiidor. El PNB B se eleva y eel desempleo diisminuye. Unn mayor crecim miento del suuministro de dinero d también da como resuultado una maayor inflación n. Por últim mo, una reduccción de impu uestos del 15% % sería, basaddo en este moodelo, muy exxpansionista. El crecimientto del PNB reeal se acelera, el desempleeo disminuye y la inflación sse incrementaa. LECTURAS S ADICIONALES Donihue, Miichael R. "Evaaluating the Ro ole Judgment Plays P in Foreccast Accuracy"", Journal off Forecasting, vol. v 12, núm. 2 , pp. 81-92, febbrero de 1993. Fair, Ray C. Sppecification, Estiimation, and Ana alysis of Macroeeconometric Moodels (Cambridge, Mass.: Haarvard Universiity Press, 19944). Klein, Lawrencce R. (ed.) Compparative Perform mance of U.S. Ecconometric Modeels (Nueva Yorkk: Oxford University Press , 1991). Klein, Lawrennce R. y Richardd M. Young. Ann Introduction too Econometric Forecasting annd Forecastinng Models (Lexxington, Mass.: Lexington Boo ks, DC Heath, 1980). Young, Allan H. "Alternativ e Measures of Change C in Reall Output and Prrices, Quarterlyy Estimatess for 1959-92", SSurvey of Curreent Business, vool. 73, pp. 31-41, marzo de 19933.
EJERCICIO OS 14.1 Muestre que si A 1 λ ′1 y A 2 λ ′2 son amb bas soluciones transitorias a un modelo; es e decir, ambas satisfacen unna ecuación coomo la ecuaci ón (14.5), enttonces la sum ma A 1 λ ′1 + A 2 λ ′2 taambién debe serr una solución.
CAPITULO 14 4: Comportamiento dinámico de los modelos de simu ulación
485
14.2 Considere ell siguiente moddelo macroeconnómico multipllicador-aceleraador simple:
Noote que la inverrsión ahora es una función dee los cambios een el consumo o en lugar de unaa función de loos cambios en el PIB total. a) Determinee la ecuación ccaracterística para p este modeelo y encuentree las raíces carracterísticas aso ociadas. b) Encuentre las relaciones eentre los valorees de a2 y b2 quue determinan qué q tipo de sollución tendrá el modelo. Dibuuje un diagram ma que correspoonda al de la figgura A14.1. c) ¿Cuál es ell multiplicador de impacto corrrespondiente a un cambio en Gt? ¿Cuál es el multiplicador m t total a largo plaazo correspond diente a un cam mbio en Gt? 14.3 Las siguienttes ecuacioness describen un modelo de "reed" simple de un u mercado com mpetitivo: Deemanda: Ofe ferta: Cu uando el mercaado está en equuilibrio, QDt = QSt . Ahora, supponga que el mercado m está fueera de equilibriio de manera temporal; es deecir, que QDt ≠ QSt de maneraa temporal. a) Muestre que q el precio coonvergerá de unna manera estabble con un valoor de equilibrioo si b2 /a2 < 1. b) Muestre que q la ruta al eqquilibrio será osscilatoria si b2 > 0 y no será osscilatoria si
b2<0. <
PARTE
CU UATR RO MODEL M LOS DE D SER RIES DE TIEMPO
En las tres primeeras partes dee este libro vim mos cómo pueeden construiirse los modellos econométrricos, tanto modelos m dé reegresión de uuna sola ecuaación como moodelos de ecuaaciones múltipples, y cómo usarse para explicar y pronnosticar los moovimientos fuuturos de una o más variabbles. En la paarte cuatro taambién nos inteeresa construir modelos y usarlos para pronosticar, pero estos modelos m son dife ferentes de aq quellos con loos que se traabajó antes. Y Ya no predecciremos los moovimientos fuuturos en una variable relaacionándola coon un conjunnto de otras varriables en unaa estructura causal; en lugar de ello harremos la preddicción con basse sólo en el comportamien c nto pasado dee esa variable.. Como ejem mplo, considerre la serie dee tiempo y(t) trazada en laa siguiente figu ura, la cual poodría represenntar el desemppeño históricoo de una variaable económicca o de negoccios: un índicce del mercaddo de valores, una tasa de interés, un índdice de produccción o quizáá el volumen de d ventas diaarias de una mercancía. m
48 87
488
PARTE CUATRO: Modelos de series de tiempo
y(t) podría moverse hacia arriba o hacia abajo en parte en respuesta a cambios en los precios, él ingreso personal y las tasas de interés (o así podemos creerlo). Sin embargo gran parte de su movimiento puede deberse a factores que no se pueden explicar, como el clima, los cambios en el gusto o tan sólo ciclos estacionales (o no estacionales) en el gasto. Explicar el movimiento de y(t) por medio del uso de un modelo estructural puede difícil o imposible si, por ejemplo no se dispone de datos para aquellas variables explicativas que se cree afectan a y(t). O si se dispone de datos, la estimación de un modelo de regresión para y(t) puede dar como resultado errores estándares tan grandes que hacen insignificantes a la mayor parte de los coeficientes estimados y al error estándar de pronóstico inaceptablemente grande. Incluso si podemos estimar una ecuación de regresión estadísticamente significativa para y(t), el resultado es probable que no sea útil para pronosticar. Para obtener un pronóstico para y(t) a partir de una ecuación de regresión, las variables explicativas que no están rezagadas deben ser pronosticadas ellas mismas, y esto puede ser más difícil que pronosticar la misma y(t). El error estándar de pronóstico puede ser pequeño para y(t) con valores futuros conocidos de las variables explicativas. Sin embargo, cuando los valores futuros de las variables explicativas se desconocen, sus errores de pronóstico pueden ser tan grandes que hacer), que el error de pronóstico total para y(t) sea demasiado grande como para aceptarlo. Así hay situaciones en las que se busca un medio alternativo para obtener un pronóstico de y(t). ¿Podemos observar; la serie de tiempo en la figura y sacar algunas conclusiones acerca de su comportamiento pasado que nos permitirían inferir algo sobre su probable comportamiento futuro? Por ejemplo, ¿hay alguna clase de tendencia ascendente global en y(t) que, debido a que ha dominado el comportamiento pasando de la serie, .puede esperarse que domine su comportamiento futuro? ¿O la serie exhibe comportamiento cíclico que puede extrapolarse al futuro? Si está presente un comportamiento sistemático de este tipo se puede intentar construir un modelo para la serie de tiempo, que no ofrezca una explicación estructural para su comportamiento en función de otras variables pero replica su comportamiento pasado de tal forma que nos ayuda a pronosticar su comportamiento futuro. Un modelo de serie de tiempo explica los patrones en los movimientos pasados de una variable y usa esta información para predecir sus movimientos futuros. En cierto modo un modelo de series de tiempo es tan sólo un método complejo de extrapolación. Pero, como analizaremos también, en ocasiones proporciona una herramienta efectiva para el pronóstico. Dado que el análisis de series de tiempo se basa en la elaboración del modelo de regresión de una sola ecuación, tratamos a los modelos de series de tiempo en esta última parte del libro aun cuando son la clase "más simple" de modelos en función de su explicación del mundo real. Para pronosticar una tasa de interés a corto plazo; podríamos usar un modelo de regresión para relacionar esta variable con el PIB, los precios y el suministro de dinero. Una serie de tiempo de tasas de interés relacionaría esta variable con sus valores pasados y con variables que describen la naturaleza aleatoria de su comportamiento pasa-
PARTE CUATRO: Modelos de series de tiempo
489
do. El modelo, como la mayor parte de los modelos de regresión, es una ecuación que contiene un conjunto de coeficientes que deben estimarse. Sin embargo, por lo general la ecuación no es lineal en los coeficientes, haciendo necesaria la estimación no lineal. La parte cuatro comienza con un estudio breve de los métodos de extrapolación simples (en efecto, modelos deterministas de series de tiempo) así como de los métodos para suavizar y ajustar estacionalmente series de tiempo. Estas técnicas de extrapolación se han usado en forma extensa durante varios años, y para algunas aplicaciones proporcionan un medio simple pero adecuado de pronóstico. El suavizamiento y el ajuste estacional también son técnicas útiles que en muchos casos pueden facilitar el pronóstico o la interpretación de una serie de tiempo. En el capítulo 16 presentaremos una breve introducción a la naturaleza de las series de tiempo estocásticas. Expondremos cómo se generan los procesos estocásticos, cómo son y, lo más importante, cómo se describen. También expondremos algunas de las características de los procesos estocásticos y en particular desarrollaremos el concepto de estacionariedad. Luego describiremos las funciones de autocorrelación y mostraremos de qué forma se pueden usar como un medio para describir series de tiempo y como una herramienta para probar sus propiedades. Por último, veremos los métodos de prueba para estacionariedad y el concepto de series de tiempo cointegradas. Los conceptos y herramientas analíticas desarrollados en este capítulo son esenciales para el análisis de los modelos de series de tiempo en los capítulos que siguen. En el capítulo 17 se desarrollan modelos lineales para series de tiempo, incluyendo modelos de promedio móvil, modelos autorregresivos y modelos promedio móvil autorregresivos mixtos para series de tiempo estacionarias. Mostraremos cómo algunos modelos de series de tiempo no estacionarias pueden diferenciarse una o más veces para producir una serie estacionaria. Esto nos permite elaborar un modelo de promedio móvil autorregresivo integrado (ARIMA) general. Por último, explicaremos cómo pueden usarse las funciones de autocorrelación para especificar y caracterizar un modelo de series de tiempo. El capítulo 18 expone el uso de modelos de series de tiempo para pronosticar. Este capítulo explica cómo se estiman los parámetros de un modelo de serie de tiempo y cómo puede verificarse una especificación del modelo. Continúa con el análisis del modo en que puede usarse el modelo para producir un pronóstico. También mostraremos cómo las series de tiempo son de naturaleza adaptable; es decir, cómo producen pronósticos de tal forma que se adapta a la nueva información. La última parte del capítulo 18 estudia los errores de pronóstico y muestra cómo pueden determinarse intervalos de confianza para los pronósticos. El capítulo 19 desarrolla algunos ejemplos de aplicaciones en el modelado de series de tiempo. Aquí orientamos al lector en el desarrollo de la construcción de varios modelos de series de tiempo y demostramos su aplicación en problemas de pronóstico.
CAPÍTULO
15
SUAVIZAMIENTO Y EXTRAPOLACIÓN DE SERIES DE TIEMPO
Como explicamos en la introducción a la parte cuatro, un modelo de series de tiempo es un método complejo de extrapolación de datos. Sin embargo, en ocasiones, pueden usarse métodos de extrapolación meaos complejos para propósitos de pronóstico. Por ejemplo, pueden necesitarse con urgencia proyecciones para un gran número4e.series de tiempo, de modo que el tiempo y los recursos no permiten el uso de técnicas de modelado formales, o puede haber razones para creer que una serie de tiempo particular sigue una tendencia simple, obviando por tanto la necesidad de un modelo más complicado. Por consiguiente, comenzaremos exponiendo algunos métodos de extrapolación simples (y no tan simples). Estas técnicas de extrapolación representan los modelos deterministas de series de tiempo., A veces se requiere suavizar una serie de tiempo y así eliminar algunas de las fluctuaciones a corto plazo más volátiles. Este suavizamiento puede hacerse antes de hacer un pronóstico o tan sólo para formar una serie de tiempo más fácil de analizar e interpretar. La suavización también puede hacerse para eliminar las fluctuaciones estacionales; es decir, desestacionalizando (o ajustando estacionalmente) una serie de tiempo, Expondremos la suavización y el ajuste estacional en la segunda sección de este capítulo.
15.1
MODELOS DE EXTRAPOLACIÓN SIMPLE Comenzaremos con modelos simples que pueden usarse para pronosticar una serie de tiempo con base en su comportamiento pasado. Estos modelos son deterministas; es decir, que no se hace referencia a las fuentes o naturaleza de la aleatoriedad subyacente en la serie. En esencia, los modelos involucran técnicas 491
492
PARTE CUATRO: Modelos de serie es de tiempo
Figura 15..1
Serie de tiempo discreta.
de extrapolaación que hann sido, por añoos, herramienttas estándaress de oficio en el pronóstico económico e y dde negocios. Aunque, A por lo l general, esstos modelos no n proporcionaan tanta precisión de pronósstico como loss modelos de series s de tiemppo estocásticoss modernos, a menudo prroporcionan uun medio sim mple, barato y bastante aceeptable de proonóstico. La mayo or parte de lass series que enncontramos nno son continu uas en el tiem mpo; en lugarr de ello, connsisten en obsservaciones ddiscretas hechhas a intervalos regulares enn el tiempo. Una U serié de tieempo represenntativa podríaa ser proporciionada por la figura f 15.1. Inndicamos los valores de essa serie con yt , de modo quue y1 representaa la primera oobservación, y2 la segundaa y yT la últim ma observación para la seriee.1 Nuestro obbjetivo es moodelar la serie yt y usar esse modelo parra pronosticar yt más allá dde la última obbservación yT. Denotamos el e pronóstico uun periodo adeelante con ŷT++1, dos período os adelante toon ŷT+2, y l periodos adelaante con ŷT+1. Si el núm mero de observaciones noo es demasiaddo grande, la representacióón más simple y más compleeta de yt está dada por un polinomio cuyo grado ess 1 menos que ell número de observacione o s; es decir, podemos descrribir yt con unna función conttinua de tiemppo f(t), donde
y n = T- 1. Dicho D polinom mio(si las a son s elegidas een forma correecta) pasará por p cada punto en e la serie de tiempo yt. Así, podemos assegurar que f(tt) será igual a yt en todo moomento t desdde 1 a T. Sinn embargo, ¿ppodemos connfiar en que uun pronóstico de d yt generadoo por f(t) estaará tan cerca de su valor futuro f real? Por P ejemplo, ¿el pronóstico
1 En la parrte cuatro del librro usamos letras minúsculas, m por eejemplo, yt , para denotar d las series de tiempo.
CAPÍT TULO 15 Suavizam miento y extrapola ación de aseries da a tiempo
493
estará cerca del valor futuroo real yT+1? Desafortunada D amente, no po odemos respo onder esta pregunta sin innformación adicional a prevvia. La dificuultad con el moodelo dado poor la ecuación (15.1) es que no n describe yt; tan sólo reprroduce yt . No caaptura ningunna de las caraccterísticas de yt que podrían repetirse en e el futuro. Poor tanto, aunqque f(t) se corrrelaciona perffectamente coon yt , se utilizza poco para pronosticar.
15 5.1.1
Mo odelos de e extrapolació ón simple
Unna característtica básica dee yt es su pattrón de crecim miento a larg go plazo. Si creeemos que essta tendencia ascendente existe e y contiinuará (y puede no haber ninnguna razón para que lo hiciéramos), h se puede connstruir un modelo simple quue describa laa tendencia y pueda usarse para pronostticar yt. El modelo dee extrapolacióón más simplee es el modeloo de tendenciaa lineal. Si crreemos que unna serie yt se inncrementará en e cantidadess absolutas connstantes en caada periodo, se puede predeecir yt ajustan ndo la línea dee tendencia (15.2) doonde t es el tieempo y yt es el e valor de y en e el tiempo t.. Por lo generral, t se elige iguual a 0 en el periodo p base (primera obseervación) y see incrementa en e 1 durante caada periodo suucesivo. Por ejemplo, e si deeterminamos ppor regresiónn que (15.3) poodemos predeecir que el vallor de y en el período t + 1 será 3.2 uniddades mayor quue el valor preevio. P Puede ser máás realista asuumir que la seerie y, crece con c incremenntos porcentuales constantees en lugar dee con incremeentos absolutoos constantes. Esta suposicción implica que q yt sigue una u curva de crecimiento c exxponencial: (15.4) Aqquí A y r se elegirían para m maximizar la correlación enntre f(t) y yt . Entonces, E un prronóstico un periodo p adelaante estaría daado por: (15.5) y un u pronósticoo l periodos aadelante por: (15.6)
494
PARTE CUATRO: Modelos de serie es de tiempo
Figura 15..2
Curva de crecimiento exponenccial.
Esto se ilustrra en la figuraa 15.2. Los paarámetros A y r pueden estimarse tomanddo los logaritm mos de ambos lados de la eccuación (15.44) y ajustando la ecuación de d regresión logg-lineal2 log yt = c1 + c2t
(15. 7)
donde C1 = loog A y c2 = r. Un terceer método de extrapolación se s basa en el modelo m de tendeencia autorre-gresiva y t = c 1 + c 2 y t-1
(15.8)
Al usar un procedimient p to de extrapollación de estee tipo tenemoos la opción de d fijar C1= 0, en e cuyo caso c2 representa laa tasa de cambbio de la serie y. y Sin embarggo, si c2 se esttablece igual a 1, con c1 no igual a 0, la serie extrapolada se incrementarrá por la mism ma cantidad absoluta en ccada periodo.. El modelo de d tendencia auutorregresiva se ilustra en la figura 15.33 para tres vallores diferenttes de c2 (en toddos los casos c1 = 1). Una variiación de este m modelo es el modelo m de tenddencia autorreggresiva logaríttmica log y t = c 1 + c 2 log y t-1
(15.9)
Si c1 está fijaada en 0, el vaalor de c2 es laa tasa compueesta de crecimiento de la serrie y. Tanto la extrapolación e lineal como la extrapolaciión compuestta basadas en el modelo auto orregresivo, ggeneralmente,, se usan com mo un medio simple de pronóstico.
2 Nótese que q en el modelo dde crecimiento exp ponencial se suponne que el logaritm mo de yt crece con un ritmo constantee. Si y t+1 = Aert, entonces e y t-1 /yt = er. y log y t-1 - loog yt = r.
CAPÍT TULO 15: Suavizam miento y extrapolacción de series de tiempo t
495
Figura 15.3
Modelo de ten ndencia autorregresiva..
Nótese quee los cuatro m modelos antess descritos im mplican de maanera básica ejeecutar una reggresión de yt (o log yt) soobre una funcción de tiemp po (lineal o exp ponencial) y/oo rezagada enn sí misma. Pu ueden elaboraarse modelos alternativos hacciendo la funcción un poco más complicaada. Como ejeemplos, podem mos examinarr otros dos moodelos de extrappolación simples: el modelo de tendencia cuadrática c y la curva c de crecim miento logístico. El modelo de d tendencia ccuadrática es una extensión simple del modelo m de tenndencia lineall y consiste en agregar un término en t2 yt = c1 + c2t + c3t2
(15.10)
Si c2 y c3 son am mbos positivoos, yt siempre estará e incremeentándose, perro Cada vez máás rápido confforme pasa el tiempo. Si c2 es negativo y c3 es positivvo, yt disminuirá primero peero después se incrementarrá. Si ambos sson negativos, y, siempre dissminuirá. Estoos casos se iluustran en la figgura 15.4 (c1 > 0 en cada caaso). Obsérvesse que inclusoo si los datos muestran quee yt ha estadoo incrementánndose, generallmente con el tiempo, la estimación de la ecuación (15. 10) puede prroducir un Figura 15.4
Modelo de tend dencia cuadrática.
496
PARTE CUATRO:: Modelos de serie es de tiempo
valor positivvo para c3 peroo un valor neggativo para c2. Esto puede ocurrir o (como se muestra en la figura 15.44) debido a qu ue es frecuentte que los datos sólo abarcan una porción n de la curva de tendenciaa. Un moddelo un poco m más complicaado, al menos en función dee su estimacióón, es la curva logística, l la cuual está dada por: p
(15.111)
Esta ecuaciión es no lineaal en los parám metros (k, a y b) y por eso deben d estimarrse usando un procedimiennto de estimacción no lineal. Aunque estoo puede añaddir costos en el e cálculo, es conveniente en e algunos caasos. Como see muestra en la l figura 15.55, la ecuación (15.11) repreesenta una currva en forma de d S que puedde ser útil parra representarr las ventas de d un productto que algún día d saturarán el mercado (dde modo que llas reservas to otales del bienn en circulació ón se aproxim marán a algun na meseta o, dde manera equ uivalente, las ventas adicionales se aproxximarán a cero o).3 Ademáss de la curva llogística puedden usarse otraas curvas en forma f de S. U Una función muyy simple con esta forma quue se puede applicar para mo odelar los patrrones de satuuración de venntas está dada por: ¿ (15.112) Figura 15 5.5 Curvas en e forma de S.
3 La siguiente aproximaciión a la curva loggística puede estim marse usando mínnimos cuadrados ordinarios:
El parámeetro c2 debería seer siempre menor que 1 y de maneera típica estar en n la vecindad de 0.05 0 a 0.5. Esta ecuación es una aprooximación de tiem mpo discreto a la ecuación diferenncial dy/dt = c2y(c1 − y), y la solució ón a esta ecuaciónn diferencial tiene la forma de la eecuación (15.11)..
CAPÍT TULO 15: Suavizam miento y extrapolacción de series de tiempo t
497
Nó ótese que si toomamos tos logaritmos de ambos; lados, tenemos unna ecuación quee es lineal enn los parámetrros α y β, loss cuales puedeen estimarse usando mínim mos cuadradoos ordinarios: (15.13) Estta curva tamb bién se muestrra, en la figura 15.5. Obsérrvese que com mienza en el oriigen y se elev va en forma m más pronunciaada que la currva logística.
EJEMPLO 15.1
Pro onóstico de las s ventas de una a tienda de dep partamentos
En n éste ejemplo se usan modeelos de extrapolación simplle para pronossticar ventas al menudeo meensuales para tiendas de deepartamentos.4 La serie dee tiempo se preesenta en el cuadro que ssigue, donde fas observaciones mensu uales están ajuustadas estacio onalmente y aabarcan el perriodo de eneroo de 1986 a diiciembre de 19995. Las unidaades de medicción están en millones de ddólares y la fu uente de los dattos es el Depaartamento de Comercio dee Estados Uniddos.
Podríamos requerir r pronoosticar las ven ntas mensualees de enero, feebrero y los meeses siguientes en 1996! Paara este ejempllo extrapolam mos las ventas de enero de 199 96. Los resultados de cuatroo regresiones asociadas a conn cuatro de los modelos de tenndencia antess descritos sse enumerabaa continuacióón. Las estaadísticas de reggresión estánd dar se muestrran con las esstadísticas í eentre paréntessis: Mo odelo de tendencia lineal:
4
Usamos la serrie RT53 IR en la base de datos CT TIBASE.
498
PARTE CUATRO: Modelos de series de tiempo
Modelo de tendencia lineal logarítmica (crecimiento exponencial): log (SALES)t = 9.322 + .00474t (24.75)
R2 = .984
F(l/73) = 7 492
(15.15)
(86.55)
s = .021
DW = .32
Modelo de tendencia autorregresiva: SALESt = 37.53 + 1.00226 SALESt - 1 (0.39)
R2 = .995
(15.16)
(156.59)
F(l/73) = 24 519
s = 176.3
DW = 2.53
Modelo de tendencia autorregresiva logarítmica: log (SALES)t = 0.0272 + 0.99766 log (SALES)t-1 (15.17) (0.43)
R2 = .994
(152.81)
77(1/73) = 23 352
s = .012
DW = 2.5
En la primera regresión se construyó una variable de tiempo que corría de 0 a 118 y luego se usó como la variable independiente. Cuando t = 119 se coloca en el lado derecho de la siguiente ecuación: SALES = 10 765.4 + 71.68t
(15.18)
el pronóstico resultante es 19 295.3. El uso de la segunda ecuación log-lineal produce un pronóstico de 19 648.5. La tercera regresión, basada en un proceso autorregresivo, produce un valor extrapolado para enero de 1996 de 19 767.8: 19 767.8 ≈ 37.53 + 1.0023 X 19 685 Si el término constante fuera eliminado de la ecuación (15.17), el valor extrapolado sería 19 730.3. El resultado de la cuarta regresión se basa en el modelo autorregresivo logarítmico. El valor extrapolado en este caso es 19 765.1. Si quisiéramos calcular una tasa de crecimiento compuesta para la serie y extrapolar con base en que esa tasa de crecimiento permanece inmutable, el valor extrapolado sería 19 694.7. En las figuras 15.6a y b se trazan la serie simulada y la real para cada uno de los cuatro modelos de extrapolación. Aquí podemos ver que los dos modelos autorregresivos están más cerca de la serie real al final del periodo. Por supuesto, podrían usarse otros modelos de tendencia para extrapolar los datos. Por ejemplo, se podría calcular un pronóstico basado en un modelo de tendencia cuadrática (véase el ejercicio 15.1).
CAPÍTU ULO 15: Suavizam miento y extrapolac ción de series de tiempo t
499
Figura 15.6(a) Ventas simulada as y reales.
Figura 15.6(b b) Ventas simulada as y reales.
b)
Los método os de extrapolación simple como los quee se aplicaron en el ejemplo o precedente con c frecuenciaa forman la base para haceer pronósticos casuales de larrgo alcance dee variables quue van desde el e PIB hasta loos índices de población p o de contaminacióón. Aunque pueden ser útilles para formuular pronósticcos iniciales de forma rápidaa, por lo generral, proporcioonan poca preecisión de proonóstico. Un analista que esttima un modelo de extrappolación está al menos advvertido de
500
PARTE CUATRO: Modelos de series de tiempo
ccalcular un errror estándar dde pronóstico y un intervaloo de confianza de pronóstico, siguiendo los métodos presentadoss en el capítullo 8. Es impoortante percatarnos de que hay modelos alternativos que q pueden aplicarse a para obtener pro n nóstico? con errores e estánddar menores.
15.1.2
M Modelos de e promedio o móvil
Otra clase de d modelos deterministas quue se usan parra pronosticarr consiste en loos modelos dé promedio p móvvil. Como un ejemplo ej sencilllo, supongamo os que, para prronosticar unaa serie de tiem mpo mensuall, se puede ussar el modelo: (15.199) Entonces, un u pronóstico un periodo adelante a estarría dado por (15-20) El moddelo de promedio móvil es útil ú si creemoos que un valoor probable paara nuestra serie del próximoo mes es un siimple promeddio de sus valo ores durante los l 12 meses annteriores. Sin embargo, puede ser irreal asumir que un u buen pronóóstico de y, puede estar daado por un sim mple promediio de sus valoores pasados. A menudo es más razonablle suponer qu ue valores máss recientes de y, desempeñan un papel máás importante que valores anteriores. a En tal caso los valores v recienttes deben ser ponderados p coon más peso en e el promediio móvil. Un modelo simpple que logra estte es el modeloo de promedio móvil ponderaado exponenciaalmente (EWM MA, exponentiallyy wergkted movving average):
Aquí α es un u número enntre 0 y 1 que indica cuántoo más peso tieene la ponderración de los valores v recienntes en relación n con los antigguos. Con α = 1, por ejempllo, nuestro proonóstico se vuuelve: (15.22) e ignoramoos cualesquier valores de y que q hayan ocuurrido antes de d yT. Conform me α se vuelvee menor, coloccamos un maayor énfasis enn valores máss distantes de y. Nótese quee la ecuación (15.21) repreesenta un prom medio verdaddero, dado que (15.223) de modo que q la suma de los pesos da la unidad.
CAPÍT TULO 15: Suavizamiento y extrapola ación de series de tiempo
561
Así, podem mos pensar quee si la serie tieene una tendeencia ascenden nte (descendennte), el modeelo EWMA suubpredecirá (sobrepredecir ( rá) valores fuuturos de yt . Enn efecto, éste es el caso, deebido a que ell modelo prom media valoress pasados de yt para p producir un pronósticoo. Si yt ha estaado creciendoo en forma connstante en el passado, el pronóstico EWMA ŷT+1 por tanto será menor quue el valor yT más m reciente, y si s la serie conntinúa crecienndo en forma constante en el futuro, ŷT++1 tendrá una subbpredicción del d valor verdaadero yT+l. Po or tanto deberríamos eliminar cualquier ten ndencia de loss datos antes dde usar la técn nica EWMA. Una vez que se ha hecho unn pronóstico innicial sin tendeencia, puede agregarse a el téérmino de ten ndencia para obtener un pronnóstico final. Si deseamoos hacer un prronóstico ŷT+1 más de un peeriodo adelantte usando un moodelo de prom medio móvil pponderado exp ponencialmennte, podemos modificar m la ecuación (15.21 1) para incluirr un promedio o ponderado dde los pronóstiicos de corto plaazo más recienntes ŷT+1-1, ŷT+11- 2,…, ŷT+1. Essta extensión lóógica del mod delo EWMA esttá dada por:
Como un ejjemplo, consiidérese un pro onóstico de doos periodos ad delante (l = 2), el cual estarría dado por:
Ob bsérvese que el e pronóstico de dos perioddos es el mism mo que el pronnóstico de un peeriodo. Las ponnderaciones en e yT, ŷT – 1, …, en el modeloo EWMA son n las mismas quue antes, peroo ahora estam mos extrapolan ndo el promeedio adelante un periodo ex xtra. De hechoo, no es difícil demostrar (vééase el ejercicio 15.4) que el e pronóstico deel periodo l, ŷT+1, también eestá dado porr la ecuación ((15.25). Los pronósticos de proomedio móv vil representaados por las ecuaciones (155.20), (15.21) y (15.24) sonn todos pronóssticos adaptabbles. "Adaptabble", significa quue se ajustan en forma auutomática elloos, solos a loos datos dispponibles más reccientes. Por ejjemplo, considdérese un prom medio móvil dde cuatro periodos simple. Su upóngase quee y20 en la ffigura 15.7 representa loss datos indivviduales más reccientes. Enton nces nuestro pronóstico esstará dado porr: (15.26)
502
PARTE P CUATRO: Modelos de series de tiempo
Figura 15.7 Pronósticoos adaptables
y un pronósstico de dos periodos adelaante estará daado por: (15.227) Estos pronó ósticos están rrepresentados por cruces enn la figura 15.7. Si y21 fuerra conocido, prronosticaríam mos y22 un periiodo adelante como:
Este pronósstico está reprresentado porr una cruz enncerrada en un u círculo en la figura 15.7. Ahora supónngase que el valor v real de y21 resulta seer mayor que el valor pronossticado; es deecir,
ˆ
El valor reall de y22 por suupuesto no se conoce, pero esperaríamos que ŷ22 propoorcionaría un mejor pronósstico que ŷ22 debido d a la innformación exxtra usada en el proceso adaaptable. El prronóstico EW WMA exhibiríaa el mismo comportamien c nto adaptable. Aunquee los modeloss de promedioo móvil antes descritos son n útiles, no prroporcionan innformación accerca de la connfianza del prronóstico. La razón r de esto es que no se usó u regresiónn para estimaar el modelo, de modo quue no podem mos calcular errrores estándarres, ni podem mos describirr ni explicar el componennte estocástico (o no explicado) de la serie de tiempo. Es E este componente estocáástico el que crea el errorr en nuestro pronóstico. p A menos que el componennte estocástico sea s explicadoo a través del proceso p de modelado, m puedde decirse poco acerca de laas clases de errrores de pronnóstico que ppueden esperaarse.
15.2
SUAVIZA AMIENTO Y AJUSTE ES STACIONAL L Las técnicass de suavizam miento proporccionan un medio para elim minar o al mennos reducir las fluctuacioness volátiles a corto c plazo enn una serie de d tiempo. Essto puede ser útil ú debido a qque con frecuuencia es máss fácil discern nir tendenciass y patrones críticos y adem más analizar en e forma visuual una serie suavizada. El E
CAPÍTUL LO 15: Suavizamiento y extrapolación de series de tiem mpo
" 503
ajuste estacional es una forma especial de suaavizamiento; eelimina las osccilaciones estaccionales (cícliccas) de la seriee en lugar de eliminar e las flu uctuaciones irrregulares a corrto plazo.
15.2 2.1
Técn nicas de sua avizamiento o
En laa última secciión estudiamo os los modelos de promedio móvil (tanto o simples como o ponderados exponencialm mente) en el contexto del pronóstico, pero p estos modeelos también proporcionan n una base para suavizar series de tiem mpo. Por ejem mplo, una de las formas m más simples de d suavizar u una serie es tomar t un prom medio móvil dee periodo n. In ndicando la serrie original con n yt y la serie suavizada con yt , tenemos (15.28) Por supuesto, s enttre mayor es la n, más su uave será t. Un problem ma con el prom medio móvil ess que sólo usa v valores pasad dos (y actuales)) de yt para obttener cada valorr de t. Esto se soluciona con n facilidad usaando un promeedio móvil centtrado. Por ejemp plo, un promeedio móvil cen ntrado de cinco o periodos estáá dado por: (15.29) E suavizamien El nto exponencia al tan sólo im mplica el uso d del modelo de promedio móviil ponderado exponencialm mente para el suavizamientto. (Recuerdee que este modeelo asigna pesos más grandees a los valorees recientes dee yt.) La serie suavizada s expo onencialmentee t está dadaa por: (15.30)
dond de la sumatori a en la ecuaciión (15.30) see extiende en retrospectiva a todo lo largoo de la serie. De D hecho, t puede p calculaarse mucho m ás fácil si esccribimos (15.31) Ahorra, restando laa ecuación (1 5.31) de la eccuación (15.3 0), obtenemo s una fórm mula recurrentee para el cálc ulo de t: (15.32) Nóteese que entre más cerca esstá α de 1, tieene mayor peeso la ponderación del valorr actual de yt al a generar t. D De este modo, los valores p pequeños de α implican una serie s más suav vizada. En E ocasiones se requiere hacer una may yor suavizació ón de una serie pero no dar mucho m peso a los datos indiividuales pasaados. En tal caaso el uso de la ecua-
504
PARTE CUATR RO: Modelos de se eries de tiempo
ción (15.332) con un vallor pequeño de d α (digamoss, 0.1) no seríaa aceptable. En E su lugar puedde aplicarse un u suavizamieento exponenccial doble. Coomo el nombrre lo implica, laa serie t suavvizada una vezz a partir de laa ecuación (155.32) se suavizza de nuevo: (155.33) De esta foorma puede usarse u un valorr mayor de α, y la serie t resultante toddavía estará muuy suavizada. La fóórmula de suaavizamiento exponencial e ssimple de la ecuación (155.32) también puede p modificcarse incorporrando cambioss promedio enn la tendenciaa (incremento o disminucióón) a largo plaazo de la serie.. Esto fundam menta el métoddo de suavizacónn exponencial de dos parám metros de Holt..5 Ahora la serrie
t
suavizadda se
encuentraa a partir de dos d ecuacionees recurrentess y depende de d dos parámeetros de suavizzamiento, α y γ, los cuales deben caer eentre 0 y 1 (unna vez más, entre e más pequueños son α y γ, el suavizam miento es máás pesado): (155.34) (155.35) Aquí rt ess una serie suuavizada repreesentando la ttendencia; es decir, la tasa promedio dee incremento, en la serie suuavizada t. E Esta tendenciaa se añade cuaando se está caalculando la serie s suavizadda t en la ecuuación (15.344), impidiendoo por tanto que t se desvíe demasiado d dee los valores rrecientes de laa serie originaal yt . Esto es útil, ú en particuular si el méto odo de suavizzamiento va a ser usado ccomo base paraa el pronósticoo. Un pronóstico del perioddo l puede gennerarse a parttir de las ecuaciiones (15.34) y (15.35) usaando: (155.36) De este modo, m el pronóóstico del perriodo l toma eel valor suavizzado más reciiente y le ag grega un increemento esperaado lrT basadoo en la tendenncia (suavizadda) a T largo plazzo. (Si a los datos d se les ha quitado la tenndencia, ésta debe agregarsse de nuevo al pronóstico.) Los métodos m de suuavizamiento tienden t a ser ad hoc, en paarticular cuanddo se usan paraa generar pronnósticos. Un problema p es qque no tenemoos forma de deterd minar loss valores "corrrectos" de loss parámetros de d suavizaciónn, así que su elección se vu uelve un pocoo arbitraria. Sii el objetivo taan sólo es suaavizar la serie para facilitar su s interpretaciión o análisis,, éste no es unn problema en n realidad, yaa que podemos elegir los parrámetros que nos den la exxtensión de su uavizamiento de-
5 C.C. Holt, "Forecastinng Seasonals and Trends T by Exponnentially Weighted d Moving Averagges" reporte de innvestigación sin publicar, Carneggie Institute of Teechnology, Pittsb burgh, 1957.
CAPITUL LO 15: Suavizamien nto y extrapolación de series de tiem mpo
505
sead da. Debemos tener cuidadoo en reconoceer, sin embarrgo, que cuanndo se usa una ecuación com mo la ecuaciónn (15.36) paraa pronosticar, eel pronóstico resultante será un poco arbiitrario.
EJEMPLO 15.2
Cons strucción residencial nueva m mensual
La seerie de tiempoo de construccción residenciial nueva mennsual en Estado os Unidos prop porciona un buuen ejemplo de la aplicaciión de métoddos de suavizaamiento y ajustte estacional.6 La serie flucctúa en formaa considerablee y también exxhibe una fuertte variación esstacional. En este ejemplo suavizamos laa serie con el uso u de los métoodos de prom medio móvil y suavizamientto exponenciaal. P Primero usam mos los promeedios móviless centrados enn el periodo trres y siete paraa suavizar la serie; es deccir, generamoos la serie suuavizada t de d la serie origiinal yt usando:: (15.37) dondde n = 3 o 7. Nótese N que en virtud de que el promedio móvil m está cen ntrado, no hay necesidad de eliminar la tendencia de la l serie antes de suavizarlaa. La serie origiinal, junto coon las dos seeries suavizaddas, se muesttran en la figgura 15.8. Obséérvese que ell uso del prom medio móvil del periodo ssiete suaviza mucho la seriee e incluso eliimina algo dee la variación estacional.
Figura 15.8 Suavizamiento us sando promedios móvile es.
6 La serie de dat os original está en e miles de uniddades por mes y nno está ajustada estac ional-mente. Hem mos usado la ser ie HS6FR en la base b de datos CH HIBASE.
506
PARTE CUATR RO: Modelos de series de tiempo
Figura 15.9 Suaviza amiento usando promed dios móviles pondera ados exponencialmente.
Luego o, usamos el m método de suaavizamiento exxponencial; ess decir, aplicam mos la ecuación (15.32). Daado que la seriie original esttá creciendo con c el tiempo y el promedio móvil ponderrado exponenccialmente no está e centrado, la serie suavizzada subestimarrá la serie origginal a menoss que primeroo eliminemos la l tendencia de d la serie. Paraa eliminarla dde la serie orriginal asumim mos una tenddencia lineal (por supuesto que q podríamos probar tend dencias de tiem mpo alternativvas) y ejecutam mos la siguientte regresión durante d el periiodo de eneroo de 1986 a occtubre de 19995: ŷt = 142.92 - 0.4192* R2 = .227 (29.38)
(155.38)
(-5.83)
Los residuuales ut de estaa regresión, ess decir, ut= yt − 142.92 + 0.4192t, proporrcionan la serrie sin tendencia. A conntinuación apliicamos el suaavizamiento exxponencial a esta serie sin tendencia. Ussamos dos vaalores alternattivos del paráámetro de suaavizamiento: α = 0.8 (suavizzación ligera)) y α = 0.2 (suuavización peesada). Por últtimo, tomamoos la serie sin tendencia t suaavizada t y agregamos a la tendencia de nuevo; es deecir, calculamoos ỹt = t + 1442.92 - 0.41922t. La serrie original y la serie suavizaada se muestrran en la figuraa 15.9. Obsérvvese a partir de la figura que las variaciones estacionalees, aunque esttán reducidas, son recorridas hacía adelannte por el suav vizamiento exxponencial pessado. Esto ocurre ya que el promedio móóvil ponderad do exponenciaalmente no está centrado. Por tanto, si una u serie mueestra variacio ones estacionaales fuertes, el suavizamieento exponenciial sólo debee usarse desppués de que la serie se ha h ajustado estae cionalmennte.
CAPÍT TULO 15: Suavizamiento y extrapola ación de series de e tiempo
15.2.2
507
Aju uste estacioonal
Las técnicas dee ajuste estaciional básicam L mente son méttodos ad hoc para p calcular ín ndices estacion nales (los cuaales intentan medir m la variacción estacionaal en la serie) y luego usar estos e índices p para desestaccionalizar (es decir, ajustaar estacionalm mente) la seriee eliminando las variaciones estacionalees. Los datos económicos dee Estados Uniidos, por lo g general, son ajjustados estaccionalmente por p el método C Census II (o un na de sus variaantes), el cuall fue elaborado o por la Oficin na del Censo deel Departameento de Comeercio de Estad dos Unidos. El E método Cen nsus II es un prrocedimiento bastante b detalllado y compliccado (y ad hocc de manera so orprendente), y por lo tanto no intentarem mos describirlo aquí. En v vez de ello, ex xponemos la id dea básica quee fundamenta ttodos los méto odos de ajustee estacional (in ncluyendo el C Census II) y presentamos u un método mu uy simple quee es adecuado o en muchos caasos. Las técnicaas de ajuste esstacional se fu undamentan een que una serrie de tiempo yt puede repressentarse como o el producto de cuatro com mponentes: yt = L X S X C X 1
(15.39)
do onde L = valo or de la tendeencia secular a largo plazo en la serie S = valo or del compon nente estacion nal C = com mponente cícliico (a largo pllazo) I = com mponente irregular E objetivo es eliminar El e el co omponente esttacional S. Para hacerrlo primero ttratamos de aislar a los com mponentes de tendencia a laargo plazo y cíclico combin nados L x C. Esto E no se pueede hacer con exactitud; en lu ugar de ello, se usa un proccedimiento de suavizamientto ad hoc paraa eliminar (lo m posible) lo más os componenttes estacional e irregular co ombinados S x I de la serie orriginal yt. Por ejemplo, supóngase que yt consiste de d datos mensualees. Entonces, see calcula un promedio p de 1 12 meses ỹt: (15.40) Se da por hech ho que ỹt estáá relativamentte libre de flu uctuaciones esstacionales e irrregulares y po or tanto es un na estimación de L x C. Ahora diviidimos los daatos originales entre esta estimación e dee L x C para ob btener una esstimación de los componen ntes estacionaal e irregular combinados S x I: (15.41)) El siguientte paso es elim minar, si es po osible, todo ell componente irregular I a fiin de obtener el e índice estaciional. Para haccer esto, prom mediamos los valores v de S x
508
PA ARTE CUATRO: Modelos M de series de tiempo
I correspondieentes al mismoo mes. En otraas palabras, suupóngase que y1 (y por tantoo z1) correspond de a enero, y2 a febrero, etccétera, y que hhay 48 mesess de datos. Porr tanto t calculam mos
El fundamentto aquí es quee cuando los porcentajes E p esttacionales irreegulares zt sonn p promediados para cada m mes (cada trim mestre, si los datos son trim mestrales), enn g gran parte lass fluctuacionees irregulares estarán suavvizadas. Los 12 promedios p z1, ..., zl2 entonnces serán esstimaciones de d los índices estacionales. e Deberían sum mar cerca de 12 pero no loo harán con taanta exactitudd si s hay algunaa tendencia a largo plazo en los datoss. Los índicess estacionaless finales f son caalculados multiplicando loos índices en la ecuación (15.42) por unn factor f que llevva su suma a 12. (Por ejem mplo, si z1, ..., zl2 suma 11.7, se multiplicaa cada c uno po or 12.0/11.7 de modo que q los índicces revisadoss sumen 12.) Denotamos D e estos índices eestacionales finales f con z1, ..., zl2. Debido a esto, ahora laa desestacionalización de la serie originall yt es simple: sólo se dividee cada valor en la serie entrre su correspoondiente índicce estacional, e eliminando así el componnente estacionnal mientras se dejan los ottros tres com mp ponentes. De este modo, laa serie ajustad da estacionalm mente yta se obbtiene a partir a d yta = y1 / z1, y2 = y2 / z2, …, y12a = y12/ z12, y a13 = y13 / z1, y 14a = y 14 / z2, etcétera. de EJEMPLO 15.3
Construcción residencial r nue eva mensual
Ahora aplicarremos la técniica de ajuste estacional e a nuuestra serie dee construcciónn residencial nuueva mensuaal (véase el ejemplo e 15.2)). Para hacerr esto primeroo calculamos unn promedio dee 12 meses ỹt de la serie orriginal yt usanddo la ecuaciónn (15.40) y lueggo dividimos yt entre ỹt ; ess decir, calcullamos zt = yt /ỹt . Nótese que zt contiene (ap proximadameente) los comp ponentes estaccional e irreguular de la serie original. Elim minamos el coomponente irreegular promeddiando los valores de zt que corresponden al mismo mes; es decir, calculamos z1, z2, ..., z12 usanndo la ecuaciónn (15.42). Lueggo calculamoss los índices estacionales zz1, z2, ..., z12 1 finales mulltiplicando z1, ..., z12 por un factor que lleeva su suma a 1. Los índicees estacionalees finales son dee la siguiente forma: Índices estacio onales Mes
ín ndice
Mes s
índ dice
Enero Febrero Marzo Abril Mayo Junio
0.7437 0.7508 1.0330 1.1797 1.1848 1.2285
Julio o Ago osto Sep ptiembre Octu ubre Novviembre Dicie embre
1.1466 1.1120 1.0 0544 1.1211 0.8 8836 0.7 7582
CAPÍTUL LO 15: Suavizamiento y extrapolación n de series de tiem mpo
509
Figura 15.10 Construcción residencial nuev va vivienda: índice es estacionales.
Figura 15.11
Ajustes estacion nales de los datos de la construcción residencial nuevva.
Estos índices esttacionales se han trazado en e la figura 15.10. Para desestaacionalizar la serie originall yt , sólo diviidimos cada valor v en la seriie entre su índ dice estacionaal corresponddiente, eliminaando así el co omponente estaacional. La seerie original yt y la serie ajuustada estacionnalmente yta se muestran en la l figura 15.11. Obsérvese que la variacción estacionaal se ha elimiinado en la seriie ajustada, mientras m quee permanecenn la tendenciia a largo pllazo y las flucctuaciones irreegulares a corrto plazo.
510
PARTE CUATRO O: Modelos de seriies de tiempo
EJERCICIO OS 15.1 Considdere el ejemploo 15.1 y use lo os datos para las ventas mennsuales de tienddas de departamenttos para estimaar un modelo de tendencia cuadrática. Usse el modelo estima e do para obteener un valor extrapolado e paara las ventas de d enero de 1996. Trate de evvaluar su modelo en e comparaciónn con los otros cuatro estimaados en el ejem mplo 15.1. Expplique cómo y por qué su pronósttico para enero difiere de los ootros pronósticos en el ejempllo. 15.2 ¿Cuál de los modeloss de extrapolacción simples prresentados en la sección 15.1 (si es que hay algguno) consideraa que es adecuuado para pronnosticar el PIB? ¿El índice de d precios al conssumidor? ¿Unaa tasa de interéés a corto plazoo? ¿La produccción anual de trigo? Explique. 15.3 Demuestre que el modelo de prromedio móvvil ponderado exponencialm mente (EWMA) geenerará pronósticos que son de d naturaleza aadaptable. 15.4 Muestrre que el pronósstico EWMA de d l periodos addelante es igual que el pronóstico de un perioddo adelante; ess decir,
15.5 En el cuadro c 15.1 see muestran los datos mensualles para el índdice de Precioss de Acciones Coomunes Standaard & Poor 500. Los datos tam mbién aparecen en la gráfica dee la figura 15.12.
CUADRO 15..1 ÍNDICE DE PRECIOS P DE AC CCIONES COMU UNES S&P: COM MPUESTO (1941-1943 = 10)
Obs. 1980.01 1980.07 1981.01 1981.07 1982.01 1982.07 1983.01 1983.07 1984.01 1984.07 1985.01 1985.07 1986.01 1986.07 1987.01 1987.07 1988.01 1988.07 1989.01 1989.07
Enero/ Julio 1 110.8700 1 119.8300 1 132.9700 1 129.1300 1 117.2800 1 109.3800 1 144.2700 1 166.9600 1 166.3900 1 151.0800 1 171.6100 1 192.5400 2 208.1900 2 240.1800 2 264.5100 3 310.0900 2 250.4800 2 269.0500 2 285.4100 3 331.9300
F ebrero/ Agosto 1115.3400 1223.5000 1228.4000 1229.6300 1114.5000 1009.6500 1446.8000 1662.4200 1557.2500 1664.4200 1880.8800 1888.3100 2119.3700 2445.0000 2880.9300 3229.3600 2558.1300 2663.7300 2994.0100 3446.6100
M Marzo/ Sept. 1044.6900 1266.5100 1333.1900 1188.2700 1100.8400 1222.4300 1511.8800 1677.1600 1577.4400 1666.1100 1799.4200 1844.0600 2322.3300 2388.2700 2922.4700 3188.6600 2655.7400 2677.9700 2922.7100 3477.3300
Abbril/ Oct. 102. 9700 130. 2200 134. 4300 119. 8000 116. 3100 132. 6600 157. 7100 167. 6500 157. 6000 164. 8200 180. 6200 186. 1800 237. 9800 237. 3600 289. 3200 280. 1600 262. 6100 277. 4000 302. 2500 347. 4000
Maayo/ Nov. 107.6 900 135.6 500 131.7 300 122.9 200 116.3 500 138.1 000 164.1 000 165.2 300 156.5 500 166.2 700 184.9 000 197.4 500 238.4 600 245.0 900 289.1 200 245.0 100 256.1 200 271.0 200 313.9 300 345.9 900
Juniio/ Dic. 114.55 00 133.48 00 132.28 00 123.79 00 109.70 00 139.37 00 166.39 00 164.36 00 153.12 00 164.48 00 188.89 00 207.26 00 245.30 00 248.61 00 301.38 00 240.96 00 270.68 00 276.51 00 323.73 00 348.57 00
CAPÍTULO 15: Suavizamiento y extrapolación de series de e tiempo
511
CUADRO 15.1 (C C Continuación) ÍNDICE DE PRECIOS DE ACCIO ONES COMUNE ES S&P: COMPU UESTO (1941-19 943 = 10)
Obs.
Enerro/ Julio
1990.01 1 1990.07 1 1991.01 1 1991.07 1 1992.01 1 1992.07 1 1993.01 1 1993.07 1 1994.01 1 1994.07 1 1995.01 1 1995.07 1 1996.01 1
339..9700 360..0300 325..4900 380..3300 416..0800 415..0500 435..2300 447..2900 472..9900 451..4000 465..2500 557..3670 614.44200
Febreero/ Agosto
Marzoo/ Sept.
Abril// Oct.
Mayo/ Nov.
330..4500 330..7500 362..2600 389..4000 412..5600 417..9300 441..7000 454..1300 471..5600 464..2400 481..9200 559..1110 649..5400
338.4700 315.4100 372.2800 387.2000 407.3600 418.4800 450.1600 459.2400 463.8100 466.9600 493.1500 578.7700
338.18000 307.12000 379.68000 386.88000 407.41000 412.50000 443.08000 463.90000 447.23000 463.81000 507.91000 582.91880
350.2500 315.2900 377.9900 385.9200 414.81000 422.8400 445.2500 462.8900 450.9000 461.0100 523.8100 595.5300
Junio/ Dic. 360.3900 328.7500 378.2900 388.5100 408.2700 435.6400 448.0600 465.9500 454.8300 455.1900 539.3500 614.5700
Fuente: F Citibase.
Figura 15.12 2 Índice de Pre ecios de Acciones Co omunes Standard & Poor. P
a) Usando todos menos loos dos últimos datos individuaales (es decir, enero e y febreroo dde 1996), suavicce exponencialm mente los datoss, usando un vallor de 0.9 para el e parámetro dee s suavización α. Sugerencia: S Reecuerde que un n promedio móóvil siempre es más corto quee laa serie originall. Repita el prooceso para un valor v de 0.2. b) Una vezz más usando toodos menos loss dos últimos ddatos individualles, suavice loss d datos usando ell método de suuavización exp ponencial de doos parámetros de Holt. Esta-b blezca α = 0.2 y γ = 0.2. Expliqque cómo y porr qué difieren loos resultados de los obtenidoss e el inciso a). Ahora use la ecuación (15.366) para pronostiicar la serie parra 1 y 2 meses.. en ¿ ¿Qué tan cerca está su pronóstico de los valo ores reales del índice S&P 5000 para enero y f febrero de 19966?
512
PA ARTE CUATRO: Modelos M de seriess de tiempo
Figura 15.13 Ventas mens suales de automóvviles (miles de unidades)
15.6 1 Los datos mensuales parra las ventas dee automóviles aal menudeo se muestran m en el cuadro c 15.2. Loos datos tambiién aparecen en n la gráfica de la l figura 15.133. a) Use un promedio móvvil centrado en 6 meses para ssuavizar los dattos. ¿Es eviden-tte un patrón esstacional? ¿Espperaría que las ventas de autoomóviles exhibbieran regulari-d dades estacionaales? b) Usando o los datos origginales del cuaddro 15.2, apliquue el procedim miento de ajustee e estacional desccrito en el textoo. Haga una grráfica de los dooce índices estaacionales comoo u función deel tiempo y traate de explicar la forma de la curva. Tam una mbién haga unaa g gráfica de la seerie ajustada esstacionalmente y compárela ccon la serie origginal.
C CUADRO 15.2 VENTAS V AL MENUDEO: AUTOM MÓVILES DE PA ASAJEROS NUE EVOS, TOTAL T DE NACIONALES MÁS IMPORTADOS (miles) (
Obs.
Ene ro/ Jul io i
Febreero/ Ago s t o
Marzzo/ Sep t. t
1980.01 1980.07 1 1981.01 1981.07 1982.01 1982.07 1983.01 1983.07 1984.01 1 1984.07 1985.01 1985.07
805.8000 772.6000 647.5000 706.8000 534.7000 629.5000 595.8000 791.6000 778.5000 889.8000 829.9000 892.4000
811.6000 685.5000 764.0000 801.1000 632.5000 608.9000 627.8000 740.7000 841.4000 814.9000 833.4000 995.4000
895.22000 674.11000 962.77000 687.22000 777.00000 671.22000 821.44000 704.88000 963.99000 743.55000 965.00000 1064.33000
Abrill/ Oct . 743.30000 847.50000 751.30000 648.80000 668.90000 656.00000 761.90000 860.80000 895.60000 901.50000 983.30000 859.10000
Mayo// Nov.
Junio/ D ic.
696.7000 698.2000 733.6000 584.6000 774.3000 743.4000 836.6000 781.7000 1047.0000 802.4000 1068.5000 758.4000
701.9000 649.4000 723.8000 522.9000 651.0000 632.0000 903.8000 751.7000 952.4000 759.3000 920.2000 808.5000
CAPÍTULO 15: Suavizamiento y extrapolación de series de tiempo
513
CUADRO 15.2 (Continuación) VENTAS AL MENUDEO: AUTOMÓVILES DE PASAJEROS NUEVOS, TOTAL DE NACIONALES MÁS IMPORTADOS (miles)
Obs. 1986.01 1986.07 1987.01 1987.07 1988.01 1988.07 1989.01 1989.07 1990.01 1990.07 1991.01 1991.07 1992.01 1992.07 1993.01 1993.07 1994.01 1994.07 1995.01 1995.07 1996.01
Enero/ Julio
Febrero/ Agosto
Marzo/ Sept.
Abril/ Oct.
866.8000 949.7000 621.8000 905.7000 757.2000 856.0000 711.9000 837.1000 743.3000 803.2000 554.6000 773.2000 560.5000 733.6000 562.2000 763.5000 606.1000 713.2000 581.5000 721.3000 567.0000
829.7000 949.0000 774.4000 959.2000 880.5000 878.7000 745.6000 963.5000 716.5000 786.0000 621.5000 690.4000 651.1000 644.8000 593.4000 697.1000 698.6000 782.3000 649.1000 806.4000 690.6000
893:8000 12Í3.1000 927.0000 896.9000 998.5000 822.3000 879.2000 829.9000 850.3000 769.0000 730.3000 671.4000 720.4000 673.7000 735.1000 704.0000 876.2000 741.8000 798.7000 714.9000
969.3000 902.1000 931.3000 794.5000 895.1000 829.0000 904.6000 739.2000 802.1000 787.8000 690.7000 702.0000 715.8000 694.5000 768.7000 717.3000 785.8000 738.0000 685.9000 701.6000
Fuente: Citibase.
Mayo/ Nov. 1068.5000 778.5000 861.2000 729.2000 966.9000 786.8000 963.8000 672.3000 872.4000 661.2000 769.5000 606.5000 733.7000 601.0000 812.1000 667.6000 814.5000 670.7000 825.2000 644.5000
Junio/ Dic. 997.8000 987.4000 935.1000 834.6000 1002.6000 872.0000 888.8000 640.9000 857.3000 651.1000 771.7000 593.2000 824.8000 660.5000 835.6000 661.1000 871.4000 691.8000 852.8000 654.3000
CAPÍTULO
16
PROPIEDADES DE LAS SERIES DE TIEMPO ESTOCÁSTICAS
En el capítulo 15 expusimos varias técnicas de extrapolación simple. En este capítulo comenzaremos nuestro tratamiento sobre la construcción y uso de modelos de series de tiempo. Estos modelos proporcionan un método más complejo de extrapolar las series de tiempo ya que se basan en la noción de que las series que se van a pronosticar se han generado por un proceso estocástico (o aleatorio), con una estructura que puede caracterizarse y describirse. En otras palabras, un modelo de series de tiempo proporciona una descripción de la naturaleza aleatoria del proceso que generó la muestra de observaciones bajo estudio. La descripción no se da en función de una relación de causa y efecto (como sería el caso en un modelo de regresión) sino en función de cómo está incorporada la aleatoriedad en el proceso. Comenzamos, en este capítulo, con una introducción a la naturaleza de los modelos de series de tiempo estocásticos y demostrando cómo caracterizan estos modelos la estructura estocástica del proceso subyacente que generó la serie particular. Luego analizaremos las propiedades de las series de tiempo estocas-ticas, enfocándose en el concepto de estacionariedad. Este material es importante para la exposición de la construcción del modelo en los siguientes capítulos. Después presentaremos una prueba estadística (la prueba de Dickey-Fuller) para estacionariedad. Por último, expondremos series de tiempo cointegradas; series que no son estacionarias pero que pueden combinarse para formar una serie estacionaria.
16.1
INTRODUCCIÓN A LOS MODELOS DE SERIES DE TIEMPO ESTOCÁSTICAS Los modelos de series de tiempo desarrollados en este capítulo y los capítulos siguientes se basan en la suposición de que las series que se van a pronosticar
514
CAPÍT TULO 16: Propieda ades de las series de tiempo estocás sticas
515
se han h generado por un processo estocástico.. En otras palaabras, asumim mos que cada vallor y1, y2,..., YT en la serie es extraído all azar de una distribución de d probabilidaad. Al modellar dicho procceso, intentam mos describir las caracteríssticas de su aleeatoriedad. Estto nos ayudarría a inferir allgo sobre las pprobabilidadees asociadas con n valores futuuros alternativvos de la seriee. Para generallizar, podríam mos decir que la serie obserrvada y1,..., yT es extraída de un conjunto dee variables aleeatorias distrib buidas en forma conjunta. Si pudiéramos
esp pecificar num méricamente dé d alguna mannera la funcióón de la distrribución de pro obabilidad parra nuestra serrie, podríamoss determinar lla probabilidaad de uno u otrro resultado fuuturo. Desafortunaadamente, la especificación e n completa dee la función de d la distribucción de probaabilidad para una serie de tiempo, por llo general, es imposible. Sinn embargo, ess común y possible construirr un modelo ssimplificado de d las series de tiempo que explica e su aleatoriedad de manera que sea s útil para pronosticar. p Porr ejemplo, poodemos creer que los valo ores de y1,..., yT están distrribuidos en forrma normal y están correelacionados entre e sí de aacuerdo con un u proceso auttorregresivo de d primer ordeen simple. La distribución real puede ser más compliccada, pero esste modelo simple puede ser s una aproxximación razoonable. Por sup puesto, la utilidad de un modelo m así dep pende de qué tan cerca cappte la distribucción de probaabilidad verdaadera y por taanto el compoortamiento aleeatorio verdad dero de la serrie. Nótese quue no necesitta igualar el ccomportamieento pasado reaal (y regularmeente no lo haráá) de la serie dado d que tantoo la serie como el modelo sonn estocásticos.. Tan sólo debbería captar laas características de aleatorriedad de la serrie. 16 6.1.1
Cam minatas aleatorias
Nuuestro primer ejemplo (y éll más simple) de una serie de tiempo esttocástica es el proceso p de cam minata aleatooria. En el proceso más Sim mple de caminaata aleatoria cadda cambio succesivo en yt es extraído en forma indepeendiente de unna distribució ón de probabilidad con meedia 0. Por tannto, yt está detterminado po or: yt = yt -1 + εt
(16.1)
conn E(εt) = 0 y E(ε E t εs) = 0 paara t ≠ s. Dich ho proceso puuede ser repressentado por loss lanzamientoos sucesivos dde una monedda, donde unaa cara recibe un u valor de +1 y una cruz reecibe un valoor de -1. Considerem mos el caso en el que se requuiere un pronóóstico para un proceso de cam minata aleatoria. El pronósstico está dad do por: (16.2) (16.3)
516
PARTE CUATRO: Modelos de serie es de tiempo
El pronósticco dos perioddos adelante es: e (16..4) Del mismo modo, el proonóstico l periiodos adelantee también es yT. Aunquee el pronósticoo ŷT +1 será ell mismo sin im mportar cuán grande sea l, la varianza deel error de prronóstico creccerá conform me l se haga mayor. m Para un periodo el error e de pronóóstico está dad do por: (166.5) y su varianzza es sólo E(ε T2+ 1 ) = σε2 . Paara el pronósttico de dos perriodos (166.6) y su varianzza es: (166.7) Dado que εT + 1 y εT+ 2 soon independien ntes, el tercer término en laa ecuación (166.7) es 0 y la varrianza del erroor es 2σ2ε . De igual forma, ppara el pronósstico del perioodo l, la varianzaa del error es llσ2ε . Así, el erro ror estándar deel pronóstico se s incrementa con c la raíz cuaddrada de l. Poor tanto se pu ueden obtener intervalos dee confianza paara nuestros prronósticos, y estos intervallos se volveráán más ampliios conforme se incremente el horizonte del pronósticco. En la figuura 16.1 se iluustra lo anteriior. Nótese que los pronósticoos son todos iguales i a la úlltima observación yT, pero los intervalos de d confianza representadoss por 1 desviaación estándaar en el error de pronóstico se incrementan conforme se incrementta la raíz cuaddrada de l. El hechho de que se puedan p generaar intervalos de d confianza de d esta clase es una ventaja imp portante de loos modelos dee series de tiem mpo estocástiicas. Como
Figura 16 6.1
Pronósticco de una caminata a aleatoria.
CAPÍÍTULO 16: Propied dades de las seriess de tiempo estocá ásticas
517
exxplicamos en el capítulo 88, los que elaaboran políticcas necesitann conocer el maargen de errorr a fin de evaaluar un pronó óstico particullar, y así los intervalos de coonfianza puedden ser tan im mportantes com mo los mismoos pronósticoos. Una extensión simple deel proceso de caminata aleaatoria expuesto antes es la caaminata aleatooria con rumbo. Este processo explica unaa tendencia (aascendente o deescendente) en n la serie yt y de este modoo nos permite expresar esa tendencia t en nu uestro pronósttico. En este proceso p yt esttá determinadda por: y t = y t - 1 + d +ε t
(16.8)
dee modo que enn promedio eel proceso ten nderá a moverrse en forma ascendente (para d > 0). Ahora A el pronóóstico de un periodo p es: (16.9) y el e pronóstico para el perioddo l es: ŷ T + 1 = y T+ ld
(16.10)
Ell error estándar del pronósstico será el mismo m que anntes. Para un periodo, p
(16.11) co omo antes. El proceso, juntto con los proonósticos y loos intervalos de d confianza deel pronóstico, se ilustran enn la figura 16.2 2. Como se vee en la figura,, los pronósticcos se incrementan en form ma lineal con l y el error estándar del prronóstico se inccrementa con n la raíz cuadrrada de l.
Figura 16.2 Pronóstico de una caminata aleattoria con rumbo lineal.
518
PARTE CUATRO: Modelos de series de tiempo
En el capítulo 17 examinaremos una clase general de modelos de series de tiempo estocásticas. Más adelante, veremos cómo puede usarse esa clase de modelos para hacer pronósticos para una amplia variedad de series de tiempo. Sin embargo, primero es necesario introducir algunos conceptos básicos respecto a los procesos estocásticos y sus propiedades.
16.1.2
Series de tiempo estacionarias y no estacionarias
Cuando comenzamos a desarrollar modelos para series de tiempo, deseamos saber si es posible suponer que el proceso estocástico subyacente que generó la serie es invariable con respecto al tiempo. Si las características del proceso estocástico cambian con el tiempo; es decir, si el proceso es no estacionario, en general será difícil representar la serie de tiempo durante intervalos de tiempo pasados y futuros con un modelo algebraico simple.1 Por el contrario, si el proceso estocástico está fijo en el tiempo; es decir, si es estacionario, entonces podemos modelar el proceso a través de una ecuación con coeficientes fijos que pueden estimarse a partir de datos pasados. Esto es análogo al modelo de regresión de una sola ecuación en el que una variable se relaciona con otras variables, con coeficientes que son estimados bajo la suposición de que la relación estructural descrita por la ecuación es invariable con el tiempo (es decir, es estacionaria). Si la relación estructural cambió con el tiempo, no se podrían aplicar las técnicas del capítulo 8 al usar un modelo de regresión para el pronóstico. Los modelos desarrollados detalladamente en el capítulo 17 representan procesos estocásticos que se supone están en equilibrio alrededor de un nivel medio constante. La probabilidad de una fluctuación dada en el proceso a partir de ese nivel medio se supone que es la misma en cualquier punto en el tiempo. En otras palabras, se supone que las propiedades estocásticas del proceso estacionario son invariables con respecto al tiempo.
Se puede dar el caso de que muchas de las series de tiempo que uno encuentra en los negocios y la economía no son generados por procesos estacionarios. El PIB, por ejemplo, en su mayor parte ha estado creciendo en forma constante. Por esta razón sus propiedades estocásticas en 1997 son bastante diferentes de las de 1933. Aunque puede ser difícil modelar procesos no estacionarios, veremos que los procesos no estacionarios a menudo pueden transformarse en procesos estacionarios o aproximadamente estacionarios.
16.1.3
Propiedades de los procesos estacionarios
Se ha dicho que cualquier serie de tiempo estocástica y1, ...,y T puede considerarse generada por un conjunto de variables aleatorias distribuidas en forma conjunta; es decir, el conjunto de datos individuales y1, ...,y T representa un resulta1 La caminata aleatoria con rumbo lineal es un ejemplo de un proceso no estacionario para el cual puede construirse un modelo de pronóstico simple.
CAP PÍTULO 16: Propie edades de las series de tiempo estoc cásticas
519
doo particular de d la funciónn de la distribución de prrobabilidad conjunta p( y1, .. .,y T ).2 Asimissmo, una obserrvación futuraa yT+1 puede considerarse coomo generada po or una función de distribuciónn de probabiliddad condicionall p(yT+1│y1, ....,y T ); es decir, un na distribuci ón de probabbilidad para yT+1 dadas laas observacioones pasadas y1, ...,y T . Entonnces, un proceeso estacionarrio se define ccomo uno cuyaa distribución co onjunta y distriibución condiccional son inva ariables con reespecto al desp plazamiento en ell tiempo. De otra o manera, si s la serie y t ess estacionariaa, entonces (16.12) y
(16.13)
p ara cualquierr t, k y m. Observe qu ue si la serie yt es estacionarria, la media dde la serie, la cual c se define co omo: µy = E(y E t) taambién debe ser estacionaaria, así que E(y E t) = E(yt A Además, la varrianza de la seerie,
(16.14) + m),
para cuallquier t y m. (16.15)
debe ser estacio onaria, de moddo que E[(yt - µy)2] = E[(yt + m - µy)2] y, porr último, para cu ualquier rezaggo k, la covarianza de la seerie, (16.16) ddebe ser estacioonaria, de moddo que Cov (yt, yt + k) = Cov ((yt + m, yt+m+k).3 Si un procceso estocástiico es estacioonario, la dis tribución de probabilidad p((y t ) es la missma para todoo tiempo t y su forma (o al menos alggunas de sus prropiedades) puede p inferirs e viendo un histograma h dee las observacciones y 1 , ..., yT que forman la l serie observvada. Recuérd dese del capítuulo 2 que una estimación e de laa media µ y dell proceso puedde obtenerse de d la media m muestral de la serie: (16.17)
2 Este resultaddo se llama realizzación. Por tanto, y 1 , ...,y T repressenta una realizaciión particular del prroceso estocástico representado poor la distribuciónn de probabilidad p( y 1 , ..., y T ). 3 Es posible que la media, la varianza y la coovarianza de la seerie sean estacionnarias pero no la diistribución de pro obabilidad conju nta. Si las distribbuciones de prob abilidad son estaacionarias, denom minamos a la seriee estacionaria en sentido estricto. Si sólo la media, la varianza y lass covarianzas son esstacionarias, denoominamos a la serrie estacionaria en sentido amplio. Nótese que la esstacionariedad en seentido estricto im mplica estacionarriedad en sentidoo amplio pero noo sucede lo mism mo a la inversa.
520
PA ARTE CUATRO: Modelos M de seríes de tiempo
y una estimaación de la vaarianza σ2y puuede obtenersse a partir de la varianza muestra! (16.188)
16.2
CARACTE ERIZACIÓN DE SERIES DE TIEMPO O: LA FUNCIÓ ÓN DE AUTOC CORRELACIÓ ÓN Mientras es imposible i obttener una desccripción comppleta de un prroceso estocásstico (es decirr, especificar en realidad laas distribucioones de probaabilidad subyaacentes), la fuunción de auutocorrelación n demostrará ser muy útil debido a quue proporciona una descripciión parcial deel proceso parra propósitos de modeladoo. La función de d autocorrelaación nos dicee cuánta correelación hay (y y por implicaación cuánta interdependenncia hay) entree datos indiviiduales contigguos en la seriie yt. Definimos la autocorrelaación con rezaggo k como:
Para un proceeso estacionarrio la varianza en el tiempoo t en el deno ominador de la l ecuación (16..19) es la missma que la varrianza en el tiiempo t + k; así, a el denomiinador es justo o la varianza del proceso estocástico e y
Nótese que el e numerador en la ecuaciónn (16.20) es la covarianza entre yt y yt + k , γk , de modo que q (16.211) y por tanto ρ0 = 1 para cuaalquier processo estocástico.. Supóngaase ahora quee el proceso estocástico es tan sólo yt = εt
(16.222)
donde ε t es una u variable aaleatoria distriibuida en form ma independieente con mediia cero. Entoncces, es fácil vver a partir de la ecuaciónn (16.20) quee la función de d autocorrelaciión para este proceso estáá dada por ρ0 = 1, ρk = 0 para k > 0. El E proceso de laa ecuación (16.22) se llam ma ruido blancco y no hay un u modelo quue pueda proporrcionar un pronóstico mejorr que ŷT+ l = 0 para toda l. De D este modo,
CAPÍTULO 16: Pro opiedades de las se eries de tiempo esto ocásticas
521
sii la función de d autocorrelaación es cero (o ( cercana a ccero) para todda k > 0, hay poco o ningúnn valor en usaar un modelo para pronostticar la serie. Está claro que la funcióón de autocorrrelación en laa ecuación (166.20) es puramente m teórica en el sentido de que descrribe un proceeso estocásticoo para el que sóólo tenemos un número liimitado de ob bservaciones.. Entonces, en e la práctica debemos calcuular una estim mación de la fuunción de auttocorrelación, llamada funciión de autocorrrelación muestrral:
(16.23)
Por las deefiniciones ess fácil ver qu ue tanto la fuunción de auttocorrelación teeórica como la l estimada sson simétricass; es decir, qque la correlaación para un desplazamientto positivo es la misma quue para un dessplazamiento negativo, de modo m que ρk = ρ - k
(16.24)
Entonces, al hacer E h una grááfica de una función de autocorrelació a ón (es decir, trrazar ρk para valores difereentes de k), só ólo necesitam mos consideraar valores posiitivos de k. Frecuentem mente es útill determinar si s un valor paarticular de la función de au utocorrelaciónn muestral ρˆk está lo bastannte cerca de cero c como parra permitir la suuposición de que el valor verdadero dee la función dde autocorrelación ρk es en effecto igual a cero. También es útil probbar si todos loos valores de la l función de au utocorrelación n para k > 0 son iguales a cero. (Si lo sson, sabemos que estamos trratando con ruido r blanco.) Por fortun na, pueden ussarse pruebass estadísticas siimples para probar p la hipóótesis de que ρk = 0 para unna k particulaar o probar la hipótesis de qu ue ρk = 0 paraa todas las k > 0. Para probaar si un valor particular de d la funciónn de autocorreelación ρk es ig gual a cero ussamos un resuultado obteniddo por Bartlettt. Él demostrró que si una seerie de tiempoo se ha generaddo por un proceso de ruido blanco, los cooeficientes de auutocorrelación muestral (ppara k > 0) están e distribuiidos aproxim madamente de accuerdo con una u distribucióón normal coon media 0 y desviación estándar e 1/√T T (ddonde T es el número de obbservaciones en la serie).4 De D este modo o, si una serie particular consiste de, digaamos, 100 daatos individuales, podemoos aplicar un errror estándar de 0.1 a cadaa coeficiente de d autocorrelaación. Por con nsiguiente, si unn coeficiente particular ess mayor en magnitud m 0.2, ppodemos asegurar con un 95% de confiaanza que el cooeficiente de autocorrelació a ón no es cero..
4 Véase M. S. Bartlett, "On the Theoretical Speccification of Samppling Properties off Autocorrelated Tiime Series", Journnal of the Royal Staatistical Society, ser. s B8, vol. 27, 19946.
522
PA ARTE CUATRO: Modelos M de series de tiempo
Para probaar la hipótesiss conjunta de que q todos los coeficientes de d autocorrela-cción son cero usamos u la estaadística Q introducida por B Box y Pierce. Este E método loo a analizaremos con detalle een el capítulo o 18 en el conntexto de reaalizar verifica-c ciones diagnóósticas en moodelos estimaddos de series de tiempo, y por eso aquíí s la mencio sólo onaremos brevvemente. Boxx y Pierce dem muestran que la l estadística (16.255) está e distribuidda (aproximaddamente) com mo ji cuadradaa con K gradoos de libertadd. Así, A si el valo or calculado de d Q es mayo or que, digam mos, el nivel crítico del 5%, podemos p aseggurar con un 995% de confiaanza que los coeficientes c d autocorrela-de ción c verdaderros ρ1, ..., ρk noo todos son cerro. En la prácctica, las perssonas tienden a usar el niveel crítico del 10% como unn c corte para estta prueba. Porr ejemplo, si Q resultara seer 18.5 para unn total de K = 15 rezagos, observaríamos o s que esto estáá por debajo ddel nivel crítiico de 22.31 y a aceptaríamos (es decir, no rechazaríamoos) la hipótesiis de que la seerie de tiempoo f generada por un proceeso de ruido blanco. fue b Ahora esttudiemos el eejemplo de un na función dee autocorrelacción estimadaa p una seriee de tiempo eeconómica esttacionaria. Se ha calculado para o ρˆk para datos t trimestrales reeales de inverrsiones en inv ventarios no aagrícolas (med didos en miles d millones de de d dólares de 11987). La seriie de tiempo een sí (que abaarca el periodoo d 1960 a 19 de 995) se muesttra en la figurra 16.3, y la función de auutocorrelaciónn m muestral se presenta p en laa figura 16.4. Note que la ffunción de auutocorrelaciónn c aceleradaamente conforrme se increm cae menta el rezaggo k. Esto es común c en unaa s serie de tiemppo estacionariia, como una inversión en inventario. De D hecho,
Figura 16.3 3 Inversión en n inventarios no agrícolass (en dólares constantes de 1987).
CAPÍT TULO 16: Propieda ades de las series de tiempo estocásticas
523
Figura 16.4
Inversión en inventarios no agrícolas: función de autocorrelación n muestral.
com mo veremos, la función dee autocorrelacción puede usarse para probar si una serrie es estacionaaria. Si ρˆk no ccae con rapideez conforme k se incrementaa, esto es un inddicio de no estacionarieda e ad. Comentarremos pruebaas más form males de no estacionariedad (pruebas de "raíces unitarrias") en la seección 16.3. Si una serie de tiempo es estacionaria, hay ciertas coondiciones annalíticas que pon nen límites a los valores quue pueden serr tomados porr los puntos inndividuales de la función dee autocorrelacción. Sin embargo, la derivvación de estaas condicioness es un poco complicada c y no se presenntará en este ppunto. Además, las condicciones en sí soon muy difícilees de manejarr y de utilidad limitada en aplicaciones a de modelado dee series de tiempo. t Por consiguiente, c , se han aparrtado en el apééndice 16.1. Por P el momennto observarem mos las propieedades de aquuellas series de tiempo que no n son estaciionarias pero que pueden transformarsse en series estaacionarias. 16.2 2.1
Proc cesos homo ogéneos no estacionariios
Es probable que muy pocas dee las series de tiempo que enncontramos enn la práctica seaan estacionariias. Sin embaargo, por suerrte muchas dee las series dee tiempo no esttacionarias quue se encuentrran (y esto in ncluye la mayyor parte de aquellas que surrgen en la eco onomía y los nnegocios) tien nen la propieddad deseable de d que si son dife ferenciadas unaa o más vecess, la serie ressultante será eestacionaria. Una U serie no
estacionaria así se s denomina hhomogénea. El E número de veces que debbe diferen-
524
PARTE CUATRO: Modelos de serie es de tiempo
ciarse una serie s original antes de quee resulte unaa serie estacio onaria se llam ma orden de hom mogeneidad. A Así, si yt es no estacionaria homogénea h de primer orden, la serie w t = y t – y t - 1 = ∆y t
(16.2 26)
es estacionaaria. Si yt resu ultara ser hom mogénea de seegundo orden n, la serie w t = ∆ 2 y t = ∆y t - ∆y t - 1
(16.2 27)
sería estacio onaria. Como un u ejemplo dee un proceso homogéneo h n no estacionario de primer oro den, considéérese el proceeso de caminatta aleatoria simple que presentamos antees:
yt = yt- 1 + εt
(16.2 28)
Examinemo os la varianza de este proceeso:
(16.2 29)
o
(16.3 30)
Obsérvese a partir de estaa relación reccurrente que laa varianza es infinita y por lo tanto indefin nida. Lo mism mo sucede con n las covarian nzas, dado quee, por ejemplo o, (16.3 31) Ahora veamos v la seriie que resulta de la diferencciación del pro oceso de caminata aleatorria; es decir, lla serie w t = ∆y t = y t - y t - 1 = ε t
(16.3 32)
Debido a qu ue se establecce que ε t es independiente i e a lo largo deel tiempo, wt es claramente un proceso eestacionario. De D este modo, vemos quee el proceso de caminata alleatoria es ho omogéneo dee primer ordeen. De hecho, wt es sólo un u proceso de ruido r blanco, y tiene la fun nción de autoccorrelación ρ0 = 1, con ρk = 0 para k > 0.
16.2.2
Estacionariedad y la función de autocorrela ación
Tanto el PIB B como una sserie de cifrass de ventas dee una empresaa puede ser que q sean no estaacionarias. Caada una ha esstado creciend do (en promeedio) a lo larg go
CAP PÍTULO 16: Propie edades de las serie es de tiempo estoc cásticas
525
Figura 16.5 Serie estacion naria.
deel tiempo, asíí que la media de cada serrie es dependiiente del tiem mpo. Sin embaargo, es probaable que si el PIB o las ciffras de ventas de la compañ ñía son difereenciadas prim mero una o máás veces, la seerie resultantee será estacionnaria. Así, si deeseamos construir un modeelo de serie déé tiempo paraa pronosticar el e PIB, podem diferenciaar la serie unaa o dos vecess, construir uun modelo paara esta serie mos nuueva, hacer nuuestros pronóósticos y luego o integrar (ess decir, invertiimos la difereenciación) el modelo m y suss pronósticos para llegar dee nuevo al PIB. ¿Cómo poddemos decidirr si una serie es estacionariia o determinar el número dee veces aproppiado que unaa serie no esttacionaria hom mogénea debería diferenciiarse para lleggar a una serrie estacionarria? Podemos comenzar obbservando la grráfica de una función de aautocorrelación (llamada coorrelograma).. Las figuras 166.5 y 16.6 muuestran funcioones de autocoorrelación paraa series estaciionarias y no esstacionarias. La L función de autocorrelaación para una serie estaciionaria caerá co onforme k, el número de reezagos, se haace grande, peero esto por lo general no seerá el caso parra una serie noo estacionariaa. Si estamos ddiferenciando o una serie no esstacionaria, poodemos probaar cada diferenncia sucesiva observando la l función de au utocorrelaciónn. Por ejempllo, si la segunnda vuelta dee diferenciaciión da como reesultado una serie cuya fuunción de au utocorrelaciónn disminuye con rapidez, poodemos determ minar que la sserie original es homogéneaa de segundo orden. Si la
Figura 16.6 Serie no estaccionaria.
526
PA ARTE CUATRO: Modelos M de series s de tiempo
serie resultannte todavía es no estacionarria, la funciónn de autocorreelación permaanecerá grande aun para rezagos largos.
EJEMPLO 16.1
Tasa de interés s
En el trabajoo aplicado conn frecuencia no n está claro cuántas vecess debería difeerenciarse unaa serie no esttacionaria parra producir unna estacionarria, y debemoos hacer un juiccio con base en la experieencia y la inttuición. Com mo un ejemploo, examinaremoos la tasa de innterés en bono os de tesoreríaa del gobiernoo a un plazo de d tres meses. Esta serie, conssistente en dattos mensualess desde el com mienzo de 19660 hasta marzo de 1996, coomo se ilustrra en la figuura 16.7, y su s función de d autocorrelació ón que se muuestra en la figgura 16.8. Laa función de autocorrelació a ón declina confo orme el númerro de rezagos se hace grandde, pero sólo muy despacioo. Además, la serie exhibe unna tendencia ascendente (dde modo que la media no es e constante a lo l largo del ttiempo). Por consiguientee, sospecharíaamos que estta serie ha sido generada por un proceso no n estacionarioo homogéneo.. Para comproobarlo, diferenciamos la sserie y recalcculamos la función f de au utocorrelación muestral. La serie diferenciada d sse muestra en la figura 16.99. Nótese que la media de la l serie ahora caasi es constannte, aunque la varianza se vuuelve inusitaddamente alta, a principios de la década de 1980 (un periiodo en que laa Reserva Fedeeral tuvo com mo objetivo el suuministro de ddinero, permittiendo que fluuctuaran las tasas de interés)). La función de d autocorrelaación muestrall para la seriee diferenciadaa se muestra en e la figura 16.1 10. Ésta declinna con rapideez, de acuerdoo con una seriie estacionariaa. También se inntenta diferennciar por seguunda vez la serrie. La serie diiferenciada doos veces, ∆2Rt = ∆Rt − ∆R Rt-1 se muestrra en la figuura 16.11 y su s función de d autocorrelaciión muestral se muestra en la figura 16.12. Los resultados nno parecen cualitativamente diferentes del d caso antterior. Nuestrra conclusiónn, entonces, es que diferenciar una sola veez debería serr suficiente paara asegurar la l estacionarieddad.
Figura 16.7 Tasa de bo onos de tesorería a tres t meses.
CAPITU ULO 16: Propiedad des de las series de tiempo estocástticas
Figura 16.8 Tasa de bonos de d tesorería a tres meses: m función de autoccorrelación muestral.
Figura 16.9 Tasa de bonos de d tesorería a tres meses: m primeras diferenc cias.
Figura 16.10 Tasa de interés; primeras diferenccias: función de autocorrelación muestral.
527
528
PARTE CUATRO: Modelos de se eries de tiempo
Figura 16.11 Tasa de bonos de tesorería a a tres meses: segunda as diferencias.
Figura 16.12 1 Tasa de interés; segunda as diferencias: función de autocorrrelación muestrall.
EJEMPLO 16.2
Precios diarrios de cerdos
5
Como un segundo s ejem mplo, examinaaremos una serie de tiemp po para el preecio diario de mercado m de ccerdos. Si puddiera elaboraarse un modello de pronósttico para esta serie, s es concebible que unno podría haccer dinero esp peculando en los mercados futuros f de cerrdos y usandoo el modelo ppara superar al a mercado. La seriie consiste en 250 datos inddividuales diaarios que cubrren todos los ddías comercialees en 1965. Laa variable de precio p es el prrecio promedio en dólares por p 5 Este ejjemplo es de unn artículo de R. Leuthold, A. M acCormick, A. Schmitz S y D. Watts, W "Forecasting Daily D Hog Prices and a Quantities: A Study of Alternaative Forecasting Techniques", Jouurnal of the America an Statistical Assoociation, marzo dee 1970, Applicatioons Section, pp. 900-107.
CAPIT TULO 16: Propieda ades de las series de tiempo estocássticas
529
Figura 16.13 Funciones de Autocorrelación muestral de dato os de precios diario os de cerdos.
quinntal de todos los cerdos venndidos en los ocho mercadoos regionales en Estados Uniidos en un díaa particular. Las L funcioness de autocorreelación muesttral para la seriie del precio original o y paraa la primera diferencia d de la serie se mueestran en la figu ura 16.13. Obsérvese qu ue la serie oriiginal clarameente es no estaacionaria. La función de autoocorrelación apenas declinna, aún despuués de un rezzago de 16 peeriodos. La seriie, sin embarg go, es homogéénea de primeer orden, ya quue su primeraa diferencia clarramente es estacionaria. De hecho, no sólo es estaacionaria la primera p serie diferenciada, al parecer sem meja ruido blaanco, debido a que la funnción de autoocorrelación muestral m ρˆk estáá cerca de ceroo para todas laas k > 0. Paraa determinar sii la serie diferrenciada en efeccto es ruido blanco, calcculamos la estadística e Q para los prrimeros 15 rezaagos. El valorr de esta estaddística es 14.6 62, el cual, coon 15 grados de d libertad, es insignificante en el nivel deel 10%. Por consiguiente, ppodemos conccluir que la seriie diferenciadda es ruido bllanco y que la serie de preecios originall puede ser moddelada mejor como c una cam minata aleatorria: Pt = Pt - 1 + εt
(16.33)
Como sucedde con la mayyor parte de los precios del d mercado de d valores, nueestro mejor pronóstico de Pi es su valor más reciente, y (desafortunnadamente) no hay h ningún modelo m que puueda ayudarn nos a superar el mercado.
16..2.3
Esta acionalidad d y la funció ón de autoc correlación
Acaabamos de veer que la funcción de autoco orrelación puede revelar in nformación acerca de la estaccionariedad dde una serie dee tiempo. En llos últimos caapítulos de
530
PARTE CUATRO: Modelos de series de tiempo
este libro veremos que podemos obtener otra información sobre una serie de tiempo a partir de su función de autocorrelación. Sin embargo, continuaremos examinando la relación entre la función de autocorrelación y la estacionalidad de una serie de tiempo. Como explicamos en el capítulo 15, la estacionalidad tan sólo es un comportamiento cíclico que se apoya en un calendario común. Un ejemplo de una serie de tiempo muy estacional sería la venta de juguetes, la cual exhibe un punto máximo cada Navidad. Las ventas de helados y mezclas para té helado muestran cimas estacionales cada verano en respuesta a un incremento de la demanda producido por un clima más caluroso; la producción de anchoas peruanas muestra mínimos estacionales una vez cada siete años en respuesta a una disminución del suministro producido por cambios cíclicos en las corrientes oceánicas. A menudo, los máximos y mínimos estacionales son fáciles de detectar por observación directa de la serie de tiempo, pero en el caso en que la serie de tiempo fluctúa en forma considerable, éstos pueden no ser distinguibles de las otras fluctuaciones. La identificación de la estacionalidad es importante, debido a que proporciona información acerca de la "regularidad" en la serie que puede ayudarnos a hacer un pronóstico. Por suerte, este reconocimiento puede hacerse con mucha mayor facilidad empleando la función de autocorrelación. Si una serie de tiempo mensual yt exhibe estacionalidad anual, los datos individuales en la serie mostrarán algún grado de correlación con los datos individuales correspondientes que se adelantan o se rezagan por 12 meses. En otras palabras, se espera ver algún grado de correlación entre yt y yt -12. Dado que yt y yt - 12 estarán correlacionadas, al igual que yt -12 y yt - 24, también deberíamos ver correlación entre yt y yt – 24. Del mismo modo, habrá correlación entre yt y yt – 36 , yt y yt – 48, etc. Estas correlaciones deberán manifestarse por sí mismas en la función de autocorrelación muestral ρˆ k, la cual exhibirá máximos en k = 12, 24, 36, 48, etc. Por tanto, se identifica la estacionalidad observando máximos regulares en la función de autocorrelación, aun si los máximos estacionales no pueden discernirse en la misma serie de tiempo. EJEMPLO 16.3
Producción porcina
Como un ejemplo, obsérvese la serie de tiempo para la producción porcina mensual en Estados Unidos que se muestra en la figura 16.14. Se necesitaría más experiencia para discernir con facilidad la estacionalidad en esa serie. Sin embargo, la estacionalidad de la serie se hace evidente en su función de autocorrelación muestral, la cual se muestra en la figura 16.15. Nótense los máximos que ocurren en k = 12, 24 y 36, lo que indica ciclos anuales en la serie. Un método crudo para eliminar los ciclos anuales ("desestacionalizando" los datos) sería tomar una diferencia de 12 meses, obteniendo una nueva serie z1 = yt – yt − 12 . Como se aprecia en la figura 16.16, la función de autocorrelación muestral para esta serie diferenciada de 12 meses no exhibe una estacionalidad fuerte. En capítulos posteriores, observaremos que zt representa un modelo de series de tiempo muy simple para la producción porcina, dado que explica sólo el ciclo anual. Podemos completar este ejemplo observando que la función de
CAPITULO 16: Propied dades de las serie es de tiempo estoccásticas
Figura 16.14 Producción po orcina (en miles de cerdos c por mes). Límites de tiempo: enero o de 1962 a diciembre de 1971.
Figura 16.15 Función de autocorrelació ón muestral para a la serie de producción n porcina.
Figura 16.16 Producción po orcina: función de autocorrelació ón muestral de yt – yt − 12
531
532
PARTE CUATRO O: Modelos de series de tiempo
autocorrelacción de la figuura 16.16 decclina pero muuy despacio, de d modo que se duda respeccto a si zt es uuna serie estaacionaria. Por consiguientee, diferenciam mos primero estaa serie para obttener wt = ∆zt = ∆(yt – yt -12). L La función de autocorrelación muestral de esta serie, la cual se muesstra en la figurra 16.17, decllina con rapiddez y permanecee pequeña, asíí que podemoos confiar en que q wt es una serie de tiemppo estacionariaa no estacionaal.
16.3
PRUEB BAS PARA CAMINATAS S ALEATOR RIAS ¿Las variablles económicaas como el PIB B, el empleo y las tasas de interés i tiendenn a revertirse a una u tendenciaa a largo plazoo después de uun shock, o siiguen caminattas aleatorias? Esta preguntta es importaante por doss razones. Prrimera, si esttas variables sig guen caminattas aleatorias, una regresióón de una coontra otra pueede conducir a resultados r fallsos. [Por ejem mplo, el teoreema de Gausss-Markov no se cumpliría deebido a que uuna caminata aleatoria no ttiene una variianza finita. P Por tanto, los mínimos m cuadrrados ordinariios (OLS, Orddinary least squares) s no prroducirían un estimador deel parámetro consistente.] c Eliminar la tendencia de las l variables anntes de ejecutaar la regresiónn no ayudará; la serie sin teendencia aún no será estacionnaria. Sólo laa primera difeerenciación prroducirá seriees estacionariaas. Segunda, laa respuesta tieene implicacioones para nueestra comprennsión de la ecconomía y parra el pronóstico. Si una variable v comoo el PIB siguue una caminaata aleatoria, los efectos de uun shock temp poral (como uun incrementoo en los preciios del petróleo o o una caída een el gasto guubernamental)) no se disiparrán aun despuués de varios añ ños sino que sserá permaneente. En un estudio desaffiante, Charlees Nelson y Charles C Plossser encontraroon evidencia de d que el PIB y otras series de tiempo maacroeconómicaas se comporttan
CAPÍTULO 16: Propiedades de las series de tiempo estocásticas
533
como caminatas aleatorias.6 El trabajo generó una serie de estudios que investigaron si las variables económicas y financieras son caminatas aleatorias o revierten sus tendencias. Varios de estos estudios muestran que muchas series de tiempo económicas parecen ser caminatas aleatorias o al menos tienen componentes de caminata aleatoria.7 La mayor parte de estos estudios usan pruebas de raíces unitarias introducidas por David Dickey y Wayne Fuller.8 Supóngase que creemos que una variable Yt , la cual ha estado creciendo con el tiempo, puede describirse por laf siguiente ecuación: Y t = α + βt + βY t – 1 + ε t
(16.34)
Una posibilidad es que Yt ha estado creciendo debido a que tiene una tendencia positiva (β > 0) pero sería estacionaria después de eliminar la tendencia (es decir, ρ < 1). En este caso Yt podría usarse en una regresión y se aplicarían todos los resultados y pruebas expuestas en la parte uno de este libro. Otra posibilidad es que Yt ha estado creciendo debido a que sigue una caminata aleatoria con un rumbo positivo (es decir, α > 0, β = 0 y ρ = 1). En este caso trabajaríamos con ∆Yt . La eliminación de la tendencia no haría estacionaria la serie, y la inclusión de Yt en una regresión (aun si se elimina la tendencia) podría conducir a resultados falsos. Podríamos pensar que la ecuación (16.34) pudiera ser estimada con OLS y que la estadística t en ρˆ se puede usar para probar si ρˆ es significativamente diferente de 1. Sin embargo, si el valor verdadero de p en efecto es 1, el estimador OLS está sesgado hacia cero. Por tanto, al usar OLS de esta manera puede conducirnos a rechazar incorrectamente la hipótesis de la caminata aleatoria. Dickey y Fuller derivaron la distribución para el estimador ρˆ que se cumple cuando ρ = 1 y generaron estadísticas para una prueba F simple de la hipótesis de la Caminata aleatoria; es decir, la hipótesis de que β = 0 y ρ = l. La prueba de Dickey-Fuller es fácil de realizar y puede aplicarse a una versión más general de la ecuación (16.34). Funciona de la siguiente forma: Supóngase que Yt puede describirse con la siguiente ecuación: Y t = α + βt + ρY t – 1 + εt
(16.35)
6 C. R. Nelson y C. I. Plosser, "Trends and Random Walks in Macroeconomic Time Series: Some Evidence and Implications", Journal of Monetary Economics, vol. 10, pp. 139-162, 1982. 7 Ejemplos de estos estudios incluyen los de J. Y. Campbell y N. G. Mankiw, "Are Output Fluctuations Transitory?", Quarterly Journal of Economics, vol. 102, pp. 857-880, 1987; J. Y. Campbell y N. G. Mankiw, "Permanent and Transitory Components in Macroeconomics Fluctuations", American Economic Review Papers and Proceedings, vol. 77, pp. 111-117, 1987; y G. W. Gardner y K.P. Kimbrough, ''The Behavior of U.S. Tariff Rates", American Economic Review, vol. 79, pp. 211-218, 1989. 8 D. A. Dickey y W A. Fuller, "Distribution of íhe Estimators for Autoregressive Time-Series with a Unit Root", Journal of the American Statislical Association, vol. 74, pp. 427-431, 1979; D. A. Dickey y W. A. Fuller, "Likelihood Ratio Statistics for Autoregressive Time Series with a Unit Root", Econometrica, vol. 49, pp. 1057-1072, 1981; y W. A. Fuller, Introduction to Statistical Time Series (Nueva York: Wiley, 1976).
534
PARTE CUATRO O: Modelos de series de tiempo
Usando OL LS, ejecutamoos primero la regresión sin restricción (16.36) y luego la regresión r resttringida (16.337) Luego calcu ulamos la razzón F estándarr para probar si las restricciones (β = 0, ρ = 1) se cumplen.9 Esta razzón, sin embarrgo, no está distribuida d com mo una distribbución F estáándar bajo la hhipótesis nulaa. En lugar dee ello, debem mos usar la disstribución tabuulada por Dickkey y Fuller. Los valores críticos c para esta estadísticaa se muestran en el cuadro 16.1. Nótese que estos vaalores críticos son mucho mayores m que los l de la tablaa F estándar. Po or ejemplo, sii la razón F calculada resullta ser 5.2 y hay h 100 obserrvaciones, se podría p rechazaar con facilidaad la hipótesiss nula de una raíz r unitaria enn el nivel del 5% %, con el uso de una tabla F estándar (laa cual, con doss restriccioness de parámetro, muestra un vvalor crítico dee más o menoos 3.1); es deccir, la conclusión sería que no o hay caminaata aleatoria. No N obstante, este e rechazo, sería incorreccto. Nótese quee fallamos en rrechazar la hippótesis de unaa caminata aleeatoria usandoo la distribuciónn calculada poor Dickey y Fuller (el valorr crítico es 6.449).10
9
Recuéérdese que F se ccalcula de la sigu uiente forma: F= (N- k)(ESS R - ESS U R )lq(ES S U R )
donde ESSR y ESSUR son las ssumas de cuadrad dos de los residuaales en las regresio ones restringida y sin restricciones, respectivamente. N es el número de observacionees, k es el númeroo de parámetros estimados en la regresión r sin resttricción y q es el número de restrricciones de paráámetro. 10 Para una u exposición más m detallada del modelo de camiinata aleatoria y pruebas alternatiivas, véase P. Perroon, "Trends and Random R Walks in Macroeconomic Time Series: Furrther Evidence froom a New Approachh", Journal of Ecconomic Dynamiccs and Control, vol. v 12, pp. 297-3 332, 1988, y P. C. C B. Phillips, "Tim me Series Regressiion with Unit Rooots", Econometricca, vol. 55, pp. 2777-302, 1987.
CAPITULO 16: Propied dades de las seriess de tiempo estocá ásticas
535
Un problem ma con la ecuaación (16.35) es que hace lla suposición implícita de quue no hay corrrelación seriaal de ningunaa clase en el ttérmino del error e εt. Nos guustaría permitiir, con frecueencia, una corrrelación seriial en εt y toddavía probar porr una raíz unittaria. Esto pueede hacerse co on la prueba de d Dickey-Fulller aumentada. Esta pruebaa se lleva a ccabo expandieendo la ecuacción (16.35) para incluir cam mbios rezagaados en Yt en eel lado derechho de la ecuacción: (16.38) donde ∆Yt = Yt – Yt - 1. Depennde del econom metrista especcificar cuántoss rezagos (ρ) inccluir en el laddo derecho de d esta ecuación. Por lo ggeneral, esto se hace por expperimentación, y esperaríaamos que los resultados dee la prueba reesultaran ser loss mismos para cualquier núúmero razonaable de rezagos. Entonces, la l prueba de raíz unitariaa se realiza dee la misma manera m que anntes. Usando OLS, O primeroo se ejecuta laa regresión sinn restricción (16.39) y luego l la regreesión restringiida
Enntonces, se callcula una razóón F estándarr para probar si se cumplenn las restriccioones (β = 0, ρ = 1). Una vezz más, debemoos usar las disstribuciones taabuladas por Dickey y Fulleer para esta prueba, p las cu uales se muestran en el cuadro c 16.1. Au unque la prueeba de Dickeey-Puller se usa u extensivaamente, debee tenerse en cueenta que su potencia es lim mitada. Sólo nos n permite reechazar (o dejar de rechazarr) la hipótesiss de que una vvariable no ess una caminatta aleatoria. Una U falla en recchazar (en esspecial en un nivel de signnificancia altto) sólo propo orciona una evidencia débil a favor de laa hipótesis de la caminata aaleatoria.
EJEMPLO 16 6.4
¿L Los precios de las mercancías s siguen camin natas aleatorias s?
Coomo las accionnes y los bonoos, muchas mercancías m sonn comercializááis en forma acttiva en mercaados spot de alta liquidezz. Además, eel comercio es e activo en insstrumentos fin nancieros, com mo contratos futuros, que dependen dee los precios de estas mercanncías. Por coonsiguiente, podríamos p espperar que loss precies de esttas mercancíaas siguieran caminatas aleaatorias, de moodo que ningú ún inversionissta esperaría beneficiarse b siiguiendo algu una regla com mercial. (Véasee el ejemplo 16.2 sobre los precios p diarioss de los cerdo os.) En efecto, la mayor paarte de los
536
PARTE CUATRO: Modelos de seriess de tiempo
modelos finaancieros de fu futuros, opcioones y otros innstrumentos vinculados v coon una mercanccía se basan en la suposicción de que llos precios sppot siguen unna caminata aleeatoria.11 Sin embbargo, la teoríaa microeconóómica básica nnos dice que a largo plazo el precio de unna mercancía debería estar vinculado a ssu costo de prroducción maarginal. Esto significa que aunque a el preccio de una meercancía puedda estar sujetoo a fluctuaciones marcadas a corto plazoo, debería tennder a regresar a un nivvel "normal" bassado en el cossto. Por consiiguiente se esppera que el coosto de produucción marginal se eleve (ssi la mercancía es un recuurso agotable)) o caiga lenttamente (debiddo al cambio tecnológico),, pero esto siggnifica que el precio sin tenndencia deberría tender a reevertirse a un nivel normall. Entoncees está en disccusión si el prrecio de una m mercancía puuede describirse mejor como un proceso dde caminata aleatoria, a quizzá con tenden ncia: Pt = α + Pt - 1 + εt
(16.41)
donde ε t es un término de d error de ruido blanco, o en forma altterna, como un u proceso autoorregresivo de primer ordeen con tendenncia: P t = α + βt β + ρP t - 1 + ε t
(16.42)
Debido a quue es probablee que cualquiier reversión a un costo marginal m a larggo plazo sea len nta, sólo podrremos discrim minar entre esttos dos modeelos alternativos con datos qu ue abarquen unn periodo larggo (de modo quue se quiten laas fluctuacionnes a corto plazoo). Por suerte,, se dispone de d más de 1000 años de datoos de precios dde mercancías. En las figuras fi 16.18 a 16.20 se prresentan los pprecios reales (en dólares de d 1967) de pettróleo crudo, cobre c y maderra durante el periodo de 117 7 años de 18700 a 1987.12 Obséérvese que el precio del peetróleo fluctuóó alrededor de d 4 dólares por p barril de 18880 a 1970 peero se elevó en e forma abruupta en 1974 y 1980-1981 y luego cayó durante d mediaados de la déécada de 19800. Los precioss del cobre haan fluctuado enn forma considerable perro muestran una tendenciia descendennte general, mieentras que loss precios de laa madera hann tendido a incrementarse, al menos hastaa más o menoos 1950. Al ejecuutar una prueeba de raíz unnitaria de Dicckey-Fuller en n cada serie de d precios estim mando la regrresión sin resttricciones:
11 Para unn tratamiento mi nucioso de los mercados m de me rcancías e instruumentos derivaddos como los contratos futuros, véase Darrell Duffie, Fulures F Markets (E Englewood Cliffs,, N.J.: Prentice-Haall, 1989) y John Hu ull, Options, Fulurees, and Other Deriivalive Securities (E Englewood Cliffs, N.J.: Prentice-Haall, 1989). 12 Los dattos de 1870 a 19973 son de Roberrt Manthy, A Cenntury of Natural Resource Statisttics (Baltimore, MD D: Johns Hopkinss University Press, 1978). Los dattos posteriores a 1973 son de pubblicaciones de la Energy Informaation Agency y el U.S. Bureau of Mines. Todoss los precios esttán deflacionados por p el índice de precios p al mayoreeo (ahora índice de Precios al Pro oductor).
CAPÍÍTULO 16: Propied dades de las serie es de tiempo estoccásticas
537
Figura 16.18 Precio del petrróleo (en dólares con nstantes de 1967).
y la l regresión reestringida:
Probamos las l restriccionnes calculandoo una razón F y comparánd dola con los valores críticos en el cuadro 16.1. Los resuultados de la rregresión (conn los errores esttándares entre paréntesis) se muestran en el cuadro 16.2. En cada casso hay 116 obbservaciones anuales. Por lo tanto, paraa el cobre la razzón F es (112 2)(4 913.5 - 4 344.8)/(2)(4 4 344.8) = 7.33. Comparanddo esto con
Figura 16.19 Precio del cob bre (en dólares con nstantes de 1967).
538
P PARTE CUATRO: Modelos de serie es de tiempo
Figura 16 6.20 Precio de la madera (en dólaress constantes de 1967).
los valores críticos c para uun tamaño de muestra de 100 en el cuaddro 16.1, vemos que podemoos rechazar la hipótesis de una u caminata aleatoria en el e nivel del 5% %. Para la maddera la razón F es 4.64, y para el petróóleo crudo ess de 13.93. Por P consiguientee, podemos rechazar r con facilidad la hipótesis dee una caminaata aleatoria parra el petróleo crudo pero no podemos reechazar esta hipótesis h para la madera, aun n en el nivel del d 10%. ¿Los preccios de las meercancías siguuen caminatass aleatorias? Más M de un sigglo de datos inddican que los precios del coobre y el petróóleo crudo no o son caminataas
CUADRO 16.2 2 PRUEBAS DE DICKEY-FULLE ER
CAPÍTULO 16: Propiedades de las series de tiempo estocásticas
539
aleatorias, pero el precio de la madera es consistente con la hipótesis de la caminata aleatoria.13
16.4
SERIES DE TIEMPO COINTEGRADAS Ejecutar una regresión de una caminata aleatoria contra otra pueden conducir a resultados falsos en el sentido de que las pruebas de significancia convencionales tenderán a indicar una relación entre las variables cuando de hecho no existe ninguna. Ésta es una razón por la que es importante probar si son caminatas aleatorias. Si una prueba falla en rechazar la hipótesis de una caminata aleatoria, podemos diferenciar la serie en cuestión antes de usarla en una regresión. Debido a que muchas series de tiempo económicas parecen seguir caminatas aleatorias, esto sugiere que se desee, de manera típica, diferenciar una variable antes de usarla en una regresión. Aunque esto es aceptable, la diferenciación puede dar como resultado una pérdida de información acerca de la relación a largo plazo entre dos variables. ¿Existen situaciones en las que se puede ejecutar una regresión entre dos variables aun cuando ambas variables sean caminatas aleatorias? Sí las hay. En ocasiones dos variables seguirán caminatas aleatorias pero una combinación lineal de esas variables será estacionaria. Por ejemplo, puede ser que las variables xt y yt sean caminatas aleatorias pero la variable zt = xt – λyt es estacionaria. Si éste es el caso, decimos que xt y yt están cointegradas y llamamos a λ el parámetro cointegrador.14 Entonces se puede estimar λ ejecutando una regresión OLS de xt en yt. (A diferencia del caso de dos caminatas aleatorias que no están cointegradas, aquí los OLS proporcionan un estimador consistente de λ.) Además, los residuales de esta regresión pueden usarse para probar si xt y yt en efecto son cointegradas. La teoría de cointegración, la cual fue desarrollada por Engle y Granger, es importante por razones que van más allá de su uso como un diagnóstico para la
13
El hecho de que los precios del cobre y el petróleo no parecen ser caminatas aleatorias no significa que uno pueda obtener una ganancia inusualmente alta por comerciar con estas mercancías. Primero, un siglo es un largo tiempo y así, aun ignorando los costos de transacción, es probable que cualquier ganancia excesiva por el uso de una regla de comercio sea muy pequeña. Segundo, el comportamiento de reversión de la media que hemos encontrado puede deberse a cambios a lo largo del tiempo en la ganancia esperada ajustada al riesgo. 14 En algunas situaciones xt y yt serán vectores de variables y λ será un vector de parámetros; λ es llamada entonces vector de cointegración. Además, estamos asumiendo que x, y y, son no estacionarias homogéneas de primer orden (también llamadas integradas de orden uno); es decir, las series diferenciadas ∆xt y ∆yt son estacionarias. De manera más general, si xt y yt son no estacionarias homogéneas de orden d (integradas de orden d) y zt = xt – λyt es no estacionaria homogénea de orden b, con b < d, decimos que xt y yt son cointegradas de orden d, b. Limitaremos nuestra atención al caso de d = 1 y b = 0.
540
PARTE CUATRO: Modelos de series de tiempo
regresión lin neal.15 En muchos casos la teeoría económiica nos dice qu ue dos variablles deberían estaar cointegradaas, y una prueb ba de cointegrración es enton nces una prueb ba de la teoría. Por ejemplo, aunque el con nsumo agregaado y el ingresso disponible se comportan como c caminaatas aleatoriass, se esperaríaa que estas dos d variables se movieran jun ntas a largo plazo, de modo que una comb binación lineal de las dos serría estacionaria. Otro ejemplo o es el mercado o de valores; ssi los valores son s valuados de d manera racio onal, el preciio de las accio ones de una ccompañía seríía igual al vallor presente del flujo futuro esperado de dividendos. d E Esto significa que aunque los l dividendos y los precios de valores sigan s caminattas aleatorias,, las dos seriies deberían esttar cointegrad das, con el parámetro coin ntegrador igu ual a la tasa de descuento usada u por los inversionistaas para calcu ular el valor presente p de las l ganancias.16 Supongaa que con el u uso de la prueeba de Dickey y-Fuller descrrita antes, deteerminamos qu ue xt y yt son caaminatas aleaatorias pero qu ue ∆xt y ∆yt so on estacionariaas. Entonces, essto nos facilitta la prueba de d si xt y yt eestán cointegrradas. Tan só ólo ejecutamos laa regresión OL LS (llamada reegresión de coiintegración): x t = α + βy t + ε t
(16.4 43)
y luego prob bamos si los rresiduales, et, de esta regreesión son estaccionarios. (Si xt y yt no están n cointegradass, cualquier co ombinación lin neal de ellas será no estaciionaria y por lo o tanto los resiiduales et seráán no estacionaarios.) Probam mos la hipótesis, específicameente, de que et no es esstacionaria; es decir, la hipótesis h de no n cointegració ón. Una pru ueba de la hipó ótesis de que et es no estaccionaria puedee hacerse de dos d maneras. Pu uede realizarsse una pruebaa de Dickey-F Fuller en la seerie residual. O sólo puede observarse laa estadística de Durbin-W Watson de la regresión coiintegradora. Recuerde R del capítulo 6 que q la estadísttica de Durbin-Watson esstá dada por:
Si et es una caminata c aleattoria, el valor esperado de (eet - et-1) es cerro, y por lo tan nto la estadística de Durbin-W Watson deberrá estar cercaa de cero. Enttonces, tan só ólo debemos pro obar la hipóteesis de que DW W = 0. Para 1 100 observaciones, los 15 La teorría es enunciadaa en R. F. Engl e y C. W. J. Grranger, "Co-Inteegration and Errror Correction: Reppresentation, Esti mation, and Testiing", Econometriica, vol. 55, pp. 251-276, 2 1987. 16 Para pru uebas del modelo del valor presentee de los precios dee valores, véase J. Y. Campbell y R. R J. Shiller, "Cointeggration and Testss of Present Valuéé Models", Journal of Political Ecconomy, vol. 95, pp. p 1062-1088, 19887. Para otras apllicaciones, véase J. Y. Campbell, "Does Saving Anticípate A Decliniing Labor Income? An Alternative T Test of the Permaanent Income Hyppothesis", Econom metrica, vol. 55, pp. p 1249-1273, 19887, para un estuddio de la cointeg gración del consuumo y el ingreso o, y R. Méese y K. Rogoff, "Was It Real? The Exchange Ratee-Interest Differeential Relation over the Modeern Floating-Rate Period", P Journal off Finance, vol. 43, pp. 933-947, 19888, para un estudio o de la cointegraciión de las tasas de intercambio i y loss diferenciales dee interés.
CAPÍÍTULO 16: Propied dades de las seriess de tiempo estocá ásticas
541
CU UADRO 16.3 VA ALORES CRÍTICOS PARA LA PR RUEBA DE DW = 0 Nivel de sig gnificancia, %
Valor críttico de DW W
1 5 10
.511 .386 .322
valores críticos para esta prueeba se muestrran en el cuaddro 16.3.17 Porr ejemplo, si después de ejeccutar la regresión de cointtegración obteenemos un vaalor DW de 0.771, podemos rechazar la hipótesis de no o cointegracióón con un nivvel de 1%. EJEMPLO 16 6.5
La cointegración del consumo y el ingreso
Enn macroeconoomía es intereesante el hallaazgo de que muchas variaables, incluyenndo el consum mo agregado y el ingreso disponible, pparecen seguiir caminatas aleeatorias. Entree otras cosas, esto significaa que los efecttos de un shoock temporal no tenderán a disiparse d desppués de varioos años, sino que serán peermanentes. Pero aun si el co onsumo y el iingreso disponible son cam minatas aleatorias, los dos tennderían a movverse juntos. La L razón es quue durante peeriodos largos los hogares tienden a consum mir una ciertaa fracción de su s ingreso dissponible. De este e modo, a larrgo plazo, el consumo y el ingreso deb berían permannecer alineadoos; es decir, debberían estar cointegrados. c Probaremoss si el gasto en e consumo real r y el ingreeso disponiblle real están cointegrados, usando u datos trimestrales t p para el primerr trimestre dee 1960 al últim mo trimestre de d 1995. Prim mero comprobbaremos si caada variable es e una caminaata aleatoria, usando la prrueba de Dicckey-Fuller auumentada deescrita en la seccción anteriorr. La ejecucióón de esta pruueba, primero para el consuumo y luego paara el ingreso disponible, y en cada casoo incluyendo uuno, dos o cuaatro rezagos paara el cambio en la variablee, siempre pro oduce estadístticas de pruebba que fallan enn rechazar la hipótesis de la caminata aleatoria, auun en el niveel del 10%. (D Dejamos al lecttor la realizaciión de una pruueba de Dickeey-Fuller para las primeras differencias de estas e variabless y demostrar que en este caso c podemoss rechazar la hip pótesis de cam minata aleatooria.) A continuacción ejecutam mos una regreesión de cointtegración del consumo C conntra el ingreso o disponible Y YD.18 Los ressultados son los siguientes (las estadísticcas t están enttre paréntesiss): (16.44)
17 18
Tomado de Engle E y Granger, op. cit., p. 269. Para los lecttores que usen los datos de CITIBASE, las series corrrespondientes son GCQ y GYDQ.
542
PARTE CUATRO: Modelos de seriess de tiempo
Podemos usaar la estadística de Durbin n-Watson paraa probar si los residuales en e esta regresión siguen una caminata aleatoria. Comparando la DW W de 0.325 co on los valores críticos en el cuadro c 16.3, vemos v que po odemos rechazzar la hipótesis de una camin nata aleatoriaa en el nivel del d 10% pero o no en el niv vel del 5%. La L ejecución dee una prueba de Dickey-Fuller en los residuales r de esta regresió ón también con nduce a un reechazo de la hipótesis h de lla caminata aleatoria a en un u nivel del 10% % pero no en n un nivel deel 5%. Estos rresultados parrecen ser pocco concluyentess, dejando ab bierta la interrrogación de si el consum mo y el ingresso disponible en n efecto están n cointegradoss. Es intereesante compaarar este resulltado con el ejemplo que apareció en la l tercera edició ón de este libro. En esta teercera edición ejecutamos laa misma regreesión de cointtegración usan ndo datos trim mestrales paraa el tercer trim mestre de 195 50 hasta el primer trimestre dee 1988. Los reesultados de essa regresión dee cointegració ón fueron los siguientes: Ĉ t = -133. 82 + .9651Y YD, (-21.9 0)
R2 = .9 9981
(16.45 5)
(278.933)
s = 23.35
DW = .4 4936
En este caso, la DW W de 0.4936 nos n lleva a reechazar la hip pótesis de un na caminata aleaatoria en un n nivel del 5%. Por P lo tanto, en e la tercera edición e conclu uimos que "ell consumo y el ingreso diisponible en efecto están cointegrados". Ahora, adem más podemos concluir que al hacer inveestigaciones empíricas debeemos ser cuidaadosos respeccto al periodo de d muestra y rrespecto a la estabilidad e de la relación hipo otética.
APÉNDICE E 16.1 La función de e autocorrelaci ón para un pro oceso estacion nario
En este apén ndice derivareemos un conjjunto de cond diciones necessarias.para un na función de autocorrelació a ón de un procceso estacionario. Tenemo os que yt es un u proceso estaccionario y quee Lt es cualquiier función lin neal de yt y loss rezagos en yt , por ejemplo.
Ahora, dado que yt es estaacionaria, las covarianzas c d de yt son estaciionarias, y (A16.2 2)
CAPÍT TULO 16: Propieddades de las seriess de tiempo estocáásticas
543
inddependiente de d t. Entonces, al elevar al cuadrado c ambbos lados de laa ecuación (A A16.1), vemoss que la variannza de Lt está dada por: (A16.3)
Si las α no todass son 0, la variianza de Lt deb be ser mayor qque 0 y, por co onsiguiente, deb bemos tener, para todas laas i y j, (A16.4) Ah hora, para n ob bservaciones, escribimos laas covarianzass de yt como una matriz:
(A16.5)
Estta matriz debee ser positiva definida debiido a que la vvarianza de Lt siempre es maayor que cero. Nótese que
(A16.6)
donnde Pn es la matriz m de auttocorrelacionnes y ella misma es positivva definida. Assí, el determin nante de Pn y sus menores principales ddeben ser may yores que 0. Coomo un ejempplo, considereemos el caso de n = 2. L La condición en e el determinante de Pn se vuelve
lo cual implica que (A16.7)
o
Deel mismo moddo, para n = 3, es fácil ver quue deben cumpplirse las tres condiciones c sig guientes: -1
(A16.8)
544
PARTE CUATRO: Modelos de serie es de tiempo
(A16.99) (A16.100)
Tambiéén pueden derrivarse conjun ntos de condicciones para n = 4, n = 5, etcc., pero debe quedar clarro que confo orme se vueelve grande el número de d observacionnes n, el núm mero de condiiciones que se deben cumpplir también se vuelve bastante grande.. Aunque estaas condicionees pueden prooporcionar unna comprobacción analítica de la estacio onariedad de una serie dee tiempo, en el trabajo apliicado es más ccomún juzgarr la estacionarriedad a partirr de un exameen visual de laa serie en sí y de d la función de autocorrelaación muestraal. Para nuestrros propósitos será suficientte recordar quue para k >0, - 1 < ρk < 1 para p un proceso estacionariio.
CUADRO 16.4 PRECIOS DE E PETRÓLEO CRUDO, COBRE Y MADERA (en dólares constantes c de 19 967)
Obs.
Petró óleo
1870 1871 1872 1873 1874 1875 1876 1877 1878 1879 1880 1881 1882 1883 1884 1885 1886 1887 1888 1889 1890 1891 1892 1893 1894 1895 1896 1897 1898 1899 1900
8 8.64 100.16 8 8.35 4 4.24 2 2.81 3.37 3 6 6.90 6 6.95 3.74 3 2 2.84 2 2.80 2 2.74 2.26 2 3.27 3 2 2.66 2 2.95 2.42 2 2 2.44 2 2.97 3.18 3 3.00 3 2 2.33 2 2.08 2 2.44 3.24 3 4 4.90 4 4.58 3.17 3 3.64 3 4 4.80 4 4.72
Cobre 41.61 47.54 70.64 61.57 54.68 53.37 49.60 51.15 47.17 49.50 52.68 46.39 49.85 42.64 41.67 35.62 32.53 31.96 52.03 45.61 52.41 43.75 41.26 38.18 36.84 41.43 44.17 45.42 46.00 63.20 55.17
Madera
Obs. O
Petrólleo
9.13 9.70 9.75 9.98 9.93 9.45 9.60 9.74 9.75 10.43 10.09 10.90 11.11 11.05 11.79 12.02 12.32 12.44 12.03 12.03 12.28 12.19 12.60 12.55 13.72 13.07 13.67 13.17 13.32 13.68 12.59
1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959
3.633 3.644 2.477 3.500 2.711 3.522 3.177 3.488 3.555 3.655 3.322 3.266 3.288 3.011 2.899 2.911 2.899 2.922 3.277 4.099 4.199 4.055 3.677 3.777 4.077 4.211 4.188 4.099 4.388 4.233 4.111
Cobre 36.86 29.21 21.54 16.77 20.59 21.76 20.82 22.78 29.66 24.69 27.71 27.90 26.16 23.18 22.18 22.01 21.61 22.12 27.45 26.57 24.40 25.92 26.56 27.34 32.99 33.94 42.71 46.09 31.73 27.27 32.95
Madera 32.65 29.84 29.39 25.42 24.97 24.97 23.51 24.34 25.12 24.59 26.55 25.38 27.47 29.98 39.74 38.76 37.78 45.31 52.84 48.76 53.94 52.30 46.18 51.13 52.86 54.91 55.48 54.20 50.88 48.78 51.24
CAPÍTULO 16: Propiedades de las series de tiempo estocásticas
545
CUADRO 16.4 PRECIOS DE PETRÓLEO CRUDO, COBRE Y MADERA (en dólares constantes de 1967) (Continuación)
Obs.
Petróleo
1901
4.00
1902 1903 1904 1905 1906 1907 1908 1909 1910 1911 1912 1913 1914 1915 1916 1917 1918 1919 1920 1921 1922 1923 1924 1925 1926 1927 1928
3.59 4.04 3.83 2.90 2.66 2.50 2.50 2.18 1.85 2.03 2.39 3.19 2.79 2.20 3.22 3.42 3.90 3.90 5.40 4.39 4.21 3.24 3.58 4.10 4.67 3.50 3.37
Cobre
Cobre
Madera
Obs.
Petróleo
Madera
57.19
12.53
1960
4.07
33.83
52.57
38.16 43.00 40.91 49.03 60.50 59.52 40.74 37.36 34.99 37.01 45.79 42.50 38.75 48.19 61.68 44.88 36.34 26.15 21.96 24.85 26.85 27.75 25.69 26.22 26.74 26.22 29.26
13.95 13.42 11.95 13.77 15.80 16.01 20.49 20.17 18.29 22.12 20.98 23.25 22.56 22.95 18.98 16.34 16.51 17.86 19.15 22.84 22.53 21.91 26.13 31.33 29.94 30.12 26.75
1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
4.10 4.10 4.11 4.09 3.99 3.89 3.90 3.83 3.90 3.89 4.00 3.84 3.99 5.56 5.64 5.82 5.71 5.61 6.98 10.34 13.94 12.34 11.26 10.86 10.15 5.46 6.57
31.64 32.28 32.38 33.79 36.23 36.27 38.20 40.78 44.60 52.26 45.13 42.49 43.73 46.81 35.11 36.22 32.48 30.23 37.77 35.99 27.22 23.37 24.80 20.76 20.47 20.91 25.61
50.89 49.43 50.03 51.58 52.09 50.46 51.17 53.99 57.65 49.09 57.88 65.20 74.21 50.57 45.27 52.35 57.54 64.23 62.77 41.17 32.09 27.71 37.21 28.27 27.58 35.70 39.91
EJERCICIOS 16.1 Demuestre que el proceso de caminata aleatoria con rumbo lineal es no estaciona rio homogéneo de primer orden. 16.2 Considere la serie de tiempo 1, 2, 3, 4, 5, 6,. . ., 20. ¿Esta serie es estacionaria? Calcule la función de autocorrelación muestral ρˆk para k = 1, 2,. . ., 5. ¿Puede explicar la forma de esta función? 16.3 La serie de datos para los precios de petróleo crudo, cobre y madera está impresa en el cuadro 16.4. a) Calcule la función de autocorrelación muestral para cada serie y determine si esas funciones son consistentes con los resultados de la prueba de Dickey-Fuller en el ejemplo 16.4. De manera específica, ¿las funciones de autocorrelación muestral para los precios del petróleo crudo y el cobre exhiben estacionariedad? ¿La función de autocorrelación muestral para el precio de la madera indica que la serie es no estacionaria?
546
PARTE CUATRO: Modelos de series de tiempo
b) ¿Qué tan robustos son los resultados de la prueba de Dickey-Fuller para el tamaño de la muestra? Divida la muestra a la mitad y para cada serie de precios repita las pruebas de Dickey-Fuller para cada mitad de la muestra. 16.4 Regrese a los datos para el índice de Precios de Acciones Comunes S&P al final del capítulo 15. ¿Usted esperaría que este índice siguiera una caminata aleatoria? Realice una prueba de Dickey-Fuller para ver si en efecto lo hace. 16.5 Calcule la función de autocorrelación muestral para las ventas de automóviles al menudeo. (Use los datos del cuadro 15.2 al final del capítulo 15.) ¿La función de autocorrelación muestral indica estacionalidad?
CAPÍTULO
17
MODELOS LINEALES DE SERIES DE TIEMPO
Ahora estudiaremos la construcción de modelos de series de tiempo. El objetivo es elaborar modelos que "expliquen" el movimiento de una serie de tiempo relacionándola con sus propios valores pasados y con una suma ponderada de perturbaciones aleatorias actuales y rezagadas. Aunque pueden usarse muchas formas funcionales, nos enfocaremos en los modelos lineales. Estos nos permitirán hacer afirmaciones cuantitativas acerca de las propiedades estocásticas de los modelos y los pronósticos generados por ellos (por ejemplo, para calcular intervalos de confianza). Además, nuestros modelos se aplican tanto a procesos estacionarios como a los procesos no estacionarios homogéneos (los cuales pueden diferenciarse una o más veces para producir procesos estacionarios). Por último, los modelos están descritos como ecuaciones con coeficientes estimados fijos, que representan una estructura estocástica que no cambia con el tiempo. (Aunque se han elaborado modelos con coeficientes que varían con el tiempo de procesos no estacionarios, no se verán en este libro.) En las primeras dos secciones del capítulo se examinan modelos de promedio móvil simple y autorregresivos para procesos estacionarios. En un modelo de promedio móvil, el proceso se representa por completo con una suma ponderada de perturbaciones aleatorias actuales y rezagadas. En el modelo autorregresivo, el proceso depende de una suma ponderada de sus valores pasados y un término de perturbación aleatoria. En la tercera sección introducimos modelos mixtos de promedios móviles y autorregresivos. En estos modelos el proceso es una función tanto de sus valores pasados como de las perturbaciones aleatorias rezagadas, así como de un término de perturbación actual. Aun si el proceso original es no estacionario, con frecuencia puede diferenciarse una o más veces para producir una serie nueva que es estacionaria y para la cual puede construirse un 547
548
PA ARTE CUATRO: Modelos M de seriess de tiempo
modelo mixtoo de promedioos móviles y autorregresivo a os. Este modello puede usarsse para producir un pronóstiico de uno o más m periodos en el futuro,, después de lo l cual la serie estacionaria pronosticada puede integrrarse una o más m veces parra producir un pronóstico p paara la serie de tiempo originnal. El modello autorregressivo y de prom medio móvil integrado prooporciona unaa estructura general g para el e modelado dee series de tiem mpo no estaccionarias hom mogéneas. Al constrruir un modello autorregressivo y de prom medio móvil integrado parra una serie de tiempo no esstacionaria, deebemos especcificar cuántass veces se va a diferenciar laa serie antes de que resultte una serie estacionaria. e T También debeemos especificar el númeroo de términoss autorregresivvos y términoos de perturbaación rezagaddos que se inccluirán. En ell capítulo 16 se revisó quee la función de d autocorrelaciión puede apliicarse para deecirnos cuántaas veces debem mos diferenciaar un proceso no n estacionariio homogéneo o para produccir un proceso estacionarioo. También aquuí veremos cóómo puede usarse la funciión de autocoorrelación parra ayudar a detterminar cuánntos términoss de perturbaación rezagaddos y términoos autorregresivvos deben inccluirse en el modelo. m
17.1
MODELLOS DE PRO OMEDIO MÓ ÓVIL En el procesoo de promedio móvil de ordeen q cada obseervación yt es generada g por un u promedio po onderado de pperturbaciones aleatorias qque se remonttan q periodoos. Denotamos este e proceso ccomo MA(q) y escribimos su ecuación como: c y1= µ + ε t – θ1ε t - 1 – θ1ε t - 2 –
...
– θqε t - q
(17.11)
donde los paarámetros θ1, . . ., θq pueden ser positivoos o negativoss.1 En el mo odelo de prom medio móvil (yy también en el modelo auttorregresivo, el cual se preseentará despuéés) se suponee que las pertturbaciones aleatorias a estáán distribuidas en e forma indeependiente a lo l largo del tiiempo; es deccir, son generaadas por un prroceso de ruiddo blanco. En n particular, see asume que cada c término de d perturbaciónn εt es una vaariable aleato oria normal con c media 0, varianza σ2ε y covarianza γk = 0 para k ≠ 0.2 Puede seer que los proocesos de ruid do blanco no
1 Siguiendo o las convencionees, ponemos un signo s de menos frrente a θ1, libros de texto el e modelo MA(q q) se escribe com mo:
y1= µ + ε t + θ1ε t - 1 +
...
. . ., θq. En algunos
+ θqε t - q
Téngase en cueenta esto cuandoo se lean e interppreten resultadoss de computadorra y conforme see avance a lo larggo del resto de estte libro. 2 Como vim mos en el capítuloo 16, la función de d autocorrelaciónn para un proceso de ruido blanco es: e
CAPÍTULO 17: Modelos lin neales de senes de e tiempo
549
occurran muy a menudo pero o, como verem mos, las sumaas ponderadass de un proceeso de ruido bllanco pueden proporcionarr una buena reepresentación de procesos qu ue no son blan ncos. Observarem mos que la meedia del proceso de promed dio móvil es in ndependiente deel tiempo, dad do que E(yt) = µ. Se suponee que cada e, es generada por p el mismo proceso de ruid do blanco, de modo que E(εεt) = 0, E(εt2 ) = σ2ε y E(εt εt - k) = 0 para k ≠ 0. Por tanto, el proceso MA MA(q) es descriito por exactam mente q + 2 paarámetros, la meedia µ, la varrianza de la perturbación p σ2ε y los parám metros θ1, θ2,. . ., θq que deeterminan los pesos en el p promedio móv vil. Tenemos laa varianza, denotada por γ0, del processo de promed dio móvil de orrden q:.
(17.2) Nó ótese que los valores esperaados de los téérminos cruzad dos son todoss 0, dado que heemos asumido o que las εt so on generadas por p un processo de ruido bllanco para el cu ual γk = E(εt εt - k) = 0 para k ≠ 0. La ecuación n (17.2) impo one una restriicción en los valores que están e permitid dos para θ1,. . ., θq Tenemoss la expectativ va de que la varianza de yt sea s finita, ya qu ue de lo contrario una realización del pro oceso aleatoriio implicaría desviaciones d caada vez más grrandes de un p punto de referrencia fijo con nforme se incrrementara el tieempo. Esto a su vez violarría nuestra sup posición de eestacionariedaad, ya que la estacionariedad d requiere quee la probabilid dad de estar a aalguna distanccia arbitraria dee un punto de referencia r seaa invariable co on respecto all tiempo. Por tanto, t si yt es la realización de un proceso aleatorio estacionario, debeemos tener (17.3) En n un sentido este resultado o es trivial, debido d a que sólo tenemoss un número ' fin nito de θ 2 y por p consiguieente su suma es e finita. Sin eembargo, la su uposición de ' un n número fijo de θ i puedee considerarsee como una ap proximación a un modelo máás general. Un U modelo co ompleto de más m procesoss aleatorios reequeriría un nú úmero infinito o de términos de perturbacción rezagados (y sus pesos correspondientes). Enton nces, conform me q, el orden n del proceso o de promediio móvil, se 2 vu uelve infinitam mente grande,, debemos req querir que la suma Σi∞=Oθ i converja. c La co onvergencia, generalmente, g , ocurrirá si laas θ sé vuelv ven más pequeeñas conformee i se vuelve más grande. P Por tanto, si estamos e repreesentando un proceso, p que se cree es estaciionario, con u un modelo de promedio mó óvil de orden q, q esperamos qu ue las θi se vu uelvan más peequeñas confo orme la i se vuelve v más grrande. Analizaaremos más adelante a que esto implica que si el prroceso es estaacionario su fun unción de correelación ρk se volverá v más peequeña conforrme k se haga más gran-
550
PARTE CUATRO: Modelos de series s de tiempo
de. Esto estáá de acuerdo coon el resultadoo del capítulo 16 en el que un indicador de d estacionariedad es una fuunción de autoocorrelación que se aproxiima a cero. Ahora examinaremos e s algunos proocesos de proomedio móvill, calculando la media, variaanza, covariannzas y funciónn de autocorreelación para cada c uno. Esttas estadísticas son importanntes, primeroo porque propporcionan información quue ayuda a caraacterizar el proceso y en seegundo lugar pporque nos ayyudarán a idenntificar el prooceso cuando construyamoos modelos enn el capítulo 18. Comenzzaremos con el e proceso de promedio p móvvil más simplee, el proceso dde promedio mó óvil de orden 1. El proceso es denotado ppor MA( 1) y su s ecuación ess: yt = µ + εt – θ1εt - 1 2
(17.4 4) 2
Este procesoo tiene mediaa µ y varianzaa γ0 = θ ε (l + θ 1 ). Ahora derivaremos la covarianza para p un desplaazamiento de un rezago, γ1: (17.5)
En general podemos p deteerminar que laa covarianza para p un desplazamiento dee k rezagos es: (17.6) Por tanto, el proceso MA(( 1) tiene una covarianza dee 0 cuando el desplazamiennto es mayor quue un periodo.. Entonces, deecimos que ell proceso tien ne una memorria de un solo periodo; cualquuier valor yt esstá correlacionnado con yt - 1 y con yt +1 peero con ningún otro o valor de la serie de tieempo. En efeccto, el proceso olvida lo quue sucedió más de un periodoo hacia el pasaado. En generral, es importaante la memorria limitada de un proceso de d promedio móvil. Esto sugiere que un modelo de d promedio móvil m proporciiona informacción de pronóstico sólo para p un número limitado de periodos en el e futuro. Ahora podemos p deteerminar la funnción de autoocorrelación para p el processo
(17.77) Un ejemplo o de un processo de promediio móvil de prrimer orden puede p darse poor: y t = 2 + ε t + .8ε t - 1
(17.8)
La función de autocorreelación para yt se muestrra en la figuura 17.1, y unna realización típica t se muestra en la figuura 17.2.
CAPÍTULO 17: 1 Modelos lineale es de series de tiempo
5S1
Ahora procedderemos a exaaminar el proceso de prom medio móvil dee orden 2. El proceso p es dennotado por M MA(2) y su ecu uación es: (17.9) Estee proceso tien ne media µ, vvarianza σ2ε(1+ θ21 +θ 22 ) y covarianzas dadas por:
552
PARTE CUATRO O: Modelos de serries de tiempo
La función de autocorreelación está daada por: (17.13)
(17..14) (17.115)
y
El proceso MA(2) tienee una memoriia de exactam mente dos perriodos, de moodo que el valo or de yt es inffluido sólo poor eventos quue se presentaan en el perioodo actual, un periodo p atrás y dos period dos atrás. Un ejem mplo de un prroceso de prom medio móvil dde segundo orrden podría seer el siguiente: y t = 2 + ε t + .6ε t-1 − .3ε tt-2
(17.16)
La funciónn de autocorreelación se obbserva en la ffigura 17.3, y una realización típica se muestra m en la ffigura 17.4. Dejarem mos qué ustedd haga una prrueba de que el e proceso de promedio móóvil de orden q tiene una meemoria de exaactamente q pperiodos y quue su funciónn de autocorrelaación ρk está ddada por la sigguiente expresión (véase el ejercicio 17.33):
(17..17) Ahora podemos verr por qué la función fu de auutocorrelaciónn muestral pueede ser útil para especificar el orden de un u proceso de promedio móóvil (asumienndo
CAPÍTULO O 17: Modelos linea ales de series de tiempo
553
quue la serie dee tiempo de innterés esté geenerada por un u proceso de d promedio móóvil). La funciión de autocorrrelación ρk paara el procesoo MA(q) tiene q valores no cerro y es 0 paraa k > q. Confoorme avancem mos en estos caapítulos, inten ntaremos dar al lector una comprensión c de la forma en que puede usarse la función de au utocorrelación n muestral parra identificar el proceso estocástico quee pudo haber geenerado una serie de tiemppo particular.
17.2
MODELOS AUTORREG GRESIVOS En n el proceso au utorregresivo dde orden p la observación aactual yt es gen nerada por un pro omedio pondderado de obsservaciones pasadas p que se remontan p periodos, jun nto con una perturbación p aaleatoria en el e periodo actuual. Denotam mos este proceso como AR(p p) y escribim mos su ecuació ón de la siguieente forma: (17.18) Aq quí δ es un téérmino constaante que se reelaciona (com mo veremos) con c la media deel proceso estoocástico. 17 7.2.1
Pro opiedades de d los mode elos autorre egresivos
Si el proceso auutorregresivo es estacionarrio, entonces ssu media, la cual c denotamoos con µ, deb be ser invariabble con respeccto al tiempo;; es decir, E(yyt) = E(yt - 1) = E(yt - 2) = … = µ. Por consiguiente la media m µ está daada por:
554
PARTE CUATRO:: Modelos de serie es de tiempo
Esta fórrmula para la media del prroceso tambiéén nos proporrciona una coondición para la estacionarriedad. Si el proceso p es esstacionario, laa media µ en la ecuación (17 7.20) debe serr finita. Si éstte no fuera el caso, el proceso apartaría su rumbo cada vez más de cualquier c punnto de referenncia fijo y no podría p ser esttacionario. (C Considérese ell ejemplo de la l caminata alleatoria con rumbo r lineal; es decir, yt = yt – 1 + δ + εt . A Aquí ф1 = 1 y µ = ∞ y, si δ > 0, el proceso sigue un rumbbo ascendente en forma conntinua.) Si µ ha h de ser finitta, es necesarrio que: ф1 + ф2 + … + фP < 1
(17.221)
Esta condiciión no es sufiiciente para assegurar estaciionariedad, deebido a que hay h otras condicciones necesarrias que debeen cumplirse ssi el proceso AR(p) A ha de ser s estacionarioo. Expondrem mos estas cond diciones adicionales con más m detalle en el apéndice 17.1. Ahora examinaremos e s las propiedaades de algunnos procesos autorregresivvos simples. Nuuevamente, deeterminamos la media, las covarianzas, etc., para cada uno. Comennzaremos conn el proceso dee primer ordeen AR(1): y t = ф1 yt – 1 + δ + εt
(17.222)
Este procesoo tiene mediaa (17.23) y es estacionnario si │ф1 │< 1. Una vezz más, recuérddese que la cam minata aleatorria con rumbo lineal l es un pproceso autorrregresivo de primer p orden que no es esttacionario. Enn ese proceso ф1 = 1 y, com mo vimos en eel capítulo 16,, la varianza del d proceso se vuelve v cada vvez mayor conn el tiempo. Ahora calcularemos c γ0, la varianza de este prooceso alrededoor de su meddia. Asumiendo estacionarieddad, de modo que sepamos que la varian nza es constannte (para │ф1 │< 1), y establleciendo δ = 0 (para escalaar el proceso a uno que tennga media cero), tenemos3
3 Estableceer δ = 0 es equivaalente a medir y, enn función de desvviaciones alrededoor de su media, daado que si y, sigue la ecuación (17.222), entonces la serie s ỹt = yt - µ sigue el proceso ỹt = ф1 ỹt - 1 + εt . Esto se puede comprobar para ver que los resu ultados en la ecuuación (17-24) taambién se obtiennen (aunque con más manipulación algebraica) calcu ulando en forma directa E[(y t - µ)) 2 ].
CAPÍTU ULO 17: Modelos lin neales de series de e tiempo
555
Taambién podem mos calcular las l covarianzaas de yt alredeedor de su meedia:
D mismo mo Del odo, la covariaanza para un desplazamien nto de k rezag gos es:
Así la función de autocorreelación para AR(1) A A es partticularmente simple, com mienza en ρ0 = 1 y luego deeclina en form ma geométricaa:
Nótese que estee proceso tien N ne una memorria infinita. El E valor actuall del proceso deepende de tod dos los valorees pasados, au unque la magn nitud de esta dependencia 4 deeclina con el tiempo. t Un ejemplo de un proceeso autorregreesivo de prim mer orden seríaa el proceso deefinido por: (17.29) Laa función de autocorrelació a ón para este proceso p se preesenta en la figura fi 17.5, y un na realización n típica se mueestra en la figu ura 17.6. La realización r diffiere de la de un n proceso de promedio mó óvil de primeer orden en q que cada obseervación está altamente correelacionada co on aquellas qu ue la rodean, lo que da com mo resultado paatrones generales de ascen nso y descenso o discernibless. Veamos ah hora el processo autorregressivo de segund do orden AR((2): (17.30)
4 Puede mostrrarse que si el prroceso AR(1) es estacionario, e es eequivalente a un proceso de promeedio móvil de orrden infinito (y por tanto con mem moria infinita). D De hecho, para cu ualquier proceso au utorregresivo estaacionario de cualquier orden existte un proceso de promedio móvill equivalente de ord den infinito (de modo m que el proceeso autorregresivo o es invertible enn un proceso de prromedio móvil). Deel mismo modo, si s se cumplen cierttas condiciones dee invertibilidad (y éstas se expondráán en el apéndice 177.1), cualquier prooceso de promeddio móvil de ordeen finito tiene un proceso autorreggresivo de orden inffinito equivalentte. Para una expoosición más detallada de la inverttibilidad, se remiite al lector a G. E. P. Box y G. M. Jenkins, Time Serries Analysis (Sann Francisco: Holdeen-Day, 1970); C. Nelson, Applied Tim me Series Analysiis (San Francisco: Holden-Day, 19 973), capítulo 3; y C. W. J. Grangeer y P. Newbold,
Fo orecasting Econom mic Time Series (N Nueva York: Acadeemic, 1986).
556
PA ARTE CUATRO: Modelos de series s de tiempo
El proceso tiene media (17.31 1) y una condicción necesariaa para la estaccionariedad ess que ф1 + ф2 < 1 . Ahora caalculemos lass varianzas y covarianzas de d yt (cuando yt se mide en n forma de dessviación):
CAPÍTULO 17: Modelos lineales de series de tiempo
557
y enn general, parra k ≥ 2, (17.35) Poddemos resolveer las ecuacioones (17.32), (17.33) y (177.34) de maneera simultáneaa para obteneer γ0 en función de ф1, ф2 y σε2 - La ecuación (177.33) puede reescribirse com mo: (17.36) La sustitución de d la ecuaciónn (17.34) denttro de la ecuaación (17.32) produce: (17.37) Ah hora el uso de la ecuación ((17.36) para eliminar e y, no os da:
la cual, c después de reordenarrla, produce:
Estas ecuacciones tambiéén pueden applicarse paraa derivar la función f de autto-correlaciónn ρk . A partir dde las ecuacioones (17.34) y (17.36), (17.39)
(17.40)
A partir p de la eccuación (17.35) uno puedee ver que paraa k ≥ 2, (17.41) y esto se puede usar para calccular la funciión de autocorrelación paraa k > 2. Es necesario o un comentarrio respecto a las ecuacionnes (17.39) y (17.40), las cuaales son llamaddas ecuaciones es de Yule-Wallker. Supóngasse que tenemoos la función de autocorrelació ón muestral ppara una seriee de tiempo quue creemos fuue generada porr un proceso autorregresivo a o de segundoo orden. Entonnces podríamo os medir ρ1 y ρ2 Y sustituir esos números en las ecuaaciones (17.39) y (17.40). Por tanto
558
PARTE CUATRO O: Modelos de serries de tiempo
tendríamos dos d ecuacionees algebraicas que podrían rresolverse en forma f simultánnea para los dos desconocidos ф1 y ф2. Así, po odríamos usar las ecuacioness de Yule-Walkker para obtenerr estimacioness de los parám metros autorreggresivos ф1 y ф2. Veamos unn ejemplo de uun proceso auutorregresivo de segundo orden: o (17.442) La función de autocorreelación para este e proceso se s muestra en n la figura 177.7. Nótese que es una funcióón sinusoidal que q está amorrtiguada en forrma geométrica. Como verem mos en otros eejemplos, las funciones f de aautocorrelació ón para processos autorregresivos (de orden mayor que 1) son usualm mente funcion nes sinusoidales, oscilatorias, amortiguadaas en forma geométrica. g Observee que las reallizaciones de procesos p autorregresivos dee segundo ordden (y de ordenn superior) puueden ser cíclicas o no, deppendiendo dee los valores nnuméricos de los parámetroos ф1, ф2, etc.. La ecuaciónn (17.30), por ejemplo, es una u ecuación dee diferencia dee segundo ordden en yt (con un término deel error aditivvo). En el capítu ulo 14 vimos qque los valorees de ф1 y ф2 determinan d si la solución paara esta ecuacióón de diferenncia es oscilattoria. 17.2.2
La función de autocorrrelación parcial
Un problem ma al construuir modelos autorregresivo a os es identificcar el orden del d proceso subbyacente. Parra los modelos de promediio móvil éste es un problem ma menor, debiido a que si uun proceso es de orden q, laas autocorrelaaciones muesttrales deberíann estar todas ccerca de cero para rezagoss mayores quee q. (La fórmuula de Bartlett proporciona eerrores estánd dares aproxim mados para lass autocorrelacciones, de moddo que el orden de un proceeso de promeddio móvil puedde determinarsse
CAPÍTULO 17: 1 Modelos lineales de series de tiempo
559
a partir de prueb bas de significcancia en las autocorrelacio a ones muéstralees.) Aunque se obtiene algun na informació ón sobre el orden o de un p proceso autorrregresivo a parrtir del comportamiento osscilatorio de la función dee autocorrelaación muestrall, puede obten nerse mucha m más informació ón a través dee la función dee autocorrelaciión parcial.
Para entender lo que es la función de autocorrelació ón parcial y cómo c puede apllicarse, consid deremos primero las covariianzas y la fun nción de auto ocorrelación parra el proceso autorregresivo a o de orden p. Primero, nóteese que la cov varianza con dessplazamiento k está determ minada a parttir de
Ah hora, considerando k = 0, 1,. . ., p, obtenemos las siguieentes p + 1 ecu uaciones de differencia que pueden p resolveerse de manerra simultáneaa para γ0, γ, …, … γp:
Parra desplazamiientos k mayorres que p las covarianzas c see determinan a partir de: (17.45) Al dividir loos lados izquieerdo y derechoo de las ecuaciones en (17.444) entre γ0 , poddemos derivarr un conjunto de p ecuacionnes que juntas determinan loos primeros p valores v de la función f de auttocorrelación:: (17.46) Parra desplazamiientos k mayo ores que p teneemos, a partirr de la ecuació ón (17.45), (17.47) Lass ecuaciones en (17.46) son n las ecuacion nes de Yule-W Walker; si se conocen ρ1, ρ2, …, ρp, las ecu uaciones pueden resolverse para ф1, ф2,. . ., фP. Desafortunaadamente, la solución de lass ecuaciones de d Yule-Walk ker tal como se presenta en laa ecuación (17.46) requierre del conocim miento de p, el e orden del pro oceso autorreg gresivo. Por lo o tanto, resolv vemos las ecu uaciones de Yule-Walker Y parra valores succesivos de p. En otras palaabras, supóngaase que comeenzamos por plaantear la hipóttesis de que p = 1. Entoncees, la ecuación n (17.46) se reeduce a ρ1 = ф1 o, usando lass autocorrelacciones muéstrrales, ρˆ1 = ф ˆ1. Por lo tanto, si el valor callculado ф ˆ1 ess significativaamente diferente de cero, sabemos quee el proceso auttorregresivo al a menos es dee orden 1. Deenotaremos esste valor ф ˆ1 coon a1.
560
PARTE P CUATRO O: Modelos de serie es de tiempo
Ahora consideraremo c os la hipótesis de que p = 2. Para hacer essto resolverem mos las ecuacionnes de Yule-W Walker [ecuacióón (17.46)] paara p = 2. Reaalizar esto nos da un conjunto nuevo de estiimaciones фˆ 1 y фˆ 2 . Si ф2 es siignificativameente diferente de cero, podem mos concluir quue el proceso al menos es de d orden 2, mientras que si фˆ 2 es aproximaadamente ceroo, podemos conncluir que p = 1. Representtaremos el vallor ˆ ф 2 con a2. Ahora repetimos r estte proceso paara valores suucesivos de p. Para p = 3 se ˆ ˆ obtiene una estimación dde ф 3 que dennotamos con a3, para p = 4 obtenemos ф 4 que denotam mos con a4, eetc. Llamamos a esta seriee a1, a2, a3, ....., la función de autocorrelacción parcial y observamos que podemoss inferir el orrden del proceeso autorregresiivo a partir dee su comportamiento. En pparticular, si el orden verddadero del prooceso es p, verríamos que aj ≈ 0 para j > pp. Para probar si una aj en particulaar es cero, poodemos usar el e hecho de que q está distribu uida en formaa aproximadam mente normaal, con media cero y variannza 1/T. Por lo tanto, podem mos verificar si es significativa estadístticamente en un nivel, digam mos, del 5% determinando d o si excede dee 2/√T en magnitud.
EJEMPL LO 17.1
Inversión en inventario
En el capítu ulo 16 examinnamos el comp portamiento de d la inversiónn en inventariios no agrícolass reales durannte el periodo de 1960 a 19995. (La serie en e sí se muestra en la figuraa 16.3 y su fu función de auutocorrelaciónn muestral see presenta en la figura 16.4.)) Se concluyóó que la serie es estacionariia debido a qu ue la función de autocorrelacción muestrall desciende co on rapidez haacia cero connforme se incrrementa el núúmero de rezaagos. La figuura 17.8 presenta la función n de autocorrrelación parcial para nuestrra serie de inversión en inveentarios. Obséérvese que lass autocorrelacciones parcialles Figura 17 7.8 Inversión en inventarios no agríco olas: función de autoco orrelación parcial.
CAPÍTULO O 17: Modelos linea ales de series de tiempo t
561
see acercan a cerro después dee más o menoss cuatro rezaggos. Debido a que hay 144 daatos individuaales en la muuestra, una au utocorrelación parcial es significativa esstadísticamentte en el nivel del 5% sólo si s es mayor enn magnitud quue 2 / √l44 = 0.167. No hay autocorrelaciiones parcialees más allá dee cuatro rezag gos que sean tan grandes (ex xcepto por unn rezago de 23). 2 Podemoss concluir a partir p de esto qu ue en la medida en que unaa inversión enn inventarios sigue un procceso autorregrresivo, el ordden de ese prooceso no debbería ser mayor que 4. Tomaremos en cuuenta esta infformación cuando construuyamos un moodelo de seriie de tiempo paara la inversióón en inventaarios en el cappítulo 19.
17.3
MODELO MIXTO M AUTO ORREGRES SIVO-PROM MEDIO MÓVIIL Muchos M processos aleatorioss estacionario os no pueden modelarse como promediios móviles puuros o como autorregresiv vos puros, ya que tienen laas cualidades dee ambos tipos de procesos. L La extensión lógica l de los m modelos preseentados en las últimas dos seccciones es el pproceso mixto autorregresivoo-promedio móóvil de orden (pp, q). Denotam mos este proceeso como AR RMA(p, q) y lo l representam mos con:
Suuponemos que el proceso ees estacionario o, de modo quue su media es constante a loo largo del tiempo y está daada por:
Esto da una condición c neccesaria para laa estacionarieedad del proceeso; es decir, (17.50) Ahora conssideraremos ell proceso mixxto de promediio móvil y auttorregresivo m simple, el proceso más p ARM MA(1, 1): (17.51) Laas varianzas y covarianzas de este proceeso son determ minadas en forrma conjunta dee la siguientee manera (estableciendo δ = 0):
562
PA ARTE CUATRO: Modelos de series de tiempo
Dado que E((y t-1 E t-1 )= σε2 tenemos (17.53) de modo quee la varianza está e dada por::5
Ahora podem mos determinarr las covarianzzas γ1, γ2, …, d de manera recu urrente:
y, del mismo o modo,
(17.57 7)
La función de d autocorrelaación, entoncees, está dada p por: (17.58) y para un dessplazamiento o k mayor quee 1, (17.59 9) De este modo o, la función de autocorrellación comien nza en su valo or inicial ρ1 (eel cual es una fu unción tanto dee ф1 como de θ1) y luego disminuye en forrma geométricca a partir de esste valor iniciial. Esto reflejja el hecho d de que la partee de promedio móvil del pro oceso tiene un na memoria de d un solo perriodo. Examinemos las funciones f d de autocorreelación de algunos procesos ARM MA(1, 1) com munes. La fun nción de autoccorrelación paara el proceso o: (17.60 0) se expone en n la figura 17.9. El valor in nicial ρ1 es negativo, y la función decaae hacia 0 a parrtir de este vaalor. La funció ón de autocorrrelación paraa el proceso (17.61 1) 5
Para │ф1│< <
1.
CAPÍTULO O 17: Modelos line eales de series de tiempo
563
exh hibirá comporrtamiento osciilatorio, comoo se muestra enn la figura 17.10. Nótese quee oscila entre valores posittivos y negativ vos, ya que ф1 es negativo. Para procesoos de orden suuperior, es deccir, el proceso general ARM MA(p, q), la varrianza, covariaanzas y función de autocorrrelación son soluciones a ecuaciones de diferencia quue por lo geneeral no puedeen resolverse por inspeccióón. Sin embarrgo, puede moostrarse con ffacilidad, quee
Nóttese que q es la l memoria de la parte de promedio p móvvil del processo, de modo 'quee para k ≥ q + 1 la función de autocorrellación (y las ccovarianzas) exhiben e las proppiedades de un u proceso auutorregresivo puro. p Esto compleeta la exposiciión de los moodelos para prrocesos estocáásticos estacionarios. Antess de pasar a loos modelos paara procesos hhomogéneos no estacionarrios, será útil introducir i un nuevo dispossitivo de notacción. Con freccuencia es
564
PARTE CUATRO: Modelos de serie es de tiempo
convenientee escribir o describir los rezzagos de tiemp po con el uso del operador de rezago B. Ell operador B im mpone un rezaago de tiempo de un periodo o cada vez quee es aplicado a una u variable. A Así, Bεt = εt – 1, B2εt = εt – 2,. . ., Bnεt = εt – n. Usando este e operador, ahora podemo os reescribir laa ecuación (1 17.1) para el proceso M.A(q) como: (17.64)
donde θ(B) denota una fu unción polinó ómica del operrador B. Del mismo m modo,, la ecuación (17.18) para el proceso AR(p p) puede reescribirse como o:
Por último, la ecuación ((17.48) para el e proceso AR RMA(p, q) pu uede reescribirse como:
17.4
PROCES SOS NO ESTACIONARIIOS HOMOG GÉNEOS: M MODELOS ARIMA A En la práctiica, muchas de d las series de d tiempo con n las que trabaajaremos son no estacionariaas, de modo q que las caracteerísticas del prroceso estocástico subyacente cambian co on el tiempo. En esta seccción construirremos modelo os para aquelllas series no esstacionarias q que pueden trransformarse en series esttacionarias diiferenciándolass una o más veces. v Decimo os que yt es no n estacionaria a homogénea de orden d si
wt= ∆dyt
(17.6 69)
es una seriee estacionariaa. Aquí ∆ deno ota diferenciaación; es decirr,
y así en fo orma sucesivaa. En el apén ndice 17.1 ap parece una ex xposición de las característiccas autorregreesivas de las series s no estaacionarias hom mogéneas. Obsérveese que si teneemos una seriee wt , podemoss regresar a yt sumando wt un u total de d veces. Escribim mos esto como:
yt = Σdwt
(17.7 70)
CAPÍTULO 17: 1 Modelos lineales de series de tiiempo
565
do onde Σ es el operador o de suumatoria: (17.71)
(17.72) y así a en forma suucesiva. Nóteese que el operrador de sumaatoria Σ es justto el inverso del operador dee diferencia ∆. Debido a quue ∆yt = yt – yt-1, podemos escribir que ∆ = 1 - B y por tanto Σ = ∆-1 = (1 - B)-1. Al calcular esta suma ppara una seriee de tiempo rreal, comenzaamos con la priimera observaación en la seerle original no n diferenciada (y0) y luego o agregamos valores sucesivoos de la serie diferenciada. De este modo, si wt = ∆yt, calcularíamo os yt a partir de: d
Si yt había sido diferenciado dos veces, dee modo que wt = ∆2yt , calcularíamos yt a partir p de wt suumando wt doss veces.6 Después dee haber diferennciado la seriie yt para prodducir la serie estacionaria wt , podemos moodelar wt comoo un proceso ARMA. A Sí wt = ∆dyt y wt ess un proceso AR RMA(p, q), enton nces decimos que y, es un proceso autorregreesiyo integrado o de promedio
móóvil de orden (p, ( d, q), o tann sólo ARIMA A(p, d, q), usanndo el operado or de rezago, com mo:
Llaamamos a ф(B) el operador auutorregresivo y a θ(B) el operaador de promeddio móvil.
Nótese quee la media de wt = ∆2yt estáá dada por:
(17-77) 6
Sumar wt la primera p vez nos daa ∆yt:
Ah hora la suma de ∆yyt produce yt :
566
P PARTE CUATRO: Modelos de seriess de tiempo
Figura 17..11 Un proces so ARIMA con d=1
Así, si δ no es igual a 0, la serie integ grada yt tendrrá una tendenccia determinissta
incorporadaa. Supóngase, por ejemploo, que d = 1 y δ > 0. Entoonces, yt = Σw wt crecerá en foorma lineal a lo largo del tiiempo. Un ejeemplo de una serie así podrría ser el trazad do en la figuraa 17.11. La serie tiene unaa tendencia de d tiempo lineeal que es indeppendiente de las l perturbaciiones aleatoriias; es decir, que q es determ minista. La serrie trazada enn la figura 17.12, por el coontrario, tienee una pendiennte promedio quue se incrementa en form ma lineal con el e tiempo. Essta serie podrría haber sido generada g por uun proceso quue es ARIMA A con d = 2 y δ > 0. De esste modo, wt = ∆2yt no tendrrá tendencia temporal, t Σw wt = ∆yt tendráá una tendenccia temporal lin neal y ΣΣwt = yt tendrá unna tendencia ttemporal cuyaa tasa de incrremento es coonstante. Es posibble que la seriie estacionariaa wt no sea m mixta; es decir,, será complettamente autorrregresiva o dee promedio mó óvil. Si wt es sólo AR(p), lllamamos a yt un u proceso autoorregresivo inntegrado de orrden (p, d) y llo indicamos como ARI(p, d, 0). Si wt es sólo MA(q), lllamamos a yt un proceso dde promedio móvil m integraddo de orden (d, q) y lo denottamos como IMA(0, I d, q). Figura 17 7.12 Un proces so ARIMA con d = 2. 2
CAPÍTULO 17: Modelos lineales de series de tiempo
17.5
567
ESPECIFICACIÓN DE MODELOS ARIMA Hemos visto que cualquier serie de tiempo n estacionaria homogénea puede ser modelada como un proceso ARIMA de orden (p, d; q). El problema práctico es elegir los valores más apropiados para p, d y q; es decir, especificar el modelo ARIMA. Este problema se resuelve en parte examinando tanto la función de autocorrelación como la función de autocorrelación parcial para la serie de tiempo de interés. Dada una serie yt que nos gustaría modelar, el primer problema es determinar el grado de homogeneidad d; es decir, el número de veces que debe diferenciarse la serie para producir una serie estacionaria. Para realizar esto, usamos el hecho de que la función de autocorrelación ρk para una serie estacionaria debe aproximarse a 0 conforme el desplazamiento k se vuelve grande. Para Ver por qué, considérese un
proceso ARMA estacionario de orden (p, q). Conocemos que la función de autocorrelación para la parte de promedio móvil de éste proceso se vuelve 0 para k >q, ya que el proceso tiene Una memoria de sólo q periodos. Por tanto, si yt es MA(q), entonces ρk = 0 para k >q. También sabemos que la función de autocorrelación para la parte autorregresiva de un proceso ARMA estacionario está amortiguada en forma geométrica (véase los ejemplos en las figuras 17.5 a 17.7). Por último, la función de autocorrelación para el proceso ARMA completo tiene características de promedio móvil para los primeros periodos q - p, pero después de esto es de carácter autorregresivo; es decir, tiene una envolvente que declina en forma geométrica. Para especificar d, primero examinaremos la función de autocorrelación de la serie original yt y determinaremos si es estacionaria. Si no lo es, diferenciaremos la serie y examinaremos la función de autocorrelación para ∆yt. Se repite este proceso hasta que se alcanza un valor para d tal que ∆dyt sea estacionario; es decir, la función de autocorrelación se dirige a 0 conforme k se vuelve grande.7 Deberíamos examinar también la serie de tiempo en sí; si parece tener una tendencia general, es probable que no sea estacionaria. Después de que se determina d, podemos trabajar con: la serie estacionaria wt = ∆dyt y examinar tanto su función de autocorrelación como su función de autocorrelación parcial para determinar especificaciones posibles para p y q. Para procesos de orden bajo esto no es demasiado difícil, ya que las funciones de autocorrelación para procesos como AR( 1), AR(2), MA( 1), MA(2) y ARMA( 1, 1) se reconocen fácilmente y se distinguen entre sí (véase las figuras 17.1 a 17.10). Sin embargo, si la serie de tiempo no puede modelarse como un proceso ARMA de orden bajo, la especificación de p y q se vuelve más difícil y requiere una inspección minuciosa de las funciones de autocorrelación completa y parcial. Por ejemplo, las espigas en la función de autocorrelación son indicativas de términos de promedio móvil, y la función de autocorrelación parcial puede aplicarse como guía para determinar el orden de la porción autorregresiva del proceso. 7 Recuérdese que en la práctica no tenemos garantía de que la serie de tiempo que se está modelando es no estacionaria homogénea. Si la serie de tiempo es no estacionaria no homogénea, no importa cuántas veces sea diferenciada, la función de autocorrelación no se amortiguará hacia 0.
568
P PARTE CUATRO: Modelos de series s de tiempo
Si tanto la parte autorrregresiva com mo la parte dee promedio móvil del proceeso son de ordenn alto, podemoos hacer una conjetura c tentaativa para p y q. Sin embarggo, como verem mos más adelaante, es posiblee verificar esta conjetura deespués de que se han estimado los parámetrros en el modelo ARMA(p,, q) . Como un n primer paso en este proceso de verificacióón diagnósticaa calcularemos la función de autocorrelación para los residuales del m modelo ARMA A(p, q) estimaado y determ minamos si esttos residuales parecen p ser ruuido blanco. Si S no lo son, puede intenttarse una nueeva especificació ón. Este proceso de verificcación diagnóstica se exponndrá con mayyor detalle en ell capítulo 18.
EJEMPL LO 17.2
Precio del pa apel periódico
Como un prrimer ejemploo de la especifficación de unn modelo, exaaminaremos uuna serie trimesstral para el prrecio promed dio del papel pperiódico en Estados Uniddos durante el periodo 1965-22 a 1977-3 (50 0 datos individduales). La seerie en sí (que no se muestra aquí) a se elevaa en forma con nstante con ell tiempo, indicando que es no estacionaria. Sin embargoo, la serie difeerenciada ∆yt pparece ser esttacionaria, com mo puede versee a partir de suu función de autocorrelación a n muestral enn la figura 17.113. La función de autocorreelación tiene la forma sinnusoidal amoortiguada de un proceso auttorregresivo de segundo orden y no ttiene espigass indicativas de términos dee promedio móvil. m La funnción de autoocorrelación parcial, que se muestra en la figura 17..14, tiene esppigas significaativas en los rezagos 1 y 2, confirmanddo una interprretación autoorregresiva dee segundo orrden de la serrie diferenciadaa. Por tanto ppodríamos esttimar un moddelo ARI(2, 1,, 0).
Figura 17 7.13
Precio de el papel periódico o: función de autocorre elación de ∆yt.
CAPÍTULO O 17: Modelos linea ales de series de tiempo t
EJEMPLO 17.33
569
Tasaas de interés
Com mo un segunddo ejemplo dee la especificaación de un m modelo, regreesemos a la seriie para la tasaa de interés dee bonos de tessorería a tres meses que exxaminamos en el e capítulo 166. Después dee diferenciar la serie y exaaminar las fu unciones de auto ocorrelación muestral, m estaablecimos quee es probable que sea no estacionaria e hom mogénea de primer p orden, de modo quee d es igual a 1 en una espeecificación de un u modelo AR RIMA. Ahoraa, si examinam mos la funciónn de autocorreelación para ∆yt en la figura 166.10 con más detalle, vemos que exhibe ppropiedades dee promedio móvvil que son de d primer o segundo ordeen; es decir, disminuye después d del punnto k = 1. ¿Qué hay respecto a las ppropiedades autorregresiva a as de la serie de d tasas de inteerés? Para k ≥ 1 ninguna dde las autocorrrelaciones muuéstrales exceede 0.25 en mag gnitud, lo quee sugiere quee sólo unos cuantos c términnos autorregrresivos podríaan ser suficieentes. Por lo tanto, podem mos comenzarr estimando un u modelo AR RIMA(2, 1, 2)). Sin embarggo, las autoccorrelaciones muéstrales permanecen p signnificativamennte diferentes de cero aun para p valores ggrandes de k, lo que sugierre que puedenn ser necesariios mucho máás términos auutorregresivos. Explorarem mos esta posibilidad en el caapítulo 18, doonde estimarem mos y comparraremos un moddelo ARIMA(2, 1, 2), un modelo ARIM MA(8, 1, 2) y modelos ARIMA A que inclluyen término os de promediio móvil adicionales.
570
PARTE CUATRO O: Modelos de series de tiempo
EJEMPL LO 17.4
Producción porcina
Un tercer ejemplo e es la serie mensuaal para la prodducción porciina, la cual taambién fue examinada en ell capítulo 16. Tomamos unna diferencia de d 12 meses dee la serie para eliminar e cicloos estacionales y luego encontramos quee diferenciar una u vez era suuficiente paraa asegurar la estacionariedad. La funcción de autocorrelación paara (1 - B)(l - Bl2)yt se muesstra de nuevo en la figura 17.15. 1 Obsérvvese que la fun nción de auutocorrelación n muestral ccomienza a declinar de inmediato enn k = 1 y tiene crestas más o menos una vvez cada tres periodos. p De este e modo podrííamos sospechhar que (1 - B)(l B - Bl2)yt es autorregresivvo de orden 3,, de modo que yt podría ser especificado por el modelo:
Usted rio debe d inquietarrse en este puunto si encuenntra este proceeso de especifficación del modelo m algo ddesconcertantee. Veremos máás ejemplos enn el capítulo 19. APÉNDIC CE 17.1 Estacionarie edad, invertibillidad y homoge eneidad
Vimos antees que una conndición necessaria para quee un proceso ARMA(p, A q) sea s estacionariio es que .
Ahora presentaremos una condición necesaria y sufficiente para laa estacionarieddad y la usarem mos para demostrar una propiedad paarticular de los l procesos no estacionarioos homogéneos.
CAPÍTULO O 17: Modelos linea ales de series de tiempo t
571
Nótese quee el proceso A ARMA(p, q) p uede escribirsse en la siguieente forma:
do onde B es el operador o de reezago y ỹt es laa desviación d de yt de su med dia; es decir,
Aljjora reescribim mos la ecuaciión (A17.3) co omo:
Si yt es un processo estacionario o, entonces ф-1(B) debe con nverger. Esto requiere r que las raíces r de la ecuuación caracterrística
ф(B) = 0
(A17.6)
esttén todas fueraa del círculo u unitario. Por taanto, todas lass soluciones B1..., Bp de la ecu uación (A17.6) deben ser mayores que 1 en magnitu ud. Ahora supón ngase que el p proceso ỹt en la l ecuación (A A17.3) es no estacionario, e perro en tal formaa que exactameente d de las raaíces de ф(B)eestán en el círcculo unitario y el e resto están n fuera de éstte. Este proceeso puede reeescribirse ento onces en la sig guiente formaa: (A17.7) don nde ω(B) es un n operador auttorregresivo estacionario e dee orden p - d y el operador (1 - B)d tiene d frases todas iguales a la unidad. u Pero 1 − B es un operador o de primera diferenciial es decir,
Por tanto, la ecu uación (A17.7 7) puede reesccribirse como o:
don nde wt = ∆dỹt es estacion nario, debido a que se deerivó de diferrenciar ỹt d vecces. Llamarem mos a ỹt no esstacionario hoomogéneo con orden d, y señalamos s la con nclusión de qu ue tal proceso o tiene un opeerador autorregresivo ф(B) tal que
ф(B) = ω(B) (l - B) d don nde las raícess de ω(B) estáán todas fueraa del círculo u unitario.
(A17.ll)
572
PARTE CUATRO: Modelos de serie es de tiempo
Análogaa a la condiciión de estacioonariedad paraa el operadorr autorregresivvo es la condición de invertibbilidad para el operador de promedio p móvvil. Decimos qque yt es invertibble si podemoos escribir la ecuación e (A17.3) como (A17.122)
es decir, si laa parte de proomedio móvil del proceso A ARMA puede invertirse en un u proceso autorregresivo ppuro. Ahora, si yt es inverrtible θ-1(B) debe d convergeer. Esto requieree que las raícees de la ecuació ón característtica (A17.13) deben encon ntrarse todas fuera f del círcuulo unitario; es decir, todas las solucionees B1, B2,..., Bq de la ecuacióón (A17.3) deb ben ser mayorres que 1 en valor v absoluto. Como un ejemplo, considdérese el procceso de promeedio móvil dee primer orden (es decir, q = 1), cuya eccuación caraccterística es: 1 – θ1B = 0
(A17.14)
Entonces la condición dee invertibilidaad se vuelve
Para el proceso de ppromedio móvvil de segunddo orden (q = 2) la ecuacióón característicca es: (A17.166) (A17.117)
Estos dos vaalores de B deeben estar fuerra del círculo unitario, lo quue implica quue
y
θ2 + θ 1 < 1
(A17.118)
θ 2 - θ1 < 1
(A17.119)
│θθ2│< 1
(A17.220)
CAPÍTULO O 17: Modelos lineales de series de tiempo
573
EJJERCICIOS 17 7.1 Calcule las covarianzas γk para MA(3), el e proceso de promedio p móviil de orden 3. Deetermine la función de autocorrrelación para este e proceso. Trrace la gráfica de d la función dee autocorrelacióón para el proceeso MA( 3) y t , = 1 + ε t + .8ε t- 1 - .5ε t-2 + 3ε t-3 t 17 7.2 ¿Qué caractterísticas esperaaríamos de unaa realización dell siguiente procceso MA( 1)? y t = 1 + ε t + .8ε t-1 ¿C Cómo diferiríann estas caracteríísticas de aquelllas de una realiización del sigu uiente proceso MA(1)? M y t =1 + ε t + .8ε t-1 17 7.3 Muestre qu ue las covarianzzas γk de MA(q q), el proceso dde promedio móóvil de orden q, está dado por:
y que la función de autocorrelaación para MA((q) está dada poor:
coomo en la ecuación (17.17). 17 7.4 Derive la fuunción de autocorrelación parra el proceso ARMA(2, A 1)
ess decir, determiine ρ1, ρ2, etc., en función de ф1, ф2 y θ1. Obbtenga esta fun nción de autocoorrelación paraa ф1 = 0.6, ф2 = 0.3 y θ1 = 0.9. Repítalo paara ф1 = 0.6, ф2 = 0.3 y θ1= -00.9. Repítalo paara ф1= 0.6, ф2 = -0.3 y θ1 = -00.9.
574
PA ARTE CUATRO: Modelos de seriess de tiempo
17.5 Muestre que q la función de d autocorrelacción para el procceso general AR RMA(p, q) estáá dada por:
como en la ecuación (17.63)). 17.6 Supongaa que yt es no eestacionaria hoomogénea de pprimer orden y que wt = ∆yt puede represen ntarse con el m modelo ARMA((1, 1)
Si yt = 0 para t = 0, ¿qué es E(yt) como unna función del tiempo? 17.7 Relacionne el operador de sumatoria con c el operadorr de rezago moostrando que: Σ = ( 1 - B) -1 = 1 + B + B 2 + B 3 + … 17.8 Refiérasse a la serie dee tiempo para inversión i en innventarios no agrícolas a en laa figura 16.3, su u función de, aautocorrelaciónn muestral en la l figura 16.4 y su función dee autocorrelación n parcial en la ffigura 17.8. ¿Pu uede sugerir unoo o más proceso os ARMA(p, q)) que podrían haber h generadoo esta serie de tiempo? t
CAPÍT TULO
18 8
ESTIMACIÓN Y PRONÓ ÓSTICO O CON MODELO M OS DE SERIES S DE TIEM MPO
E
En estee capítulo mostraremos m ccómo se esttiman los paarámetros dee un modelo ARIMA A. Como vereemos, si el modelo m contieene términos de promedio o móvil, estoo implica la aplicació ón de un méétodo de estimación no lineal similaar al que se describiió en el cappítulo 10. D Después de esto describbiremos la verificación diagnósttica, éste es un procedim miento usado para probar sí el modelo se ha especificado en forma correcta c (es decir, d si p, d y q se hann elegido corrrectamente). Una veez que se ha h estimado y verificado o un modelo de series de tiempo, puede usarse u para pronosticar. p E En este capítu ulo explicam mos cómo usaar el modelo ARIMA A general:
para obbtener un pron nóstico de yt para el periodo o T + l (es deccir, l periodos adelante, con l ≥ 1). Denotamos D esste pronóstico con ŷT(l) al que qu llamamos ppronóstico coon origen en T para el tiempo adela ante l. Consideeraremos prim mero que los pparámetros veerdaderos del modelo o son conocidoos y examinaaremos las proopiedades tantto del pronósttico como del error dee pronóstico. Luego L veremos cómo el connocimiento im mperfecto de loos valores de parámeetro verdaderoos incrementaa el error de pronóstico. STIMACIÓN DEL MOD DELO Supóngase quee se ha hecho una especificcación tentativva del modeloo de serie de S 1 tiiempo; es decir, se han eleggido valores de d p, d y q parra el modelo ARIMA, A 1 Asumimoss aquí por simpliccidad que δ = 0, ess decir, que wt see mide como una desviación de suu vaalor medio
575 5
576
PA ARTE CUATRO. Modelos de senes de tiempo
(18.1) con ф(B) = 1 – ф1B – ф2B 2- … - фpBp y θ(B) = 1 – θ1B - θ2B2- … - θqBq. Debemoos obtener estim maciones paraa los p parám metros autorregresivos ф1, …, фp y los q parámetros de d promedio m móvil θ1,.. ., θq Como en ell caso del moodelo de regreesión, elegimoos valores de parámetro quue minimizaráán la suma dee diferencias al a cuadrado entrre la serie de tiempo real wt = ∆dyt y la serie de tiemppo ajustada ŵt. También, dee otra maneraa, reescribimoos la ecuacióón (18.1) en función de la l serie de térmiinos de error εt:2 (18.22) El objetivo en e la estimaciión es enconttrar un conjuunto de parám metros autorreegresivos (ф1, …, фp) y un coonjunto de parrámetros de prromedio móviil (θ1,.. ., θq) quue minimicen la suma s cuadráticca de errores (18.3 3) Representam mos los conjunntos de parámeetros que minnimizan la ecuuación (18.3) ˆ ˆ con (фˆ1, … ,фˆ p) y (θ1,. . .,θ q) y denotamos los residualess asociados co on estos va ˆ lores de parám metros con εˆt, de modo que εˆt = θ -1(B) фˆ ((B)wt. Por tantto,
(18.44) Si están pressentes términoos de promed dio móvil, la eecuación (18.2) es no lineaal en los parámeetros, y por esso debe usarsee un método de d estimaciónn no lineal en la l minimizaciónn de la ecuacción (18.3). Además, A el priimer término del error en la l serie, ε1, depeende de los vvalores pasadoos e inobservab ables w0, w-1,. . ., w-p + 1 y ε0, ε-1,. . ., ε- q + 1. De este modoo, debe emplearse algún méétodo para iniccializar la seriie (es decir, elegir números para p estos vallores inobservvables). Después de que se hha estimado el e modelo, see usa un procedimiento dde verificación diagnóstica d paara probar si fue fu correcta la especificaciónn inicial. Podeemos esperar que q los residuuales εˆt , t = 1,.. . ., T, se pareezcan en form ma cercana a loos errores verdaaderos εt, los cuales c por supposición no esstán correlacioonados. Lueggo probaremos si s estos residuuales en efecto o no están corrrelacionados.. Si no lo estánn, sería conveniiente volver a especificar el e modelo (es decir, elegir valores v nuevoos para p, d y q)), estimar estee modelo nuevvo y realizar ootra verificacióón diagnósticaa. Una vez que el modelo se ha verificado a nuestra satiisfacción, pueede usarse parra pronosticar.
2 Debe queddar más claro ahoora por qué estáb bamos interesados en la invertibiliidad de θ(B) en ell apéndice 17.1.
CAPÍTULO 1 18: Estimación y pronóstico con mod delos de series de tiempo t
577
Examinemoos el procedim miento de estimación con m más detalle. Establecemos quue un total de T + d observaaciones están disponibles para p la serie de d tiempo no esttacionaria homogénea de orden o d, yt y denotamos estas observacciones como y-d+ …,yT Después de diferenciarr esta serie d veces, obtenndremos una d+1,…, y0, y1,… serrie estacionariia wt con T obbservaciones w1,. . ., wT. E El problema ess estimar los paarámetros paraa el modelo A ARMA(p, q) que q se ha espeecificado paraa la serie wt. Paara hacer esto, utilizaremoss el hecho de que (por supposición) los términos t del errror ε1,..., εT están todos disttribuidos en fo orma normal y son indepenndientes, con meedia 0 y varian nza σ2ε . Entonnces, la función n log-verosimiilitud condicio onal asociada con los valores de d parámetro ((ф1,. . ., фp, θ1, …, θq, σε) esstá dada por:
deecimos que L es la funciónn de verosimillitud logarítm mica condicionnal debido a quue la suma cuuadrática de errrores S depeende de los vaalores pasadoos e inobservab ables w0, w-1,. . ., w- p + 1, ε0, ε-1,. . ., ε- q + 1 . Esto E puede verrse escribiendo o la ecuación paara el primer término dell error obserrvable ε1 en la forma exp pandida del mo odelo ARMA::
(18.6) Por el mom mento dejemoos a un lado el e problema dde determinarr los valores paasados de wt y εt , la ecuacción (18.5) dej eja claro que la l estimaciónn de máxima veerosimilitud dee los parámettros del modeelo está dada ppor la minimiización de la suuma de los cu uadrados de llos residuales S. Por tanto, bajo la suuposición de errrores distribuiidos en formaa normal, la estimación e de máxima veroosimilitud es la misma que laa estimación de d mínimos cuaadrados.
18 8.1.1
Inicialización de la serie e
Deebido a que la función de suuma de cuadrad dos S(ф1,. . ., фp, θ1, …, θq) y por tanto la funnción de verrosimilitud L son ambas condicionalees a los valores pasados inoobservables dee wt y εt (w0 , … …, w- p + 1 y ε0 , …, ε- q + 1), lass estimacioness de mínimos cuuadrados que obtendremoss dependerán de la eleccióón de valoress hecha para w0, w-1… Por esta razón ddebemos elegir valores dee arranque inniciales para w0, w- 1,…, paraa ser usados een la minimizzación de la función de suuma de cuadrados condicioonal. La solución n más común a este probleema es estableecer w0,…,w- p + 1 y ε0,…, ε- q + 1 iguales a sus s valores espperados no con ndicionales. Loos valores esperrados no condiccionales de ε0,…, ε- q + 1 soon todos 0, y si δ= 0, tambbién los valorees esperados noo condicionalees de w0,…,w w- p + 1 son 0. Esto proporccionará una ap proximación razzonablemente buena b al proceedimiento correecto si los valoores reales de d ф1,. . ., фp
578
PARTE CUATRO: Modelos de seriess de tiempo
no están muy y cerca de 1 y si el númeroo de observaciiones T es graande con rela ción a p y q. q3
18.1.2
Estimación n no lineal de d parámetros del mod delo
Nuestro prob blema de estim mación es enccontrar valorees de los paráámetros ф1,. . ., фp, θ1,…, θq que minimiceen la suma dee cuadrados deel error S. Sup poniendo que la inicialización n de la serie sse basa, como o sugerimos, en los valorees esperados no n condicionaless (los cuales so on todos 0) dee w0 , …, w- p + 1 y ε0 , …, ε- q + 1, los límites de d ˆ ˆ tiempo serán t = 1 a T. Po or tanto, el prroblema es selleccionar фˆ1, …, … фˆ p, θ1,. . ., θ q para minimizzar
(18..7) Ahora su upóngase que el modelo es puramente p auttorregresivo; es e decir, es de d la forma
Obsérvese que q debido a q que la ecuació ón (18.9) es d de la forma geeneral
puede estimarse tan sólo como una reegresión lineaal. Aunque para p un modelo autorregresiv vo puro el proceso de estimación es en essencia una reg gresión lineal, el problema ess más difícil si el modello contiene ttambién un componente c d de promedio mó óvil. En ese ccaso podemos representar el e modelo com mo:
Es evidente que q esta "ecuaación de regreesión" es no liineal en los paarámetros y po or tanto no puede estimarsee por una ap plicación sim mple de mínim mos cuadrado os ordinarios. Sin S embargo, puede estimaarse por una rrutina generaal iterativa de 3
Un métoddo alternativo de inicializar la serie es determinar vvalores esperados condicionales paara
w0 , …, w- p + 1 ; es decir, valores que son condicionnales a los valores observados de w1 ,..., wT y los valorres estimados de ε1, ..., εT. Este proccedimiento es diffícil desde el punnto de vista técnicco, y puede que sus s beneficios no seean considerables. Recomendamoos usar los valorees esperados no condicionales paara w0 , …, w- p + 1 ; es e decir, estableciéndolos igual a 0 (cuando δ = 0).
CAPÍTULO 18 8: Estimación y pro onóstico con mode elos de series de tiiempo
579
esttimación no liineal. El proceeso es casi idééntico al que se expuso en el capítulo 10 y se usa en programas p de regresión no lineal estánddares. El proceso de d estimaciónn no lineal usaa comúnmentee los primeross dos términoss en una exppansión de seerie de Taylorr para linealiizar la ecuaciión (18.11) alreededor de unaa conjetura innicial para loss valores de loos parámetross. Se realiza enttonces una reg gresión lineall en esta ecuaación linealizada, se obtien nen estimaciones de mínim mos cuadradoos de ф1,…, фp, ф1,…, фq y se hace una nueva lineealización de la ecuación (18.11) alreddedor de estass estimacionees. Una vez máás, se realiza una u regresiónn lineal, se obttiene un seguundo conjuntoo de estimacio ones de los parámetros p y se hace una nueva linealización de la l ecuación (18 8.11) alrededo or de este seggundo conjunnto de estimaaciones. Este proceso se reppite en forma iterativa hastta que ocurree la convergenncia; es decirr, hasta que las estimaciones de los parám metros no cambbian después dde iteracioness repetidas. 18.1.3 Obte ención de u una conjetura inicial pa ara los valo ores de los paráme etros An ntes de que puueda realizarsse una estimacción no lineall en la ecuaciión (18.11), deb be hacerse unaa conjetura innicial para los valores de los parámetros. La convergenncia del proceeso de estimacción puede seer más rápida si la conjeturra inicial es bueena; es decir, si está cerca de los valores de los parám metros "verdaaderos". Por otraa parte, si la conjetura c iniciial es muy maala, es posiblee que el proceeso iterativo no converja en absoluto. a La función de autocorrellación muestrral en ocasionnes puede ser usada para ayuudar a produciir la conjeturaa inicial, al meenos si el moddelo de serie de d tiempo es de orden bajo. Por P ejemplo, si la serie wt es modeladaa como autorrregresiva de prim mer orden, unno sólo necesiita observar ell valor muestrral de ρ1. Si esste valor es, diggamos, .9, unaa primera conjjetura razonabble para ф1 es ф1,0 = .9. Sin embargo, si nueestro modelo para wt es ccomplejo, es improbable qque este métoodo de inspeccción sea útil. Aun si no podemos deterrminar la conjjetura inicial con c la simplee inspección de un correlogrrama, podemoos usar los valores v numérricos para la función de auttocorrelación muestral paraa obtener la co onjetura iniciaal. Como se demostró d en el capítulo c 17, la función de autocorrelaciión teórica puuede relacionaarse con los vallores de los parámetros teóóricos a través de una seriee de ecuacionnes. Si estas ecuuaciones están n invertidas, ppueden usarsee para resolverr los valores de d los parámettros en función n de la funciónn de autocorreelación. Esto es sencillo en el e caso de un
moodelo autorreegresivo puroo. Como un ejemplo, coonsideremos el proceso auttorregresivo de d orden p y recuérdese a partir de la ecuación (177.47) que la ecu uación de difeerencia para eesta función de d autocorrelaación está dadda por:
580
PARTE CUATRO: Modelos de serie es de tiempo
Usando el hecho h de quee ρk = ρ-k po odemos reescrribir esta ecu uación como un u conjunto dee p ecuacionees lineales siimultáneas reelacionando los parámetr os ф1,…, фp conn ρ1,…, ρp:
Con el empleeo de las ecuaciones de Yulee-Walker para resolver los paarámetros ф1,… …, фp en función de los valorees estimados de d la función de d autocorrelaación, llegamos a las estimaciones de Yule-Walker de lo os parámetross. Estas estim maciones pued den usarse para proporcionar p una primera conjetura c razo onable para lo os valores de los l parámetros.4 Esta primeraa conjetura, sin embargo, ess de valor lim mitado, ya que el modelo auto orregresivo pu uro puede estiimarse por mínimos cuadraados ordinario os. Si el mo odelo de seriees de tiempo contiene c una p parte de prom medio móvil, llas ecuaciones de d Yule-Walk ker que relaciionan los valo ores de la fun nción de autoccorrelación co on los valoress de los parám metros no serrá lineal. Reccuérdese, que el proceso MA A(1) tiene la fu función de auttocorrelación
Supóngase en este ejem mplo que ρ 1 = .4 en la fu unción de auttocorrelación n muestral. En ntonces (18.1 13) Por tanto, la primera estimación para p θ 1 es --2 o -.5. Deebido a que la invertibilidaad necesita quee | θ 1 | < 1, selleccionamos eel valor θ1,0 = -.5 para nuesttra primera con njetura en ell proceso de estimación n no lineal. Po or desgracia, la solución parra las θ en función de las ρ se s vuelve más difícil conforrme el promed dio móvil de orrden q es máss grande. De hecho, h para o obtener estimaaciones inicialles para el modeelo MA(q), es necesario reso olver q ecuaciiones no lineaales simultáneaas. Como resulttado, con frecuencia intentaamos varias co onjeturas iniciales y vemoss si nuestras estiimaciones con nvergen a los mismos valorres de los paráámetros finalees.
4 Escribienndo la ecuación (118 .12) en notacióón matricial, ρ = P ф, podemos resoolver para ф tan sólo s como ф = P-1ρ.
CAPÍTULO 18 8: Estimación y pro onóstico con modelos de series de tiempo t
581
Nos podríaamos preguntaar por qué loss valores de loos parámetross basados en lass ecuaciones de d Yule-Walkker no son sufficientes para prepósitos prrácticos. Esto eliiminaría el uso u de estimaación no lineeal. Una razóón es que laa función de au uto-correlación muestral sóllo es una estim mación de la ffunción de auttocorrelación real y por tantoo está sujeta a error. De heccho, para mueestras pequeñaas la función dee autocorrelacción muestral estará sesgadda (en forma ddescendente) a partir de la fuunción de autoocorrelación vverdadera. Unna segunda raazón es que laa función de au utocorrelaciónn muestral no contiene tantta informaciónn como la serrie de tiempo real. Para usar tanta informaación como sea s posible, eestimamos loss parámetros deel modelo conn base en la seerie de tiempo real.
18.2
VERIFICAC CIÓN DIAGN NÓSTICA Después de quee se ha estimaado un modelo o de serie de tiempo, debem mos probar si la especificacióón fue correctta. Este proceeso de verificación diagnósstica implica do os pasos. Prim mero; la funcción de autoccorrelación para la serie simulada s (es deecir, la serie de tiempo generada por el modelo) ppuede compaararse con la fu unción de auto ocorrelación m muestral de laa serie originaal. Si las dos funciones f de auutocorrelaciónn parecen muyy diferentes, podemos p dudaar de la validezz del modelo y puede requerrirse una nueeva especificaación. Si las ddos funcioness de autocorreelación no soon diferentes en forma maarcada (y éstee será el casoo con mayor freecuencia), poddemos analizaar los residuales del modelo. Recordemo os que hemos eestablecido quue los términos del error aleaatorio εt en el prroceso real esttán distribuidoos en forma normal n y son iindependientees. Entonces, si el modelo ha h sido especificado en foorma correctaa, los residuales εˆ t deben seemejar un pro oceso de ruiddo blanco. Enn particular, ppodemos esperar que los residuales estuvvieran casi no correlacionaddos entre sí, dee modo que unna función de auutocorrelaciónn muestral de los l residuales estaría cerca dde 0 para un desplazamiend tok≥1. Recuérdesee que los residduales del moodelo son: (18.14) Denotaremos la l función de autocorrelaciión muestral (para desplazzamiento k) dee los residualees como rˆk. Esstá calculada por: (18.15) Como se mencionó m en eel capítulo 16, puede aplicaarse una pruebba muy conveeniente basadaa en los resultados estadístticos obtenidoos por Box y Pierce P a esta fuunción de autocorrelación mueestral.5 Si el modelo está especcificado en form ma correcta, 5 G. E. P. Box y D. A. A Pierce. "Diistribution of Residual Autoccorrelations in Auutoregressive-Inteegrated Moving A Average Time Seeries Models", Jouurnal of the Ameerican Statistical Asssociation, vol. 65,, diciembre de 19970.
582
PARTE CUATRO: Modelos de series s de tiempo
entonces para a k desplazamientos grandess (por ejemploo, k > 5 para modelos m de orden bajo) las auttocorrelacioness residuales ˆrk son en sí mismas m variablees aleatorias no n correlacionad das distribuidass en forma norm mal con mediaa 0 y varianza 1/T, 1 donde T es el
número de observacione o s en la serie de tiempo. E Este hecho poosibilita diseññar una prueba diagnóstica d siimple. Consideeremos la estaadística Q compuesta de las primeras K autocorrelaaciones residu uales rˆ1 ,…,rˆk:6
(18.16) Esta estadísttica es una suuma de variabbles aleatoriass normales ind dependientes al cuadrado, caada una con m media 0 y varrianza 1/T, y ppor lo tanto está e distribuidda, aproximadam mente, como jji cuadrada (véase ( el capíttulo 2). Decim mos "aproxim madamente" poorque las prim meras autocorrrelaciones r1, r2, etc., tendráán una varianza ligeramente menor que 1/T y puedeen estar corrrelacionadas. Box y Pierce demostraronn que la aprooximación es bastante cerccana y que laa estadística Q estará distribuida como x2 (K- p- a); es decir, ji cuuadrada con KK p - q gradoos de libertad.7 Por consiguieente, puede reaalizarse una prrueba de hipótesis estadística de la precisión del modello comparanddo el valor obsservado de Q con los puntoos apropiados de d una tabla de d ji cuadrad da. Supóngaase, por ejem mplo, que hem mos especificaado un modello ARMA(1, 1) para una serrie wt, que see ha estimado o el modelo y que se ha caalculado que la estadística Q es 31.5 con K K= 20. A parttir de una tablaa de ji cuadradda vemos que el punto del 900% para K- p - q=l8 gradoss de libertad ees 26.0 y el puunto del 95% es 28.9. Por taanto, la estadíística Q es demasiado graande y podem mos rechazar el modelo, debbido a que la pprobabilidad de d que los ressiduales no seaan ruido blanco es al menoss del 95%. Coonsideremos que se especiifica y se estiima un modeelo nuevo, ARM MA(2, 2) y quee la estadísticaa Q ahora es 22.0, 2 de nuevoo con K= 20. A partir de la tabla t de ji cuaadrada vemoss que el puntoo del 90% parra 16 grados de libertad es 23.5. Por tannto no necesiitamos rechaazar la hipóteesis de que los residuales soon ruido blancco, y este seguundo modelo ees aceptable.8 Para P determinnar la "mejor" especificación e n podemos esppecificar y esttimar algunoss otros modelos ARMA paraa ver si puedee obtenerse un na estadísticaa ji cuadrada menor. m 6 Para 7
moddelos de orden baajo, K igual a 15 o 20 es suficientte. En el cap pítulo 16 dijimos que la estadísticaa Q es ji cuadradda con K grados de d libertad. Nótesse que esta definiciión fue en referenncia a una prueba de d la hipótesis de que la serie de da atos originales (enn oposición a los residuales de nueestro modelo ARM MA estimado) es ruido blanco. Parra la serie de datos originales, p = q = 0. 8 Nótese que q esta prueba jji cuadrada es una u prueba de hippótesis "débil". Un valor de Q ppor debajo del puntto del 90% en la distribución ji cuuadrada indica quue no es necesariio rechazar la hippótesis de que loss residuales son bblancos, dado que la probabilidadd de que la hipóteesis es verdaderaa es menor que el 90%. Por tanto sóllo es una prueba indirecta de la hhipótesis de que loos residuales no son s blancos.
CAPÍTULO 18: Estimación y pronóstico con modelos de series de tiempo
583
En otro caso, si el valor calculado de Q está entre los puntos del 90 y 95% de la cola de ji cuadrada, entonces, se dudará sobre el modelo. Cuando menos se aplicará una segunda prueba. Esta segunda prueba implicaría observar los valores individuales de rˆk para todas las k entre, digamos, K/4 y K (en nuestro ejemplo, entre k = 5 y k = 20). En vista de que estas rˆk son normales con varianza 1/T, podemos probar para ver si están todas dentro de 2 o 3 desviaciones estándar de sus medias de 0. Si varias de las rˆ k son mayores que 2/√T (2 desviaciones estándar de la variable normal), se tendrá evidencia de que el modelo está mal especificado. Además, la evidencia de esto puede sugerir cómo debería volver a especificarse el modelo. Por ejemplo, si para un modelo ARMA(2, 1) rˆ k es mucho más grande que 2/√T, esto indica que el modelo debe especificarse de nuevo con la inclusión de un término de promedio móvil de tercer orden. Al construir un modelo de series de tiempo con frecuencia se estiman varias especificaciones alternativas. Puede ser el caso de que dos o más especificaciones pasen las verificaciones diagnósticas descritas antes. En este caso deben usarse pruebas adicionales para determinar la "mejor" especificación. Una prueba es comparar la "serie simulada" (es decir, la serie de tiempo generada por el modelo) para cada especificación con la serie original. Entonces, la especificación que produce el error de simulación rms menor será conservada. Sin embargo, a menos que una especificación tenga un error rms claramente menor, sugerimos conservar todas las especificaciones que pasen las verificaciones diagnósticas y luego elegir entre ellas con base en su desempeño en los pronósticos.
EJEMPLO 18.1
Tasas de interés
En los dos capítulos anteriores comenzamos a analizar una serie de tiempo de datos mensuales para la tasa de interés de bonos de la tesorería del gobierno de Estados Unidos desde principios de 1960 hasta marzo de 1996, y una serie de tiempo de datos mensuales para la producción porcina estadounidense de 1960 a 1967. Ahora estimaremos algunos modelos ARIMA alternativos para estas dos series de tiempo. Comenzaremos con la serie de las tasas de interés. Revisemos las funciones de autocorrelación muestral en las figuras 16.8, 16.10 y 16.12 para las series no diferenciada, diferenciada una vez y diferenciada dos veces. Anteriormente se explicó que estas funciones de autocorrelación sugieren que la serie es no estacionaria homogénea de primer orden; es decir, puede ser modelada como ARIMA(p, 1, q). También se comentó en el capítulo 17, que una especificación para p y q es difícil de determinar a partir de las autocorrelaciones muéstrales. Un modelo de orden inferior como ARIMA(2, 1, 2) puede ser suficiente, pero el hecho de que las autocorrelaciones muéstrales permanezcan significativamente diferentes de cero aun para rezagos grandes sugiere que puede ser necesario estimar modelos de orden superior. Comenzaremos con una especificación de orden bajo y estimaremos un modelo ARIMA(2, 1, 2). El resultado es
584
PARTE CUATRO: Modelos de series de tiempo
ARIMA(2,1,2): (1 - .5590B - .1366B 2 )∆y t = .00446 + (1 - .2338B - ∆72lB 2 )ε t (18.17) R2 = .120
X 2(4, 36) = 120.36
Nótese que aunque la R2 de esta ecuación es baja, esto no necesariamente significa que la especificación es mala. Recuerde que la R2 mide el ajuste en función de la variable dependiente de la regresión, la cual en este caso es el cambio mensual en la tasa de interés. Una estadística más reveladora es la ji cuadrada, la cual es 120.36. Con 32 grados de libertad (36 rezagos menos 4 parámetros AR y MA estimados), este valor está muy por encima del nivel crítico del 95%. Por tanto, se puede concluir que los residuales de este modelo están autocorrelacionados, y se necesitan términos de orden más alto. Como un siguiente paso, incrementaremos el número de parámetros y estimaremos un modelo ARIMA(4, 1, 4). El resultado es ARIMA(4,1,4): (1 - .6648B + .5871B2 - .3981B3 - .4365B4)∆y t = .00360 + (1 - .3453B + .2755B2 - .1833B3 - .7130B4)ε t (18.18) R2 = .181
X2(8,36) = 80.42
Aunque la estadística ji cuadrada ha descendido, todavía es muy significativa, lo que nos lleva a rechazar esta especificación. Ahora intentaremos especificaciones que son de orden mucho más alto: ARIMA(8,1,2): (1 - .8370B + .7152B2 - .2286B3 + .1830B4 - .1972B5 + .3275B6 - .0867B7 - .0635B8)∆y t = .00133 + (1 - .5106B + .3764B2)ε t (18.19) R2 = .205
X2(10,36) = 57.22
ARIMA(8,1,4): (1 - .4564B + .7676B2 - .3146B3 + .7932B4 - .3351B5 + .3661B6 + .0172B7 - .0367B8)∆y t = .00167 + (1 - .1142B + .5613B2 - .1381B3 + .6309B4)ε t R2 = .228
X2(12,36) = 47.18
(18.20)
CAPÍTULO O 18: Estimación y pronóstico p con mod delos de series de tiempo
585
Las estadístiicas ji cuadraada han desceendido de maanera consideerable pero todaavía son signiificativas en el nivel del 95%. 9 Puede seer que necesiitemos una espeecificación de orden aún más alto. Loos resultados de estimar un u modelo ARIIMA(8, 1, 6) son los siguieentes: ARIIMA(8,1,6): (1 ( - .4974B - .0584B2 + .00025B3 + .1220B 4 - .0980B B 5 - .3310B 6 + .2920B7 - .3395B 8) ∆y ∆ t = .00269 + (1 - .15499B - .2930B 2 - .0993B3 + .0959B4 + .0761B5 - .58 854B6)εt R?2 = .231
(18.21)
X2(14, 36) = 46.87
Comparada con c la del moodelo ARIMA A(8, 1,4), la esstadística ji cu uadrada es ligeeramente mennor (46.87 conntra 47.14), peero es más siggnificativa deebido a que hayy dos parámettros adicionales y por tantoo dos grados de libertad menos m (36 14 = 22 contra 36 3 – 12 = 24)). Por lo tanto o, agregar doss términos dee promedio móv vil adicionalees no mejora el modelo. El E lector puedde verificar qu ue agregar térm minos autorreggresivos adicionales tampooco mejora ell modelo. Aunque los resultados r de la verificació ón diagnósticaa no son buennos, el modeloo ARIMA(8, 1, 4) parece ser s el más pro omisorio. Usaaremos este modelo m para prodducir pronóstticos en la sigguiente sección.
EJEMPLO 18.2 2
Prod ducción porcin na
Aho ora estudiemoos la serie para la produccióón porcina meensual. Recuéérdese del capítulo 17 que sugerimos s quue un modelo apropiado paara la serie poodría ser
Estee modelo fue estimado e paraa el periodo dee enero de 19660 a diciembree de 1967, con n los siguientees resultados (1 + .66811B + .2015B B 2 - .1298B 3 )(1 ) - B)(1 - B 12 )y t = .001 4 + ε t (18.22) R2 = .365
X2(3, 20) = 122.83
Ell modelo es aceptable, perro nos podríam mos preguntaar si otra espeecificación pro oporcionaría un mejor ajuuste a los datoos. Quizá, la adición de téérminos de
586
PARTE P CUATRO: Modelos M de series de tiempo
promedio móvil m mejoraríía el modelo. Para comproobar esto, estiimamos un m modelo que inccluye términoos de promediio móvil de pprimer y segun ndo órdenes: 1 (1 + .66266B + .3945B 2 - .0179B 3 ) (l - B)(l - B 12 )y t
= .0015 + (1 + .016885 - .2191B 2 ) ε t R2 = .349
(18.223)
X2(5, 20) = 13.01
La inclusión n de los térm minos de prom medio móvil da como resuultado un vallor ligeramentee menor para la l R2. Sin em mbargo, es de mayor m importtancia, el hecho de que la suuma de los vvalores estimaados de ф1, ф2 y ф3 resultta mayor que 1. Derivándosee un modelo no estacionarrio para una sserie que creeemos que es ese tacionaria. Por P tanto rechhazaríamos este modelo y cconservaríamo os el modelo de la ecuación (18.22).
18.3
PRONÓ ÓSTICOS CO ON ERROR CUADRÁTIICO MEDIO MÍNIMO Ahora analizzaremos los pronósticos. p N Nuestro objetivvo es predecirr valores futurros de una serie de tiempo sujjeta al menor error posible.. Por esta razóón consideram mos que el pronóóstico óptimo es aquel que tenga t el errorr cuadrático medio m mínimo de pronóstico. Debido a quee el error de pronóstico p es una variable aleatoria, minnimizamos el valor esperaddo. Siendo estoo así, elegirem mos nuestro proonóstico ŷT(l) de modo que see minimice E[eeT2(l)] = E{[yT+ 1 - ŷT(l)]2}. Deemostramos quue este pronóstiico está dado po or el valor espeerado condicio onal de yT+ l; ees decir, por: (18.224) Para deemostrar que el error cuaddrático medioo mínimo de pronóstico esstá dado por la ecuación (18.24), comenzaaremos por reeescribir el mod delo ARIMA de la ecuación (18.1) como: (18.225) en vista de que ∆ = 1 - B. B Por consiguuiente, (l8.2 26)
Aquí hemoss expresado ell modelo ARIIMA como unn proceso de promedio p móvvil puro de ordden infinito.9 E Entonces, 9 Cualquieer proceso ARIM MA puede ser exppresado en formaa equivalente com mo promedio móóvil puro o como autorregresivo au purro. Podríamos, po or ejemplo, habeer reescrito la ecuuación (18.25) como d -11 ф(B)(1 - B) θ (B)yt = εt , o ξ(B) B)yt = εt . Éste es un u proceso autorr rregresivo puro de orden infinito. No especificamos originalmente o el pproceso ARIMA como autorregressivo puro o prom medio móvil puro (de orden infinito)) debido a que teendríamos que esstimar un númerro infinito de parrámetros.
CAPÍTULO O 18: Estimación y pronóstico con mod delos de series de tiempo
587
(18.27) En la ecuación (18.27) ( hemoos dividido laa suma infinitta en dos parrtes, con la seguunda parte coomenzando coon el término ψl εT y por taanto describieendo informacción hasta el periodo p T incclusive. Por supuestoo, el pronósticco ŷT(l) sólo puede p basarsee en informacción disponiblle hasta el moomento T. Nuuestro objetivo es comparaar este pronósstico con el valoor real yT + l co omo se expresa en la ecuacción (18.27). Para hacer essto, escribimoss el pronóstico o como una suma s ponderada de aquelloos términos deel error que pod damos estimarr, a saber, εT, εT -1,. . .. Entonnces el pronósstico deseado es: e (18.28) donnde los pesos ψl*+ j se han dde elegir de manera m óptimaa para minimizar el error cuaadrático medio mínimo de pronóstico. Ahora A podrem mos escribir una u expresión n para el errorr de pronósticco, eT(l) usand do las ecuacioones (18.27) y (18.28):
Ya que por supossición E(εi εj) = 0 para i ≠ j, el e error cuadráático medio dee pronóstico es: (18.30)
Es evidente quee esta expresión es minimizada estableeciendo los peesos "óptimoss" ψl*+ j iguall a los pesos vverdaderos ψl + j, para j = 0, 1,. . .. Perro entonces nueestro pronósticco óptimo ŷT(l) es sólo ell valor esperaado condicionnal de yT+l. Estoo puede obserrvarse tomanddo el valor espperado condiccional de yT+l en la ecuaciónn (18.27). Los valores esperrados de εT+l , …, εT+1 son toodos 0, mienttras que los valo ores esperados de εT, εT+1, . . ., son sólo loos residuales de la ecuaciónn estimada. Porr tanto, tenem mos (18.31) Esto proporcionaa el principio bbásico para callcular pronóstticos a partir de d nuestros modelos ARIMA A. Ahora aplicaaremos este prrincipio al cálcculo real de prronósticos.
588
18.4
PARTE CUATRO: Modelos de serie es de tiempo
CÁLCU ULO DE UN PRONÓSTIICO El cálculo del pronósticco ŷT(l) puede hacerse en forma recurrente usando el modelo ARIIMA estimado o. Esto implicaa calcular prim mero un pronó óstico un perio odo adelante, lu uego usando este pronósttico calcular un pronósticco dos period dos adelante y continuando c h hasta que se haya h alcanzad do el pronósticco del periodo o l. Escribiremo os el modelo A ARIMA(p, d, q) q como: (18.3 32)
Para calculaar el pronóstiico ŷT(l), com menzaremos ccalculando el pronóstico a un periodo de wt , ŵT(1). Para hacerlo, escrib biremos la ecu uación (18.32) con el periodo o de tiempo mod dificado:
(18.3 33) Entonces, calculamos c nu uestro pronóstiico ŵT(1) tomaando el valor esperado con ndicional de wT+1 en la ecu uación (18.33)):
donde los εˆT, εˆT-1, etc., sson residualess observados. Nótese que el e valor esperaado de εT+1 es 0. Ahora, usan ndo el pronóstiico a un perio odo ŵT(1), pod demos obtenerr el pronóstico a dos periodos ŵT(2):
(18.3 35) El pronósticco a dos periodos se usa entonces e para producir el pronóstico p a tres t periodos, y así hasta quee se alcance el pronóstico a l periodos ŵT(l):
(18.336)
CAPÍTU ULO 18: Estimaciónn y pronóstico con m modelos de series de d tiempo
589
N Nótese que si l > p y l > q, eeste pronóstico será: (18.37) Una vez qu ue se ha pron nosticado la seerie diferenciaada wt, puede obtenerse un prronóstico paraa la serie origiinal yt con sólo o aplicar la op peración de su umatoria a wt; ess decir, sumaando wt d vecces. Supóngase, por ejemp plo, que d = 1 . Entonces, nu uestro pronósstico a l period dos de yt estáá dado por: ;
(18.38)
Sin embargo, si el modelo paara yt fue ARIM S MA con d = 2, el pronóstico a l periodos ŷT(l) estaría daado por
Aquí el operad A dor de sumato oria se ha aplicado dos vecces. El proced dimiento es paarecido para valores v mayorres de d.
18.5
EL ERROR R DE PRONÓ ÓSTICO Como C vimos an ntes, si expresaamos el modello ARIMA com mo un proceso o de promedio móvil m puro de orden infinito o, el error de pronóstico p l periodos adelaante está dado por: (18-40) Recuerde R que los pesos ψj sson determinaados a partir d de (18.41) Asumimos A quee los parámetrros del modello ф1,. . ., фp, θ1,. . ., θq,q se conocen ex xactamente, y por consiguiente los pesoss ψ0, ψ1,. . ., taambién se cono ocen de igual fo orma. En estee caso la varia anza del errorr de pronósticco está dada por: p (18.42) Por lo tanto, la forma f algebraaica para la varianza v del error e de pronó óstico depende de d la especificcación ARIMA A particular que q se ha adop ptado. En la siguiente s
590
PAR RTE CUATRO: Mo odelos de series de e tiempo
sección s exam minaremos el error de proonóstico con más detalle para algunoss modelos m ARIMA simples. Por ahora, haay dos cosas qque deberemo os observar. Primera, sabemos s a parrtir de la definnición de ψ(B B) anterior quue ψ = 1.10 Porr e para cualq eso, quier especifiicación ARIM MA sabemos quue el error de pronóstico unn p periodo adelan nte es sólo: eT(1) = εT+1
(18.43))
y esto tiene vaarianza σε2. Poor tanto, la varrianza del erroor de pronóstiico un periodoo a adelante es laa varianza dell término de error. e Segunda, debemos tenner en cuenta el e hecho de quue nuestro cállculo del error de d pronósticoo se basó enn la suposiciión de que cconocemos lo os valores dee parámetro p ф1,. . ., фp, θ1,. . ., θq, con certeza. c Sin em mbargo, los parámetros p sonn estimados e porr medio de unna regresión de d mínimos ccuadrados no lineales, y lass estimaciones e son variabless aleatorias coon medias y vvarianzas. Porr consiguientee, la l varianza deel error de prronóstico rea al será mayorr que la variaanza calculadaa antes. a Para deeterminar conn exactitud qu ué tanto es mayor, debemo os conocer las varianzas v de las l estimacionnes de los paráámetros en el modelo ARIM MA. Debido a que q los parám metros son esttimados en fo orma no lineall, calcularíam mos los erroress estándares e baasados en la última ú iteraciión del proceddimiento de estimación e noo lineal. l La dificuultad aquí es qque los errorees estándares para la lineaalización en laa última ú iteracción pueden no ser estim maciones "veerdaderas" de los erroress estándares e reaales para los valores v de loss parámetros. Como una cu uestión práctica, c tenemos la opción dee usar estos errores e estánndares en el cálculo de laa varianza v del error e de pronóóstico o ignorrarlos y tan sóólo calcular laa varianza deel error e de pronó óstico basadaa en la ecuación (18.42).
18.6
INTERVALLOS DE CONFIANZA DE PRONÓSTICOS Antes A de que podamos callcular un interrvalo de conffianza para nuuestro pronós-tico, t necesitam mos una estim mación de σε2 para la variaanza del término de pertur-bación. b Esta estimación e esttaría basada en e forma lógicca en la sumaa de residualess ˆ ˆ al a cuadrado S( S фˆ1, …, фˆ p, θ1,. . ., θ q) obtennida después de que se han n obtenido lass estimaciones e de los parámetros:
Aquí T - p - q es el númeroo de grados dee libertad en laa regresión lin A neal. Vemos a partir de la ecuación (118.42) y del hecho h de que ψ0 = 1 que unn intervalo dee 10 Recuérdes e que el modelo A ARIMA (con meddia 0) es w t = ф 1 w t - 1 + … + ф p w t - p + ε t - θ 1 ε t - 1 -… - θ q ε t - q El único término t no rezagaado en el lado derrecho es ε t (el cuaal tiene un peso de d 1). Por tanto, ψ0 debe ser igual a 1 en la ecua cióón (18. 26).
CAPÍTULO O 18: Estimación y pronóstico p con mod delos de series de tiempo t
591
connfianza de n desviaciones d esstándar alreded dor de un pronnóstico l period dos adelante esttaría dado porr:
(18.45) Coomo esperamoos, este intervvalo se hace mayor m conform me el tiempo adelante a l es maayor, aunque el patrón exaacto depende de los pesos ψj. Los pronóstticos de yt, junnto con un in ntervalo de coonfianza caraccterístico del 666% ( n = 1) y un intervalo dde confianza del 95% (n = 2), se muesttran para un moodelo ARMA A hipotético (dd = 0) en la fiigura 18.1. Nóótese que los pronósticos (deenotados conn cruces) prim mero están in ncrementándoose pero lueg go declinan hasta el nivel medio m constantte de la serie. Sabemos quee el pronóstico se aproximaará a la media de la serie coonforme el tiem mpo adelante l sea más gran nde debido a qu ue el proceso es estacionarrio. Los interrvalos de connfianza, por supuesto, s se inccrementan coonforme el tieempo al cual se hace el proonóstico aum menta.
18.7
PROPIEDAD DES DE LOS S PRONÓST TICOS ARIM MA Ahhora examinaaremos las proopiedades de los pronósticcos derivadas de algunos moodelos ARIM MA simples. En todos los caasos que siguen asumimos que los parám metros del mo odelo ARIMA A particular se conocen con certeza. 18 8.7.1
El proceso p AR R(1)
Comenzaremo C os con el procceso autorreg gresivo de priimer orden esstacionario, A AR(1): (18.46) Figura 18.1
Pronósticos e intervalos de confianza para a un proceso ARMA A estacionario.
592
PA ARTE CUATRO: Modelos de series de tiempo
Para este prooceso el pronóóstico a un peeriodo es: (18.477) Del mismo modo, m (18.488) Y el pronóstiico a l periodoos es: (18.499) Nótese que en e el límite coonforme l se vuelve v grandee, el pronósticco converge al valor (18.500) Vemos, entonnces, que el ppronóstico tieende a la meddia de la serie conforme l se s vuelve grandde [recuérdese la ecuación (17.23) ( para laa media del prroceso AR(1)]. Por supuesto o que esto no es sorprendennte, ya que laa serie es estaacionaria. Connforme el tiem mpo adelante l se vuelve mu uy grande, en esencia no haay informacióón útil en los vaalores recientes de la serie de d tiempo, yT, yT-1, etc., quee puedan usarsse para ajustar el e pronóstico lejos del valoor de la mediaa. Por tanto, para p un tiemppo adelante muy y grande el mejor m pronósttico es la meddia estacionarria de la seriee. Ahora calcuularemos el eerror de pron nóstico para este proceso o. El error dde pronóstico l periodos p adellante está daddo por:
Ahora, sustiituyendo la eccuación (18.4 49) por ŷT(l), oobtenemos: (18.511) la cual tiene una varianzaa (18.522) Obsérvese quue esta varianzza del error dee pronóstico se s incrementa (en forma noo lineal) confoorme l se vuellve más grand de.
CAPÍTULO 18 8: Estimación y pro onóstico con mode elos de series de tiiempo
18 8.7.2
593
El proceso p MA A(1)
Ahhora examinarremos el procceso de promeedio móvil dee primer orden MA(1): y t = δ + ε t – θ 1 ε t-1
(18.53)
El pronóstico a un periodo para este proceeso es: (18.54) don nde εˆT es el reesidual real dee la observaciión actual (y m más reciente).. Por comparración, el pronnóstico para el periodo l, para p l > 1, es precisamentee (18.55) Estto también es como se espeeraba, en virtu ud de que el pproceso MA( 1) tiene una meemoria de un solo s periodo. Por tanto, loss datos recienntes no son de ayuda para haccer un pronósstico dos o más m periodos adelante, y el mejor pronóóstico es la meedia de la serie, δ. La varianzaa del error de ppronóstico paara MA( 1) ess σε2 para el prronóstico a un periodo, y paara el pronósttico a l perioddos, l > 1, estáá dado por:
(18.56) Porr tanto la variianza del error de pronósticco es la mism ma para un proonóstico dos perriodos adelannte, tres perioodos adelante,, etc. Los inteervalos de co onfianza del pro onóstico aparecerán como se muestra enn la figura 188.2.
Figura 18.2 Pronósticos e intervalos de confianza para a un proceso MA(1)).
594
PARTE CUATRO O: Modelos de serie es de tiempo
18.7.3
El proceso o ARMA(1, 1)
Ahora calcuularemos y exxaminaremoss los pronósticcos generadoss por el proceeso de promediio autorregressivo móvil mixto más simpple, ARMA(1,, 1): (18.5 57)
El pronóstiico a un perioodo para el modelo ARMA A(1, 1) está daado por: (18.5 58)
El pronóstiico a dos perioodos es:
(18.59) Porr último, el prronóstico a l periodos p es: (18.660)
Nótese quee, nuevamentte el valor lím mite del pronóóstico conforrme l se vuelvve grande es la l media de laa serie: (18.661) Examinanddo estos pronósticos para diferentes d tiem mpos adelantte, vemos quee la perturbacióón actual ayuuda a determinnar el pronósstico a un perriodo y a su vvez sirve comoo un punto de partida del reesto del perfill del pronóstiico, el cual ess de carácter auttorregresivo y decae hacia la media δ/(11 – ф1). El hechho de que loss pronósticos de modelos A ARMA se aprroximen al vaalor medio (connstante) de la serie conform me el tiempo adelante aum mente indica una u limitación de d estos moddelos. Como veremos v en loos ejemplos enn este capítulo y en el capítuulo 19, los modelos de seriees de tiempo son mejores paara pronósticoos a corto plazoo. Para un horrizonte de pro onóstico a larrgo plazo es probable p que sea más útil unn modelo econnométrico esttructural.
18.7.4
El proceso o ARI(1, 1, 0)
Ahora exam minaremos unn proceso no estacionario e ssimple, el procceso autorregrresivo integraado ARI(1, 1,,0):
CAPÍTULO 18: Estimación y pronóstico p con moddelos de series de tiempo t
595
(18.62) con n Los pronósticos para yt se relaacionan con loos pronósticos de la serie differenciada wt como sigue: (18.63) y
(18.64)
Deebido a que el proceso diferrenciado wt ess AR( 1), sus pronósticos están e dados porr:
(18.65) Enntonces, el proonóstico a unn periodo paraa yt es: (18.66) El pronóstico a dos periodos para yt es:
(18.67) Sin n embargo, unna forma más instructiva dee ver este pronnóstico, es enn función de suss cambios. Dee modo que (18.68) podemos escribbir el pronósticco ŷT(2) como o (18.69) Deel mismo moodo,
(18.70)
Ah hora examinarremos las proppiedades de esste pronóstico. Ya que wt ess un proceso AR R(1), sabemos a partir de lla ecuación (118.50) que (18.71)
596
PARTE CUATRO O: Modelos de series de tiempo
De esta form ma, conformee el horizonte del pronósticco l se vuelve grande, el perfil del pronóstiico se aproxim ma a una líneea recta con ppendiente δ/(11 – ф1). En ottras palabras, co onforme el hoorizonte sea más m grande, ell pronóstico es e dominado por p el rumbo deeterminista deel proceso. Parra un horizonnte de pronóstiico corto esto no sería cierto.. Podría haber sido el caso o, por ejemploo, de que las últimas difereencias wT, wT-1, wT-2 fuerann negativas aun nque δ fuera ppositiva, de modo m que la seerie tuviera un rumbo r ascenddente general. En este caso los pronósticcos a corto plaazo ŵT (l) y ŵT(2) podríaan ser negattivos, aun ccuando ŵT(l) tendería haacia δ/(1 – ф1)cconforme l see volviera grrande. Los prronósticos paara yt, entoncces, disminuiríaan primero perro luego cambbiarían de direección, aproxiimándose al fiinal a una línea recta r con penddiente δ/(1 – ф1). Este pronnóstico ARI(1, 1, 0) hipotético se muestra en forma gráffica en la figuura 18.3. Una cosa que queda clara de inmeediato acerca de d los pronóstticos ARIMA A es que son adaaptativos. Como puede verrse en la figuura 18.3, el prronóstico usa los datos más recientes r y se adapta en co onsecuencia. O Otro ejemplo de la naturaleeza adaptativa de d los pronóstticos ARIMA A se muestra een la figura 18 8.4. Este proceeso también es ARI(1, 1, 0) y es idéntico al proceso enn la figura 18.3 3 para t ≤ T. Las L cruces en laa figura 18.4 representan los pronósticcos hechos enn el momentoo T. Ahora supó óngase que la serie se increementa en loss periodos T + 1, T + 2 y T + 3 y que se hace un nuevvo conjunto de d pronósticoos en el perioddo T + 3. Esstos pronósticoss se representan con círcullos, y como puede p verse enn la figura 188.4, primero se incrementan y luego disminuyen. Al finnal también se aproximaránn a una línea de rumbo. Estaa nueva líneaa de rumbo tenndrá la mism ma pendiente que q antes pero será s un poco m mayor como resultado r de los l nuevos dattos individualles. Lo que obseervamos, entoonces, es que el e pronóstico se ha "adaptado" a los nuevvos datos que quedaron dissponibles en los periodos T + 1 , T + 2 y T + 3. Obsérvese que q los valorees de este proonóstico para uun tiempo guía largo también se han adapptado. Figura 18 8.3 Pronósticcos hipotéticos para un proceso p ARI(1, 1 , 0).
CAPÍTULO 18: 1 Estimación y prronóstico con mod delos de series de tiempo
597
Figura 18.4 Naturaleza ada aptativa del pronóstico ARI (1, 1, 0).
18 8.7.5
Intervalos de c confianza para el pronóstico ARI((1, 1, 0)
Ahhora calcularemos el error dde pronóstico y su varianza para p el processo ARI( 1, 1, 0) de modo qu ue podamos obtener o un inntervalo de coonfianza del pronóstico. Co omo veremos, el intervalo de d confianza del d pronóstico para yt se relaaciona con el inttervalo de connfianza del prronóstico paraa la serie diferrenciada wt. Comenzareemos con el error e de pronó óstico para ell pronóstico a un periodo, ŷT(l) ( : (18.72)
el cual tiene unna varianza σε2 . El error de pronóstico para el perio odo dos está daddo por:
(18.73) y éste é tiene unaa varianza (18.74)) Nóótese que estee error de pronnóstico (y su varianza) v es aacumulativo; es e decir, es igu ual al error deel periodo doss para ŵT(2) además a del errror del period do uno para
598
PA PARTE CUATRO: Modelos M de series de d tiempo
ŵT(l). Por tantto, el error enn ŷT(2) es unna acumulacióón de los erroores en ŵT(l) y ŵT(2). Ahora obbsérvese este ffenómeno acu umulativo en el e pronóstico del d periodo l:
y éste tiene una varianza: (18.76) Así el error en e ŷT(l) es unaa acumulaciónn de los erroress en ŵT(l),ŵT(2 2),..., ŵT(l). Essto puede versee en forma grráfica en las figuras 18.5 y 18.6, las cu uales comparran intervalos dee confianza paara pronósticoos de la serie ddiferenciada wt con intervallos de confianzza para los prronósticos dee yt. Obsérvesse la relaciónn entre los prronósticos de la serie diferrenciada wt y los pronóstiicos de yt. wT-2 T y wT-1, esttán disminuyenddo, y wT es neggativa, de mod do que ŵT(l) y ŵT(2) tambiéén son negativvas [ŷT(l) y ŷT(2)) están dism minuyendo], ŵT(3), ŵT(4),, etc., son poositivas [ŷT(3) es mayor que ŷT(2)], y por últtimo ŵT(l) se aproxima a a la m media δ/(1 – ф1)conforme l se vuelve grandde de modo quue ŷT(l) se aprroxima a la línnea de rumbo. Obsérvese que el intervaloo de confianzza para ŷT(l) crece c con rappidez, en vissta de que deebe explicar la acumulación a dde errores de pronóstico p en lla serie diferennciada.
Figura 18 8.5 Intervalo de d confianza para ŵT( l )para el proceso ARI(1, A 1, 0).
CAPÍTULO 18: Estimación y pronóstico p con mo odelos da series de e tiempo
599
Hemos exaaminado las propiedades de pronósticco sólo de los modelos AR RIMA simples, pero algunaas de nuestras conclusiones se aplican a modelos m más co omplicados (ees decir, de orrden alto). Enn particular, nnótese que unn modelo de pro omedio móvil de orden q ttiene una mem moria de sólo q periodos, de d modo que loss datos observvados afectaráán el pronósticco sólo si el tiempo adelantte l es menor quue q. Un moddelo autorreggresivo tiene una memoriaa de longitudd infinita, es deecir, que todass las observaciones pasadass tendrán algúún efecto en ell pronóstico, au un si el tiemp po adelante l es largo. Pero P aunque todas las obbservaciones paasadas tienen algún a efecto een el pronósticco, sólo las obsservaciones más m recientes tieenen un efectto grande. Poor tanto, inclluso con modelos autorreegresivos (o miixto autorregrresivo-promedio móvil), laas observacioones pasadas tienen poco efe fecto en el proonóstico si ell tiempo adelaante es grandde. Por tanto los l modelos AR RIMA son máás adecuados ppara pronósticoo a corto plazzo; esto es, proonósticos con unn tiempo adellante l no mucho más larggo que p + q. 18.8
D DOS EJEMP PLOS Anntes en este capítulo c estim mamos modellos ARIMA ppara la tasa de d interés de boonos de tesoreería a tres messes y para la producción p poorcina mensuaal en Estados Unnidos. Ahora generaremos pronósticos para p los mism mos casos usan ndo los modeelos ARIMA.
EJEMPLO 18 8.3
Pronóstico de tas sas de interés
Reecuérdese del ejemplo 18.11 que se estim mó un modeloo ARIMA(8, 1 , 4 ) para la tassa de interés de bonos dee tesorería a tres t meses ussando datos que q abarcan haasta marzo dee 1996. En esste ejemplo usamos u este modelo m para generar una se rie de pronóssticos de la taasa de interés dé los bonos .
600
P PARTE CUATRO: Modelos de series de tiempo
Figura 18.7 Cambios mensuales m en la tasa de interés de bonos de tesorería, t pronóstico o de 24 meses contra real.
En la figgura 18.7 se muestra m un proonóstico ex post de 24 messes (de abril de d 1994 a marzzo de 1996), een la figura 18 8.8 se muestraa un pronósticco de 12 mesees (abril de 19995 a marzo de d 1996) y en la figura 18.9 un pronóstiico de 6 mesees (octubre de 1995 a marzoo de 1996). Nótese N que toddas estas figurras muestran la serie pronossticada y reall para el camb bio mensual en la tasa dee interés, no su s nivel. Una evaaluación de eeste modelo como c herramienta de pronnóstico es alggo difícil dada la l volatilidad de las tasas de d interés. Sinn embargo, loo que podemoos
Figura 18..8 Cambios mensuales m en la tasa de interés de bonos de tesorería, t pronóstico de 12 meses contra real.
CAPÍTULO 1 18: Estimación y pronóstico p con mod delos de series de e tiempo
601
Figura 18.9 Cambios mensuales en la tasa de interrés de bonos de tesorrería, pronóstico de 6 meses contra real.
verr, es que el moodelo ARIMA A captura las teendencias perro falla en pred decir virajes abrruptos, en esp pecial para loss pronósticos más m largos. Por ejemplo, ell pronóstico de 24 meses fallló en capturarr los incremenntos abruptos en la tasa dee interés que ocuurrieron durannte 1994 y las disminucionees (algo más ppequeñas) quee ocurrieron durrante 1995. Del D mismo moodo, el pronósstico de 12 meeses falló en predecir p las decclinaciones ab bruptas que ocurrieron durrante el año. Inncluso el pronnóstico de 6 meeses tiende a subpredecir s loos cambios enn la tasa de interés. Esto tam mbién puede verrse en la figura 18.10, la cuual traza el proonóstico de 6 m meses y los vaalores reales en función del nivel de la tasaa de interés en n lugar de las pprimeras diferrencias. Figura 18.10 Tasa de interés s de bonos de tesorrería a tres meses, pro onóstico de 6 meses contra real.
602
PARTE CUATRO O: Modelos de serie es de tiempo
Figura 18 8.11 Cambios mensuales en la tasa de e interés de bonos de tesorería, pronóstico ex ante.
La figurra 18.11 muestra un pronó óstico ex ante de 18 meses que se extiennde de octubre de 1995 a marzo de 19977. (Esta figuraa de nuevo ess en función de primeras diiferencias.) Aquí A se predijjo que los cam mbios cíclicoos en la tasa de interés que ocurrieron (y fueron pronoosticados por el modelo) paara los primerros 6 meses conntinuarán ocuurriendo a lo largo de los siguientes s 12 meses. Dejarremos al lectoor la comprobbación de los datos d y la detterminación de lo preciso qque fue el pronóóstico. La utilid dad de un moodelo ARIMA A como éste coomo una herrramienta de prronóstico sóloo puede evaluuarse en com mparación conn otras herram mientas disponnibles. En el caso de una tasa de interéés a corto plaazo, en particcular durante un periodo en que q las tasas estaban fluctu uando de mannera consideraable, podríam mos esperar quee un modelo dde regresión estructural muestre m un meejor desempeeño de pronóstico que un moodelo de seriies de tiempoo. En el capítuulo 19 verem mos cómo puedee combinarse uun modelo dee series de tiem mpo con un modelo m de regrresión para mejorar m el pronnóstico de las tasas de interés.
EJEMPL LO 18.4
Pronóstico de d la producció ón porcina
Recuérdese que el modeelo ARIMA para p la produccción porcinaa en la ecuaciión (18.22) se estimó e usandoo datos desdee principios de d 1960 hastaa fines de 19667. Generamos nuestro pronnóstico sobre un u horizonte de dos años, comenzando en enero de 1968 y terminanndo en enero de d 1970. Lueggo comparam mos los 25 messes de producciión pronosticada con los datos d reales. Las seriies pronosticaada y real paraa la produccióón porcina se muestran en la l figura 18.122. Obsérvese que nuestro modelo m ha geenerado pronó ósticos que soon
CAPÍTULO 1 18: Estimación y prronóstico con modelos de series de tiempo t
603
Figura 18.12
Pronóstico de dos d años (25 meses) de producción porcina. Límites L de tiempo: ene ero de 1968 a enero de d 1970.
basstante preciso os. El modelo no sólo pronoosticó en form ma correcta lass tendencias cam mbiantes en laa serie sino quue también deetectó el ciclo estacional am mplio (como debbería, en vistta de que el m modelo incluy ye una doceaava diferenciaa de la serie parra explicar laa estacionaliddad). En general el pronósttico está denttro del 10 o 15% de la seriee real y reprooduce la mayo or parte de loos puntos de viraje. Este moodelo sería baastante aceptaable como unna herramientta de pronóstiico. A diferenncia de nuestrro ejemplo dee la tasa de innterés, es proobable que la producción porcina pueda pronosticarse p e mejor con el e empleo de un modelo de d series de tiempo que usan ndo un modello de regresióón de una solaa ecuación. Laa razón para estto es que la economía e com mplicada de laa producción porcina no puede p represen ntarse con faccilidad con unna ecuación estructural e senncilla. Aunquue probablemeente la produccción porcinaa puede modeelarse bastantee bien con unn modelo de sim mulación de ecuaciones e m múltiples, es probable p que lla construccióón de dicho moodelo sería diffícil y consum miría mucho tiiempo. El moodelo de seriess de tiempo, por el contrario, puede consttruirse con faccilidad y rapiidez y hace unn trabajo de pro onóstico razon nable.
En el capítu ulo 19 veremos algunos ottros ejemplos de modelos de series de tieempo aplicado os a problem mas en el pronnóstico econóómico y de neegocios. En cadda caso pasareemos por el proceso p de esp pecificar, estim mar y verificarr un modelo AR RIMA, y lueg go usaremos eel modelo paraa producir proonósticos. Esto o proporcionarrá al lector alg go más que uuna sensación de las propieddades y caraccterísticas de loss modelos de series de tiem mpo y los pron nósticos.
604
PARTE CUATRO: Modelos de series de tiempo
EJERCICIOS 18.1 Suponga que se ha estimado un modelo ARMA(0, 2) para una serie de tiempo que se ha generado por un proceso ARMA( 1,2). a) ¿Cómo indicaría la prueba diagnóstica de que el modelo ha sido especificado mal? b) ¿Cómo se verían las autocorrelaciones residuales rˆk? ¿Qué características de estas autocorrelaciones podrían indicar que ARMA(1, 2) es una especificación más correcta? 18.2 Repita el ejercicio 18.1 para un modelo ARMA(0, 2) estimado para una serie de tiempo que se ha generado por un proceso ARMA(2, 3). 18.3 Suponga que una serie de tiempo no estacionaria homogénea particular yt puede modelarse como un proceso estocástico que es ARIMA(1, 1, 1). a) ¿Cómo calcularía las funciones de autocorrelación muestral para yt y sus diferencias y las usaría para verificar que ARIMA( 1, 1, 1) es en efecto una especificación apropiada para yt? b) Suponga que no tiene acceso a un paquete para computadora para estimación no lineal. ¿Cómo usaría una regresión lineal para obtener estimaciones aproximadas de los parámetros en el modelo? (Explique los pasos involucrados con claridad.) 18.4 Usando datos para la tasa de interés de bonos de tesorería a tres meses (o alguna otra tasa de interés a corto plazo), especifique y estime modelos alternativos a los del ejemplo 18.1. Experimente con modelos ARIMA(p, 1, q) de orden superior y también con modelos ARIMA(p, 2, q). ¿Qué tan sensibles son sus estimaciones a la elección del periodo de la muestra? 18.5 Escriba la ecuación que determina el pronóstico ŷT(l) en función de ŵT(l), ŵT(2),..., para un proceso no estacionario homogéneo de tercer orden; es decir, derive el equivalente de la ecuación (18.39) para un modelo ARIMA con d = 3. 18.6 ¿Parece razonable que para cualquier especificación ARIMA la varianza del error de pronóstico un periodo adelante siempre es la varianza del término de error? Ofrezca una explicación intuitiva de por qué debe cumplirse siempre la ecuación (18.43). 18.7 Derive expresiones para los pronósticos a uno, dos y tres periodos, ŷT(1), ŷT(2), y ŷT (3), para el proceso de promedio móvil de segundo orden MA(2). ¿Cuáles son las varianzas de los errores para estos pronósticos? ¿Cuál es la varianza del error para el pronóstico del periodo l, con l > 3? 18.8 Derive expresiones para los pronósticos a uno, dos y tres periodos para el proceso autorregresivo de segundo orden AR(2). ¿Cuáles son las varianzas del error de estos pronósticos? 18.9 Repita el ejercicio 18.8 para el proceso ARMA(2, 1). 18.10 Suponga que una serie de tiempo no estacionaria particular yt puede modelarse como un proceso estocástico que es ARIMA(1, 1, 1 ). a) Después de que ha estimado los parámetros del modelo, ¿cómo pronosticaría yt un periodo adelante? Exprese este pronóstico del periodo uno, ŷT(1), como una función de datos observables. ¿En qué sentido es adaptativo este pronóstico?
CAPITULO 18: Estimación y pronóstico con modelos de series de tiempo
605
b) ¿Cómo calcularía el error estándar del pronóstico del periodo uno ŷT(1) asumiendo que los parámetros del modelo se conocen perfectamente? Note que esto es análogo al cálculo del error estándar de un pronóstico de regresión bajo la suposición de que los coeficientes β se conocen perfectamente. c) ¿Cuál será la diferencia entre el pronóstico del periodo l ŷT(1) y el pronóstico del periodo (l + 1) ŷT(l + 1) cuando l es muy grande?
18.11 En el ejercicio 18.4 le pedimos que estimara modelos ARIMA alternativos para la tasa de interés de bonos de tesorería a tres meses. Ahora use sus modelos para generar pronósticos comparables con los del ejemplo 18.3. ¿Usted ha podido construir un modelo cuyo desempeño de pronóstico es mejor?
CAPÍTULO
19
APLICACIONES DE LOS MODELOS DE SERIES DE TIEMPO
Hemos visto que la construcción de un modelo econométrico en parte es un arte. Aun con un modelo simple de una sola ecuación debemos decidir acerca de cuáles variables explicativas incluir, la forma funcional para la ecuación, cómo debe interpretarse el ajuste estadístico del modelo y qué tan útil es el modelo resultante para propósitos de pronóstico o explicativos. La situación es muy parecida con los modelos de series de tiempo. Generalmente no es obvio cuál debería ser la especificación apropiada para un modelo ARIMA. Varias especificaciones diferentes podrían ser aceptables para una sola serie de tiempo y su función de autocorrelación, así que un juicio sólido debe usarse junto con una cierta cantidad de experimentación. A menudo, como en el caso de la regresión, especificaremos y estimaremos más de un modelo ARIMA y comprobaremos cada uno en forma individual. En general, es difícil de asegurar la utilidad de un modelo ARIMA con propósitos de pronóstico. Aunque pueden determinarse intervalos de confianza para los pronósticos de un modelo, aún debemos decidir si podría ocurrir cualquier cambio estructural significativo en la determinación de la variable bajo estudio y por tanto alterar el movimiento futuro de la serie de tiempo. En este capítulo presentaremos varios ejemplos de la construcción y uso de modelos de series de tiempo. Esperamos que los ejemplos ayuden a transmitir una mejor comprensión del proceso de modelado y que el lector conozca la utilidad de los modelos de series de tiempo en problemas de pronóstico aplicados. Veremos que los modelos de series de tiempo pueden usarse en aplicaciones de pronóstico no sólo por sí mismos sino también en combinación con modelos de regresión. Comenzaremos con un modelo para una variable económica agregada, inversión en inventarios no agrícolas, y luego pasaremos a un modelo para pro606
CAPÍTULO 19: Aplicaciones de tos modelos de series de tiempo
607
nosticar datos telefónicos estacionales. Podríamos afirmar que la inversión en inventarios puede explicarse mejor con un modelo econométrico estructural, pero dicho modelo puede ser difícil de construir y consumir mucho tiempo. Los datos telefónicos estacionales que examinamos son cíclicos, muy fluctuantes y difíciles de explicar usando un modelo econométrico estructural, de modo que un modelo de series de tiempo proporciona un vehículo natural para el pronóstico. Como una aplicación final mostramos en dos ejemplos cómo es posible combinar un modelo de series de tiempo con un modelo econométrico estructural. Para hacer esto, primero construiremos un modelo de regresión y luego elaboraremos un modelo de series de tiempo para los residuales de la regresión (es decir, para el ruido no explicado). Este modelo combinado de series de tiempo es llamado en ocasiones modelo de función de transferencia y, si se usa en forma apropiada, puede ser una herramienta de pronóstico muy efectiva.
19.1
REVISIÓN DEL PROCESO DE MODELADO Comenzaremos por revisar en forma breve los pasos involucrados en la construcción, evaluación y uso de los modelos de series de tiempo. Empezamos con la especificación de un modelo. Esto requiere primero una decisión acerca del grado de homogeneidad en la serie de tiempo; es decir, cuántas veces debe diferenciarse para producir una serie estacionaria. Esta decisión se toma observando las funciones de autocorrelación de la serie y sus diferencias. (Sin embargo, hemos visto que el grado de homogeneidad no siempre es obvio.) Luego debe determinarse el orden de las partes de promedio móvil y autorregresiva del modelo. Podemos obtener alguna guía a partir de las funciones de autocorrelación muestral total y parcial, pero a menudo la elección correcta no es clara y deben estimarse varias especificaciones alternativas. Una vez que se, ha especificado un modelo (o un grupo de modelos), debe estimarse. Si el número de observaciones en la serie de tiempo es grande con relación al orden del modelo, entonces el proceso de estimación implica una regresión no lineal sencilla. Después, se realiza una verificación diagnóstica. Esto implica ver la función de autocorrelación de los residuales del modelo estimado. Puede realizarse una prueba ji cuadrada simple para determinar si los residuales no están correlacionados. Además, debe verificarse que las estimaciones de los parámetros sean consistentes con la estacionariedad; es decir, que los parámetros autorregresivos sumen un número menor que 1 en magnitud. El modelo debe evaluarse luego para determinar su capacidad para pronosticar con precisión y, para proporcionar una mejor comprensión de sus propiedades de pronóstico. Por ejemplo, el modelo puede pasar una verificación diagnóstica pero tener un ajuste estadístico muy deficiente, y esto limitará su utilidad para pronosticar. Si los parámetros estimados del modelo tienen errores estándares grandes, el error estándar de pronóstico será grande.
608
PARTE CUATRO: Modelos de series de tiempo
Un medio de evaluación y análisis del modelo es realizar una simulación histórica comenzando en diferentes puntos en el tiempo. Se puede examinar entonces estadísticas como el error de simulación rms y el coeficiente de desigualdad de Theil y su descomposición. (Véase los capítulos 8 y 13 para una revisión de éstas y otras estadísticas de evaluación de modelos.) Además, podemos realizar un pronóstico ex post comparando el pronóstico con datos reales para evaluar su desempeño. Esto podría ayudarnos a decidir qué tan lejos en el futuro puede usarse el modelo para pronosticar. Esto es importante en particular si se va a usar un modelo de series de tiempo junto con un modelo econométrico estructural. De manera típica, el modelo de series de tiempo proporcionará un mejor pronóstico a muy corto plazo pero el modelo econométrico estructural proporcionará un mejor pronóstico a un plazo más largo.
19.2
MODELOS DE VARIABLES ECONÓMICAS: INVERSIÓN EN INVENTARIOS En esta sección construiremos y examinaremos algunos modelos de series de tiempo para el nivel real de inversión en inventarios no agrícolas (dólares constantes de 1987). Esta variable es difícil de explicar y pronosticar usando modelos econométricos estructurales, por lo que parece apropiada la construcción de un modelo ARIMA. Nuestra muestra consiste en datos trimestrales desde el primer trimestre de 1960 hasta el último trimestre de 1995. Sin embargo, para evaluar el desempeño para el pronóstico de nuestros modelos ARIMA, estimaremos los modelos usando datos sólo hasta el último trimestre de 1994. La serie de tiempo se muestra en la figura 16.3 y su función de autocorrelación muestral se muestra en la figura 16.4. Cuando examinamos la serie y su función de autocorrelación en el capítulo 16, señalamos que la función de autocorrelación muestral exhibe las propiedades de una serie estacionaria. (Después de un desplazamiento de rezago k de 3, cae con rapidez hacia cero.) Además, la serie en sí parece ser estacionaria debido a que no hay tendencias a largo plazo ya sea ascendentes o descendentes. No obstante, para comprobar también diferenciamos la serie una vez. La serie diferenciada y su función de autocorrelación muestral se muestran en las figuras 19.1 y 19.2. Nótese que la función de autocorrelación disminuye de inmediato a más o menos -.25, se eleva a .2 y luego oscila entre valores de alrededor de ±. 1. Hay poco aquí que se parezca a un patrón, lo que dificulta especificar un modelo ARIMA. Parece razonable asumir que nuestra serie es estacionaria; es decir, especificar y estimar modelos ARIMA(p, 0, q). En el ejemplo 17.1 examinamos la función de autocorrelación parcial para esta serie de inversión en inventarios. Señalamos que las autocorrelaciones parciales se vuelven pequeñas después de cuatro rezagos, lo que sugiere que el componente autorregresivo del modelo ARIMA podría estar limitado al cuarto orden. El hecho de que la función de autocorrelación también disminuya cuando k = 3 o 4 sugiere que cualesquier términos de promedio móvil también deberían ser de orden bajo. Por consiguiente comenzamos por estimar las siguientes
CAP PÍTULO 19: Aplicacciones de los mod delos de series de tiempo
Figura 19.1 Inversión en inventarios: prim meras diferencias (en dólares d constantes de 1987). 1
Figura 19.2 Inversión en inventarios: prim meras diferencias, fun nción de autocorrelación muestral.
609
610
PARTE CUATRO: Modelos de series de tiempo
tres especificaciones: ARIMA(2, 0, 2), ARIMA(4, 0, 0) y ARIMA(4, 0, 2). Los resultados son los siguientes: ARIMA(2, 0, 2): (1 + .24325 - .5639B2)yt = 21.485 + (1 + .8187B - .1695B2)εt 2
(19.1)
2
R = .335
X (4, 24) = 27.12
ARIMA(4, 0, 0):
(1 - .5191B - .0157B2 - .1994B3 + .2289B4)yt = 21.985 + εt 2
(19.2)
2
R = .334
X (4, 24) = 26.89
ARIMA (4, 0, 2):
(1 - .4910B + .7799B 2 - .5565B 3 + .1071B 4 )y t = 22.349 + (1 + .0332B + .9796B2)εt 2
R = .393
(19.3)
2
X (6, 24) = 15.09
Todas estas estadísticas ji cuadrada (con 20, 20 y 18 grados de libertad, respectivamente) son insignificantes en el nivel del 90%, permitiéndonos en cada caso aceptar la hipótesis de que los residuales son ruido blanco. Es claro que la inversión en inventarios puede describirse con un modelo ARIMA de orden bajo. El modelo ARIMA(4, 0, 2) parece ser el más promisorio debido a que tiene una estadística ji cuadrada mucho menor que los otros dos modelos, aun después de ajustar para los grados de libertad. No obstante, es útil investigar si agregar más términos AR y MA al modelo puede mejorar su ajuste. Por tanto, también estimamos los modelos ARIMA(4, 0, 4) y ARIMA(6, 0, 4). ARIMA(4, 0, 4): (1 - 1.1077B + .6858B 2 - .8389B 3 + .4214B 4 )y t = 21.586 + (1 - .6239B + .4020B2 - .5130B3 - .2412B4)εt R2 = .405
(19.4)
X2(8, 24) = 16.05
ARIMA(6, 0, 4) (1 - .4356B - .0922B2 - .1927B3 - .5020B4 + .4587B5 + .0419B 6)yt = 21.536 + (1 + .0480B + .0064B2 - .0474B3 - .9541B4)εt (19.5) R2 = .455 X2(10, 24) = 9.87 Aunque el modelo ARIMA(4, 0, 4) no difiere mucho del modelo ARIMA(4, 0, 2), el modelo ARIMA(6, 0, 4) tiene un ajuste considerablemente mejor. La R2 se ha incrementado en alrededor de .05 y, de mayor importancia, la estadística ji cuadrada ha caído en forma considerable, aun después de ajustar para los grados de libertad. La figura 19.3 muestra las series real y ajustada, junto con los residuales, para este modelo. El modelo no capta la extensión de los virajes descendentes del inventario durante las recesiones de 1975, 1980 y 1982, pero
CAP PÍTULO 19: Aplica aciones de los modelos de series de tiempo t
611
Figura 19.3 Series reales, ajustada a y residuales para a el modelo ARIMA A(6, 0, 4).
po or lo demás él ajuste es buueno y los ressiduales no m muestran una correlación serrial o heteroceedasticidad apparentes. Por tanto, usarem mos el modelo o ARIMA(6, 0, 4) para prono osticar la inveersión en inveentarios. Primero genneramos un ppronóstico de ocho trimestrres para 19944 y 1995. La serrie pronosticaada y real se muestran en la "figura 19..4. Aunque ell pronóstico sig gue la tendencia general de d las inversio ones en invenntarios, no cappta el incremeento abrupto que q ocurrió durante d 1994. ¿Un pronóstiico más corto podría de-
Figura 19.4 Pronóstico de ocho trimestres de in nversión en inventarios:: pronóstico con ntra real:
612
P PARTE CUATRO: Modelos de seriess de tiempo
Figura 19.5
Pronóstico o de cinco trimestres de inversión en inventa arios: pronóstico o contra real.
sempeñarse mejor? La figura fi 19.5 muestra m un proonóstico de cinco trimestrres para 1995 y el primer trrimestre de 1996. 1 En estee caso la seriie pronosticadda replica en foorma cercana el descenso de d la inversión en inventarrios que ocurrrió en realidad en e 1995. Por últim mo, la figuraa 19.6 muestrra un pronósttico ex ante que q se extiendde desde 1996--1 hasta 1997-4. Nótese quue el pronóstico está cerca del valor de la media de la inversión en inventarios duurante el perioodo de estimaación y muesttra poca fluctuaación. Determ mine usted de la precisión dde este pronó óstico.
Figura 19..6
Pronóstico o ex ante de inversió ón en inventarioss.
CAPÍTULO 19: Aplicaciones de los modelos de series de tiempo
613
La incapacidad de nuestro modelo ARIMA para predecir virajes descendentes y virajes ascendentes abruptos en la inversión en inventarios limita su valor para pronosticar. Sin embargo, antes de descartarlo como una herramienta de pronóstico, debe compararse con las herramientas de pronóstico alternativas de que se dispone. Se han construido muchos modelos de regresión de una sola ecuación y de ecuaciones múltiples para pronosticar inversiones en inventarios, algunos con un desempeño que no es mucho mejor que el de nuestro modelo ARIMA simple. Debido a que la inversión en inventarios depende de otras variables macroeconómicas, las cuales dependen a su vez de la inversión en inventarios, es probable que sean explicadas y pronosticadas mejor usando un modelo macroeconómico de ecuaciones simultáneas completo. Sin embargo, construir un modelo así consume tiempo y es costoso, así que un modelo de series de tiempo puede proporcionar una alternativa de pronóstico económica.
19.3
PRONÓSTICO DE DATOS TELEFÓNICOS ESTACIONALES Un artículo de Thompson y Tiao proporciona otro caso de estudio interesante del análisis de series de tiempo.1 En el estudio, se construyeron modelos de pronóstico para los movimientos de altas y bajas de la estación Wisconsin Telephone Company, usando datos mensuales de enero de 1951 a octubre de 1966. El movimiento de altas de la estación en un mes determinado es la suma de las instalaciones telefónicas residenciales y comerciales, mientras que el movimiento de bajas de la estación consiste en la eliminación y desconexión de teléfonos. Es importante para la compañía telefónica obtener pronósticos razonablemente precisos de los movimientos de estación, ya que estos pronósticos se usan como informaciones fundamentales para la planificación a corto y a largo plazo de la compañía. La diferencia entre los movimientos de altas y bajas de la estación representa el incremento neto (o disminución) de teléfonos en servicio, de modo que una diferencia positiva esperada conduciría a una secuencia de gastos de capital. La subestimación de la diferencia podría crear una escasez en el suministro de teléfonos e instalaciones asociadas, mientras que la sobrestimación daría como resultado una expansión prematura de las instalaciones y por tanto resultaría un costo agregado para la compañía. Los datos usados por Thompson y Tiao para los movimientos de altas y bajas de la estación se muestran en las figuras 19.7 y 19.8. Los datos muestran un patrón estacional muy distinto, con un máximo y un mínimo que se alcanzan cada año. Nótese que el nivel de cada serie tiende a incrementar con el tiempo y que la varianza de los datos tiende a incrementarse conforme aumenta el nivel. Para
reducir esta dependencia de la varianza con el nivel, los autores le aplicaron una transformación logarítmica a ambas series. Por tanto, el análisis que sigue está dado en función de datos logarítmicos transformados. (Las transformaciones
1 H . E. Thompson y G. C. Tiao, "Analysis of Telephone Data: A Case Study of Forecasting Seasonal Time Series", Bell Journal of Economics and Management Science, vol. 2, núm. 2, otoño de 1971.
614
PA ARTE CUATRO: Modelos M de series de tiempo
Figura 19.7 7 Movimiento os mensuales de altas de e la estación, enero de 1951 1 a octubre de 196 66.
Figura 19.8 8 Movimiento os mensuales de bajas de la estación, enero de 1951 1 a octubre de e 1966 (yt).
logarítmicas se usan con frecuencia enn el análisis dde series de tieempo como un u medio para eliminar e el crrecimiento a lo l largo del tiempo en la varianza v de loos datos.) Pueden construirse c coon facilidad modelos m de seeries de tiempo para explicaar la estacionallidad; de hechho, tratamos la estacionaliidad antes cu uando construuimos un mod delo de series de tiempo paara la produccción porcina. Es E conveniennte esperar un patrón estacionnal en los movimientos de estación; es decir, d semejannzas en las ob bservaciones ddel mismo mees en años dife ferentes. Por taanto, esperaríamos que las observacionees que están separadas por 12 periodos estuvieran e altaamente correllacionadas (ccomo en nuesstro ejemplo de la produccción porcinaa). Podemos exppresar esta rellación estacioonal con el moodelo autorreggresivo simple (19.6 6)
donde et es un u shock aleattorio. Mientraas que esta ecuuación explicaa la dependen-cia de las observaciones entre e años, lass observacionees en meses sucesivos s tam-
C CAPÍTULO 19: Aplic caciones de los mo odelos de series de tiempo
615
bieen pueden serr dependientees. Esta depeendencia puedde representaarse con un seggundo modeloo autorregresiivo: (19.7) donde εt es un shock aleatorioo. La ecuación (19.6) puedde sustituirse en e la ecuaciónn (19 9.7) para elim minar et: (19.8)
(19.9) Laa ecuación (19 9.9) es un moddelo autorregrresivo simple. Sin embargo o, sirve para desscribir tanto la l dependencia estacional como la no estacional e enttre observacio ones.2 En este casoo presentamoss el modelo dee Thompson y Tiao de la seerie de bajas log garítmica. (Loos lectores intteresados en el e resto de suss resultados puueden remitirsse al artículoo original.) Representarem R mos el logarittmo de los movimientos m meensuales de baajas de la estaación con la variable v yt. Laa función de autocorrelaa cióón muestral de d y, se muesstra en la figuura 19.9. Nóttese que esta función de auttocorrelación alcanza su m máximo en k = 12, 24 y 36; esto no es sorrprendente
Figura 19.9 Función de autocorrelación n muestral de yt.
2
Esta ecuación n puede generalizaarse para producirr una clase de mo delos para series estacionales:
do onde фp*1 (B12)es unn polinomio en B12 de orden p1 y фp(B) es un polinoomio de orden p. Los parámetros ф*1 ,…,фp* 1, puedenn llamarse parám metros autorregreesivos estacionalles. En la etapa preliminar de construcción del modelo m se pone paarticular atención n a los máximos een las funciones de d autocorrelacióón muestral que ocurren en múlt iplos de 12 reza gos. Generalmennte, es necesario diferenciar 12 periodos aparte (unna o más veces) ccuando ρ k es grannde de manera persistente para k - 1 2 , 24, 36,. ..
616
PARTE P CUATRO: Modelos de series s de tiempo
Figura 19.10 Función de d autocorrellación muestral para p wt.
en vista del patrón estacioonal en los daatos. Por tantoo calculamos diferencias d deel periodo 12 en e la serie y lllamamos a essta nueva serie wt: wt = (1 - B12)yt
(19.10)
La función de autocorrellación muestrral para wt se presenta en la l figura 19.110. Nótese que la dependencia estacionaal entre años ha sido elim minada y que la magnitud de la autocorrrelación se ha h amortiguaddo de maneraa considerablle. Además, nóótese que estaa función de autocorrelacción tiene mááximos en cadda tercer rezago o, lo que sugiiere por tanto el modelo auutorregresivo3 (19.11) Thompsson y Tiao ajuustaron un modelo autorreegresivo de teercer orden a la serie wt y luuego calcularoon la función de autocorrellación para loos residuales de este modelo. Encontraronn máximos en k = 9, 12 y 133, lo que sugieere la adición de tres parámettros de promeedio móvil. Por tanto, su modelo m ARIM MA final paraa yt fue de la sigguiente formaa (19.12) Se estimaronn los cinco parrámetros ф3, ф12, θ9, θ12 y θ133 y el modelo resultante r se usó u para pronostticar la serie dde bajas logaríítmica para loos 36 meses deesde noviembbre de 1966 hastta octubre de 1969. El pronnóstico, junto con el intervaalo de confiannza del 95%, se muestran en la figura 19.11. Nótese que el modello hace un traabajo bastantee bueno para pronosticar los l movimientoos de bajas dee la estación, aun durante un u periodo dee 36 meses. De D hecho, parecce desempeñaarse consideraablemente mejjor que nuestrros modelos de d 3 También podrían generarsse ciclos cada terccer periodo con un u modelo autorreegresivo de segunndo orden (con los valores de los paarámetros apropi ados). Los autorees pueden haber probado un modeelo de segundo ordden y encontrado que era preferibble la ecuación ( 1 9 . 1 1 ). Sin emb argo, en general,, si ocurre un máxim mo distinto en la función de autoccorrelación en cadda nésimo rezagoo, sugerimos incl uir un término auttorregresivo de nnésimo orden en la especificació n del modelo AR RIMA.
CAP PÍTULO 19: Aplicacciones de los modelos de series de tiempo t
617
Figura 19.11
Pronóstico de la a serie de bajas logaríítmica para los 36 meses, noviembre de 1966 1 a octubre de 196 69, hecho en octub bre de 1966.
invversión en invventarios. La rrazón para essto es que los datos telefónnicos usados en el estudio dee Thompson y Tiao fueron particularmeente dóciles all análisis de serries de tiempo o. El análisis de series de tiempo funcioona mejor cuuando existe un patrón persisstente (estacioonal o de otraa índole) en llos datos, y dicho d patrón esttá presente en n los datos tellefónicos.
19.4
COMBINAC CIÓN DEL ANÁLISIS A DE E REGRESIÓN CON UN N MODELO DE E SERIES DE E TIEMPO: MODELOS M D FUNCIÓN DE N DE TRANS SFERENCIA Enn el capítulo 18 1 estimamoss un modelo de series de tiempo para una tasa de intterés a corto plazo. p Aunquue usamos el modelo para producir un pronóstico, sug gerimos que podría p habersse obtenido unn mejor pronóóstico usando o un modelo de regresión estrructural de una sola ecuació ón (como en ell capítulo 8). De D hecho, el anáálisis de seriees de tiempo y el análisis de regresión pueden comb binarse para prooducir un mej ejor pronósticco del que serría posible obbtener usandoo solamente una de estas téccnicas. Supóngase que queremoos pronosticarr la variable yt usando unn modelo de reg gresión. Es probable que dicho modeloo incluya aquuellas variables independieentes que pueeden explicar los movimienntos en yt perro no son coliineales en sí miismas. Considdere que nuesstro modelo de d regresión contiene dos variables v indep pendientes, x1 y x2, de la siguiente form ma: yt = a0 + a 1 x1t1 + a 2 x 2t + ε t
(19.13)
Estta ecuación tiiene un términno del error aditivo a que exxplica la variaanza inexplicadda en yt; es deecir, explica eesa parte de laa varianza de yt que no es ex xplicada por x1 y x2. La ecuaación puede eestimarse, y resultará una R2 que (a menos que por alg gún azar yt esté e perfectam mente correlaacionada conn las variablees independieentes) será meenor que 1. Enntonces la ecuuación puede usarse para prronosticar
618
PARTE CUATRO O: Modelos de serie es de tiempo
yt. Como vim mos en el cap pítulo 8, una fuente de error de pronósttico vendría del d término del ruido aditivo o cuyos valorees futuros no pueden predeecirse. Una apllicación efecttiva del análisis de seriess de tiempo es e construir un u modelo ARIIMA para la seerie residual ut de esta regreesión. Entoncees sustituiríam mos el modelo ARIMA A para el e término del error implícitto en la ecuaciión de regresión original. Al usar la ecuacción para pron nosticar yt , taambién seríam mos capaces de hacer un prronóstico dell término dell error εt usaando el modeelo ARIMA. El modelo ARIIMA proporcio ona alguna infformación resp pecto a cuáless valores futurros de εt son prrobables; es d decir, ayuda a "explicar" la varianza in nexplicada en la ecuación de regresión. El modelo comb binado de reg gresión y seriees de tiempo es: e (19.1 14) donde ηt es un u término deel error distrib buido en formaa normal que puede tener una u varianza differente de εt. Es probablee que este m modelo propo orcione mejorres pronósticos que la ecuació ón de regresió ón en la ecuacción (19.13) so ola o un modeelo de series dee tiempo solo o dado que incluye i tanto una explicacción estructurral (económica) de esa partte de la variaanza de yt que puede expllicarse desde el punto de vista estructuraal como una "explicación"" de series dee tiempo de esa e parte de la varianza v de yt que no puede explicarse eestructuralmeente. La ecuaación (19.14)) es un ejemp plo de lo quee en ocasionees se denomiina modelo defun nción de transfferencia o, de manera m alternattiva, modelo de promedio au utorregresivo móvil m multivariiado (modelo MARMA). M Un n modelo de función f de tran nsferencia relaaciona una vaariable depend diente con vallores rezagados de sí mism ma, valores actu uales y rezagad dos de una o más m variables independienttes y un término del error quee es "explicad do" en forma parcial p por un n modelo de series de tiemp po. Por tanto, la forma geeneral para un u modelo de d función de d transferenccia univariado (sólo ( una variiable indepen ndiente) puedee escribirse co omo: (19.1 15) La técnica de d modelado de función de d transferenccia implica ell examen de las l funciones dee autocorrelacción parcial y total para la variable indeependiente xt así a como de laa variable d dependiente y t en un esffuerzo para especificar e l los polinomios rezagados r v(B B), ω(B), ф(B)) y θ(B).4 Un problema con n la técnica, sin embargo, ess que la especiificación de laa parte estructtural del modeelo, es decir, llos polinomios v(B) y ω(B), se hace de manera m mecániica en lugar de d apelando a la teoría econó ómica y a la llógica. Los modelos m estruccturales que son s consistenttes con la intu uición y la teoría económ mica en geneeral son máss confiables (y defendibles)) que los mod delos en los qu ue se llega a la estructura en forma meccánica. Por esta razón sugeerimos que cu uando se usen n modelos de la l forma de laa 4 Las técnicas se exponen con detalle en G. E. P. Box y G. M. M Jenkins, Time Series Analysis (S San Francisco: Holden-Day, 1970), capítulos 10 y 11, 1 y en general en C. W. J. Gran nger y P. Newboold, Forecasting Ecoonomic Time Seriies, 2a. ed. (Nuevaa York: Academicc Press, 1986).
I
CAPÍTULO 19: Aplicaciones de los modelos de series de tiempo
619
ecuación (19.15) se llegue a la parte estructural del modelo por medio de una mezcla de la teoría económica y el método econométrico expuestos en la parte uno de este libro, mientras que a la parte de la serie de tiempo del modelo, es decir, ф(B) y θ(B), se llegue por medio de un análisis de los residuales del modelo estructural. Ahora regresaremos al modelo simple de la ecuación (19.14). Primero, nótese que la especificación de un modelo de series de tiempo para el término del error es sólo una generalización de la técnica descrita en el capítulo 8 para el pronóstico con modelos de regresión que tienen errores correlacionados serialmente. [Si el modelo de series de tiempo es AR( 1), es exactamente equivalente a pronosticar con errores correlacionados serialmente de primer orden.] Segundo, nótese que los parámetros a0, a1 y a2 de la ecuación de regresión estructural y los parámetros ф1,. . ., фp, θ1, …, θq del modelo de series de tiempo deberán estimarse en forma simultánea. (La falla en estimar todos los parámetros en forma simultánea puede conducir a una pérdida de eficiencia.) Por desgracia, la estimación simultánea de todos los parámetros en ocasiones es difícil desde el punto de vista computacional y en tales casos a menudo no se hace. Este uso combinado del análisis de regresión con un modelo de series de tiempo del término del error es un enfoque del pronóstico que en algunos casos puede proporcionar lo mejor de dos mundos. Para demostrar la técnica y su uso, veremos dos ejemplos.
19.5
UN MODELO COMBINADO DE REGRESIÓN Y SERIES DE TIEMPO PARA PRONÓSTICO DE FLUJOS DE DEPÓSITO DE AHORROS A CORTO PLAZO El primer ejemplo que combina análisis de series de tiempo con análisis de regresión se basa en un estudio de Ludwig5 para pronosticar el flujo mensual de depósitos en los bancos mutualistas de Massachusetts. Primero se construye un modelo de regresión (para explicar los flujos de depósitos), y luego se elabora un modelo de series de tiempo para "explicar" la serie residual (es decir, el término del error) en la ecuación de regresión.6 Comenzaremos con una ecuación de regresión que proporciona una explicación estructural de los flujos de depósitos de ahorros mutualistas. Ludwig usó la razón de flujos de depósitos S para la riqueza personal W como la variable dependiente. Y eligió el ingreso personal mensual de Massachusetts como una variable sustituía para la riqueza. Su mejor ecuación de regresión tenía tres variables explicativas: el porcentaje de rendimientos efectivos (incluyendo divi5 R. S. Ludwig, "Forecasting Short-Term Savings Deposit Flows: An Application of Time Series Models and a Regional Analysis", tesis de maestría sin publicar, Sloan School of Management, M.I.T., junio de 1974. 6 En el momento en que se hizo este estudio, la estimación simultánea de los parámetros de regresión y de series de tiempo era difícil desde el punto de vista computacional y por tanto no se realizó.
620
P PARTE CUATRO: Modelos M de seriess de tiempo
dendos) sobre los depósitoos de ahorros mutuos m rms, laa tasa de interés de bonos de d tesorería a trees meses rm y la razón de laa reserva del mes m anterior de d los depósitoos de ahorros mutuos m A-1 coon la variable de la riqueeza. Su ecuacción, estimadda usando datoss mensuales ppara el estado de Massachuusetts durantee el periodo de d febrero de 19968 a junio dee 1973, es:
Como se espperaría, hay una u relación positiva entree los flujos de d depósito de d ahorros y el porcentaje dee rendimiento o efectivo sobbre los depósittos. La tasa de d interés de boonos de tesoreería a tres meses, usada coomo tasa de innterés del merrcado, represeenta el rendim miento de alteernativas de innversión comp petitivas librees de riesgo para los ahorros y por tanto tenndría un impaacto negativo en e los flujos de d depósito de ahorros. a Por úlltimo, la relacción negativa eentre los flujos de depósito y la reserva de depósitos reppresenta un effecto de ajustee de la reservaa; los depósitoos de ahorros deeberían ser prroporcionales a esa parte dee la riqueza peersonal que no n se ha colocad do en una cueenta de ahorrros; es decir, (19.177) de modo quee:
(19.188) Una sim mulación históórica de la eccuación (19.116) se muestrra en la figuraa 19.12, y un pronóstico p ex ppost del perio odo de julio dee 1973 a octubbre de 1973 se
Figura 19.12 Simulación n histórica de la ecuación (19.16) para flujos de depósito.
CA APÍTULO 19: Aplic caciones de los mo odelos de series de e tiempo
621
Figura 19.13 Pronóstico exx post de flujos de depó ósito.
muestra m en la figura f 19.13. La L simulaciónn histórica tiene un error de d porcentaje rm ms de 75.1, y el pronósticoo ex post tienne un error de d porcentaje rms de 157. Obbsérvese que la simulaciónn sigue la traayectoria del m movimiento general g de la seerie pero deja mucha m de la vvarianza inexplicada. El moddelo de regressión funciona biien para pronoosticar los fluj ujos de depósito en julio de 1973 pero faalla en captar el descenso abrrupto en los depósitos d en agosto a de ese año. Ahora intentaremos mejjorar el pronó óstico construuyendo un modelo de seriees de tiempo para la serie residual de laa ecuación de regresión. Laa función de auutocorrelaciónn muestral paara la serie reesidual se muuestra en la figura f 19.14. Obbsérvese que las correlaciiones de ordeen superior see amortiguann hacia 0, de m modo que la serie residuaal puede conssiderarse estaacionaria. La función de auuto-correlación contiene, siin embargo, máximos m en loos rezagos meensuales que soon múltiplos de d 12, lo que indica estacionnalidad anuall. La figura 199.15 presenta la función de au utocorrelaciónn muestral parra una diferenccia de 12 meses de la serie
Figura 19.14 Función de autocorrelació ón de residuales ut de d la ecuación (19.16).
41
51
622
PARTE P CUATRO: Modelos de series s de tiempo
Figura 19. 15
Función de e autocorrela ación de diferencia de d 12 meses de residualles
(1 – B12)u ) t
residual origginal; es decir, para la seriee (1 – B12)ut. Esta E función de d autocorrelaación tiene unna forma sinuusoidal amorrtiguada que es e indicativa de un processo autorregresiv vo puro de orrden 2 o mayoor. Ludwig estimó una vaariedad de moodelos autorreegresivos paraa esta serie reesidual y encontró que el mejor m era:
el cual en suu forma expanndida y estim mada es: (1 - .736B - .025B 2 - .0055B 3 - .009 B 4 + .310B 5 - .128B 6 - . 782B 12 1 + .532B13 + .081B14 + .125B15 - .213B16 - .103B B17 - .060B18)uut = ηt
(19.19) R2 = .78
X
2
= 14. 5
Una sim mulación histórica de un sollo modelo de series de tiem mpo se muestrra en la figuraa 19.16. Obséérvese que laa serie residuual se reprodduce en form ma cercana. Ahora ell modelo de seeries de tiemp po para la serie residual pueede combinarsse con el modello de regresióón de la ecuacción (19.16). U Una simulacióón histórica del modelo com mbinado de reegresión y seeries de tiemppo se presentta en la figurra 19.17. Nótesse que los deppósitos de ahoorros son rasttreados muchoo más de cercca que antes. En n efecto, el errror de porcen ntaje rms se hha reducido por un factor de d más de 3 a 29.3. 2
CA APÍTULO 19: Aplic caciones de los mo odelos de series de tiempo
623 3
Figura 19.16 Simulación histórica del modelo de e series de tiempo para residuales.
Figura 19.17 Simulación hiistórica de un modelo co ombinado de regresión y series de tiempo para flujos f de depósito de ahorros. a
Finalmentee, se hace un pronóstico p exx post de los fllujos de ahorrros usando el modelo m combin nado de regreesión y series de tiempo, dee nuevo para el e periodo de cuuatro meses de d julio de 19973 a octubree de 1973. Este pronósticoo, el cual se muestra m en la fiigura 19.18, está más cerca de los datos rreales que cuan ndo se usó el modelo m de regrresión solo. ((El error de porcentaje rmss se ha reduciido de 157 a 1118.) Aunque el pronóstico no capta la extensión e del viraje descenndente en los fluujos de depóssito de ahorross en agosto dee 1973, capta los l movimienttos generales enn la variable.
624
P PARTE CUATRO: Modelos de seriess de tiempo
Figura 19.1 18
Pronóstico ex post de flujos de de epósito de ahorros usando un modelo combinado de regresión y series de tiempo.
19.6
UN MODE ELO COMBI NADO DE R REGRESIÓN N Y SERIES S DE TIEMPO O PARA PRO ONÓSTICO DE D TASAS D DE INTERÉS S Como segundo ejemplo deel uso combinnado del análissis de regresió ón con modeloos de series dee tiempo, connstruimos un modelo paraa pronosticar, con una basse mensual, la tasa t de interéss de los bonos de tesorería a tres meses. Comenzaremo C os con un modeelo de regresiión que expliique la tasa dde interés com mo una funcióón de la produccción industriaal, la inflación y la tasa de crrecimiento deel suministro de d dinero. Desp pués examinaaremos los residuales de eese modelo y ajustaremos a ellos un moddelo ARIMA. Por último, reestimaremos r s en forma sim multánea todoos los parámetro os del modeloo combinado de regresión y series de tieempo (un passo que no realizzamos en el ejemplo e anterrior). Comenzaremos con la regresión de la tasa de innterés que elaaboramos en el e ejemplo 8.2. Recuérdese qque en esa reggresión relacioonamos la tassa de interés dde bonos de tesoorería a tres m meses (R3) conn el índice de pproducción inndustrial (IP), la l tasa de creccimiento del suministro dee dinero defiinido en form ma amplia M M2 [GM2t = (M M2t - M2t-1)/M M2t-1], y la taasa rezagada de inflación n de precios al a mayoreo, GP PW = (PWt - PWt-1)/PWt--1, donde PW W es el índicee de Precios al a Productor paara todas las mercancías. Las L estimacioones OLS de esta ecuaciónn, usando datoss para el perioddo de enero dee 1960 a agostto de 1995, son n las siguientees (las estadístiicas t están enntre paréntesiis): R3t = 1.2141 + .00484IPt + 1400.33GM2t + 1104.59GPWt-1 (2.20)
R2 = .216
(8.79)
s = 2.481
(3.89)
(6.00)
(19.20))
F = 39.02 DW = 0..18
La figuraa 19.19 muesttra las series real r y ajustadaa, junto con lo os residuales de d la regresión. Nótese que loos residuales parecen tenerr un alto grado o de autocorreelación; esto no n nos sorpreende dada la estadística e de Durbin-Watsson muy baja..
CA APÍTULO 19: Aplica aciones de los mo odelos de series de e tiempo
625
Figura 19.19 Tasa de bonoss de tesorería a tress meses: real, ajustada y residuales.
(E En efecto, enccontramos en el ejemplo 8.3 8 que podríaamos mejorarr de manera siggnificativa el desempeño dee pronóstico de d esta ecuaciión de regresióón explicando o la correlacióón serial de prrimer orden.) También seññalamos que el e modelo se ajuusta a los datoos de manera aceptable durante las décaadas de 1960 y 1970 pero se desempeña mal m durante prrincipios de laa década de 11980 y la décaada de 1990. Exxaminaremos ahora los reesiduales de esta regresióón. La figuraa 19.20 presenta la funciónn de autocorrrelación muesstral para los rresiduales, loos cuales decliinan en formaa constante haacia cero, lo que q es indicattivo de una seerie estado-
Figura 19.20 Residuales de regresión: funcción de autocorrelació ón muestral.
626
P PARTE CUATRO: Modelos de seriess de tiempo
Figura 19.2 21 Primeras diferencias d de residua ales de regresión: función de autocorrela ación muestral.
naria. La figgura 19.21 muuestra la funcción de autocoorrelación muuestral para loos residuales deespués de quee han sido differenciados por primera veez; ahora todaas las autocorrrelaciones esttán cerca de cero. Trabajjaremos con los residualees indiferenciaddos. Despuéss de hacer algguna experim mentación, ajuustamos el sigguiente modello ARIMA(8, 0, 0 2) a la seriee de residualees, los cuales ddenotamos coon ut: (1 - .9089B B + .62 3B2 - .4769B3 + .00854B 4 - .24888B5 + .17800B 6 - .0494B B 7 - .1410B8) ut = -.1411 + (1 - .1981B B + .6076B 2)ηt R2 = .846
(19.21))
X2(10, 36) = 32.22
Con 36 - 10 = 26 grados dde libertad, la estadística e ji ccuadrada es innsignificante en e el nivel del 90%, 9 de modoo que podemoss aceptar la hiipótesis de quee los residualees de este modeelo ARIMA son s ruido blannco. Ahora teenemos una eespecificaciónn ARIMA parra los residuaales que parecce ajustarse bieen. Sin embarggo, en lugar de d usar este m modelo ARIM MA junto con el modelo de reegresión tal como c están, combinamos los dos y reesstimamos todoos los parámetrros en forma simultánea. En E otras palabbras, estimam mos los parámeetros del siguiente modelo: (19.222) donde ф(B) = 1 – ф 1B− ф2 B2 −…− ф 8B8 y θ(B) = 1 – θ1 B− θ2 B2 . Loos resultados
de esta estim mación son loss siguientes:
CAPÍTULO 19: Aplicacciones de los mode elos de series de tiempo t
627
Nó ótese que la R2 ahora es muucho mayor y que la DW está muy cercca de 2. Las auttocorrelacionees muéstraless para los residduales de estaa ecuación (noo mostradas aquí) están todaas muy cercaa de cero, de modo que loos residuales parecen ser ruiido blanco. En la figuraa 19.22 se preesentan las seeries de tasa dde interés aju ustada y real asíí como los ressiduales. A diiferencia del modelo m de reggresión simplee con el que em mpezamos, el ajuste de estaa ecuación es excelente a llo largo del peeriodo de la muuestra, y los residuales r no exhiben autoccorrelación.7 La figura 19.23 muestra un pronósticco de la tasa dde interés paraa el periodo de 14 meses dee enero de 19995 a febrero de 1996. (Nóótese que los primeros 8 meeses de este pronóstico p inccluyen el periiodo muestrall usado en la estimación, miientras que los restantes 6 m meses no.) Loos valores proonosticados dee la tasa de
Figura 19.22 Modelo combinado de regresión y serries de tiempo: real, ajustado a y residuales.
7 Los residualles, sin embargo, exhiben heteroocedasticidad autoorregresiva cond dicional. Podría corrregirse esto incluuyendo una especcificación ARCH o GARCH para los l errores, como o se comentó en el capítulo c 10. Hem mos elegido no haacerlo para conserrvar simple este ejemplo. e
628
P PARTE CUATRO: Modelos de serie es de tiempo
Figura 19.23
Modelo co ombinado de regresión y series de tiempo: prronóstico de 14 meses..
Figura 19 9.24 Modelo co ombinado de regresión y series de tiempo: pronóstico de 6 meses.
CAPÍTULO 19: Aplicaciones de los modelos de series de tiempo
629
interés generalmente están cerca de los valores reales. Por último, la figura 19.24 presenta un pronóstico de 6 meses fuera de la muestra para el periodo de septiembre de 1995 a febrero de 1996. Nótese que la serie pronosticada rastrea a la serie real hasta los últimos 2 meses, cuando diverge de manera significativa. EJERCICIO 19.1 Los datos para la inversión en inventarios no agrícolas se reproducen en el cuadro 19.1. a) Trate de elaborar un modelo ARIMA que mejore el desempeño de pronóstico del presentado en la sección 19.2. b) Elabore su propio modelo combinado de regresión y series de tiempo de la inversión en inventarios. ¿Puede mejorar el desempeño de pronóstico del modelo ARIMA puro?
CUADRO 19.1 INVERSIÓN EN INVENTARIOS NO AGRÍCOLAS REAL
Obs. 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977
Obs. 34.60 -10.20 26.30 17.00 19.60 38.20 41.40 39.90 15.40 29.70 0.40 25.50 14.40 47.00 35.00 -39.50 31.10 28.40
6.90 2.30 17.00 14.90 19.30 26.00 43.60 15.00 27.70 24.30 11.60 18.70 27.40 29.20 27.70 -32.80 42.50 30.30
Fuente: Citibase, serie GVUQ.
10.80 18.10 19.70 21.20 18.70 25.60 39.70 30.80 23.00 33.90 19.80 18.80 35.80 22.20 11.00 -0.70 29.90 47.50
-17.10 14.50 9.30 12.70 20.30 21.10 53.90 32.50 25.60 21.40 1.20 9.10 24.00 55.60 53.70 -1.10 25.00 20.70
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
48.30 28.80 13.20 37.40 -29.00 -29.70 83.50 20.70 50.50 36.30 16.80 36.20 10.90 -15.00 -7.80 26.00 29.80 58.10
42.80 34.40 6.80 -0.20 -9.60 5.30 72.50 23.50 27.60 27.40 17.70 37.80 39.20 -23.40 1.50 26.70 54.10 33.80
30.30 44.20 7.20 6.60 -27.90 1.90 35.90 18.30 -4.90 -47.90 35.90 36.90 72.60 47.80 16.10 32.90 -12.70 -15.60 7.70 65.60 25.50 38.80 30.40 29.60 6.70 -25.90 13.60 19.90 6.80 7.20 30.90 22.10 50.10 53.30 38.30 23.60
TABLAS ESTADÍSTICAS TABLA 1 DISTRIBUCIÓN NORMAL ESTANDARIZADA
z
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0
.5000 .4602 .4207 .3821 .3446 .3085 .2743 .2420 .2119 .1841 .1587 .1357 .1151 .0968 .0808 .0668 .0548 .0446 .0359 .0287 .0228 .0179 .0139 .0107 .0082 .0062 .0047 .0035 .0026 .0019 .0013
.4960 .4562 .4168 .3873 .3409 .3050 .2709 .2389 .2090 .1814 .1562 .1335 .1131 .0951 .0793 .0655 .0537 .0436 .0351 .0281 .0222 .0174 .0136 .0104 .0080 .0060 .0045 .0034 .0025 .0018 .0013
.4920 .4522 .4129 .3745 .3372 .3015 .2676 .2358 .2061 .1788 .1539 .1314 .1112 .0934 .0778 .0643 .0526 .0427 .0344 .0274 .0217 .0170 .0132 .0102 .0078 .0059 .0044 .0033 .0024 .0018 .0013
.4880 .4483 .4090 .3707 .3336 .2981 .2643 .2327 .2033 .1762 .1515 .1292 .1093 .0918 .0764 .0630 .0516 .0418 .0366 .0268 .0212 .0166 .0129 .0099 .0075 .0057 .0043 .0032 .0023 .0017 .0012
.4840 .4443 .4052 .3669 .3300 .2946 .2611 .2296 .2005 .1736 .1492 .1271 .1075 .0901 .0749 .0618 .0505 .0409 .0329 .0262 .0207 .0162 .0125 .0096 .0073 .0055 .0041 .0031 .0023 .0016 .0012
.4801 .4404 .4013 .3632 .3264 .2912 .2578 .2266 .1977 .1711 .1469 .1251 .1056 .0885 .0735 .0606 .0495 .0401 .0322 .0256 .0202 .0158 .0122 .0094 .0071 .0054 .0040 .0030 .0022 .0016 .0011
.4761 .4364 .3974 .3594 .3228 .2877 .2546 .2236 .1949 .1685 .1446 .1230 .1038 .0869 .0721 .0594 .0485 .0392 .0314 .0250 .0197 .0154 .0119 .0091 .0069 .0052 .0039 .0029 .0021 .0015 .0011
.4721 .4325 .3936 .3557 .3192 .2843 .2514 .2206 .1922 .1660 .1423 .1210 .1020 .0853 .0708 .0582 .0475 .0384 .0307 .0244 .0192 .0150 .0116 .0089 .0068 .0051 .0038 .0028 .0020 .0015 .0010
.4681 .4686 .3897 .3520 .3156 .2810 .2483 .2217 .1894 .1635 .1401 .1190 .1003 .0838 .0694 .0571 .0465 .0375 .0301 .0239 .0188 .0146 .0113 .0087 .0066 .0049 .0037 .0027 .0020 .0014 .0011
.4641 .4247 .3859 .3483 .3121 .2776 .2451 .2148 .1867 .1611 .1379 .1170 .0985 .0823 .0681 .0559 .0455 .0367 .0294 .0233 .0183 .0143 .0110 .0084 .0064 .0048 .0036 .0026 .0019 .0014 .0010
La tabla presenta la probabilidad acumulativa Z≥ z. Fuente: Producido de Edward J. Kane, Economic Statistics and Econometrics: An Introduction to Quantitative Economics (Nueva York: Harper & Row, 1968).
631
TABLA 2 PERCENTILES DE LA DISTRIBUCIÓN χ2
Tablas estadísticas
TABLA 3 PERCENTILES DE LA DISTRIBUCIÓN t
Pr df
.80
.60
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120
.325 .289 .277 .271 .267 .265 .263 .262 .261 .260 .260 .259 .259 .258 .258 .258 .257 .257 .257 .257 .257 .256 .256 .256 .256 .256 .256 .256 .256 .256 .255 .254 .254 .253
.727 .617 .584 .569 .559 .553 .549 .546 .543 .542 .540 .539 .538 .537 .536 .535 .534 .534 .533 .533 .532 .532 .532 .531 .531 .531 .531 .530 .530 .530 .529 .527 .526 .524
00
.40 1.376 1.061 .978 .941 .920 .906 .896 .889 .883 .879 .876 .873 .870 .868 .866 .865 .863 .862 .861 .860 .859 .858 .858 .857 .856 .856 .855 .855 .854 .854 .851 .848 .845 .842
.20 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1;350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.303 1.296 1.289 1.282
.10 3.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 .796 1.782 1.771 .761 .753 1.746 .740 .734 .729 .725 .721 .717 1.714 1.711 1.708 .706 .703 .701 1.699 1.697 1.684 1.671 1.658 1.645
.05 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.021 2.000 1.980 1.960
.02 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.390 2.358 2.326
.01 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.660 2.617 2.576
Nota: Pr representa la probabilidad de que el valor / excederá cada número en la tabla en valor absoluto. Esto es apropiado para pruebas bilaterales. Para pruebas unilaterales tan sólo divida cada probabilidad a la mitad. Por ejemplo, .325 en la fila 1, columna 1, nos dice que la probabilidad de que f sea menor que -.325 o mayor que .325 es .8. Fuente: Obtenida de la tabla III de Fisher y Yates, Statistical Tables for Biological, Agricultural and Medical Research, con la autorización de los autores y editores (Edimburgo: Oliver & Boyd, Ltd.).
633
634
Tablas estadísticas
TABLA 4a DISTRIBUCIÓN F, SIGNIFICANCIA DEL 5%
Fuente: Reproducido con autorización de Fideicomisarios Biometrika de M. Merrington y C. M. Thompson, "Tables of Percentage Points of the Inverted Beta (F) Distribution", Biometrika, vol. 33, p. 73, 1943.
Tablas estadísticas
Grados de libertad para el numerador 10
12
15
242
244
246
19.4 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54 2.49 2.45 2.41 2.39 2.35 2.32 2.30 2.27 2.25 2.24 2.16 2.08 1.99 1.91 1.83
19.4 8.74 5.91 4.68 4.00 3.57 3.28 3.07 2.91 2.79 2.69 2.60 2.53 2.48 2.42 2.38 2.34 2.31 2.28 2.25 2.23 2.20 2.18 2.16 2.09 2.00 1.92 1.83 1,75
19.4 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.18 2.15 2.13 2.11 2.09 2.01 1.92 1.84 1.75 1.67
20
24
30
40
60
248
249
19.5 8.66 5.80 4.56 3.87 3.44 3.15 2.94 2.77 2.65 2.54 2.46 2.39 2.33 2.28 2.23 2.19 2.16 2.12 2.10 2.07 2.05 2.03 2.01 1.93 1.84 1.75 1.66 1.57
19.5 8.64 5.77 4.53 3.84 3.41 3.12 2.90 2.74 2.61 2.51 2.42 2.35 2.29 2.24 2.19 2.15 2.11 2.08 2.05 2.03 2.01 1.98 1.96 1.89 1.79 1.70 1.61 1.52
250
251
252
253
19.5 8.62 5.75 4.50 3.81 3.38 3.08 2.86 2.70 2.57 2.47 2.38 2.31 2.25 2.19 2.15 2.11 2.07 2.04 2.01 1.98 1.96 1.94 1.92 1.84 1.74 1.65 1.55 1.46
9.5
19.5 8.57 5.69 4.43 3.74 3.30 3.01 2.79 2.62 2.49 2.38 2.30 2.22 2.16 2.11 2.06 2.02 1.98 1.95 1.92 1.89 1.86 1.84 1.82 1.74 1.64 1.53 1.43 1.32
19.5 8.55 5.66 4.40 3.70 3.27 2.97 2.75 2.58 2.45 2.34 2.25 2.18 2.11 2.06 2.01 1.97 1.93 1.90 1.87 1.84 1.81 1.79 1.77 1.68 1.58 1.47 1.35 1.22
3.59 5.72 J.46 5.77 3.34 3.04 2.83 2.66 2.53 2.43 2.34 2.27 2.20 2.15 2.10 2.06 2.03 .99 .96 .94 .91 .89 .87
1.79 1.69 .59
.50 .39
120 254
19.5
853
5.63 4.37 3.67 3.23 2.93 2.71 2.54 2.40 2.30 2.21 2.13 2.07 2.01 1.96 1.92 1.88 1.84 1.81 1.78 1.76 1.73 1.71 1.62 1.51 1.39 1.25 1.00
635
636
Tablas estadísticas
TABLA 4b DISTRIBUCIÓN F, SIGNIFICANCIA DEL 1% Grados de libertad para el numerador 1
2
3
4
5
6
7
5 000 99.0 30.8 18.0 13.3 10.9 9.55 8.65 8.02 7.56 7.21 6.93 6.70 5.51 6.36 6.23 6.11
5 403 99.2 29.5 16.7 12.1 9.78 8.45 7.59 6.99 6.55 6.22 5.95 5.74 5.56 5.42 5.29 5.19
5 625 99.2 28.7 16.0 11.4 9.15 7.85 7.01 6.42 5.99 5.67 5.41 5.21 5.04 4.89 4.77 4.67
5 746 99.3 28.2 15.5 11.0 8.75 7.46 6.63 6.06 5.64 5.32 5.06 4.97 4.70 4.56 4.44 4.34
5 859 99.3 27.9 15.2 10.7 8.47 7.19 6.37 5.80 5.39 5.07 4.82 4.62 4.46 4.32 4.20 4.10
5 928 99.4 27.7 15.0 10.5 8.26 6.99 6.18 5.61 5.20 4.89 4.64 4.44 4.28 4.14 4.03 3.93
8
5 982 99.4 27.5 14.8 10.3 8.10 6.84 6.03 5.47 5.06 4.74 4.50 4.30 4.14 4.00 3.89 3.79
9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
4 052 98.5 34.1 21.2 16.3 13.7 12.2 11.3 10.6 10.0 9.65 9.33 9.07 8.86 8.68 8.53 8.40
6 023 99.4 27.3 14.7 10.2 7.98 6.72 5.91 5.35 4.94 4.63 4.39 4.19 4.03 3.89 3.78 3.68
18
8.29
6.01
5.09
4.58
4.25
4.01
3.84
3.71
3.60
19 20
8.19 8.10
5.93 5.85
5.01 4.94
4.50 4.43
4.17 4.10
3.94 3.87
3.77 á.70
3.63 3.56
3.52 3.46
21 22 23 24 25
8.02 7.95 7.88 7.82 7.77
5.78 5.72 5.66 5.61 5.57
4.87 4.82 4.76 4.72 4.68
4.37 4.31 4.26 4.22 4.18
4.04 3.99 3.94 3.90 3.86
3.81 3.76 3.71 3.67 3.63
3.64 3.59 3.54 3.50 3.46
3.51 3.45 3.41 3.36 3.32
3.40 3.35 3.30 3.26 3.22
30 40 60 120 °°
7.56 7.31 7.08 6.85 6.63
5.39 5.18 4.98 4.79 4.61
4.51 4.31 4.13 3.95 3.78
4.02 3.83 3.65 3.48 3.32
3.70 3.51 3.34 3.17 3.02
3.47 3.29 3.12 2.96 2.80
3.30 3.12 2.95 2.79 2.64
3.17 2.99 2.82 2.66 2.51
3.07 2.89 2.72 2.56 2.41
Tablas estadísticas
637
638
Tablas estadísticas
TABLA5
SOLUCIONES A PROBLLEMAS SELEC CTOS
1..1 a) La línea de d regresión es Y = 1.17 + 1.772X. b) La pendieente nos dice qu ue en promedio o un incremento o de 1 millón de dólares en laa cantidad de dinero d conduciirá a un increm mento de 1.72 millones de dólares en el in ngreso nacionall. Interpretado en e forma literall, el intercepto nos dice que sii el suministro o de dinero caee hasta cero, el ingreso nacion nal sería de 1.1 17 millones de dólares. Sin em mbargo, en vistta de que no haay observacion nes disponibles para valores de X cerca de ceero, no podemo os confiar en una u interpretaciión así. c) Estableceeríamos el sum ministro de dineero en 6.3 millo ones de dólaress. 1..3 a) La pendiente será redu ucida por un faactor de 10, y eel intercepto permanecerá p in nalterado. b) Para evalluar los efectoss de la transforrmación sobre la pendiente y el intercepto, su ustituya las ecu uaciones que deescriben las varriables transform madas en los estimadores e de mínimos m cuadrad dos:
(Deberá ( verificaar que taal, resulta que
Despuéss de algo de álg gebra elemen-
1..4 El intercepto o y la pendientee de mínimos cu uadrados son in ndefinidos. Cuando todas las 2 ob bservaciones dee la variable ind dependiente son n idénticas, Σxi es e igual a cero. Ya Y que no hay caambio en la variable independiente (en la muestra), es impossible decir cóm mo respondería laa variable depen ndiente a un caambio en la vaariable indepen ndiente.
639
640
Soluciones a problemas selectoos
1.7 a) b)
Dado que Prob P (|Z| > 1.966) = .05 a partiir de la tabla noormal, fracasam mos en rechazaar la hipótesis nula.
Dado que Prob P (| t | > 2.0042) = .05 a parrtir de la tabla t, de nuevo fracaasamos en rechazar laa hipótesis nulaa. 2.4 La estaadística correccta es:
Usando unna tabla normall, rechazamos con c un nivel dee significancia del d 5%. 2.6 La estaadística correctta es:
Usando unna tabla ji cuaddrada, fracasam mos en rechazaar la hipótesis nula. n 2.9 Prob (X ≥ 30) = .21119. 2.12 [(X - µ)/σ] µ 2 sigue unna distribución ji j cuadrada. 3.1 s2 = .14 4 y tc = 2.3. Poor consiguiente, el intervalo de confianza del 95% 9 para el intercepto es: 1.17 ± (2.3)(.484) = 1.17 ± 1.11 = (.06,2.28)) El intervalo dde confianza del 95% para laa pendiente es: 1.72 ± (2.3)(.126)) = 1.72 ± .299 = (1.43, 2.01) Sí, puede p rechazarr la hipótesis nuula en ambos ccasos.
Soluciiones a problemass selectos
2
2
2
2
641 1
2
3.4 3 R2 = bˆ2 Σxi / Σxi . Si R2 = 1, ˆb2 = Σxi / Σxi . Pero, por consstrucción, bˆ = Σxiyi/Σxi . Por consiguiente c
Por consigguiente, Σxiεˆi =
33.8 2 2 βˆΣxi − βˆΣxi =0 . *
*
33.9 yi = a2yi xi = b2xi (dadoo que l os datos transfformados
Entoncces, a partir de
P Pero a partir del ejercicio 1.3, βˆ*2 = (a2/b2)2βˆ2. Su ustituyendo, enccontramos que (R R*)2 =R2. 3.10 3 a) B es la pendiente p de la línea que pasa por los puntos (X ¯1 , ¯ Y1) y (X ¯2 , ¯ Y2). Dividir loss datos d en dos grupos g es suficciente para aju ustar una líneaa recta, lo cuaal produce unaa estimación e de la l pendiente. b) B no ess igual a βˆ, pero es un estimador insesgado de β:
c) Sabemo os que Var (B)) ≥ Var (βˆ ) a partir p del teorema de Gauss-M Markov, el cuaal eestablece que βˆ es el mejor esstimador lineal insesgado de β.. (Es fácil mosttrar que B es un n e estimador lin neal.) En est e caso particcular Var (B ) = .157σ 2 , mientras quee V (βˆ) = .115σ 2 . Var 4.1 a) Supongaamos que Zi = Yi -X2i; entoncess por sustitució 4 ón en las ecuaciiones (4.3) a ( (4.5),
Del D mismo moddo b) En el mo delo I
642
So oluciones a problemas selectos
E el modelo II En I
c) en el modelo I, y en e el modelo III. En virtud de que E q los residualles de la regressión son idénticcos, la relación n entre R2 y R''2 d dependerá en forma f directa de d la relación entre e la varianzza de Y y la varianza de Z. 4.2 4 A partir de la regresión X22i =α1+ α2 X3i + ε ′i , los residu uales εˆ ′i = X2i - αˆ 1- αˆ 2 X3i. Susstituyendo t en la regresión Yi = β ′i + β ′2 εˆ i + β ′3 X3i + ε *i , enccontramos que Yi =(β1 - β ′2 αˆ 1) + β ′2 X2i + (β ′3 - β ′2 αˆ2) X3i + ε *i. Comparando esto e con la regrresión original resulta r claro quee βˆ2' = βˆ2. (εˆi mide e la porción de X2i que no está correlacionada con X3i.) 4.4 4 Cada coeficciente estandarrizado será iguaal al parámetro de regresión co orrespondientee, excepto e por el intercepto, el ccual no existe. 4 En el modeelo de dos variiables, 4.7
Por P tanto, βˆ2 proporciona p unaa estimación de d la elasticidad d de Y con resspecto a X2. Lo o análogo a resultaa cumplirse paara βˆ 3. Estas ellasticidades son n constantes deebido a que laas estimaciones e d la pendientee de mínimos cuadrados de c son cconstantes. 5.2 a) t = 3.02 5 2 (en el coeficiiente ROOM PER), de modo que rechazamo os la hipótesis n nula usando un na prueba unil ateral. b) t = -1.35 (en el coeficiente DIST), de d modo que fraacasamos en reechazar usando o una u prueba unilateral. c) t = 1.2 1, de modo qu ue fracasamos en rechazar. La L prueba F co orrespondiente conduce c a un resultado r idénttico. 5.3 a) t = -.96 5 6 (en el coeficieente [(ROOM PER)(SEX)]), de modo que fracasamos en r rechazar. b) Calculaamos F = A/S, donde A = (ES SSI – ESSIII)/2 y B = ESSIII/26, de modo quee F = 2.61. Usand do una distribucción F con (2, 26) 2 grados de lib bertad, fracasam mos en rechazarr.
Solucionnes a problemas selectos s
643
6..2 Sí, podríamo os esperar que los términos de d error asociaddos con las com munidades conn gaastos educativoos elevados tenddrían varianzass mayores que los términos deel error asociadoos con comunidades con gastos educativoos bajos. Para uusar la pruebaa de GoldfeldQuandt, Q ordene las observacioones con respeccto a la medianna del ingreso en la comunidaad. 6..4 En estudioss de corte trannsversal por lo o general no hay h secuencia natural en los daatos, y no hay razón r para espeerar que los errrores asociados con diferentes observaciones esstarán correlaccionados. Sin embargo, e la coorrelación seriaal puede estar presente p si las ob bservaciones see relacionan geográficamente como en un moodelo regional de d crecimiento ecconómico o unn modelo metroopolitano de co omportamientoo del gobierno local. l 6..6 La estadísticca de prueba ess σˆ 2h ombre / σˆ 2m ujer= 1.47 que sigue una distrribución F con (119, 7) grados de d libertad. En el e nivel del 5% % fracasamos enn rechazar la hiipótesis nula. 7..1 El error de medición m en laa variable depeendiente da com mo resultado un u incremento en n la varianza deel error, pero een tanto el errorr de medición no n esté correlaccionado con la vaariable indepen ndiente, las esttimaciones de parámetro p seráán insesgadas y consistentes. Siin embargo, cu uando una variaable independieente se mide coon error, el erroor de medición esstará correlacioonado con la vvariable indepeendiente, causan ando que las esstimaciones de paarámetro estén n sesgadas y seean inconsistenntes.
Si z es un instru umento, el seguundo término se aproximará a cero conform me se haga más grrande el tamañño de la muestrra, pero el prim mer término se aproximará a β sólo cuando Σ izi / Σz2i se aprooxime a 1. Σx
3 2 Por consiguiente, la especificaación del sesgoo es igual a β3Σx Σ 2 i /Σx2i. Por tanto, t el coefi3 ciiente de la pend diente estará seesgado hacia arrriba cuando β3Σx2 i es posittivo y sesgado hacia abajo cuanndo β3Σx32i es negativo.
Sustituyendo S parra yi = β2x2i + εi y tomando loss valores esperaados, obtenemo os
644
So oluciones a problem mas selectos
9.3 Usando el tiempo como uun instrumento,, Xˆ T = αˆ 1 + - αˆ 2T y Xˆ 1 = X t , t = l , 2 , . . . , T - l , donde αˆ 2 = Σ xtt /Σt2. La estimación de d la pendientte de mínimo s cuadrados ees β = Σxˆt y t /Σxˆ 2t . Ahora, sustituuyendo yt = βxˆt + β(xt - xˆt ) + εt, obtenemos
si el tiempo es e un instrumeento apropiadoo. Sin embargoo, si el términno del error esstá correlacionado o serialmente, el e tiempo t y el error estarán coorrelacionados y la consistencia de βˆ desapareecerá. 9.4 La estadísstica de pruebaa apropiada es
donde ESS1 es e la suma de ccuadrados de lo os residuales ussando mínimoss cuadrados orddinarios y ESS2 es la suma dde cuadrados de d los residuales con el emppleo de variables indicadoras de d corte transveersal. 9.7 Usando una u especificación polinómicaa de segundo grado, g asumim mos que wi = C o + C 1i + C2i2
i = 00, 1, 2, 3
Sustituyendo en la especificcación original y combinandoo términos,
la cual puede estimarse usanndo mínimos cuuadrados ordinnarios si no hay y restricciones de d puntos extrem mos. Si las dos laterales se estaablecen igualess a cero, entoncces W-1= C0 – C1 + C2 = 0 y W4 = Co + 4C1 + 16C2 = 0. Resolviendo, encontrramos que C1 = -3C2 y Co = -4C C2. Entonces, poddemos reescribirr la ecuación orriginal que se vaa a estimar elim minando Co y C1
Con el uso dee mínimos cuaadrados se puedde estimar unoo de los pesos de rezago, y por p sustitución poodemos determ minar los dos reestantes.
Soluciones a problemass selectos
64 45
Las ecuacionees normales sonn:
La solución de d estas ecuacioones para α0, α1 y α2 requeriirían usualmennte un algoritm mo computarizadoo que linealicee de manera iteerativa las ecuaaciones normales alrededor de d valores para lo os parámetros. 11.1 Hay unaa varianza del eerror única asoociada con cadda observación n en Xi y Yi. Es imposible obteener una estimaación de cada varianza v del errror a partir de una u sola obser-vación residuaal. 11.2 Todos lo os coeficientes se duplicarán. Esto sugiere quue los parámetrros de mínimoss cuadrados esttimados son significativos só ólo con relacióón a la magnitu ud de los otross parámetros y a las unidades de la variable dependiente. 11.4 Suponga que existe unn índice Zi, unaa función lineaal de los atribuutos de la iésim ma comunidad, laa cual mide la pprobabilidad dee que una comuunidad incumplla. Asociada coon cada comunid dad hay una vaariable aleatoriia distribuida een forma norm mal Zi* que determina el punto de corte entre incumplir y cu umplir. Entoncces, el modelo probit p producirrá probabilidadess pronosticadass que caen denntro del intervallo (0, 1), pero necesita un proocedimiento dee estimación noo lineal. 11.6 La línea de d regresión es Ŷ = 12 + 38 X , R2 = .75, y el núm mero de clasificaaciones correctaas es cinco. 12.4 Los mínimos cuadradoos ordinarios producirán p estim maciones sesgaadas e inconsistentes de los parámetros p en lla primera ecuaación. Los mínnimos cuadrado os indirectos, laas variables instrrumentales y loos mínimos cuaadrados de doss etapas produccen estimacionees de parámetro sesgadas peroo consistentes (hay dos estiimaciones possibles para cadda parámetro en el caso de mínnimos cuadradoos indirectos). Sin embargo, la l estimación dde mínimos cuadrrados de dos etapas es más efiiciente que los m mínimos cuadraados indirectoss o las variables innstrumentales. Esta regresión de Y en Z1 y Z2 no producirá estimaciones de d cualquier paráámetro en la prrimera ecuacióón. 12.6 Supongaamos que G = número de vaariables predeterminadas en el sistema G1 = nnúmero de varriables predeterrminadas en la ecuación que se está consid derando H = nnúmero de varriables endógennas en el sistem ma H1 = número n de variiables endógennas en la ecuaciión que se estáá considerando La primera foorma de la conddición de ordenn es equivalentte a: G – G1 ≥ H1 - 1
646
Solucciones a problema as selectos
Laa segunda form ma de la condicción de orden es e equivalente a: (G – G 1 ) + (H – H 1 ) ≥ H - 1 Reestando H – H1 de ambos laddos de la segund da condición se produce la prrimera. 12 2.8 Hay cuatro variables endóógenas y tres vaariables predeteerminadas en el e sistema. Por tannto, de acuerdoo con la condicción de orden, una condición necesaria paraa la identificabillidad es que ell número de vaariables predeteerminadas exclluidas sea de trres o más. De accuerdo con estee criterio la priimera ecuaciónn está apenas iddentificada, miientras que la segunda y tercerra ecuaciones no n están identificadas. La prrimera ecuacióón puede estimaarse usando mínimos cuadrados de dos etappas. 133.1 El error rm ms en general es e un mejor criiterio de desem mpeño cuando la l variable de intterés exhibe fluuctuaciones y puntos de viraj aje; si la serie ssimulada pierdee un punto de viraje en la seriee real, a uno lee gustaría pennalizar mucho ppor el error taan grande que resulta. El error medio absoluuto podría prefe ferirse si la varriable de interéés exhibe una ten ndencia constaante, en cuyo ccaso la preocup pación sólo es qué tan arriba o abajo de la línnea de tendenccia real está la serie simuladaa. Debido a quee generalmentee construimos modelos para ex xplicar fluctuaciones en variabbles económicaas, el error rmss es la estadísticca estándar calculada en la m mayor parte de los programas de simulaciónn para computaddora. 13 3.4 La subprediicción del PIB en e gran medidaa es resultado dde la incapacidaad del modelo paara predecir punntos de viraje enn la tasa de inteerés, combinaddo con un error negativo n en la propensión estim mada a consumiir lo que da com mo resultado unna subpredicció ón general del coonsumo. El con nsumo en la sim mulación histó órica, por lo geeneral, está porr debajo de la serrie real. (El connsumo y el PIB están cerca de la serie real en 1970-1971 debbido a un error poositivo en la inv versión simulaada, derivado a su vez de erroores negativos grandes en la tassa de interés sim mulada en 19699-1970.) Obsérrvese en el pronnóstico ex post que la tasa de intterés está sobrrepronosticadaa en 1972 de modo m que la invversión está sub bpronosticada enn 1973. El consumo está subprronosticado a lo largo del proonóstico ex postt. El resultado es una subprediccción del PIB. 144.2 a) La ecuacción dinámica fundamental para p el modeloo está dada por: Y t - (a 2 + b 2 a 2 )Y t-1 + b 2 a 2 Y t-2 = a 1 + b 1 + G t
dee modo que la ecuación e caraccterística es: λ 2 - (a 2 + b 2 a 2 )λλ + b 2 a 2 = 0
Poor consiguientee, las raíces carracterísticas so on:
b) La solucióón oscilará si laas raíces características son coomplejas; es deccir, si 4b2a2 > (a2 + b2a2)2. La solución s explotaará si las raícess son mayores que q 1 en magnittud. El tipo de soolución dependeerá de a2 y b2 como sigue:
Solucion nes a problemas selectos s
647 7
solucióón estable, no ooscilatoria solucióón explosiva, noo oscilatoria
solucióón explosiva, osscilatoria
solucióón estable, osciilatoria (ciclos amortiguados)
1 6. 1 S ab e m o s q ue el pr oc eeso es no est a cio na ri o ya q ue s u m edia y var ia nz a s e inncrementan en forma indefin ida. Es homoggéneo de primeer orden debidoo a que
w t = ∆y t = d + ε t 2
E Este proceso tienne una media cconstante d y unna varianza connstante σ ε y es estacionario. 177.1 La varianz a y covarianzass para el processo MA(3) son:
177.2 Obsérvese que y t tiende a estar correlac ionado en form ma positiva conn valores adyaceentes; por ejem mplo, es más proobable que un valor v positivo seea precedido y seguido por un vaalor positivo quue por un valorr negativo. La correlación, c sin embargo, no see extiende más dee un periodo, de modo que lla realización parece p muy "ruuidosa". Una realización r del prroceso y t = 1 + ε t – .8 ε t - 1 moostraría correlacciones negativa s entre valores adyacentes, de m modo que un va lor positivo de y t tendría mayyor probabilida d de ser seguiddo por un valor neegativo.
188.1 a) Esta maala especificaciión dará como resultado residduales que estáán autocorrelaciionados. Puede usarse la verifficación diagnósstica descrita enn la sección 18 .2, y es probablle que la estadí stica Q esté porr encima del pu nto del 90% enn la distribuciónn ji cuadrada.
648
Soluciones a problem mas selectos
b) Asumireemos que los paarámetros del prroceso son conoocidos con certeeza. Escriba el pproceso verdad dero ARMA(1, 2) como:
escriba e el modeelo ARMA(0, 22) como:
El término de error E e para el moodelo se relacio ona por tanto coon el término de error para el p proceso verdaddero por:
Por P consiguiennte, el término del error εt estaará autocorrelaacionado:
donde d γ1 es la covarianza c (paraa el desplazamieento 1) del procceso verdadero ARMA(1, 2). Por P lo general ф12 γ1 será muchho menor que ф1 σ 2ε, de modo qque podemos esscribir
Del D mismo modo E(εt εt - 2) ≈ ф12 σ 2ε, y así en forma f sucesiva.. De este modo las autocorrelaaciones c residualles para el moddelo ARMA(0,, 2) se verán coomo aquellas para p un procesoo autorregresivo a de d primer ordenn y esto indicaríía que ARMA( 1, 2) es una esp pecificación máás correcta. c 18.6 Nótese que q al hacer unn pronóstico unn periodo adellante, la únicaa información faltante es el valor v del términno del error εt en e el siguiente periodo; es decir, el valor dee εT+1 (los valorees de wT, wT-1,. . ., εT, εT-1,. . . so on todos conocidos, asumiend do que los p parámetros dell modelo son cconocidos). Porr consiguiente, la varianza deel error de pro n nóstico para ell pronóstico a un u periodo tan n sólo debería sser la varianza de εt. 18.7 Los pronóósticos a uno, ddos y tres perio odos para el prroceso AR(2) son s
Estos pronósticos tienen variianzas del errorr:
ÍNDICE DE AUTORES
Afifi, A.A., 258n Aldrich, J., 321n Alm, A., 255n Amemiya, T., 281n, 343n Anderson, L.C., 455n Ashenfelter, O., 125n Ashmore, D., 125n Barro, R., 248n Bartels, R., 172 n Bartlett, M.S., 521, 521 n Belsley, D.A., 101 n, 151 n, 198 n, 408 n Berk, K.N., 370 Bollerslev, T., 300 n, 301 n Bound, 268 n Box, G.E.P., 289, 289 n, 522, 555 n, 581 n, 618 n Brehm, C.T., 379, 379 n Breusch, T.S., 160 n Brewer, G.D., 398 n Brunner, R.D., 398 n Campbell, J.Y., 533 n, 540n Carlson, K.M., 445, 445 n Chan, L., 141 n Chiang, A.C., 400 n Chow, G.C., 138 n, 197, 197 n, 442 n Chou, R., 301 n Clotfelter, C, 48 n Cnudde, C.F., 321 n
Cochrane, D., 169 n Cox, D.R., 289, 289 n, 326 n Crenson, M.A., 398n Crissey, B.L., 398 n
,
Dagenais, M.G., 258 n Dhrymes, P.J., 93 n, 240 n Dickey, D.A., 533, 533 n Dixon, W.J., 632 n Domencich, T., 313 n, 316 n, 326 n Donihue, M., 464 n, 484 n Donohue, J.J., 12 n Duffie, D., 535 n Durbin, J., 171 n, 175 n, 176, 638 n Elashoff, R.M., 258 n Elliott, J.W., 398 n Engle, R.F., 204 n, 289 n, 297 n , 299 n, 539 n, 540 n Fair, R.C., 143 n, 373 n, 418 n, 464 n, 484 n Feige, E.L., 255 n Feldstein, M., 231 n Fisher, F.M., 138 n, 384 n Fisher, M.E., 256, 256 n Forrester, J.W., 428 n Freedman, D., 46 n Fuller, W.A., 533, 533 n Gardner, G.W., 533 n Goldfeld, S., 143 n, 158 n
649
650
ÍNDICE DE AUTORES
Goodhew, J., 172 n Goodman, L., 325 n Granger, C, 253, 253 n, 255 n, 540 n, 541 n, 555 n, 618 n Greenberger, M., 398 n Greene, W.H., 36 n, 101 n, 264 n, 267 n Griliches, Z., 198 n, 204 n, 240 n, 246 n, 268 n, 281 n, 289 n Haitovsky, Y., 258n Hall, A.D., 198n Hall, B.H., 268n Halvorsen, R., 368n Hamilton, J.D., 255, 255 n, 306 n Hansen, L.P., 306 n Hanushek, E.A., 322 n Hausman, J.A., 268 n Heckman, J., 342, 342 n Heller, P., 271n Hildreth, G., l70n Holt, C.C., 504n Houthakker, H., 151 n Hsiao, C, 262 n Hull, J., 536 n Hymans, S.H., 448, 448 n, 449 Intriligator, M., 198n, 204 n, 281 n, 289n Jackson, J.E., 322n Jacobi, R.L., 255n Jaffee, D.M., 143n Jenkins, G.M., 555 n, 618 n Kane, E., 631n Kaye, D., 46n Kimbrough, K.P., 533n Klein, L., 381n. 484 n Kmenta, J., 169 n, 245n, 370n, 450, 450n Kohn, M.G., 330n Krasker, W.S., 198n Kroner, K., 301n Kuh, E., 100n, 151n, 198n, 409n Lalonde, R., 125n Leamer, E., 196, 255n Lee, T.H., 335, 335n Leuthold, R., 528n Lu, J.Y., 170n Ludwig, R.S., 619n MacAvoy, P.W., 403n MacCormick, A., 528n
McFadden, D., 163n, 313n, 316n, 326n, 327n, 335n McKelvey, R.D., 339, 339n Maddala, G.S., 266n, 333n Mankiw, N.G., 533n Manski, C.F., 330n Manthy, R., 536n Marquardt, D.W., 281n Mason, A., 141n Massey, F.J., 632n Meadows, D.L., 428n Meese, R., 539n Merrington, M., 634n Miller, R.L., 194n Morrison, D.G., 333n Mundel, D., 330n Naylor, T.H., 398n, 403n Nelson, C.R., 532, 533n, 555n Newbold, P., 555n, 618n Newhouse, J.P., 197, 197n Nordhaus, W.D., 428n Orcutt, G.H., 169n Pagan, A.R., 160n, 198n, 248n Parker, R., 126n Pearce, D.K., 255n Perron, P., 534n Phillips, P.C.B., 535 Pierce, D.A., 521n, 582n Pindyck, R.S., 131n, 255n, 403n Plosser. C.I., 532, 533n Poirier, D., 141n Prais, S.J., 151n Pratt, J.W., 255n Quandt, R.E., 129n, 143n, 158n Quigley, J.M., 48n, 292, 292n Ramanathan, R., 294n Rao, P., 194n Roberts, S., 131n Rogoff, K., 540n Rotenberg, J.J., 255n Rothschild, M., 48n Rubinfeld, D.L., 48n, 292, 292n, 317n, 328n Sargent, T., 253n Saving, T.R., 379, 379n Schlaifer, R., 255n
ÍNDICE DE AUTORES
Schmidt, P., 337n Schmitz, A., 528n Shelton, J.P., 427n Shiller, R.J., 540n Siegelman, P., 12n Sims, C, 253, 253n, 420n Singleton, K.J., 306n Smith, P.E., 450, 450n Spencer, D.E., 370n Spitzer, J.J., 291n Strauss, R.P., 337n Suits, D., 141n Taylor, L.D., 197, 197n Theil, H., 325n, 327n, 333n, 335n, 378n, 381, 381n, 407n Thompson, C.M., 634n Thompson, H.E., 613, 613n Thurman, W.N., 256, 256n Tiao, G.C., 613, 613n
Tobin, J., 341 Train, K., 333n Ward, M.P., 255n Warren, J.M., 427n Watson, G.S., 638n Watts, D., 528n Weiner, R., 255n Welsch, R.E., 100n, 151n, 198n, 409n White, H., 153, 153n, 157, 157n, 162, 162n, 295 Wilson, J.H., 124n Young, A., 484n Young, R., 484n Zarembka, P., 313n Zavoina, W., 339, 339n Zellner, A., 196n, 255n, 335, 335n, 377n, 378n, 381, 381n
651
ÍNDICE TEMÁTICO
Ajuste de acciones, modelo de, 457 Ajuste de acopio, efecto de, 449 Ajuste estacional, métodos de, 507-508 Akaike, criterio de información (AIC), 249, 421 Análisis de varianza, 73 ARCH y GARCH, modelos, 298-306 Asintóticas, propiedades, 33 Atípicos, 7 Autocorrelación, función de, 520-523 del proceso estacionario, 523-526, 542-545, 564-568 muestral, 521, 580 parcial, 558-561 y estacionalidad, 529 (Véase también Correlación serial) Autorregresión vectorial (VAR), 420-426 y funciones de respuesta al impulso, 453-457 Autorregresivo: ARI (1,1,0), proceso, 594-596 ARMA (1,1), proceso, 593-595 operador, 565 proceso de error, 167 proceso estacionario de primer orden, 592 Autorregresivo con tendencia logarítmica, modelo, 494 Autorregresivos, modelos, 553-561 ARCH y GARCH, 298-306 cualidad adaptable de los pronósticos ARIMA, 596 promedio móvil autorregresivo (ARMA), 561-564 promedio móvil autorregresivo integrado (ARIMA), 564-568, 575-581 promedio móvil autorregresivo mixto, 561-564 tendencia autorregresiva, 494
Bloque recursivo, modelo de, 416 Bloques, diagrama de, 459-460 Bondad de ajuste, 73-76 en modelo no lineal, 282 en modelos de elección, 333 R2 como medida, 91 Box-Cox, modelo de, 289-291 Box-Pierce, prueba de, 522 Breusch-Pagan, prueba de, 160-162 Caminatas aleatorias, 515-517 pruebas para, 532-535 Causalidad, 239 correlación y, 76-77 pruebas para, 253-256 Censurado, modelo de regresión, 340-345 Census II, método de, 507 Centrado, 9 Chow, prueba de, 138-139 Circuitos de retroalimentación, 459 Cochrane-Orcutt, procedimiento de, 169-170 Coeficiente: de correlación, 23 de variables indicadoras, 144-146 desigualdad de Theil, 220, 407 Coeficientes de regresión, 109-110 prueba, 89-95 prueba de funciones lineales, 137-138 prueba de la igualdad de coeficientes de diferentes regresiones (prueba de Chow), 138-139 Coeficientes estandarizados, 101, 102
653
654
ÍNDICE TEMÁTICO
Colinealidad perfecta, 98-99, 128 Combinación de datos (véase Datos de panel) Componentes principales, técnica de, 367 Confianza, intervalos de, 40-43 en el pronóstico, 215, 218, 233 en modelo de regresión de dos variables, 69-73 en pronóstico de series de tiempo, 590-591 para elasticidades a largo plazo, 273-274 Consistencia, del estimador, 33-34 Consumo, función de, 129, 137-142, 239-240, 250-252, 284-285 Convergencia, 279-281 Correlación: coeficiente, 23 correlograma, 525 función de autocorrelación, 520-526 muestral, 27 parcial, 102-103 serial, 164-177 simple, 27-28, 103 y causalidad, 76-77 y variables independientes, 24-25, 187 Correlación serial, 60, 164-177 correcciones para, 166-170 de primer orden, 165 diferenciación generalizada, 167 en presencia de variables dependientes rezagadas, 175, 373-375 procedimientos de estimación, 169-170 proceso autorregresivo de primer orden, 167 prueba para, 170-176 Correlación serial de primer orden, 142 Correlación simple, 28 Covarianza, 15-16 contribución de, 220, 408 de estimadores de mínimos cuadrados, 66 negativa y positiva, 23 Crecimiento logístico, curva de, 495-496 Curva de crecimiento exponencial, 494 Curvas, ajuste de, 3 Datos: censurados y truncados, 341 combinados, 3, 262 datos de panel, 261-272 de corte transversal, 3, 262 especificación ad hoc, 420-426 individuales influyentes, 199 modelado con datos limitados, 427-428 observaciones faltantes, 257-262
propiedades de las series, 48 puntos de viraje, 406 series de tiempo, 3, 262 Descenso de pendiente máxima, método de, 279 Desviación estándar, 22, 46n Desviaciones, 4 estándar, 22 Desviaciones, forma de las, 9, 153n Determinista: modelos de series de tiempo, 491 rumbo, 596 tendencia, 565 DFBETAS, 200-203 Diagnóstico de regresión, 198-203 DFBETAS, 200-203 residuales studentizados, 199-200 Dickey-Fuller, prueba de, 532-535 Diferencia, ecuaciones de, 399 Diferenciación, 201 generalizada, 167, 226 primera, 168 Dinámica fundamental, ecuación de la, 439-441 Dispersión, diagrama de, 6 Distribución de frecuencias, 47 Distribución de probabilidad, 20 binomial, 20 condicional, 519 conjunta, 23 densidad, 21,342 distribución F, 38-39 distribución í, 36-38 ji cuadrada, 36 kurtosis, 48 mediana, 48 modelo de probabilidad lineal, 313-318 nivel de significancia, 40 normal, 34-36 pruebas unilateral y bilateral, 40 sesgo, 48 Distribución F. 38-39, 77-78 prueba de, 94, 116-117, 132-134, 204n tabla de 1% de significancia, 636 tabla de 5% de significancia, 634 Distribución normal, 34-35 conjunta, 462 tabla estandarizada, 631 Durbin, prueba h de, 176 Durbin-Watson, prueba de, 170-172 tabla de 5% de significancia, 638
ÍNDICE TEMÁTICO
Econometría bayesiana, 196n Ecuación característica, 436, 441 Ecuaciones simultáneas, modelos de, 354-358 estimación con correlación serial y variables dependientes rezagadas 373-375 estimación de parámetro, 363-365 identificación, 358-362 problema de identificación en forma matricial, 383-389 prueba de simultaneidad, 370-372 Efectos aleatorios, modelo de, 266-268 Efectos fijos, modelo de, 263-265 Eficiencia, 31 en la construcción de modelos, 196-198 Elasticidad, 102, 122n elasticidades dinámicas, 446-453 estimación de intervalos de confianza, 273-274 Elasticidades dinámicas, 446-453 Elección binaria, modelos de, 312-333 Error cuadrático medio mínimo, pronóstico de, 586-587 Error estándar. 56 de la regresión (SER), 67 del coeficiente, 67, 90, 100 del pronóstico, 214n Error, suma de cuadrados del, 88 Errores: correlacionados con la variable independiente, 187 correlacionados serialmente, 61 cuadrados, suma de, 576 cuadrático medio, 31-34, 196n de medición, 190-192, 204-206 diagnóstico de regresión, 198-203 distribución lognormal, 123 en variables, 188-192 especificación, 192-205 estadística de simulación del error, 405-406 homocedásticos y heterocedásticos, 61 media absoluta, 406n media muestral del término de error, 65 mínimos cuadrados de dos etapas (2SLS), 365-372 mínimos cuadrados de tres etapas (3SLS), 378 observaciones faltantes, 257-261 porcentaje medio, 404 raíz cuadrática media (rms), 405 Tipo I y Tipo II, 43-45 varianza y heterocedasticidad, 155 (Véase también Error de pronóstico) Errores correlacionados serialmente, pronóstico con, 224-226 Especificación, error de: errores de medición, 204-206
no linealidades, 195 prueba, 203-207 variable irrelevante, 195 variables omitidas, 192-194, 203-204 Estabilidad del modelo de simulación, 435-443 Estacionalidad, 529 Estacionariedad, 518-519 e invertibilidad y homogeneidad, 570-572 y autocorrelación, 524-525 Estadística Q, 522, 582 Estimación: comparación de técnicas, 382-383, 419 de los modelos de series de tiempo ARIMA, 578-581 de modelos de simulación, 416-419 de modelos no estructurales, 370-371 de sistemas de ecuaciones, 373-382 2SLS en forma matricial, 389-392 máxima verosimilitud, 53-55, 285-298 método de momentos generalizados (GMM), 306-310 mínimos cuadrados de dos etapas (2SLS), 365-372 mínimos cuadrados de tres etapas (3SLS), 378 mínimos cuadrados generalizados (GLS), 153, 177-182 mínimos cuadrados indirectos, 363 no lineal (véase Estimación no lineal) regresiones aparentemente no relacionadas (SUR), 376-379, 392-394 tasa de riesgo, 342-343 variables instrumentales, 190-192 Estimación de parámetros: ecuación simultánea de la, 363-365 mínimos cuadrados, 108 Estimación indirecta de mínimos cuadrados, 363 Estimadores, 25-29 a diferencia de estimaciones, 26 consistencia de los, 33-35 eficiencia de los, 30 error cuadrático medio mínimo, 31-32 máxima verosimilitud de, 53-55, 90, 288 mejor estimación lineal insesgada (BLUE), 63-68 método de momentos, 306 mínimos cuadrados ordinarios (OLS), 64 pendiente, 64 sesgados e insesgados, 25-31, 65 Estocástico, proceso, 514-515 y la función de autocorrelación, 519-522 Estructural, modelo, 356 problema de identificación, 358-362 Ex post, simulación, 402 Exógenas, variables, 302 Expansión en series de Taylor, 279-280
655
656
ÍNDICE TEMÁTICO
Expectativas adaptables, modelo de, 243-244 Expectativas racionales, 248n Exponencial, función, 54 Extrapolación, modelos de, 491-500
Intercepto, 11 solución de mínimos cuadrados, 8 Inversión de inventarios, modelo de, 251-252 Invertibilidad, 555n, 572
Financiera, modelos de simulación, 376-377 Formas matriciales: de estimación de regresión aparentemente no relacionada, 392-394 de estimación por variables instrumentales, 206-208 de mínimos cuadrados de dos etapas, 389-392 de modelos logit y probit, 345-346 del modelo de regresión múltiple, 110-116 del problema de identificación, 382-389 en autorregresión vectorial, 392-394, 420n matriz de productos cruzados, 112 matriz de varianza-covarianza, 111 pronóstico con regresión multivariada, 234-238 Función de transferencia, modelos de, 617-618
Jarque-Bera (JB), estadística de, 48 Ji cuadrada, distribución, 37 tabla de percentiles de la distribución, 632
GARCH, modelo, 298-306 Gauss-Markov, teorema de, 64, 89-90, 114 Goldfeld-Quandt, prueba de, 158-159 Grados de libertad, 27, 76n Granger-Sims, prueba de causalidad de, 254-255 Hansen-Singleton, prueba J, 310 Hausman, prueba de especificación de, 206, 268n, 371 Heterocedasticidad, 61, 151-164 estimador consistente (HCE), 157 modelos ARCH y GARCH, 298-306 pruebas para, 157-162 Hildreth-Lu, procedimiento de, 170 Hipótesis nula, 41, 70 Hipótesis, prueba de, 40-43 Histograma, 47-50 Holt, método de suavización exponencial de, 504 Homocedasticidad, 61, 151, 158 Homogeneidad, 570-572 Homogéneos no estacionarios, procesos, 523-524, 564-566 Identificación, 358-362 problemas de, en forma matricial, 382-389 Independiente de la escala, 23 Indicadoras, variables, 126-129, 144-146 coeficientes, 144-146 en modelos de efectos fijos, 263-264 Instrumentos, 186, 205, 190-192 Interacción, término de, 123-124
Kurtosis (estadística K), 48 Lagrange, multiplicadores de, 204n, 236 prueba de, 293-297 prueba para heterocedasticidad, 295 vs. otras pruebas, 289n, 296-297 Límite central, teorema del, 29, 66n Límites en probabilidad (plim), 33, 208 Línea ajustada, 4 Línea de mejor ajuste, 5 Línea de regresión por el origen, 10 Línea de regresión verdadera, 65 Lineal de probabilidad, modelo, 313-318, 334-335 Linealización: estabilidad, 442 iterativa, 279 Linealización iterativa, método de, 279 Logit, modelo, 322-332, 335-338 Log-verosimilitud, función de, 54, 204n, 288 con heterocedasticidad, 161n matriz de información, 288 Lyapunov, método directo de, 442n Marquardt, método de, 281n Máxima verosimilitud, estimación por, 53-55, 90 de modelos Logit y Probit, 345-346 estimadores, 26, 288 mínimos cuadrados ponderados, 153 modelo Box-Cox, 289-291 prueba de multiplicadores de Lagrange, 293-297 prueba de razón de verosimilitud, 288-289 Media, 21 error cuadrático, 31-34, 196n media muestra, 21 rezago, 241 vector de medias, 237 Mediana, 49 rezago mediano, 242
ÍNDICE TEMÁTICO
Memoria: de proceso autorregresivo, 555 de proceso de promedio móvil, 550 Método de momentos generalizados (GMM), estimación por el, 306-310 prueba J de Hansen-Singleton, 310 Mínimos cuadrados generalizados (GLS), estimación por, 153, 177-182 y método de momentos, 307 Mínimos cuadrados, método de, 5-8 derivación, 7 derivación de estimaciones de parámetros, 17-18 en forma matricial, 112-115 estimación de parámetros, 108 mínimos cuadrados generalizados, 153, 177-182 mínimos cuadrados ponderados, 153-154 propiedades de los residuales, 83-84 Mínimos cuadrados ordinarios (OLS), estimador de, 64, 152 y heterocedasticidad, 151-152 Mínimos cuadrados ponderados, 153-154 Modelos: ARCH y GARCH, 298-305 ARIMA, 564-568 ARMA, 561-564 autorregresivo, 553-561 bondad de ajuste, 72-76 con datos limitados, 427-428 construcción, eficiencia contra sesgo, 196-198 diagrama de bloques, 459-460 ecuación simultánea, 354-358 elección binaria, 312-333 elección cualitativa, 312 elección múltiple, 334-339 especificación, 77 estructural, 356 exponencial, 123 extrapolación, 493-498 funciones en tiras, 141 inherentemente lineal, 121 inherentemente no lineal, 122, 278 interacción, 123 lineal por segmentos, 141-142 logit, 322-332, 335-338, 345-346 MARMA, 617-618 modelo lineal general, 121-124 multiplicativo, 123 no estructural, 420-426 no lineal {véase Modelos no lineales)
polinómico, 122 probabilidad lineal, 313-318, 334-335 probit, 318-321, 345-346 probit ordenado, 339-340 promedio autorregresivo móvil mixto, 561-564 promedio móvil, 500-503, 548-553 recíproco, 123 regresión censurada, 341-345 regresión con cambio estructural, 142 regresión de dos variables, 59-63 regresión lineal clásica, 60-61, 87 regresión lineal normal clásica, 63 semilogarítmico, 123 series de tiempo (véase Modelos de series de tiempo de) Tobit, 340-343 (Véase también modelos específicos) Modelo de regresión múltiple, 87-89 combinado con series de tiempo, 617-618 con variables explicativas estocásticas, 143-144 en forma matricial, 110-117 modelos restringidos (R) y no restringidos (UR), 132-134 pronóstico con, 234-237 teorema de Gauss-Markov, 90 Modelos de rezagos distribuidos, 239-249 criterio de información Akaike, 248-250 criterio de Schwartz, 250 especificación de modelo, 248-249 geométrico, 240-246 polinómico, 246-248 racional, 248n respuesta a largo plazo, 241 rezago mediano, 242 rezago medio, 241 suma finita, 240 Monte Carlo, simulación, 461 Muestra, 4 asintótica, 33 coeficiente de correlación, 27 distribución muestral, 26 media, 8-9, 21 población, 25 teorema del límite central, 29 Multicolinealidad, 98-101 Multiplicador-acelerador, modelo de, 400, 435-441 Multiplicadores dinámicos, 394-397, 428-430
657
658
ÍNDICE TEMÁTICO
No estacionariedad, 518, 523-524 No estructurales, modelos, 420-426 No lineal, estimación, 64, 278-285 búsqueda directa, 278 de modelos de series de tiempo, 578-579 descenso de pendiente máxima, 279 ecuaciones inherentemente no lineales, 278 evaluación, 282 expansión de series Taylor, 279-280 linealización iterativa, 279 modelo Box-Cox, 289-292 optimización directa, 279 No lineales, modelos: análisis dinámico de, 443 evaluación de, 282 pronóstico con, 282-283 Normales, ecuaciones, 17, 279 Operador de rezago, 563-564 Operadores: autorregresivo, 565 de rezago, 563-564 de suma, 13-17, 52, 564-565 promedio móvil, 565 valor esperado, 21-22, 50-53 Orden cero, enfoque de, 258 Panel, datos de, 261-273 efectos aleatorios, 265-268 efectos fijos, 263-264 modelo de autocorrelación de series de tiempo, 270-271 Pendiente de la regresión, 12 estimación por mínimos cuadrados, 9, 28 solución de mínimos cuadrados, 8 Pendiente por mínimos cuadrados, estimador de la, 28 varianza, 82-83 Pérdida, función de, 6 Población, 4n muestra, 25 parámetro, 26 Política de análisis: usando el modelo de simulación, 403 usando el modelo macroeconómico, 478-484 Potencia, de una prueba, 45-46 Predicción (véase Pronóstico) Primera diferenciación, 146 Probabilidad, funciones de: acumulativas, 318 continuas y discretas, 20
logística acumulativa, 322 normal y logística, 319 Probit, modelo, 318-322 Probit ordenado, modelo, 339-340 Proceso autorregresivo de primer orden, 144 Promedio autorregresivo móvil multivariado (MARMA), modelos de, 617-618 Promedio móvil: modelos, 500-502, 548-553 modelos de promedio autorregresivo móvil multivariado (MARMA), 617-618 operador, 565 ponderado exponencialmente (EWMA), 500-502 proceso ARMA (1,1), 593-595 proceso de primer orden, MA( 1), 593 promedio autorregresivo móvil mixto, 561-564 y suavización, 441 Pronóstico, 211 adaptable, 500-501 caminatas aleatorias, 515-516 con ecuación no lineal, 282-283 con errores correlacionados serialmente, 224-227 con modelo de elección, 333 con modelo de regresión múltiple 234-238 con modelos ARIMA, 587, 596 con origen en T, 575 con rezagos, 213 condicional, 212, 231-234 determinista, 463, 502 error cuadrático medio mínimo, 586-588 ex ante y ex post, 212-213, 230, 402-403 incondicional, 212, 213-224 intervalos de, 211 intervalos de confianza del, 215, 218 línea base del, 478-481 mejor pronosticado, 213 modelos de simulación, 402 periodo de estimación del, 212 pronósticos puntuales, 211 simulación del modelo, 219 vs. pruebas estadísticas, 215 Pronóstico, error de, 213, 214-219, 231 coeficiente de desigualdad de Theil, 220 en ecuación de regresión sencilla, 461 ex post, 212, 406 fuentes en la simulación de ecuaciones múltiples, 461 para el modelo de series de tiempo, 589-590 raíz cuadrática media del error (rms), 405 varianza del, 214, 231, 590
ÍNDICE TEMÁTICO
Pronóstico, valor, 8 Proporciones de desigualdad, 220, 408 Prueba: coeficientes de regresión, 89-94 de ecuaciones no lineales, 282 diagnósticos de regresión, 198-203 distribución F, 77-79 errores Tipo I y Tipo II, 43, 69 hipótesis nula, 41, 69 intervalos de confianza 40, 68-71 modelos de simulación, 404-410 normalidad, 150-151 observaciones faltantes, 257-261 para causalidad, 253-256 para errores de especificación, 203-207 para simultaneidad, 370-372 potencia, 45, 46, 254 pronóstico contra pruebas estadísticas, 215 prueba de Wald, 133 prueba F, 93-94 prueba t, 42-43, 70-71 pruebas conjuntas, 133-135 R2, 74-76, 91-93 . significancia, 41, 43, 68-72 unilateral y bilateral, 40, 43 valor crítico, 70 valor p, 75, 71 verificación diagnóstica de series de tiempo, 581-583
residual, 67 suposiciones del modelo de, 60 Regresión aparentemente no relacionada (SUR), estimación de la, 375-379 en forma matricial, 392-394 Regresión con cambio estructural, modelo de, 142 Regresión por etapas, 104 Residuales, 60n, 67 de modelo de series de tiempo, 581-582 estandarizados, 151n propiedades de los mínimos cuadrados, 83-84 studentizados, 199 Residuales, suma de cuadrados de los, 56, 152 Respuesta al impulso, funciones de, 453-457 Retropronóstico, 403 Rezagadas, variables: en ecuaciones simultáneas, 373-376 en el pronóstico, 213, 219 endógenas, 355 modelo de ajuste de acciones, 244-245 modelo de expectativas adaptables, 242-244 Rezago geométrico, modelo de, 246-248 Rezago polinominal, 246-248 Rezagos distribuidos, modelos de (véase Modelos de rezagos) Rompimiento estructural, 141 Ruido blanco, proceso de, 521, 548 Rumbo, línea de, 597
R cuadrada (R2), 74-76, 90-93 corregida (R2), 93-95, 117 en estimación no lineal, 282 en forma matricial, 116 en modelos de rezago, 248 en pruebas conjuntas, 135 y correlación parcial, 104 Raíces unitarias, pruebas para, 532-535 Raíz cuadrática media (RMS): error de pronóstico, 219 error de simulación, 354 error porcentual, 405 Razón de verosimilitud, prueba de la, 204, 288-289 índice de razón, 332-333 vs. otras pruebas, 289, 296-297 Realización de un proceso, 519n Recurrentes, sistemas de ecuaciones, 365 Regresión: combinada con modelos de series de tiempo, 617-618 pendiente, 11
S, curvas en forma de, 496 Schwartz, criterio de (SC), 249 Sensibilidad: a los atípicos, 7 análisis con pronóstico, 403 del error de pronóstico, 317 del modelo de simulación, 409 Series de tiempo: ajuste estacional, 507-508 cointegradas, 539-542 con observaciones faltantes, 257-258 curva de crecimiento logístico, 495-496 discretas, 492 estacionalidad y la función de autocorrelación, 529 estacionarios y no estacionarios, 518-524, 524-525, 570-572 función de autocorrelación, 519-526, 542-545 iniciación de, 577 modelos de extrapolación simple, 491-498 no estacionarias homogéneas, 523-524, 564-567, 570-572
659
660
ÍNDICE TEMÁTICO
residuales en, 580-581 suavización, 503-506 (Véase también Datos de panel) Series de tiempo, modelos de, 487-489 autocorrelación, 270-273 autorregresivos, 553-561 combinados con regresión múltiple, 617-618 deterministas, 491-493 estimación de modelos ARIMA, 575-581 estocásticos, 514-519 intervalos de confianza para pronóstico, 590-591 proceso de modelamiento, 607 promedio autorregresivo móvil integrado (ARIMA), 564-568 promedio autorregresivo móvil mixto, 561-564 promedio móvil, 500-502, 548-553 tendencia autorregresiva, 494 tendencia autorregresiva logarítmica, 494 tendencia cuadrática, 495 tendencia lineal, 493 verificación diagnóstica, 581-583 y caminatas aleatorias, 515-517, 532-535 y correlación serial, 164 y rezagos distribuidos, 239 Sesgo: en la construcción del modelo, 196-198 en la estimación, 26 proporción, 220, 408 Sesgo (estadística s), 48 Significancia estadística, 69-72 Significancia, prueba de, 40 valor p, 45 Simulación, 399 contexto, 404 de modelos grandes, 441-443 ecuación característica, 436 ex post (histórica), 402 función de respuesta al impulso, 453-457 pronóstico determinista, 463 proporciones de error, 220 y errores de pronóstico, 461 Simulación, modelos: ajuste, 457-460 comportamiento dinámico de los, 434-435, 443-453 construcción de modelos, 399-403 desempeño, 409 estabilidad y oscilación, 435-443
estimación de, 416-419 estocásticos (Monte Cario), 495, 461-464 evaluación de, 403-409 financieros, 427-428 horizonte de tiempo, 402 modelo dinámico, 219 puntos de viraje, 406 sensibilidad, 409 Solución de forma reducida, 356 St. Louis, modelo de, 445-446 Suavizamiento, técnicas de, 503-506 Suma de cuadrados de los residuales, 67 Suma de cuadrados del error, 576 Suma, operador de, 13-17, 52, 564-565 Sumatoria doble, 16 t, distribución, 37-38, 70-72 estadística t, 42 percentiles de la gráfica de distribución, 633 prueba, 116-117, 132-134 Tasa de riesgo, 342 Tendencia central, 48 Tendencia cuadrática, modelo de, 495 Tendencia lineal, modelo de, 493 Término de error aleatorio, 59-63 Theil, coeficiente de desigualdad de, 220, 407 Tipo I y Tipo II, errores, 43-45, 65 Tiras, funciones en, 141 Tobit, 343 (Véase también Residuales)
Transformaciones logarítmicas, 613 llamadas hacia fuera, 615 Transitoria, solución, 436 Valor ajustado de yi. 8 Valor de probabilidad (valor p), 45 Valor esperado condicional, 586 Valor esperado, operador de, 21-22, 50-53 Valor mínimo absoluto, estimación de, 6 Valores esperados, 21, 26 Valores p, 45, 71 Variable aleatoria, 20 continua y discreta, 20 distribución conjunta, 22, 515 independiente, 24 Variables: aleatorias, 20, 60 aleatorias, continuas y discretas, 20 censuradas, 341
ÍNDICE TEMÁTICO
cointegradas, 539-541 combinación lineal, 539-540 dependientes, 7 distribuciones conjuntas, 22-24, 515 elasticidad, 102 en modelos de efectos fijos y aleatorios, 263-268 endógenas y exógenas, 355 errores en las, 188-192 estimación por variables instrumentales, 190-192 explicativas, 7 explicativas estocásticas, 143-144 función de respuesta al impulso, 453-457 independiente, 7, 24-25 independiente correlacionada con el término de error, 187 indicadoras, 126-129, 133, 144-146 influyentes, 199 interacción, 124 irrelevantes u omitidas, 193-195, 196 no estocástica, 60 normalización, 101 ponderaciones fijas contra encadenadas, 465 predeterminadas, 355 prueba de causalidad, 253-256 rezagadas (véase Variables rezagadas) simultaneidad, 370-372 truncadas, 341 Variables instrumentales, estimación por, 190-192 en forma matricial, 207-209 y método de momentos, 308
Varianza, 15-16, 21, 92 análisis, 72 constante, 61 del error de pronóstico, 214, 231, 589 del estimador de mínimos cuadrados de la pendiente, 82-83 descomposición de la, 455-457 desviación estándar, 22 errores y heterocedasticidad, 155, 156 estimador, 26 estimador consistente, 153-158 estimador consistente con la heterocedasticidad, 158 modelos ARCH y GARCH, 298-306 proporción, 408 prueba con distribución t y F, 36-40 prueba con ji cuadrada, 36 residual, 67 Varianza residual, 67 Verdadera varianza del error, 42 Verificación diagnóstica, 198-203, 568, 576 Verosimilitud, función de, 54 Wald, pruebas de, 133, 204n, 296-297 White, prueba de, 162, 295 Yule-Walker, ecuaciones de, 557, 579 Z, estadística, 42
661