ECONOMETRIA
Medición económica. Definición. Es la herramienta utilizada por economistas, sociólogos, mercadólogos e investigadores en general para respaldar o comprobar modelos matemáticos teóricos que relacionan una variable dependiente (o explicada) por una o mas variables independientes (o explicativas).
En un sentido más técnico es una rama de la Teoría Económica que mediante procedimientos estadísticos y matemáticos relaciona series temporales de información o datos numéricos, con el objeto de determinar vínculos presentes entre variables, de manera que se determina las relaciones directas o inversas de las mismas, siempre basado en un modelo conceptual de teoría económica, por ejemplo la relación inversa entre los precios y la demanda (a un mayor precio una menor demanda y viceversa).
el término de modelo económico, y se puede decir que son simplificaciones teóricas de abstracciones de la realidad, expresadas mediante una relación funcional de una variable dependiente y una o mas independientes. En este contexto es necesario plantear
Al aplicar métodos estadísticos, como correlación y regresión, a un modelo matemático de teoría económica, se esta efectuando un análisis econométrico y por tanto se busca dar validez a la teoría con la técnica inferencial probabilística y sus respectivas pruebas de hipótesis estadísticas, que den la aproximación numérica de la certeza del modelo.
La principal utilidad de esta técnica se encuentra por dos vías: A) Por un lado se comprueba los supuestos teóricos-matemáticos de un modelo basado en una realidad
B) Y por otro se genera la posibilidad de realizar proyecciones para eventos futuros y por lo tanto se tiene información adecuada para la toma de decisiones y diseño de políticas o acciones preventivas o correctivas según sea el caso, siempre y cuando, el modelo posea validez estadística, probabilística y sobre todo teórica. La aplicación de esta técnica económica se originó a partir de la dificultad de asignar valores numéricos a las relaciones teóricas de las funciones matemáticas generadas para cada modelo económico, el cual además se basa en ciertos supuestos que restringen la influencia de variables exógenos. A continuación se muestran las herramientas estadísticas necesarias, su definición y utilidad, con el fin de determinar un estudio econométrico, en tal sentido se plantea la correlación, regresión, metodología, así como algunos casos de expresiones funcionales, los supuestos que debe cumplir un modelo econométrico y finalmente se presenta elementos de análisis de significancia estadística e interpretación de coeficientes.
CORRELACIÓN La correlación o coeficiente de correlación r2 mide la proporción de variación en la variable dependiente explicada por la variación en la o las variables independientes, es decir mide el grado de intensidad lineal de vinculación de las variables, a partir de las variaciones observadas de los valores valores proyectados y de los valores reales comparadas con la media aritmética.
Este coeficiente es útil por cuanto permite establecer el grado de intensidad en que una variable dependiente se encuentra explicada por la o las variables independientes dentro de un modelo. También facilita el estudio de variables cuantitativas en la medida que podemos explicar un fenómeno por el grado en que una variable influye en otra, es decir nos permite efectuar afirmaciones de carácter social, económico y físico.
Esta herramienta estadística estadísti ca se mide por un coeficiente que puede tomar un valor que puede oscilar entre -1 y 1, si el valor es cercano a 1 se dice que existe una relación directa entre las variables estudiadas, una mayor cantidad en una implica que la otra aumentara también, en la medida que se acerca a 0 se dice que el nivel de correlación es mínimo o simplemente no existe correlación y por lo tanto la variación de una variable no explica el comportamiento de otra, finalmente si es cercano a -1 la relación es inversa, si aumenta la variable independiente, disminuye el valor de la dependiente. La siguiente gráfica muestra las posibles formas de correlación, vinculando el valor del coeficiente con su expresión gráfica.
B) Y por otro se genera la posibilidad de realizar proyecciones para eventos futuros y por lo tanto se tiene información adecuada para la toma de decisiones y diseño de políticas o acciones preventivas o correctivas según sea el caso, siempre y cuando, el modelo posea validez estadística, probabilística y sobre todo teórica. La aplicación de esta técnica económica se originó a partir de la dificultad de asignar valores numéricos a las relaciones teóricas de las funciones matemáticas generadas para cada modelo económico, el cual además se basa en ciertos supuestos que restringen la influencia de variables exógenos. A continuación se muestran las herramientas estadísticas necesarias, su definición y utilidad, con el fin de determinar un estudio econométrico, en tal sentido se plantea la correlación, regresión, metodología, así como algunos casos de expresiones funcionales, los supuestos que debe cumplir un modelo econométrico y finalmente se presenta elementos de análisis de significancia estadística e interpretación de coeficientes.
CORRELACIÓN La correlación o coeficiente de correlación r2 mide la proporción de variación en la variable dependiente explicada por la variación en la o las variables independientes, es decir mide el grado de intensidad lineal de vinculación de las variables, a partir de las variaciones observadas de los valores valores proyectados y de los valores reales comparadas con la media aritmética.
Este coeficiente es útil por cuanto permite establecer el grado de intensidad en que una variable dependiente se encuentra explicada por la o las variables independientes dentro de un modelo. También facilita el estudio de variables cuantitativas en la medida que podemos explicar un fenómeno por el grado en que una variable influye en otra, es decir nos permite efectuar afirmaciones de carácter social, económico y físico.
Esta herramienta estadística estadísti ca se mide por un coeficiente que puede tomar un valor que puede oscilar entre -1 y 1, si el valor es cercano a 1 se dice que existe una relación directa entre las variables estudiadas, una mayor cantidad en una implica que la otra aumentara también, en la medida que se acerca a 0 se dice que el nivel de correlación es mínimo o simplemente no existe correlación y por lo tanto la variación de una variable no explica el comportamiento de otra, finalmente si es cercano a -1 la relación es inversa, si aumenta la variable independiente, disminuye el valor de la dependiente. La siguiente gráfica muestra las posibles formas de correlación, vinculando el valor del coeficiente con su expresión gráfica.
La correlación puede clasificarse en dos tipos dependiendo de la cantidad de variables analizadas y analizadas y por el tipo de relación lineal, en el primer caso estamos haciendo referencia a: 1. Correlación simple: se estudia la dependencia únicamente entre dos variables 2. Correlación múltiple: se estudia la dependencia entre mas de 2 variables 3. Correlación parcial: cuando se incluye la influencia de variables exógenas no consideradas en el cálculo de los coeficientes. Dependiendo del tipo de relación lineal el coeficiente relaciona: 1. Relación directa entre las variables : un aumento en la variable independiente implica un aumento en la variable dependiente. 2. Relación inversa entre las variables: un aumento en la variable independiente implica una disminución en la variable dependiente. A partir de ello la ecuación puede mejorar su correlación si se hace pruebas para determinar si se ajusta mas a una recta, una curva exponencial o parabólica.
REGRESIÓN
Mientras que la correlación mide el grado de vinculación entre variables, la regresión se encarga de calcular, a partir de las observaciones, el valor real de los coeficientes que explican una relación funcional matemática. Si dicho valor es calculado a partir de la serie u observaciones de una población completa se esta hablando de una ecuación de regresión poblacional, y esa es una ecuación completamente confiable, sin embargo sabemos que en la mayoría de los casos es imposible realizar este tipo de estudios ya sea por la cantidad de unidades observacionales, o por la dispersión de la población o sobre todo por el valor económico asociado a un estudio de tal magnitud. Por tal motivo se utilizan mecanismos que facilitan estos estudios llegando a una aproximación de los datos poblacinales a partir de porciones o muestras representativas, utilizando para su selección métodos estadísticos de modo que se explique a cabalidad los fenómenos sociales con cierto margen de error tolerable. Partiendo de esa premisa es lógico pensar que podemos calcular una función de regresión a partir de una muestra y el valor encontrado se dice que estima los valores o coeficientes poblacionales y poblacionales y de esta forma se esta contando con una ecuación muestral que es confiable en la medida que la recolección de datos cumple con una metodología que garantice la representatividad de la información. La función de regresión se representa tal como una ecuación de la forma
Y(X) =b+aX; En el cálculo se estima los coeficiente a y b, donde a es el intercepto y b es una elasticidad. Para su cálculo se utiliza el método de Mínimos Cuadrados Ordinarios, el cual se explicará más adelante. SECUENCIA DE PASOS Para la realización efectiva de un análisis econométrico es necesario efectuar una secuencia de pasos de manera que se construya un modelo adecuado de predicción, dicha secuencia esta ligada a la experiencia y a las preferencias de los investigadores, en ningún momento representa una receta que se tenga que seguir al pie de la letra, ademas es posible simultanear algunas actividades:
Secuencia de pasos en econometría 1. Planteamiento teórico del teórico del modelo econométrico (formulación de hipótesis; o relaciones funcionales) 2. Supuestos del modelo y formulación de hipótesis . 3. Construcción de la forma matemática del modelo teórico e identificación de las principales variables y relaciones funcionales de las mismas.
4. Elaboración funcional del modelo econométrico . 5. Identificar la información necesaria para realizar el modelo econométrico . 6. Recolección de datos de la serie y comparación gráfica de las observaciones . 7. Estimación de los coeficientes del modelo econométrico . 8. Validez del modelo mediante la aplicación de pruebas estadísticas . 9. Pronóstico. 10. Toma de decisiones y diseño de políticas o acciones preventivas o correctivas, basadas en el modelo.
Paso 1 Planteamiento teórico del modelo econométrico La primera etapa consiste en seleccionar un modelo económico, para ello es necesario adoptar un enfoque de teoría económica, por ejemplo bajo los supuestos de la teoría clásica, neoclásica, keynesiana o estructuralista, etc, todo depende del modelo que se estudie, esto con el objeto de facilitar la identificación de las relaciones de las variables y el establecimiento de los supuestos, y de igual manera sirve como base para explicar las proyecciones y justificar la toma de decisiones y políticas derivadas de los resultados del modelo econométrico. Esta primer parte no es más que tomar una hipótesis de teoría económica que relacione una variable dependiente a una o más variables independientes. Ejemplo: “en la medida que se aumenta el precio de un bien y/o servicio determinado y manteniendo todo lo demás constante, las cantidades demandadas de las mismas serán menores”
Paso 2 Supuestos del modelo y formulación de hipótesis A partir de esa selección se procede a conocer todos los límites o alcances del modelo y por lo tanto se determinan los supuestos con los que el modelo adquiere validez teórica. Ejemplo:”se trata de un bien normal, en un mercado de competencia perfecta y no se tiene sustituto.” En cualquier caso se parte de una hipótesis de teoría económica, la cual se busca demostrar mediante procedimientos estadístico, indistintamente que modelo se desee comprobar se parte de una afirmación de relación entre variables representada mediante una ecuación matemática. Este punto es importante por cuanto la hipótesis será la referencia con la que se busca demostrar la investigación, en caso que se encuentre información confiable que mediante la ecuación de regresión calculada se compruebe la relación de las variables, se esta en
posición de avalar o aceptar la hipótesis y por tanto el estudio se vuelve una herramienta de análisis que facilita la explicación de un fenómeno.
Paso 3 Construcción de la forma matemática del modelo teórico e identificación de las principales variables y relaciones funcionales de las mismas. Conociendo con exactitud las relaciones funcionales de la teoría, los supuestos en los que el modelo tiene validez se pasa a determinar la forma matemática de dicho modelo Ejemplo “D=a-bP” Donde: D: Cantidades demandas (variable dependiente) a: Demanda Autónoma ( Intercepto) b: Elasticidad precio de la demanda (Pendiente de la recta) P: Precio (variable independiente) Es posible que el investigador determine que existen otras variables como gustos y preferencias, edad, etnia, etc. Sin embargo el modelo se puede ajustar a esas variables siempre y cuando se posea la información para determinar la relación y sobre todo de registros estadísticos numéricos que permitan el cálculo del modelo econométrico.
Paso 4 Elaboración funcional del modelo econométrico A partir de ello se puede trabajar con esa ecuación para adecuarla a su forma “regresiva”, es decir a plantearlo de manera que los datos se adecuen de manera natural a un promedio y se “Ajusten” a una tendencia, para ello se requiere expresar el modelo en términos funcionales de Mínimos Cuadrados Ordenados, dicho método se planteará más adelante.
Paso 5 Identificar la información necesaria para realizar el modelo econométrico. Cuando se esta seguro del modelo y se tiene la forma econométrica, se pasa a considerar el lugar donde se puede obtener la información, cual es la más útil y la facilidad de recolección de la misma. Este paso consiste en verificar la existencia y registro de las variables, en muchos de los casos, no se cuenta con una variable del modelo como tal, por ejemplo para la ecuación de producción el nivel de capital físico de la economía, que no en todas las economías se calcula , no obstante por tratarse de análisis de tendencia, se puede sustituir el nivel de
capital por una representativa de su variación, que en este caso, puede ser perfectamente el nivel de inversión, la idea central reside en adecuar la variable del modelo a los datos más cercanos con que se cuentan . Es necesario considerar en ente punto cual de toda la información de serie estadística que representa mejor a la o las variables estudiadas. A nivel general se esperaría obtener al menos 31 observaciones de cada variable, debido principalmente a que a partir de ese número de observaciones una serie de registros se adecua al Teorema del Límite Central, lo que significa que es una serie con curva normal, el cual es un requisito dentro de la econometría para dar validez estadística al modelo. No obstante se sabe que los registros obtenidos de una unidad observacional poblacional tienden a cumplir los supuestos de la curva normal es decir que se adecua a una curva de probabilidad de forma de campana que es simétrica alrededor de su valor medio, aproximadamente el 68% del área bajo la curva normal se posiciona entre los valores de su media (µ) y su varianza ( ), el 95% se ubica entre µ ± 2 y alrededor del 99.7% se encuentra en µ±3 , tal como muestra la gráfica.
El supuesto que se trabaja con un modelo en que sus variables se comportan de manera normal permite garantizar: 1. Una distribución normal de las perturbaciones estocásticas. 2. Que los estimadores son insesgados o que no están influenciados por variables externas. 3. Tienen una varianza mínima lo que significa una media altamente representativa. 4. Consistencia, en la media que se aumenta el valor de la muestra o de observaciones para estimar, los valores proyectados se acercan o igualan los valores poblacionales reales.
5. Los coeficientes estimados tiene varianza mínima por lo que los parámetros encontrados por Mínimos cuadrados Ordinarios son los Mejores Estimadores Insesgados lineal
Paso 6 Recolección de datos de la serie y comparación gráfica de las observaciones. Al tener la certeza de poseer las observaciones necesarias y se cuenta con respaldo y validez en la recolección de las mismas, se pasa a efectuar una comparación gráfica (en el caso que se plante una variable dependiente y una independiente), utilizando un plano cartesiano y se observa la existencia de alguna tendencia en el comportamiento de las observaciones tal como lo muestran las siguientes gráficas, los puntos reflejan las observaciones de una serie de datos, mientras que la línea que se encuentra al centro es su tendencia.
En la anterior imagen se aprecia que no existe relación lineal Un coeficiente de correlación cercano a 0
Paso 7 Estimación de los coeficientes del modelo econométrico. Habiendo establecido las relaciones de manera gráfica con una serie estadística suficiente y con la viabilidad matemática y teórica del modelo se procede a la estimación de los coeficientes para ello se utiliza el método de Mínimos Cuadrados Ordinarios MCO por medio del cual se obtienen los mejores coeficientes que permiten determinar el comportamiento de una función de econométrica, para un rango determinado, estimando de esta manera los valores reales a partir de la muestra. El principal objetivo de una ecuación de regresión obtenida por Mínimos Cuadrados Ordinarios es que las desviaciones de los valores observados respecto a los estimados sea el mínimo posible, es decir, se espera que se encuentren los coeficientes que sean ∑(F(x) observado –F(x)estimado)2 un mínimo, en otras palabras que la sumatoria de las diferencias del valor real menos el proyectado elevado al cuadrado tienda a cero, de ahí el nombre que el método se le denomine Mínimo Cuadrado Ordinario.
Paso 8 Validez del modelo mediante la aplicación de pruebas estadísticas. Para determinar la validez del modelo se debe haber pasado una serie de pruebas de hipótesis que hacen que el modelo se comporte de cierta manera o que se encuentre en ciertos parámetros donde existe suficiente probabilidad de ser fiables o buenos estimadores de los valores reales (dichas pruebas se presentaran más adelante).
Paso 9 Pronóstico. El pronóstico consiste en utilizar la ecuación para establecer con certeza el posible comportamiento de la variable el cual puede darse en dos tiempos. 1. Dentro del domino o rango de información con la que se obtuvieron los coeficientes 2. Fuera del rango, para observaciones posteriores o anteriores a los del domino o rango de información. En el primer caso no es necesario más que sustituir en la ecuación la o las variables independientes, por que los coeficientes explican el comportamiento dentro del rango con que se cuenta la información; en este caso se esta tratando de una ecuación que se puede llamar de Largo Plazo, para el segundo caso es necesario transformar la ecuación en un modelo predictivo de corto plazo en el que se puede con alguna certeza aproximarse a los valores futuros y para ello se trabaja la serie estadística en diferencias para obtener de esas variables los nuevos coeficientes, para el alcance de este curso se tomara la primer forma de preedición.
Paso 10 Toma de decisiones y diseño de políticas o acciones preventivas o correctivas, basadas en el modelo. Al haber establecido los coeficientes que dan validez al modelo se esta en la posibilidad de efectuar toma de decisiones y diseño de políticas o acciones preventivas o correctivas, basadas en el modelo, lo que supone que es una herramienta que facilita la toma de actividades y acciones, pero a pesar de ese valor estadístico en ningún momento se esta en la posibilidad de sustituir la experiencia o el conocimiento del comportamiento humano que es en algunos casos más confiable que cualquier herramienta estadística.
CONDICIONES DE LOS MODELOS Los modelos econométricos suponen que la ecuación estimada se comporta bajo ciertas condiciones o requisitos y bajo ciertos parámetros, uno de los principales tiene que ver con que los en cada punto observacional utilizado se ajusta al teorema del límite central y por
tanto se ajusta a la curva normal, de igual manera, la serie estadística necesaria para estimar los coeficientes debe estar apoyada en este supuesto y por tanto requiere un mínimo de 31 datos (este es un valor numérico aproximado en el que una variable comienza a ajustarse a la curva normal). Esa es una premisa no obstante se tiene que tomar en cuenta una serie de supuestos que son necesarios para estimar una ecuación econométrica con validez estadística, muchos de ellos se logran por el simple hecho de efectuar los cálculos mediante el método de Mínimos Cuadrados Ordinarios, los supuestos se mencionan a continuación.
SUPUESTOS 1. El modelo econométrico es lineal en sus parámetros es decir en sus coeficientes y en sus variables incluyendo su valor de error estocástico Yi = β1+ β2Xi + υi Esto significa en términos sencillos que la potencia de cada factor de la ecuación es igual a 1. 2. Los valores que toma la variable “X” en un ejercicio de muestreo se mantienen constantes, es un valor no estocástico o no aleatorio, por ejemplo si consideramos lo niveles de educación en grados escolares de la Población Ocupada se tiene que el valor que puede tomar el nivel de educación de una persona puede variar desde 0 hasta el nivel máximo 13 o 14 para un año determinado manteniendo el valor de X que es un promedio inalterable, lo que importa es el valor medio que toma la variable “Y” a partir de la “X” pero el valor de esta última es independiente de ese promedio en “Y”. Lo que implica en términos concretos que los coeficientes estimados están condicionados al valor de la o de las variables dependientes. 3. El valor promedio de las variaciones estocásticas υi es cero, que significa que la variación del valor observado con el estimado a partir de la ecuación de regresión es cercano a cero para cada punto utilizado en la proyección. En términos sencillos lo que pretende este supuesto es que el valor de las variaciones estocásticas es cero y por lo tanto la ecuación econométrica se puede representar así: Yi = β1+ β2Xi + υi Yi = β1+ β2Xi + 0 Yi = β1+ β2Xi
υi aproximado a cero
4. Las varianzas de cada error estocástico υi deben ser idénticas o en términos estadísticas cumplir con el criterio de Homocedasticidad (homo o igual y cedastico o dispersión), es decir que la varianza de υi es igual para cada punto en todas las observaciones.
Si este supuesto se cumple se esta asegurando que el nivel de varianza de las observaciones es el mismo. 5.No existe correlación entre los errores estocásticos, lo que significa que al aplicar un modelo de regresión para perturbaciones υi de distintos puntos observados, se obtiene un r2 cercano a cero, lo que se busca es que la estimación de “Y” no dependa de la variación sistemática de los errores estándar la siguiente grafica muestran la condición descrita de los errores estocásticos:
Correlación serial Negativa, el valor de - υi es correspondido con un valor + υi y viceversa
Correlación serial Positiva, el valor de + υi es correspondido con un valor + υi y viceversa
Correlación cero de perturbaciones
1. No existe correlación entre los valores estocásticos y la variable independiente, en otras palabras que no existe Covarianza entre υi y “X” o que su covarianza es cero, al correr la variable independiente y el valor de la perturbación se debería esperar que es cero, principalmente por que el valor de X es no aleatorio y se asume fijo para muestras repetidas. 2. El número de observaciones debe ser mayor al número de parámetros a estimar, no obstante no se debe olvidar que debemos contar con una serie de al menos 31 datos para ajustarse al teorema de límite central, no obstante este criterio varia de investigador a investigador, muchos economistas apuntan que más de 20 valores estadísticos son suficientes, también es necesario considerar el tipo de variables que se desean estimar. 3. Debe existir variabilidad en las variables independientes, es lógico pensar este supuesto ya que la función de regresión estimada se logra a partir de las desviaciones entre el valor de X y el de Y, determinando de esta manera un estimado de los parámetros, de no encontrar variabilidad, se estaría esperando una no relación lineal entre las variables. 4. Debe el modelo debe estar especificado correctamente, es decir que lo que se plante matemáticamente debe estar respaldado por supuestos del modelo económico y que la forma funcional sea la que más se ajusta, finalmente se deben incluir todas las variables involucradas que inciden en la explicación de un fenómeno, para ello se pueden correr muchos modelos y aquellos que demuestren un mejor nivel de correlación y de pruebas estadísticas son los que clasifican para hacer estimaciones o demostraciones de relaciones funcionales. El grado de cumplimiento de cada una de los supuestos anteriores puede variar según el criterio del investigador, algunas pruebas que se mencionan son determinadas automáticamente por programas computacionales, además para hacer proyecciones a futuro se analiza la estacionariedad de la serie, el sentido de estas pruebas esta vinculado con la variabilidad de las perturbaciones, en este curso se presenta la prueba de significancia estadística.
Tipos de modelo Los modelos econométricos pueden incluir híbridos o combinaciones, generalmente se trata con modelos lineales, en la mayoría de los casos encontraremos que con dificultad se logra una serie con tendencia lineal debido a la variabilidad de las observaciones y por tanto no siguen una tendencia visible en primera impresión. Por tal motivo el uso de los logaritmos es una herramienta que facilita ajustar una serie a una tendencia, en la medida que se tiene una serie con mucha dispersión, se aplica a todas
las variables o a una parte de ellas los logaritmos con el objetivo de suavizar el efecto distorsionador. Por tato tenemos los siguientes tipos de modelos 1. Lineales en sus variables (lineales en sus variables y parámetros) 2. Modelos log-lineales, se ajusta una o todas las variables que no tiene compartimiento lineal 1. Log-log 2. Log lineales o semi logarítmicos En los modelos lineales al graficar podemos apreciar su tendencia y estimar sin mayor cambio utilizando el método de MCO. Para los modelos doble log o log-log se aplica a ambos lados de la ecuación los logaritmos, este es el caso de las funciones exponenciales y de potencia. En los semi-logarítmicos aplicamos a la variable dependiente un valor en logaritmo para suavizar la tendencia y de esta manera obtener un mejor estimador.
FUNCIÓN LINEAL Cuando se han recolectado los datos y si estos cumplen con el teorema de límite central (información que se ajusta a una curva normal) se procede a presentar la información bajo un esquema bidimensional que no es más que plantearla en términos del plano cartesiano.
Que bien puede representar la función de oferta, donde “Y” seria la cantidad de productos ofertados, “a” el intercepto y “b” la elasticidad precio de la oferta; ahora la siguiente tabla muestra que la cantidad de kilos de carne de cerdo ofrecidas a los precios de mercado Cantidades Y 2 2,5 Precio X 3.3 4.4
3 4 3.5 3.3 5.5 4.4
3.5 4.5 5 5.5 5.5 6.6 6.6 7.2
5.5 7.7
6 7 7.5 7.7 8.8 8.8
9 11
8.5 9.9
La forma gráfica queda entonces
El grafico anterior muestra una relación directa, como la función de oferta se supone es lineal su forma funcional así se expresa, no obstante esta puede ser una curva semejante a una parábola o a una exponencial (todo depende el caso) y por lo tanto se puede optar por la mejor forma, en este caso para efectos de simplificación se muestra una lineal.
DESARROLLO La ecuación de la línea recta es Y(x) = a+ bXi , donde “a” es el intercepto o el valor que adquiere “Y” cuando “X” es igual a cero, “b” representa la pendiente o elasticidad de la ecuación (por el cambio en una unidad adicional de x el valor total de Y cambia en la proporción de b).
CÁLCULO Para obtener los valores de los coeficientes se tiene en primer lugar efectuar los productos encontrar sus sumatorias y luego simultanear la ecuación y despejando en cada caso el valor que se requiera: Precio X 3.3 4.4 3.3 5.5 4.4 5.5 6.6 6.6 7.15
Cantidades Y (X)(Y) 2 6.6 2.5 11 3 9.9 4 22 3.5 15.4 3.5 19.25 4.5 29.7 5 33 5.5 39.325
10.89 19.36 10.89 30.25 19.36 30.25 43.56 43.56 51.1225
TOTAL
7.7 7.7 8.8 8.8 11 9.9 100.65
5.5 6 7 7.5 9 8.5 77
42.35 46.2 61.6 66 99 84.15 585.475
59.29 59.29 77.44 77.44 121 98.01 751.7125
Con el coeficiente encontrado se procede a sustituir en cualquiera de las dos funciones originales para despejar el valor de a por lo que se obtiene 585.475
= (a) 100.65+ (b) 751.7125
585.475
= (a) 100.65+ 0.901166978) 751.7125
585.475-667.7418482 = (a) 100.65 -91.94348195/100.65= a a
= -0.913497088
De manera tal que la ecuación queda: Y(X)
=
0.9012 X- 0.9135
A un precio de 0, según esa ecuación, la producción seria -0.91 unidades, la elasticidad precio de la oferta como es de esperarse es positiva en la medida que cambie el precio de la producción este tendrá un impacto en el cambio de oferta a un mayor precio se ofrecerá una mayor cantidad de producto. Para efectos simplificadores se puede usar de manera general
FUNCIÓN CUADRÁTICA La forma funcional de cada modelo econométrico depende en alguna parte por su forma gráfica, es decir que al reflejar en un esquema bidimensional se puede apreciar la forma y hacerse una idea de la ecuación que se ajusta de mejor manera al modelo que se busca. Para el caso tomaremos un ejemplo hipotético en el que se toma el esquema de una función de costos totales, donde se sabe que hasta cierto punto en el que la producción aumenta los costos caen dado un nivel de tecnología llegando a un mínimo y a partir de ahí existe un incremento progresivo por cada unidad adicional por tanto se espera una forma parabólica . La siguiente tabla muestra el valor del costo total Y que se obtiene con un nivel de producción específico X.
x 200 240 300 400 500 540 600 640 700 800 900 1000 1040 1100 1200 y 3910 3680 2990 2070 2070 1380 1610 1380 1725 1495 2070 1840 2530 2990 4025 Y su forma gráfica es:
El gráfico anterior muestra claramente que la tendencia no se ajusta a una recta, esta se plantea como una curva en forma de u, siendo una parábola la ecuación que más se ajusta es cuadrática. En este caso estamos tratando con una ecuación de la forma
lo que indica que tiene un valor máximo o en su defecto un mínimo.
DESARROLLO Para el caso de la función cuadrática es necesario aclara que es un caso espacial que se ve en muchos ejemplos económicos, su aplicación es útil para determinar máximos y mínimos. El procedimiento es el mismo que en el anterior se encuentra
mínimo, se deriva respecto a los coeficientes a, b y c y luego se igualan a cero, para posteriormente simultanearlas, las ecuaciones quedan entonces:
CÁLCULO El siguiente paso a realizar consiste en obtener los productos y sumatorias indicadas en las tres ecuaciones X 200 240 300 400 500 540 600 640 700 800 900 1,000 1,040 1,100 1,200 ∑
Y 3,910 3,680 2,990 2,070 2,070 1,380 1,610 1,380 1,725 1,495 2,070 1,840 2,530 2,990 4,025
XY 782,000 883,200 897,000 828,000 1,035,000 745,200 966,000 883,200 1,207,500 1,196,000 1,863,000 1,840,000 2,631,200 3,289,000 4,830,000
X2Y 156,400,000 211,968,000 269,100,000 331,200,000 517,500,000 402,408,000 579,600,000 565,248,000 845,250,000 956,800,000 1,676,700,000 1,840,000,000 2,736,448,000 3,617,900,000 5,796,000,000
X2 40,000 57,600 90,000 160,000 250,000 291,600 360,000 409,600 490,000 640,000 810,000 1,000,000 1,081,600 1,210,000 1,440,000
X3 X4 8,000,000 1,600,000,000 13,824,000 3,317,760,000 27,000,000 8,100,000,000 64,000,000 25,600,000,000 125,000,000 62,500,000,000 157,464,000 85,030,560,000 216,000,000 129,600,000,000 262,144,000 167,772,160,000 343,000,000 240,100,000,000 512,000,000 409,600,000,000 729,000,000 656,100,000,000 1,000,000,000 1,000,000,000,000 1,124,864,000 1,169,858,560,000 1,331,000,000 1,464,100,000,000 1,728,000,000 2,073,600,000,000
10,160 35,765 23,876,300 20,502,522,000 8,330,400 7,641,296,000 7,496,879,040,000
Con 15 observaciones se tiene un n de 15
Siguiendo el esquema anterior se procede a simultanear las ecuaciones, comenzaremos con (1) y (2)
Simultaneando (1) y (3)
Multiplicando -8.330.400 por la (1) y 15 por la (3)
Sustituyendo este valor en 4 y despejando b tenemos b= (-5,227,900 – 29,982,576,000(0.009954675))/ 21,730,400 b= -13.97556819 Para encontrar el coeficiente c hay que sustituir en cualquiera de (1), (2) ó (3), tomando la ecuación primera se tiene: 35,765 35,765 35,765 a a
= 15 a + 10,160 b + 8,330,400 c = 15 a + 10,160 (-13.97556819) + 8,330,400 (0.009954675) = 15 a -141991.7728 + 82926.42106 = (35,765+141991.7728- 82926.42106)/15 = 6322.023448
En consecuencia la ecuación queda
Y(x)
=
0.009954675 X2 - 13.97556819 X + 6322.023448
Función exponencial El caso de una ecuación exponencial requiere de un tratamiento especial, el crecimiento exponencial se le aplica en la mayoría de variables poblacionales, la explicación se debe entre otras, además de la relación gráfica, a que el crecimiento en un tramo es lento y a partir de cierto punto, este se incrementa en mayor cantidad, tal como muestra la siguiente gráfica.
La forma de la función estimada es
Los coeficientes “a” y “b” se calculan a partir de un sistema de ecuaciones que a continuación se explicara, el primer paso a realizar es linealizar la función para ello se aplican logaritmos base 10. Teniendo el siguiente cuadro que relaciona tiempo y niveles Población ocupada, se puede observar una tendencia no lineal, una curvatura en la secuencia de datos, la forma gráfica muestra que el modelo de regresión mas adecuado es la exponencial.
Es necesario aclarar que cuando se relaciona el tiempo y otra variable, se considera al tiempo como la variable independiente.
1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 N= 25
escolaridad 2.890 2.740 3.230 3.400 3.123 3.365 3.563 3.735 3.960 3.560 3.573 3.662 3.842 3.523 3.760 3.990 4.126 4.356 4.653 5.236 5.136 5.313 5.459 5.609 5.763
Desarrollo El procedimiento para determinar los coeficientes entonces es:
Al igual que en los casos anteriores se busca que la desviaciones de los valores observados respecto a los estimados sea el mínimo posible, por lo que se debe derivar respecto a los coeficientes “a” y “b” para luego igualar los resultados a cero. Para el caso se debe sustituir la función exponencial linealizada en la expresión sumatoria a minimizar por lo que:
CÁLCULO Tomando como base la tabla presentada anteriormente y para simplificar los cálculos, se sustituyen los valores de años por un equivalente numérico que no afecta el resultado (este método se utiliza principalmente en años o en variables de tiempo que poseen un incremento unitario). En consecuencia tenemos la siguiente gráfica que relaciona el tiempo y la cantidad de población ocupada en millones de personas:
Años 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
X -12 -11 -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11
Y 2.890 2.740 3.230 3.400 3.123 3.365 3.468 3.684 3.860 3.560 3.573 3.662 3.842 3.900 3.760 3.990 4.126 4.356 4.653 5.236 5.018 5.190 5.333 5.479
Log Y 0.46089784 0.43775056 0.50920252 0.53147892 0.49457198 0.52698507 0.54007909 0.56631962 0.5865873 0.55149767 0.55301164 0.56367494 0.58450797 0.59106461 0.57518784 0.6009729 0.61548712 0.63908787 0.66773305 0.71899964 0.70049474 0.715185 0.72695922 0.73873907
X*log Y -5.53077411 -4.81525619 -5.09202522 -4.78331025 -3.95657587 -3.68889548 -3.24047453 -2.83159811 -2.34634922 -1.654493 -1.10602328 -0.56367494 0 0.59106461 1.15037569 1.80291869 2.46194847 3.19543936 4.00639832 5.03299747 5.6039579 6.43666501 7.26959218 8.12612979
X2 144 121 100 81 64 49 36 25 16 9 4 1 0 1 4 9 16 25 36 49 64 81 100 121
2003 ∑
12 0
5.630 101.067229
0.7505158 14.946992
9.00618959 15.0742268
144 1300
En este caso no habrá necesidad de simultanear debido a que la sumatoria de X es igual a cero y por lo tanto el valor de “a” y “b” se obtienen de manera más rápida En consecuencia el valor de “a” se obtiene:
Para este caso se debe sustituir valores comprendidos entre -12 y 12, para que de como resultado el valor en su equivalente en años.
Función de potencia. A esta función se le conoce como curva geométrica de la forma , al igual que los casos anteriores es necesario linealizar la ecuación, como se puede esperar basta aplicar logaritmo a la ecuación de igual manera que el en caso exponencial para obtener una ecuación de la tendencia buscada y se procede a derivar respecto a “a” y “b” .
En este caso utilizamos la relación ingreso y consumo
Ingreso 3.01 3.26 3.69 3.98 3.654 4.024 3.89 4.2 4.36 4.56 4.268 4.689 4.93 5.3 5.21 5.36
consumo 1.904236782 2.389395036 2.93138203 3.321130844 2.884343721 3.074481512 3.198127393 3.629445223 3.860393932 4.156912734 3.726912485 3.957023376 4.727987654 5.327630566 5.179181854 4.934102133
n=16
DESARROLLO La secuencia de pasos es similar a la exponencial se tiene que minimizar la expresión, sustituir el valor equivalente de Y estimado y derivar.
Aplicando propiedades de logaritmos
Igualando a cero y derivando respecto a los coeficientes “a” y “b” se llega a las siguientes expresiones
CÁLCULO Con la información anterior se construye los cuadros respectivos que permitirán determinar los valores de los coeficientes:
Y (Consumo) 1.904 2.389 2.931 3.321 2.884 3.074 3.198 3.629 3.860 4.157
X (Ingreso) 3.010 3.260 3.690 3.980 3.654 4.024 3.890 4.200 4.360 4.560
Log X 0.479 0.513 0.567 0.600 0.563 0.605 0.590 0.623 0.639 0.659
Log Y 0.280 0.378 0.467 0.521 0.460 0.488 0.505 0.560 0.587 0.619
Log X* Log Y (Log X) 2 0.134 0.229 0.194 0.263 0.265 0.322 0.313 0.360 0.259 0.317 0.295 0.366 0.298 0.348 0.349 0.388 0.375 0.409 0.408 0.434
3.727 3.957 4.728 5.328 5.179 4.934 Sumatoria n=16
4.268 4.689 4.930 5.300 5.210 5.360
0.630 0.671 0.693 0.724 0.717 0.729
0.571 0.597 0.675 0.727 0.714 0.693
0.360 0.401 0.467 0.526 0.512 0.505
0.397 0.450 0.480 0.525 0.514 0.532
10.002
8.842
5.661
6.333
En consecuencia la ecuación queda
Y(X) = aXb Y(X) = 3.57 X70.32
COEFICIENTE DE CORRELACIÓN INTERPRETACIÓN ESTADÍSTICA Como ya se ha planteado el grado de correlación mide la intensidad de relación lineal , ya sea directa, inversa o inexistente entre dos variables, se dice que es directa si tiene signo positivo, inversa de signo negativo y nula cuando el valor sea aproximadamente igual a cero. Existen diferentes métodos para calcular el grado de correlación en este curso explicaremos el método en términos de variaciones y simplificado de Kart Pearson . El método de variaciones consiste en comparar el grado de desviación que se presenta entre los valores observados, los proyectados y la media aritmética; el de Kart Pearson lo resume en una ecuación determinada.
La idea central radica en que si existe relación entre los valores de “Y” observados con los valores de X, el grado de variación de la media aritmética respecto a los “Y” estimados y los observados es mínima. En términos concretos se compara el porcentaje de la variación explicada (que se origina entre los valores proyectados y la media), y la variación total (la variación observada y la variación explicada) en cuyo caso refleja un coeficiente que se encuentra entre el valor de 1 y 1. De manera funcional se mide: Variación total = variación no explicada + variación explicada (Y observada -media de Y) = (Y observada - Y estimada) + (Y estimada - media de Y) La siguiente gráfica muestra las desviaciones a las que se hace referencia, el valor de la media se representa por la variable Ψ y se obtiene de la suma del valor observado dividido entre el total de observaciones, = ∑ Y / n.
Para evitar valores negativos se debe llevar al cuadrado cada expresión, para totalizar ese cálculo se realiza para cada uno de los puntos y luego se procede a la suma en consecuencia
Como el coeficiente de correlación es un porcentaje que explica el comportamiento de la relación entre lo variación explicada y la variación total se calcula mediante
Con esta ecuación se puede apreciar que en la medida que el valor de observado sea igual al valor proyectado, el nivel de variación con la media será el mismo, es decir que Y observado = Y estimado, si eso se cumple para cada uno de los puntos las variaciones son inexistentes y por lo tanto
El método de Pearson no es más que aplicar la siguiente ecuación
DESVIACIÓN ESTÁNDAR La desviación estándar de la función de regresión indica el grado de dispersión entre las variaciones de los valores observados “Y” respecto a los estimados con ese valor se puede
determinar con cierta certeza si un modelo es confiable, en la medida que dicho coeficiente sea mayor se puede apreciar que la estimación de los coeficientes no es lo suficientemente confiables. Y(X) , la fórmula queda:
CÁLCULO DE LA DESVIACIÓN ESTÁNDAR . De acuerdo con los datos recopilados se puede decir que la desviación es
Por el segundo método
La diferencia se debe a los decimales utilizados
PRUEBAS DE VALIDEZ ECONOMÉTRICAS Significancia Estadística Para determinar la significancia estadística es necesario calcular la varible t student, la cual es una distribución que tiene una fuerte vinculación con la curva o distribución normal, puesto que en la medida que se tengan mayor cantidad de observaciones en el calculo del t student la curva se va ajustando a la normal. Para iniciar este tipo de evaluación hay que considerar los grados de libertad de la serie los cuales no son más que el número de observaciones “n” menos el número de variables utilizadas para la proyección. La formula entonces queda
Donde la variable ß es un parámetro encontrado en la ecuación, el gorrito o el ^ significa que el valor encontrado mediante los MCO y el valor ß por si solo es el real o el poblacional no estimado y es el error estándar del parámetro. El valor “t” debe evaluarse para un nivel de significancia o probabilidad que no debe ser mayor al 15% y se puede evaluar para una o para dos colas, esto se estima el valor mediante una tabla que se encuentra en la mayoría de libros de estadística para estudios superiores. Para establecer si los coeficientes son significativos en términos estadísticos, se observa si el valor de t, se encuentra fuera de la zona crítica y en este caso se dice que los coeficientes son estadísticamente significativos. De caer dentro de los intervalos de las colas, es decir entre ellas, se dice que no son estadísticamente significativos, dependiendo del tipo de modelo también se puede elegir la prueba utilizando un lado de la cola. En primer lugar se debe determinar el valor crítico y para ello se analiza los grados de libertad y la probabilidad con la que se desea trabajar, utilizando los valores de la función lineal tenemos:
Como el valor de b es 0.90 y para una probabilidad del 5% con 15-2 grados de libertad se tiene un valor de 2.160, como el valor t es 60.92 podemos asegurar que la t student queda fuera del rango en que no existe significancia estadística
INTERPRETACIÓN DE VARIABLES Los valores obtenidos como “a” y “b” son estimadores de los parámetros reales, porque se dicen estimadores por que son encontrados a partir de una muestra, su representación en econometría son los valores ß, el caso de “a” se esta tratando con el intercepto y con “b” con la elasticidad, si “b” esta siendo afectado por un logaritmo ese coeficiente es una tasa de crecimiento. En la medida que el valor de r o r2 tienda a uno o a -1 se esta tratando de una fuerte correlación, los investigadores prefieren trabajar con un coeficiente de correlación cercano a 0.90 y 0.95, si es 0.99 nos encontramos en la posibilidad de presentar auto correlación entre las variables y por tanto no aproximarnos a los valores reales.
PROYECCIONES
Las proyecciones de los modelos como se ha planteado son en dos momentos el Corto Plazo CP y el Largo Plazo LP, este último se utiliza solamente la ecuación calculada por mínimos cuadrados ordinarios, en el caso de CP sea hace una regresión utilizando las desviaciones típicas de cada valor u observación para estimar su relación de variabilidad con la función econométrica a partir de ello se aplica a las observaciones un método de diferencias para determinar su variación para cada año y a partir de los coeficientes que refleje se puede hacer estimaciones para no mas de 5 o 6 observaciones a futuro, con la condición de proyectar las variables independientes . El método de proyecciones de CP no será presentado por tratarse de un método que requiere otros elementos de análisis como la estacionariedad de la serie y su cointegración, así como métodos de proyección y utilización de paquetes computacionales; por tal motivo estamos en la posición de hacer proyecciones a LP, para ello se toma la ecuación calculada
y se procede a sustituir valores de la variable independiente que se encuentren dentro del rango o dominio de la variable X. Finalmente para efectuar una proyección de CP, el modelo debe poseer un coeficiente de correlación cercano a 1 o a -1, una mínima desviación estándar y poseer significancía estadística, solo de esta manera una proyección es confiable, en la medida que los el r2 sea cercano a cero o inferior a 0.75, una desviación grande y con coeficientes no representativos la estimación se dice no confiable o espuria. Para el ejercicio de la función lineal tenemos una ecuación construida para un domino que va desde 3.3 a 11, el cual representa el precio. Con esa información podemos decir que si el mercado espera en ese periodo un precio de 5 unidades monetarias el valor de la cantidad ofertada será de Y(X)=0.9012 (5)- 0.9135, Y(X)= 3.59, en consecuencia los productores ofrecerían una 3.6 kilos de carne aproximadamente, la misma mecánica se aplica para las demás ecuaciones calculadas, la interpretación variará dependiendo de las variables utilizadas. En el caso de utilizar el Excel solo es necesario aplicar la formula tal como se presenta en la siguiente grafica, el valor variable es la columna de los precios esperados B y por tanto se deja la ecuación idéntica excepto ese valor que nos sirve para estimar, para encontrar los valores posteriores simplemente es necesario copiar y hacia abajo
Nótese que el valor de 15 no fue estimado por no encontrarse dentro del rango, lo mismo se aplica para casos que están por debajo de 3.3.
ALGUNOS CÁLCULOS MEDIANTE EXCEL Como es de esperarse existen diferentes programas que facilitan el análisis econométrico, dentro de ellos se puede mencionar SPSS y Econometrics Views, son programas especializados para ello, no obstante, office de Windows mediante Excel ofrece herramientas que facilitan ciertos cálculos como la estimación de la educación y el valor de r2.
En primer lugar debemos introducir los datos de manera vertical tal como se muestra
Luego marcamos las dos columnas para graficar las relaciones
Nótese que se señalo el gráfico de dispersión, se aplica siguiente hasta el punto en que se solicita la ubicación, se recomienda que se envíe a una hoja aparte, no en la misma hoja. Se da clic derecho en la línea de dispersión para seleccionar línea de tendencia
Como se puede apreciar existen diferentes tendencias, uno mismo puede hacer las pruebas en que el coeficiente de correlación y la forma funcional se ajuste más.
Además en la viñeta de opciones de la misma venta se puede seleccionar que muestre la ecuación y el valor de r2. Quedando de esta manera
Nótese que son los mismos valores calculados para el ejemplo 1 de línea de regresión lineal Cuestionario Introducción 1. Que es la econometría? 2. Cuáles son las diferencias entre la correlación y regresión? 3. Cómo puede vincular los conceptos econometría, correlación y regresión.? Metodología 1. explique brevemente los pasos para la construcción de un modelo econométrico a partir de los niveles de desempleo e inflación utilizando la curva de Phillips y su teoría. CONSIDERACIONES DE LOS MODELOS 1. Qué condición ó condiciones indispensable debe contener una serie estadística para considerarla apta para aplicar la herramienta de econometría.
2. Cuál es la razón de utilizar logaritmos aplicados a una serie estadística y que implicaciones tienen en el modelo en cuanto a la interpretación de los parámetros o coeficientes. Mínimos Cuadrados Ordinarios A continuación se presenta un caso hipotético en el que se relaciona el tiempo y la variable Población Ocupada, se pide: 1. 2. 3. 4.
Coeficiente de correlación. Desviación estándar. Ecuación de regresión Cual de las formas de ecuación se ajusta más para explicar el comportamiento de esta serie. 5. Será que existe una relación entre el tiempo y la cantidad de Población Ocupada, comente? 6. Cómo se pueden interpretar los coeficientes encontrados. Nota: utilice Excel para verificar sus resultados
Ejercicio de aplicación caso hipotético Población ocupada 1975 1,236,400 1976 1,269,783 1977 1,304,067 1978 1,336,525 1979 1,440,242 1980 1,437,598 1981 1,392,730 1982 1,307,429 1983 1,484,303 1984 1,393,370 1985 1,371,884 1986 1,484,961 1987 1,532,991 1988 1,740,448 1989 1,633,763 1990 1,854,882 1991 1,781,582 1992 1,753,147 1993 1,802,586 1994 1,950,998 1995 1,973,017 1996 2,056,450 1997 2,066,523