UNIVERSIDAD PONTIFICIA COMILLAS
ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA (ICAI) INGENIERO EN INFORMÁTICA
PROYECTO FIN DE CARRERA
MÉTODOS DE PREDICCIÓN PARA LOS MERCADOS DE DIVISAS
DIRECTOR
Prof. Dr. Carlos Maté Jiménez
AUTOR
Gabriel Gómez Rojo MADRID, Junio de 2007
Autorizada la entrega del proyecto del alumno: GABRIEL GÓMEZ ROJO
El Director del Proyecto PROF. DR. CARLOS MATÉ JIMÉNEZ
Fdo.: …………….
Fecha: 27/06/2007
Vº Bº del Coordinador de Proyectos PROF. DR. MIGUEL ÁNGEL SANZ BOBI Fdo.: …………….
Fecha: 27/06/2007
1
UNIVERSIDAD PONTIFICIA COMILLAS
ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA (ICAI) INGENIERO EN INFORMÁTICA
PROYECTO FIN DE CARRERA
MÉTODOS DE PREDICCIÓN PARA LOS MERCADOS DE DIVISAS
DIRECTOR
Prof. Dr. Carlos Maté Jiménez
AUTOR
Gabriel Gómez Rojo MADRID, Junio de 2007 2
MÉTODOS DE PREDICCIÓN PARA LOS MERCADOS DE DIVISAS Autor: Gómez Rojo, Gabriel Director: Maté Jiménez, Carlos Entidad colaboradora: ICAI – Universidad Pontifica de Comillas RESUMEN DEL PROYECTO Los mercados de divisas ejercen una gran influencia en la economía internacional actualmente. De forma adicional, son el mayor mercado financiero del mundo y un gran vehículo de especulación. Predecir su comportamiento futuro aporta importantes ventajas competitivas a los actores del mercado pero es una tarea compleja en la que se están vertiendo continuamente grandes esfuerzos de investigación sin obtener resultados definitivos. En este proyecto se ha buscado un enfoque original al problema de su predicción y se han desarrollado tres modelos diferentes, el último de ellos con resultados muy positivos. Los tipos de cambio y los mercados de divisas son influidos por un amplio rango de factores macroeconómicos, a la vez que repercuten en ellos: las variaciones del comercio internacional, los cambios en los tipos de interés y la inflación son los principales. Según la hipótesis del mercado eficiente, la mayor parte de la información sobre este entorno macroeconómico está ya contenida en la serie temporal de los tipos de cambio, lo que dificulta la predicción hasta el punto que numerosos estudios han reconocido la aleatoriedad de los tipos de cambio, apuntando al paseo aleatorio como modelo muy difícil de batir en la predicción del mercado de divisas. Sin embargo, el uso de algunos modelos de predicción resulta particularmente prometedor. Las redes neuronales han tenido gran auge en los últimos años y se han obtenido resultados positivos en la predicción de tipos de cambio. Esto es debido a las especiales características de esta técnica, ya que las redes neuronales son capaces de generalizar, responden bien a series con ruido, capturan no-linealidades y son autoadaptativas. Así pues, los tres modelos de este proyecto han hecho uso de un tipo de red neuronal, el perceptrón multicapa, caracterizado por su versatilidad y practicidad.
3
El primer modelo de predicción desarrollado lleva a cabo una estrategia de tipo “divide y vencerás” para afrontar el problema. La serie a predecir es descompuesta en diferentes subtendencias, cada una de ellas representando los diferentes horizontes temporales de los inversores del mercado. Se entrena una red neuronal para cada una de las subtendencias para que ésta se especialice en su serie particular y aprenda los patrones propios de la subtendencia que se le ha asignado. La misión de cada una de estas redes neuronales es realizar la predicción de su subtendencia para que luego se realice el sumatorio de todas las predicciones obteniendo una predicción final del tipo de cambio. El resultado obtenido para este modelo ha sido mixto: las subtendencias son predichas con precisión pero al realizar la combinación final el error de precisión se ve fuertemente amplificado, obteniéndose un error final elevado. Esto es debido a que existe una fuerte correlación entre los errores de las predicciones de las subtendencias, lo que hace que la combinación amplifique el error final. Estudiar las causas de esta correlación se propone como desarrollo futuro. El segundo modelo de predicción consiste en buscar autocorrelaciones en la serie de máximos, mínimos y cierres de tipos de cambio y utilizar los períodos más autocorrelacionados
como
entradas
para
un
perceptrón
multicapa.
Estas
autocorrelaciones son buscadas también en los cuadrados de la serie, buscando así períodos con fuerte autocorrelación de la volatilidad. Adicionalmente se buscan mejoras en la predicción usando diferentes funciones de entrenamiento para las redes neuronales. Cada una de las arquitecturas que obtiene buenos resultados es al final combinada con las otras mediante una regresión múltiple. Este modelo obtiene una precisión mejor que la obtenida por el modelo benchmark. El último modelo intenta capturar dos aspectos de los tipos de cambio, volatilidad y direccionalidad, respectivamente mediante dos aproximaciones diferentes: modelos ARCH y redes neuronales. Hay enorme literatura acerca de la bondad de los modelos ARCH para predecir la volatilidad, y en particular el modelo GARCH(1,1) ha sido loado como imbatible en los tipos de cambio. Así pues, se realiza una predicción de los intervalos de máximo y mínimo diario de la serie de tipos de cambio usando GARCH(1,1) para predecir la amplitud del intervalo y un perceptrón multicapa para predecir el valor del centro del intervalo. De esta manera se obtienen predicciones de máximos y mínimos diarios con alta precisión; los resultados no sólo superan la
4
precisión del modelo de referencia sino que también superan la precisión de variados modelos exitosos publicados. Utilizando este último modelo de predicción, se ha desarrollado una aplicación para el software matemático MATLAB que permite visualizar 5 tipos de cambio diferentes y calcular sus predicciones obtenidas mediante el modelo explicado. Esta aplicación descarga en tiempo real los datos de los tipos de cambio por Internet de la plataforma FXTrade de OANDA, a través de la API de Java cedida gratuitamente por Olsen and Associates para los fines de investigación de este proyecto. Por último, de la investigación realizada en este proyecto, se puede concluir que la serie de cierres muestra una gran aleatoriedad, que en los modelos de predicción debe primar la parsimonia (en particular, las arquitecturas de redes neuronales deben ser tan sencillas como sea posible) y que, aún siendo la predicción de tipos de cambio un problema complicado, pueden obtenerse buenos resultados combinando múltiples modelos que capturen diferentes aspectos del comportamiento del mercado. Una única aproximación nunca debería bastar.
5
FORECASTING METHODS FOR
THE FOREIGN
EXCHANGE
MARKETS ABSTRACT In the current global economy, foreign exchange markets play a prominent and relevant role. Additionally they are the largest financial markets of the world and a big destination for speculators. Foreign exchange rate forecasting provides important competitive advantages for all the market players, currently being a challenging task for both academic researchers and business practitioners. In this paper three different original forecasting models are developed, the last of them achieving an interesting predictive accuracy. Exchange rates and foreign exchange markets are influenced by a wide range of macroeconomic factors and vice versa: international trade variations, interest rate changes and inflation rates are the main ones. Following the efficient market hypothesis, most of the information of this macroeconomic environment is already contained in the exchange rate time series, making difficult its prediction. Many researchers have found exchange rates as random, pointing to the random walk as an unbeatable forecasting model. However, some forecasting models are particularly promising. Artificial neural networks have gained considerable attention in the last years and positive accuracy results have been obtained using them in prediction models of exchange rates. This is due to the special characteristics of this technique: neural networks are good generalizing, perform well in noisy environments, capture non-linearities and are selfadaptive. Thus, the three models introduced in this paper have made use of a class of neural network, the multi-layer perceptron, characterized by its versatility and practical features. The first forecasting model developed in this project applies a “divide and conquer” strategy to face the problem. The time series to be predicted is decompounded in several sub-trends, each of them representing different time horizons of the market players. A neural network is trained for each of the sub-trends, so each network specializes in its own series and learns the individual patterns of its assigned sub-trend. 6
The mission of each one of this neural networks is to predict its sub-trend as better as possible; later the summatory of the individual predictions will be calculated, providing a final forecast of the exchange rate series. Mixed results have been obtained with this model: the sub-trends are predicted accurately but, when the predictions are combined, the accuracy errors are severely amplified, resulting in a high final predictive error. Further research in the causes of this correlation is suggested as future development. The second forecasting model uses as inputs for several multi-layer perceptrons the most autocorrelated delayed periods of the time series and the time series squared, so effects of volatility are observed. Additionally several different training functions are used for each group of neural networks. Then the top performing neural networks are combined with a multiple regression, obtaining satisfactory accuracy for daily maximum, minimum and close values of the USD/JPY exchange rate. The last model intends to capture two key aspects of exchange rates, volatility and direction. This is made through two different approaches respectively: ARCH models and neural networks. There is huge literature about the optimum results of ARCH models predicting volatility and, specially, GARCH(1,1) has been acclaimed as unbeatable for exchange rates. Therefore, it is made a prediction of the daily maximum and minimum interval of the time series using GARCH(1,1) to predict the interval width and a multi-layer perceptron to predict the value of the interval center. This way, a highly accurate forecast of daily maximums and minimums is obtained: the results are not only better than the benchmark model but also improves the accuracy of other successful models published. Using this last forecasting model, a graphic user interface for the mathematical software MATLAB is developed, allowing to show 5 different exchange rates and calculate their predictions, obtained through the explained model. This application downloads in real time through the Internet the currency quotes from the FXTrade platform of OANDA, using the JAVA API provided free of cost by Olsen and Associates for the research purposes of this project. Finally, from the research made in this paper, it can be concluded that the close series shows a high random component, that an approach to forecasting models should
7
rely on parsimony (particularly, the neural networks architectures should be as simple as possible) and that, although the exchange rate forecasting is a complex problem, good results can be obtained combining multiple models that capture different aspects of the market behaviour. One individual approach alone should always be avoided.
8
Agradecimientos A mi director, por el continuo apoyo para sacar adelante este proyecto. Y a mi familia y amigos, por estar siempre junto a mí en los otros proyectos de mi vida.
9
Índice I. OBJETIVOS 1. Introducción y motivación del proyecto................................... 14 2. Objetivos................................................................................. 15 II. DESARROLLO TEÓRICO E IMPLANTACIÓN 1. Introducción a los tipos de cambio.......................................... 17 1.1 Los tipos de cambio........................................................... 17 1.2 Tipos de cambio fijos, flexibles y dirigidos.............................. 20 1.3 Efectos de las variaciones del comercio sobre el tipo de cambio................................................................................. 21 1.4 Los tipos de cambio y la paridad del poder adquisitivo. La influencia de la inflación........................................................... 23 1.5 Tipos de cambio y tipos de interés. Bonos nacionales frente a bonos extranjeros. ................................................................. 25
2. Los mercados de divisas......................................................... 28 2.1 Características y funcionamiento......................................... 28 2.2 Tipos de operaciones......................................................... 29 2.3 Magnitud del mercado y datos cuantitativos............................... 33
3. Redes neuronales artificiales en la predicción de tipos de cambio................................... ..................................................... 35 3.1 Introducción................................... ................................. 35 3.2 Elección de información de entrada...................................... 36 3.3 Preparación de los datos.................................................... 37 3.4 Topologías de redes neuronales................................................. 38 3.5 Comparación del rendimiento con otros métodos de predicción. 41
4. Modelo de predicción mediante descomposición en subtendencias............................................................................. 44
10
4.1 Introducción................................................................................. 44 4.2 Método de descomposición......................................................... 45 4.3 Aplicación de redes neuronales.................................................. 51 4.4 Resultados y conclusiones.......................................................... 53
5. Combinación de modelos de predicción de valores extremos 56 5.1 Introducción: análisis estadístico de precios máximos, mínimos y de cierre.......................................................................................... 56 5.2 Predicciones basadas en retrasos consecutivos......................... 61 5.3 Predicciones basadas en retrasos con altos coeficientes de autocorrelación.................................................................................. 64 5.4 Mejoras mediante la función de entrenamiento cuasinewtoniana BFGS............................................................................. 68 5.5 Combinación de predicciones – Conclusiones............................ 70
6. Modelo de predicción de centro y radio.................................. 73 6.1 Características de la distribución y volatilidad de las series financieras......................................................................................... 73 6.2 Modelos de heteroscedasticidad condicional.............................. 75 6.3 Análisis de intervalo..................................................................... 78 6.4 Predicción del radio mediante la volatilidad................................ 79 6.5 Combinación de predicciones de radio mediante EWMA........... 81 6.6 Predicción del centro mediante perceptrón multicapa................. 83 6.7 Resultados y conclusiones de la predicción del intervalo........... 83
7. Interfaz de usuario para predicción......................................... 85 7.1 Entorno de programación............................................................ 85 7.2 Módulos de la aplicación............................................................. 85 7.3 Instalación y lanzamiento de la aplicación.................................. 86 7.4 Uso de la aplicación.................................................................... 87 7.5 Correcto funcionamiento y resolución de problemas.................. 92
III. Planificación y presupuesto 1. Planificación............................................................................ 96 2. Presupuesto del proyecto....................................................... 97 2.1 Costes de ingeniería.................................................................... 97
11
2.2 Inversiones y costes materiales.................................................. 98 2.3 Servicios y mantenimiento anual................................................. 98 2.4 Presupuesto final......................................................................... 99
3. Herramientas utilizadas en el desarrollo del proyecto............. 100
IV. Conclusiones y desarrollos futuros 1. Conclusiones.................................................................. 102 2. Desarrollos futuros......................................................... 104 V. Bibliografía........................................................................... 105 VI. Apéndices A. Análisis estadístico de las series de tipos de cambio............. 111 A.1 Serie de máximos
112
A.2 Serie de mínimos
117
A.3 Serie de cierres
122
B. Muestra de predicciones y valores observados...................... 127
12
I. Objetivos
13
1. Introducción y motivación del proyecto Al realizar transacciones internacionales como pueden ser compra-venta de bienes, servicios o activos financieros, es probable que nuestra moneda local sea diferente de la divisa de nuestra contraparte en el extranjero. Ello hace necesario cambiar una moneda por otra para poder llevar a cabo la transacción. El mercado de divisas es el lugar en el que se intercambian monedas de distintos países, estableciéndose cotizaciones para cada una de ellas según la oferta y la demanda. Dada su repercusión en las transacciones internacionales, los mercados de divisas tienen un papel muy relevante en la economía mundial. El comportamiento de dichos mercados tiene un cierto grado de incertidumbre que añade riesgo adicional a las transacciones internacionales, aumentando además su coste. Conseguir predicciones fiables supondría una importante ventaja para comerciantes e inversores internacionales, bancos centrales, instituciones financieras y en definitiva cualquier operador del mercado. El proyecto tiene la intención de cubrir los métodos utilizados actualmente y en el pasado, entendiendo su comportamiento y fiabilidad en los diversos mercados y llegando a conclusiones sobre la utilidad práctica de dichos métodos. Una vez repasado el estado del arte de los sistemas de predicción actuales, se diseñará y desarrollará un método básico de predicción para los mercados de divisas basado en un enfoque original, estudiándose la viabilidad de incluir técnicas de inteligencia artificial.
14
2. Objetivos 1. Revisar el estado del arte y realizar documentación de los siguientes elementos: mercados de divisas, métodos de predicción y software para predicción en los mercados de divisas. Especialmente, hay que valorar la ubicación de MATLAB en este contexto. 2. Revisar el estado del arte y realizar documentación de los métodos de predicción para datos de tipo intervalo. 3. Construir una herramienta para realizar predicciones en los mercados de divisas que utilice como entrada el histórico de un mercado y proceda a predecir el intervalo de variación de la divisa a analizar durante un determinado período, evaluando la exactitud de esas predicciones. 4. Encontrar la manera más eficiente de diseñar la interfaz del sistema. 5. Encontrar la manera más eficiente de ofrecer el sistema a potenciales clientes a partir de las pruebas que se realicen con la aplicación.
15
II. Desarrollo teórico e implantación 16
1. Introducción a los tipos de cambio Esta introducción pretende exponer de forma resumida los conceptos básicos necesarios para comprender el significado, funcionamiento y relevancia de los mercados de divisas, pues son la razón de ser de este proyecto. Se comentará la influencia de los mercados de divisas en el comercio exterior, la inflación, los mercados financieros, los tipos de interés y viceversa. También se explicarán las diversas formas en las que las divisas cotizan y cómo se intercambian las monedas en el mercado. Con ello, se intenta ofrecer una visión general del comportamiento de los tipos de cambio flexibles para crear la base de conocimiento necesaria para la comprensión de la motivación de este proyecto y de los diferentes métodos de predicción que serán estudiados más adelante.
1.1 Los tipos de cambio Cuando son realizadas transacciones de comercio interior dentro de una misma nación o un área de unión monetaria, tanto el comprador como el vendedor de la mercancía desean habitualmente realizar la transacción en una misma moneda. Es por ello por lo que simplemente intercambian de forma directa la moneda del comprador por la mercancía del vendedor. Esto es así porque las dos partes usan mayoritariamente para sus relaciones económicas en el día a día una misma y única moneda. Sin embargo, la situación es distinta en el comercio exterior. Normalmente, dos individuos de diferentes países con voluntad de llevar a cabo un intercambio comercial se encontrarán con el problema de que sus monedas son completamente distintas y habitualmente, tendrán diferente valor. Un importador ruso de coches alemanes encontrará que, comúnmente, cuando desee adquirir coches en Alemania el vendedor querrá ser pagado en euros 17
mientras que él posee rublos rusos. Para poder realizar la transacción, el importador ruso deberá cambiar sus rublos por euros. Para ello deberá comprar euros con su moneda y utilizarlos posteriormente para realizar la transacción comercial. Así pues, se podría definir el tipo de cambio como el precio de una moneda expresado en otra, es decir, la cotización de una divisa expresado en términos de otra moneda. Normalmente se suele expresar en los mercados poniendo la denominación de la divisa de la que se quiere dar el precio partida por la denominación de la divisa que se usa como base y acompañado de la cotización propiamente dicha. Las denominaciones de las divisas usadas se basan en una denominación de 3 siglas estipulada por el estándar ISO 4217 para cada moneda. Para el caso del euro, la denominación ISO es EUR. Así pues si se quiere expresar el tipo de cambio del euro respecto al dólar americano (USD en la nomenclatura ISO), se usaría 1,2573 EUR/USD, lo que significa que hacen falta 1,2573$ para adquirir 1€. A continuación se muestra un cuadro de los tipos de cambio del jueves, 19 de octubre de 2006: Thu Oct 19 06:00:15 2006 Currency
Bid
Offer
Time
EUR/USD
1.2573
1.2574
Thu Oct 19 06:00:12 2006
USD/JPY
118.60
118.62
Thu Oct 19 06:00:14 2006
GBP/USD
1.8693
1.8696
Thu Oct 19 06:00:14 2006
USD/CAD
1.1353
1.1357
Thu Oct 19 06:00:05 2006
USD/CHF
1.2644
1.2647
Thu Oct 19 05:59:56 2006
EUR/JPY
149.13
149.15
Thu Oct 19 06:00:12 2006
EUR/GBP
0.6724
0.6726
Thu Oct 19 06:00:14 2006
EUR/CHF
1.5898
1.5900
Thu Oct 19 06:00:12 2006
GBP/CHF
2.3637
2.3643
Thu Oct 19 06:00:14 2006
GBP/JPY
221.72
221.78
Thu Oct 19 06:00:14 2006
.
Tabla 1.1.1 – Ejemplo de tipos de cambio
18
Es útil conocer las equivalencias ISO de las diferentes monedas pues es la manera estándar de referirse a ellas en los mercados, y en este proyecto se referenciarán de la misma forma. Seguidamente se muestra una lista de las divisas más populares y sus equivalencias de códigos ISO con los nombres comunes de las diferentes monedas: Código ISO
Nombre común
EUR
Euro
USD
Dólar americano
JPY
Yen japonés
GBP
Libra británica
CHF
Franco suizo
CAD
Dólar canadiense
AUD
Dólar australiano
NZD
Dólar neozelandés
SEK
Corona sueca
CZK
Corona checa
PLN
Zloty polaco
HKD
Dólar hongkonés
MXN
Peso mexicano
ARS
Peso argentino
THB
Baht tailandés
SGD
Dólar de Singapur
ZAR
Rand sudafricano
HUF
Forint húngaro
NOK
Corona noruega Tabla 1.1.2 – Equivalencias ISO de divisas populares
El lugar en el que se intercambian unas monedas por otras es el denominado mercado de divisas, que será motivo de estudio más adelante.
19
1.2 Tipos de cambio fijos, flexibles y dirigidos Una vez conocido el significado del tipo de cambio, se debe comprender cómo se forma la cotización de las diferentes divisas. La forma más sencilla y utilizada mayoritariamente en los últimos tres siglos (excluyendo el período más reciente) es el tipo de cambio fijo. En él, los gobiernos fijan el precio de su moneda de forma directa. Según Samuelson [SAMU48] el más importante ha sido históricamente el patrón oro, mediante el que las naciones fijaron el precio de su moneda basado en cantidad de oro durante casi todo el período entre 1717 y 1933. De esta forma cada moneda equivalía a una cantidad fija de oro asignada por el gobierno, de manera que el cambio entre las diferentes divisas era relativamente sencillo pues sólo había que calcular cuánto oro representaba la cantidad determinada de moneda que se quería cambiar. Con el patrón oro, la oferta monetaria de un país dependía de las reservas de oro que poseía esa nación pues toda la moneda era convertible en oro en el banco central. Después de las guerras mundiales y la Gran Depresión se consideró que el patrón oro era demasiado rígido. En 1944 se creó el sistema de Bretton Woods, que estableció una paridad para cada moneda fijada tanto en dólares como en oro, con la característica destacable de posibilitar que los tipos de cambio fueran fijos pero ajustables. Después de tres décadas de éxito, en 1971 la situación de patrón dólar se hace insostenible para Estados Unidos y abandona el sistema de Bretton Woods, lo que dio paso al sistema de tipos de cambio flexibles o flotantes. Los tipos de cambio flexibles consisten en dejar fluctuar libremente las monedas bajo la influencia de las fuerzas del mercado: la oferta y demanda marcan la cotización de la divisa. Las tres principales regiones que utilizan básicamente el tipo de cambio flexible son Estados Unidos, Europa y Japón. Una demanda masiva de euros provocará que el euro se aprecie frente otras divisas mientras que una salida a gran escala de capitales de Japón causará la depreciación de su moneda. Multitud de factores diversos intervienen en la 20
formación de la oferta y demanda de una divisa, lo que hace muy compleja la predicción de su cotización en un momento dado. Es por ello por lo que este proyecto se va a centrar en encontrar una posible solución a la predicción de los tipos de cambio flexibles. Por último, en la economía mundial también podemos encontrar los tipos de cambio dirigidos, en los que el tipo de cambio es determinado mayoritariamente por las fuerzas del mercado pero el gobierno tutela la cotización según su propio interés nacional comprando o vendiendo moneda o modificando su oferta monetaria.
1.3 Efectos de las variaciones del comercio sobre el tipo de cambio Las variaciones del comercio exterior influyen muy directamente sobre el tipo de cambio de los países envueltos en las diferentes transacciones. A su vez, los tipos de cambio influyen de forma recíproca sobre el comercio exterior, pudiendo causar variaciones y ajustes en la demanda de exportaciones o importaciones. Cuando un país exporta bienes o servicios a otra nación aumenta la demanda de su moneda, pues el país importador necesita adquirir la moneda local para pagar las mercancías al país de origen. Ello presiona al alza el tipo de cambio del país que exporta. Por otro lado, aumenta la oferta de la divisa del país importador, pues está vendiendo su moneda, presionando así a la baja la cotización de su divisa. Como ejemplo se puede tomar la importación a Estados Unidos de aparatos electrónicos japoneses. Cuando los ciudadanos de Estados Unidos compran aparatos japoneses, deben cambiar dólares americanos por yenes para poder pagar en Japón, alimentando la demanda de yenes y a su vez la oferta de dólares. Si la oferta y demanda exterior de Estados Unidos y Japón es estable, el tipo de cambio no variará pues se mantendrá en el punto de
21
equilibrio de oferta y demanda. Pero si hubiera un descenso en la demanda de aparatos electrónicos japoneses por parte de Estados Unidos causado, por ejemplo, por el atractivo de un producto sustitutivo más barato como pueden ser aparatos electrónicos chinos, la curva de demanda se desplazaría. Estados Unidos cambiaría menos yenes por dólares. Así pues, el tipo de cambio del yen frente al dólar descendería, depreciándose el yen y aumentando el precio de los dólares en yenes. Como se puede ver, la variación del comercio ha repercutido en el tipo de cambio.
Figura 1.3.1 – Variación en la demanda
Si el dólar siguiera subiendo frente al yen, puede que el yen se depreciara por debajo de unos niveles que pudieran ser considerados de equilibrio. En ese momento, los aparatos electrónicos japoneses volverían a ser atractivos para el consumidor americano, lo que empujaría las importaciones americanas de aparatos japoneses. De esta forma, el tipo de cambio habría provocado una variación del comercio exterior. En definitiva, el tipo de cambio se ve afectado entre otros factores por las variaciones del comercio y se ajustará hasta encontrar un punto de equilibrio.
22
1.4 Los tipos de cambio y la paridad del poder adquisitivo. La influencia de la inflación Es una idea de aceptación extendida entre los economistas que los tipos de cambio, a pesar de sus fuertes variaciones en el corto plazo respondiendo a diversos hechos como la política monetaria, los acontecimientos políticos y los cambios sobre expectativas futuras, en el largo plazo son sin embargo determinados principalmente por los precios relativos de los bienes en los diferentes países. Una de las importantes implicaciones de esta idea es la teoría denominada PPA (paridad del poder adquisitivo). Aunque esta teoría ha sido enunciada de una u otra forma a lo largo de toda la historia de la economía, Gustav Cassel [CASS23] es reconocido como el padre de esta teoría en tiempos modernos, desarrollándola en 1923 en su artículo Tract on Monetary Reform. Según esta teoría, el tipo de cambio de una nación ajustará el coste de adquisición de los bienes comerciados dentro de sus fronteras con el coste total de adquisición en el extranjero (incluyendo transporte y/o otros costes asociados). Para entender la PPA, como ejemplo, se puede suponer una cesta de bienes no diferenciables como alimentos, combustible, herramientas, etc... que cuesta 2.500 dólares en Estados Unidos y 25.000 pesos mexicanos en México. Si suponemos la misma calidad para los bienes a un lado y a otro de la frontera y el tipo de cambio estuviera a 50 pesos por dólar, los individuos estadounidenses adquirirían los bienes en México pues esta cesta les costaría 500 $, que es una cantidad sensiblemente inferior a los 2.500 $ que les costaría en su país. De esta forma, se produciría un flujo de capitales de Estados Unidos a México, incrementándose la demanda de pesos mexicanos a cambio de dólares. Ello haría que la cotización del peso en dólares subiera, es decir, que el peso se apreciara con respecto al dólar. Como consecuencia, para los
23
compradores estadounidenses los precios de los bienes mexicanos estarían subiendo, aunque los precios nominales en pesos no variaran. Este proceso se produciría hasta que los precios para los compradores estadounidenses fueran similares a los de su país, por lo que pararía cuando el tipo de cambio bajara hasta los 10 pesos por dólar (10 USD/MXN). Un interesante índice de las diferentes divisas basado en la PPA es el Índice Big Mac elaborado anualmente por The Economist. Este índice, recoge los diferentes precios de la hamburguesa Big Mac de la cadena de restaurantes McDondald’s en diferentes países. La idea es que al ser los ingredientes de la hamburguesa los mismos y disponer la mayoría de los países de producción de dichos ingredientes, el Big Mac debería ser un buen índice de comparativa de PPA. La siguiente tabla muestra el Índice Big Mac junto con ciertos valores explicativos:
The Hamburger Standard (based on March 25, 2006 BigMac Prices)
Country
BigMac Price in Local in US Currency dollars United States $3.10 3.10 Argentina Peso 7.00 2.2609 Australia A$3.25 2.4777 Brazil Real6.40 2.9835 Britain £1.94 3.6535 Canada C$3.52 3.1306 China Yuan10.50 1.3284 Euro area 2.94 3.7182 Hong Kong HK$12.00 1.542 Hungary Indonesia Japan Malaysia Mexico New Zealand Poland Russia Singapore South Africa
Forint 560 Rupiah14,600 ¥250 M$5.50 Peso29.0 NZ$4.45 Zloty6.50 Rouble48.00 s$3.60 Rand13.95
2.7134 1.5958 2.1049 1.4926 2.696 2.9201 2.1188 1.79 2.2945 1.8502
Actual Exchange Rate 1 USD =
Over(+) / Under(-) Valuation against the dollar, %
Purchasing Power Price
1.00 3.0961 1.3117 2.1451 1.8832‡ 1.1244 7.9045 0.7907 7.782
-27.0049 -19.9512 -3.9672 17.7024 1.3874 -57.113 20.4478 -50.2699
2.26 1.05 2.06 0.625 1.14 3.39 0.9524 3.87
206.384 9149.13 118.769 3.6848 10.7565 1.5239 3.0678 26.8157 1.569 7.5399
-12.2994 -48.5197 -32.1372 -51.9648 -13.0758 -5.5056 -31.547 -42.198 -26.0676 -40.3175
181 4,710 80.6 1.77 9.35 1.44 2.10 15.5 1.16 4.50 24
South Korea Sweden Switzerland Taiwan Thailand
Won2,500 Skr33.0 SFr6.30 NT$75.00 Baht60.0
2.597 4.5265 5.002 2.2533 1.6198
962.649 7.2904 1.2595 33.2838 37.0411
-16.2727 45.3967 61.1751 -27.292 -47.6257
806 10.6 2.03 24.2 19.4
‡ Dollars per pound
Tabla 1.4.1 – Índice Big Mac
También según la PPA se establece que el diferencial de inflación entre diferentes monedas es causa de variaciones en el tipo de cambio, depreciándose la moneda del país con más inflación frente a la moneda del de menos inflación en un valor anual cercano al diferencial de la inflación entre los dos países. Así pues si en un país la inflación es del 8% y en otra nación la inflación es del 2%, el tipo de cambio del país con más inflación debería depreciarse a un ritmo del 6% anual con respecto a la moneda del otro país. Un ejemplo es el caso de España en los años 80 y 90, en los que la peseta fue devaluada en sucesivas ocasiones por el gobierno a causa de la fuerte inflación en relación con nuestros vecinos europeos. Como advertencia, se debe saber que la PPA es sólo una aproximación y se debe de tener en cuenta a título orientativo, como una regla flexible, aunque es una buena guía para el largo plazo. Hay muchos factores que influyen de forma inmediata sobre el tipo de cambio a corto plazo, incluyendo la especulación en los mercados y que los movimientos financieros pueden superar a los momentos comerciales en el corto plazo.
1.5 Tipos de cambio y tipos de interés. Bonos nacionales frente a bonos extranjeros. La deuda pública (que en este proyecto por motivos de simplificación será referida como “bonos” a pesar de la multitud de variantes que ofrece) es considerada como una inversión sin riesgo. Por ello, el tipo de interés que ofrecen los bonos nacionales es tenido en cuenta como el coste de oportunidad del dinero.
25
¿Pero qué pasa en una economía abierta global en la que los inversores tienen acceso también a bonos de otros países? En ese caso, las posibilidades de inversión aumentan considerablemente y los agentes buscarán el mercado que ofrezca la máxima rentabilidad, teniendo en cuenta también la variación en el tipo de cambio. Por ello, para que se den condiciones de equilibrio, tanto los bonos nacionales como los bonos extranjeros deben tener la misma rentabilidad total esperada, lo que implica que debe cumplirse la siguiente relación para mantener el equilibrio, siendo i el tipo de interés nacional, i * el tipo de interés extranjero, E el tipo de cambio y Ee el tipo de cambio esperado: it = i*t + (Eet+1 – Et)/Et, Esta relación indica que el tipo de interés nacional debe ser igual al tipo extranjero más la depreciación esperada de la moneda nacional con respecto a la divisa extranjera. La relación anterior puede expresar el tipo de cambio actual en función del tipo de cambio esperado y de los tipos de interés, quedando de la siguiente manera: E = Eet+1 / (1 + i – i*) De esta forma se concluye que una variación en los tipos de interés, ya sea el nacional o el extranjero, afecta al tipo de cambio. Un aumento de los tipos de interés locales o disminución de los tipos de interés extranjeros, provocará una apreciación de la moneda nacional, mientras que en el caso inverso la divisa local se depreciará. Como ejemplo, si los tipos de interés en Estados Unidos y en Europa son iguales, según la relación el tipo de cambio EUR/USD se mantendrá estable, siendo E = Ee. Si se produjera una subida de tipos de interés en Estados Unidos, los inversores europeos encontrarían más atractivos los bonos americanos, ya que obtendrían más interés por su dinero en ese país que en Europa. Por ello, se
26
produciría un flujo de capital a Estados Unidos desde Europa, vendiendo los inversores sus euros por dólares. Este hecho empujaría la cotización del dólar al alza pues aumenta su demanda e incrementa la oferta de euros, depreciándose el euro respecto al dólar, o lo que es lo mismo, desencadenando la apreciación del dólar. Esta apreciación del dólar continuará hasta que se halla cubierto el diferencial de tipos de interés entre las dos regiones, de forma que si todo lo demás permanece constante en el largo plazo se alcance de nuevo el equilibrio.
27
2. Los mercados de divisas 2.1 Características y funcionamiento Como se ha podido leer anteriormente, en los mercados de divisas (también conocido como FOREX o FX, acrónimo de Foreign Exchange) se intercambia una moneda a cambio de otra, casándose la oferta con la demanda. Al precio al que dos monedas son intercambiadas se le denomina tipo de cambio y en el caso de los tipos de cambio flotantes, éste varía constantemente movido por las fuerzas del mercado. El mercado de divisas es un mercado OTC (over-the-counter), es decir, un mercado descentralizado, no regulado, en el que las transacciones son bilaterales y no en la forma contraparte-mercado-contraparte. Esto quiere decir que no hay un único lugar en el que se intercambian divisas, sino que lo que es llamado mercado de divisas es en realidad un conglomerado de operadores del mercado interconectados unos con otros a través de una plataforma interbancaria. No hay una única cotización para un par de divisas, sino multitud de ellas ya que estas cotizaciones serán ofrecidas por multitud de contrapartes a las que se está conectado. En la práctica los arbitrajistas acaban explotando la mayor parte de posibles diferencias entre cotizaciones, haciendo que la mayoría de contrapartes disfruten de cotizaciones muy similares. No hay un lugar específico en el que se desarrolle toda la actividad del mercado de divisas pero sí que hay ciertas plazas financieras con relativa importancia en el volumen de operaciones. Según el Triennial Central Bank Survey [TRIE05] las más importantes según el porcentaje de operaciones del total son: - Londres: 31% - Nueva York: 19% - Tokio: 8% - Singapur: 5% 28
- Frankfurt: 5% - Hong Kong: 4% - Sidney: 3% - Zurich: 3% Otra característica importante del mercado de divisas es que opera las 24 horas del día y 365 días al año, aunque durante sábados y domingos la actividad es muy limitada. La siguiente figura, obtenida a través de la plataforma de divisas OANDA, muestra una gráfica OHLC del tipo de cambio EUR/USD entre el 19 de septiembre y el 27 de octubre de 2006, marcando entre líneas amarillas la actividad del fin de semana:
Figura 2.1.1 – Gráfico de OANDA. Entre barras amarillas los fines de semana.
2.2 Tipos de operaciones Dependiendo de las necesidades que deseemos cubrir, hay diferentes tipos de operaciones en el mercado de divisas.
29
Estas operaciones las podemos dividir en operaciones OTC y operaciones en mercados de derivados. Los derivados reciben este nombre porque son contratos sobre un subyacente (en este caso, las monedas) del que dependen o derivan y no se opera de forma directa sobre el mercado de divisas. Algunas otras características de los mercados de derivados son: - Los contratos se operan en mercados centralizados y organizados. El más importante en el caso de futuros sobre divisas es el CME (Chicago Mercantile Exchange) y en el caso de las opciones de divisas el CBOT (Chicago Board Of Trade). - Las operaciones son del tipo contraparte-mercado-contraparte y existe la figura de cámara de compensación, que liquida diariamente las pérdidas y ganancias y elimina el riesgo de impago de las contrapartes. Para ello se solicitan unas garantías (depósitos que avalen a cada una de las contrapartes) que deben estar cubiertas permanentemente. En caso de que en algún momento no se pueda cumplir con la garantía la operación es cerrada por la cámara de compensación, liquidando las pérdidas o ganancias. - Se manejan lotes o contratos de tamaño normalizado. - Las fechas de vencimiento de los contratos son también normalizadas, siendo mensuales o trimestrales y son establecidas por la autoridad del mercado. A continuación se explica los tipos de operaciones que pueden llevarse a cabo en el mercado de divisas: Operaciones OTC: - A plazo o forward: el comprador y el vendedor acuerdan llevar a cabo una transacción en una fecha futura, por un precio y cantidad de mutuo acuerdo. Esta operación al ser OTC es totalmente flexible en el tiempo y la cantidad, pero con riesgo de impago. Operaciones de este tipo suelen ser llevadas a
30
cabo normalmente por operadores comerciales/financieros que desean eliminar el riesgo de tipo de cambio en el futuro. Ejemplo: El comerciante A en Europa desea comprar al comerciante B en Japón una mercancía que debe pagar a 120 días por un total de 1.000.000 de yenes que al tipo de cambio de ese momento supone 10.000 euros. El comerciante A no quiere correr el riesgo de que el yen se aprecie en ese período y que acabe pagando una cantidad superior a los 10.000 euros. Por ello acude a los mercados con un contrato a plazo de 120 días y cantidad 10.000 euros por 1.000.000 de yenes. Independientemente de las variaciones del tipo de cambio en ese período, el comerciante A recibirá 1.000.000 de yenes por sus 10.000 euros al cabo de 120 días, evitando correr el riesgo del tipo de cambio. - Swap: en esta transacción dos contrapartes intercambian divisas y acuerdan el intercambio a la inversa en una fecha futura. Este tipo de operaciones es común entre los operadores especuladores. Ejemplo: Un especulador alemán prevé una caída de la corona sueca frente al euro durante el próximo mes mientras que un especulador en Suecia opina que el euro se depreciará frente a la corona sueca también durante el próximo mes. Los dos especuladores acuerdan entre ellos un intercambio de las coronas del sueco por los euros del alemán y realizar el intercambio inverso dentro de 30 días. Una vez que el alemán tiene coronas suecas las cambia inmediatamente en el mercado por euros (haciendo la operación contraria el sueco) y conserva su dinero en euros hasta que pasan los 30 días. En ese momento deberá devolver a su contraparte sueco sus coronas, por lo que cambia de nuevo euros por coronas en el mercado, devolviéndole exactamente la misma cantidad de coronas que le había proporcionado la contraparte 30 días atrás. Si la corona se ha depreciado entonces el especulador alemán habrá necesitado menos euros que los que recibió hace 30 días para devolver la misma cantidad de coronas, obteniendo así un beneficio económico. Viceversa en el caso del especulador sueco.
31
- Al contado o spot: es la forma más clásica, involucrando el cambio de una divisa por otra en el plazo de 2 días. Este plazo de entrega es un remanente del pasado, en el que 2 días era el plazo que tardaba en cambiar los fondos de un banco a otro. Las operaciones de este tipo pueden ser llevadas a cabo por cualquier tipo de operador, ya sea comercial/financiero o especulador. Para las operaciones de especulación actualmente no se respeta el plazo de 2 días de entrega sino que diariamente se cierra la posición y se reabre inmediatamente durante otras 24 horas, pudiéndose alargar de forma artificial la operación por tiempo ilimitado. Un ejemplo de operación especulativa podría ser el siguiente: Un operador especulador español predice una depreciación del dólar australiano frente al yen. Sin embargo el operador carece de yenes o dólares australianos, y aunque los tuviera lo que desea es beneficiarse de la forma más óptima de la variación en el tipo de cambio AUD/JPY que predice. Para llevar a cabo la operación, solicita lo que podría llamarse un préstamo de 100.000 dólares australianos. Estando el tipo de cambio a 80 AUD/JPY cambia sus dólares australianos por yenes, recibiendo un total de 8.000.000 de yenes. Al cabo de unos días el tipo de cambio baja hasta 78,05 AUD/JPY. El especulador considera que se han cumplido sus expectativas y decide cerrar la operación, por lo que cambia sus 8.000.000 de yenes por aproximadamente 102.500 dólares australianos después de aplicar el tipo de cambio del momento. En ese instante amortiza el préstamo de 100.000 AUD que tenía, recogiendo un beneficio de 2.500 AUD (menos los costes de operación). Como se ha podido ver, en este tipo de operación, el especulador se puede beneficiar de las variaciones en cualquier tipo de cambio sin ni siquiera disponer de ninguna de las
divisas
involucradas.
Actualmente
la
operación
al
contado
es
probablemente la más popular entre los especuladores en el OTC y será la que se utilice a lo largo de este proyecto para simulaciones de especulación. Operaciones en mercados de derivados - Futuros: son similares a la operación a plazo pero con la diferencia de que son contratos normalizados y se operan en mercados organizados. Entre los especuladores es de popularidad equivalente a las operaciones spot o al
32
contado. Diferencias adicionales a las ya explicadas en el modo de operar spot vs. futuros son los plazos de la operación (en futuros normalmente un máximo de 3 meses mientras que en spot los plazos son virtualmente ilimitados mediante el mecanismo explicado anteriormente) y la forma en la que se cobra/deduce el interés (en spot el interés se cobra o deduce diariamente mientras que en los futuros el diferencial de tipos de interés viene incluido en la cotización del contrato, no deduciéndose ni cobrándose en ningún momento interés). - Opciones: son un derecho a comprar o vender en un plazo específico una determinada divisa a un precio estipulado previamente. Por este derecho se paga una prima. Algunas de las posibilidades de uso más populares son: como seguro de tipo de cambio para comerciantes, como herramienta de cobertura a inversores y como instrumento de especulación directa. C. Maté y A. Oliva [MATE03] exponen métodos para calcular los precios de las opciones financieras según la volatilidad.
2.3 Magnitud del mercado y datos cuantitativos Según el Triennial Central Bank Survey (B.I.S., 2005) [TRIE05] el mercado de divisas tuvo un volumen medio diario de 1,9 billones de USD durante 2004, lo que le convierte en el mercado con mayor volumen de negocio del mundo.
Figura 2.3.1 – Volumen diario en miles de millones de USD
33
Según el citado estudio, en el 89% de las operaciones estuvo involucrado el USD, seguido por el EUR con el 37%, el yen con el 20% y la libra con el 17%. Hay que tener en cuenta que el USD ejerce de “moneda puente” en la mayoría de los tipos de cambios. Es decir, si un comerciante desea intercambiar pesos mexicanos por yenes, deberá cambiar primero sus pesos por dólares y luego sus dólares por yenes. Según Wikipedia [WIKI07] sólo hay una excepción a este uso del USD como moneda puente que es el caso del tipo de cambio EUR/JPY, en el que el tipo de cambio es directo entre euros y yenes. Otras fuentes bien informadas aseguran que también existen los tipos de cambio directos en el caso de EUR/GBP y EUR/CHF. De acuerdo con el artículo de The Wall Street Journal Europe (2/9/06 p. 20) [WALLS06] los mayores operadores del mercado de divisas durante 2005 fueron:
Puesto
Nombre
% de volumen total
1
Deutsche Bank
17.0
2
UBS
12.5
3
Citigroup
7.5
4
HSBC
6.4
5
Barclays
5.9
6
Merrill Lynch
5.7
7
J.P. Morgan Chase
5.3
8
Goldman Sachs
4.4
9
ABN AMRO
4.2
10
Morgan Stanley
3.9
Tabla 2.3.2 – Principales bancos por volumen de negociación
34
3. Redes neuronales artificiales en la predicción de tipos de cambio Este capítulo está basado en el artículo Forecasting foreign exchange rates with artificial neural networks: a review de W. Huang, K. K. Lai, Y. Nakamori y Shouyang Wang [HUAN04]. Se realizará una breve revisión sobre el uso de redes neuronales artificiales en la predicción de tipos de cambio. Se estudiarán los variados resultados obtenidos por distintos investigadores y se llegará a conclusiones sobre la utilidad y criticidad del uso de esta herramienta para el propósito de este proyecto.
3.1 Introducción Como se explicó en anteriores capítulos, los tipos de cambio están correlacionados con multitud de factores que interactúan de forma altamente compleja. Las series temporales de los tipos de cambio muestran alta volatilidad, ruido y no-linealidad; Fang et al. [FANG94] demostraron estructuras fractales en la formación de precios del mercado de futuros de divisas. Por ello, se ha investigado ampliamente la aplicación a la predicción de los mercados de divisas de modelos no-lineales, entre los que se encuentran las redes neuronales artificiales. Algunos modelos paramétricos no-lineales como el modelo de varianza aleatoria autorregresiva (ARV) aplicado por So et al. [SOLA99], el de heteroscedasticidad condicional autorregresiva (ARCH) por Hsieh [HSIE91], dinámica del caos por Peel y Yadav [PEEL95], han sido probados. Aunque estos
modelos
pueden
alcanzar
buenos
resultados
en
determinadas
circunstancias, su rendimiento no es satisfactorio en otras situaciones. Esto es debido a que estos modelos están restringidos a ser útiles en unos determinados patrones no-lineales, sin ser lo suficientemente generales para capturar todas las no-linealidades de la serie de datos.
35
Sin embargo, las redes neuronales artificiales son útiles a la hora de encontrar soluciones precisas en un entorno caracterizado por información parcial, compleja, ruidosa o irrelevante. Algunas de las características que hacen a las redes neuronales especialmente prácticas para este propósito son: - Son autoadaptativas. - Son capaces de generalizar. - Son no-lineales. Es por ello por lo que se ha dedicado multitud de recursos de investigación al uso de redes neuronales en la predicción de los tipos de cambio. En este capítulo se expondrán algunos de los resultados y enseñanzas obtenidos en el pasado.
3.2 Elección de información de entrada Generalmente, se puede escoger entre dos tipos de entradas a tener en cuenta. El primero son datos de entrada de tipo fundamental. Estos datos son factores económicos exógenos a la cotización de la divisa como pueden ser el producto interior bruto, el índice de precios al consumo, la balanza comercial, el tipo de interés, etc... El segundo tipo de datos de entrada son los datos de carácter técnico. Estos datos son los que pueden ser directamente extraídos (endógenos) del mercado de divisas: los máximos y mínimos del día, las series de cotizaciones de la divisa al cierre, la media móvil de la cotización, volúmenes de operaciones, el índice de fuerza relativa, volatilidad, etc... En el caso de las redes neuronales, en la mayoría de las ocasiones se utilizan entradas univariable, dependientes de la serie temporal, siendo así entradas de tipo técnico. Para ello se elige un determinado número de periodos que se van a introducir como entradas, creando una ventana móvil que se va desplazando por la serie temporal. Uno de los problemas encontrados es como seleccionar el tamaño apropiado de la ventana móvil; algunos autores realizan experimentos para resolver esta tarea mientras otros usan ideas empíricas intuitivas. Según Huang et al. [HUAN04], la ausencia de un método sistemático 36
para el diseño de las redes neuronales es probablemente la principal causa de las inconsistencias encontradas en los diferentes trabajos de investigación sobre predicción del mercado de divisas usando redes neuronales.
3.3 Preparación de los datos La dedicación empleada a la preparación de los datos es de importancia decisiva en la posterior velocidad de aprendizaje y calidad de las predicciones de la red neuronal. Algunas de las preguntas iniciales a responder son: 1.- ¿Hay suficientes datos disponibles? ¿Contienen los datos la información adecuada? 2.- ¿Cubren los datos disponibles el rango deseado? 3.- ¿Hay casos marginales que no están cubiertos por los datos? 4.- ¿Contienen los datos información irrelevante? 5.- ¿Existen combinaciones o transformaciones de las variables que describirían el problema de una forma más eficiente que las variables individuales en sí mismas? Una vez resueltas estas cuestiones, puede que sea necesario transformar o normalizar los datos. En otras investigaciones se han utilizado variadas transformaciones de los datos para este propósito. Tenti [TENT96] normaliza las entradas a media cero y dos desviaciones típicas. En el estudio de Hu et al. [HUTS99], todas las entradas son normalizadas linealmente a [0,1]. Lisi y Schiavo [LISI99] escalan linealmente la diferencia de los logaritmos de los datos en el rango [0,2, 0,8] para adaptarlos a la función sigmoidal de activación. Sin embargo, no hay consenso acerca de qué tipo de normalización debe ser utilizada. Tampoco, si quiera, acerca de si se debe usar normalización, pues los pesos de los arcos podrían contrarrestar el escalado. Shanker et al. [SHAN96] hallaron que la normalización no mejora los resultados cuando el tamaño de la muestra es suficientemente grande. Zhang y Hu
37
[ZHAN98] tampoco encontraron diferencias significativas entre el uso de datos normalizados y datos originales. Habitualmente el conjunto de datos es dividido en dos, el conjunto de entrenamiento y el conjunto de prueba. El conjunto de entrenamiento es usado para el ajuste de la red neuronal mientras que el conjunto de prueba se utiliza para comprobar la capacidad predictiva de ésta. En otras ocasiones se usa un tercer conjunto, denominado conjunto de validación. Yao et al. [YAOT00] sugieren el uso de los conjuntos de entrenamiento, validación y prueba, conteniendo respectivamente el 70%, el 20% y el 10% de los datos. Otro de los factores a tener en cuenta es el tamaño de la muestra. Para averiguar qué tamaño era óptimo para el entrenamiento, Zhang y Hu [ZHAN98] usaron dos tamaños de muestra diferentes para el entrenamiento. Finalmente concluyeron que el tamaño de muestra superior obtenía resultados mejores que el tamaño de muestra pequeño. Sin embargo, Kang [KANG91] encontró en otra investigación que no son necesarias muestras grandes para obtener un buen
rendimiento.
Walczak
[WALC01]
obtuvo
como
conclusión
que
generalmente 2 años de muestras son suficientes en series financieras.
3.4 Topologías de redes neuronales 3.4.1 Feedforward En este tipo de redes neuronales, las conexiones no forman ciclos. La arquitectura de este tipo más popular es probablemente el perceptrón multicapa
(MLP).
Las
principales
características
responsables
de
su
popularidad son: - Es relativamente fácil de implementar. - Genera respuestas a velocidad razonable. - Teóricamente es capaz de aproximar cualquier función no-lineal. 38
- Su velocidad de entrenamiento es aceptable comparada con otras redes más complejas. El MLP está formado por tres capas: capa de entrada, capa oculta y capa de salida. La capa oculta está formada por un número de neuronas arbitrario y puede ser a su vez dividida en más capas. Cada una de las capas tiene conexiones con la siguiente capa, pero no entre neuronas de la misma capa. El flujo de datos va desde la capa de entrada hasta la capa de salida.
capa de entrada
capa de salida capa oculta Figura 3.4.1 – Perceptrón multicapa
No hay un método preciso para escoger la estructura exacta del perceptrón multicapa por lo que debe ser utilizado un método de prueba y error o de cruce-validación. En este proyecto se estudiará el uso de algoritmos genéticos para la elección del tipo de estructura del perceptrón multicapa. Otras arquitecturas de tipo feedforward útiles para la predicción son:
39
- Redes de función de base radial (RBFN): estas redes usan una función gaussiana en las neuronas de la capa oculta. Generalmente tienen un tiempo de entrenamiento reducido, requiriendo menor tamaño muestral, y, a diferencia del perceptrón multicapa, no se bloquean en mínimos locales. - Redes neuronales de regresión general (GRNN): son redes con memoria basadas en estimaciones de funciones de masa de probabilidad. Tienen cuatro capas: capa de entrada, capa de patrón, capa sumatoria y capa de salida. Las GRNN muestran buen rendimiento en entornos ruidosos con suficientes datos. Como desventajas, tienen ciertos problemas con datos irrelevantes, necesitan tamaño muestral elevado y necesitan almacenar todas las muestras para la predicción. 3.4.2 Retroalimentación En las redes neuronales retroalimentadas se forman ciclos en las conexiones, de forma que los nexos no tienen porqué seguir una jerarquía específica. En este tipo de redes, cada vez que se introduce una entrada, la red neuronal debe iterar hasta generar la salida, siendo un proceso potencialmente lento. Las redes neuronales recurrentes pueden aprender patrones temporales extremadamente complejos, lo que es de gran utilidad para predicciones del mercado de divisas. Sin embargo, requieren un elevado número de conexiones, gran cantidad de memoria y un prolongado tiempo de entrenamiento debido a su poco ágil tiempo de respuesta.
40
Figura 3.4.2 – Red neuronal recurrente. Fuente: Bryan Davis http://plaza.ufl.edu/badavis/EEL6586/NeuralNetworks.html
3.5 Comparación del rendimiento con otros métodos de predicción A continuación se muestran los conclusiones alcanzadas por distintos investigadores acerca del uso de redes neuronales en la predicción de tipos de cambio. Algunos de los estudios que alcanzaron conclusiones positivas sobre el uso de redes neuronales fueron: - Weigend et al. [WEIG92]: el tipo de cambio estudiado fue DEM/USD. Usando un MLP obtuvieron mejores resultados que el modelo de paseo aleatorio.
41
- Wei y Jiang [WEIJ95]: mediante el uso de un MLP obtuvieron mejores resultados que mediante modelos AR(p), ARMA(p, q) y ARIMA(p, d, q) para el tipo de cambio GBP/USD. - Lisi y Schiavo [LISI99]: en términos de error cuadrático medio normalizado, el MLP se comportó mejor que el modelo caótico y el de paseo aleatorio, para un conjunto de 4 divisas. - Yao y Tan [YAOT00]: obtuvieron mucho mejores resultados mediante MLP que mediante ARIMA en 5 divisas. - Leung et al. [LEUN00]: usando GRNN obtuvieron mejores resultados que el modelo de paseo aleatorio y que funciones paramétricas de transferencia multivariación.
Seguidamente se enuncian algunos estudios en los que las redes neuronales obtuvieron resultados pobres o mixtos: - Episcopos y Davis [EPIS96]: en su estudio, redes de tipo MLP obtuvieron resultados similares que el modelo EGARCH, aunque superaron los resultados del paseo aleatorio. - Hu y Tsoukalas [HUTS99]: obtuvieron resultados mixtos comparando MLP con modelos MAV, GARCH, EGARCH, IGARCH, OLS y AVE para un variado grupo de divisas. Las redes neuronales no siempre se comportaron mejor que otros modelos. - Kuan y Liu [KUAN95]: usaron MLP y RNN contra el modelo de paseo aleatorio, obteniendo resultados mixtos. - Billio, Sartore y Toffano [BILL00]: en su estudio compararon redes neuronales, lógica borrosa, modelos GARCH, regimen cambiante y dinámica
42
del caos para la predicción de DEM/USD. Todos los modelos tuvieron comportamiento similar al paseo aleatorio excepto el de lógica borrosa. Después de revisar la literatura sobre el uso de redes neuronales en la predicción de tipos de cambio podemos concluir que las redes neuronales son una técnica a tener en cuenta a la hora de realizar predicciones, con resultados similares o superiores a otras técnicas. Por ello, se aplicará su uso en este proyecto.
43
4. Modelo de predicción mediante descomposición en subtendencias A lo largo de este capítulo se describirá un modelo de predicción basado en redes neuronales que utiliza la descomposición en subtendencias como característica original. Se expondrán sus fundamentos básicos así como sus resultados y conclusiones.
4.1 Introducción En los mercados financieros actúan una variedad de agentes con diferentes horizontes temporales. Cada uno de ellos se ve influido de forma distinta por las noticias o por la propia cotización, reaccionando de forma diferente ante los estímulos. Las motivaciones de los movimientos a muy corto plazo suelen ser diferentes a las motivaciones de los movimientos a largo plazo. Por ello, en este proyecto se ha decidido crear un modelo que descomponga la serie principal en diferentes subtendencias que representen de forma esquemática los horizontes temporales de los actores del mercado e intentar predecir de forma individual cada una de ellas para obtener finalmente una predicción global al combinarlas. Las ventajas que se esperan obtener mediante un modelo de este tipo son las siguientes: - Mejor ajuste específico, causando una mejora en el ajuste global. Es una estrategia de tipo “divide y vencerás”. Al entrenarse una red neuronal distinta para cada una de las subtendencias, se espera obtener una especialización que mejore significativamente los resultados globales. Es de esperar que los patrones para cada subtendencia sean distintos; la misión de cada una de las redes neuronales entrenadas es aprender estos patrones encontrados en su subtendencia para conseguir un resultado superior al aprendizaje que podría
44
llevar a cabo una red neuronal general trabajando sobre la serie temporal global. - Reducción del error global al combinarse los errores aleatorios de las subtendencias. Siendo los errores de las predicciones aleatorios y teniendo las diferentes subtendencias baja correlación entre ellas (como se demostrará más adelante), es de esperar que los errores de sus predicciones tengan también baja correlación unos con otros. Esto facilitaría una reducción del error combinado respecto al error global que cabría esperar. Los resultados que se exponen a lo largo de este capítulo son referentes a la puesta en práctica de este modelo con la cotización del tipo de cambio EUR/USD en períodos de 60 minutos desde 2003 hasta 2007. Estos datos han sido extraídos de la base de datos de Visual Chart.
4.2 Método de descomposición La realización de la descomposición se ha fundamentado en algunas de las ideas básicas de conocidos y efectivos métodos de descomposición de series temporales como el método del Censo II. Este método fue desarrollado por la Oficina del Censo de los Estados Unidos con Julius Shiskin [SHIS57] como principal contribuidor y es ampliamente reconocido. El método del Censo II actúa descomponiendo los datos originales en una serie ciclo-tendencia, una componente estacional y un error. Sin embargo, en el caso de datos financieros, es común en la literatura proponer modelos de predicción que actúen directamente sobre los valores de las series financieras, sin realizar transformación alguna para obtener estacionalidades de la serie. La mayoría de los modelos discutidos en el capitulo 3 así lo hacían. Esto es debido a que las series financieras, entre las que se incluyen los tipos de cambio, carecen de estacionalidad alguna ya que, según la teoría del mercado eficiente [FAMA70], de poder encontrarse algún tipo de estacionalidad, ésta sería explotada inmediatamente por los agentes del mercado incluyéndola
45
instantáneamente en el precio de los activos. Es por ello por lo que habitualmente se trabaja sobre los datos “crudos”. Una de las principales diferencias del método de descomposición aplicado aquí frente a otros métodos es que no se busca descomponer en una serie ciclo-tendencia, una componente estacional y un error, si no descomponer en una serie ciclo-tendencia y sucesivas subtendencias operando sobre la tendencia principal. El proceso es recursivo y acaba cuando la última subtendencia tiene un horizonte temporal de un período. El algoritmo es el siguiente: - Paso 1: Un alisado exponencial simple es aplicado a los datos originales para obtener la serie ciclo-tendencia (o T1 en el modelo desarrollado en este capítulo). El alisado exponencial es un método de suavizado para series temporales derivado de la media móvil. Se basa en el principio de que en predicción las observaciones más recientes son las que mejor servirán de guía para el futuro. Así pues, va reduciendo el peso de las observaciones a medida que son más antiguas, implicando una reducción exponencial de los pesos en el tiempo. Siendo Yt el dato observado en el período t y Ft el valor del suavizado exponencial en t, la estimación de Ft+1 se calcula como: Ft+1 = Ft + α(Yt – Ft), donde α es una constante entre 0 y 1 que determina el peso que tendrán las observaciones recientes. A menor α el suavizado será mayor. Para el cálculo de la serie ciclo-tendencia, se debe escoger un valor de
α suficientemente pequeño como para recoger únicamente las características a largo plazo de la serie temporal. El valor de α escogido las pruebas realizadas con la serie EUR/USD 60 min. fue de 0,00133. En la siguiente figura se muestra en rojo la serie original utilizada y en azul la serie ciclo-tendencia calculada:
46
Figura 4.2.1 - EUR/USD 60 min. 2003-2007 y alisado exponencial α=0.00133 (Τ1)
- Paso 2: Es calculada la diferencia entre el ciclo-tendencia y los datos originales, refiriéndonos a ella como D1. Para otras series económicas podría ser más recomendable calcular el ratio entre los datos originales y el ciclotendencia en lugar de la diferencia; para los tipos de cambio esto no es crítico ya que estos suelen oscilar en un rango limitado lo que hace que la diferencia entre los datos sea aceptable. - Paso 3: En este paso se calcula el alisado exponencial de la serie resultante en el paso 2, que denominaremos T2. Esta vez el valor de α debe ser superior al utilizado en el paso 1, pues se desea obtener las características de la serie a un plazo menor. En el modelo desarrollado en este capítulo se ha escogido como proporción entre los diferentes valores de α usados para el cálculo de cada una de las subtendencias un valor aproximado de Φ2, siendo Φ el número áureo:
αn = Φ2 αn-1
47
La razón para escoger esta proporción es que el número áureo es frecuentemente utilizado en el análisis técnico de los mercados como referencia para proporciones temporales y de precios. De cualquier forma, la elección de la proporción entre los diferentes valores de α usados en este método de descomposición requiere experimentación. La siguiente figura muestra en rojo la diferencia entre los datos originales y T1, denominada D1, y el alisado exponencial de ésta con α = 0,0035 (T2):
Figura 4.2.2 – D1 y T2 (α = 0.0035)
- Paso 4: Se calcula la diferencia entre D1 y T2 , siendo ésta D2. - Paso 5: Se halla T3, que es el alisado exponencial simple de D2 utilizando un valor de α aproximadamente Φ2 veces superior al valor de α usado en el calculo de la subtendencia anterior. - Paso 6: Los pasos 4 y 5 pueden ser repetidos, descomponiendo en nuevas subtendencias, mientras el valor de αn cumpla la relación: 48
Φ2 αn < 1 En el caso desarrollado en este capítulo, se calculó hasta T7, quedando un residuo final D7. A continuación se muestra en 3 gráficos los resultados obtenidos, con las 7 tendencias calculadas y el residuo final.
Figura 4.2.3
49
Figura 4.2.4
Figura 4.2.5
50
4.3 Aplicación de redes neuronales Una vez que la serie ha sido descompuesta, la próxima tarea es estudiar una forma adecuada de predecir cada una de las subtendencias. En este caso se escogió usar redes neuronales por sus ventajosas características ya explicadas en anteriores capítulos. El siguiente paso es escoger la topografía y parámetros más adecuados para nuestras redes neuronales, además de determinar si es necesaria alguna transformación en los datos y elegir un tamaño para el conjunto de pruebas. En el modelo desarrollado se ha usado una red neuronal para cada subtendencia pero todas ellas con las misma configuración. De cualquier manera, esta clase de modelo permitiría configuraciones más especializadas para cada una de las subtendencias. La pregunta inicial a responder es qué tipo de red neuronal se va a utilizar. En este caso se ha utilizado el perceptrón multicapa por su versatilidad y sencillez. Más adelante se pretende estudiar también la aplicación de las redes de función de base radial debido a su capacidad para evitar mínimos locales. Una nueva pregunta que puede plantearse es, ¿qué tipo de entrada recibirá de la red neuronal? La primera decisión tomada al respecto ha sido la elección de un modelo univariable. Como ha sido descrito por Huang et al. [HUAN04], gran parte de los modelos de predicción del mercado de divisas son univariables, recibiendo como entrada los datos retrasados de la serie a predecir. Esto es debido a que la cotización de las divisas incluye ya toda la información necesaria para su estudio según la hipótesis del mercado eficiente de E. Fama [FAMA70]. Seguidamente, se ha optado por un número de valores de entrada reducido. A cada red neuronal se le pasarán únicamente los 5 últimos valores de su subtendencia. Esta elección es debido al deseo de que la red neuronal 51
generalice
al
máximo
posible.
Incluir
excesivos
valores
puede
ser
contraproducente para nuestro interés. Otra cuestión relevante a decidir es el número de neuronas que formarán la capa o capas ocultas. De nuevo, un número pequeño de neuronas servirá mejor a nuestros propósitos ya que de lo contrario se corre riesgo de sobreajuste. Después de realizar pruebas con topografías de 6, 24 y 150 neuronas en la capa oculta, distribuídas en 1, 2 y 3 capas, se obtuvieron los mejores resultados en términos de error cuadrado medio con 6 neuronas en 1 única capa oculta. Tanto las neuronas de la capa oculta como la de salida, usan como función de transferencia la tangente hiperbólica sigmoidal ya que pruebas con otras funciones de transferencia dieron resultados insatisfactorios.
Figura 4.3.1
La siguiente pregunta a responder sería, ¿es necesaria alguna transformación o normalización de los datos de entrada? Shanker et al. [SHAN96] investigaron la efectividad de métodos de normalización lineales y estadísticos,
encontrando
que
no
necesariamente
desembocaban
en
resultados superiores. El Shazly et al. [ELSH97] aplicaron normalización y transformaciones a los datos para después descartarlos. Zhang y Hu [ZHAN98] no encontraron significativas diferencias entre los resultados usando datos normalizados y datos originales. Adicionalmente, todas las entradas que recibirán las redes tendrán valores estacionarios próximos a 0, excepto T1 ya que es la serie ciclo-tendencia. Por ello se ha descartado realizar transformaciones o normalizaciones en D7 y T2 a T7. Para el caso de T1 sin
52
embargo sí que se hará una pequeña transformación que consiste en calcular la diferencia de un valor con el anterior y utilizar el resultado como entrada. Por último, una de las elecciones que generó diferencias más notables en los resultados fue la elección de la función de entrenamiento. Las siguientes funciones fueron probadas: - Descenso del gradiente. - Descenso del gradiente con ritmo de aprendizaje adaptativo. - Descenso del gradiente con momento. - Descenso del gradiente con ritmo de aprendizaje adaptativo y momento. - BFGS Cuasi-Newtoniana. - Regularización bayesiana. - Gradiente conjugado con reinicios de Powell-Beale. - Gradiente conjugado con actualizaciones de Fletcher-Reeves. - Gradiente conjugado con actualizaciones de Polak-Ribiere. - Levenberg-Marquardt. - Secante de un paso. - Entrenamiento de orden incremental aleatorio. - Retropropagación resistente. De entre ellas, la función de entrenamiento de Levenberg-Marquardt obtuvo los mejores resultados, conjugando el error medio cuadrado más bajo con una buena velocidad de entrenamiento.
4.4 Resultados y conclusiones Una vez entrenadas las redes neuronales con el conjunto de entrenamiento, se analizan a continuación los resultados. El método para calcular la bondad de la predicción escogido es el error medio absoluto. Esto es debido a la relación directa que tiene con el retorno esperado de las predicciones si se operara en el mercado usándolas como directriz. Es común en la literatura usar este error como estimador de la bondad 53
de la predicción. Algunos otros trabajos que lo usan son entre otros los de Billio et al. [BILL00] Como referencia a superar su error, se comparará con el modelo del paseo aleatorio, del que algunos estudios, como los de Meese y Rogoff [MEES83], han demostrado su dificultad para ser superado. La siguiente tabla muestra el error medio absoluto de cada una de las redes neuronales, registrado en 1000 períodos, prediciendo individualmente la tendencia en la que está especializada: Tendencia E.M.A. Paseo aleatorio E.M.A. Red neuronal
Reducción
T2
2.6229e-005
3.0566e-006
88%
T3
4.3889e-005
6.6982e-006
85%
T4
6.5105e-005
1.6515e-005
75%
T5
1.2448e-004
4.0213e-005
68%
T6
1.9178e-004
9.4219e-005
51%
T7
2.7094e-004
1.9432e-004
28%
D7
6.7791e-004
5.2050e-004
23%
Tabla 4.4.1
Como se puede observar, los resultados son ampliamente satisfactorios a la hora de predecir las subtendencias de forma individual. El siguiente paso es hallar el sumatorio de las predicciones y calcular el error medio absoluto global de la superpredicción. Aquí sin embargo nos encontramos un resultado ciertamente sorprendente: el error medio absoluto del paseo aleatorio es inferior al error de la superpredicción. E.M.A. paseo aleatorio global = 8.0982e-004 E.M.A. superpredicción = 8.5938e-004 El resultado es ciertamente inesperado. Buscando las razones para que se produzca este incremento en el error al realizar el sumatorio, es encontrada
54
una fuerte correlación entre los errores de las predicciones individuales, lo que hace que al sumarlas se amplifique el error final. Correlación Error P7 – Error P8
0.9689
Error P6 – Error P7
0.9830
Error P5 – Error. P6
0.9887
Error P4 – Error P5
0.9958
Error P3 – Error P4
0.9971
Error P2 – Error P3
0.8856
No están todavía claras las causas de esta elevada correlación, que merece un estudio en mayor profundidad y requiere experimentación.
55
5. Combinación de modelos de predicción de valores extremos En este capítulo se expondrá el desarrollo llevado a cabo hasta alcanzar una conclusión positiva sobre un modelo de predicción de cierres, máximos y mínimos del tipo de cambio USD/JPY en períodos de un día.
5.1 Introducción: análisis estadístico de precios máximos, mínimos y de cierre Desde el influyente trabajo de Meese y Rogoff [MEES83], es ampliamente aceptado que los precios de cierre o retornos de los tipos de cambio siguen un modelo de paseo aleatorio. Sin embargo, la predicción de máximos y mínimos en un determinado período ha recibido inferior atención a pesar de ostentar utilidad práctica. La predicción de máximos y mínimos está relacionada con la forma en la que los operadores del mercado realizan operaciones basadas en el análisis técnico. Las predicciones podrían ser utilizadas como puntos de referencia para soportes y resistencias usados por los operadores. Por otro lado, desde un punto de vista econométrico, las series de máximos y mínimos tienen características particulares que hacen que no encajen de forma ortodoxa con los modelos habituales. Representan valores extremos alcanzados a lo largo del día y son observadas en períodos no equidistantes. Por ello, según Billio et al. [BILL00], pueden ser caracterizadas por familias no-estándar de distribuciones de probabilidad dimensional finita, lo que justifica el uso de modelos no-lineales, como son las redes neuronales.
56
Función de Autocorrelación (ACF) Uno de los estadísticos que más información aporta para identificar posibles modelos de predicción para una serie es la función de autocorrelación (ACF). Si comparamos Yt (el valor observado en t) con Yt-1 observaremos como de relacionados están dos valores consecutivos de una serie. Si calculamos la correlación entre una serie y ella misma con un retraso de un período, estamos hallando su autocorrelación a un período. La fórmula es la siguiente: n
∑ (Y − Y )(Y
t −k
t
rk =
t = k +1
n
∑ (Y − Y )
−Y )
2
t
t =1
Ecuación 5.1.1
Si realizamos la autocorrelación con retrasos 1, 2, 3... y tantos períodos como queramos, con todos estos valores juntos tenemos la función de autocorrelación (ACF). Esta función nos ayuda a ver si valores previos de la serie contienen información relevante sobre el siguiente valor o si, por el contrario, los valores pasados carecen de relación con los valores futuros. Debido a que la distribución de los coeficientes de autocorrelación se aproxima a una curva normal con media cero y error estándar 1/ n , a menudo se utiliza el valor ±1,96 / n como referencia (conocido como valor crítico) para considerar
autocorrelaciones relevantes, lo que significa que el 95% de los coeficientes de autocorrelación deberían de estar dentro de esos límites si fuera una serie aleatoria. Es habitual dibujar la función de autocorrelación en un correlograma en el que se grafica con líneas verticales los coeficientes de autocorrelación para cada retraso y con dos líneas horizontales el valor de referencia positivo y negativo para considerar las correlaciones relevantes. A continuación se puede
57
observar el correlograma del precio de cierre del USD/JPY en períodos de un día durante los 20 primeros retrasos:
Figura 5.1.2 – ACF de CIERRES de USD/JPY (períodos de un día)
En esta figura se puede ver que ningún retraso de los precios de cierre tiene una correlación elevada como para poder ser suficientemente interesante para explicar el próximo valor. A continuación se muestra la ACF (con hasta 20 retrasos) de los valores máximos diarios:
Figura 5.1.3 – ACF de MÁXIMOS de USD/JPY (períodos de un día)
58
En este caso sí hay una correlación suficientemente fuerte con la serie retrasada un período, lo que da una idea de que se encontrará información valiosa en el primer retraso para hacer predicciones del próximo valor. Seguidamente, se continúa dibujando la ACF de los precios mínimos diarios, con 20 retrasos:
Figura 5.1.4 – ACF de MÍNIMOS de USD/JPY (períodos de un día)
En esta función de autocorrelación, no hay un único valor destacado sino hasta 3 coeficientes de autocorrelación que sobrepasan los valores críticos y que por lo tanto deben ser tenidos en cuenta a la hora de establecer un modelo de predicción. Se recuerda que los valores críticos representan un intervalo en el que deberían de estar el 95% de los coeficientes si la serie fuera ruido blanco; en este caso no se alcanza esa cifra sino únicamente el 85%, lo que hace pensar que, en la serie de mínimos, hay información importante del futuro que se puede extraer del pasado. Función de autocorrelación parcial (PACF) En el caso de que haya una autocorrelación entre el valor en t y en t-1, también podría caber esperar que hubiera algún tipo de relación entre t-1 y t-2, así como entre todos los períodos que tuvieran el mismo único retraso de
59
diferencia entre sí. Es por ello por lo que se usa la función de autocorrelación parcial (PACF), que nos permite medir el grado de asociación entre Yt y Yt-k cuando los efectos de los retrasos 1, 2, 3, ... , k – 1 son eliminados. A continuación se puede observar la PACF de la serie de mínimos que se ha estudiado anteriormente:
Figura 5.1.4 – PACF de MÍNIMOS de USD/JPY (períodos de un día)
Como se puede deducir del correlograma, hay información adicional sobre el futuro más allá del primer retraso. Particularmente significativos son los retrasos 3 y 11. Tests de portmanteau: Ljung-Box-Pierce Los tests de portmanteau son un método para comprobar si un conjunto de coeficientes de autocorrelación son significativamente diferentes al conjunto que cabría esperar de una serie de ruido blanco. Uno de estos tests es el que está basado en el estadístico Q de BoxPierce, después revisado por Ljung y Box [LJUN78]. Siendo rk los coeficientes de autocorrelación, L el máximo retraso, y N el número de valores observados, el estadístico Q se desarrolla como sigue:
60
Ecuación 5.1.5
Aunque originalmente se concibió para probar que los residuos de un modelo de predicción eran ruido blanco y no se podía mejorar el modelo, también puede ser utilizado para probar si una serie puede ser predecible. Si la serie es ruido blanco, el estadístico Q tiene una distribución chi cuadrado con (L - m) grados de libertad, siendo m el número de parámetros en el modelo (en el caso de que no se haya probado ningún modelo, 0). En el caso de la serie de cierres para 20 retrasos y el 1% de significación, se acepta la hipótesis nula, ya que el estadístico Q es igual a 22,6761 mientras que el valor crítico basado en la distribución chi cuadrado es 37,5662. Sin embargo, para la serie de máximos con los mismos parámetros se rechaza la hipótesis nula, siendo Q 59,4729 frente al mismo valor crítico. En el caso de la serie de mínimos el estadístico Q es aún superior, 69,6126, rechazándose de nuevo la hipótesis nula y denotando una mayor información sobre el próximo valor mínimo en los 20 primeros retrasos que en el caso de la serie de máximos. Conclusión del análisis estadístico de los máximos, mínimos y cierres Como ha sido revelado con las diferentes herramientas utilizadas, se puede concluir que el pasado de la serie de cierres del USD/JPY contiene poca información sobre el futuro. Sin embargo la situación es más esperanzadora para las series de máximos y mínimos. Principalmente en el caso de los mínimos los retrasos anteriores parecen ser especialmente relevantes.
61
5.2
Predicciones
basadas
en
retrasos
consecutivos Usando como entradas los valores de retornos diarios retrasados de las series de cierres, máximos y mínimos, se ha construido dos grupos de perceptrones multicapa: el primero recibe como entradas los 5 últimos retrasos de la serie mientras que el segundo recibe los 20 últimos retrasos, todos ellos consecutivos. En estas redes neuronales se ha usado una capa oculta con 5 neuronas y una neurona en la capa de salida, la función de entrenamiento de LevenbergMarquardt y 250 épocas para el aprendizaje. Los datos utilizados han sido los valores normalizados de retornos de cierre, máximo y mínimo diario del tipo de cambio USD/JPY desde el 5-Ene1998 hasta 28-Feb-2007, haciendo un total de 2380 períodos de operativa. La forma de calcular el retorno diario es la siguiente:
rett =
Yt − Yt −1 Yt −1
Como conjunto de entrenamiento se ha usado aproximadamente los primeros dos tercios de los datos (1600 períodos). El conjunto de validación son los siguientes períodos. 5.2.1 – 5 retrasos inmediatos como entrada En el apartado anterior se ha podido ver como en la serie de cierres no había ningún coeficiente de autocorrelación notable en los primeros 20 retrasos, en la de máximos era notable el coeficiente del retraso 1 y en la de mínimos alcanzaban los valores críticos los retrasos 1, 3 y 11. Por ello, se ha decidido entrenar 3 perceptrones multicapa que reciben como entradas cada uno los 5 primeros retrasos de cada serie, ya que en esos retrasos hay 0
62
autocorrelaciones relevantes en los cierres, 1 en los máximos y 2 en los mínimos. Como medición de la precisión se ha usado el error absoluto medio (siendo EAMT el valor para el conjunto de entrenamiento y EAMV para el conjunto de validación ) y el porcentaje de aciertos de la dirección del movimiento (δT y δV). A continuación se muestra una tabla con comparaciones de estos valores normalizados para las predicciones de las redes neuronales (P) y la predicción del paseo aleatorio (RW) usado como referencia.
EAMT EAMV
δT δV
Pcierres 0,0800 0,0676 52,405 47,95
RWcierres 0,0837 0,0673 49,52 48,37
Pmáximos 0,0708 0,0613 55,39 50,86
RWmáximos 0,0741 0,0608 55,65 52,985
Pmínimos 0,0523 0,0417 56,43 54,77
RWmínimos 0,0545 0,0419 54,33 53,78
Tabla 5.2.1 – Precisión de predicciones con 5 retrasos
Como podemos observar, solamente en el caso de la predicción de mínimos se obtienen resultados consistentemente mejores que los del paseo aleatorio.
5.2.2 – 20 retrasos inmediatos como entrada Cuando son estudiados los 20 primeros retrasos en las respectivas ACF, se puede observar que en el caso de los mínimos hay 3 coeficientes, en vez de 2 como anteriormente, que superan el valor crítico, mientras que en los cierres y los máximos se mantiene el mismo número de autocorrelaciones relevantes que las ya encontradas en los 5 primeros retrasos. También hay que tener en cuenta que algunos coeficientes de los 20 primeros retrasos en estas series, a pesar de no alcanzar los valores críticos, sí se aproximan bastante por lo que es posible que el perceptrón multicapa encuentre nuevas relaciones y patrones. De la misma forma que en el modelo anterior, a continuación se muestran las mediciones de precisión de las nuevas predicciones basadas en
63
perceptrones multicapa que reciben como entrada esta vez los 20 últimos retrasos:
EAMT EAMV
δT δV
Pcierres 0,0733 0,0724 58,76 47,87
RWcierres 0,0837 0,0673 49,52 48,37
Pmáximos 0,0637 0,0668 59,14 50,26
RWmáximos 0,0741 0,0608 55,65 52,985
Pmínimos 0,0460 0,0437 57,32 50,5
RWmínimos 0,0545 0,0419 54,33 53,78
Tabla 5.2.2 – Precisión de predicciones con 20 retrasos
Como puede observarse en los resultados, aunque las predicciones dentro del conjunto de entrenamiento son francamente mejores que las conseguidas mediante el paseo aleatorio o las redes neuronales con 5 entradas, fuera de muestra la precisión se reduce dramáticamente. Para ninguna de las series se consigue una mejora consistente respecto al paseo aleatorio. Puede ser concluido que hay un cierto sobreajuste en las predicciones debido al aumento del número de entradas. Podemos deducir, como se enunció en el capítulo 2, que no siempre es positivo para la precisión añadir más datos de entrada en las redes neuronales, si no que pocos datos pero con altos coeficientes de autocorrelación son más adecuados
5.3 Predicciones basadas en retrasos con altos coeficientes de autocorrelación A raíz de la conclusión obtenida en el apartado anterior, una aproximación distinta al problema ha sido buscada a través de un cambio en la selección de entradas para las redes neuronales. En vez de utilizar entradas formadas por los retrasos inmediatamente anteriores al período a predecir, se ha realizado una selección de los retrasos con mayores coeficientes de autocorrelación en un horizonte de 300 períodos en un modelo y de 150 períodos en el otro.
64
5.3.1 – Predicción basada en ACF El primer modelo consiste en buscar los 3 retrasos con mayor valor en la ACF de 300 períodos de su serie. En los correlogramas se ha utilizado como valores críticos +/-3σ, implicando una confianza del 99,74%. A continuación son mostradas a título orientativo las funciones ACF de las serie de máximos, mínimos y cierres a 300 períodos:
Figura 5.3.1 – ACF de MÁXIMOS (izq.) y MÍNIMOS (dcha.)
Figura 5.3.2 – ACF de CIERRES
En el caso de la serie de cierres, fueron elegidos los retrasos 93, 115 y 263 como entradas. Sólo este último sobrepasa el valor crítico. En los máximos, las entradas seleccionadas fueron los retrasos 1, 94 y 248. Tanto el retraso 1 como el 94 son significativos con respecto al valor crítico. En la serie de mínimos, los tres retrasos seleccionados como entradas sobrepasan el valor crítico. Estos fueron el 1, 3 y 40.
65
Después del entrenamiento, se obtuvieron los siguientes resultados del análisis de precisión:
EAMT EAMV
δT δV
Pcierres 0,0827 0,0674 53,09 54,01
RWcierres 0,0837 0,0673 49,52 48,37
Pmáximos 0,0720 0,0612 56,21 52,71
RWmáximos 0,0741 0,0608 55,65 52,985
Pmínimos 0,0522 0,0415 56,28 55,91
RWmínimos 0,0545 0,0419 54,33 53,78
Tabla 5.3.3 – Precisión de predicciones basadas en ACF
Comparando estos resultados con los de la tabla 5.2.1, que era la que mejores resultados había arrojado hasta el momento, se puede observar que para todas las series se ha conseguido una mejora consistente en las predicciones del conjunto de validación. Especialmente interesante es la mejora en la predicción de dirección del movimiento de la serie de cierres, que supera ampliamente a la predicción del paseo aleatorio. El error absoluto medio también se ha visto reducido para todas las series, aunque sólo la predicción de mínimos obtiene un error inferior al del paseo aleatorio. Esto coincide con los resultados de la predicción del apartado 5.2.1.
5.3.2 – Predicción basada en PACF de cuadrados En este modelo se buscan los 5 retrasos con mayor coeficiente en la PACF de los 150 primeros períodos del cuadrado de las series. Se usa la PACF en vez de la ACF ya que se ha percibido influencia de las autocorrelaciones en los valores inmediatamente próximos a un retraso con alto coeficiente de autocorrelación. El objetivo de este modelo es realizar predicciones teniendo en cuenta relaciones en la volatilidad de la serie. A continuación se grafican las funciones de autocorrelación parcial con los valores críticos en +/-3σ (99,74% de confianza):
66
Figura 5.3.4 – PACF de los cuadrados de MÁXIMOS (izq.) y MÍNIMOS (dcha.)
Figura 5.3.5 – PACF de los cuadrados de CIERRES
En todas las funciones de autocorrelación parcial hay valores fuertemente destacados de los cuáles se eligieron los 5 con mayor valor absoluto. En el caso de la serie de cierres fueron elegidos los retrasos 1, 2, 68, 80 y 128. En el de la serie de máximos 1, 21, 59, 80 y 101. Y en la de mínimos 1, 18, 80, 81 y 128. En la siguiente tabla se puede ver la precisión de las predicciones obtenidas mediante este modelo:
EAMT EAMV
δT δV
Pcierres 0,0809 0,0674 52,53 52,84
RWcierres 0,0837 0,0673 49,52 48,37
Pmáximos 0,0709 0,0619 54,78 53,6
RWmáximos 0,0741 0,0608 55,65 52,985
Pmínimos 0,0525 0,0418 55,65 53,71
RWmínimos 0,0545 0,0419 54,33 53,78
Tabla 5.3.5 – Precisión de predicciones basadas en PACF de cuadrados
Se puede observar que los resultados son mixtos comparándolos con las predicciones anteriores. El δV de
Pmáximos es el mejor conseguido hasta el
momento. En el caso de Pcierres este valor es sensiblemente superior al del paseo aleatorio pero inferior al mejor conseguido hasta el momento (el del apartado 5.3.1). El EAMV es el mejor conseguido hasta el momento en la serie de cierres, mientras que en los demás es mejorable.
67
La principal ventaja de estas predicciones es que aportan una aproximación distinta al estar basadas en relaciones de la volatilidad, lo que puede resultar útil en un modelo de combinación de predicciones.
5.4 Mejoras mediante la función de entrenamiento cuasi-newtoniana BFGS Aunque la función de entrenamiento de Levenberg-Marquardt ha obtenido habitualmente los mejores resultados tanto en velocidad como precisión en los perceptrones multicapa entrenados hasta el momento en este proyecto, se han conseguido mejoras en algunos de los anteriores modelos usando la función de entrenamiento cuasi-newtoniana BFGS (en honor a Broyden, Fletcher, Goldfarb y Shanno). El paso básico del método de Newton es:
Ecuación 5.4.1
siendo
el vector de pesos actuales,
el gradiente actual y
la matriz
hessiana del índice de rendimiento con los pesos actuales de la red neuronal. Debido al coste computacional de la matriz hessiana, son usados los métodos cuasi-newtonianos que aproximan el valor de la matriz hessiana iterando. Éste es el caso de la función de entrenamiento BFGS.
5.4.1 – Mejoras en el modelo de 5 retrasos inmediatos A continuación se muestran las mejoras en la precisión conseguidas en las series de cierres y mínimos (no ha habido mejoras para la serie de máximos) mediante BFGS respecto al algoritmo de Levenberg-Marquardt. Para una mejor comprensión los errores han sido multiplicados por 10.000.
Nuevo
EAMT EAMV
821,92 671,90
Pcierres
Anterior
Nuevo
800,5 676,42
521,64 415,23
Pmínimos
Anterior
522,82 416,77 68
δT δV
50,09 53,36
52,405 47,95
56,86 56,07
56,43 54,77
Tabla 5.4.2
En el caso de las nuevas predicciones de cierres, se puede observar que incluso por primera vez se supera consistentemente los resultados del paseo aleatorio (ver tablas de los anteriores apartados). También se observa una mejora en la capacidad de generalización de la red neuronal, ya que aunque en el conjunto de entrenamiento se obtienen peores resultados que con la anterior función, los resultados son más estables en la validación. 5.4.2 – Mejoras en la predicción basada en la ACF En la serie de máximos se han conseguido mejoras significativas, mostrándose el siguiente cuadro comparativo: Pmáximos EAMT EAMV
δT δV
Nuevo
Anterior
723,85 605,87 56,06 54,47
720,46 612,31 56,21 52,71 Tabla 5.4.3
También aquí por primera vez es conseguida una mejora significativa en todas las mediciones con respecto al paseo aleatorio.
5.4.3 – Mejoras en la predicción basada en la PACF de los cuadrados Pcierres
Pmáximos
Nuevo
Anterior
Nuevo
Anterior
EAMT
797,55
809,5
728,25
709,06
EAMV
671,93
674,47
607,69
619,14
δT
52,49
52,53
52,89
54,78
δV
50,19
52,84
51,89
53,6
Tabla 5.4.4
En este caso, aunque haya habido una reducción en la precisión de la predicción de dirección del movimiento, sí se ha conseguido un aumento de la precisión en criterios de error absoluto medio, consiguiéndose en este modelo un error menor al del paseo aleatorio para las series de cierres y máximos.
69
5.5 Combinación de predicciones – Conclusiones Tras observar las correlaciones entre los errores de los distintos modelos se pudo comprobar como probablemente al combinar las predicciones se obtendrían resultados superiores. Es por ello por lo que se estudió de forma exhaustiva las posibles combinaciones a realizar, de las que se mostrarán en este apartado las que obtuvieron los resultados óptimos. Para ello se ha tenido en cuenta no sólo las posibles combinaciones de modelos sino también los resultados de aplicar una combinación de tipo lineal (una regresión múltiple) confrontada con una de tipo no-lineal como es una red neuronal. En el cálculo de las combinaciones se ha usado para la estimación de los parámetros, en el caso de la regresión, o el entrenamiento de la red neuronal el conjunto de los 1600 primeros valores, anteriormente utilizado para el entrenamiento, y para la medición de la precisión, los valores restantes (el conjunto de validación).
5.5.1 – Combinación de predicciones de cierres En la serie de cierres los mejores resultados han sido obtenidos mediante una regresión múltiple entre las predicciones realizadas en los apartados 5.3.1, 5.4.1 y 5.4.3: Pcierres = 0.0020 + 0.9657·P5.3.1 + 0.2620·P5.4.1 + 0.8665·P5.4.3 Ecuación 5.5.1
En la siguiente tabla se muestra la comparación de la precisión obtenida con respecto a la mejor predicción anterior (la predicción del apartado 5.4.1) Pcierres EAMT EAMV
δT δV
Combinación
Mejor Anterior
791,90 671,84 53,74 55,27
821,92 671,90 50,09 53,36 Tabla 5.5.1
70
5.5.2 – Combinación de predicciones de máximos En esta serie también se han obtenido los mejores resultados mediante un método lineal, una regresión múltiple entre las predicciones de los apartados 5.4.2 y 5.4.3: Pmáximos = 0.0008 + 0.6816·P5.4.2 + 0.7103·P5.4.3 Ecuación 5.5.2
La mejor predicción hasta el momento había sido la calculada en el apartado 5.4.2. En la siguiente tabla puede ser observado como la regresión múltiple obtiene una mayor precisión: Pmáximos EAMT EAMV
δT δV
Combinación
Mejor Anterior
717,66 603,44 56,33 55,78
723,85 605,87 56,06 54,47 Tabla 5.5.2
5.5.3 – Combinación de predicciones de mínimos A diferencia de las anteriores series, la serie de mínimos ha sido mejor predicha mediante una combinación no-lineal de predicciones realizada a través de un perceptrón multicapa de 5 neuronas en una única capa oculta y una neurona en la capa de salida. Las entradas que recibe la red neuronal son las predicciones para el siguiente período calculadas mediante los modelos de los apartados 5.3.1, 5.4.1 y un modelo como el del apartado 5.3.2 pero con función de entrenamiento BFGS que no ha sido descrito en el apartado 5.4 ya que no obtenía mejoras significativas con respecto a su predecesor entrenado con la función Levenberg-Marquardt.
71
A continuación se muestran los datos de precisión comparados con los obtenidos en el modelo del apartado 5.4.1 (hasta ahora la predicción óptima):
Pmínimos EAMT EAMV
δT δV
Combinación
Mejor Anterior
513,72 414,04 57,16 56,38
521,64 415,23 56,86 56,07 Tabla 5.5.3
72
6. Modelo de predicción de centro y radio Los valores extremos de un período de una serie temporal pueden ser tratados como datos de tipo intervalo los cuáles pueden ser definidos por un centro y un radio. Este enfoque ha obtenido buenos resultados en la predicción de series temporales, como se puede ver en Muñoz, Maté, Arroyo y Sarabia [MUÑO07]. Las dos variables centro y radio pueden ser predichas mediante modelos diferentes que mejor capturen sus características propias. En este capítulo se explicará el desarrollo de un modelo de predicción que combinando modelos de heteroscedasticidad condicional autorregresiva y redes neuronales obtiene mejoras significativas en la predicción.
6.1 Características de la distribución y volatilidad de las series financieras Las series financieras tienen características especiales que hacen que sean necesarios modelos específicos para explicar su comportamiento estadístico. Una de sus principales características es que la distribución de sus retornos observados tiene escaso apuntamiento o kurtosis. Comparándola con una distribución gaussiana se verifica un ensanchamiento de las colas, aumentando la probabilidad de observar valores extremos.
73
Figura 6.1.1 – Efecto de ensanchamiento de colas
Otras características especiales son las referentes a la volatilidad de la serie. En este caso, volatilidad significa la varianza condicional de los retornos del activo subyacente. La volatilidad es una medida importante para la evaluación del riesgo del activo. Algunas de sus características principales según Tsay [TSAY02] son: -
Clustering o agrupamiento: fuertes movimientos tienden a ser seguidos de fuertes movimientos, y cambios débiles tienden a ser seguidos de movimientos débiles. Una manifestación cuantitativa de este hecho es que aun siendo los retornos incorrelacionados entre sí, sus cuadrados suelen mostrar una correlación positiva que decrece en el tiempo como se puede observar en la siguiente figura:
Figura 6.1.2 – PACF de los retornos diarios al cuadrado de USD/JPY
74
-
La volatilidad evoluciona en el tiempo de una forma continua. Habitualmente los saltos en volatilidad son atípicos.
-
La volatilidad no diverge a infinito. Suele variar en un rango más o menos fijo, lo cual quiere decir estadísticamente hablando que a menudo la volatilidad es estacionaria. Para contemplar estas características, en 1982 Engle desarrolló el
modelo
de
heteroscedasticidad
condicional
autorregresiva
(ARCH)
[ENGL82], al que le siguieron varios modelos adicionales que introdujeron diferentes mejoras.
6.2 Modelos de heteroscedasticidad condicional 6.2.1 El modelo ARCH La idea básica del modelo ARCH [ENGL82] es que el retorno at corregido por la media es serialmente incorrelacionado pero dependiente, y que la dependencia de at puede ser descrita por una función cuadrática simple de sus valores pasados. Un modelo ARCH(m) contempla que at = σ t ε t ,
σ t2 = α 0 + α1at2−1 + ... + α m at2− m , donde {ε t } es una secuencia de variables aleatorias independientes e idénticamente distribuidas (iid) con media 0 y varianza 1 (habitualmente se considera que sigue una distribución normal o t-Student). A través de las ecuaciones del modelo se puede observar que grandes variaciones pasadas al cuadrado implicarán una elevada varianza condicional, tal como se ha descrito anteriormente que reaccionan los mercados. Esta característica es similar al clustering o agrupamiento de volatilidad. Por otro lado, de acuerdo a Tsay [TSAY02], para estudiar el comportamiento de las colas, es necesario que el cuarto momento de at sea finito. Asumiendo la normalidad de εt se tiene 75
E (at4 | Ft −1 ) = 3[ E (at2 | Ft −1 )]2 = 3(α 0 + α1at2−1 )2
siendo Ft-1 el conjunto de información disponible en el período t-1. Por tanto, E (at4 ) = E[ E (at4 | Ft −1 )] = 3E (α 0 + α1at2−1 )2 = 3E[α 02 + 2α 0α1at2−1 + α12 at4−1 ]
Si at es estacionaria de cuarto orden con m4 = E (at4 ) , entonces α m4 = 3[α 02 + 2α 0α1Var (at ) + α12 m4 ] = 3α 02 1 + 2 1 + 3α12 m4 1 − α1
Por lo que, 3α 02 (1 + α1 ) m4 = (1 − α1 )(1 − 3α12 ) lo que implica que, si el cuarto momento de at es positivo, α1 debe satisfacer la 1 condición 0 ≤ α12 < ; y que la kurtosis incondicional de at es 3
E (at4 ) 3α 02 (1 + α1 ) (1 − α1 ) 2 1 − α12 = × = >3 3 [Var (at )]2 (1 − α1 )(1 − 3α12 ) α 02 1 − 3α12 Por ello, el exceso de kurtosis de at es positivo y la distribución de la cola de at es más abultada que la que cabría esperar de una distribución normal. De esta forma los modelos ARCH se ajustan más a la realidad de las series financieras, recogiendo así otra de las características vistas en el apartado 6.1. 6.2.2 El modelo GARCH A pesar de que el modelo ARCH es sencillo, a menudo requiere muchos parámetros para describir con aceptable precisión la volatilidad de algunos activos financieros. Ello conduce a modelos ARCH de orden elevado que complican el cálculo con numerosos parámetros. Por ello se desarrollaron modelos adicionales que cubrían las debilidades de ARCH. Uno de los más
76
prácticos
es
GARCH
(heteroscedasticidad
condicional
autorregresiva
generalizada), resultado de los estudios de Bollerslev [BOLL86]. GARCH asume que la volatilidad puede ser descrita por un modelo ARMA (media móvil autorregresiva) de la siguiente forma
at = σ t ε t , m
s
i =1
j =1
σ t2 = α 0 + ∑ α i at2−i + ∑ β jσ t2− j para un modelo GARCH(m,s). Sin embargo, especificar el orden de un modelo GARCH no es sencillo. En la práctica se utilizan solamente modelos GARCH de orden bajo como GARCH(1,1), GARCH(1,2) y GARCH(2,1). La estimación de los parámetros del modelo se suele hacer por máxima verosimilitud. 6.2.3 Otros modelos de la familia ARCH A lo largo de los años diferentes investigadores han ido desarrollando nuevos modelos de tipo ARCH para contemplar características adicionales de las series temporales financieras. Un breve resumen con otros 3 modelos adicionales, según Maté y Oliva [MATE03] es mostrado a continuación: Modelo Autores Año Especificación de la varianza
Contribución principal
IGARCH
Engle
y
1989
Bollerslev
σ t2 = α 0 + β1σ t2−1 + (1 − β1 )Yt −21
Persistencia la
en
varianza
condicional. Modelo clave en la
métrica
del
riesgo. EGARCH
Nelson
1991
ln(σ t2 ) = (1 − α1 )α 0 + α1 ln(σ t2−1 ) + g (ε t −1 )
Para no
procesos normales.
Carácter asimétrico. Recoge el efecto
77
apalancamiento. GJR-
Glosten et
GARCH
al.
1993
σ t2 = α 0 + βσ t2−1 + αε t2−i + αt −iε t2−i
Diferenciación del parámetro en subida bajada.
y
en
Mayor
robustez a datos extremos.
Aunque estos modelos son útiles en determinadas circunstancias, el modelo GARCH(1,1) ha mostrado gran persistencia en muchas series temporales a pesar de su simplicidad. Particularmente para tipos de cambio Hansen y Lunde [HANS05] estudiaron cual sería el modelo de la familia ARCH que mejor predicción de la volatilidad tendría; su conclusión es contundente: de 330 modelos diferentes, GARCH(1,1) era el que mejor resultados obtenía siempre para tipos de cambio.
6.3 Análisis de intervalo El análisis de intervalo es un área introducida por Moore en 1966 [MOOR66], la cual asume que las observaciones de los datos en el mundo real o sus estimaciones son habitualmente incompletas o inciertas, por lo que no representan los datos reales de forma exacta. Por ello para obtener precisión los datos deben ser representados como intervalos que comprenden los valores reales. Algunos estudios, como Muñoz et al. [MUÑO07], han mostrado que el uso de datos de tipo intervalo en la predicción de series temporales es prometedor. Un intervalo puede ser representado por su límite superior e inferior, de la forma A = [a L , aU ] , o de forma equivalente, por su punto medio y radio, como
A = a C , a R , donde aC =
a L + aU a L − aU y aR = . 2 2
78
En el caso del mercado de divisas, el límite superior e inferior de un intervalo diario corresponderían con el máximo y el mínimo diario alcanzado. El modelo que se expone en este capítulo busca predecir ese intervalo en la forma centro y radio.
6.4 Predicción del radio mediante la volatilidad El tamaño del intervalo de cotización (o radio) de una serie financiera está directamente relacionado con su volatilidad implícita. En la siguiente figura se grafica el radio de los intervalos diarios de la serie USD/JPY frente a σt de la misma serie:
Figura 6.4.1 – Radio vs. Sigma
Como se puede observar en la figura, el radio del intervalo se podría definir como una medida tosca de la volatilidad (y viceversa). Según Hansen y Lunde [HANS05], GARCH(1,1) es insuperable para predecir la volatilidad de los tipos de cambio, por lo que se ha optado por este popular modelo para hacer las predicciones de la volatilidad. Hay literatura enorme acerca de la bondad de las predicciones de volatilidad de modelos de 79
la familia ARCH. Es por ello por lo que se ha considerado un modelo popular como GARCH(1,1) que en numerosas ocasiones ha sido demostrado ser una opción adecuada para series financieras debido, entre otras cosas, a su parsimonia. Siendo el radio φt del intervalo, calculado de la siguiente forma:
φt = (Ymax-Ymin)/2, se ha obtenido un ratio κ, entre el radio y el valor de sigma a lo largo de la serie estudiada del USD/JPY con el valor que sigue:
κ=
∑φ ∑σ
t
= 5,8879
t
Una vez halladas las predicciones de la volatilidad para cada período, estas son corregidas con el factor κ para obtener así una predicción del radio. El resultado es el siguiente:
Figura 6.4.2 – Radio (rojo) vs. Predicción radio con garch (azul)
Para medir la bondad de esta predicción se ha usado la U-Theil, calculada de la siguiente forma:
80
2
Yˆ − Y ∑ t +1 Y t +1 t U= 2 Yt +1 − Yt ∑ Y t
Si el valor de U es mayor que 1, la precisión es peor que la de la predicción consistente en usar el último valor observado como próximo valor predicho (conocida también como predicción ingenua o predicción del paseo aleatorio). Si es inferior a 1 entonces la precisión supera a la predicción del paseo aleatorio por lo que es un buen modelo. En este caso se han obtenido las siguientes medidas de precisión:
MAE (error absoluto medio) Predicción GARCH 0,1976 Paseo aleatorio 0,2543
MSE (error cua- U-Theil drático medio) 0,0965 0,8367 0,1378 1
Tabla 6.4.3 – Precisión de la predicción del radio
Según se puede contemplar en la tabla, la predicción GARCH nos es útil para predecir el valor del radio en el siguiente período ya que se obtiene una precisión sensiblemente superior a la obtenida mediante el modelo de paseo aleatorio.
6.5 Combinación de predicciones de radio mediante EWMA Habitualmente modelos diferentes tienen comportamientos mejores comparados unos con otros en diferentes instantes de una serie temporal. Una buena forma de aprovecharse de esa situación es ponderar más un modelo cuando está en “buena racha” y reducir su ponderación cuando otro modelo está obteniendo mejores resultados. Esta es la idea básica de Shin y Sohn [SHIN07], que desarrollan un sistema de combinación de predicciones que pondera éstas según el rendimiento reciente que hayan tenido. Basándose en este sistema de combinación, se ha combinado una predicción del radio mediante GARCH con otra mediante redes neuronales.
81
Para realizar la combinación se deseaba tener más en cuenta la precisión que cada uno de los dos modelos estaba obteniendo recientemente que su precisión histórica. Por ello se ha utilizado un alisado exponencial o media móvil exponencial (EWMA, exponentially weighted moving average) del error porcentual absoluto (APE, average percentual error): EWMAi ,t = λ APE + (1 − λ ) EWMAi ,t −1
en el que λ debe ser calculado por experimentación (a mayor λ más ponderación tendrá la precisión reciente). Una vez calculado el EWMA de cada modelo, se debe asignar los pesos w que va a tener cada predicción de la siguiente manera:
wi ,t =
EWMAi−,t1 N
∑ EWMA
−1 i ,t
i =1
siendo N el número total de predicciones a combinar, en este caso 2. Por último, las predicciones se combinan según el valor de los pesos calculados: N
Yˆcombinada = ∑ wi ,t yˆti i =1
De esta forma, el modelo que obtiene mejores rendimientos recientes es favorecido frente al que obtiene resultados más mediocres, consiguiéndose una óptima combinación dinámica según las circunstancias. En la siguiente tabla se puede comparar la precisión obtenida por el modelo GARCH individual frente a la precisión obtenida mediante la combinación basada en EWMA: MAE Predicción GARCH 0,1976 Predicción 0,1914 combinada EWMA
MSE
U-Theil
0,0965 0,0859
0,8367 0,7897
Tabla 6.5.1 – Precisión de la predicción GARCH frente a la combinación
82
Como se puede observar, se obtiene una mejora significativa de la precisión. Especialmente relevante es la reducción de la U-Theil.
6.6 Predicción del centro mediante perceptrón multicapa Para la predicción del centro se ha seguido una aproximación similar al problema a la de anteriores capítulos. Al perceptrón multicapa se le pasa como entradas los retornos diarios del centro del intervalo de cotización. En este caso recibe los retrasos 1, 3 y 40 de los centros, aunque la aplicación desarrollada al final de este proyecto hace predicciones también recibiendo los 5 últimso retrasos inmediatos de la serie de centros. A continuación se muestran datos sobre la precisión de la predicción en el conjunto de validación:
Predicción centro Paseo aleatorio
MAE 0,3609 0,3780
MSE 0,2100 0,2308
U-Theil 0,9538 1
Tabla 6.6.1 – Precisión de la predicción del centro
6.7 Resultados y conclusiones de la predicción del intervalo Uniendo la predicción del centro y el radio de los apartados anteriores, se obtiene la predicción del intervalo en la forma A = a C , a R
. Si pasamos
estos valores a la forma A = [a L , aU ] , se obtiene la predicción del máximo y mínimo diario. Calcular la precisión de estas predicciones se puede hacer por alguno de los métodos habituales para predicciones de valores puntuales. A continuación se muestra una tabla con la precisión de la predicción de máximos:
83
Predicción máximos Paseo aleatorio
MAE 0,3736
MSE 0,2312
U-Theil 0,879
0,4094
0,2992
1
Tabla 6.7.1 – Precisión de la predicción de máximos
Como se puede observar, este modelo obtiene una precisión superior a la de los modelos mostrados anteriormente en este proyecto. Más aún, la UTheil obtenida es significativamente mejor a la de varios modelos de predicción publicados en diferentes artículos. Seguidamente se muestra una tabla comparativa: Predicción
Meade
Shin & Sohn
Fernández-
centro-radio
[MEAD02]
[SHIN07]
Rodríguez et
GARCH+RN U
0,8790
al. [FERN99]* 0,9886
0,9633
0,811 , 0,908
Tabla 6.7.2 – Comparativa U-Theil
En el caso de la predicción de Fernández-Rodríguez se muestran dos valores: el mejor y el siguiente mejor. Se debe tener en cuenta que el estudio versaba sobre 9 tipos de cambio dirigidos (y no en libre flotación), los cuales además todos han desaparecido, y que, aunque uno de los tipos de cambio (florines holandeses, sustituido por el euro hace 8 años) obtuvo una medida de U-Theil muy buena, el siguiente tipo de cambio mejor obtuvo un valor muy superior, y tres tipos de cambio a los que se les aplicó el mismo modelo obtuvieron U-Theil mayores que 1. Otro artículo interesante para comparar es Billio et al. [BILL00] ya que se centra también en la predicción de valores extremos diarios. Sin embargo este artículo no muestra como medida de precisión la U-Theil y sólo muestra información sobre el error medio absoluto (MAE). Por ello para la comparación se ha calculado una U-Theil modificada denominada U*, hallada de la siguiente forma:
84
U* =
MAEP MAERW
El resultado es el siguiente: Predicción centro-
Billio et al. (2000)
radio GARCH+RN U*
0,9126
0,9481
Tabla 6.7.3 – Comparativa U*
De nuevo se puede observar como el modelo desarrollado en este capítulo obtiene mejores resultados. En el Apéndice B se ha construido una tabla con los valores predichos y los observados de una muestra que comprende los últimos 30 días del histórico de USD/JPY utilizado para las pruebas de este modelo. De este modo el lector puede comprobar con datos reales la bondad de las predicciones. Adicionalmente se muestra una figura a continuación con la evolución de una U-Theil a 60 días durante los 800 días de cotización del conjunto de validación (de 2-3-2004 a 26-2-2007), pudiéndose observar la fiabilidad a lo largo del periodo:
Figura 6.7.4 – Evolución de U-Theil a 60 días durante el período de validación
85
A la vista de los resultados obtenidos, puede concluirse que combinando dos modelos distintos para contemplar dos características específicas de los tipos de cambio, en este caso volatilidad (el radio, predicho con GARCH) y dirección del movimiento (el centro, predicho con redes neuronales), se consiguen resultados muy superiores a los obtenidos mediante un enfoque menos completo.
86
7. Interfaz de usuario para el modelo de predicción Se ha programado una interfaz gráfica para MATLAB para aplicar el modelo de predicción desarrollado en el capítulo 6. Aunque el modelo está pensado y sólo da predicciones precisas a un día (el día actual), la aplicación también muestra predicciones a 5 días (el día actual más 4 días posteriores), pero se debe tener en cuenta que éstas carecen de garantías de precisión. A continuación se documenta su funcionamiento.
7.1. Entorno de programación La interfaz ha sido desarrollada mediante el potente lenguaje matemático MATLAB y el lenguaje multiplataforma JAVA. La parte gráfica se ha construido mediante el entorno de desarrollo GUIDE de MATLAB.
7.2. Módulos de la aplicación • Archivo principal para la conexión al servidor de cotizaciones y lanzamiento de interfaces y módulos de predicción: prediccion.m
• Código MATLAB para el cálculo de predicciones: o Predeurus1d.m, predusdjp1d.m, predusdch1d.m, predgbpus1d.m, predeurgb1d.m
• Ficheros MATLAB para la administración de las interfaces gráficas: o Welcome.m o Predgui.m • Ficheros MATLAB de estructura y disposición de las ventanas gráficas: o Welcome.fig o Predgui.fig • Paquete JAVA de la API de OANDA: o Oanda_fxtrade.jar 87
• Archivo de variables de MATLAB con la red neuronal ya entrenada lista para ser usada por la aplicación: redes1dcentroradio.mat
7.3. Instalación y lanzamiento de la aplicación Los pasos a seguir para la instalación de la aplicación son los siguientes: 1. Descomprimir el fichero prediccion.zip en un directorio a la elección del usuario. Ej.: c:\prediccion 2. Arrancar MATLAB. 3. Seleccionar como directorio de trabajo el que contiene los ficheros de la aplicación. Ej.:
4. Escribir en la línea de comandos de MATLAB el comando “prediccion”. Nota: la versión de MATLAB debe contener las toolbox de GARCH, Neural Network y Financial.
88
7.4. Uso de la aplicación Después de la pantalla de bienvenida, la aplicación arranca mostrando los últimos 260 días de cotización de los tipos de cambio EUR/USD y USD/JPY:
Los gráficos mostrados para las cotizaciones son del tipo HLC (high, low, close), en color azul. Este tipo de gráfico muestra para cada período una barra vertical cuyo límite superior es el máximo del día, el inferior es el mínimo y una pequeña barra horizontal intermedia es el cierre. Se puede interactuar con las siguientes secciones: Currencies Muestra los posibles tipos de cambio a graficar y el número de períodos a ser mostrados. Se pueden graficar simultáneamente hasta 5 tipos de cambio. Estos aparecerán en el panel derecho de gráficos al pulsar el botón “Show”.
89
El número de períodos máximos a seleccionar es 260. El usuario debe tener en cuenta que cada vez que se presione el botón “Show” el panel de gráficos se borrará, eliminándose los gráficos de predicciones si los hubiera, y mostrando únicamente los gráficos de las divisas seleccionadas. Forecasting models Presionando el botón “Calculate” la aplicación calculará las predicciones de máximos y mínimos históricas, las del día de hoy y las de los 4 días siguientes (aunque hay que tener en cuenta que sólo los predicciones del día de hoy son fiables, pues son las únicas que obtienen medidas de precisión buenas), de las divisas que se muestran en ese momento en el panel de gráficos. Estas predicciones están basadas en el modelo de predicción GARCH+RN para centro y radio desarrollado en este proyecto. El cálculo puede tardar unos minutos, dependiendo del número de divisas seleccionadas. Los resultados se graficarán en el panel de gráficos, mostrándose con una línea verde la predicción de máximos y con una línea roja la predicción de mínimos. En el título de cada gráfico se muestran además los valores numéricos de las predicciones para el día de hoy, especificándose con una eme mayúscula (“M”) el máximo y una eme minúscula (“m”) el mínimo. A continuación se muestra el resultado del cálculo de la predicción para EUR/USD y USD/JPY:
90
En esta misma sección se puede observar también un menú despegable. Este menú está pensado para futuras ampliaciones y el usuario no le debe prestar mayor atención. Calculate accuracy ranking (all rates) Pulsando este botón el sistema realizará cálculos sobre la precisión de las predicciones en los 5 tipos de cambio mostrados y seguidamente mostrará un ránking con los valores de U-Theil calculados para las predicciones a un día (el día actual), obtenidos para las 5 divisas, ordenados de menor a mayor. Estos valores de U-Theil son para las predicciones de los últimos 30 días, y no para el período seleccionado o el histórico completo. Es así pues un indicador de en qué divisas están haciéndose más aciertos en las últimas semanas. Se debe tener en cuenta que el cálculo puedo durar unos minutos. A continuación se muestra el resultado que mostraría:
91
7.5. Correcto funcionamiento y resolución de problemas Se debe tener en cuenta que para ejecutar la aplicación se requiere conexión a Internet, pues las cotizaciones son descargadas en tiempo real a través del servidor externo de Olsen and Associates (oanda.com). Cuando en la línea de comandos de MATLAB se ejecuta el comando “prediccion” en la ventana de comandos se irá mostrando el estado de la conexión con oanda.com. Cuando la conexión se realiza con éxito, los mensajes mostrados serán como los siguientes:
NET: NET: NET: NET: NET: NET: NET: NET:
13:10:49 13:10:49 13:10:49 13:10:49 13:10:49 13:10:49 13:10:49 13:10:49
fxclient.login(): new session. logging in... login(): PROXY - creating new Net Connection... login(): host: fxgame-api.oanda.com login(): port: 80 login(): PROXY - creating new Net Connection... Done! login(): opening secure connection... login(): opening secure connection... Done! login(): making login request for user gabro84...
92
NET: 13:10:49 SecureConnection.write(): New session, begin key negotiations... NET: 13:10:50 SecureConnection.write(): New session, key negotiation complete! NET: 13:10:50 login(): making login request... Done! INF: 13:10:50 login(): creating rate table... INF: 13:10:50 login(): creating rate table... Done! Descargando histórico de cotizaciones...
Estos mensajes se mostrarán en color negro. Sin embargo, si ocurren errores en la conexión, puede que se muestren los siguientes mensajes en color rojo:
NET: 10:42:17 fxclient.login(): new session. logging in... NET: 10:42:17 login(): PROXY - creating new Net Connection... NET: 10:42:17 login(): host: fxgame-api.oanda.com NET: 10:42:17 login(): port: 80 NET: 10:42:17 login(): PROXY - creating new Net Connection... Done! NET: 10:42:17 login(): opening secure connection... NET: 10:42:19 login(): opening secure connection... Done! NET: 10:42:19 login(): making login request for user gabro84... NET: 10:42:19 SecureConnection.write(): New session, begin key negotiations... ***: 10:42:40 SecureConnection.open(): caught: java.net.ConnectException: Connection timed out: connect ***: 10:42:40 dorpc(): caught: java.net.ConnectException: Connection timed out: connect NET: 10:42:40 logging out ***: 10:42:40 fxclient.login(): caught: com.oanda.fxtrade.api.SessionDisconnectedException: Connection timed out: connect INF: 10:42:40 session.destroy() ??? Java exception occurred: com.oanda.fxtrade.api.SessionDisconnectedException: Connection timed out: connect at com.oanda.fxtrade.api.e.a(Unknown Source) at com.oanda.fxtrade.api.FXClient.login(Unknown Source) . Error in ==> prediccion at 14 fxclient.login('gabro84', 'upcomillas');
En ese caso se debe comprobar si la conexión a Internet funciona adecuadamente. Si ésta funciona correctamente, puede que el servidor de oanda.com esté ocupado y esté rechazando nuestra conexión. Para solucionarlo simplemente intentar de nuevo ejecutar el comando “prediccion”, tantas veces como sea necesario hasta conseguir conexión con oanda.com.
93
Por último, una vez obtenida la conexión, es posible que tras un tiempo de inactividad, la conexión con oanda.com se pierda. Los mensajes que se mostrarán en la ventana de comandos serán similares a los siguientes:
***: 13:13:43 SecureConnection.open(): caught: java.net.ConnectException: Connection timed out: connect ***: 13:13:43 dorpc(): caught: java.net.ConnectException: Connection timed out: connect NET: 13:13:43 logging out INF: 13:13:43 User.destroy() INF: 13:13:43 Account.destroy() INF: 13:13:43 RateTable.destroy()
De nuevo en este caso para solucionarlo, se debe reiniciar la aplicación ejecutando otra vez el comando “prediccion”.
94
III. Planificación y presupuesto 95
1. Planificación A continuación se muestra el diagrama GANT de la planificación del proyecto:
1. Revisión del estado del arte y documentación sobre tipos de cambio y mercados de divisas. 2. Revisión del estado del arte y documentación sobre métodos de predicción. Análisis y estudio estadístico de series de tipos de cambio. 3. Desarrollo del modelo de predicción basado en descomposición en subtendencias (capítulo II-4). 3. Desarrollo del modelo de predicción de combinación de redes neuronales para
predicción
de
valores
extremos
basado
en
autocorrelaciones
significativas en las series (capítulo II-5). 4. Desarrollo del modelo de predicción de centro y radio basado en GARCH y redes neuronales (capítulo II-6). 5. Implantación de la interfaz gráfica. 6. Documentación de los modelos de predicción
96
2. Presupuesto del proyecto El presupuesto de este proyecto ha sido desglosado según tres tipos de costes, que serán descritos en los siguientes apartados. Estos costes son:
•
Costes de ingeniería
•
Inversiones y costes materiales
•
Servicios y mantenimiento anual
2.1 Costes de ingeniería Para valorar los costes de ingeniería se debe tener en cuenta que la naturaleza del proyecto exige conocimientos multidisciplinares amplios. Estos conocimientos están englobados en la denominada ingeniería financiera, que, según Wikipedia [WIKI07] engloban matemáticas financieras, métodos numéricos y simulación informática, además de profundización en teoría económica. Adicionalmente se requieren también conocimientos específicos de inteligencia artificial, propios de la ingeniería superior en informática. Es por ello por lo que ha sido estimado un coste de 45€ por hora de trabajo. El tiempo empleado en el proyecto se muestra a continuación:
•
Documentación preliminar: 50 horas.
•
Entrevistas: 20 horas.
•
Análisis de los datos: 50 horas.
•
Desarrollo y programación: 300 horas.
•
Pruebas y depuración: 150 horas.
•
Documentación: 50 horas.
97
El
total
de
horas
trabajadas
es
620
horas,
equivalente
a
aproximadamente 77 días laborables con jornadas de 8 horas. Por ello, el coste final de ingeniería asciende a 27.900€.
2.2 Inversiones y costes materiales Las inversiones son principalmente dos: el equipo informático y el software matemático MATLAB. Dada la alta carga computacional, para el equipo informático es necesaria una elevada velocidad de proceso y es recomendable disponer de suficiente memoria RAM para operar con vectores y matrices de gran tamaño.
•
Dell Precision 390, Intel Core Duo E6600, 2 GB RAM: 1.349€
•
MATLAB: 2.000€ o Statistics toolbox: 1.100€ o Neural network toolbox: 1.100€ o GARCH toolbox: 1.100€
Total inversiones y costes materiales: 6.649€
2.3 Servicios y mantenimiento anual El principal coste anual será el derivado del uso del servicio API de OANDA (Olsen and Associates). Adicionalmente se ofertará un servicio de mantenimiento de la herramienta de predicción.
•
API de OANDA: 500€/mes
•
Mantenimiento de la aplicación de predicción: 300€/mes
Total servicios y mantenimiento anual: 9.600€/año 98
2.4 Presupuesto final La suma de los anteriores apartados genera un presupuesto total de 44.549€.
99
3. Herramientas utilizadas en el desarrollo del proyecto Se ha hecho uso de las siguientes herramientas: - El software matemático MathWorks MATLAB v. 7.1.0.246 y las toolbox que continúan: GARCH toolbox, Artificial Neural Network toolbox y Financial toolbox. - Bases de datos de históricos de cotizaciones de divisas, a destacar la base de datos de VCG VisualChart v. 3 de la que el alumno es suscriptor. - Hojas de cálculo Microsoft Excel v. 9.0.2812 para el tratamiento de los históricos de cotizaciones. - La plataforma de operaciones FXTrade de Olsen And Associates Ltd. (OANDA) para reproducir condiciones de operativa real en los mercados. La plataforma FXTrade es una de las más potentes del mercado, ofreciendo acceso directo al mercado interbancario, con operativa en 33 pares de divisas además del mercado al contado de oro y plata, todo ello en tiempo real. OANDA cedió gratuitamente su API (que habitualmente tiene un coste de $600/mes) para los fines de investigación de este proyecto. - JAVA v. 1.4.1.
100
IV. Conclusiones y desarrollos futuros 101
1. Conclusiones El estudio realizado en este proyecto comprende tres modelos originales diferentes que obtienen variados resultados. Son el resultado de una profundización en el estado del arte de la predicción de tipos de cambio. A pesar de la consideración habitual de que los tipos de cambio siguen un modelo de paseo aleatorio difícilmente batible, al menos uno de los modelos ha sido capaz de obtener resultados consistentes y generalizados tanto para distintos tipos de cambio como para diferentes períodos de actuación. Algunas de las conclusiones que pueden ser extraídas son: 1. Los precios de cierre diarios de las series de tipos de cambio tienen una elevada componente de aleatoriedad. No así los valores extremos del día, los máximos y
mínimos diarios. Difícilmente se obtienen
autocorrelaciones significativas en la serie de cierres mientras que sucede lo contrario en los máximos y mínimos. Esto provoca que sea más plausible obtener información sobre el futuro observando las series de máximos y mínimos que la de cierres. 2. La parsimonia es clave a la hora de obtener un modelo de predicción preciso capaz de generalizar. Aplicado a las redes neuronales esto significa utilizar arquitecturas lo más sencillas posibles, con un número reducido de entradas. En cuanto a la familia ARCH, el modelo GARCH(1,1) es de los más sencillos posibles y sin embargo a menudo es el que mayor precisión obtiene, habiendo incluso estudios que lo califican contundentemente como insuperable para los tipos de cambio. 3. Las series temporales financieras como son los tipos de cambio son complejas y habitualmente hay aspectos que no pueden ser capturados por un único modelo. Es útil, y casi se puede decir que obligatorio, utilizar más de un modelo de predicción para aproximar los diferentes aspectos de las series financieras. Seguidamente se pueden combinar los distintos modelos con un método dinámico como el basado en EWMA del capítulo 6.
102
4. La predicción de datos de tipo intervalo es prometedora y aporta un enfoque relativamente poco explorado en la predicción de tipos de cambio. El modelo desarrollado en el capítulo 6 es un ejemplo de aumento considerable de la precisión mediante el uso de intervalos expresados en forma de centro y radio. 5. Mediante la interfaz de usuario creada para facilitar el uso del modelo de predicción de centro y radio, se pueden realizar predicciones en otros tipos de cambio a parte del estudiado en esta memoria, obteniéndose precisión satisfactoria. Esto demuestra una capacidad generalizadora del modelo muy práctica.
103
2. Desarrollos futuros 1. Respecto al modelo del capítulo 4, una tarea interesante sería profundizar en el estudio de las causas de la correlación entre los errores de las predicciones de las diferentes subtendencias. En este proyecto no se ha encontrado una explicación sencilla a esta correlación;
teniendo
en
cuenta
que
la
correlación
entre
las
subtendencias es cercana a 0, no es trivial acceder a una conclusión sobre el motivo por el que la correlación entre los errores de sus predicciones es próxima a 1. 2. En el modelo del capítulo 6, aunque la predicción de los radios se hace mediante combinación de dos modelos, la predicción de los centros se hace usando exclusivamente una red neuronal. Utilizar modelos adicionales de predicción para el centro posiblemente mejore la precisión. 3. Es habitual encontrar correlaciones entre los diferentes tipos de cambio por lo que se debería valorar la posibilidad de mejorar las predicciones mediante
modelos
que
contemplen
más
tipos
de
cambio
simultáneamente. El uso de GARCH multivariante sería una opción a valorar para aumentar la precisión de las predicciones de radio del capítulo 6. 4. Contemplar medidas adicionales de valoración de los modelos. Hay extensa literatura sobre este tema. 5. La interfaz gráfica creada para MATLAB actualmente sólo realiza predicciones con el modelo del capítulo 6. Sin embargo está pensada para trabajar con varios modelos de predicción y ampliarla sería relativamente sencillo.
104
V. Bibliografía [BILL00]
Billio M., Sartore D., Toffano C., Combining forecasts: some results on exchange and interest rates, The European Journal of Finance, 6, (2000) 126
[BLAN04]
Blanchard, O.: Macroeconomics. Pearson Prentice Hall, New Jersey. 2004.
[BOLL86]
Bollerslev T. 1986. Generalized autoregressive heteroskedasticity. Journal of Econometrics 31: 307–327.
[CASS23]
Cassel, G.: Tract on Monetary Reform. London: T. F. Unwin. 1923.
[ELSH97]
M. R. El Shazly and H. E. El Shazly, Comparing the forecasting performance of neural networks and forward exchange rates, Journal of Multinational Financial Management 7 (1997) 345–356.
[ENGL82]
Engle RF. 1982. Autoregressive conditional heteroskedasticity with estimates of the variance of U.K. inflation. Econometrica 45: 987–1007.
[EPIS96]
A. Episcopos and J. Davis, Predicting returns on Canadian exchange rates with artificial neural networks and EGARCHM-M model, Neural Computing and Application 4 (1996) 168–174.
[FAMA70]
E. F. Fama,Efficient Capital Markets: A Review of Theory and Empirical Work. The Journal of Finance, Vol. 25, No. 2, Papers and Proceedings of the Twenty-Eighth Annual Meeting of the American Finance Association New York, N.Y. December, 28-30, 1969 (May, 1970), pp. 383-417.
105
[FANG94]
Fang, H., Lai, K.S. y Lai, M.: Fractal Structure in currency Future Price Dynamics. 169-181. 1994
[FERN99]
Fernández-Rodríguez, F., Sosvilla-Rivero, S. and Andrada-Félix, J. Exchange-rate forecasts with simultaneous nearest-neighbour methods: evidence from the EMS. International Journal of Forecasting 15, 383-392. (1999).
[HANS05]
Hansen, P.R. and Lunde, A. A forecast Comparison of volatility models does anything beat a GARCH(1,1)? Journal of Applied Econometrics 20: 873–889 (2005).
[HSIE91]
Hsieh, D. A., 1991. Chaos and nonlinear dynamics: Application to financial markets. Journal of Finance 46 (5), 1839–77.
[HUAN04]
W. Huang, K. K. Lai, Y. Nakamori y Shouyang Wang: International Journal of Information Technology & Decision Making, Vol. 3, No. 1 (2004) 145-165
[HUTS99]
M. Y. Hu and C. Tsoukalas, Combining conditional volatility forecasts using neural networks: An application to the EMS exchange rates, Journal of International Financial Markets, Institutions and Money 9 (1999) 407–422.
[KANG91]
S. Kang, An investigation of the use of feedforward neural network for forecasting, PhD Thesis, Kent State University, Kent, OH 44240, USA, (1991).
[KUAN95]
C. M. Kuan and T. Liu, Forecasting exchange rates using feedforward and recurrent neural networks, Journal of Applied Econometrics 10 (1995) 347–364.
106
[LEUN00]
M. T. Leung, A. S. Chen and H. Dauk, Forecasting exchange rate using general regression neural networks, Computer and Operations Research 27 (2000) 1093–1110.
[LISI99]
F. Lisi and PA. Schiavo, "A comparison between neural networks and chaotic models for exchange rate and predictions", Computational Statistics & Data Analysis, 30, 87-102, (1999).
[LJUN78]
Ljung, G.M. and Box, G.E.P.. On a measre of lack of fit in time series models, Biometrika, 65, 297-303.
[MATE03]
Maté, C y Olivas, A: II," Anales de Mecánica y Electricidad. vol. LXXX, no. I, pp. 56-64, January 2003
[MEAD02]
Meade, N. A comparison of the accuracy of short term foreign exchange forecasting methods. International Journal of Forecasting 18, 67-83. (2002).
[MEES83]
Meese, R. A. and Rogoff, K. S., Empirical exchange rate models of the seventies: Do they fit out of sample?, Journal of International Economics 14, (1983) 3-24.
[MOOR66]
Moore, R. E. Interval Analysis. Prentice-Hall: Englewood Cliffs, NJ, 1966.
[MUÑO07]
Muñoz A., Maté, C., Arroyo, J. and Sarabia, A. iMLP: Applying Multi-Layer Perceptrons to Interval-Valued Data. Neural Processing Letters, Volume 25, Number 2 / Pages 157-169. April, 2007.
[PEEL95]
Peel, D. A. y Yadav, P.: Empirical Economics.
[SAMU48]
Samuelson, P.A. y Nordhaus, W.D.: Economics. McGraw Hill, 1948.
107
[SHAN96]
M. Shanker, M. Y. Hu and M. S. Hung, E_ect of data standardization on neural network training, Omega 24(4) (1996) 385–397.
[SHIN07]
Shin, H. W. and Sohn, S.Y. Application of an EWMA combining technique to the prediction of currency exchange rates. IIE Transactions 39, 639-644. (2007).
[SHIS57]
Shiskin J., Electronic computers and business indicators, National Bureau of Economic Research, Ocassional Paper 57.
[SOLA99]
So M. K. P., Lam K., Li W. K., Forecasting exchange rate volatility using autoregressive random variance model, Applied Financial Economics
[TENT96]
Tenti, P: Forecasting Foreign Exchange Rates Using Recurrent Neural Networks. Applied Artificial Intelligence 10(6): 567-582 (1996)
[TRIE05]
Triennial Central Bank Survey. Bank for International Settlements. Basel, Switzerland. 2005.
[TSAY02]
Tsay, R.S. Analysis of Financial Time Series. John Wiley and Sons, New Jersey. 2002.
[WALC01]
S. Walczak, An empirical analysis of data requirements for financial forecasting with neural networks, Journal of Management Information System 17(4) (2001) 203–222.
[WALLS06] The Wall Street Journal Europe (2/9/06 p. 20). [WEIG92]
A. S. Weigend, B. A. Huberman and D. E. Rumelhart, Predicting sunspots and exchange rates with connectionist networks, in
108
Nonlinear Modeling and Forecasting, eds. M. Casdagli and S. Eubank (Addison-Wesley, Redwood City, CA, 1992), pp. 395–432. [WEIJ95]
W. X. Wei and Z. H. Jiang, Artificial neural network forecasting model for exchange rate and empirical analysis, Forecasting 2 (1995) 67–69.
[WIKI07]
Wikipedia: The Free Encyclopedia http://www.wikipedia.com
[YAOT00]
J. T. Yao and C. L. Tan, A case study on using neural networks to perform technical forecasting of forex, Neurocomputing 34 (2000) 79–98.
[ZHAN98]
G. Zhang and M. Y. Hu, Neural network forecasting of the British Pound/US Dollar exchange rate, Journal of Management Science 26(4) (1998) 495–506.
109
VI. Apéndices
110
Apéndice A Análisis estadístico de las series de tipos de cambio En este apéndice se muestra el análisis estadístico de las series de máximos, mínimos y cierres diarios de EUR/USD, USD/JPY, USD/CHF, GBP/USD, EUR/GBP. Los datos utilizados son valores observados entre 5-11998 y 30-5-2007. La información se muestra en tablas comparativas para facilitar su manejo. El software utilizado para esta tarea ha sido StatGraphics de StatPoint Inc.
La información mostrada en cada apartado es la siguiente:
•
Resumen estadístico
•
Percentiles
•
Gráficas: o Histograma de frecuencias o Traza de densidad o Box-Whisker o Gráfica de probabilidad normal o Gráfica de cuantiles o Simetría respecto a la mediana
111
A.1 Análisis de máximos diarios Resumen estadístico Máximos Media
EUR/USD
USD/JPY
USD/CHF
GBP/USD
EUR/GBP
1,14168
117,301
1,43918
1,6718
0,660158
8,88714
0,182467
0,162863
0,0321826
7,57637%
12,6786%
9,74181%
4,87499%
Desviación 0,137247 típica Coeficiente 12,0215% de variación Mínimo
0,8326
102,19
1,1374
1,3802
0,5789
Máximo
1,3681
147,65
1,8313
2,0132
0,7254
Rango
0,5355
45,46
0,6939
0,633
0,1465
14,8615
6,62386
3,56342
-6,03637
5,31318
-11,7963
-10,2636
-10,5969
Coeficiente -13,0631 de simetría Kurtosis
-9,34041
Percentiles Máximos EUR/USD
USD/JPY
USD/CHF
GBP/USD
EUR/GBP
1,0%
0,8565
103,2
1,1588
1,4137
0,5924
5,0%
0,884
105,37
1,2058
1,4296
0,6081
10,0%
0,9117
106,46
1,2269
1,4481
0,6147
25,0%
1,06
109,75
1,2723
1,559
0,6302
50,0%
1,1684
117,69
1,4052
1,647
0,6695
75,0%
1,2523
121,66
1,59825
1,8149
0,6867
90,0%
1,2993
129,48
1,7046
1,8978
0,6973
95,0%
1,3253
134,15
1,7401
1,9473
0,7038
99,0%
1,352
144,2
1,8006
1,988
0,7151
112
Histogramas y trazas de densidad Máximos
Tipo de
Histograma
Traza de densidad
cambio Density Trace 3
500
2,5
400
density
EUR/USD
frequency
Histogram 600
300 200
2 1,5 1 0,5
100
0
0 0,8
1
1,2
1,4
0,83
1,6
0,93
1,03
0,04
600
0,03
density
frequency
800
400 200
0,01
109
119
129
139
149
100
159
110
120
140
150
Density Trace
Histogram 500
2
400
1,6
density
frequency
130
_HIGH_
_HIGH_
300 200
1,2 0,8 0,4
100
0
0 1,1
1,3
1,5
1,7
1,1
1,9
1,3
1,5
1,7
1,9
_HIGH_
_HIGH_
Density Trace
Histogram 500
2
400
1,6
density
frequency
1,43
0
99
GBP/USD
1,33
0,02
0
USD/CHF
1,23
Density Trace
Histogram
USD/JPY
1,13
_HIGH_
_HIGH_
300 200 100
1,2 0,8 0,4
0 1,3
1,5
1,7
_HIGH_
1,9
2,1
0 1,3
1,5
1,7
1,9
2,1
_HIGH_
113
Density Trace
Histogram 12 10
400
density
EUR/GBP
frequency
500
300 200
8 6 4 2
100 0 0,57
0,6
0,63
0,66
0,69
0,72
0 0,57
0,75
0,61
0,65
0,69
0,73
_HIGH_
_HIGH_
Gráficas de Box-Whisker y probabilidad normal Máximos
Tipo de
Box-Whisker
Probabilidad normal
cambio Normal Probability Plot
percentage
Box-and-Whisker Plot
EUR/USD 0,83
0,93
1,03
1,13
1,23
1,33
1,43
99,9 99 95 80 50 20 5 1 0,1 0,83
0,93
1,03
percentage
USD/JPY 120
130
140
110
150
percentage
USD/CHF 1,5
_HIGH_
1,7
120
130
140
150
Normal Probability Plot
Box-and-Whisker Plot
1,3
1,43
_HIGH_
_HIGH_
1,1
1,33
99,9 99 95 80 50 20 5 1 0,1 100
110
1,23
Normal Probability Plot
Box-and-Whisker Plot
100
1,13
_HIGH_
_HIGH_
1,9
99,9 99 95 80 50 20 5 1 0,1 1,1
1,3
1,5
1,7
1,9
_HIGH_
114
Normal Probability Plot
Box-and-Whisker Plot percentage
99,9 99 95 80 50 20 5 1 0,1
GBP/USD
1,3
1,3
1,5
1,7
1,9
1,5
1,7
1,9
2,1
_HIGH_
2,1
_HIGH_
Normal Probability Plot
percentage
Box-and-Whisker Plot
EUR/GBP
99,9 99 95 80 50 20 5 1 0,1 0,57
0,61
0,65
0,69
0,73
_HIGH_ 0,57
0,61
0,65
0,69
0,73
_HIGH_
Gráficas de cuantiles y simetría Máximos
Tipo de
Cuantiles
Simetría
cambio Quantile Plot
proportion
EUR/USD
0,8 0,6 0,4 0,2 0 0,83
0,93
1,03
1,13
1,23
1,33
1,43
_HIGH_
distance above median
Symmetry Plot
1
0,4 0,3 0,2 0,1 0 0
0,1
Quantile Plot
0,6 0,4 0,2 0 110
120
130
_HIGH_
140
150
distance above median
proportion
0,8
100
0,3
0,4
Symmetry Plot
1
USD/JPY
0,2
distance below median
30 25 20 15 10 5 0 0
5
10
15
20
25
30
distance below median
115
Quantile Plot
proportion
USD/CHF
0,8 0,6 0,4 0,2 0 1,1
1,3
1,5
1,7
1,9
distance above median
Symmetry Plot
1
0,5 0,4 0,3 0,2 0,1 0 0
distance above median
proportion
0,8 0,6 0,4 0,2 0 1,3
1,5
1,7
1,9
0,1 0 0
0,1
0,4 0,2 0
_HIGH_
0,73
distance above median
proportion
0,6
0,69
0,2
0,3
0,4
distance below median
Symmetry Plot
0,8
0,65
0,5
0,2
Quantile Plot
0,61
0,4
0,3
2,1
1
0,57
0,3
0,4
_HIGH_
EUR/GBP
0,2
Symmetry Plot
Quantile Plot 1
GBP/USD
0,1
distance below median
_HIGH_
0,1 0,08 0,06 0,04 0,02 0 0
0,02
0,04
0,06
0,08
0,1
distance below median
116
A.2 Análisis de mínimos diarios Resumen estadístico Mínimos Media
EUR/USD
USD/JPY
USD/CHF
GBP/USD
EUR/GBP
1,13223
116,108
1,42451
1,65882
0,65508
8,7194
0,180071
0,161579
0,0328143
7,5097%
12,641%
9,74057%
5,00921%
Desviación 0,137408 típica Coeficiente 12,1361% de variación Mínimo
0,8227
101,26
1,1286
1,3682
0,5679
Máximo
1,3615
146,03
1,8121
2,0011
0,7204
Rango
0,5388
44,77
0,6835
0,6329
0,1525
13,9958
6,58981
3,63222
-6,72863
4,18776
-11,8729
-10,0532
-10,4749
Coeficiente -13,0679 de simetría Kurtosis
-9,38539
Percentiles Mínimos EUR/USD
USD/JPY
USD/CHF
GBP/USD
EUR/GBP
1,0%
0,847
102,12
1,1474
1,4004
0,5842
5,0%
0,8766
104,16
1,1936
1,4197
0,6014
10,0%
0,9009
105,46
1,2168
1,4366
0,6093
25,0%
1,0488
108,75
1,25925
1,5483
0,6247
50,0%
1,1566
116,5
1,38735
1,635
0,6645
75,0%
1,2442
120,43
1,5822
1,7989
0,6824
90,0%
1,2907
127,83
1,6841
1,8838
0,6927
95,0%
1,3153
132,71
1,7215
1,9315
0,699
99,0%
1,3428
141,42
1,7821
1,9768
0,7085
117
Histogramas y trazas de densidad Mínimos
Tipo de
Histograma
Traza de densidad
cambio Density Trace 3
500
2,5
400
density
EUR/USD
frequency
Histogram 600
300 200
2 1,5 1 0,5
100 0 0,79
0,99
1,19
1,39
0 0,82
1,59
0,92
1,02
density
frequency
300 200
0,02 0,01
0
0 99
109
119
129
139
149
100
110
120
_LOW_
140
150
Density Trace
600
2
500
1,6
400
density
frequency
130
_LOW_
Histogram
300 200
1,2 0,8 0,4
100 0
0 1
1,2
1,4
1,6
1,8
2
1,1
1,3
_LOW_
1,5
1,7
1,9
_LOW_
Density Trace
Histogram 500
2
400
1,6
density
frequency
1,42
0,03
400
100
GBP/USD
1,32
0,04
500
USD/CHF
1,22
Density Trace
Histogram 600
USD/JPY
1,12
_LOW_
_LOW_
300 200 100
1,2 0,8 0,4
0
0 1,3
1,5
1,7
_LOW_
1,9
2,1
1,3
1,5
1,7
1,9
2,1
_LOW_
118
Density Trace 10
400
8
density
EUR/GBP
frequency
Histogram 500
300 200 100
6 4 2
0 0,56
0,59
0,62
0,65
0,68
0,71
0 0,56
0,74
_LOW_
0,59
0,62
0,65
0,68
0,71
0,74
_LOW_
Gráficas de Box-Whisker y probabilidad normal Mínimos
Tipo de
Box-Whisker
Probabilidad normal
cambio Normal Probability Plot
percentage
Box-and-Whisker Plot
EUR/USD 0,82
0,92
1,02
1,12
1,22
1,32
99,9 99 95 80 50 20 5 1 0,1 0,82 0,92 1,02 1,12 1,22 1,32 1,42
1,42
_LOW_
_LOW_ Box-and-Whisker Plot
percentage
Normal Probability Plot
USD/JPY 100
110
120
130
140
150
99,9 99 95 80 50 20 5 1 0,1 100
_LOW_
percentage 1,5
_LOW_
130
140
150
Normal Probability Plot
USD/CHF 1,3
120
_LOW_
Box-and-Whisker Plot
1,1
110
1,7
1,9
99,9 99 95 80 50 20 5 1 0,1 1,1
1,3
1,5
1,7
1,9
_LOW_
119
Normal Probability Plot
percentage
Box-and-Whisker Plot
GBP/USD 1,3
1,5
1,7
1,9
99,9 99 95 80 50 20 5 1 0,1
2,1
1,3
1,5
1,7
1,9
2,1
_LOW_
Box-and-Whisker Plot
Normal Probability Plot
percentage
_LOW_
EUR/GBP 0,56 0,59
0,62
0,65 0,68
0,71 0,74
_LOW_
99,9 99 95 80 50 20 5 1 0,1 0,56
0,59
0,62
0,65
0,68
0,71
0,74
_LOW_
Gráficas de cuantiles y simetría Mínimos
Tipo de
Cuantiles
Simetría
cambio Quantile Plot distance above median
Symmetry Plot
EUR/USD
proportion
1 0,8 0,6 0,4 0,2 0 0,83
0,93
1,03
1,13
1,23
1,33
1,43
0,4 0,3 0,2 0,1 0 0
0,1
Quantile Plot
0,6 0,4 0,2 0 110
120
130
_LOW_
140
150
distance above median
proportion
0,8
100
0,3
0,4
Symmetry Plot
1
USD/JPY
0,2
distance below median
_HIGH_
30 25 20 15 10 5 0 0
5
10
15
20
25
30
distance below median
120
Quantile Plot
proportion
USD/CHF
0,8 0,6 0,4 0,2 0 1,1
1,3
1,5
1,7
1,9
distance above median
Symmetry Plot
1
0,5 0,4 0,3 0,2 0,1 0 0
_LOW_
0,1
Quantile Plot
0,6 0,4 0,2 0 1,5
1,7
1,9
2,1
distance above median
proportion
0,8
1,3
0,3 0,2 0,1 0 0
0,1
Quantile Plot
0,4 0,2 0,65
0,68
_LOW_
0,71
0,74
distance above median
proportion
0,6
0,62
0,2
0,3
0,4
Symmetry Plot
0,8
0,59
0,5
distance below median
1
0 0,56
0,4
0,4
_LOW_
EUR/GBP
0,3
Symmetry Plot
1
GBP/USD
0,2
distance below median
0,1 0,08 0,06 0,04 0,02 0 0
0,02
0,04
0,06
0,08
0,1
distance below median
121
A.3 Análisis de cierres diarios Resumen estadístico Cierres Media
EUR/USD
USD/JPY
USD/CHF
GBP/USD
EUR/GBP
1,13704
116,722
1,43165
1,66558
0,657578
8,80939
0,181306
0,162314
0,0325322
7,54732%
12,6642%
9,74517%
4,94727%
Desviación 0,137305 típica Coeficiente 12,0757% de variación Mínimo
0,8282
101,59
1,1303
1,3731
0,5733
Máximo
1,3646
147,16
1,8191
2,0088
0,7221
Rango
0,5364
45,57
0,6888
0,6357
0,1488
14,3553
6,59492
3,60583
-6,43504
4,7359
-11,8365
-10,1758
-10,5098
Coeficiente -13,0753 de simetría Kurtosis
-9,35821
Percentiles Cierres EUR/USD
USD/JPY
USD/CHF
GBP/USD
EUR/GBP
1,0%
0,8529
102,6
1,1524
1,4075
0,5886
5,0%
0,8808
104,79
1,1989
1,4252
0,6042
10,0%
0,9064
105,93
1,2221
1,4428
0,612
25,0%
1,0537
109,25
1,26665
1,5538
0,6276
50,0%
1,1614
117,17
1,39475
1,6403
0,6669
75,0%
1,2482
121,09
1,58825
1,807
0,6844
90,0%
1,2951
128,72
1,6941
1,8925
0,695
95,0%
1,3205
133,45
1,7307
1,9415
0,7014
99,0%
1,3468
142,57
1,7929
1,9831
0,7116
122
Histogramas y trazas de densidad Cierres
Tipo de
Histograma
Traza de densidad
cambio Density Trace 3
500
2,5
400
density
EUR/USD
frequency
Histogram 600
300 200 100
2 1,5 1 0,5
0 0,8
1
1,2
1,4
0
1,6
0,82
0,92
1,02
_CLOSE_
0,04
600
0,03
density
frequency
800
400 200
109
119
129
139
149
0
159
100
_CLOSE_
120
130
140
150
Density Trace
600
2
500
1,6
400
density
frequency
110
_CLOSE_
Histogram
300 200
1,2 0,8 0,4
100 0
0 1
1,2
1,4
1,6
1,8
2
1,1
1,3
_CLOSE_
1,5
1,7
1,9
_CLOSE_
Density Trace
Histogram 500
2
400
1,6
density
frequency
1,42
0,01
99
GBP/USD
1,32
0,02
0
USD/CHF
1,22
Density Trace
Histogram
USD/JPY
1,12
_CLOSE_
300 200 100
1,2 0,8 0,4
0 1,3
1,5
1,7
_CLOSE_
1,9
2,1
0 1,3
1,5
1,7
1,9
2,1
_CLOSE_
123
Density Trace 12
400
10
density
EUR/GBP
frequency
Histogram 500
300 200 100
8 6 4 2
0 0,56
0,59
0,62
0,65
0,68
0,71
0 0,57
0,74
_CLOSE_
0,61
0,65
0,69
0,73
_CLOSE_
Gráficas de Box-Whisker y probabilidad normal Cierres
Tipo de
Box-Whisker
Probabilidad normal
cambio Normal Probability Plot
percentage
Box-and-Whisker Plot
EUR/USD
99,9 99 95 80 50 20 5 1 0,1 0,82
0,92
1,02
1,12
1,22
1,32
1,42
_CLOSE_ 0,82
0,92
1,02
1,12 1,22
1,32
1,42
_CLOSE_ Normal Probability Plot
percentage
Box-and-Whisker Plot
USD/JPY 100
110
120
130
140
150
99,9 99 95 80 50 20 5 1 0,1 100
110
_CLOSE_
percentage
USD/CHF 1,3
1,5
_CLOSE_
130
140
150
Normal Probability Plot
Box-and-Whisker Plot
1,1
120
_CLOSE_
1,7
1,9
99,9 99 95 80 50 20 5 1 0,1 1,1
1,3
1,5
1,7
1,9
_CLOSE_
124
Normal Probability Plot
percentage
Box-and-Whisker Plot
GBP/USD
99,9 99 95 80 50 20 5 1 0,1 1,3
1,3
1,5
1,7
1,9
1,5
1,7
1,9
2,1
_CLOSE_
2,1
_CLOSE_
Normal Probability Plot
percentage
Box-and-Whisker Plot
EUR/GBP 0,57
0,61
0,65
0,69
99,9 99 95 80 50 20 5 1 0,1 0,57
0,61
0,65
0,69
0,73
_CLOSE_
0,73
_CLOSE_
Gráficas de cuantiles y simetría Cierres
Tipo de
Cuantiles
Simetría
cambio Quantile Plot
proportion
EUR/USD
0,8 0,6 0,4 0,2 0 0,82
0,92
1,02
1,12
1,22
1,32
1,42
distance above median
Symmetry Plot
1
0,4 0,3 0,2 0,1 0 0
_CLOSE_
0,1
Quantile Plot
0,6 0,4 0,2 0 110
120
130
_CLOSE_
140
150
distance above median
proportion
0,8
100
0,3
0,4
Symmetry Plot
1
USD/JPY
0,2
distance below median
30 25 20 15 10 5 0 0
5
10
15
20
25
30
distance below median
125
Quantile Plot
proportion
USD/CHF
0,8 0,6 0,4 0,2 0 1,1
1,3
1,5
1,7
1,9
distance above median
Symmetry Plot
1
0,5 0,4 0,3 0,2 0,1 0 0
_CLOSE_
0,1
Quantile Plot
0,6 0,4 0,2 0 1,5
1,7
1,9
2,1
distance above median
proportion
0,8
1,3
0,3 0,2 0,1 0 0
0,1
Quantile Plot
0,4 0,2
_CLOSE_
0,69
0,73
distance above median
proportion
0,6
0,65
0,2
0,3
0,4
Symmetry Plot
0,8
0,61
0,5
distance below median
1
0 0,57
0,4
0,4
_CLOSE_
EUR/GBP
0,3
Symmetry Plot
1
GBP/USD
0,2
distance below median
0,1 0,08 0,06 0,04 0,02 0 0
0,02
0,04
0,06
0,08
0,1
distance below median
126
Apéndice B Muestra de valores observados y predichos según el modelo de predicción de centro y radio A continuación se expone una muestra del histórico utilizado para el modelo del capítulo 6 con las predicciones y medidas de precisión obtenidas para la muestra, consistente en los 30 días de cotización del USD/JPY desde 16-1-2007 hasta 26-2-2007.
Predicción Error Predicción GARCH+ Error^2 ingenua Máximo del día máximo Error p. Error^2 p. GARCH+RN RN GARCH+RN máximo ingenua Ingenua observado Fecha 20070116 120,77 120,6864 -0,0836 0,00698896 120,61 -0,16 0,0256 20070117 120,88 120,8713 -0,0087 7,569E-05 120,77 -0,11 0,0121 20070118 121,59 121,0046 -0,5854 0,34269316 120,88 -0,71 0,5041 20070119 121,48 121,5176 0,0376 0,00141376 121,59 0,11 0,0121 20070122 121,79 121,7253 -0,0647 0,00418609 121,48 -0,31 0,0961 20070123 121,75 121,956 0,206 0,042436 121,79 0,04 0,0016 20070124 121,79 121,774 -0,016 0,000256 121,75 -0,04 0,0016 20070125 121,3 121,5281 0,2281 0,05202961 121,79 0,49 0,2401 20070126 121,65 120,9755 -0,6745 0,45495025 121,3 -0,35 0,1225 20070129 122,19 122,007 -0,183 0,033489 121,65 -0,54 0,2916 20070130 122 122,2821 0,2821 0,07958041 122,19 0,19 0,0361 20070131 121,74 122,0641 0,3241 0,10504081 122 0,26 0,0676 20070201 120,91 121,4062 0,4962 0,24621444 121,74 0,83 0,6889 20070202 121,54 120,7149 -0,8251 0,68079001 120,91 -0,63 0,3969 20070205 121,17 121,6884 0,5184 0,26873856 121,54 0,37 0,1369 20070206 120,57 121,0128 0,4428 0,19607184 121,17 0,6 0,36 20070207 120,81 120,5279 -0,2821 0,07958041 120,57 -0,24 0,0576 20070208 121,44 120,8827 -0,5573 0,31058329 120,81 -0,63 0,3969 20070209 122,09 121,5988 -0,4912 0,24127744 121,44 -0,65 0,4225 20070212 122,05 122,1575 0,1075 0,01155625 122,09 0,04 0,0016 20070213 121,86 122,2795 0,4195 0,17598025 122,05 0,19 0,0361 20070214 121,37 121,7882 0,4182 0,17489124 121,86 0,49 0,2401 20070215 120,75 121,2656 0,5156 0,26584336 121,37 0,62 0,3844 20070216 119,57 120,1374 0,5674 0,32194276 120,75 1,18 1,3924 20070219 119,73 119,5427 -0,1873 0,03508129 119,57 -0,16 0,0256 20070220 120,35 120,0279 -0,3221 0,10374841 119,73 -0,62 0,3844 20070221 121,19 120,5315 -0,6585 0,43362225 120,35 -0,84 0,7056 20070222 121,64 121,0575 -0,5825 0,33930625 121,19 -0,45 0,2025 20070223 121,63 121,9235 0,2935 0,08614225 121,64 0,01 0,0001 20070226 121,07 121,7267 0,6567 0,43125489 121,63 0,56 0,3136 Suma Suma error^2 5,52576493 error^2 7,5572 U-Theil
0,855097713
127