UNIVERSIDAD NACIONAL ´ A DISTANCIA DE EDUCACION
Introducci´ on o n a la Teor eor´ıa de la Deci Decisi si´ ´ on on
Autor: Ricardo Rica rdo V´elez elez Ibarro Iba rrola la Departamento Departam ento de Estad´ıstica, ıstica, Investigaci´on on Operativa y C´ alcu al culo lo num´erico eri co
UNED
Introducci´ on on Decidir es parte inherente de la actividad humana. Desde los individuos que se plantean la compra de un coche, de una casa o simplemente acuden al supermercado, hasta los Gobiernos, que deben elegir su pol´ pol´ıtica, los proy p royectos ectos legislativos que promover´ an y la forma de gastar sus presupuestos, pasando an por las corporaciones que han de escoger d´onde onde realizar sus inversiones o bien que productos fabricar y c´omo omo organizar su producci´ on, on, la acci´ on o n de todos ellos consiste constantemente en adoptar decisiones con una repercusi´ on on directa en su ´exito exito o en su fracaso. Siempre que se disponga de diversas alternativas o de diferentes cursos de acci´on, on, se impone pronunciarse por uno de ellos y descartar los dem´as. as. La Teor´ Teor´ıa de la Decisi´ Deci si´on, on, que se introduce a lo largo de este texto, analiza la forma de llevar a cabo tal selecci´on on de acuerdo con principios de racionalidad , en lugar de fiar el resultado al “olfato” o la “buena fortuna” del decisor. decisor. Se trata, trata, por tanto, tanto, de una teor´ teor´ıa normativa que pretende aportar normas para escoger entre diferentes alternativas. Naturalmente, para ello se utilizan u tilizan t´ecnicas ecnicas matem´ aticas aticas y, m´ as as concretamente, concreta mente, estad´ısticas. ıstica s. Es relevante, a este prop´osito, osito, la distinci´ on de R.A. Howard entre “buenas deon cisiones” y “decisiones afortunadas”: Para los que ganaron el primer premio en la ultima u ´ltima loter´ loter´ıa de Navidad, la decisi´ on on de comprar su n´ umero umero fue una decisi´ on on providencial; sin embargo, para la may mayor or´´ıa de los jugadores fue una mala decisi´ on, con un coste que no les aport´o ning´ on, un beneficio. En este senun tido, jugar a la loter´ loter´ıa debe considerar considerarse se una mala decisi´ decisi´ on, aunque s´olo olo sea porque s´olo olo se reparte en premios un escaso porcentaje de la cantidad recaudada. recauda da. Un resultado res ultado afortunado afortun ado es aqu´ a qu´el el que desear´ d esear´ıamos ıamos que o curriese; una buena decisi´ decisi´ on es la que, sobre la base de las incertidumbres, beneficios on y preferencias del decisor, garantiza un alto porcentaje de posibles buenos resultados. resultados. La decisi´ decisi´ on on involucra la selecci´ on del cirujano que realizar´a una on delicada delicada operaci´ operacion o´n quir´ urgica; urgica; el ´exito exito o el fracaso de la cirug´ cirug´ıa s´ olo olo interviene a trav´ trav´es es de las probabilidades de ambas eventualidades en cada caso, posiblemente junto a otras consideraciones de costos, plazos, etc. i
Normalmente, la toma de decisiones se concentra en ciertos periodos cruciales. En cualquier actividad empresarial hay momentos en los que es preciso optar entre varias alternativas y periodos en los que se implementa y explota la alternativa escogida. El an´ alisis de decisiones provee de procedimientos alisis l´ ogicos para hacer un balance de los factores que influyen en las decisiones, ogicos incorporando las incertidumbres, valoraciones y preferencias en un modelo estructural que se presta al estudio y al c´alculo, alculo, frecuentemente mediante programas de ordenador. Suele distinguirse en la pr´ actica actica entre la fase de preparaci´on on del problema y la fase de resoluci´on. on. Muchos manuales pr´acticos acticos insisten en que la fase de preparaci´ preparaci´ on o n es m´ as a s cost costos osa, a, en tiem tiempo po y en recu recurs rsos os,, que que la fase fase de resoluci´ on. De hecho, es en la fase de preparaci´on on. on en la que hay que investigar detenidamente: a) todas las posible p osibless alternativ alternativas as u opciones; opciones; b) todas las posibles consecuenc consecuencias ias de cada opci´ on; on; c) la asignaci asignaci´ on o´n de valoracione valoracioness o utilidades utilidades a cada posible p osible consecuenc consecuencia, ia, frecuentemente frecuentemente averiguando averiguando las preferencias, no expl´ expl´ıcitas inicialmente, de los responsables; d) la selecci selecci´ o´n de las variables de estado responsables de que cada opci´ on on on tenga una u otra consecuencia; e) las relaciones relaciones entre entre las distintas distintas variables variables de estado; estado; f ) las incertidumbres y verosimilitudes verosimilitudes relativas relativas a las variables de estado, basadas normalmente en las opiniones subjetivas de los expertos; g) la expres expresi´ i´ on on del modelo probabil´ probabil´ıstico acerca de las variables variables de estado que resulta de lo anterior. Todo ello permitir´ a establecer un modelo matem´ atico atico de decisi´ on, o n, al que aplicar la fase de resoluci´ on. Ni que decir tiene que los errores en el planon. teamie teamient ntoo del modelo modelo pueden pueden traduc traducirs irsee en errore erroress grave gravess en la decisi decisi´ on o´n adoptada. Aunque, como es habitual, la teor´ teor´ıa matem´ atica no detecta errores de planteamiento (salvo que produzcan inconsistencias) y determina la soluci´ on de cada modelo como si fuese adecuado para la realidad que se on estudia. Hist´ oricamente, oricamente, pueden rastrearse antiguos antecedentes antecedentes de la teor´ teor´ıa de la decisi´ on en las discusiones de Daniel Bernoulli y Laplace acerca de la utilidad on ii
esperada. Sin embargo, como cuerpo de doctrina independiente, la Teor´ıa de la Decisi´ on naci´ o con los trabajos de Abraham Wald, en los a˜ nos 1940, cuya intenci´ on era presentar un marco conceptual muy general de los m´ etodos de Inferencia estad´ıstica desarrollados previamente. Los resultados de von Neumann y Morgenstern (1947), acerca de la expresi´on de las preferencias de un decisor racional en forma de una funci´on de utilidad, sirvieron para proporcionar una base s´olida a la teor´ıa. Para finales de los a˜ nos 1970, la Teor´ıa de la Decisi´on hab´ıa alcanzado su periodo de madurez, como prueban las primeras ediciones de los textos: (1) Ferguson, Thomas S.: Mathematical Statistics. A decision theorethic approach. Academic Press, 1967. (2) Blackwell, David – Girshick, Meyer A.: Theory of games and statistical decisions . 1a ed. Wiley, 1954; 2a ed. Dover 1979. (3) De Groot, Morris H.: Optimal Statistical Decisions . 1a ed. McGrawHill, 1970; 2a ed. Wiley, 2004. (4) Berger, James O.: Statistical decision theory and Bayesian analysis. 1a ed. Springer, 1985; 2a ed. Springer, 2006, 2010. (5) Raiffa, Howard – Schlaifer, Robert: Applied statistical decision theory. MIT Press, 1961. (6) Pratt, John W. – Raiffa, Howard – Schlaifer, Robert: Introduction to statistical decision theory. MIT Press, 1995. Cualquiera de ellos –y, en particular, el primero– contiene la mayor parte de los desarrollos presentados en esta introducci´o n. El gui´ on preferido aqu´ı para hacerlo comprende un primer cap´ıtulo de planteamientos, en el que se formula el problema general de decisi´ on con las diversas variantes y circunstancias que pueden influir en su soluci´on. Se incluye en la secci´on 1.4 los resultados sobre utilidad y probabilidad subjetiva en base a los cuales es posible hacer un planteamiento racional de los problemas de decisi´ on. Los cap´ıtulos 2 y 3 exponen los criterios y m´etodos propuestos para seleccionar una decisi´ on racional, seg´ un las diferentes situaciones, pero siempre en ausencia de experimentaci´on previa. El cap´ıtulo 4 considera precisamente la existencia de experimentaci´on estad´ıstica previa a la toma de la decisi´ on y, en cierto modo, es el cap´ıtulo culminante de la Teor´ıa de la decisi´ on, en el que se conecta con las t´ ecnicas m´ as propias de la Inferencia estad´ıstica. El cap´ıtulo 5, relativo a la decisi´ on secuencial, muestra la complejidad de los problemas de decisi´ on cuando se plantean en su m´ axima generalidad. iii
Entre los textos m´as recientes en este ´area cabe citar: (7) Parmigiani, Giovanni – Inoue, Lurdes: Decision theory: principles and approaches. Wiley, 2009. (8) Liese, Friedrich – Miescke, Klaus J.: Statistical decision theory: estimation, testing, and selection. Springer, 2008. Hay que se˜ nalar que la literatura sobre teor´ıa de la decisi´ on incluye tambi´en textos de car´acter econ´ omico, social o pol´ıtico; relativamente pr´ oximos a la teor´ıa matem´ atica, por cuanto siguen teniendo una motivaci´ on normativa, relativa a sus respectivos campos de aplicaci´ on. De forma relativamente reciente, la Inteligencia Artificial tambi´ en se ocupa del tema de la decisi´ on, clave para dise˜ nar aut´ omatas capaces de adaptar correctamente su comportamiento a las condiciones ambientales. En cambio, en el terreno de la psicolog´ıa, hay obras de tipo descriptivo que analizan experimentalmente el proceso real que siguen las personas al adoptar sus decisiones, ni mucho menos siempre con criterios racionales. Incluso hay obras de car´acter filos´ ofico que tratan de la decisi´on en relaci´ on con el libre albedr´ıo, la predeterminaci´ on, etc. Por otra parte, hay aspectos que forman parte hoy en d´ıa de la Teor´ıa de la Decisi´ on y que no se han incluido en esta introducci´on, por su mayor complejidad o menor inter´es. En primer lugar, cabe destacar que los problemas de decisi´on, que aqu´ı se consideran siempre est´aticos, tienen a menudo un car´acter din´ amico si las decisiones se adoptan en una serie temporal de instantes. Surgen as´ı, en particular, los modelos de decisi´on markovianos y los problemas de parada ´optima , cuya soluci´on requiere del uso de t´ecnicas de programaci´on din´ amica . A este respecto, pueden consultarse: (9) Bather, John: Decision theory : an introduction to dynamic programming and sequential decisions. Wiley, 2000. (10) Puterman, Martin L. : Markov decison Processes: discrete dynamic programming. Wiley, 2005. Relacionado con el anterior, surge la cuesti´ on de la selecci´on o´ptima de los experimentos que han de realizarse sucesivamente. Ello est´ a tratado, por ejemplo en los cap´ıtulos finales de: (11) Strasser, Helmut: Mathematical theory of statistics : statistical experiments and asymptotic decision theory. de Gruyter, 1985. iv
En cambio, el asunto de las decisiones colectivas o sociales se plantea c´omo deben combinarse las preferencias de un grupo de personas para alcanzar una preferencia u ´ nica, respetando ciertas reglas que parecen de sentido com´ un. Los resultados en este sentido son casi todos de tipo negativo, siendo el m´ as conocido el teorema de imposibilidad de Arrow (1951). A este respecto, pueden consultarse los cap´ıtulos correspondientes de: (12) Rapoport, Anatol: Decision theory and decision behaviour : normative and descriptive approaches. Kluwer, 1989. (13) Michael D. Resnik: Choices: an introduction to decision theory. University of Minnesota Press, 1987, 1993. M´ as recientemente ha cobrado inter´es el estudio de m´etodos de selecci´ on de alternativas en presencia de multicriterios o multiobjetivos , de modo que se busca la alternativa que optimiza un vector de valoraciones, en lugar de una sola. Por ejemplo, no se combina el precio y la calidad de diversos productos en un u ´nico ´ındice precio/calidad, sino que se mantiene la pareja de valoraciones –generalmente contrapuestas– y se busca el/los productos preferidos en ambos sentidos simult´ aneamente. Pueden consultarse a este respecto el cap´ıtulo correspondiente de (12) o bien (14) Keeney, Ralph L. – Ra¨ıffa, Howard: Decisions with multiple objectives. Cambridge University Press, 1993. (15) Belton, Valerie – Stewart, Theodor J.: Multiple criteria decision analysis. Kluwer, 2002. En cada uno de los cap´ıtulos de esta introducci´ on se incluye un conjunto de ejercicios, cuya soluci´on figura en el Ap´endice, a fin de que pueda afianzarse convenientemente el estudio de los conceptos y resultados te´oricos. El Autor, Agosto de 2011.
v
´ Indice
1. Problemas de decisi´ on 1.1. Elementos esenciales . . . . . . . . . . . . . . . . . . . . . . 1.2. Ambientes en un problema de decisi´ on . . . . . . . . . . . . 1.2.1. Ambiente de certidumbre: T´ecnicas de optimizaci´ on 1.2.2. Ambiente de riesgo . . . . . . . . . . . . . . . . . . . 1.2.3. Ambiente de incertidumbre . . . . . . . . . . . . . . 1.2.4. Decisi´ on con experimentaci´ on . . . . . . . . . . . . . 1.3. Decisiones aleatorizadas . . . . . . . . . . . . . . . . . . . . 1.3.1. Decisiones aleatorizadas sin experimentaci´ on . . . . 1.3.2. Decisiones aleatorizadas con experimentaci´ on . . . . 1.4. Utilidad y probabilidad subjetiva . . . . . . . . . . . . . . . 1.4.1. Utilidad . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2. Probabilidad subjetiva . . . . . . . . . . . . . . . . . 1.4.3. Utilidad monetaria . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
1 1 7 8 9 12 12 15 17 18 21 21 26 29
2. Decisi´ on en ambiente de riesgo e incertidumbre 2.1. Introducci´ on . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Criterios de decisi´ on en ambiente de riesgo . . . . . . . . . . . 2.2.1. Criterio del valor esperado: . . . . . . . . . . . . . . . 2.2.2. Criterio Media-Dispersi´ on: . . . . . . . . . . . . . . . . 2.2.3. Criterio de riesgo fijo: . . . . . . . . . . . . . . . . . . 2.2.4. Criterio de m´ axima probabilidad: . . . . . . . . . . . . 2.2.5. Criterio del valor esperado con cl´ ausula de seguridad: 2.2.6. Aplicaci´ on: El problema de selecci´on de la cartera . . 2.2.7. Ejemplo adicional . . . . . . . . . . . . . . . . . . . . 2.3. Criterios de decisi´ o n en ambiente de incertidumbre . . . . . . 2.3.1. Criterio de Wald: . . . . . . . . . . . . . . . . . . . . . 2.3.2. Criterio de Hurwicz: . . . . . . . . . . . . . . . . . . . 2.3.3. Criterio de Laplace: . . . . . . . . . . . . . . . . . . . 2.3.4. Criterio de Savage: . . . . . . . . . . . . . . . . . . . .
37 37 37 38 38 40 40 40 41 43 45 45 46 47 48
vii
2.3.5. Criterio de Bayes con probabilidad subjetiva: . . . . . 3. Decisiones Bayes y minimax 3.1. Introducci´ on . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Decisiones Bayes . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. Interpretaci´ on geom´etrica . . . . . . . . . . . . . . . 3.2.2. Existencia de las acciones Bayes . . . . . . . . . . . 3.3. Admisibilidad y completitud . . . . . . . . . . . . . . . . . . 3.3.1. Admisibilidad de las acciones Bayes . . . . . . . . . 3.3.2. Completitud de las acciones Bayes . . . . . . . . . . 3.3.3. Completitud de las acciones no aleatorizadas . . . . 3.4. Decisiones minimax . . . . . . . . . . . . . . . . . . . . . . . 3.4.1. Distribuci´ on menos favorable . . . . . . . . . . . . . 3.4.2. Teorema del minimax . . . . . . . . . . . . . . . . . 3.4.3. M´ etodos de determinaci´ o n de la estrategia minimax 3.5. Ejemplos adicionales . . . . . . . . . . . . . . . . . . . . . . 3.6. Ap´endice: Teorema del hiperplano separador . . . . . . . . 4. Decisi´ on con experimentaci´ on 4.1. Introducci´ on . . . . . . . . . . . . . . . . 4.2. Reglas de decisi´ on Bayes . . . . . . . . . 4.3. Estad´ısticos suficientes . . . . . . . . . . 4.4. Costes de experimentaci´ on . . . . . . . . 4.5. La Inferencia Estad´ıstica como problema 4.5.1. Estimaci´ on puntual . . . . . . . . 4.5.2. Contraste de hip´ otesis . . . . . . 4.5.3. Intervalos de confianza . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . de decisi´ on . . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . .
49
. . . . . . . . . . . . . .
55 55 55 57 61 62 65 66 67 68 70 71 74 79 86
. . . . . . . .
93 93 94 99 104 108 110 111 112
5. Decisi´ on secuencial 124 5.1. Introducci´ on . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 5.2. Reglas de decisi´ on secuencial . . . . . . . . . . . . . . . . . . 124 5.3. Reglas secuenciales Bayes . . . . . . . . . . . . . . . . . . . . 126 A. Soluci´ on de los Cap´ıtulo 1 . . . . Cap´ıtulo 2 . . . . Cap´ıtulo 3 . . . . Cap´ıtulo 4 . . . . Cap´ıtulo 5 . . . .
ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
viii
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
136 . 136 . 146 . 153 . 167 . 214
Cap´ıtulo 1
Problemas de decisi´ on 1.1.
Elementos esenciales
on cuenta siempre con los siDe forma gen´erica, un problema de decisi´ guientes elementos: Un conjunto, A, de acciones o alternativas entre las cuales el decisor debe elegir la que le parezca m´as conveniente. Un conjunto, Θ, de estados de la naturaleza , que describen las circunstancias que pueden afectar o influir en las decisiones a adoptar.
× →
Una funci´on de p´erdida L : Θ A IR; de modo que L(θ, a) mide las consecuencias de adoptar cada acci´on a cuando el estado de la naturaleza es θ. Seg´ un las circunstancias, cada uno de los conjuntos A y Θ pueden ser finitos, continuos o arbitrariamente complejos. Por su parte, la p´erdida L(θ, a) puede ser positiva o negativa y, en este u ´ltimo caso, representa una ganancia para el decisor que adopte la acci´on a cuando el estado de la naturaleza es θ. En consecuencia, la teor´ıa puede desarrollarse equivalentemente considerando la funci´on de ganancia G = L y toda la diferencia radica en que en un caso se desear´a minimizar la p´erdida y, en el otro, maximizar la ganancia (1 ).
−
Diversos elementos adicionales pueden formar parte de un problema de decisi´ on, en los diversos contextos que se examinar´ an a lo largo del texto; pero, al menos los tres anteriores estar´ an siempre presentes. Para proporcionar 1
Conviene tener siempre presente que m´ınx [−f (x)] = − m´ axx f (x).
1
Cap´ıtulo 1. Problemas de decisi´ on
2
una idea intuitiva de lo que el planteamiento anterior significa, nada mejor que analizar algunos ejemplos. Ejemplo 1.1 El tiempo en un fin de semana puede ser soleado o h´umedo y fr´ıo o caluroso . Caben, pues, cuatro estados de la naturaleza: Θ = SF,SC,HF,HC . Para un fin de semana, una persona considera tres alternativas: ir a la playa , ir a la monta˜ na o bien quedarse en casa ; es decir, abreviadamente, A = P , M , C . Para adoptar su decisi´ on debe valorar las ventajas o inconvenientes que tendr´a con cada plan, en funci´ on de c´omo sea el clima. Y, tal valoraci´on podr´a expresarla en forma de tabla:
{
}
{
}
Clima Plan Playa Monta˜ na Casa
SF
SC
HF
HC
−1 −5 −3 −2
7 4 6
3 3 4
0
2
−
−
Recu´erdese que la valoraci´on se expresa en forma de p´erdidas; de forma que desplazarse a la playa con tiempo h´umedo y fr´ıo supone una p´erdida de 7, mientras que hacerlo con tiempo seco y caluroso le reporta una satisfacci´on de 5 (p´erdida de 5). En estos momentos, es irrelevante c´omo haya llegado a estas valoraciones; ciertamente habr´an intervenido sus preferencias personales, puede haber atendido a consideraciones de costes, a aspectos sociales, etc. La teor´ıa de la utilidad , que se introduce en la secci´on 1.4 estudia procedimientos para establecer tales valoraciones. Pero la cuesti´on primordial es saber si la informaci´on contenida en la tabla puede ser utilizada para adoptar su decisi´on.
−
En el contexto de este ejemplo, cabe anticipar algunas consideraciones de la pr´oxima secci´on. De hecho, enfrentada con este problema, cualquier persona sensata procurar´ıa enterarse de las previsiones meteorol´ogicas para el fin de semana. Generalmente, ello le proporcionar´a una estimaci´ on de las probabilidades con las que el clima va a estar en cada uno de los cuatro estados posibles; es decir un vector de probabilidades [πSF , πSC , πHF , πHC ] que, sin duda, le ser´a de suma utilidad para orientar su elecci´on. En el mejor de los casos, podr´ıa ocurrir que fuese alg´ un πi = 1 y que pudiese actuar sabiendo con certidumbre c´omo estar´a el tiempo. En cambio, frente a un pron´ostico del tipo πSF = 0 7, πSC = 0 1, πHF = 0 2, siempre correr´ıa un riesgo de haber adoptado una decisi´on en la que ha pesado mucho la alta probabilidad de que el clima sea seco y fr´ıo y, sin embargo, al final result´ o que el tiempo era h´umedo y fr´ıo. Peor a´un, pudiera ocurrir que no tuviese acceso a ning´un bolet´ın meteorol´ogico y que tuviese que actuar con una incertidumbre total. Tambi´ en es oportuno se˜nalar que, si interesase hacer un modelo m´as preciso de la situaci´ on, los estados de la naturaleza podr´ıan incluir la cantidad de lluvia (por m2 ) recogida y la temperatura m´axima (o m´ınima) a lo largo del fin de semana. El
1.1. Elementos esenciales
3
conjunto de estados de la naturaleza, Θ, pasar´ıa a ser entonces un subconjunto de IR2 o IR3 , en lugar de un conjunto finito. Consecuentemente, la funci´on de p´erdida no se expresar´ıa entonces en forma de tabla, sino como una terna de funciones L(θ, P ), L(θ, M ) y L(θ, C ).
El siguiente ejemplo es debido a Savage (The foundation of Statistics , 1954). Ejemplo 1.2 Un ama de casa ha cascado cinco huevos en un recipiente para hacer una tortilla. Dispone de un sexto huevo del que sospecha que puede estar podrido, pero que en todo caso se estropear´a si no se utiliza. Duda entre los siguientes comportamientos: (I) cascar el huevo en el mismo recipiente que los otros cinco; (II) examinarlo previamente en un taz´on adicional y (III) tirarlo a la basura sin abrirlo. Seg´ un el estado del huevo sospechoso, las consecuencias pueden ser Estado Alternativa
Bueno
Podrido
I
Tortilla de 6 huevos
5 huevos desperdiciados sin tortilla
II
Tortilla de 6 huevos y taz´on para lavar
Tortilla de 5 huevos y taz´on para lavar
III
Tortilla de 5 huevos y huevo desperdiciado
Tortilla de 5 huevos
Valora estas consecuencias con la siguiente tabla de ganancias: Estado Alternativa
Bueno
Podrido
I
30
0
II
27
22
III
20
25
en la que parece que ha atribuido un valor 5 a cada huevo y ha evaluado en 3 el coste de lavar el taz´on. La pregunta vuelve a ser cu´al es su mejor comportamiento. Y, por supuesto, para su respuesta ser´ıa de gran ayuda poder evaluar las probabilidades de cada uno de los posibles estados del huevo sospechoso. Si no es capaz de llevar a cabo tal evaluaci´on, su problema se complica; al menos en el sentido de que ha de resolverlo con menor informaci´ on.
Cap´ıtulo 1. Problemas de decisi´ on
4
Seg´ un los ejemplos anteriores, un problema de decisi´ on puede concebirse como una tabla en la que las columnas representan los estados de la naturaleza y las filas las acciones posibles consideradas por el decisor: Estado Acci´ on
θ1
θ2
...
θk
a1 a2 .. .
L(θ1 , a1 ) L(θ1 , a2 ) .. .
L(θ2 , a1 ) L(θ2 , a2 ) .. .
... ... .. .
L(θk , a1 ) L(θk , a2 ) .. .
an
L(θ1 , an )
L(θ2 , an )
...
L(θk , an )
Frente a tal problema, se trata de estudiar criterios para elegir la “mejor” de las filas. El que Θ o A no sean conjuntos finitos puede complicar la presentaci´ on de los datos, pero la situaci´ on es conceptualmente la misma. Una tercera situaci´ on –emparentada con el juego del “black-jack”– puede mostrar que la fase de elaboraci´on del modelo no siempre es inmediata, porque puede ser laborioso analizar las acciones y los estados de la naturaleza posibles. Ejemplo 1.3 De un mazo de cartas, cada una de las cuales contiene uno de los n´umeros 1, 2 o 3, un croupier toma una oculta para s´ı mismo y otorga otra a un jugador. El jugador puede pedir otra carta, aunque si se “pasa”, porque la suma de sus puntuaciones es superior a 3, tiene que pagar 2 euros a la banca. Tambi´en puede “plantarse”, sin intentar mejorar su puntuaci´on. Cuando lo hace, el croupier descubre su carta y el jugador recibe un euro si su puntuaci´ on es mayor que la del croupier, paga un euro si es menor y, en caso de igualdad, ninguno cobra nada. Una breve reflexi´on muestra que los estados de la naturaleza, que han de influir en el resultado, dependen de la puntuaci´on oculta del croupier, x1 , y de la puntuaci´on x2 de la carta que ocupe la primera posici´on en el mazo despu´es de la distribuci´on. Es decir, son de la forma (x1 , x2 ) y concretamente es
{
}
Θ = (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3) . Por ejemplo (2, 1) significa que la banca tiene un 2 y la carta siguiente del mazo es un 1. Por su parte, las acciones del jugador s´olo pueden ser plantarse (0) o pedir carta (1); es decir A = 0, 1
{ }
aunque tiene que elegir entre ambas opciones, en funci´on del valor de la carta que haya recibido. La situaci´on plantea pues tres problemas de decisi´on: uno cuando su carta tiene el valor 1, otro cuando es 2 y un tercero (m´as simple) cuando es 3. De acuerdo con las reglas descritas, la funci´on de p´erdida es
1.1. Elementos esenciales
5 Estado
Acci´ on 1:0 1: 1 2: 0 2: 1 3: 0 3:1
(1, 1)
(1, 2)
(1, 3)
0
0
−1 −1 −1 −1
−1 −1 2
−1
−1
−1
2
2
0 2 2
2
(2, 1) 1 0 0
−1 −1 2
(2, 2) 1
(2, 3)
(3, 1)
(3, 2)
(3, 3)
1 2
1 1
1 0
1 2
0 2
0 2
1 0
1 2
1 2
−1
−1
0 2
0 2
0 2
−1 2
2
A la vista de la tabla, una elecci´on razonable para el jugador puede ser: pedir carta si tiene un 1, plantarse si tiene un 2 y, desde luego, plantarse si tiene un tres. Esto es emplear la estrategia ([1 : 1], [2 : 0], [3 : 0]), que especifica el comportamiento en cualquier posible circunstancia. Si la composici´on del mazo es conocida y se ha barajado adecuadamente antes del reparto, entonces el decisor puede evaluar con facilidad la probabilidad πi de cada uno de los elementos de Θ; lo cual supone una informaci´ on muy valiosa. Por el contrario, el problema tiene sentido en el contexto en que no se informe al jugador de composici´on del mazo y las probabilidades πi hayan de ser conjeturadas o, incluso, imposibles de atribuir.
Es f´acil imaginar c´ omo se complicar´ a el planteamiento anterior en una situaci´ on m´ as habitual, tal como la del “black-jack” que se juega en los casinos con una baraja francesa, en el que el objetivo es obtener una puntuaci´on inferior pero lo m´as pr´oxima posible a 21, mediante la petici´ on de tantas cartas como el jugador desee. El ejemplo anterior da pie a examinar las similitudes y diferencias entre la Teor´ıa de la Decisi´on y la Teor´ıa de juegos . Teor´ ıa de la Decisi´ on vs Teor´ıa de juegos
El esquema (A, Θ, L) de un problema de decisi´ on es formalmente id´entico al que se emplea en teor´ıa de juegos para describir un juego bipersonal de suma nula. All´ı se interpreta que un segundo jugador hace el papel de la naturaleza, debiendo elegir un estado o estrategia θ Θ, a la vez que el primer jugador escoge una jugada o estrategia a A. Como consecuencia el primero paga al segundo una cantidad L(θ, a), funci´ on de las estrategias empleadas por cada uno de los jugadores. Es decir, el primer jugador tiene una “p´erdida” L(θ, a), mientras que el segundo jugador gana L(θ, a). Ni que decir tiene que L(θ, a) puede ser negativa y representar realmente una ganancia para el primero y una p´ erdida para el segundo.
∈
∈
6
Cap´ıtulo 1. Problemas de decisi´ on
Es habitual en teor´ıa de juegos analizar con detenimiento la manera de obtener un “juego matricial”, que responda al esquema te´orico (A, Θ, L), a partir de las reglas del juego que, con frecuencia, especifican diversos movimientos o jugadas que los participantes pueden realizar sucesiva y alternativamente. As´ı ocurre, por ejemplo, en el juego de las “tres en raya”, en casi todos los juegos de cartas, en el “backgammon”, etc. En este sentido, es primordial el concepto de estrategia , interpretado como cada uno de los conjuntos de instrucciones que un jugador debe proporcionar a una tercera persona para que pueda jugar por ´el, sin tener que improvisar una jugada en ning´ un posible lance del juego. De este modo, cada estrategia ser´ a a menudo un complejo sistema de instrucciones y puede ser complicado enumerar todas las posibles estrategias. No obstante, desde un punto de vista te´ orico, ello es lo que permite reducir las reglas de cualquier juego a un planteamiento matricial del tipo (A, Θ, L). As´ı, A ser´ a el conjunto de estrategias posibles para el primer jugador, Θ incluir´a las posibles estrategias del segundo y L(θ, a) ser´a el pago a realizar cuando uno emplee su estrategia a y el otro su estrategia θ. Algo muy similar sucede con los problemas de decisi´on, que pueden comportar diversas etapas en las que pueden ocurrir diferentes situaciones, frente a las cuales hay que decidir que acci´ on se elige de entre las permitidas para ese momento y esas circunstancias. Por ejemplo, una compa˜ n´ıa a´erea tendr´a que decidir con cu´antos aviones opera, cu´antas tripulaciones contrata, y en cada momento, qu´e movimientos realiza con sus aparatos y con sus tripulaciones para atender a los vuelos programados, sin incumplir las normativas correspondientes. Se trata de un sistema muy complejo, al que pueden afectar condiciones clim´ aticas, precios de combustibles y diversas otras condiciones ambientales. Pero, como en los juegos, la enumeraci´ on de las estrategias viables para la compa˜ n´ıa, as´ı como de los estados posibles de la naturaleza, junto con la evaluaci´ on de los costes en cada caso, permite reducir el problema al esquema formalizado (A, Θ, L). Hay un aspecto que diferencia b´asicamente la teor´ıa de la decisi´on de la teor´ıa de juegos bipersonales de suma nula . En esta u ´ ltima se supone siempre que intervienen dos jugadores inteligentes, cuyos objetivos son contrapuestos: lo que un jugador gana, lo pierde el otro. Por consiguiente, cada jugador debe suponer que su contrincante elegir´a la estrategia que m´ as beneficios le reporta y m´as perjudica a su oponente. El criterio para la elecci´ o n de las estrategias queda, por tanto, determinado. Por el contrario, en teor´ıa de la decisi´on no hay ning´ un motivo para suponer que la naturaleza tenga inter´ es en elegir su estado con el objetivo de maximizar su ganancia, ni de perjudicar al decisor. Como consecuencia, el criterio para distinguir entre buenas y malas estrategias est´ a peor definido y admite muchas m´ as variantes.
1.2. Ambientes en un problema de decisi´ on
7
Un ejemplo simple puede aclarar la cuesti´ on. Ejemplo 1.4 Consid´erese A = a1 , a2 , Θ = θ1 , θ2 y la funci´on de p´erdida:
{
}
{
}
Estado Acci´ on a1 a2
θ1
θ2
2 −4 −1 −2
Si se interpreta como juego, est´a claro que la ´unica elecci´on inteligente del estado es θ1 ; ya que las cantidades de la matriz son ganancias para el jugador que elige en Θ y escogiendo θ1 gana m´as que con θ2 , sea cual sea el comportamiento del contrincante. Esto lo sabe el decisor que ha de elegir una acci´on, de modo que puede ignorar la existencia del estado θ2 , al que nunca tendr´a que enfrentarse, y considerar solo su elecci´on frente a θ1 . Resulta entonces obvio que su mejor elecci´on es a2 , con la que su p´erdida valdr´a 1. En cambio, interpretado como problema de decisi´on frente a una naturaleza neutral, no interesada en maximizar su beneficio ni en minimizar el del decisor, la elecci´on est´ a menos clara. La acci´on a2 garantiza una ganancia positiva (1 o 2 seg´u n el estado de la naturaleza); pero a1 permite aumentar la ganancia a 4, a costa de correr el riesgo de perder 2. Por ejemplo, si el decisor estima que el estado es θ2 en el 80 % de las ocasiones, deber´ıa preferir a1 .
−
En base a esta observaci´o n, la teor´ıa de juegos y la teor´ıa de la decisi´on divergen. Aquella examina cualquier situaci´ on, por compleja que sea, con el criterio indicado; mientras que ´esta debe analizar qu´e criterios son oportunos en un problema de decisi´ on, por simple que pueda ser. De ello se ocupar´a el cap´ıtulo 2. Previamente procede tratar los aspectos adicionales que pueden comportar los problemas de decisi´ on.
1.2.
Ambientes en un problema de decisi´ on
Como se ha se˜ nalado en los ejemplos anteriores, hay diversas circunstancias en las que el decisor puede enfrentarse con un problema de decisi´on. El ambiente de certidumbre es aquel en que el decisor conoce con exactitud el estado en el que se encuentra la naturaleza. Cuando el decisor no sabe el estado elegido por la naturaleza, pero dispone de la distribuci´ on de probabilidad π(θ) con la que se elige dicho estado, se dice que el problema de decisi´on se plantea en ambiente de
Cap´ıtulo 1. Problemas de decisi´ on
8
riesgo. Formalmente ello requiere suponer que Θ est´a dotado de una σ-´ algebra y considerar el espacio de probabilidad (Θ, , π ). Ahora bien, normalmente Θ ser´ a un espacio discreto o un subconjunto de n un espacio eucl´ıdeo, IR , de modo que la elecci´o n de no comporta ninguna ambig¨ uedad y π puede especificarse mediante las t´ ecnicas habituales del c´ alculo de probabilidades.
B
B
B
El ambiente de incertidumbre se refiere a aquellos problemas de decisi´ on en los que el decisor no dispone de la distribuci´on de probabilidad que rige la elecci´ on del estado de la naturaleza, bien porque ´esta no es conocida o bien p orque no existe. Puede ser desconocida; como en el caso del ejemplo 1.3 con un mazo de cartas cuya composici´ on no se puede examinar. Pero tambi´ en puede no existir, si el estado de la naturaleza depende del resultado de un acontecimiento irrepetible, como una carrera de caballos o un descubrimiento cient´ıfico. De hecho, recu´erdese que, hasta ahora, la probabilidad se ha considerado siempre ligada a un fen´ omeno aleatorio: “aqu´el que, repetido en id´ enticas condiciones,. . . ”. En la secci´on 1.4 se introducir´ a el concepto de probabilidad subjetiva que muestra que, en determinadas ocasiones, el decisor se comporta como si pudiese atribuir una distribuci´on de probabilidad a los estados de la naturaleza, a´ un cuando ´estos no dependan de un fen´omeno aleatorio genuino. En otro sentido, hay ocasiones en que, antes de elegir su acci´ on, el decisor puede llevar a cabo un conjunto de observaciones que le proporcionen informaci´ on sobre el estado de la naturaleza. De forma gen´erica, podr´a observar el valor de una variable aleatoria multidimensional, X , cuya distribuci´ on P θ (x) dependa del estado de la naturaleza θ. En estas circunstancias, se habla de problema de decisi´ on con experimentaci´ on o de problema de decisi´ on estad´ıstico, puesto que, al fin y al cabo, la inferencia estad´ıstica estudia como estimar el valor de un cierto par´ametro θ a partir de la observaci´ on de una muestra X , cuya distribuci´ on depende de θ. En un problema de decisi´ on, la introducci´ on de experimentaci´on enriquece notablemente la teor´ıa; el cap´ıtulo 4 se o cupar´a espec´ıficamente de este caso. 1.2.1.
Ambiente de certidumbre: T´ ecnicas de optimizaci´ on
Cuando el estado de la naturaleza, θ1 , es conocido, la funci´ on de p´erdida L(a) = L(θ1 , a) depende exclusivamente de la acci´ on a del decisor y la
1.2. Ambientes en un problema de decisi´ on
9
elecci´ on de la mejor acci´ on –aquella que minimiza la p´ erdida– se reduce a la determinaci´ on del punto a A en el que se alcanza
∈
m´ın L(a). a∈A
Ello no significa que el problema sea forzosamente sencillo. Lo ser´a, por supuesto, en el caso en que A sea finito o, mejor dicho, con un n´ umero de elementos moderado. Pero, seg´ un las caracter´ısticas del conjunto A y de la funci´on L, puede ser necesario emplear t´ecnicas de optimizaci´ on desarrolladas en diversas disciplinas matem´ aticas. n Por ejemplo, si A IR y L es diferenciable, el An´ alisis Matem´ atico proporciona condiciones que necesariamente deben cumplirse en el punto a en el que se alcance el m´ınimo. Incluyen, en particular, el m´etodo de los multi plicadores de Lagrange para el caso en que A est´e definido por restricciones gk (a) = 0, definidas mediante funciones diferenciables gk . En otra direcci´ on, la programaci´ on lineal proporciona la soluci´ on a en el n , deficaso en que L sea una funci´ on lineal y A un poliedro convexo en IR+ nido por desigualdades lineales. El estudio de diversos problemas similares, en los que intervienen funciones objetivo o restricciones no lineales, constituye el campo de la programaci´ on no lineal . Asimismo existen desarrollos propios de diversos casos diferenciados por las caracter´ısticas de las funciones o restricciones que intervienen: programaci´ on cuadr´atica, programaci´ on convexa, etc. Recientemente, tambi´ en han alcanzado relieve los algoritmos gen´eticos y otras t´ecnicas heur´ısticas de b´ usqueda de ´optimos que pueden ser aplicados a´ un en el caso de funciones objetivo no diferenciables, siempre que el espacio de b´ usqueda pueda codificarse mediante una cadena de s´ımbolos. En resumidas cuentas, las t´ecnicas de optimizaci´ on no son propiamente parte de la teor´ıa de la decisi´on y no ser´an consideradas aqu´ı. De manera que los problemas de decisi´on en ambiente de certidumbre se remiten a los cursos espec´ıficos sobre t´ecnicas de optimizaci´ on.
⊂
1.2.2.
Ambiente de riesgo
Como ya se ha se˜ nalado, en ambiente de riesgo, el conjunto Θ de estados de la naturaleza es la base de un espacio de probabilidad (Θ, , π ). Supondremos siempre que las funciones de p´erdida L( , a) son medibles respecto a , porque no tiene ning´ un inter´es pr´ actico pensar en casos en que pudiese no ser as´ı. Con ello las p´erdidas, L(θ, a1 ), L(θ, a2 ), . . ., asociadas a cada una de las acciones posibles, se convierten en variables aleatorias, que pueden
B
·
B