Índice Introducción ................................................................................................................................. 1 3.1 Conceptos básicos ........................................................................................................... 2 3.2 Variables aleatorias discretas .......................................................................................... 3 3.3 Variables aleatorias continuas ........................................................................................ 3 3.4 Métodos para generar variables aleatorias .................................................................... 4 3.4.1 Método de la transformada inversa ..................................................................... 4 3.4.2 Método de convolución ........................................................................................ 5 3.4.3 Método de composición ....................................................................................... 5 3.5 Procedimientos especiales .............................................................................................. 6 3.6 Pruebas estadísticas. (Pruebas de bondad de ajuste) .................................................... 7 Conclusión .................................................................................................................................... 9 Referencias bibliográficas ............................................................................................................ 10
Introducción
La generación de cualquier variable aleatoria se va a basar en la generación previa de una distribución uniforme (0,1). Existen métodos que nos permiten obtener valores de variables aleatorias que sigan determinadas distribuciones de probabilidad a partir de los números aleatorios generados, que sieguen la distribución uniforme en el intervalo (0,1). Hay cuatro métodos generales de generación de variables aleatorias y una serie e métodos particulares de las distintas distribuciones. La facilidad de aplicación de dichos métodos, así como el coste computacional asociado a los mismos, varía mucho según la familia de variables aleatorias a las que se apliquen. Normalmente existen varios algoritmos que se pueden utilizar para generar valores de una determinada distribución, y diferentes factores que se pueden considerar para determinar qué algoritmo utilizar en un caso particular. Desafortunadamente dichos factores suelen entrar en conflicto unos con otros y a veces se ha de llegar a una solución de compromiso.
1
3.1 Conceptos básicos Definición de una variable aleatoria Un modelo de simulación permite lograr un mejor entendimiento de prácticamente cualquier sistema. Para ello resulta indispensable obtener la mejor aproximación a la realidad, lo cual se consigue componiendo el modelo base de variables aleatorias que interactúan entre sí. Podemos decir que las variables aleatorias son aquellas que tienen un comportamiento probabilístico en la realidad. Por ejemplo, el número de clientes que llega cada hora a un banco depende del momento del día, del día de la semana y de otros factores: por lo general, la afluencia de clientes será mayor al medio día que muy temprano por la mañana; la demanda será más alta el viernes que el miércoles; habrá más clientes un ´día de pago que un día normal, etc. Dadas estas características, las variables aleatorias deben cumplir reglas de distribución de probabilidad como éstas:
La suma de las probabilidades asociadas a todos los valores posibles de la variable aleatoria x es uno.
La probabilidad de que un posible valor de la variable x se presente siempre es mayor que o igual a cero.
El valor esperado de la distribución de la variable aleatoria es la media de la misma, la cual a su vez estima la verdadera media de la población.
Si la distribución de probabilidad asociada a una variable aleatoria está definida por más de un parámetro, dichos parámetros pueden obtenerse mediante un estimador no sesgado. Por ejemplo, la varianza de población a2 puede ser estimada usando la varianza de una muestra que es s2. De la misma manera, la desviación estándar de la población, a, puede estimarse mediante la desviación estándar de la muestra s.
Tipos de variables aleatorias Podemos diferenciar las variables aleatorias continuas de acuerdo con el tipo de valores aleatorios que represente. Por ejemplo, si habláramos del número de clientes que solicitan cierto servicio en un periodo de tiempo determinado, podríamos encontrar valores tales como 0, 1, 2,…, n, es decir,
2
un comportamiento como el que presentan las distribuciones de probabilidad discretas. Por otro lado, si habláramos del tiempo que tarda en ser atendida una persona, arrojaría resultados como 1.54 minutos, 0.028 horas o 1.37 días, es decir, un comportamiento similar al de las distribuciones de probabilidad continuas. Considerando lo anterior podemos diferenciar entre variables aleatorias discretas y variables aleatorias continuas.
3.2 Variables aleatorias discretas Una variable aleatoria continua teóricamente puede asumir cualquier valor entre dos límites dados, o sea que sus variaciones son infinitesimales, mientras que en las variables aleatorias discretas existen “saltos” o “interrupciones” entre los valores que puede tomar.
De acuerdo a lo anterior podemos decir que: Una variable aleatoria X es discreta, si solamente puede tomar un conjunto numerable de valores. Como ejemplos de variables aleatorias discretas podemos mencionar: el número de libros en una biblioteca, el número de habitantes en una población, la cantidad de dinero que una persona trae en su bolsillo, el número de aves en un gallinero, el número de admisiones diarias a un hospital, el número de accidentes automovilísticos en una carretera durante un año, etc.
3.3 Variables aleatorias continuas Es aquella que puede tomar infinitos valores dentro de un intervalo de la recta real. En el caso de variables aleatorias continuas no tiene sentido plantearse probabilidades de resultados aislados. La probabilidad de valores puntuales es cero. El interés de estas probabilidades está en conocer la probabilidad correspondiente a un intervalo. Dicha probabilidad se conoce mediante una curva llamada función de densidad y suponiendo que bajo dicha curva hay un área de una unidad. Conociendo esta curva, basta calcular el área correspondiente para conocer la probabilidad de un intervalo cualquiera.
3
3.4 Métodos para generar variables aleatorias Existen varios métodos que nos permiten generar variables aleatorias. Lo normal es que existan varias opciones para generar una misma variable aleatoria. La elección del método adecuado se puede basar en una serie de factores como:
Exactitud.se prefiere un método exacto frente a métodos aproximados, como soluciones numéricas.
Velocidad. Uno de los datos que se toma en consideración es el tiempo de generación de la variable.
Espacio. Necesidades de memoria del método utilizado. En general, los métodos no consumen mucha memoria.
3.4.1 Método de la transformada inversa El método de la transformada inversa puede utilizarse para simular variables aleatorias continuas, lo cual se logra mediante la función acumulada f(x) y la generación de números pseudoaleatorios ri ~U (0,1).
El método consiste en:
Definir la función de Densidad f(x) que representa la variable a modelar.
Calcular la función acumulada f(x).
Despejar la variable aleatoria x y obtener la función acumulada inversa f(x)-1.
Generar las variables aleatorias x, sustituyendo valores con númer os pseudoaleatorios ri ~U (0,1) en la función acumulada inversa.
El método de la transformada inversa también puede emplearse para simular variables aleatorias de tipo discreto, como en las distribuciones de Poisson, de Bernoulli, binomial, geométrica, discreta general, etc. La generación se lleva a cabo a través de la probabilidad acumulada P(x) y la generación de números pseudoaleatorios ri ~U (0,1).
4
3.4.2 Método de convolución La distribución de probabilidad de la suma de dos o más variables aleatorias independientes es llamada la convolución de las distribuciones de las variables originales. El método de convolución es entonces la suma de dos o más variables aleatorias para obtener una variable aleatoria con la distribución de probabilidad deseada. Puede ser usada para obtener variables con distribuciones Erlang y binomiales. Muchas variables aleatorias incluyendo la normal, binomial, Poisson, Gamma, Erlang, etc, se pueden expresar de forma exacta o aproximada mediante la suma lineal de otras variables aleatorias. El método de convolución se puede usar siempre y cuando la variable aleatoria x se pueda expresar como una combinación lineal de k variables aleatorias:
En este método se necesita generar k números aleatorios (u1,u2,...,uk ) para generar ( x1,x2,...xk ) variables aleatorias usando alguno de los métodos anteriores y así poder obtener un valor de la variable que se desea obtener por convolución.
3.4.3 Método de composición Este método va a poder ser aplicado cuando la función de densidad es fácil de
Siendo n el número de trozos en los que se ha dividido la función. Cada uno de los fragmentos se puede expresara como producto de un función de distribución y un peso y la función de distribución global la podemos obtener como
5
El método consiste en generar dos números aleatorios, uno sirve para seleccionar un trozo y el otro se utiliza para generar un valor de una variable que sigue la distribución de dicho trozo. El valor de la variable obtenida es el valor buscado. El algoritmo general queda como sigue: Generar u1,u2~U(0,1) Si u1=w1 entonces generar x~f1(x) Si no Si u1=w1+w2 entonces generar x~f2(x)
3.5 Procedimientos especiales La distribución de Poisson se utiliza para describir cierto tipo de procesos, entre los que se encentra la distribución de llamadas telefónicas que llegan a un conmutador, las solicitudes de pacientes que requieren de servicios en una institución de salud, la llegada de automóviles y camiones a una caseta de cobro y el número de accidentes registrados en ciertas intersecciones. Cuando en una distribución binomial se realiza el experimento un número "n" muy elevado de veces y la probabilidad de éxito "p" en cada ensayo es reducida, entonces se aplica el modelo de distribución de Poisson: Se tiene que cumplir que: " p " < 0,10
" p * n " < 10
La distribución de Poisson sigue el siguiente modelo: El número "e" es 2,71828 " l " = n * p (es decir, el número de veces " n " que se realiza el experimento multiplicado por la probabilidad " p " de éxito en cada ensayo) " k " es el número de éxito cuya probabilidad se está calculando
6
La distribución binomial parte de la distribución de Bernouilli: La distribución de Bernouiili se aplica cuando se realiza una sola vez un experimento que tiene únicamente dos posibles resultados (éxito o fracaso), por lo que la variable sólo puede tomar dos valores: el 1 y el 0. La distribución binomial se aplica cuando se realizan un número "n" de veces el experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido éxitos
3.6 Pruebas estadísticas. (Pruebas de bondad de ajuste) Estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta. Sea X: variable aleatoria poblacional f0(x) la distribución (o densidad) de probabilidad especificada o supuesta para X Se desea probar la hipótesis: Ho: f(x) = f0(x) En contraste con la hipótesis alterna: Ha: f(x) no= f0(x) (negación de Ho)
Prueba Ji-Cuadrado
Esta prueba es aplicable para variables aleatorias discretas o continuas. Sea una muestra aleatoria de tamaño n tomada de una población con una distribución especificada f0(x) que es de interés verificar. Suponer que las observaciones de la muestra están agrupadas en k clases, siendo oi la cantidad de observaciones en cada clase i = 1, 2, ..., k
7
Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i. Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que según el modelo especificado deberían estar incluidos en la clase i: ei = pi n,
i = 1, 2, ..., k
Tenemos entonces dos valores de frecuencia para cada clase i oi: frecuencia observada (corresponde a los datos de la muestra) ei: frecuencia esperada (corresponde al modelo propuesto)
La teoría estadística demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste:
8
Conclusión La generación de valores de variables aleatorias es un elemento indispensable en todos los proyectos de simulación. Numerosas técnicas disponibles para ello necesitan un generador de valores de una distribución U[0,1], a partir de la cual se obtienen los valores de la variable aleatoria considerada. Los algoritmos para la generación de valores uniformemente distribuidos se encuentran en la mayoría de las calculadoras y lenguajes de programación, y suelen estar basado en la aritmética modular. En todos los experimentos de simulación existe la necesidad de generar valores de variables aleatorias que representan a una cierta distribución de probabilidad como o vimos anteriormente. Durante un experimento de simulación, el proceso de generar un valor de la variable aleatoria de una distribución particular, puede repetirse tantas veces como se desee y tantas veces como distribuciones de probabilidad existan en el experimento de simulación. Sin embargo, es conveniente señalar que el proceso de generación de variables aleatorias no uniformes se hace a partir de la generación de números rectangulares.
9
Referencias bibliográficas COSS Bu, Raúl. Simulación (Un enfoque práctico), Limusa, México. 2003. RACZYNSKI, Stanislaw. Simulación por Computadora, Primera edición, Megabyte, México. 1993. Azarang Mohamad A,García Dunna Eduardo, Simulación y análisis de modelos estocásticos, 1ª Edición, McGraw-Hill, Inc., México, 1996. Cano, Gabriela. (2012). Generación de variables aleatorias. octubre, 2016, de Calameo Sitio web: http://es.calameo.com/books/001589672deaf8e8c1d74
10