UNIVERSIDAD FRANCISCO GAVIDIA CENTRO REGIONAL DE OCCIDENTE
ASIGNATURA: Estadística I TEMA: DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
DOCENTE: LIC. WALTER FRANCISCO VASQUEZ FLORES
ALUMNO: ALUMNO: HEBER ANTONIO LEMUS VILLEDA
FECHA: Santa Ana, 17 de noviembre de 2008.
INDICE
Distribuciones Discretas de Probabilidad
INTRODUCCIÓN Analizar Analizar datos recabados, recabados, puede tornarse tornarse una tarea difícil difícil en cuanto cuanto a cuales cuales pueden pueden ser los resu result ltad ados os y para para que que nece necesi sita tarí rían an la info inform rmac ació ión. n. La esta estadí díst stic ica, a, como como una una rama rama de la matemática, presenta formas prácticas de resolver estas dificultades. Una Una dist distri ribu buci ción ón de los los dato datos s en cate catego gorí rías as que que ha demo demost stra rado do ser ser útil útil al orga organi niza zarr los los procedimientos estadísticos, es la distinción entre variables discretas.
Una variable discreta es sencillamente una variable para la que se dan de modo inheren inherente te separacio separaciones nes entre entre valores valores observabl observables es sucesivo sucesivos. s. En otras otras palabr palabras, as, se defin define e una una variab variable le discr discreta eta como como la variab variable le tal que que entre entre 2 valores cualesquiera cualesquiera observables, hay por lo menos un valor no observable. Esta distribución tiene muchas variantes, pero entre las más importantes podemos mencionar 5 y son: Distribuc Distribución ión Binomial Binomial,, la cual mideel mideel número número de éxitos
en una secuencia secuencia de “n” ensayos ensayos
indepe independi ndient entes es de Berno Bernoull ulli i ; Dist Distri ribu buci ción ón Binom Binomia iall Nega Negati tiva va,, que que estu estudi dia a el núme número ro de experimentos, independientes entre sí ; La Distribución Poisson, que expresa la probabilidad de un número k de eventos ocurriendo en un tiempo fijo: La Distribución Geométrica e Hipergeométrica.
3
Distribuciones Discretas de Probabilidad
DISTRIBUCIÓN DE PROBABILIDAD En esta estadí díst stic ica, a,
dada dada
una una vari variab able le
alea aleato tori ria a X ,
distri ribu buci ción ón la dist
de
prob probab abil ilid idad ad de X de X
es la función F X ( x x ), ), que asigna a cada evento definido sobre X sobre X una una probabilidad, que está definida por:
y de manera que se cumplan las siguientes tres condiciones:
1.
y
2. Es con conti tinu nua a por por la der derec echa ha.. 3. Es mon monót óton ona a no decr decrec ecie ient nte. e. Para simplificar la notación, cuando no hay lugar a confusión se omite el subíndice X subíndice X , y se escribe simplemente F ( x x ). ). La función de distribución es la acumulada de la función de densidad de probabilidad f ( x x ). ). Es decir, se calcula directamente según:
Si x Si x es es una variable aleatoria discreta
Si x Si x es es una variable aleatoria continua
4
Distribuciones Discretas de Probabilidad
Propiedades
Para Para
dos dos
núme número ros s
y
real reales es
cual cuales esqu quie iera ra a y b tal
que que (a < b),
los
sucesos
serán serán mutuament mutuamente e excluyente excluyentes s y su unión es el suceso suceso
, por lo
que tenemos entonces que:
y finalmente
Por lo tanto una vez conocida la función de distribución F ( x x ) para todos los valores de la variable aleatoria x aleatoria x conoceremos conoceremos completamente la distribución de probabilidad de la variable. Para realizar cálculos es más cómodo conocer las distribución de probabilidad, para ver una representación gráfica de la probabilidad es más práctico el uso de la función de densidad.
DISTRIBUCIÓN DE VARIABLE DISCRETA Una variable discreta es sencillamente una variable para la que se dan de modo inherente separacion separaciones es entre valores observables observables sucesivos. sucesivos. En otras otras palabras, palabras, se define define una variable variable discreta discreta como la variable variable tal que entre 2 valores valores cualesquiera cualesquiera observables, observables, hay por lo menos un valor no observable. A dicha función se la llama función de masa de probabilidad. En este caso la distribución de probabilidad es el sumatorio de la función de masa, por lo que tenemos entonces que:
5
Distribuciones Discretas de Probabilidad
Y, tal como corresponde a la de finición de distribución de probabilidad, esta expresión representa la
suma de todas las probabilidades desde
hasta el valor x .
Distribuciones de variable discreta más importantes Existen 5 tipos de distribuciones de variable discreta que son las más importantes, y estas son:
Distribución binomial
Distribución binomial negativa
Distribución Poisson
Distribución geométrica
Distribución hipergeométrica
Distribución Binomial Esta distribución se basa en el proceso de Bernoulli. Se denominan procesos de tipo Bernoulli, a todo todo experi experimen mento to consis consisten tente te en una serie serie de prueba pruebas s repeti repetidas das,, caract caracteri erizad zadas as por tener tener result resultado ados s que se pueden pueden clasi clasific ficar ar en si verifi verifican can o no cierta cierta propie propiedad dad o atribu atributo, to, siendo siendo aleatorios e independientes. La distribución binomial es una generalización de la distribución de Bernoulli, a la que puede llegarse nuevamente haciendo n = 1. Su función de masa de probabilidad está dada por:
para
, siendo siendo
elementos tomados de
6
en
)
Distribuciones Discretas de Probabilidad
las combinacio combinaciones nes de
en
(
Por ejemplo, la distribución binomial se puede usar para calcular la probabilidad de sacar 5 caras y 7 cruces en 12 lanzamientos de una moneda. En realidad solo se calcula la probabilidad de sacar 5 caras, pero como es lógico si en 12 lanzamientos de una moneda sacamos 5 caras el resto deben ser cruces, 7 en este caso. Por lo tanto debemos definir la variable "X: Número de caras obtenidas en 12 lanzamientos de
moneda".
En
este
caso
se
tiene
que
y resulta:
Observese que para el caso concreto de la moneda al ser la probabilidad de éxito θ = 0,5 la función
de masa de probabilidad solo depende del número combinatorio
ya que:
x + x 0,5 x (1 − 0,5)n − x = 0,5 x 0,5n − x = 0,5n − x + = 0,5n que es constante para un n fijo.
Su media y su varianza son:
Experimento binomial La variable aleatoria binomial y su distribución están basadas en un experimento que satisface las siguientes condiciones:
El
experimento
consiste
en
una
secuencia
antes del experimento.
7
Distribuciones Discretas de Probabilidad
de n ensay ensayos os,,
dond donde e n se
fija
Los ensayos se realizan bajo idénticas condiciones, y cada uno de ellos tiene unicamente dos
posibles
resultados,
que
se
denotan
a
conveniencia
por
éxito (E) o
fracaso (F) (p(E)+p(F)=1).
Los ensayos ensayos son independ independien ientes tes,, por lo que el result resultado ado de cualqu cualquier ier ensayos ensayos en particular no influye sobre el resultado de cualquier otro intento.
La probabilidad de éxito es idéntica para todos los ensayos.
Siguiendo estas premisas, la variable aleatoria binomial X binomial X está está definida como X = el número de E entre E entre los n intentos. Relaciones con otras variables aleatorias
Se verifi verifica ca que si
parámetro parámetro
son tales tales que cada cada una sigue sigue una distri distribuc bución ión Bernou Bernouil illi li de
, y todas ellas ellas independie independientes ntes entre entre sí, entonces entonces
aleatoria con distribución binomial de parámetros
Además, si n es grande grande y
a
resulta resulta ser una variable variable
.
es pequeño, pequeño, de modo que el producto entre ambos parámetros parámetros tiende
, entonc entonces es la distri distribuc bución ión de la variab variable le aleato aleatoria ria binomial binomial tiende tiende a una distri distribuc bución ión de
Poisson de parámetro Por último, se cumple que cuando n es muy grande (n>=30) la distribución binomial se aproxima a la distribución normal. Propiedades reproductivas
Dadas n variables aleatorias
, tales que
todas tienen una distribución binomial
8
Distribuciones Discretas de Probabilidad
todas tienen el mismo parámetro
cada una tiene su propio parámetro
(es decir, decir, los n no necesariamente tienen que ser
iguales)
son todas independientes entre sí
se toma la variable aleatoria
se toma
Entonces:
La variable aleatoria Y tiene una distribución Binomial, con parámetros
y
.
Por lo tanto, dadas n variables binomiales independientes, donde cada una tiene su propio n pero
todas tienen igual
, su suma suma es también también una variable binomial, binomial, cuyo parámetro n es la suma de
los n de las las variables variables originales, originales, y cuyo parámetro
coincide con el de las originales.
Distribución binomial negativa En estadísti estadística, ca, la distribuc distribución ión binomial binomial negativa, negativa, o distribuci distribución ón pascal, pascal, es una distribuc distribución ión de probabilidad discreta. Esta distribución de variable discreta estudia el número de experimentos, independientes entre si, realizados hasta la obteción del k-ésimo éxito. Es una variable aleatoria que tiene una distribución binomial negativa con parámetros k y k y θ. Donde k es k es el número de ensayos exitosos donde acaba el experimento y θ es la probabilidad de éxito en un ensayo (o experimento).
9
Distribuciones Discretas de Probabilidad
Su función masa de Probabilidad viene dada por:
Para
Siendo el combinatorio Su media y su varianza son:
si pensamos en "fracasos esperados", y
si consideramos "número de experimentos" (incluyen k -1 -1 éxitos y los fracasos)
(para ambos casos)
Por ejemplo, si la probabilidad de que un niño expuesto a una enfermedad contagiosa la contraiga es 0,40, ¿cuál es la probabilidad de que el décimo niño expuesto a la enfermedad sea el tercero en contraerla? Sea X: Número de niños expuestos a una enfermedad contagiosa.
10
Distribuciones Discretas de Probabilidad
Distribución de Poisson En teoría de probabilidad y estadística, la distribución de Poisson 1 expresa la probabilidad de un número k de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media conocida, y son independientes del tiempo desde el último evento. La distribución fue descubierta por Siméon-Denis Poisson(1781–1840) que publicó, junto con su teoría de probabilidad, en 1838 en su trabajo Recherches sur la probabilité des
jugements
crim crimin inel elle les s
et
en
mati matièr ère e
matières civi civile le2.
El
trabaj trabajo o estaba estaba enfoca enfocado do en ciert ciertas as variables variables aleatorias aleatorias N que cuentan, cuentan,
El eje horizontal es el índice k . La función solamente está definida en valores enteros de k . Las líneas que conectan los puntos son solo guías para el ojo y no indican continuidad.
entr entre e otra otras s cosa cosas, s, un núme número ro de ocurrencias discretas (muchas veces llamadas "arribos") que tienen lugar durante un intervalo de tiempo de duración determinada. Si el número esperado de ocurrencias en este intervalo es λ, entonces la probabilidad de que haya exactamente k ocurrencias k ocurrencias (siendo k un k un entero no negativo, k = k = 0, 1, 2, ...) es igual a:
dónde
e es el base del logaritmo natural (e (e = 2.71828...),
k ! es el factorial de k ,
k es k es el número de ocurrencias de un evento,
λ es un número real positivo, equivalente al número esperado de ocurrencias durante un intervalo dado. Por ejemplo, si los eventos ocurren de media cada 4 minutos, y se está
1La distribución Poisson es también llamada Poissoniana, análogamente al término Gaussiana para una distribución de Gauss o distribución normal.
2"Investigación sobre la probabilidad de los juicios en materias criminales y civiles"
11
Distribuciones Discretas de Probabilidad
interesado en el número de eventos ocurriendo en un intervalo de 10 minutos, se usaría como modelo una distribución de Poisson con λ = 2.5. Por ejemplo, si 2% de los libros encuadernados en cierto taller tiene encuadernación defectuosa, obte obtene nerr la prob probab abil ilid idad ad de que que 5 de 400 400 libr libros os encu encuad ader erna nado dos s en este este tall taller er teng tengan an
encuadernaciones defectuosas.
Su media y su varianza son:
Como una función de k , ésta es la función probabilidad de masa. La distribución de Poisson puede ser vista como un caso limitante de la distribución binomial, es decir, que una distribución binomial
en la que que
y
se pued puede e apro aproxi xim mar por por una una dist distri ribu buci ción ón de Pois Poisso son n de
valor Ocurrencia La distribución Poisson, Se aplica a varios fenómenos discretos de la naturaleza (esto es, aquellos fenómenos que ocurren 0, 1, 2, 3, ... veces durante un periodo definido de tiempo o en una área determinada) cuando la probabilidad de ocurrencia del fenómeno es constante en el tiempo o el espaci espacio. o. Ejemp Ejemplos los de estos estos evento eventos s que pueden pueden ser modela modelados dos por la distri distribuc bución ión Poiss Poisson on incluyen:
El número de autos que pasan a través de un cierto punto en una ruta (suficientemente distantes de los semáforos) durante un periodo definido de tiempo.
El número de errores de ortografía que uno comete al escribir una única página.
El número de llamadas telefónicas en una central telefónica por minuto.
12
Distribuciones Discretas de Probabilidad
El número de servidores web accedidos por minuto.
El número de animales muertos encontrados por unidad de longitud de ruta.
El número de mutaciones de determinada cadena de ADN después de cierta cantidad de radiación.
El número de núcleos núcleos atómicos atómicos inestables inestables que decayeron decayeron en un determinado determinado periodo periodo de tiempo en una porción de sustancia radiactiva. La radiactividad de la sustancia se debilitará con el tiempo, por lo tanto el tiempo total del intervalo usado en el modelo debe ser significativamente significativamente menor que la vida media de la sustancia.
El número de estrellas en un determinado volumen de espacio.
La distribución de receptores visuales en la retina del ojo humano.
La inventiva de un inventor a través de su carrera.
13
Distribuciones Discretas de Probabilidad
Propiedades
El valor esperado de una variable aleatoria con distribución Poisson es igual a λ y también lo es su varianza varianza.. Los momento momentos s más altos de la distribuci distribución ón Poisson Poisson son polinomi polinomios os de Touchard ouchard en λ cuyos coeficientes coeficientes tienen tienen un sentido sentido combinato combinatorio. rio. De hecho, cuando el valor esperado de la distribución Poisson es 1, entonces la fórmula de Dobinski dice que el enésimo momento iguala al número de particiones de tamaño n.
Las medidas de tendencia central de una variable aleatoria de distribución Poisson con un
λ no no entero entero es igual a
(o suelo suelo de λ), el cual cual es es el número entero entero más grande grande menor menor o
igual a λ. Esto también también es expresado expresado como la función función parte entera de λ. Cuando Cuando λ es un entero positivo, las medidas de tendencia central son λ y λ − 1.
Sumas de las variables aleatorias de distribución Poisson:
Si
sigue
una
distribución
Poisson
y X i i son son inde indepe pend ndie ient ntes es ento entonc nces es
con
tamb tambié ién n
parámetro
sigu sigue e
una una
distribución Poisson cuyo parámetro es la suma de los parámetros del componente.
La función generadora de momentos de la distribución Poisson con valor esperado λ es:
Todas las acumulaci acumulaciones ones de la distribución distribución Poisson Poisson son iguales al valor esperado esperado λ. El enésimo momento factorial de la distribución Poisson es λn.
La distribuciones Poisson son funciones probabilísticas infinitamente divisibles.
14
Distribuciones Discretas de Probabilidad
La divergencia Kullback-Leibler dirigida entre Poi(λ0) y Poi(λ) está dada por:
Distribución Geométrica En teoría teoría
de
probab probabili ilidad dad y estadí estadísti stica, ca,
la distri distribuc bución ión
geomét geométric rica a
es
cualqu cualquier iera a
de
las las
dos distribuciones de probabilidad discretas siguientes:
La distri distribuc bución ión de probab probabili ilidad dad del número número X X del del ensayo de Bernoulli Bernoulli necesaria necesaria para obtener un éxito, contenido en el conjunto { 1, 2, 3,...} o
La distribuc distribución ión de probabili probabilidad dad del número Y = Y = X − X − 1 de fallos fallos antes antes del primer primer éxito, éxito, contenido en el conjunto { 0, 1, 2, 3,... }.
Cuál de éstas es la que uno llama "la" distribución distribución geométrica, geométrica, es una cuestión cuestión de convención convención y conveniencia. Si la probabilidad de éxito en cada ensayo es p es p,, entonces la probabilidad de que n ensayos sean necesarios para obtener un éxito es
para n = 1, 2, 3,.... Equivalentemente, la probabilidad de que haya n fallos antes del primer éxito es
para n = 0,1, 2, 3,.... En ambos casos, la secuencia de probabilidades es una secuencia geométrica. Por ejemplo, supongamos que un dado ordinario es lanzado repetidamente hasta que aparece "1" por primera vez. La distribución de probabilidad del número de veces que el dado es lanzado se encuentra en el conjunto infinito {1, 2, 3,...} y es una distribución geométrica con p=1/6. p=1/6. El valor esperado de una variable aleatoria X aleatoria X distribuida distribuida geométricamente es 1/' p p y su varianza es (1 − p − p)/ )/ p p2;
15
Distribuciones Discretas de Probabilidad
Equivalent Equivalentement emente, e, el valor esperado esperado de una variable variable aleatoria aleatoria distribui distribuida da geométric geométricament amente e Y es Y es (1 − p − p)/ )/ p, p, y su varianza es (1 − p − p)/ )/ p p2.
La función generatriz de probabilidad de X de X y y la de Y son, Y son, respectivamente,
Como su continua análoga (la distribución exponencial), la distribución geométrica es sin memoria. Esto significa que si intentamos repetir el experimento hasta el primer éxito, entonces, dado que el primer éxito todavía no ha ocurrido, la distribución de probabilidad condicional del número de ensayos adicionales no depende de cuantos fallos se hayan observado. El dado o la moneda que uno lanza no tiene "memoria" de estos fallos. La distribución geométrica es de hecho la única distribución discreta sin memoria. De todas estas distribuciones de probabilidad contenidas en {1, 2, 3,... } con un valor esperado dado μ, la distribución geométrica X geométrica X con con parámetro p parámetro p = 1/μ es la de mayor entropía La distribución geométrica del número y de y de fallos antes del primer éxito es infinitamente divisible, esto
es,
para
cualquier
entero
positivo n,
existen
variables
aleatorias
independientes Y 1,..., Y n dist distri ribu buid idas as idén idénti tica came ment nte e la suma suma de las las cual cuales es tien tiene e la mism misma a distribución que tiene Y . Estas no serán geométricamente distribuidas a menos que n = 1
16
Distribuciones Discretas de Probabilidad
Distribuciones relacionadas La distribución geométrica Y es Y es un caso especial de la distribución binomial negativa, con r = r = 1. Más generalme generalmente, nte, si Y 1,...,Y ,..., Y r r son variables variables independie independientes ntes distribuid distribuidas as geométric geométricament amente e con
parámetro p parámetro p,,
ento entonc nces es
sigu sigue e
a
una una
dist distri ribu buci ción ón
bino binomi mial al
nega negati tiva va
con con
parámetros r y r y p. p. Si Y 1,...,Y ,..., Y r r son variables independientes distribuidas geométricamente (con diferentes parámetros de éxito p éxito pm posibles ), entonces su mínimo W = W = minmY m es también geométricamente distribuido, con parámetro p parámetro p dado por
1-∏m(1-Pm)
Distribución hipergeométrica En estadística la
Distribución hipergeométrica es una distribuci distribución ón de probabili probabilidad dad discreta discreta con
tres parámetros discretos N , d y d y n cuya función de probabilidad es:
N = N = Tamaño de población. n = Tamaño de muestra. d = d = Cantidad de elementos que cumple característica deseada. x = x = Cantidad de éxitos.
17
Distribuciones Discretas de Probabilidad
Aquí Aquí,,
se refie refiere re al coef coefic icie ient nte e bino binomi mial al,, o al númer número o de combi combina naci cion ones es posib posible les s al
seleccionar b seleccionar b elementos de un total a. Esta distribución se refiere a un espacio muestral donde hay elementos de 2 tipos posibles. Indica la probabilidad de obtener un número de objetos x objetos x de de uno de los tipos, al extraer (sin reemplazo) una muestra de tamaño n, de un total de N objetos, N objetos, de los cuales d son d son del tipo requerido. El valor esperado de una variable aleatoria X aleatoria X de de distribución hipergeométrica es
Y su varianza
llamando
,
q = 1 − p − p
entonces:
La distribución hipergeométrica se puede aproximar por una distribución binomial Bi (n p) ,p) si
y
18
Distribuciones Discretas de Probabilidad
BIBLIOGRAFÍA •
Gestiopolis: http://www.gestiopolis.com/rec http://www.gestiopolis.com/recursos/experto/catsexp/pagans/ ursos/experto/catsexp/pagans/eco/44/distripoisson.ht eco/44/distripoisson.htm m 10:00 pm - 15 /Nov/ 2008.
•
Monografías: http://www.monografias.com/t http://www.monografias.com/trabajos27/probabilidadesdiscr rabajos27/probabilidadesdiscretas/probabilidadesetas/probabilidadesdiscretas.shtml - 03:15 pm - 16 /Nov/ 2008.
•
Wikipedia: http://es.wikipedia.org/wiki/D http://es.wikipedia.org/wiki/Distribuci%C3%B3 istribuci%C3%B3n_de_probabilidad n_de_probabilidad – 9:45 am – 15 /Nov/ 2008.
19
Distribuciones Discretas de Probabilidad