Intervalos

Estimación puntual y estimación por intervalos La estimación puntual presenta un gran inconveniente: aún utilizando el mejor estimador de una característica poblacional o parámetro, no sólo no acertaremos en la estimación (la posibilidad de acertar es remota), sino que desconoceremos el grado de precisión y iabilidad de la misma! "sí, cuando estimamos que el número medio de #oras diarias ante el televisor es $!% a partir de la inormación que proporcionan &''' individuos elegidos al azar, no medimos ni la discrepancia con el verdadero valor del parámetro (precisión), ni la probabilidad de equivocarse en menos de una cierta cantidad (iabilidad)! La única garantía que podemos tener acerca de la bondad de la estimación proviene del #ec#o de que se #a realizado con el estimador más adecuado (en ese caso, la media muestral)! ara evitar esta insuiciencia de la estimación puntual se introducen los intervalos de conianza! Tamaño muestral, precisión y fiabilidad ea una variable aleatoria X cuya distribución depende de un parámetro

* para obtener inormación

sobre este parámetro tomamos una muestra aleatoria simple de dic#a variable, ! +n intervalo de confianza alea confianza aleatorio torio a un nivel nivel de & & es un conju conjunto nto de de posible posibles s valores valores del del parámetr parámetro o dentro del cual se encuentra el verdadero valor del mismo con una probabilidad de & ! -ste conjunto está delimitado por dos estadísticos: el primero de ellos, el e.tremo inerior del intervalo, es un estimador por deecto del parámetro, mientras que el segundo, el e.tremo superior del intervalo, es un estimador por e.ceso del mismo! /uando la muestra se concreta, el intervalo pasa de ser aleatorio a ser un intervalo en la recta real en el que coniamos que est0 el verdadero valor del parámetro!

1e manera más ormal, dada una muestra aleatoria simple estadísticos, , nivel &

y

y dos

, tal que es un intervalo de conianza aleatorio para el parámetro

a

si

ara una realización de la muestra,

, obtenemos el intervalo de conianza num0rico:

-l nivel de confianza, confianza , & , mide la fiabilidad del fiabilidad del intervalo de probabilidad, esto es, la probabilidad de acertar! 2abitualmente se toman valores como '!3', '!34 o '!33, correspondientes correspondient es a valores de de '!&', '!'4 y '!'&, probabilidad de equivocarse! 5ientras consideremos la muestra como aleatoria interpretaremos el intervalo en t0rminos de probabilidad! +na vez concretados los valores de la muestra y, por tanto, del intervalo, interpretaremos 0ste en t0rminos de conianza: si pudi0semos repetir la toma de datos de orma reiterada, el de los intervalos contendría el verdadero valor del parámetro! La hoja adjunta ilustra hoja adjunta este #ec#o a partir de &4' intervalos de conianza sobre la media poblacional obtenidos simulando una misma distribución normal!

La longitud del intervalo, , mide la precisión de la estimación: intervalos largos proporcionan estimaciones imprecisas, mientras que intervalos cortos proporcionan estimaciones precisas! 2abitualmente la precisión se e.presa como el radio del intervalo,

, el margen de error de la estimación!

+n intervalo de conianza puede utilizarse para tomar decisiones sobre el verdadero valor del parámetro! "sí, planteada una #ipótesis sobre del intervalo!

,

, se acepta (no se rec#aza) si

es uno de los valores

+n ejemplo nos ayudará a construir un intervalo y a entender los principales conceptos! 6ueremos saber acerca del número de #oras diarias de estudio de los bac#illeres espa7oles, para lo cual tomamos una muestra de tama7o &''' que arroja los resultados que se incluyen en la tabla: 2oras de estudio

$!8 &!9 $!3 !!! %!& %!$ %

siendo $! el número medio de #oras diarias que dedican al estudio los &''' bac#illeres seleccionados! La figura muestra el #istograma de recuencias de estos datos! ;amos a construir el intervalo de conianza para la media de #oras diarias de estudio de los bac#illeres,

, a un nivel de conianza de '!34, esto es, con una probabilidad de equivocarnos de '!'4!

ara abordar el problema suponemos que X , número de horas de estudio diarias de un bachiller , sigue una distribución normal de media , desconocida, y de varianza '!<&! La suposición de normalidad está plenamente justiicada dada la naturaleza de la variable, que se ve inluida por múltiples actores* esta suposición se ve corroborada por la orma que presenta el #istograma anterior, que no es muy dierente a la unción de densidad de una normal! or otro lado, la suposición de varianza conocida carece de undamento (si la media es desconocida, con más motivo lo será tambi0n la varianza), pero esta suposición sirve para introducir el problema sin e.cesivas complicaciones ormales! or tanto,

La media muestral, conianza sobre

, el mejor estimador de a nivel de conianza de &

conocer la distribución del estadístico tama7o n de una variable normal, varianza

, es de nuevo la clave para encontrar un intervalo de ! ara construir el intervalo de conianza, necesitamos

! La media muestral de una muestra aleatoria simple de , tiene una distribución normal de media

y de

:

-ste resultado permite construir un intervalo de conianza sobre

cuando suponemos conocida

!

ara ello, tipiiquemos previamente el estimador , restándole la media y dividiendo por su desviación, trasormación 0sta que no aecta a su normalidad:

" partir de este resultado, que proporciona el estadístico pivote, buscamos dos valores y tales que dejen entre sí una probabilidad de & en una distribución normal tipiicada! 1e esta orma,

-n esta doble desigualdad operamos para dejar sólo y en el centro de la misma el parámetro de nuestra inerencia! "sí se obtiene un intervalo de conianza para a nivel & :

, objetivo

=otemos que e.isten muc#as parejas que dejan entre ellas una probabilidad de & pero, evidentemente, es deseable que la estimación sea lo más precisa posible, esto es, que el intervalo tenga longitud mínima! -n este caso, la longitud del intervalo es

longitud que se #ace mínima cuando sim0tricos! -ntonces, a (el más corto) es

y

y

est0n lo más cerca posible, situación que se da cuando son

los denotaremos como

y

! 1e esta orma, el intervalo óptimo

-n concreto, para construir un intervalo de conianza al 34> sobre el número medio de #oras de estudio,

, con una muestra de tama7o &''', sustituyendo se obtiene:

donde ?&!39 y @&!39 son los dos puntos que en la distribución normal estándar dejan '!'$4 de probabilidad en cada cola! impliicando resulta

lo que permite decir que el verdadero valor del parámetro está entre y , con una probabilidad de '!34, o lo que es lo mismo, que el verdadero valor de diiere de la media muestral en,

a lo sumo, '!'49 con una probabilidad de '!34! /omo se ve, estos dos estadísticos son estimadores por deecto y por e.ceso, respectivamente, de

!

Ainalmente, dado que el número medio de #oras de estudio entre los bac#illeres de la muestra era $!, se sustituye en la anterior e.presión dando lugar al intervalo real

pudi0ndose airmar con una conianza del 34> que el número medio de #oras diarias dedicadas al estudio de los bac#illeres espa7oles está entre $!98 y $!4! Bbs0rvese que este intervalo no puede interpretarse en t0rminos de probabilidad, sino en t0rminos de conianza! i #emos acertado, está entre dic#os valores, y si #emos allado, no está entre los mismos, pero nunca sabremos en cuál de las dos situaciones nos encontramos! i este problema se plantea repetidas veces tomando cada vez una muestra distinta, obtendríamos intervalos de conianza no aleatorios y distintos en cada caso, pudi0ndose airmar que en el 34> de esos intervalos #emos acertado, y que en el 4> restante #emos allado (nunca podremos identiicar cuáles son aqu0llos en los que #emos acertado y aqu0llos en los que #emos allado)! "dvi0rtase que en la construcción del intervalo de conianza podemos controlar tres actores:

•

-l tamaño de la muestra n que nos cuantiica el número de observaciones y, por tanto, la cantidad de inormación de que dispondremos!

•

La fiabilidad del intervalo, &

, esto es, la probabilidad de que el parámetro se encuentre

dentro del intervalo aleatorio* o lo que es lo mismo, la probabilidad de equivocarse,

•

!

La precisión de la estimación o longitud del intervalo, L!

"sí, en el intervalo construido, contábamos con una muestra de tama7o &''' y para una iabilidad de '!34 #emos obtenido un intervalo de longitud '!&$, o en notación más #abitual, con una precisión de @C '!'9! Aijado uno de los tres actores anteriores podemos ver cómo se relacionan los otros dos entre sí! 1esarrollemos estos resultados en el supuesto del ejemplo planteado, si bien todas las conclusiones son generalizables a cualquier otra situación! I. Aijado el tama7o de la muestra, n, una mayor iabilidad (es decir, menor ) implica una menor precisión (un intervalo más largo)* esto es, si queremos incrementar la probabilidad de acierto lo #aremos a e.pensas de perder precisión en la estimación! La longitud del intervalo de conianza óptimo para la media poblacional de una variable normal con desviación conocida vale:

-ntonces, ijado el tama7o n, al crecer (menor iabilidad), decrece, para dejar a su derec#a una cola más grande, y Ltambi0n decrece (mayor precisión)! or tanto, la longitud del intervalo es unción decreciente de ! /ompru0bese este #ec#o en la hoja adjunta obteniendo un intervalo con una mayor iabilidad, en concreto, al 33>! Dodo esto nos conirma la imposibilidad de encontrar un intervalo ideal , muy iable y muy preciso, teniendo que llegar a situaciones de compromiso en las que no se sacriique la precisión para conseguir una iabilidad óptima y viceversa! II. ara una iabilidad concreta, un aumento en el tama7o de la muestra, produce una mejora en la precisión de la estimación! -sto es, si es ijo, al aumentar el tama7o muestral n, la longitud L del intervalo decrece, #ec#o que se deduce a partir de la e.presión de la longitud del intervalo:

III. ara una precisión ijada, un aumento en el tama7o muestral, produce una mayor iabilidad! 1e la e.presión de la longitud del intervalo deducimos que

-ntonces, si L permanece ijo, un aumento de n produce un aumento de , o lo que es lo mismo, una disminución en la probabilidad ! or tanto, si pretendemos que el intervalo tenga una longitud determinada y podemos aumentar el tama7o de la muestra, este aumento provoca una mayor iabilidad en la estimación ( disminuye)! -stas dos últimas observaciones evidencian un resultado totalmente esperable: la posibilidad de contar con una muestra más grande mejora la estimación, bien sea aumentando la iabilidad (disminuyendo ), bien sea aumentando la precisión (disminuyendo L)! "#ora bien, este deseable aumento de inormación no siempre es posible! ensemos que una muestra más grande supone un mayor coste económico, una mayor demora en la obtención de resultados e, incluso, una p0rdida en la calidad de la inormación! -n la práctica, el cliente que encarga una encuesta a un estadístico le pide que los resultados obtenidos tengan una cierta iabilidad (un determinado & ) y una cierta precisión (un determinado L)* el estadístico determinará una muestra lo más peque7a posible (esto es, lo más barata, rápida y buena posible) para conseguir dic#os objetivos (con todo esta situación no deja de ser ideal pues en la mayor parte de las situaciones el cliente dispondrá de un tec#o presupuestario lo que limitará el número de observaciones a realizar)! -n esta situación, despejando n en la e.presión de la longitud del intervalo, se obtiene:

de donde podremos obtener el valor de n que nos proporcione un intervalo de conianza de una iabilidad y una precisión determinada! or último, la varianza juega tambi0n un papel importante en la estimación por intervalos! -n concreto, las variables menos dispersas (menos variables), es decir, las que tienen varianza peque7a, admiten una mejor estimación, en el sentido de una estimación más iable y precisa! Estimación por intervalos /on la estimación puntual se estima el valor del parámetro poblacional desconocido, a partir de una muestra! ara cada muestra se tendrá un valor que estima el parámetro! -sta estimación no es muy útil si desconocemos el grado de apro.imación de la estimación al parámetro! -s deseable conocer un m0todo que nos permita saber donde se encuentra el parámetro con un cierto grado de certeza! -ste m0todo va a ser la determinación de un intervalo donde estará el parámetro con un nivel de conianza! -l intervalo se construye a partir de una muestra, entonces, para cada muestra se tendrá un intervalo distinto! Llamaremos a al error que se permite al dar el intervalo y el nivel de conianza será & ! +n intervalo tiene un nivel de conianza & cuando el &''E(& )> de los intervalos que se construyen para el parámetro lo contienen! -s deseable para un intervalo de conianza que tenga la menor amplitud posible, esta amplitud dependerá de: •

•

-l tama7o de la muestra, mientras mayor sea el tama7o mejor será la estimación, aunque se incurre en un aumento de costes =ivel de conianza, si se pide mayor nivel de conianza, el intervalo será mayor!

" veces es conveniente obtener unos límites entre los cuales se encuentre el parámetro con un cierto nivel de conianza, en este caso #ablamos de estimación por intervalos! El nivel de confianza , /, indica, en porcentaje, con qu0 proporción el intervalo de conianza contiene el

parámetro estimado! -l coeiciente de conianza, c, es la misma proporción en tanto por uno, c F /C&''! -n otras palabras, c es la probabilidad de que el intervalo de conianza contenga el parámetro estimado! i G F &  c, y (a,b) es el intervalo de conianza se cumplirá: Dado un nivel de confianza, C, calculamos el coeficiente de confianza, c = C/100.

eguidamente calculamos G F &  c y GC$! i H I =(',&), el punto crítico, zGC$, es el que cumple p(H J zGC$) F &  GC$! or último buscamos en la tabla de la unción de distribución de la distribución =(',&) el valor de z cuya probabilidad es &  GC$! ara comprobar el valor obtenido podemos usar la siguiente escena:

Intervalos

Recommend Documents