Estimación puntual y estimación por intervalos La estimación puntual presenta un gran inconveniente: aún utilizando el mejor estimador de una característica poblacional o parámetro, no sólo no acertaremos en la estimación (la posibilidad de acertar es remota), sino que desconoceremos el grado de precisión y iabilidad de la misma! "sí, cuando estimamos que el número medio de #oras diarias ante el televisor es $!% a partir de la inormación que proporcionan &''' individuos elegidos al azar, no medimos ni la discrepancia con el verdadero valor del parámetro (precisión), ni la probabilidad de equivocarse en menos de una cierta cantidad (iabilidad)! La única garantía que podemos tener acerca de la bondad de la estimación proviene del #ec#o de que se #a realizado con el estimador más adecuado (en ese caso, la media muestral)! ara evitar esta insuiciencia de la estimación puntual se introducen los intervalos de conianza! Tamaño muestral, precisión y fiabilidad ea una variable aleatoria X cuya distribución depende de un parámetro
* para obtener inormación
sobre este parámetro tomamos una muestra aleatoria simple de dic#a variable, ! +n intervalo de confianza alea confianza aleatorio torio a un nivel nivel de & & es un conju conjunto nto de de posible posibles s valores valores del del parámetr parámetro o dentro del cual se encuentra el verdadero valor del mismo con una probabilidad de & ! -ste conjunto está delimitado por dos estadísticos: el primero de ellos, el e.tremo inerior del intervalo, es un estimador por deecto del parámetro, mientras que el segundo, el e.tremo superior del intervalo, es un estimador por e.ceso del mismo! /uando la muestra se concreta, el intervalo pasa de ser aleatorio a ser un intervalo en la recta real en el que coniamos que est0 el verdadero valor del parámetro!
1e manera más ormal, dada una muestra aleatoria simple estadísticos, , nivel &
y
y dos
, tal que es un intervalo de conianza aleatorio para el parámetro
a
si
ara una realización de la muestra,
, obtenemos el intervalo de conianza num0rico:
-l nivel de confianza, confianza , & , mide la fiabilidad del fiabilidad del intervalo de probabilidad, esto es, la probabilidad de acertar! 2abitualmente se toman valores como '!3', '!34 o '!33, correspondientes correspondient es a valores de de '!&', '!'4 y '!'&, probabilidad de equivocarse! 5ientras consideremos la muestra como aleatoria interpretaremos el intervalo en t0rminos de probabilidad! +na vez concretados los valores de la muestra y, por tanto, del intervalo, interpretaremos 0ste en t0rminos de conianza: si pudi0semos repetir la toma de datos de orma reiterada, el de los intervalos contendría el verdadero valor del parámetro! La hoja adjunta ilustra hoja adjunta este #ec#o a partir de &4' intervalos de conianza sobre la media poblacional obtenidos simulando una misma distribución normal!
La longitud del intervalo, , mide la precisión de la estimación: intervalos largos proporcionan estimaciones imprecisas, mientras que intervalos cortos proporcionan estimaciones precisas! 2abitualmente la precisión se e.presa como el radio del intervalo,
, el margen de error de la estimación!
+n intervalo de conianza puede utilizarse para tomar decisiones sobre el verdadero valor del parámetro! "sí, planteada una #ipótesis sobre del intervalo!
,
, se acepta (no se rec#aza) si
es uno de los valores
+n ejemplo nos ayudará a construir un intervalo y a entender los principales conceptos! 6ueremos saber acerca del número de #oras diarias de estudio de los bac#illeres espa7oles, para lo cual tomamos una muestra de tama7o &''' que arroja los resultados que se incluyen en la tabla: 2oras de estudio
$!8 &!9 $!3 !!! %!& %!$ %
siendo $! el número medio de #oras diarias que dedican al estudio los &''' bac#illeres seleccionados! La figura muestra el #istograma de recuencias de estos datos! ;amos a construir el intervalo de conianza para la media de #oras diarias de estudio de los bac#illeres,
, a un nivel de conianza de '!34, esto es, con una probabilidad de equivocarnos de '!'4!
ara abordar el problema suponemos que X , número de horas de estudio diarias de un bachiller , sigue una distribución normal de media , desconocida, y de varianza '!<&! La suposición de normalidad está plenamente justiicada dada la naturaleza de la variable, que se ve inluida por múltiples actores* esta suposición se ve corroborada por la orma que presenta el #istograma anterior, que no es muy dierente a la unción de densidad de una normal! or otro lado, la suposición de varianza conocida carece de undamento (si la media es desconocida, con más motivo lo será tambi0n la varianza), pero esta suposición sirve para introducir el problema sin e.cesivas complicaciones ormales! or tanto,
La media muestral, conianza sobre
, el mejor estimador de a nivel de conianza de &
conocer la distribución del estadístico tama7o n de una variable normal, varianza
, es de nuevo la clave para encontrar un intervalo de ! ara construir el intervalo de conianza, necesitamos
! La media muestral de una muestra aleatoria simple de , tiene una distribución normal de media
y de
:
-ste resultado permite construir un intervalo de conianza sobre
cuando suponemos conocida
!
ara ello, tipiiquemos previamente el estimador , restándole la media y dividiendo por su desviación, trasormación 0sta que no aecta a su normalidad:
" partir de este resultado, que proporciona el estadístico pivote, buscamos dos valores y tales que dejen entre sí una probabilidad de & en una distribución normal tipiicada! 1e esta orma,
-n esta doble desigualdad operamos para dejar sólo y en el centro de la misma el parámetro de nuestra inerencia! "sí se obtiene un intervalo de conianza para a nivel & :
, objetivo
=otemos que e.isten muc#as parejas que dejan entre ellas una probabilidad de & pero, evidentemente, es deseable que la estimación sea lo más precisa posible, esto es, que el intervalo tenga longitud mínima! -n este caso, la longitud del intervalo es
longitud que se #ace mínima cuando sim0tricos! -ntonces, a (el más corto) es
y
y
est0n lo más cerca posible, situación que se da cuando son
los denotaremos como
y
! 1e esta orma, el intervalo óptimo
-n concreto, para construir un intervalo de conianza al 34> sobre el número medio de #oras de estudio,
, con una muestra de tama7o &''', sustituyendo se obtiene:
donde ?&!39 y @&!39 son los dos puntos que en la distribución normal estándar dejan '!'$4 de probabilidad en cada cola! impliicando resulta
lo que permite decir que el verdadero valor del parámetro está entre y , con una probabilidad de '!34, o lo que es lo mismo, que el verdadero valor de diiere de la media muestral en,
a lo sumo, '!'49 con una probabilidad de '!34! /omo se ve, estos dos estadísticos son estimadores por deecto y por e.ceso, respectivamente, de
!
Ainalmente, dado que el número medio de #oras de estudio entre los bac#illeres de la muestra era $!, se sustituye en la anterior e.presión dando lugar al intervalo real
pudi0ndose airmar con una conianza del 34> que el número medio de #oras diarias dedicadas al estudio de los bac#illeres espa7oles está entre $!98 y $!4! Bbs0rvese que este intervalo no puede interpretarse en t0rminos de probabilidad, sino en t0rminos de conianza! i #emos acertado, está entre dic#os valores, y si #emos allado, no está entre los mismos, pero nunca sabremos en cuál de las dos situaciones nos encontramos! i este problema se plantea repetidas veces tomando cada vez una muestra distinta, obtendríamos intervalos de conianza no aleatorios y distintos en cada caso, pudi0ndose airmar que en el 34> de esos intervalos #emos acertado, y que en el 4> restante #emos allado (nunca podremos identiicar cuáles son aqu0llos en los que #emos acertado y aqu0llos en los que #emos allado)! "dvi0rtase que en la construcción del intervalo de conianza podemos controlar tres actores:
•
-l tamaño de la muestra n que nos cuantiica el número de observaciones y, por tanto, la cantidad de inormación de que dispondremos!
•
La fiabilidad del intervalo, &
, esto es, la probabilidad de que el parámetro se encuentre
dentro del intervalo aleatorio* o lo que es lo mismo, la probabilidad de equivocarse,
•
!
La precisión de la estimación o longitud del intervalo, L!
"sí, en el intervalo construido, contábamos con una muestra de tama7o &''' y para una iabilidad de '!34 #emos obtenido un intervalo de longitud '!&$, o en notación más #abitual, con una precisión de @C '!'9! Aijado uno de los tres actores anteriores podemos ver cómo se relacionan los otros dos entre sí! 1esarrollemos estos resultados en el supuesto del ejemplo planteado, si bien todas las conclusiones son generalizables a cualquier otra situación! I. Aijado el tama7o de la muestra, n, una mayor iabilidad (es decir, menor ) implica una menor precisión (un intervalo más largo)* esto es, si queremos incrementar la probabilidad de acierto lo #aremos a e.pensas de perder precisión en la estimación! La longitud del intervalo de conianza óptimo para la media poblacional de una variable normal con desviación conocida vale:
-ntonces, ijado el tama7o n, al crecer (menor iabilidad), decrece, para dejar a su derec#a una cola más grande, y Ltambi0n decrece (mayor precisión)! or tanto, la longitud del intervalo es unción decreciente de ! /ompru0bese este #ec#o en la hoja adjunta obteniendo un intervalo con una mayor iabilidad, en concreto, al 33>! Dodo esto nos conirma la imposibilidad de encontrar un intervalo ideal , muy iable y muy preciso, teniendo que llegar a situaciones de compromiso en las que no se sacriique la precisión para conseguir una iabilidad óptima y viceversa! II. ara una iabilidad concreta, un aumento en el tama7o de la muestra, produce una mejora en la precisión de la estimación! -sto es, si es ijo, al aumentar el tama7o muestral n, la longitud L del intervalo decrece, #ec#o que se deduce a partir de la e.presión de la longitud del intervalo:
III. ara una precisión ijada, un aumento en el tama7o muestral, produce una mayor iabilidad! 1e la e.presión de la longitud del intervalo deducimos que
-ntonces, si L permanece ijo, un aumento de n produce un aumento de , o lo que es lo mismo, una disminución en la probabilidad ! or tanto, si pretendemos que el intervalo tenga una longitud determinada y podemos aumentar el tama7o de la muestra, este aumento provoca una mayor iabilidad en la estimación ( disminuye)! -stas dos últimas observaciones evidencian un resultado totalmente esperable: la posibilidad de contar con una muestra más grande mejora la estimación, bien sea aumentando la iabilidad (disminuyendo ), bien sea aumentando la precisión (disminuyendo L)! "#ora bien, este deseable aumento de inormación no siempre es posible! ensemos que una muestra más grande supone un mayor coste económico, una mayor demora en la obtención de resultados e, incluso, una p0rdida en la calidad de la inormación! -n la práctica, el cliente que encarga una encuesta a un estadístico le pide que los resultados obtenidos tengan una cierta iabilidad (un determinado & ) y una cierta precisión (un determinado L)* el estadístico determinará una muestra lo más peque7a posible (esto es, lo más barata, rápida y buena posible) para conseguir dic#os objetivos (con todo esta situación no deja de ser ideal pues en la mayor parte de las situaciones el cliente dispondrá de un tec#o presupuestario lo que limitará el número de observaciones a realizar)! -n esta situación, despejando n en la e.presión de la longitud del intervalo, se obtiene:
de donde podremos obtener el valor de n que nos proporcione un intervalo de conianza de una iabilidad y una precisión determinada! or último, la varianza juega tambi0n un papel importante en la estimación por intervalos! -n concreto, las variables menos dispersas (menos variables), es decir, las que tienen varianza peque7a, admiten una mejor estimación, en el sentido de una estimación más iable y precisa! Estimación por intervalos /on la estimación puntual se estima el valor del parámetro poblacional desconocido, a partir de una muestra! ara cada muestra se tendrá un valor que estima el parámetro! -sta estimación no es muy útil si desconocemos el grado de apro.imación de la estimación al parámetro! -s deseable conocer un m0todo que nos permita saber donde se encuentra el parámetro con un cierto grado de certeza! -ste m0todo va a ser la determinación de un intervalo donde estará el parámetro con un nivel de conianza! -l intervalo se construye a partir de una muestra, entonces, para cada muestra se tendrá un intervalo distinto! Llamaremos a al error que se permite al dar el intervalo y el nivel de conianza será & ! +n intervalo tiene un nivel de conianza & cuando el &''E(& )> de los intervalos que se construyen para el parámetro lo contienen! -s deseable para un intervalo de conianza que tenga la menor amplitud posible, esta amplitud dependerá de: •
•
-l tama7o de la muestra, mientras mayor sea el tama7o mejor será la estimación, aunque se incurre en un aumento de costes =ivel de conianza, si se pide mayor nivel de conianza, el intervalo será mayor!
" veces es conveniente obtener unos límites entre los cuales se encuentre el parámetro con un cierto nivel de conianza, en este caso #ablamos de estimación por intervalos! El nivel de confianza , /, indica, en porcentaje, con qu0 proporción el intervalo de conianza contiene el
parámetro estimado! -l coeiciente de conianza, c, es la misma proporción en tanto por uno, c F /C&''! -n otras palabras, c es la probabilidad de que el intervalo de conianza contenga el parámetro estimado! i G F & c, y (a,b) es el intervalo de conianza se cumplirá: Dado un nivel de confianza, C, calculamos el coeficiente de confianza, c = C/100.
eguidamente calculamos G F & c y GC$! i H I =(',&), el punto crítico, zGC$, es el que cumple p(H J zGC$) F & GC$! or último buscamos en la tabla de la unción de distribución de la distribución =(',&) el valor de z cuya probabilidad es & GC$! ara comprobar el valor obtenido podemos usar la siguiente escena: