TEORIA DE LA ESTIMACION En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n. La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos métodos que se usan en función de las características y propósitos del estudio:
1. Estimación puntual:
Método de los momentos;
Método de la máxima verosimilitud;
Método de los mínimos cuadrados;
2. Estimación por intervalos. 3. Estimación bayesiana.
Estimador Un estimador es una regla que establece cómo calcular una estimación basada en las mediciones contenidas en una muestra estadística.
Estimación puntual Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla media de los individuos. Lo más importante de un estimador, es que sea un estimador eficiente. Es decir, que sea insesgado (ausencia de sesgos) y estable en el muestreo o eficiente (varianza mínima) Estimación puntual. Sea X una variable poblacional con distribución Fθ , siendo θ desconocido. El problema de estimación puntual consiste en, seleccionada una muestra X1, ..., Xn, encontrar el estadístico T(X1, ..., Xn) que mejor estime el parámetro θ. Una vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimación puntual de θ, T(x1, ..., xn) = ˆ θ . Vemos a continuación dos métodos para obtener la estimación puntual de un parámetro: método de los momentos y método de máxima verosimilitud. Método de los momentos: consiste en igualar momentos poblacionales a momentos muestrales. Deberemos tener tantas igualdades como parámetros a estimar. Momento poblacional de orden r αr = E(Xr) Momento muestral de orden r ar = Xn i=1 Xr i n Método de máxima verosimilitud: consiste en tomar como valor del parámetro aquel que maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una muestra seleccionada de una población con distribución Fθ o densidad fθ(x), la probabilidad de que ocurra una realización x1, ..., xn viene dada por: Lθ(x1, ..., xn) = Yn i=1 fθ(xi) A Lθ(x1, ..., xn) se le llama función de verosimilitud.(credibilidad de la muestra observada). Buscamos entonces el valor de θ que maximice la función de verosimilud, y al valor obtenido se le llama estimación por máxima
verosimilitud de θ. Nota: si la variable X es discreta, en lugar de fθ(xi ) consideramos la función masa de probabilidad pθ(xi).
Ejemplo 7.1: Sea X → N(µ, σ), con µ desconocido. Seleccionada una m.a.s. X1, ..., Xn, con realización x1, ..., xn, estimamos el parámetro µ por ambos métodos. Según el método de los momentos: E(X) = Xn i=1 Xi n = − X, y al ser µ = E(X) se obtiene que ˆ µ = − x. Por el método de máxima verosimilitud: Lµ(x1, ..., xn) = Yn i=1 fµ(xi ) = = Yn i=1 1 √ 2πσ e −(xi−µ) 2 2σ
Estimación por Intervalos de confianza 109 y maximizamos en µ tal función; en este caso resulta más fácil maximizar su logaritmo: lnLµ(x1, ..., xn) = − 1 2σ 2 Xn i=1 (xi − µ) 2 − n ln( √ 2πσ) ∂ ∂µ lnLµ(x1, ..., xn) = 1 σ 2 Xn i=1 (xi − µ) = n − x − nµ σ 2 = 0 ⇐⇒ ˆ µ = −
Estimación por intervalos Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad. En la estimación por intervalos se usan los siguientes conceptos:
Intervalo de confianza El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este intervalo contiene al parámetro estimado con un determinado nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial.
Variabilidad del Parámetro Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviación típica poblacional y se denota σ.
Error de la estimación Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el error, más ocurrencias deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1)/2.
Límite de Confianza Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores α de 0,05 y 0,01 respectivamente.
PRUEBA DE HIPOTESIS
CONCEPTO Afirmación acerca de los parámetros de la población.
Hipótesis Estadística: Al intentar alcanzar una decisión, es útil hacer hipótesis (o conjeturas) sobre la población aplicada. Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas. Son, en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones.
Hipótesis Nula. En muchos casos formulamos una hipótesis estadística con el único propósito de rechazarla o invalidarla. Así, si queremos decidir si una moneda está trucada, formulamos la hipótesis de que la moneda es buena (o sea p = 0,5, donde p es la probabilidad de cara). Analógicamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hipótesis de que no hay diferencia entre ellos (o sea. Que cualquier diferencia observada se debe simplemente a fluctuaciones en el muestreo de la misma población). Tales hipótesis se suelen llamar hipótesis nula y se denotan por Ho. Para todo tipo de investigación en la que tenemos dos o más grupos, se establecerá una hipótesis nula.
La hipótesis nula es aquella que nos dice que no existen diferencias significativas entre los grupos. Por ejemplo, supongamos que un investigador cree que si un grupo de jóvenes se somete a un entrenamiento intensivo de natación, éstos serán mejores nadadores que aquellos que no recibieron entrenamiento. Para demostrar su hipótesis toma al azar una muestra de jóvenes, y también al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual recibirá entrenamiento, y otro que no recibirá entrenamiento alguno, al que llamaremos control. La hipótesis nula señalará que no hay diferencia en el desempeño de la natación entre el grupo de jóvenes que recibió el entrenamiento y el que no lo recibió. Una hipótesis nula es importante por varias razones: Es una hipótesis que se acepta o se rechaza según el resultado de la investigación. El hecho de contar con una hipótesis nula ayuda a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa, y si no se debió al azar. No toda investigación precisa de formular hipótesis nula. Recordemos que la hipótesis nula es aquella por la cual indicamos que la información a obtener es contraria a la hipótesis de trabajo. Al formular esta hipótesis, se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema fluctúa, por tanto, debe rechazarse como tal. Otro ejemplo: Hipótesis: el aprendizaje de los niños se relaciona directamente con su edad.
Errores tipo I Y II Al tomar la decisión de rechazar o no las hipótesis
podemos
equivocarnos en nuestra decisión, podemos cometer un error. La decisión siempre se toma en función de la hipótesis nula, sobre esta hipótesis y se pueden cometer dos tipos de errores:
1er Error. Error de tipo I o α Rechazar la hipótesis nula, siendo cierta 2do Error. Error de tipo II o β Aceptar la hipótesis nula, cuando esta es falsa Lo anterior se resume en la siguiente tabla:
Condición de la hipótesis nula Acción posible No rechazar H0 Rechazar H0 Verdadera Correcto Probabilidad 1 - a
Error tipo I Probabilidad a Falsa Error tipo II Probabilidad b Correcto Probabilidad 1 – b
Nivel de significación Siempre al tomar una decisión estoy expuesto a cometer un error, por eso es muy beneficioso tener una cuantificación de cuán buena o no ha sido mi decisión, medir en términos de probabilidades si mi decisión ha sido o no acertada y tener alguna medida de la confianza de mis decisiones. El error que se mide con más frecuencia es el de tipo I o α, donde se fija una probabilidad pequeña, como es lógico, de cometer este tipo de error, de equivocarme en mi decisión. Por convención se fija una probabilidad de 0.05 o un 5%, o de 0.01 o un 1% yb se acostumbra a denotar esta probabilidad por α, así tendríamos α= 0.05 ,o, α= 0.01 La especificidad de una probabilidad pequeña designada por α de cometer el error de tipo I, es lo que se conoce como nivel de significación de la prueba. Ahora resulta fácil entender porque la hipótesis nula se expresa en términos de lo que ``esperamos rechazar´´, lo contrario a lo esperado por el investigador, pues el error que fijamos con una probabilidad pequeña de
equivocarnos es el de rechazarla siendo cierta, y desde el momento mismo en que la formulamos se hace en función de lo que no se espera que ocurra. En el ejemplo de la intervención para reducir la prevalencia del habito de fumar, la hipótesis
nula se formuló en términos de igualdad en los
proporciones de fumadores, cuando lo que el investigador espera es que sea menor la prevalencia de los que fuman después de la intervención.
Ilustración de las zonas de rechazo de una hipótesis nula El rechazo de la Hipótesis Nula equivale a la aceptación de la Hipótesis Alternativa, si en el ejemplo que nos ocupa rechazamos la igualdad de prevalencia de fumadores, aceptamos la alternativa de que la prevalencia disminuyó después de aplicado el plan de intervención. El error de tipo II o β también puede ser `` medido´´, pero en la práctica su uso se limita a casos muy especiales. Es por eso que al no tener en valor de probabilidad fijado de cometer este tipo de error- aceptar la hipótesis nula cuando es falsa- trato de no cometer este error al realizar la prueba y por eso al no poder rechazar la hipótesis nula nunca digo que la acepto, si no que no puedo rechazarla. Esta forma de expresar el no rechazo de H
es
denominada por algunos autores como reservar el juicio y simplemente lo que se trata es de no cometer el error de tipo II al utilizar la palabra acepto.
-Estadígrafo o estadístico de prueba. Para realizar una prueba de hipótesis hay que tener en cuenta algunos aspectos de diseño de la investigación como es la naturaleza de las variables, en que escala están medidas, las características de la muestra, y
el cumplimiento de algunos supuestos pre establecidos para decidir que tipo de prueba se va a utilizar. Siempre existe para cualquier tipo de prueba un estadístico o estadígrafo ( expresión
o formula matemática) que se calcula con los datos de la
muestra. Este estadígrafa bajo el supuesto de que H sea cierta sigue una determinada distribución teórica de frecuencia, distribución que puede variar según el tipo de prueba, y que en ocasiones le da el nombre a la prueba estadística.
-Regla de decisión. La distribución teórica de frecuencia o de probabilidad que caracteriza a cada estadígrafo y el nivel de significación que se fije para realizar la prueba, son los elementos esenciales que van a influir en la decisión que se tome en cuento al rechazo o no de la hipótesis nula. Generalmente cuando se produce el rechazo de H
y por ende la
aceptación de la alternativa se dice que la prueba fue significativa a un 5% o un 1 % en dependencia del nivel de significación con que se halla trabajado la prueba. Este aspecto se explicará con mas detalle, en aras de facilitar su comprensión,
cuando
desarrollemos
algunas
pruebas
de
hipótesis
especificas. Antes creemos pertinente realizar algunas observaciones sobre el termino estadísticamente significativo, que con frecuencia se confunde con el significado corriente de la palabra significativo, y se hace
sinónimo el
resultado de una prueba, al de relevante, importante desde el punto de vista del marco teórico de la ciencia en la cual se está investigando. Por tanto se recomienda usar en la literatura científica la palabra significativo solo en caso
de referirse al resultado de una prueba estadística y no al discurso en general. Otro aspecto que vale la pena aclarar es que el resultado de una prueba de hipótesis no puede analizarse al margen del marco teórico de la ciencia particular en que esta ha sido usada. El resultado de la prueba estadística sólo es una parte de la evidencia que influye en la decisión del investigador. La decisión estadística no debe considerarse como definitiva, si no que es un elemento mas a considerar junto con el análisis de toda la información científica que existe sobre el problema que se investiga.
1 Pruebas de hipótesis a partir de medias. Existen dos condiciones básicas en que realizamos PH a partir de medias: para una sola población y para dos poblaciones. Veremos cada caso por separado, a la vez que nos detendremos en las particularidades de cada una. Pero antes, debes conocer que las pruebas de hipótesis se pueden realizar de forma unilateral y bilateral, en dependencia de la forma en que son enunciadas las hipótesis nula y alternativa. Así, una PH bilateral es aquella en que sólo interesa conocer la existencia de diferencias, sin definir el sentido de éstas, como ocurre en el caso unilateral.
La media de una sola población. Esta situación surge cuando al investigador le interesa probar que la media m de una determinada variable en una población es igual o diferente a un valor determinado m0. Estas pruebas pueden realizarse en tres condiciones diferentes que veremos a continuación:
La población se distribuye normal con varianza conocida.
La población se distribuye normal con varianza desconocida.
La población no se distribuye normal.
Aunque la teoría para las condiciones 1 y 2 se basa en que la población sigue una distribución normal, en la práctica es común aplicar este proceder aún cuando la población sólo está distribuida aproximadamente normal. Esto es satisfactorio siempre que la desviación de la normalidad sea moderada.
1- Población normal con varianza conocida. Suponemos que X~N (m, s2) donde s2 es conocida y queremos contrastar si es posible que m (desconocida) sea en realidad cierto valor m0 fijado. Esto es un supuesto teórico que nunca se dará en la realidad pero servirá para introducir la teoría sobre contrastes.
Test de dos colas con varianza conocida :
El test se escribe entonces como:
Ho: m = m0
H1: m ¹ m0
Estadígrafo de prueba: