INTRODUCCION A LA BIOESTADISTICA Bioestadística: Ciencia en la que se obtienen y analizan datos biológicos o de salud por medio de métodos estadísticos. estadísticos. La bioestadística se puede usar para ayudar a comprender las causas posibles posible s de una enfermedad o con qué frecuencia se presenta esta patología en un grupo determinado de personas. También se llama biometría.
Población o Universo: Es el total del conjunto de elementos u objetos de los cuales se quiere obtener información. información. El término población tiene un significado mucho más amplio que el usual. Puede referirse tanto a personas como: cosas, cosas, actos, áreas geográficas geográficas e incluso al tiempo.
La población debe estar perfectamente definida en el tiempo y en el espacio. De modo que ante la presencia de un potencial integrante de la misma se pueda decir si forma parte o no de la población bajo estudio.
Se debe cuidar que el conjunto de elementos quede perfectamente delimitado. delimitado.
Unidad de Análisis : Es el objeto del cual se desea obtener información. información.
Puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como como la temperatura temperatura o un intervalo de tiempo.
Dada esta definición, puede redefinirse población como el conjunto de unidades
de análisis. Muestra: Es un subconjunto de unidades de análisis de una población dada.
Destinado a suministrar información sobre la población.
Para que este subconjunto de unidades de análisis sea de utilidad estadística , deben reunirse ciertos requisitos en la selección de los elementos.
Las causales por la cual se seleccionan muestras son muchas:
- Puede ocurrir
que
la
población que
se defina tenga
tamaño infinito, y
en
consecuencia, no fuera posible observar a todos sus elementos.
- En otras ocasiones, el costo de la observación exhaustiva puede ser muy elevado. - El tiempo de recolección de la información muy extenso.
¿Que
son
enumerados
las o
variables? : Propiedades,
atributos o características características descritos medidos, los cuales cambian de un sujeto a otro o de un momento a
otro. Surgen de las preguntas y los los objetivos de investigación.
Niveles de medición de las variables: Escalas o categorías:
Nominales: define categorías. Ej: raza, sexo, grupo sanguíneo.
Ordinales : relación de orden (no miden distancia) Ej: Apgar, clase social.
Numéricas o de
intervalos: clasifican, ordena y miden
distancia. Ej: Edad, temperatura, presión arterial, colesterol, talla, n° de Hijos. Pueden ser continuas o discontinuas.
Tipos de variables Según el enfoque del análisis:
Simples:
acceso directo a su dimensión. Ej: edad, estatura, profesión.
Compuestas: de otras variables o subvariables. Ej: nivel socio $, estado nutricional. Según la relación entre dos variables:
Independiente: determina un efecto o consecuencia, Ej factor de riesgo (conducir bajo influencia del alcohol)
Dependiente : consecuencia o efecto de la independiente Ej: daño (accidente de tránsito). Según la forma de expresión:
Cualitativas o categóricas : Propiedades o cualidades que los sujetos poseen o no. Característica a la que un sujeto pertenece o no pertenece. No pueden ser medidas en términos de cantidad de la propiedad presente. Los sujetos solo se clasifican y enumeran. Ejemplos : nacionalidad, actividad, enfermedad.
Numéricas o cuantitativas: Su valor es un número o cantidad, producto de una medición o recuento. Describen al sujeto en términos de un valor numérico Ej: peso, estatura. Pueden ser: - continuas (número indefinido de valores ej. peso) - discontinuas o discretas (número finito Ej. n° de hijos)
MUESTREO: El propósito de un estudio estadístico suele ser extraer conclusiones acerca de la naturaleza de una población. Al ser la población grande y no poder ser estudiada en su integridad, en la mayoría de los casos, las conclusiones obtenidas deben basarse en el examen de solamente una parte de ésta, lo que nos lleva, en primer lugar a la justificación, necesidad y definición de las diferentes técnicas de muestreo. Técnicas de muestreo
La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribución de un carácter en la población (parámetro) y las distribuciones de dicho carácter en todas sus muestras, en donde el estadístico es una función de la muestra. Las ventajas de estudiar una población a partir de muestras son principalmente : - Costes reducido: Por ejemplo, cuando se realizan encuestas previas a un referéndum, es más barato preguntar a 4.000 persona su intención de voto que a 30.000.000.
- Mayor rapidez :
Por ejemplo, al monitorear los resultados de las primeras mesas
electorales , se obtiene una aproximación bastante buena del resultado final.
De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas: - Elección de la muestra (muestreo). - Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).
Tipos de muestreo Muestreo aleatorio: - sin reposición de los elementos: Consideremos una población E formada por N elementos. Si observamos un elemento particular e pertenece a E, en un muestreo aleatorio sin reposición se da lo siguiente: La probabilidad de que e sea elegido en primer lugar es 1/N , de que sea elegido en segundo intento es de 1/N-1, en el (i+1)-esimo intento es de 1/N -i -
con reposición: Sobre una población E de tamaño N podemos realizar extracciones de n elementos, de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces, la probabilidad de una cualquiera de ellas, formadas por n elementos es:
1 x 1 x 1 x..... 1 = 1 N N N N Nn
Muestreo aleatorio estratificado: Aquel
en
que se divide la población de N
individuos en k subpoblaciones o estratos, de tamaños respectivos N1......,Nk
N =N1 + N2+ ...... + NK y realizando en cada una de estas subpoblaciones muestreos simples de tamaño ni donde i= 1,...., k. Nos planteamos el problema de cuantos elementos de muestra se han de elegir de
cada uno
de los estratos. Para
ello tenemos fundamentalmente dos técnicas: la
asignación proporcional y la asignación optima. - Asignación proporcional: Cuando la asignación es proporcional el tamaño de la muestra de cada estrato es proporcional al tamaño del estrato correspondiente con respecto a la población total. Cuando se realiza un muestreo estratificado con asignación Optima, los ni de los estratos los elige quien hace el muestreo. Ej.: Se realiza un estudio sobre la población de estudiantes de una universidad, en el que a través de una muestra de 10 de ellos queremos obtener información sobre el uso de lápiz labial, se sabe que el 60% de los estudiantes es masculin y el resto 40% femenino. De modo que se reparten proporcionalmente ambos grupos el número total de muestras ( 6 varones y 4 mujeres) , esto se denomina asignación proporcional.
- Asignación óptima: Por otra parte la precisión será muy alta en los varones (pequeña varianza), mientras que en las mujeres habrá mayor dispersión (mayor varianza), de este modo será más conveniente tomar más individuos de mayor variabilidad. Así obtendríamos mejores resultados estudiando una muestra de 1 varón y 9 mujeres, esto se denomina asignación óptima.
Muestreo sistemático: Cuando los elementos de la población están ordenados en fichas o un listado, una manera de muestrear consiste en:
sea
k =
N n
- elegir aleatoriamente un numero m entre 1 y k; - tomar como muestra los elementos de la lista Ej.: N= 100 n=10 k =10, supongamos m =4 las muestras a elegir serán : 4, 14, 24, 34 ... ,94
Muestreo por conglomerados: Consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para luego elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.
N MUESTRAL (muestreo simple). Donde:
no : Cantidad teórica de elementos de la muestra N : Número total de elementos Z : valor estandarizado (confiabilidad de un 95 %, por lo tanto: z = 1,96 ) Є
Para 3 ≤ N ≤ 10 ----- Se asume Є = 0.1 (un error del 10 %).
: Error
Para N > 10 ---------- Se asume Є = 0.05 (un error del 5 %).
q : No presenta las características p : = 1-q
(p+q=1)
sugerencias Para 3 ≤ N ≤ 19
------- Se asume q = 0,01 (un 1 %).
Para 20 ≤ N ≤ 29 Para 30 ≤ N ≤ 79
------ Se asume q = 0,01 hasta 0,02 (del 1 al 2 %). ----- Se asume q = 0,02 hasta 0,05 (del 2 al 5 %).
Para 80 ≤ N ≤ 159 Para N ≥ 160
---- Se asume q = 0,05 hasta 0,10 (del 5 al 10 %).
--------- Se asume q = 0,05 hasta 0,20 (del 5 al 20 %).
ESTADISTICA DESCRIPTIVA Aquella parte de la estadística encargada de describir y resumir las características de los datos recopilados mediante a) Tablas especificas b) Gráficos c) Estadígrafos - Posición - dispersión
PRESENTACION GRAFICA: (Según elemento geométrico empleado) Es la que se representa mediante dibujos, los tipos más corrientes son: a) Gráficos de Barra: Utilizan para la representación un rectángulo, se puede hacer de forma horizontal o vertical. l.- Grafico de barra simple ll.- Grafico de barra agrupado lll.- Grafico de barra componente b) Gráficos Lineales: Son los gráficos que emplean el sistema cartesiano, mediante líneas poligonales van representando datos; es más indicado para representar datos de tipo continuo. c) Escalares Polares : Telarañas
ALGUNAS CONSIDERACIONES GENERALES DE LOS GRAFICOS a) Deben ser autosuficientes, deben dar toda la construcción.
información utilizada en su
b) No importa que el grafico no de los valores exactos de los datos. c) El titulo del grafico debe ser de la misma forma de la tabla. d) Debe aparecer la línea correspondiente al valor cero de la escala, (esto es válido para escala aritmética) o indicar los cortes realizados. e) Marco del grafico y líneas de escala, las líneas que encierran el grafico deben ser más gruesas. Nacimientos en Chile 270,000 260,000 250,000 240,000 230,000 1999
2000
2001
2002
2003
años
nacimientos
2004
2005
2006
2007
Tasa de Natalidad en Chile x 1000 hbt.
20.0 15.0 10.0 5.0 0.0 1999
2000
2001
2002
2003
2004
2005
2006
2007
tasa…
1999 270,000 2007 260,000
2000
250,000 2006
240,000
2001 Seri…
230,000 2005
2002 2004
2003
Ejemplo: La tabla muestra el número de casos de Sifilis y Gonorrea en el Servicio de Salud Aconcagua durante el periodo 1999 a 2009. Con los datos de la tabla representarlos en : a) gráfico de linea b) gráfico de barra simple y compuesta
año
N° de Sifilis
N° de Gonorrea
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
25 46 48 35 29 52 93 106 117 105 77
21 47 52 45 27 42 45 16 12 7 11
TABLAS ESPECIFICAS:
SIMPLES N° DE CONSULTA y CONTROLES MEDICAS NIVEL PRIMARIO
S. SALUD ACONCAGUA 2005 – 2008 años
Consultas y controles
2005
300.121
2006
291.014
2007
280.839
2008
269.370
AGRUPADAS
ESTADIGRAFOS: MEDIDAS DE CENTRALIZACION (POSICIÓN) MEDIDAS DE DISPERSION PREDICTORES ESTADISTICOS:
Estadígrafos de Posición: Media o promedio aritmético:de una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. Simple y N
Media o promedio aritmético:Si los datos están agrupados en una distribución de frecuencia no conocemos el valor de cada observación, por lo tanto para calcular el promedio habrá que determinar un valor representativo para cada intervalo , en este caso se elige el centro o marca de clase del intervalo. Agrupada
(n*y) N
Mediana (Med) Simple: Se define como aquel valor de la variable que deja bajo el a no más del 50 % de las obs. y sobre él a no más del 50 % de las obs. , cuando ellas están ordenadas según magnitud. Agrupada: Cuando los datos están agrupados en intervalos de clase, la mediana no puede ser localizada con exactitud, al igual que la mediana simple se elige el intervalo mediano en el que se encuentra el 50% de la información.
Mediana (Med) = lim inf. + (N/2 - S) A n’
lim inf = lim inf. Intervalo mediano S
= Frec Acum hasta intervalo anterior
A
= Amplitud intervalo mediano
n’
= Nº de obs del intervalo mediano
Moda (Mo): Es aquel valor de la variable que más se repite (tiene mayor frecuencia). En series agrupadas el Mo está dado por la marca de clase
del intervalo modal (el de
máxima frecuencia absoluta simple)
Percentil es deciles y Cuartiles a) Percentiles : Son valores de la variable que dividen la masa de datos en 100 partes iguales (Pp). b) Deciles : Son valores de la variable que dividen
la masa de datos en 10 partes
iguales ( 10% c/u). c) Cuartiles : Son valores de la variable que dividen la masa de datos en 4 partes iguales ( 25 % c/u).
Percentil ( Pp) = Y' i-1 + A ( N*p/ 100 - S ni Y' i-1 = lim inf. Del intervalo en el cual se encuentra el percentil buscado A = Amplitud del intervalo en el cual está el percentil buscado S = Frecuencia absoluta acumulada hasta el intervalo anterior al que contiene el p buscado ni = Frecuencia observación simple asociada al intervalo que contiene el p buscado P = Nº del percentil buscado N = Nº total de observaciones estudiadas
Estadígrafos de Dispersión : El estadígrafo toma o alcanza el valor cero si las obs. no presentan variabilidad El estadígrafo alcanza un valor positivo, si las obs. presentan algún grado de variabilidad. Mientras mayor sea el grado de variabilidad que presentan los datos , mayor deberá ser el valor alcanzado por el estadígrafo
Desviación Típica : Es una medida de la distancia promedio de las observaciones desde su media . Su empleo en la interpretación de datos
se relaciona principalmente con su
participación como parámetro de la distribución normal.
S=
( Xi - X ) 2 n
datos simples
S=
( Xi - X ) 2 *ni n datos agrupados