DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES DISTRIBUCIÓNES MULTIDIMENSIONALES MULTIDIMENSIONALES
DISTRIBUCION DE FRECUENCIA BIDIMENSIONAL
1. Variable Variable Estadísti Estadística ca Bidimensio Bidimensional: nal: Una Una vari variab able le bidi bidime mens nsio iona nall es aque aquelllla a que que pres presen enta ta simu simultltán ánea eame ment nte e dos dos características o variables del elemento en estudio, se representa en una tabla de doble entrada, también llamada “tabla de contingencia”
1.1. Tabla Tabla de Contingen Contingencia cia o Tabla Tabla de doble doble entrada entrada::
Sea una poblac población ión estudi estudiada ada simult simultane aneame amente nte según según dos caract caractere eress X e Y; que representaremos genéricamente como (xi; yj ; nij), donde xi; yj, son dos valores cualesquiera y nij es la frecuencia absoluta conjunta del valor i-ésimo de X con el iésimo de Y.
Una forma de disponer estos resultados es la conocida como tabla de doble entrada o tabla de contingencia, la cual podemos representar como sigue:
y1
y2
…..
y j
…..
yk
ni
x1
n11
n12
…..
n1j
…..
n1 k
n1
x2
n21
n22
…..
n2j
…..
n2 k
n2
Y X
ESTADISTICA
Página 1
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
.
.
.
.
.
.
.
.
.
.
.
….
.
….
.
.
.
.
.
.
.
.
.
.
Xi
ni1
ni2
…..
nij
…..
nik
ni
.
.
.
.
.
.
.
.
.
.
.
….
.
….
.
.
.
.
.
.
.
.
.
.
xh
nh1
nh2
…..
nhj
…..
nhk
nh
n. j
n. 1
n. 2
…..
n. j
…..
n. k
n
En este caso, n11 nos indica el número de veces que aparece x1conjuntamente con y1;n12, nos indica la frecuencia conjunta de x1 con y2, etc.
2. Tipos de frecuencias en una Distribución Bidimensional:
2.1. Frecuencias Conjuntas:
Se representan por “nij”, y son las frecuencias incluidas en la tabla primitiva de entrada. Los subíndices i y j representan la fila y columna en la que está situada la frecuencia. Ejemplo:
ESTADISTICA
Página 2
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
Podemos mostrar dos variables: X que denota tres niveles: A, B, C Y que denota cuatro meses: Enero, febrero, marzo, abril y mayo.
Meses Niveles A B C
Enero 4 3 9
Febrero Marzo 6 3 7
Abril
Mayo
8 5 13
8 9 14
7 6 7
Llamaremos N a la suma total de estas frecuencias. En el ejemplo, N es 109 Ʃ (Niveles Meses) = 109
2.2. Frecuencias Marginales:
Llamaremos frecuencia marginal de un valor de X, a la que le corresponde a ese valor si no tenemos en cuenta la existencia de Y. En la práctica coincide con la suma de todas las frecuencias contenidas en la fila correspondiente a ese valor.
De la misma forma se define la frecuencia marginal en la variable Y, como la que tendría si no se tuviera en cuenta la X, o la suma de la columna correspondiente. Ejemplo:
Del ejemplo anterior se puede establecer que:
La frecuencia marginal del nivel B es 26 B: 3+3+6+5+9 = 26 La frecuencia marginal del mes Marzo es 20 Marzo: 7+6+7 = 20
ESTADISTICA
Página 3
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
2.3. Frecuencias Condicionadas:
Son las frecuencias que posee una variable si sólo consideramos un valor (o varios) de la otra variable. En la práctica se traduce a considerar sólo una fila o sólo una columna, según el valor elegido.
Las frecuencias condicionadas se representan con este símbolo: n x/y, que se puede leer como Frecuencia de x condicionada por y. Ejemplo:
En la tabla del ejemplo anterior la distribución de X condicionada a Marzo es la columna A=7, B=6, C=7.
Las frecuencias condicionadas son más representativas si se convierten en proporciones o porcentajes.
3. Distribución Marginal: Al analizar una distribución bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de cómo se comporta la otra. Estaríamos así en el análisis de una “distribución marginal”. De cada distribución bidimensional se pueden deducir dos distribuciones marginales: una correspondiente a la variable x, y otra correspondiente a la variable y.
Distribución marginal de X
X X
X X1 X2 ..... Xn-1 ESTADISTICA
n i. n1. n2. ... nn-1. Página 4
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
nn.
Xn
Distribución marginal de Y
Y
n j. X
X
n.1 n.2 ... nm-1 nm
Y1 Y2 ..... Ym-1 Ym Por tanto, podemos decir:
n
N
n j . i
1
n. j j
n ij
n
1
4. Distribuciones Condicionadas:
Caso de independencia estadística Al poner una restricción o condición a una de las dos variables, tenemos las distribuciones condicionadas. Se las suele representar como:
X/Y indica que el valor de X viene condicionado por Y Y/X indica que el valor de Y viene condicionado por X ESTADISTICA
Página 5
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
4.1. Independencia estadística Se dice que dos variables X e Y son independientes estadísticamente cuando la frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales en todos los casos, es decir:
n ij n
n i
.
n
n j .
··
n
Para todo i, j
5. Representaciones Gráficas La forma más usual de representar gráficamente las distribuciones bidimensionales es el diagrama de dispersión o nube de puntos; sin embargo también se admiten los gráficos de barras y una representación espacial gráfica denominada estereograma.
5.1. Diagrama de dispersión o nubes de puntos
Se obtiene al considerar dos ejes coordenados, situando en el eje horizontal los valores de la variable X y en el vertical los de la variable Y; en las proximidades del par (x I, y )I se colocan tantos puntos como indica su frecuencia conjunta nij
ESTADISTICA
Página 6
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
5.2. Gráfico de Barras
ESTADISTICA
Página 7
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
5.3. Estereograma
DISTRIBUCION DE FRECUENCIA MULTIDIMENSIONAL
ESTADISTICA
Página 8
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
En muchas ocasiones interesa estudiar simultáneamente el comportamiento de (2 o más) en una población. Es evidente que siempre se podrá estudiar cada característica por separado, a través de su correspondiente distribución de frecuencias y analizar su comportamiento a través de los indicadores ya estudiados de posición, dispersión, forma y concentración.Pero puede resultar necesario analizar, también el comportamiento conjunto de 2 o más de las características observadas. Al estudiar conjuntamente las observaciones de todas las características (variables o atributos), se habla de una “distribución de frecuencias multidimensional”. •
Dada una población de N individuos, de la que se disponen observaciones de varias características (supongamos cuantitativas, variables) éstas pueden, en principio representarse a través de un listado (matricial) similar a una base de datos en el que en cada fila aparecerá uno de los N individuos seguido de los valores que cada variable toma para cada individuo, lo que constituye un registro.
INDIVIDUO
VARIABLE 1 ( X 1) ASIGN.MATRICUL.
VARIABLE 2( X2) EDAD
VARIABLE 3 ( X 3) ASIGN. APROBADAS
1º JUAN
X11
8
X21
21
X31
7
2º PEDRO
X12
7
X22
22
X32
6
3º MARÍA
X13
9
X23
24
X33
6
4º ANA
X14
9
X24
20
X34
5
5º LUIS
X15
9
X25
19
X35
5
I. DISTRIBUCIONES BIDIMENSIONALES
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de cada elemento de la población.
En algunos experimentos las medidas que se obtienen son dobles, estas pertenecen a dos variables distintas, a las que llamaremos X e Y respectivamente.
ESTADISTICA
Página 9
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
Este tipo de estudios es muy frecuente y se manifiesta por ejemplo en los siguientes casos: •
Comparación entre mortalidad y natalidad
•
Ídem entre extensión y población de diversos países.
•
Diferencias de renta entre la población en general y los titulados universitarios.
•
Pruebas pretest y postest.
•
Influencia de la latitud en la temperatura media.
•
Ídem de las horas de estudio en la calificación en una asignatura, etc.
GRÁFICAS ESTADÍSTICAS Las gráficas estadísticas son representaciones gráficas de los resultados que se muestran en una tabla estadística. Pueden ser de formas muy diversas, pero con cada tipo de gráfica se cumple un propósito. Por ejemplo, en los medios de comunicación, libros de divulgación y revistas especializadas se encuentran multitud de gráficas estadísticas en las que, con notable expresividad, se ponen de manifiesto los rasgos de la distribución que se pretende destacar. Los diagramas de barras, los diagramas de sectores, los histogramas y los polígonos de frecuencias son algunas de ellas.
1. Diagramas de barras: En este tipo de gráfica, sobre los valores de las variables se levantan barras estrechas de longitudes proporcionales a las correspondientes. Se utilizan para representar variables cuantitativas discretas. El diagrama de barras siguiente representa la distribución del número de hijos de 43 familias:
ESTADISTICA
Página 10
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
2. Histograma y polígonos de frecuencia: Los histogramas se utilizan para representar tablas de frecuencias con datos agrupados en intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un rectángulo cuya altura es proporcional a la frecuencia correspondiente. El histograma que se muestra a continuación es el correspondiente a la tabla de frecuencias con intervalos adjunta (1.200 calificaciones distribuidas en 10 intervalos):
Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.
3. Histograma y polígono de frecuencia acumulada: Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polígono. He aquí los que se obtienen de la tabla de 1.200 calificaciones:
ESTADISTICA
Página 11
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
4. Diagrama de Sectores: En un diagrama de este tipo, los 360º de un círculo se reparten proporcionalmente a las frecuencias de los distintos valores de la variable. Resultan muy adecuados cuando hay pocos valores, o bien cuando el carácter que se estudia es cualitativo. El diagrama de sectores siguiente refleja el resultado de una encuesta (realizada a 300 personas) sobre los tipos de película preferidos por el público en general:
TIPOS DE GRÁFICAS ESTADÍSTICAS 1. Gráficos de barras verticales: Representan valores usando trazos verticales, aislados o no unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para representar: • una serie • dos o más series (también llamado de barras comparativas)
ESTADISTICA
Página 12
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
2. Gráficos de barras horizontales: Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos. • Para una serie • Para dos o más series
3. Gráficos de barras proporcionales: Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que componen un total. Las barras pueden ser: • Verticales ESTADISTICA
Página 13
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
• Horizontales
4. Gráficos de barras comparativas: Se utilizan para comparar dos o más series, para comparar valores entre categorías. Las barras pueden ser: • Verticales • Horizontales
5. Gráficos de barras apiladas: Se usan para mostrar las relaciones entre dos o más series con el total. Las barras pueden ser: • Verticales ESTADISTICA
Página 14
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
• Horizontales
6. Gráficos de líneas: En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Estos gráficos se utilizan para representar valores con grandes incrementos entre sí. Se pueden usar para representar: • una serie • dos o más series
7. Gráficos circulares: Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor , según lo que se desee destacar. Se pueden ser: • En dos dimensiones ESTADISTICA
Página 15
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
• En tres dimensiones
8. Gráficos de áreas: En estos tipos de gráficos se busca mostrar la la información generalmente en un período de tiempo. Pueden ser:
tendencia
de
• Para representar una serie • Para representar dos o más series • En dos dimensiones • En tres dimensiones
9. Cartogramas: ESTADISTICA
Página 16
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color .
10. Gráficos Mixtos: En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series. Pueden ser: • En dos dimensiones • En tres dimensiones.
11- Histogramas: Estos tipos de gráficos se utilizan para representa distribuciones de frecuencias. Algún software específico para estadística grafican la curva de gauss superpuesta con el histograma. ESTADISTICA
Página 17
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
12. Dispersogramas: Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma. Pueden ser: • En dos dimensiones • En tres dimensiones.
13. Pictogramas:
ESTADISTICA
Página 18
DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES
Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma. Pueden ser: En dos o en tres dimensiones.
Hasta ahora sólo hemos utilizado unos tipos de gráfico muy comunes como el gráfico de columnas por ejemplo. Sin embargo, hoy día Exceldispone de muchos más tipos de gráficos. Cada tipo de gráfico se diferencia de los demás por la clase de marcas de datos que utiliza. Por ejemplo, el gráfico de columnas utiliza columnas como marcas de datos; el de círculos, utiliza círculos; etc. El motivo de que haya tantos tipos de gráficos diferentes no es solamente estético. Cada uno de los tipos de gráficos está especialmente indicado para representar los datos de una manera distinta. Por lo tanto, si se quiere obtener la máxima eficacia al crear gráficos propios y presentar datos de la mejor manera posible hay que tener esto muy en cuenta; que cada tipo de grafico esta destinado para una labor especifica.
CONCLUSIÓN En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.
ESTADISTICA
Página 19