Eliezer Montoya
Estadística II
CORRELACIÓN POR RANGOS La correlación correlación de Spearman, Spearman, o por rangos rangos , se basa basa en reemplazar reemplazar los valores valores originales de ambas variables , por números enteros positivos , comenzando por 1 en adelante adelante , que correspondan a su ordenamiento de mayor mayor de menor menor a mayor magnitud magnitud (RANGOS) (RANGOS) .Para ello, ello, los valores reales reales de cada una de las variables variables son ordenados ordenados de menor menor a mayor, mayor, por por separad separado o y reempla reemplazados zados por rangos rangos (Guilford y Fruchter 1984)
Ejemplo # 01 Supongamos 6 pares de valores (X,Y), presentados presentados en la tabla Nº 01 junto con los valores de sus rangos : Tabla Nº 1. Plantilla básica para el cálculo de correlación por rangos Variables X Y 18 31 20 33 23 30 24 50 40 40 55 45
Rx 1 2 3 4 5 6
Rangos Ry 2 3 1 6 4 5
Difere Diferencia ncia D=Rx-R D=Rx-Ry y -1 -1 2 -2 1 1
Difere Diferencia ncia al cuadrad cuadrado: o: D 2 1 1 4 4 1 1 12
Para calcular el coeficiente de correlación de Spearman o por por rangos usamos usamos la siguiente expresión:
ρ = r s = 1 −
6∑ D
(
n n
2
2
− 1)
(1)
r = Coeficiente de correlación de Spearman ( ρ = rho ) 2 Cuadra rado do de la dife difere renc ncia ia entre entre los los ran rango goss de de X e Y Donde: D = Cuad n = número de parejas s
Al introducir los valores de la tabla 1 dentro dentro de la fórmula fórmula (1), esta queda de la siguiente forma: 6∑ ( 12 ) 6.12 72 1 1 = − = − = 0, 6571 ρ = r s = 1 − 6 ( 35) 210 6 ( 62 − 1)
Ejemplo # 02. (a) La tabla Nº 2 muestra como 10 estudiantes fueron ordenados con sus logros en las secciones de laboratorio y teoría de un curso de biologia biologia . Calcule el coeficiente de correlación de rangos, o de Spearman, utilizando la ecuación (1) . (b) ¿En que circunstancias se se utiliza este coeficiente de correlación
Eliezer Montoya Print document Estadística II In order to print this document from Scribd, you'll first need to download it.
Tabla Nº 2 Ordenamiento de los alumnos queAnd cursaron Cancel Download Print Biología en la parte Teórica y practica (o laboratorio) Alumno Laboratorio (X)
1 8
2 3
3 9
4 2
5 7
6 10
7 4
8 6
9 1
10 5
Teoría (Y)
9
5
10
1
8
7
3
4
2
6
Tabla para el análisis de Spearman n 1 2 3 4 5 6 7 8 9 10
Variables X Y 8 9 3 5 9 10 2 1 7 8 10 7 4 3 6 4 1 2 5 6
Rangos Rx 8 3 9 2 7 10 4 6 1 5
Ry 9 5 10 1 8 7 3 4 2 6
Diferencia D=Rx-Ry -1 -2 -1 1 -1 3 1 2 -1 -1
Diferencia al cuadrado: D 2 1 4 1 1 1 9 1 4 1 1 24
La diferencia entre los rangos , D , en las secciones de laboratorio y teoría de cada estudiante se muestran en la tabla adjunta , que también incluye a D2 y la sumatoria de D2. Por lo tanto: ρ = r s = 1 −
6∑ D 2
(
n n
2
− 1)
= 1−
6(24) 10. ( 10 − 1) 2
= 1−
144 990
= 0,8545
Indica que hay una marcada relación entre los logros en las secciones de laboratorio y teoría del curso. Podemos notar que: la correlación por rangos, o de clasificación de Spearman se utiliza con datos cualitativos como la profesión, la educación, o el género, cuando debido a la ausencia de valores numéricos, no se puede calcular el coeficiente de correlación. La correlación por Rangos, o de Spearman, también se utiliza cuando no se dispone de valores exactos de todas o de algunas de las variables. Además que con un gran numero de observaciones de elevado valor, se puede calcular r s como una estimación de r para evitar laboriosos cálculos necesarios, sin embargo, el acceso generalizado a los PC ha suprimido esta razón.
Ejemplo # 03.La tabla Nº 3 presenta las estaturas de una muestra de 12 padres y sus hijos mayores. Calcule el coeficiente de correlación de los rangos.
Eliezer Montoya Print document Estadística II In order to print this document from Scribd, you'll first need to download it.
Download And Print
Cancel
Tabla Nº 3 Estatura (pulgadas) Padres (x)
65
63
67
64
68
62
70
66
68
67
69
71
Hijos (y)
69
66
68
65
69
66
68
65
71
67
68
70
Solución: Primeramente: Arreglamos en orden creciente de magnitud, la estatura de los padres son: 62 1º
63 2º
64 3º
65 4º
66 5º
67 6º
67 7º
68 8º
68 9º
69 10º
70 71 11º 12º
Nota: Como en el sexto y el séptimo lugar existen la misma estatura se le asigna el rango medio a ambos 1 13 ( 6 + 7 ) = = 6.5 2 2 De igual manera ocurre para el Octavo y el noveno lugar por tanto el rango medio seria: 1 17 ( 8 + 9 ) = = 8.5 2 2 Quedando asi el ordenamiento de la estatura de los padres 62
63
64
65
66
67
67
68
68
69
70 71
1
2
3
4
5
6.5
6.5
8.5
8.5
10
11
12
Seguidamente: Arreglamos en orden creciente de magnitud, la estatura de los hijos son: 65 65 66 66 67 69 70 71 68 68 68 68 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º 12º Ya sabemos calcular el rango medio para la posición 1 y 2 , asi como 3 y 4 , ahora bien como en el sexto, séptimo, octavo y novena posición tienen la misma estatura procedemos así: 1
( 6 + 7 + 8 + 9) =
30
= 7.5 4 4 Por lo tanto la estatura de los hijos por rangos quedaría asi: 65
65
66
66
67
68
68
68
68
69
70
71
1.5
1.5
3.5
3.5
5º
7.5
7.5
7.5
7. 5
10
11
12
Tabla Nro 3.Clasificación por rangos entre la estatura de los padres y de los hijos
Eliezer Montoya Print document Estadística II In order to print this document from Scribd, you'll first need to download it.
n 1 2 3 4 5 6 7 8 9 10 11 12
Va ria b le s X Y 65 68 63 66 67 68 64 65 68 69 62 66 70 68 66 65 68 71 67 67 69 68 71 70
ρ = r s = 1 −
Rx 4 2 6,5 3 8,5 1 11 5 8,5 6,5 10 12
6∑ D 2
(
n n
2
− 1)
Ra ngos Cancel Ry 7, 5 3, 5 7, 5 1, 5 10 3, 5 7, 5 1, 5 12 5 7, 5 11
= 1−
Diferencia Diferencia al Download And Print 2 D = R x - R y c u a d r a d o : D -3,5 1 2,25 -1,5 2, 25 -1 1 1,5 2, 25 -1,5 2, 25 -2,5 6, 25 3,5 1 2,25 3,5 1 2,25 -3,5 1 2,25 1,5 2, 25 2,5 6, 25 1 1 72,5
6(72.5) 12. ( 122 − 1)
= 1−
435 1716
= 0, 7465
Comentarios finales La correlación de Spearman es un excelente método para cuantificar la relación entre dos escalas de valores discretos y/o con jerarquía (ordinales). También es una excelente opción cuando los dos datos no tienen distribución Normal bivariante, especialmente si hay valores extremos. El método de Spearman permite calcular correlación, pero solo entre dos variables, este método tampoco permite hacer regresión, es decir, no se puede modelar la variable respuesta Y, con varios predoctores en forma simultanea o ver la influencia de un preeditor sobre otro. En este sentido, el método es mucho menos poderoso, que la regresión lineal o logística.
REFERENCIAS ___________________________________________ Guilford JP, Fruchter B.(1984) Métodos y problemas especiales de correlación, En estadística aplicada a la sociología y la educación. Editorial MacGrawHill p.265-333. Spiegel M.,Stephens M.(2002) Estadística .3ª edición . Editorial MacGraw-Hill p.428-429