SciELO - Scientific Electronic Library Online

 
vol.50 issue3(Emergent infectious diseases: interaction between the microbial world and human societies)Dengue seroprevalence in Golfito and the central district of Puntarenas, Costa Rica 2005-2006 author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Acta Médica Costarricense

On-line version ISSN 0001-6002Print version ISSN 0001-6012

Acta méd. costarric vol.50 n.3 San José Sep. 2008

 

Nota estadística

Asociación entre variables: correlación no paramétrica

Jorge Camacho-Sandoval

Profesor del Programa de Maestría en Epidemiología, Posgrado en Ciencias Veterinarias, UNA.
Correspondencia:
Correo electrónico: jcamacho@ice.co.cr

Resumen

Se describe la forma de estimar el coeficiente de correlación de Spearman y las condiciones en que resulta apropiada su utilización. También se describe como realizar una prueba de hipótesis para determinar si el coeficiente estimado es significativamente distinto de cero.

Abstract

A description is made on how to estimate the Spearman correlation coefficient and in what conditions it is appropriate to use it. Also, how to make hypotheses tests to determine if the estimated coefficient is significantly different from zero is described.

En el número anterior (ACM 50: 94-96) se hizo referencia al análisis de correlación lineal entre dos variables cuantitativas, conocido como el análisis de correlación de Pearson. Ese método requiere, cuando se desea hacer pruebas de hipótesis o estimar intervalos de confianza del coeficiente de correlación, como es usual, que las variables tengan una distribución normal bivariada.

¿Qué pasa cuando las variables no tienen una distribución normal bivariada? Eso ocurre, por ejemplo, cuando una o ambas variables se miden en una escala ordinal o de intervalo. Para ese caso existen pruebas que no exigen ese requisito. Dos de ellas son las pruebas de Spearman y de Kendall; ambas utilizan, en vez de los valores de las variables, sus rangos, es decir, el número de orden del valor de cada observación de la variable dentro del conjunto de observaciones. La prueba de Spearman tiene la ventaja de ser muy sencilla de calcular.

Para estimar el coeficiente de correlación de Spearman, primero se deben obtener los rangos para cada una de las observaciones de ambas variables. Para ello se considera una variable y se asigna el rango 1 al valor más pequeño, 2 al siguiente valor más pequeño y así sucesivamente hasta llegar al rango n que le corresponde a la observación con el valor más alto. Luego se repite el procedimiento para la otra variable.

El coeficiente de correlación de Spearman, rS, se puede obtener con la siguiente fórmula:


En donde n es el número de casos o pacientes y d es la diferencia entre los rangos de las variables para cada paciente o unidad de observación. No obstante, esa fórmula supone que no hay valores repetidos, es decir que no hay 2 o más pacientes a los que les corresponda el mismo rango para una misma variable. Si existen pacientes con valores repetidos, se les asigna a esos pacientes el rango promedio y se usa una fórmula de cálculo alternativa.

A manera de ejemplo se considera un estudio que se realizó para comparar herramientas de evaluación para determinar la recuperación de pacientes que sufrieron accidentes cerebro vasculares. Se evaluaron numerosas variables, entre ellas el balance y la función motora de los miembros inferiores. En ambos casos se asignó un puntaje, con un máximo de 14 puntos para el balance y de 30 para la actividad motora (http://www.statsci.org/data/oz/strokeass.html).

En el estudio, cuyos datos se muestran en el Cuadro 1, se observa que algunos pacientes tienen el mismo valor para las variables en consideración, es decir, existen valores repetidos. Por ejemplo, los pacientes 16 y 17 tienen un puntaje en actividad motora de 24 y les corresponde la posición o rango 13 y 14 si se ordenan los datos ascendentemente; el rango promedio de esas dos observaciones es 13.5, por lo tanto es el rango que se les asigna a ambos pacientes para la variable correspondiente.


Uno de los objetivos del estudio puede ser determinar si existe correlación entre ambas variables pero como éstas no siguen una distribución normal bivariada, no es posible utilizar la correlación de Pearson. Si se estima el coeficiente de correlación de Spearman, utilizando la fórmula anterior, se obtiene el siguiente valor:


Por otra parte, como existen valores repetidos en ambas variables y para varios pacientes, es necesario introducir una corrección o utilizar formas alternativas de cálculo. Existen varias opciones, una de ellas es aplicar la fórmula utilizada para obtener el coeficiente de correlación de Pearson, pero utilizando los rangos en vez de los valores o puntajes de las variables, como ya se mencionó.

De esa manera, el coeficiente de correlación de Spearman es:


Como se observa, los valores obtenidos por ambos métodos son muy similares y pueden usarse indiferentemente si el número de valores repetidos no es muy elevado. Si hay muchos valores repetidos, es mejor utilizar la última forma de cálculo.

Una vez estimado el coeficiente de correlación de Spearman, es conveniente realizar una prueba de hipótesis con la H0: rS=0; H1: rS≠0. Para decidir si se rechaza o no la hipótesis nula (H0), se utiliza un valor crítico correspondiente al nivel de significancia deseado. Esos valores se pueden obtener en muchos textos o en la red (http://www.atozee.co.uk/S151/spearman3.html). En el Cuadro 2 se muestran los valores críticos para distinto número de casos y niveles de significancia.


En el caso del ejemplo, para 20 pacientes y una prueba de hipótesis con un nivel de significancia del 5%, el valor crítico es 0.45. Como el valor estimado del coeficiente de correlación de Spearman, 0.67, es superior al valor crítico, se rechaza la hipótesis nula y se concluye que el coeficiente de correlación es significativamente distinto de cero, es decir que existe una asociación significativa entre la actividad motora de las extremidades inferiores y el balance, en pacientes que sufrieron accidentes cerebro vasculares.

Referencias

1. Camacho-Sandoval, J. Asociación entre variables cuantitativas: análisis de correlación. Acta Médic Costarric 2008; 50: 94-96.        [ Links ]

2. Siegel, S. & Castellan, N. J. 1998. Estadística no paramétrica aplicada a las ciencias de la conducta. 4ª Ed. Trillas, México. 437 p.        [ Links ]

3. Zar, J. 1999. Biostatistical Analysis. 4th Ed. Prentice Hall, New Jersey. 663 pp.        [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License