<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0001-6002</journal-id>
<journal-title><![CDATA[Acta Médica Costarricense]]></journal-title>
<abbrev-journal-title><![CDATA[Acta méd. costarric]]></abbrev-journal-title>
<issn>0001-6002</issn>
<publisher>
<publisher-name><![CDATA[Colegio de Médicos y Cirujanos de Costa Rica]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0001-60022008000200005</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Asociación entre variables cuantitativas: análisis de correlación]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Camacho-Sandoval]]></surname>
<given-names><![CDATA[Jorge]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,UNA Postgrado en Ciencias Veterinarias Maestría en Epidemiología]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>06</month>
<year>2008</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>06</month>
<year>2008</year>
</pub-date>
<volume>50</volume>
<numero>2</numero>
<fpage>94</fpage>
<lpage>96</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.sa.cr/scielo.php?script=sci_arttext&amp;pid=S0001-60022008000200005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.sa.cr/scielo.php?script=sci_abstract&amp;pid=S0001-60022008000200005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.sa.cr/scielo.php?script=sci_pdf&amp;pid=S0001-60022008000200005&amp;lng=en&amp;nrm=iso"></self-uri></article-meta>
</front><body><![CDATA[  <b><font face="Verdana" size="4">     <p align="center">Asociaci&oacute;n entre variables cuantitativas: an&aacute;lisis de correlaci&oacute;n</p> </font><font face="Verdana" size="2"> </font></b>     <p><font face="Verdana" size="2">Jorge Camacho-Sandoval</font></p>     <p><font face="Verdana" size="2">Profesor, Maestr&iacute;a en Epidemiolog&iacute;a, Postgrado en Ciencias Veterinarias, UNA.    <br> <b>Correspondencia: </b>Correo electr&oacute;nico: <a href="mailto:jcamacho@ice.co.cr">jcamacho@ice.co.cr</a></font></p>     <p><font face="Verdana" size="2">En la investigaci&oacute;n cl&iacute;nica frecuentemente se miden numerosas variables en los individuos incluidos en el estudio. Muchas veces interesa determinar si existe relaci&oacute;n entre algunas de esas variables, o predecir el valor de una de ellas conociendo el valor de otras. En ocasiones interesa determinar si distintos instrumentos, m&eacute;todos o personas obtienen valores similares cuando se mide una variable en las mismas unidades experimentales. Esos tres objetivos requieren m&eacute;todos de an&aacute;lisis distintos. La presente nota se refiere al primer objetivo: determinar si existe asociaci&oacute;n entre variables.</font></p>     <p><font face="Verdana" size="2">En el gr&aacute;fico de dispersi&oacute;n del &iacute;ndice de tabaquismo y el &iacute;ndice de mortalidad por c&aacute;ncer de pulm&oacute;n adjunto, se puede observar que conforme se incrementa el &iacute;ndice de tabaquismo, se incrementa de forma lineal, el &iacute;ndice de mortalidad. Es decir, se puede representar la asociaci&oacute;n entre esas variables, con una l&iacute;nea recta. En el segundo gr&aacute;fico de dispersi&oacute;n, entre el n&uacute;mero de cigarrillos fumados y la mortalidad por c&aacute;ncer de ri&ntilde;&oacute;n, se observa una relaci&oacute;n que no es lineal, sino curvil&iacute;nea. En ambos casos las variables est&aacute;n relacionadas, pero la forma de la relaci&oacute;n es distinta.</font></p>     <p><font face="Verdana" size="2">El m&eacute;todo m&aacute;s com&uacute;n de determinar si existe asociaci&oacute;n <b>lineal </b>entre dos variables cuantitativas continuas es el An&aacute;lisis de Correlaci&oacute;n de Pearson. Con este m&eacute;todo se obtiene el Coeficiente de Correlaci&oacute;n de Pearson, usualmente representado por la letra R. Como suele utilizarse una muestra, lo que se obtiene en realidad es un estimado del coeficiente de correlaci&oacute;n poblacional, r.</font></p>     <p><font face="Verdana" size="2">Dos aspectos importantes del coeficiente de correlaci&oacute;n son su magnitud y su signo. La magnitud refleja la intensidad de la asociaci&oacute;n entre las dos variables; el valor absoluto de la magnitud puede variar entre cero y uno. Valores cercanos a cero indican que las variables no est&aacute;n asociadas, es decir, que el valor de una variable es independiente del valor de la otra.</font></p>     <p><font face="Verdana" size="2">El signo, por su parte, refleja c&oacute;mo est&aacute;n asociados los valores de ambas variables. Si el signo es positivo indica que a valores altos de una variable corresponden valores altos de la otra, o a valores bajos de una variable corresponden valores bajos de la otra. Si el signo es negativo, indica que a valores altos de una variable corresponden valores bajos de la otra. Es decir, el sigo positivo indica que los valores de ambas variables cambian en el mismo sentido, mientras que el signo negativo indica que cambian en sentido contrario. En la f&oacute;rmula se observa que las unidades de ambas variables aparecen en el numerador y denominador, por lo tanto, se anulan aritm&eacute;ticamente, por lo que el coeficiente de correlaci&oacute;n no tiene unidades de medici&oacute;n. </font></p>     ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">El c&aacute;lculo del coeficiente de correlaci&oacute;n es muy sencillo. Si se supone que se tienen dos variables cuantitativas continuas, por ejemplo, el n&uacute;mero promedio de cigarros consumidos en cientos por persona (X), y la tasa de mortalidad por c&aacute;ncer de pulm&oacute;n en 15 localidades, en muertes por cien mil habitantes (Y), como se muestra en el <a href="#cuadro1">Cuadro 1</a>, una de las formas de c&aacute;lculo es la siguiente (Zar, 1999):    <br> </font></p>     <div style="text-align: center;"><font face="Verdana" size="2"><img  src="/img/fbpe/amc/v50n2/a05i1v52n2.jpg" title="" alt=""  style="width: 776px; height: 170px;">    
<br>     <br>     <br> <a name="cuadro1"></a><img src="/img/fbpe/amc/v50n2/a05i15v52n2.gif" title="" alt=""  style="width: 504px; height: 728px;">    
<br>     <br> </font></div>     <p><font face="Verdana" size="2">En el ejemplo se encontr&oacute; una alta correlaci&oacute;n positiva entre las variables, con un coeficiente de correlaci&oacute;n de 0.80.</font></p>     <p><font face="Verdana" size="2">Para obtener el estimado del coeficiente de correlaci&oacute;n no es necesario conocer la distribuci&oacute;n de probabilidad de las variables; sin embargo, como se obtiene a partir de una muestra es preciso obtener indicadores de la variabilidad del estimado, como su error est&aacute;ndar o un intervalo de confianza. Tambi&eacute;n es posible realizar pruebas de hip&oacute;tesis, por ejemplo, para determinar si el coeficiente es estad&iacute;sticamente diferente de cero. Para todo ello se requiere que las variables cumplan ciertos supuestos, espec&iacute;ficamente, que tengan una distribuci&oacute;n normal bivariada.</font></p>     ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">El error est&aacute;ndar de la correlaci&oacute;n se calcula de la siguiente manera (Zar, 1999):    <br> </font></p>     <div style="text-align: center;"><font face="Verdana" size="2"><img  src="/img/fbpe/amc/v50n2/a05i3v52n2.jpg" title="" alt=""  style="width: 313px; height: 64px;"></font>    
<br> </div>     <p><font face="Verdana" size="2">Una prueba de hip&oacute;tesis sobre el coeficiente de correlaci&oacute;n se puede establecer en los t&eacute;rminos siguientes: hip&oacute;tesis nula H<sub>o</sub>: r=0; hip&oacute;tesis alternativa H<sub>1</sub>: r&#8800;0; estad&iacute;stico de prueba:&nbsp;<img src="/img/fbpe/amc/v50n2/a05i4v52n2.jpg"  title="" alt="" style="width: 50px; height: 48px;"> con n-2 grados de libertad y se rechaza la hip&oacute;tesis nula s&iacute;&nbsp; <img src="/img/fbpe/amc/v50n2/a05i5v52n2.jpg"  title="" alt="" style="width: 79px; height: 29px;"> . En el caso del ejemplo <img src="/img/fbpe/amc/v50n2/a05i6v52n2.jpg" title="" alt=""  style="width: 107px; height: 37px;">con una probabilidad de 0.0003 (<a href="#figura1">Figura 1</a>), por lo tanto, se rechaza la hip&oacute;tesis nula y se concluye que el coeficiente de correlaci&oacute;n es significativamente distinto de cero.    
<br> </font></p>     <p><font face="Verdana" size="2">    <br> </font></p>     <div style="text-align: center;"><a name="figura1"></a><img  src="/img/fbpe/amc/v50n2/a05i2v52n2.jpg" title="" alt=""  style="width: 461px; height: 255px;">    
<br> </div>     ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2"> </font></p>     <p><font face="Verdana" size="2">Si se prefiere, se puede construir un intervalo de confianza para el coeficiente de correlaci&oacute;n. Como este no se distribuye normalmente, se debe realizar una transformaci&oacute;n, de manera que el coeficiente de correlaci&oacute;n transformado s&iacute; lo haga. La transformaci&oacute;n se obtiene como:    <br> </font></p>     <div style="text-align: center;"><font face="Verdana" size="2"><img  src="/img/fbpe/amc/v50n2/a05i9v52n2.jpg" title="" alt=""  style="width: 317px; height: 57px;"></font>    
<br> </div>     <p><font face="Verdana" size="2">y su error est&aacute;ndar es:    <br> </font></p>     <p style="text-align: center;"><font face="Verdana" size="2"><img  src="/img/fbpe/amc/v50n2/a05i10v52n2.jpg" title="" alt=""  style="width: 227px; height: 60px;">    
<br> </font></p>     <p style="text-align: center;"><font face="Verdana" size="2">    ]]></body>
<body><![CDATA[<br> <img src="/img/fbpe/amc/v50n2/a05i7v52n2.jpg" title="" alt=""  style="width: 520px; height: 308px;">    
<br> </font></p>     <p style="text-align: center;"><font face="Verdana" size="2">    <br> <img src="/img/fbpe/amc/v50n2/a05i8v52n2.jpg" title="" alt=""  style="width: 503px; height: 293px;">    
<br>     <br> </font></p>     <p><font face="Verdana" size="2">En donde L<sub>n</sub> se refiere al logaritmo natural o neperiano. El intervalo de confianza del coeficiente <b>transformado </b>se obtiene de forma convencional (Camacho, 2007). En el presente caso el intervalo de confianza del 95% se consigue de la siguiente manera:</font></p>     <p><font face="Verdana" size="2">L&iacute;mite inferior:    <br> </font></p>     <div style="text-align: center;"><font face="Verdana" size="2"><img  src="/img/fbpe/amc/v50n2/a05i11v52n2.jpg" title="" alt=""  style="width: 342px; height: 60px;"></font>    
]]></body>
<body><![CDATA[<br> </div>     <p><font face="Verdana" size="2">L&iacute;mite superior:    <br> </font></p>     <div style="text-align: center;"><font face="Verdana" size="2"><img  src="/img/fbpe/amc/v50n2/a05i12v52n2.jpg" title="" alt=""  style="width: 299px; height: 60px;"></font>    
<br> </div>     <p><font face="Verdana" size="2">El valor de los l&iacute;mites se refiere al coeficiente de correlaci&oacute;n <b>transformado (z)</b>, por lo que se debe realizar el proceso inverso para obtener el intervalo de confianza de r. </font></p>     <p><font face="Verdana" size="2">Los l&iacute;mites inferior y superior se obtienen como:    <br> </font></p>     <p style="text-align: center;"><font face="Verdana" size="2"><img  src="/img/fbpe/amc/v50n2/a05i13v52n2.jpg" title="" alt=""  style="width: 291px; height: 67px;">    
<br> <img src="/img/fbpe/amc/v50n2/a05i14v52n2.jpg" title="" alt=""  style="width: 274px; height: 66px;">    
]]></body>
<body><![CDATA[<br> </font></p>     <p><font face="Verdana" size="2">Es decir, se tiene un 95% de confianza de que el coeficiente de correlaci&oacute;n en la poblaci&oacute;n est&eacute; entre 0.49 y 0.93. La letra e representa la base de los logaritmos neperianos o naturales (2.72). </font></p>     <p><font face="Verdana" size="2">En una pr&oacute;xima nota se considerar&aacute; el caso de variables que no cumplen el requisito de tener distribuci&oacute;n normal bivariada.</font></p> <font face="Verdana" size="2"><b>     <p>Bibliograf&iacute;a</p> </b> </font>     <!-- ref --><p><font face="Verdana" size="2">1. Camacho, J. 2007. &iquest;Hay diferencias significativas entre tratamientos? Primera parte. Acta M&eacute;dica Costarricense 49(2): 81-82.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=034643&pid=S0001-6002200800020000500001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana" size="2">2. Zar, J. 1999. Biostatistical Analysis. 4th Ed. Prentice Hall, New Jersey. 663 pp.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=034644&pid=S0001-6002200800020000500002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Camacho]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[¿Hay diferencias significativas entre tratamientos? Primera parte]]></article-title>
<source><![CDATA[Acta Médica Costarricense]]></source>
<year>2007</year>
<volume>49</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>81-82</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zar]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Biostatistical Analysis]]></source>
<year>1999</year>
<edition>4</edition>
<page-range>663</page-range><publisher-loc><![CDATA[^eNew Jersey New Jersey]]></publisher-loc>
<publisher-name><![CDATA[Prentice Hall]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
