Vista previa del material en texto
CORRELACIÓN Y REGRESIÓN Diferencia entre correlación y regresión ■ Regresión: – Variable independiente: tratamientos con diferentes dosis de droga (X) – Variable dependiente: actividad locomotora (Y) – ¿Relación entre X y Y? ¿Se puede predecir Y sabiendo X? ■ Correlación: – Individuos son sometidos a las pruebas A y B para las cuales alojan puntajes X y Y pareados – ¿Relación / Fuerza de asociación entre X y Y? ¿X puede predecir Y o viceversa? – No hay una variable independiente obvia Diferencia entre correlación y regresión ■ Conceptos de correlación y regresión desarrollados por Francis Galton Scanned with CamScanner Tabla bivariada Diagrama de dispersión Categoría que contiene la mediana Regresión a la media Coeficiente de correlación ■ Coeficiente de Pearson: un índice que mide el grado o fuerza de la relación entre 2 variables X y Y, relacionadas linealmente. ■ Se escribe rxy o r ■ El coeficiente de correlación de una población se escribe con la letra griega rho 𝝆 -1 ≤ rxy ≤ 1 r = 1 à correlación positiva perfecta r = -1 à correlación negativa (inversa) perfecta r = 0 à no existe ninguna asociación linear entre las variables Coeficiente de correlación Coeficiente de correlación Sc an ne d w ith C am Sc an ne r Valores de r: 1 -1 0.4 -0.9 Coeficiente de correlación de Pearson ■ Ese coeficiente es indicado para describir una relación linear entre 2 variables cuantitativas Sc an ne d w ith C am Sc an ne r Coeficiente de correlación Sc an ne d w ith C am Sc an ne r Sc an ne d w ith C am Sc an ne r Coeficiente de correlación de Pearson ■ Ese coeficiente es indicado para describir una relación linear entre 2 variables cuantitativas Sc an ne d w ith C am Sc an ne r Producto vectorial de las desviaciones Sc an ne d w ith C am Sc an ne r Coeficiente de correlación de Pearson Si una persona se encuentra por debajo de la media en una variable y encima de la media de otra variable el producto vectorial será <0 Si una persona se encuentra encima de la media para ambas variables, el producto vectorial será >0 Si una persona se encuentra debajo de la media para ambas variables, el producto vectorial será >0 Coeficiente de correlación de Pearson Sc an ne d w ith C am Sc an ne r Producto vectorial de las desviaciones Naturaleza de la relación entre X y Y Coeficiente de correlación de Pearson ■ A más grande la fuerza de la relación entre X y Y, más grande será el valor absoluto de la suma de los productos vectoriales Sc an ne d w ith C am Sc an ne r Sc an ne d w ith C am Sc an ne r ■ La suma de los productos vectoriales es afectados para el número de puntajes X y Y apareados Coeficiente de correlación de Pearson Sc an ne d w ith C am Sc an ne r Sxy = Covarianza Sc an ne d w ith C am Sc an ne r Desviación estandar de X Desviación estandar de Y ■ La suma de los productos vectoriales refleja la naturaleza de la relación entre X y Y (positiva vs inversa) y la magnitud de la relación ■ El coeficiente de Pearson es un índice de relación linear sin dimensión: no depende de la unidad de medida de las variables X y Y En resumen Sc an ne d w ith C am Sc an ne r ■ Coeficiente de determinación r2 ■ Coeficiente de no determinación k2 = 1– r2 Cómo interpretar el coeficiente de Pearson? Sc an ne d w ith C am Sc an ne r ¿Cómo interpretar el coeficiente de Pearson? Sc an ne d w ith C am Sc an ne r Varianza total de X expresada como una proporción Varianza total de Y expresado como una proporción Proporción de la varianza de X explicada por Y Proporción de la varianza de X NO explicada por Y Proporción de la varianza de Y explicada por X Proporción de la varianza de Y NO explicada por X r = 0.85 R2 = 0.72 y k2 = 1 – 0.72 = 0.28 à El 72% de la varianza de Y se puede explicar por la relación linear con X ¿Cómo interpretar el coeficiente de Pearson? r = 0.85 R2 = 0.72 y k2 = 1 – 0.72 = 0.28 à El 72% de la varianza de Y se puede explicar por la relación linear con X Sc an ne d w ith C am Sc an ne r Errores al interpretar el coeficiente de Pearson 1. Interpretar r como una proporción directa de su tamaño Es incorrecto interpretar r como un porcentaje de asociación entre 2 variables Ejemplo: R = 0.6 no significa que existe un 60% de asociación entre las variables à r es una medida de la fuerza de asociación de 2 variables ¿r = 0.8 representa el doble de relación indicado por un r = 0.4? ¿Un incremento en la correlación de 0.1 a 0.2 es lo mismo que un incremento de 0.6 a 0.7? Errores al interpretar el coeficiente de Pearson 1. Inferir causalidad a partir de una correlación Es incorrecto inferir que porque 2 variables son correlacionadas, una causa la otra Un r ≠ 0 significa que existe una relación entre X y Y, es decir, que la variación de una variable es asociada de alguna manera a la variación de la otra Factores que afectan el tamaño del coeficiente de correlación 1. Naturaleza de la relación entre X y Y: Linear o no linear Sc an ne d w ith C am Sc an ne r Para relaciones no lineares se usa el coeficiente de correlación 𝜼2 Factores que afectan el tamaño del coeficiente de correlación 2. Rango truncado : restricción del rango de una de las variables Sc an ne d w ith C am Sc an ne rr = 0.06r = 0.55 Factores que afectan el tamaño del coeficiente de correlación 3. Falta de normalidad o heterogeneidad de varianzas: si las distribuciones de X y Y están marcadamente asimétricas Sc an ne d w ith C am Sc an ne r Factores que afectan el tamaño del coeficiente de correlación 3. Falta de normalidad o heterogeneidad de varianzas: si las distribuciones de X y Y están marcadamente asimétricas Sc an ne d w ith C am Sc an ne r Coeficiente de correlación de Spearman ■ rs : usado para describir el grado de concordancia entre datos pareados expresados en forma de rangos