Logo Studenta

Correlacion

¡Este material tiene más páginas!

Vista previa del material en texto

CORRELACIÓN Y 
REGRESIÓN
Diferencia entre correlación y 
regresión
■ Regresión:
– Variable independiente: tratamientos con diferentes 
dosis de droga (X)
– Variable dependiente: actividad locomotora (Y)
– ¿Relación entre X y Y? ¿Se puede predecir Y sabiendo 
X?
■ Correlación:
– Individuos son sometidos a las pruebas A y B para las 
cuales alojan puntajes X y Y pareados
– ¿Relación / Fuerza de asociación entre X y Y? ¿X 
puede predecir Y o viceversa?
– No hay una variable independiente obvia
Diferencia entre correlación y 
regresión
■ Conceptos de correlación y regresión 
desarrollados por Francis Galton
Scanned with CamScanner
Tabla bivariada
Diagrama de dispersión
Categoría que 
contiene la 
mediana
Regresión a la media
Coeficiente de correlación
■ Coeficiente de Pearson: un índice que mide el grado o 
fuerza de la relación entre 2 variables X y Y, 
relacionadas linealmente.
■ Se escribe rxy o r
■ El coeficiente de correlación de una población se 
escribe con la letra griega rho 𝝆
-1 ≤ rxy ≤ 1
r = 1 à correlación positiva perfecta
r = -1 à correlación negativa (inversa) perfecta
r = 0 à no existe ninguna asociación linear entre las 
variables
Coeficiente de correlación
Coeficiente de correlación
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Valores de r:
1
-1
0.4
-0.9
Coeficiente de correlación de Pearson
■ Ese coeficiente es indicado para describir una relación 
linear entre 2 variables cuantitativas
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Coeficiente de correlación
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Coeficiente de correlación de Pearson
■ Ese coeficiente es indicado para describir una relación 
linear entre 2 variables cuantitativas
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Producto vectorial de 
las desviaciones
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Coeficiente de correlación de Pearson
Si una persona se 
encuentra por debajo 
de la media en una 
variable y encima de la 
media de otra variable 
el producto vectorial 
será <0
Si una persona se 
encuentra encima 
de la media para 
ambas variables, el 
producto vectorial 
será >0
Si una persona se 
encuentra debajo de la 
media para ambas 
variables, el producto 
vectorial será >0
Coeficiente de correlación de Pearson
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Producto vectorial 
de las 
desviaciones
Naturaleza de la 
relación entre X y Y
Coeficiente de correlación de Pearson
■ A más grande la fuerza de la relación entre X y Y, más 
grande será el valor absoluto de la suma de los 
productos vectoriales
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
■ La suma de los productos vectoriales es afectados para 
el número de puntajes X y Y apareados 
Coeficiente de correlación de Pearson
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Sxy = Covarianza
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Desviación 
estandar de X
Desviación 
estandar de Y
■ La suma de los productos vectoriales refleja la 
naturaleza de la relación entre X y Y (positiva vs 
inversa) y la magnitud de la relación
■ El coeficiente de Pearson es un índice de relación linear 
sin dimensión: no depende de la unidad de medida de 
las variables X y Y
En resumen
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
■ Coeficiente de determinación r2
■ Coeficiente de no determinación k2 = 1– r2
Cómo interpretar el coeficiente de 
Pearson?
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
¿Cómo interpretar el coeficiente de 
Pearson?
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Varianza total de 
X expresada 
como una 
proporción
Varianza total de 
Y expresado 
como una 
proporción
Proporción de la 
varianza de X 
explicada por Y 
Proporción de la 
varianza de X NO 
explicada por Y 
Proporción de la 
varianza de Y 
explicada por X 
Proporción de la 
varianza de Y NO 
explicada por X 
r = 0.85
R2 = 0.72 y k2 = 1 – 0.72 = 0.28
à El 72% de la varianza de Y se puede explicar por la relación linear con X 
¿Cómo interpretar el coeficiente de 
Pearson?
r = 0.85
R2 = 0.72 y k2 = 1 – 0.72 = 0.28
à El 72% de la varianza de Y se puede explicar por la relación linear con X 
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Errores al interpretar el coeficiente de 
Pearson
1. Interpretar r como una proporción directa de su 
tamaño
Es incorrecto interpretar r como un porcentaje de 
asociación entre 2 variables
Ejemplo: R = 0.6 no significa que existe un 60% de 
asociación entre las variables
à r es una medida de la fuerza de asociación de 2 
variables
¿r = 0.8 representa el doble de relación indicado por un r 
= 0.4?
¿Un incremento en la correlación de 0.1 a 0.2 es lo mismo 
que un incremento de 0.6 a 0.7?
Errores al interpretar el coeficiente de 
Pearson
1. Inferir causalidad a partir de una correlación
Es incorrecto inferir que porque 2 variables son 
correlacionadas, una causa la otra
Un r ≠ 0 significa que existe una relación entre X y Y, es 
decir, que la variación de una variable es asociada de 
alguna manera a la variación de la otra
Factores que afectan el tamaño del 
coeficiente de correlación
1. Naturaleza de la relación entre X y Y: Linear o no linear
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Para relaciones no lineares se usa el coeficiente de 
correlación 𝜼2
Factores que afectan el tamaño del 
coeficiente de correlación
2. Rango truncado : restricción del rango de una de las 
variables 
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
rr = 0.06r = 0.55
Factores que afectan el tamaño del 
coeficiente de correlación
3. Falta de normalidad o heterogeneidad de varianzas: si 
las distribuciones de X y Y están marcadamente 
asimétricas
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Factores que afectan el tamaño del 
coeficiente de correlación
3. Falta de normalidad o heterogeneidad de varianzas: si 
las distribuciones de X y Y están marcadamente 
asimétricas
Sc
an
ne
d 
w
ith
 C
am
Sc
an
ne
r
Coeficiente de correlación de 
Spearman
■ rs : usado para describir el grado de concordancia entre 
datos pareados expresados en forma de rangos