Logo Studenta

Semana 13 Análisis de Correlación

¡Este material tiene más páginas!

Vista previa del material en texto

MÉTODOS ESTADÍSTICOS PARA LA 
INVESTIGACIÓN I
Profesores del curso
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Facultad de Economía y Planificación
Departamento de Estadística e Informática
Análisis de correlación
Semana XII
2020-II
0.10
0.08
0.06
0.04
0.02
0.00
Chi Critico0
OBJETIVOS
Conocer las condiciones para usar el coeficiente de
correlación.
Calcular el coeficiente de correlación de Pearson y
Spearman.
Interpretar y analizar el coeficiente de correlación de 
Pearson y Spearman.
Métodos Estadísticos para la Investigación I 2020-II
Sabías que…
Un zootecnista está interesado en evaluar 12 ejemplares
de trucha en un estudio de índole acuícola, con la
finalidad de relacionar la longitud del cuerpo y su ancho.
Longitud 66 63 64 76 76 60 73 69 67 65 70 72
Ancho 6 7 6 7 4 3 4 5 4 5 9 7
Se comprobó que las variables no cumplen con el 
supuesto de normalidad.
Correlación: Longitud; Ancho 
Correlación de Pearson de Longitud y Ancho = 0.175
Valor p = 0.587
Rho de Spearman: Longitud; Ancho 
Rho de Spearman para Longitud y Ancho = 0.128
Valor p = 0.691
a. Indique el coeficiente correlación adecuado entre longitud y
ancho del cuerpo de la trucha. Interprete.
b. Pruebe de hipótesis para la existencia de correlación entre
longitud y ancho del cuerpo de la trucha. Usar  = 0.05
Métodos Estadísticos para la Investigación I 2020-II
Logro de la sesión:
 Al final de la sesión el estudiante analiza, resuelve y
demuestra problemas de correlación en situaciones reales
aplicadas a su especialidad, hacienda uso de la correlación
y prueba de hipótesis.
Contenido:
 Correlación de variables cuantitativas
 Coeficiente de correlación de Pearson
 Interpretación del coeficiente de correlación de Pearson
 Prueba de hipótesis para el coeficiente de correlación de 
Pearson
 Ejemplo
 Coeficiente de correlación de Spearman
 Prueba de hipótesis del coeficiente de correlación de 
Spearman
 Ejemplo
 Aplicación
 Fórmulas
 Referencias
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Coeficiente de Correlación de Pearson 
El coeficiente de correlación de Pearson es una medida de la
asociación existente entre dos variables cuantitativas. Este
coeficiente toma valores desde -1 hasta 1. Para interpretar un
coeficiente de correlación tenga en cuenta lo siguiente:
a) El valor de r es independiente de las unidades en que se midan
x e y
b) r =1: significa una perfecta correlación positiva, es decir, todos
los puntos caen sobre una línea con pendiente positiva.
c) r = 0: significa no hay correlación. Es decir, las variables son
independientes
d) r = -1: significa una perfecta correlación negativa, es decir,
todos los puntos caen sobre una línea con pendiente negativa.
e) r mide la fuerza de una relación lineal
f) Se usa cuando los datos están medidos en una escala de
intervalo o de razón.
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Si r = 0 nula
Si -0.10 < r < 0.10 Casi nula
Si
-0.20 < r ≤ -0.10 0.10 ≤ r < 
0.20 Muy baja 
Si
-0.40 < r ≤ -0.20 0.20 ≤ r < 
0.40 Baja
Si
-0.60 < r ≤ -0.40 0.40 ≤ r < 
0.60 Media
Si
-0.80 < r ≤ -0.60 0.60 ≤ r < 
0.80 Alta
Si r ≤ -0.80 r > 0.80 Muy alta
Si r = ± 1 Perfecta
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
 El coeficiente de correlación está dada por: 
Siendo:
SPXY: suma de productos corregidos de X e Y.
SCX : suma de cuadrados corregidos de X.
SCY : suma de cuadrados corregidos de Y.
Métodos Estadísticos para la Investigación I 2020-II
Prueba de hipótesis para el coeficiente de 
correlación de Pearson - procedimiento
 P1) H0: ρ = 0 (No existe correlación entre X e Y)
 H1: ρ ≠ 0 (Si existe correlación entre X e Y)
 P2) Nivel de significancia: 
 P3) Estadístico de prueba:

 P4) Cálculos: Rechazar Ho si:
 Graficar:
 * Usando p-valor: Si p-valor ≤ , entonces se Rechaza H0.
 Decisión: Rechazar H0 o no rechazar H0.
 P5) Conclusión:
T < 𝑡(𝛼/2,𝑛−2) 𝑜 𝑇 > 𝑡(1−𝛼/2,𝑛−2)
𝑇 =
𝑟
(1 − 𝑟2)/(𝑛 − 2)
Ejemplo de aplicación 1 
Un ingeniero pesquero está interesado en
evaluar 12 ejemplares de trucha en un estudio
de índole acuícola, con la finalidad de verificar
si existe una correlación entre la longitud del
cuerpo y su ancho.
Asumiendo de que las variables cumplen el
supuesto de normalidad, responda las
siguientes preguntas:
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
a. Estime e interprete el coeficiente de 
correlación de Pearson para la longitud y el 
ancho de las truchas. 
Cálculos previos: 
X: Longitud 
Y: Ancho 
Existe una muy baja correlación positiva entre la longitud y el 
ancho de las truchas. 
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
b. Realice la prueba estadística más adecuada 
para verificar si existe correlación entre la 
longitud y el ancho de las truchas. Use α=0.05 
P1) Planteamiento de hipótesis 
H0: ρ = 0 (No existe correlación entre X e Y) 
H1: ρ ≠ 0 (Si existe correlación entre X e Y) 
P2) Nivel de significación: α=0.05 
P3) Estadístico de prueba y desarrollo 
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
P3) Estadístico de prueba y desarrollo:
P4) Criterios de decisión 
Como 
t(0.025,10)<tc<t(0.975,10)=2.228 
entonces no se rechaza Ho. 
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
P5) Conclusión
A un nivel de significación del 5% no se
rechaza Ho. Luego no se puede afirmar que
exista correlación entre la longitud y el ancho
de las truchas.
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Coeficiente de Correlación de Spearman
El coeficiente de correlación de Spearman
(1904) es una prueba no paramétrica cuando
se quiere medir la relación entre dos variables
y no cumplen el supuesto de normalidad en la
distribución de tales valores, o cuando una o
ambas variables estudiadas son de tipo
ordinal. Toma valores entre -1 y 1, y se
interpreta exatamente igual que el coeficiente
de correlación de Pearson.
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Coeficiente de Correlación de Spearman
Suponga que se toma una muestra aleatoria (x1, Y1), ... ,
(xn' Yn) de n pares de observaciones.
Si las Xi y las Yi se ordenan en sentido ascendente y se
calcula la correlación muestral de estos puestos, el
coeficiente resultante se llama coeficiente de correlación
de orden de Spearman. Si no hay empates, una formula
equivalente para calcular este coeficiente es:
 
2
1
2
6
1
1
n
i
i
s
d
r
n n
 


Métodos Estadísticos para la Investigación I 2020-II
di: son las diferencias entre los puestos de los miembros de los distintos 
pares n: nº de datos.
Prueba de hipótesis del coeficiente de 
Correlación de Spearman - procedimiento 
 P1) H0: ρ = 0 (No existe correlación entre X e Y)
H1: ρ ≠ 0 (Si existe correlación entre X e Y)
 P2) Nivel de significancia: 
 P3) Estadístico de prueba:
 P4) Cálculos: Rechazar Ho si: rs < - r/2, n, o rs > r/2, n
 Nota:
 Si n > 30, se puede calcular y utilizar la tabla de la distribución normal
 Decisión: Rechazar H0 o no rechazar H0.
 P5) Conclusión
 
2
1
2
6
1
1
n
i
i
s
d
r
n n
 


CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Ejemplo 2:
Se sospecha que la abundancia de la especie de
gramínea Poa bulbosa en los pastizales depende en
gran medida de la humedad que hay en el suelo.
Para comprobar esta hipótesis se realizó un
muestreo con una cuadrícula de 20 cm de lado
obteniéndose una muestra al azar de 12
cuadriculas de pasto. En cada cuadrícula se midió
la cobertura de la especie y la humedad del suelo
mediante un TDR. Ambas son variables
cuantitativas y no se ajustaron una distribuciónnormal.
Realice la prueba estadística más adecuada
utilizando un α=0.05
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Pasos para hallar rs:
1. Clasificar por jerarquìa los valores de X
desde 1 hasta n (el número de parejas de
valores de X e Y en la muestra).
2. Clasificar por jerarquía los valores de Y desde
1 hasta n.
3. Calcular di, para cada pareja de
observaciones, restando la jerarquía de Yi de
la jerarquía de Xi.
4. Elevar al cuadrado cada di y calcular, la
suma de los valores elevados al cuadrado.
5. Calcula rs
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Obs Cobertura(X) Humedad(Y) Rango (X) Rango (Y) di di
2
1 82 42 2 3 -1 1
2 98 46 6 4 2 4
3 87 39 5 2 3 9
4 40 37 1 1 0 0
5 116 65 10 8 2 4
6 113 88 9 11 -2 4
7 111 86 8 10 -2 4
8 83 56 3 6 -3 9
9 85 62 4 7 -3 9
10 126 92 12 12 0 0
11 106 54 7 5 2 4
12 117 81 11 9 2 4
Suma 52
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Calculo de rs  2
6 52
1 0,818
12 12 1
s
x
r
x
  

rs,/2= 0,5804 ( 2 colas)
si n= 12 y para α=0.05, la tabla de Spearman arroja el valor de 
rs,α/2=0.5804 
P1) Planteamiento de hipótesis 
H0: No existe correlación entre la cobertura de la 
especie y la humedad del suelo 
H1: Existe correlación entre la cobertura de la especie 
y la humedad del suelo 
P2) Nivel de significación: α=0.05 
P3) Estadístico de prueba y desarrollo 
Métodos Estadísticos para la Investigación I 2020-II
CORRELACIÓN DE VARIABLES 
CUANTITATIVAS
Como rs =0.818 es mayor a rs,α/2= 0.5804 , entonces se rechaza Ho. 
0.025 de área 0.025 de área 
-0.5804 -0.5804 
P5) Conclusión
A un nivel de significación del 5% se rechaza Ho. Por lo
tanto hay correlación entre la cobertura de Poa bulbosa y la
humedad del suelo.
Métodos Estadísticos para la Investigación I 2020-II
Aplicación
Un zootecnista está interesado en evaluar 12 ejemplares
de trucha en un estudio de índole acuícola, con la
finalidad de relacionar la longitud del cuerpo y su ancho.
Longitud 66 63 64 76 76 60 73 69 67 65 70 72
Ancho 6 7 6 7 4 3 4 5 4 5 9 7
Se comprobó que las variables no cumplen con el 
supuesto de normalidad.
Correlación: Longitud; Ancho 
Correlación de Pearson de Longitud y Ancho = 0.175
Valor p = 0.587
Rho de Spearman: Longitud; Ancho 
Rho de Spearman para Longitud y Ancho = 0.128
Valor p = 0.691
a.Indique el coeficiente correlación adecuado entre longitud
y ancho del cuerpo de la trucha. Interprete.
b.Pruebe de hipótesis para la existencia de correlación entre
longitud y ancho del cuerpo de la trucha. Usar  = 0.05
Métodos Estadísticos para la Investigación I 2020-II
Fórmulas
Métodos Estadísticos para la Investigación I 2020-II
Referencias
 R.G.D. Steel, & Torrie, J.H.(1985). Bioestadística Principios y 
Procedimientos. McGraw Hill, ed Bogotá, Colombia.
 Montgomery, D. C. (2005). Diseño y análisis de experimentos 
(2nd. Ed). México: Limusa Wiey.
 Kuehl, R. O., (2001). Diseño de experimentos: principios 
estadísticos para el diseño y análisis de investigaciones. (2nd 
Ed). International Thomson Editores, S.A. de C.V., Mexico, DF.
 Ramsey, F. L., & Schafer, D. W. (2002).The statistical sleuth: A 
course in methods of data analysis. Australia: 
Duxbury/Thomson Learning.
Métodos Estadísticos para la Investigación I 2020-II

Continuar navegando