Logo Studenta

ANÁLISIS DE CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE

¡Este material tiene más páginas!

Vista previa del material en texto

ANÁLISIS DE CORRELACIÓN 
LINEAL SIMPLE 
¿ CORRELACIÓN ? 
 
Medida estadística para determinar 
la relación entre dos variables. 
Ejemplo: El número de horas dedicadas 
al estudio de una asignatura y la 
calificación obtenida en el examen. 
ANÁLISIS DE CORRELACIÓN 
LINEAL SIMPLE 
La CORRELACIÓN ESTADÍSTICA constituye una técnica estadística que nos indica si dos 
variables están relacionadas o no. 
 
El COCIENTE DE CORRELACIÓN 𝝆 es una medida del grado de asociación lineal de 
dos variables aleatorias 𝑋 y 𝑌, también es llamado Coeficiente de Correlación de 
Pearson. Así se tiene que: 
−1 ≤ 𝜌 ≤ 1 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 
 
Este coeficiente no tiene unidad de medida y sus valores pueden indicar: 
 
𝜌 = −1 Asociación lineal perfecta negativa 
𝜌 < 0 Asociación lineal negativa 
𝜌 = 0 No existe asociación lineal entre las variables 
𝜌 > 0 Asociación lineal positiva 
𝜌 = 1 Asociación lineal perfecta positiva 
 
ANÁLISIS DE CORRELACIÓN 
LINEAL SIMPLE 
Entonces el COCIENTE DE CORRELACIÓN MUESTRAL 𝒓 viene dado por: 
 
𝑟 =
 𝑥𝑦 −
 𝑥 𝑦
𝑛
 𝑥2 −
 𝑥 2
𝑛
 𝑦2 −
 𝑦 2
𝑛
=
𝑆𝑃𝑋𝑌
𝑆𝐶𝑋 ⋅ 𝑆𝐶𝑌
 ; −1 ≤ 𝑟 ≤ 1 
 
 
 
GRAFICAS DE DISPERSIÓN COMUNES PARA ALGUNOS VALORES DE 𝑟 
ANÁLISIS DE CORRELACIÓN 
LINEAL SIMPLE 
EJEMPLO: Usted cuenta con los registros de 10 gallinas de la misma raza para los cuales 
se obtuvieron sus pesos y luego se registró el consumo de alimento de cada una de estas. 
Los resultados se presentan a continuación: (Steel and Torrie, 1985) 
Peso del 
cuerpo en 
libras 𝑿 
Consumo de 
alimento 
gramos/días 
𝒀 
4.6 87.1 
5.1 93.1 
4.8 89.8 
4.4 91.4 
5.9 99.5 
4.7 92.1 
5.1 95.5 
5.2 99.3 
4.9 93.4 
5.1 94.4 
𝑆𝐶𝑋 = 𝑥2 −
 𝑥 2
𝑛
= 249,54 −
49,8 2
10
= 1,536 
 
𝑆𝐶𝑌 = 𝑦2 −
 𝑦 2
𝑛
= 87670,34 −
935,5 2
10
= 135,604 
 
𝑆𝑃𝑋𝑌 = 𝑥𝑦 −
 𝑥 𝑦
𝑛
= 4671,1 −
49,8 935,5
10
= 11,812 
 
𝑟 =
11,812
1,536 135,604
= 0,8184 
 
 
Esto indica que el grado de asociación lineal entre el peso 
de las gallinas y el consumo de alimento es del 81,84%. 
Cálculos 
manual 
ANÁLISIS DE CORRELACIÓN 
LINEAL SIMPLE 
PRUEBA DE HIPÓTESIS PARA LA CORRELACIÓN: 
 
𝐻0: 𝜌 = 0 → No existe asociación lineal entre el peso de la gallina y el consumo de alimento. 
𝐻𝑎: 𝜌 ≠ 0 → Si existe asociación lineal entre el peso de la gallina y el consumo de alimento. 
 
𝑡𝑐 =
𝑟 − 𝜌
1 − 𝑟2
𝑛 − 2
=
0,8184
1 − 0,8184 2
10 − 2
= 4,0282 
 
𝑡𝑇 𝛼;𝑛−2𝑔𝑙 = 𝑡𝑇 0,05; 8 𝑔𝑙 = ∓2,306 
 
 
 
 
 
 
 
CONCLUSIÓN: Se rechaza la 𝐻0, por lo tanto si hay asociación lineal entre el peso de la 
gallina y el consumo de alimento 𝑝 < 0,05 . 
ANÁLISIS DE REGRESIÓN 
LINEAL SIMPLE 
ANÁLISIS DE REGRESIÓN LINEAL SIMPLE: 
 
Es el estudio de la relación funcional entre una VARIABLE DEPENDIENTE y una o 
más variables regresoras, o también llamadas VARIABLES EXPLICATIVAS, con el 
objetivo de estimar y/o predecir la media o valor promedio poblacional de la 
primera en términos de los valores conocidos o fijos (en muestras repetidas) de 
las últimas. 
 
COCIENTE DE REGRESIÓN: Mide el grado de dependencia que existe entre una 
variable dependiente y una variable independiente. 
 
 
 
 
Así: 
𝑏 =
𝑆𝑃𝑋𝑌
𝑆𝐶𝑋
 
 
Denotado como: 
POBLACIÓN → 𝜷 
MUESTRA → 𝒃 
ANÁLISIS DE REGRESIÓN 
LINEAL SIMPLE 
CONTINUAMOS CON EL MISMO EJEMPLO: 
 
En esta clase de problemas es recomendable graficar los puntos determinados por los pares 𝑥𝑦 
con el fin de visualizar el tipo de relación existente entre ellas. 
y = 7,6901x + 55,263 
R² = 0,6699 
86
88
90
92
94
96
98
100
102
4 4,5 5 5,5 6
C
o
n
su
m
o
 d
e
 a
li
m
e
n
to
 
Peso 
Gráfico de dispersión 
𝑏 =
𝑆𝑃𝑋𝑌
𝑆𝐶𝑋
=
11,812
1,536
= 7,690 
 
El consumo de alimento se incrementa en 7,690 unidades con el incremento de 
una unidad del peso de la gallina. 
EXCEL estima 
ecuación de 
regresión y 
coeficiente de 
determinación 
ANÁLISIS DE REGRESIÓN 
LINEAL SIMPLE 
PRUEBA DE HIPÓTESIS PARA LA REGRESIÓN: 
 
𝐻0: 𝛽 = 0 → No existe regresión o dependencia entre el peso de la gallina y el consumo de alimento. 
𝐻𝑎: 𝛽 ≠ 0 → Si existe regresión o dependencia entre el peso de la gallina y el consumo de alimento. 
 
𝑡𝑐 =
𝑏 − 𝛽
𝑆𝑏
𝑆𝐶𝑋
 
=
7,690 − 0
2,366
1,536
 
= 4,028 
donde: 
𝑆𝑏 =
𝑆𝐶𝑌 −
𝑆𝑃𝑋𝑌 2
𝑆𝐶𝑋
𝑛 − 2
=
135,604 −
11,812 2
1,536
10 − 2
= 2,366 
 
𝑡𝑇 𝛼;𝑛−2𝑔𝑙 = 𝑡𝑇 0,05; 8 𝑔𝑙 = ∓2,306 
CONCLUSIÓN: Se rechaza la 𝑯𝟎, por lo tanto si existe dependencia entre el peso de la 
gallina y el consumo de alimento 𝒑 < 𝟎, 𝟎𝟓 . 
ANÁLISIS DE REGRESIÓN 
LINEAL SIMPLE 
MODELO DE REGRESIÓN LINEAL SIMPLE 
 
Si existe una sola variable regresora la regresión es simple. Sea 𝑦1, 𝑥1 , 𝑦2, 𝑥2 , 𝑦3, 𝑥3 , … , 𝑦𝑛, 𝑥𝑛 
una muestra aleatoria bivariada de tamaño 𝑛. Se plantea describir la relación funcional entre 𝑋 y 𝑌 a 
través del modelo poblacional: 
Supuestos del modelo 
• Homogeneidad de varianza de errores. 
• Normalidad de los errores. 
• Independencia. 
• Aditividad de los efectos. 
ANÁLISIS DE REGRESIÓN 
LINEAL SIMPLE 
ECUACIÓN DE REGRESIÓN: 
 
𝑦𝑖 = 𝛽0 + 𝛽𝑥𝑖 → En la población 
 
También podemos expresarla como: → 𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 
 
𝑦 = 𝑎 + 𝑏𝑥 
 
𝑏 =
𝑆𝑃𝑋𝑌
𝑆𝐶𝑋
 y 𝑎 = 𝑦 − 𝑏𝑥 
 
En el ejemplo: 
𝑏 = 7,690 𝑦 =
 𝑦
𝑛
= 93,56 𝑥 =
 𝑥
𝑛
= 4,98 
 
𝑎 = 𝑦 − 𝑏𝑥 = 93,56 − 7,690 4,98 = 55,26 
 
𝒚𝒊 = 𝟓𝟓, 𝟐𝟔 + 𝟕, 𝟔𝟗𝟎𝒙𝒊 
 
 
Para estimar el valor del consumo de alimento con un peso de 5,3 libras (𝑥 = 5,3): 
 
𝑦𝑖 = 55,26 + 7,690 5,3 = 96,017 
 
El consumo será de 96,017 gramos/día. 
Ejemplo si se 
desea hacer 
alguna 
estimación 
ANÁLISIS DE REGRESIÓN 
LINEAL SIMPLE 
Fuente de 
Variación 
Grados de 
Libertad 
Suma de Cuadrados Cuadrados Medios Prueba de F 
Regresión 1 𝑆𝐶𝑟𝑒𝑔 =
𝑆𝑃𝑋𝑌 2
𝑆𝐶𝑋
 
𝑆𝐶𝑟𝑒𝑔
1
 
𝐶𝑀𝑟𝑒𝑔
𝐶𝑀𝑟𝑒𝑠
 
Residual 𝑛 − 2 
𝑆𝐶𝑟𝑒𝑠 = 𝑆𝐶𝑡𝑜𝑡𝑎𝑙
− 𝑆𝐶𝑟𝑒𝑔 
𝑆𝐶𝑟𝑒𝑠
𝑛 − 2
 
Total 𝑛 − 1 𝑆𝐶𝑡𝑜𝑡𝑎𝑙 = 𝑆𝐶𝑌 
ANÁLISIS DE VARIANZA DE LA REGRESIÓN 
 
𝐻0: 𝛽 = 0 → No existe regresión o dependencia entre el peso de la gallina y el consumo de alimento. 
𝐻𝑎: 𝛽 ≠ 0 → Si existe regresión o dependencia entre el peso de la gallina y el consumo de alimento. 
 
 
Cuadro del Análisis de la Varianza: 
ANÁLISIS DE REGRESIÓN 
LINEAL SIMPLE 
Fuente de 
Variación 
Grados de 
Libertad 
Suma de 
Cuadrados 
Cuadrados 
Medios 
𝑭𝒄 𝑭𝒕 𝟎,𝟎𝟏 ; 𝟏 ; 𝟖 
Regresión 1 90,84 90,84 16,22** 11,26 
Residual 8 44,764 5,60 
Total 9 135,604 
ANAVAR PARA EL EJEMPLO: 
Interpretación: 
 
Se rechaza la 𝐻0, por lo tanto si existe dependencia altamente significativa entre 
el peso de las gallinas y el consumo de alimento 𝑝 < 0,01 .

Continuar navegando