Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE ¿ CORRELACIÓN ? Medida estadística para determinar la relación entre dos variables. Ejemplo: El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el examen. ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE La CORRELACIÓN ESTADÍSTICA constituye una técnica estadística que nos indica si dos variables están relacionadas o no. El COCIENTE DE CORRELACIÓN 𝝆 es una medida del grado de asociación lineal de dos variables aleatorias 𝑋 y 𝑌, también es llamado Coeficiente de Correlación de Pearson. Así se tiene que: −1 ≤ 𝜌 ≤ 1 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 Este coeficiente no tiene unidad de medida y sus valores pueden indicar: 𝜌 = −1 Asociación lineal perfecta negativa 𝜌 < 0 Asociación lineal negativa 𝜌 = 0 No existe asociación lineal entre las variables 𝜌 > 0 Asociación lineal positiva 𝜌 = 1 Asociación lineal perfecta positiva ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE Entonces el COCIENTE DE CORRELACIÓN MUESTRAL 𝒓 viene dado por: 𝑟 = 𝑥𝑦 − 𝑥 𝑦 𝑛 𝑥2 − 𝑥 2 𝑛 𝑦2 − 𝑦 2 𝑛 = 𝑆𝑃𝑋𝑌 𝑆𝐶𝑋 ⋅ 𝑆𝐶𝑌 ; −1 ≤ 𝑟 ≤ 1 GRAFICAS DE DISPERSIÓN COMUNES PARA ALGUNOS VALORES DE 𝑟 ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE EJEMPLO: Usted cuenta con los registros de 10 gallinas de la misma raza para los cuales se obtuvieron sus pesos y luego se registró el consumo de alimento de cada una de estas. Los resultados se presentan a continuación: (Steel and Torrie, 1985) Peso del cuerpo en libras 𝑿 Consumo de alimento gramos/días 𝒀 4.6 87.1 5.1 93.1 4.8 89.8 4.4 91.4 5.9 99.5 4.7 92.1 5.1 95.5 5.2 99.3 4.9 93.4 5.1 94.4 𝑆𝐶𝑋 = 𝑥2 − 𝑥 2 𝑛 = 249,54 − 49,8 2 10 = 1,536 𝑆𝐶𝑌 = 𝑦2 − 𝑦 2 𝑛 = 87670,34 − 935,5 2 10 = 135,604 𝑆𝑃𝑋𝑌 = 𝑥𝑦 − 𝑥 𝑦 𝑛 = 4671,1 − 49,8 935,5 10 = 11,812 𝑟 = 11,812 1,536 135,604 = 0,8184 Esto indica que el grado de asociación lineal entre el peso de las gallinas y el consumo de alimento es del 81,84%. Cálculos manual ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE PRUEBA DE HIPÓTESIS PARA LA CORRELACIÓN: 𝐻0: 𝜌 = 0 → No existe asociación lineal entre el peso de la gallina y el consumo de alimento. 𝐻𝑎: 𝜌 ≠ 0 → Si existe asociación lineal entre el peso de la gallina y el consumo de alimento. 𝑡𝑐 = 𝑟 − 𝜌 1 − 𝑟2 𝑛 − 2 = 0,8184 1 − 0,8184 2 10 − 2 = 4,0282 𝑡𝑇 𝛼;𝑛−2𝑔𝑙 = 𝑡𝑇 0,05; 8 𝑔𝑙 = ∓2,306 CONCLUSIÓN: Se rechaza la 𝐻0, por lo tanto si hay asociación lineal entre el peso de la gallina y el consumo de alimento 𝑝 < 0,05 . ANÁLISIS DE REGRESIÓN LINEAL SIMPLE ANÁLISIS DE REGRESIÓN LINEAL SIMPLE: Es el estudio de la relación funcional entre una VARIABLE DEPENDIENTE y una o más variables regresoras, o también llamadas VARIABLES EXPLICATIVAS, con el objetivo de estimar y/o predecir la media o valor promedio poblacional de la primera en términos de los valores conocidos o fijos (en muestras repetidas) de las últimas. COCIENTE DE REGRESIÓN: Mide el grado de dependencia que existe entre una variable dependiente y una variable independiente. Así: 𝑏 = 𝑆𝑃𝑋𝑌 𝑆𝐶𝑋 Denotado como: POBLACIÓN → 𝜷 MUESTRA → 𝒃 ANÁLISIS DE REGRESIÓN LINEAL SIMPLE CONTINUAMOS CON EL MISMO EJEMPLO: En esta clase de problemas es recomendable graficar los puntos determinados por los pares 𝑥𝑦 con el fin de visualizar el tipo de relación existente entre ellas. y = 7,6901x + 55,263 R² = 0,6699 86 88 90 92 94 96 98 100 102 4 4,5 5 5,5 6 C o n su m o d e a li m e n to Peso Gráfico de dispersión 𝑏 = 𝑆𝑃𝑋𝑌 𝑆𝐶𝑋 = 11,812 1,536 = 7,690 El consumo de alimento se incrementa en 7,690 unidades con el incremento de una unidad del peso de la gallina. EXCEL estima ecuación de regresión y coeficiente de determinación ANÁLISIS DE REGRESIÓN LINEAL SIMPLE PRUEBA DE HIPÓTESIS PARA LA REGRESIÓN: 𝐻0: 𝛽 = 0 → No existe regresión o dependencia entre el peso de la gallina y el consumo de alimento. 𝐻𝑎: 𝛽 ≠ 0 → Si existe regresión o dependencia entre el peso de la gallina y el consumo de alimento. 𝑡𝑐 = 𝑏 − 𝛽 𝑆𝑏 𝑆𝐶𝑋 = 7,690 − 0 2,366 1,536 = 4,028 donde: 𝑆𝑏 = 𝑆𝐶𝑌 − 𝑆𝑃𝑋𝑌 2 𝑆𝐶𝑋 𝑛 − 2 = 135,604 − 11,812 2 1,536 10 − 2 = 2,366 𝑡𝑇 𝛼;𝑛−2𝑔𝑙 = 𝑡𝑇 0,05; 8 𝑔𝑙 = ∓2,306 CONCLUSIÓN: Se rechaza la 𝑯𝟎, por lo tanto si existe dependencia entre el peso de la gallina y el consumo de alimento 𝒑 < 𝟎, 𝟎𝟓 . ANÁLISIS DE REGRESIÓN LINEAL SIMPLE MODELO DE REGRESIÓN LINEAL SIMPLE Si existe una sola variable regresora la regresión es simple. Sea 𝑦1, 𝑥1 , 𝑦2, 𝑥2 , 𝑦3, 𝑥3 , … , 𝑦𝑛, 𝑥𝑛 una muestra aleatoria bivariada de tamaño 𝑛. Se plantea describir la relación funcional entre 𝑋 y 𝑌 a través del modelo poblacional: Supuestos del modelo • Homogeneidad de varianza de errores. • Normalidad de los errores. • Independencia. • Aditividad de los efectos. ANÁLISIS DE REGRESIÓN LINEAL SIMPLE ECUACIÓN DE REGRESIÓN: 𝑦𝑖 = 𝛽0 + 𝛽𝑥𝑖 → En la población También podemos expresarla como: → 𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 𝑦 = 𝑎 + 𝑏𝑥 𝑏 = 𝑆𝑃𝑋𝑌 𝑆𝐶𝑋 y 𝑎 = 𝑦 − 𝑏𝑥 En el ejemplo: 𝑏 = 7,690 𝑦 = 𝑦 𝑛 = 93,56 𝑥 = 𝑥 𝑛 = 4,98 𝑎 = 𝑦 − 𝑏𝑥 = 93,56 − 7,690 4,98 = 55,26 𝒚𝒊 = 𝟓𝟓, 𝟐𝟔 + 𝟕, 𝟔𝟗𝟎𝒙𝒊 Para estimar el valor del consumo de alimento con un peso de 5,3 libras (𝑥 = 5,3): 𝑦𝑖 = 55,26 + 7,690 5,3 = 96,017 El consumo será de 96,017 gramos/día. Ejemplo si se desea hacer alguna estimación ANÁLISIS DE REGRESIÓN LINEAL SIMPLE Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrados Medios Prueba de F Regresión 1 𝑆𝐶𝑟𝑒𝑔 = 𝑆𝑃𝑋𝑌 2 𝑆𝐶𝑋 𝑆𝐶𝑟𝑒𝑔 1 𝐶𝑀𝑟𝑒𝑔 𝐶𝑀𝑟𝑒𝑠 Residual 𝑛 − 2 𝑆𝐶𝑟𝑒𝑠 = 𝑆𝐶𝑡𝑜𝑡𝑎𝑙 − 𝑆𝐶𝑟𝑒𝑔 𝑆𝐶𝑟𝑒𝑠 𝑛 − 2 Total 𝑛 − 1 𝑆𝐶𝑡𝑜𝑡𝑎𝑙 = 𝑆𝐶𝑌 ANÁLISIS DE VARIANZA DE LA REGRESIÓN 𝐻0: 𝛽 = 0 → No existe regresión o dependencia entre el peso de la gallina y el consumo de alimento. 𝐻𝑎: 𝛽 ≠ 0 → Si existe regresión o dependencia entre el peso de la gallina y el consumo de alimento. Cuadro del Análisis de la Varianza: ANÁLISIS DE REGRESIÓN LINEAL SIMPLE Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrados Medios 𝑭𝒄 𝑭𝒕 𝟎,𝟎𝟏 ; 𝟏 ; 𝟖 Regresión 1 90,84 90,84 16,22** 11,26 Residual 8 44,764 5,60 Total 9 135,604 ANAVAR PARA EL EJEMPLO: Interpretación: Se rechaza la 𝐻0, por lo tanto si existe dependencia altamente significativa entre el peso de las gallinas y el consumo de alimento 𝑝 < 0,01 .
Compartir