Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
SESIÓN 30 Estadística Inferencial SUMARIO Regresión Lineal Múltiple: Coeficiente de determinación LOGRO Al finalizar el alumno aplican los conceptos de regresión lineal multiple para el cálculo del coeficiente de determinación REGRESIÓN LINEAL MÚLTIPLE Esta prueba permite determinar si el modelo es significativo o no, para esto realizamos una prueba de Análisis de Varianza(ANOVA), y la hipótesis a plantear es la siguiente: H0: 1 = 2 = .... = k = 0 (El modelo no es significativo) H1: Al menos un i es diferente de cero (El modelo si es significativo) Para decidir sobre estas hipótesis se construye la siguiente tabla de análisis de varianza (Tabla ANOVA) NOTA: Prueba de Hipótesis significancia modelo COEFICIENTE DE DETERMINACIÓN ¿Qué es el coeficiente de determinación? Estadístico que representa la proporción de variación explicada por la regresión 0 ≤ 𝑅2 ≤ 1 El resultado del 𝑅2oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable será. 𝑅2 = σ(𝑌 − ത𝑌) 2 σ(𝑌 − ത𝑌) 2 = 𝑆𝐶𝑅 𝑆𝐶𝑇 (𝑌 − ത𝑌) 2 = (𝑌 − ത𝑌) 2 + (𝑌 − 𝑌) 2 SCT = SCR + SCE Variación total (Y) = Variación Explicada + Variación no explicada SCT=SCR+SCE COEFICIENTE DE DETERMINACIÓN EJEMPLO: El presidente de una gran cadena de restaurantes de comida rápida seleccionó de manera aleatoria 10 franquicias y registró para cada una de ellas, la ganancia neta según el tipo de ventas en el local y el tipo de ventas delivery, con el fin de impulsar el tipo de ventas más rentable. Un analista encontró el siguiente modelo de regresión que describe el comportamiento de la variable de interes 𝒀𝒊 = −𝟎, 𝟐𝟏𝟓𝟗 + 𝟎, 𝟎𝟖𝟓𝟓𝒙𝟏 + 𝟎, 𝟏𝟏𝟑𝟐𝒙𝟐 FRANQUICIA GANANCIA NETA(millon) Y VENTAS EN EL LUGAR(mill) (X1) VENTAS DELIVERY(mill) (X2) 1 1,5 8,4 7,7 2 0,8 3,3 4,5 3 1,2 5,8 8,4 4 1,4 10 7,8 5 0,2 4,7 2,4 6 0,8 7,7 4,8 7 0,6 4,5 2,5 8 1,3 8,6 3,4 9 0,4 5,9 2 10 0,6 6,3 4,1 ¿Halle el coeficiente de determinación? COEFICIENTE DE DETERMINACIÓN 𝑿𝟏 𝑿𝟐 𝒀𝒊 𝒀𝒊 = −𝟎, 𝟐𝟏𝟓𝟗 + 𝟎, 𝟎𝟖𝟓𝟓𝒙𝟏 + 𝟎, 𝟏𝟏𝟑𝟐𝒙𝟐 𝑆𝐶𝑹 = Σ ( ො𝑦𝑖 − ത𝑦) 2 𝑆𝐶𝑬 = Σ (𝑦𝑖 − ො𝑦𝑖) 2 8,4 7,7 1,5 1,38 0,25 0,01 3,3 4,5 0,8 0,57 0,1 0,05 5,8 8,4 1,2 1,23 0,12 0 10 7,8 1,4 1,54 0,44 0,02 4,7 2,4 0,2 0,47 0,17 0,07 7,7 4,8 0,8 1 0,01 0,04 4,5 2,5 0,6 0,46 0,18 0,02 8,6 3,4 1,3 0,93 0 0,14 5,9 2 0,4 0,53 0,12 0,02 6,3 4,1 0,6 0,8 0,01 0,04 ത𝑦 = 0.88 1.4 0.41 Promedio 𝑆𝐶𝑇 = 𝑆𝐶𝑅 + 𝑆𝐶𝐸 𝑆𝐶𝑇 = 1.4+0.41 𝑆𝐶𝑇 = 1.81 n=10 COEFICIENTE DE DETERMINACIÓN EJEMPLO2: Hallar el coeficiente de correlación y determinación, de las variables Xi e Yi, para el problema de la cadena de restaurantes? 𝑅2 = 1.4 1.81 = 0.773 COEFICIENTE DE DETERMINACION MULTIPLE COEFICIENTE DE CORRELACION MULTIPLE Esto indica que el 77.3% de la variación de las ganancias mensuales Yi, queda estadísticamente explicado por las ventas locales X1 y por las ventas delivery X2. Este coeficiente indica que el 87.9% de los valores de X1 y X2, son explicadas por Yi, correspondiente a la ecuación de regresión lineal múltiple. R = 𝑅2 = 0.773 R= 0.879 Coeficiente de Correlación Múltiple 𝑅2 = σ(𝑌 − ത𝑌) 2 σ(𝑌 − ത𝑌) 2 = 𝑆𝐶𝑅 𝑆𝐶𝑇 EJERCICIO ADICIONAL Nº 1 𝑌 𝑋1 𝑋2 8 4 20 10 3 22 12 6 23 13 6 26 15 7 27 18 8 30 𝑌 = −8.8947𝑋1 + 0.3684𝑋2 + 0.7895𝑋3 Se sabe que X1 y X2 son dos variables cuantitativas que explican el comportamiento de Y Se sabe que el modelo de regresión que explica este comportamiento se muestra a continuación: https://www.youtube.com/watch?v=RnKowBsV1nw Compruebe el modelo de regresión con el excel ¿Halle el coeficiente de regresión e interprete? https://www.youtube.com/watch?v=RnKowBsV1nw EJERCICIO ADICIONAL Nº 2 Un embotellador está analizando las rutas de servicio de máquinas dispensadoras, está interesado en predecir la cantidad de tiempo (minutos) requerida por el chofer para surtir las máquinas en el local (Y). La actividad de servicio incluye llenar la máquina con refrescos y un mantenimiento menor. Se tienen como variables el número de envases con que llena la máquina (X1) y la distancia que tiene que caminar (X2). A continuación se tiene algunos resultados de 24 registros Y_Tiempo = 2.34 + 1.62 X1_Envase + 0.0144 X2_DistanciaModelo de regresión Suma de cuadrados regresión ( SCR)=5550.81092 Suma de cuadrados error (SCE)=233.731677 a) Interprete los coeficientes de regresión b) Halle e interprete el coeficiente de determinación CIERRE ¿QUÉ HEMOS APRENDIDO? 1. ¿Cuál es la utilidad de hacer un análisis de la varianza?
Compartir