Logo Studenta

estadistica inferencial

¡Este material tiene más páginas!

Vista previa del material en texto

SESIÓN 30
Estadística Inferencial
SUMARIO
Regresión Lineal Múltiple: Coeficiente de determinación
LOGRO
Al finalizar el alumno aplican los conceptos de regresión lineal multiple para el
cálculo del coeficiente de determinación
REGRESIÓN LINEAL MÚLTIPLE
Esta prueba permite determinar si el modelo es significativo o no, para esto
realizamos una prueba de Análisis de Varianza(ANOVA), y la hipótesis a plantear es
la siguiente:
H0: 1 = 2 = .... = k = 0
(El modelo no es significativo)
H1: Al menos un i es diferente de cero
(El modelo si es significativo)
Para decidir sobre estas hipótesis se construye la siguiente tabla de
análisis de varianza (Tabla ANOVA)
NOTA: Prueba de Hipótesis significancia modelo
COEFICIENTE DE DETERMINACIÓN
¿Qué es el coeficiente de determinación?
Estadístico que representa la proporción de variación explicada por la regresión
0 ≤ 𝑅2 ≤ 1
El resultado del 𝑅2oscila entre 0 y 1. Cuanto más cerca 
de 1 se sitúe su valor, mayor será el ajuste del modelo a 
la variable que estamos intentando explicar. De forma 
inversa, cuanto más cerca de cero, menos ajustado 
estará el modelo y, por tanto, menos fiable será.
𝑅2 =
σ(෠𝑌 − ത𝑌) 2
σ(𝑌 − ത𝑌) 2
=
𝑆𝐶𝑅
𝑆𝐶𝑇
෍(𝑌 − ത𝑌) 2
=
෍(෠𝑌 − ത𝑌) 2
+
෍(𝑌 − ෠𝑌) 2
SCT = SCR + SCE
Variación
total (Y)
= Variación
Explicada
+ Variación no 
explicada
SCT=SCR+SCE
COEFICIENTE DE DETERMINACIÓN
EJEMPLO: El presidente de una gran cadena de restaurantes de comida rápida seleccionó de manera aleatoria 10
franquicias y registró para cada una de ellas, la ganancia neta según el tipo de ventas en el local y el tipo de ventas
delivery, con el fin de impulsar el tipo de ventas más rentable. Un analista encontró el siguiente modelo de
regresión que describe el comportamiento de la variable de interes ෡𝒀𝒊 = −𝟎, 𝟐𝟏𝟓𝟗 + 𝟎, 𝟎𝟖𝟓𝟓𝒙𝟏 + 𝟎, 𝟏𝟏𝟑𝟐𝒙𝟐
FRANQUICIA GANANCIA NETA(millon) Y VENTAS EN EL LUGAR(mill) (X1) VENTAS DELIVERY(mill) (X2)
1 1,5 8,4 7,7
2 0,8 3,3 4,5
3 1,2 5,8 8,4
4 1,4 10 7,8
5 0,2 4,7 2,4
6 0,8 7,7 4,8
7 0,6 4,5 2,5
8 1,3 8,6 3,4
9 0,4 5,9 2
10 0,6 6,3 4,1
¿Halle el coeficiente de determinación?
COEFICIENTE DE DETERMINACIÓN
𝑿𝟏 𝑿𝟐 𝒀𝒊 ෡𝒀𝒊 = −𝟎, 𝟐𝟏𝟓𝟗 + 𝟎, 𝟎𝟖𝟓𝟓𝒙𝟏 + 𝟎, 𝟏𝟏𝟑𝟐𝒙𝟐 𝑆𝐶𝑹 = Σ ( ො𝑦𝑖 − ത𝑦)
2 𝑆𝐶𝑬 = Σ (𝑦𝑖 − ො𝑦𝑖)
2
8,4 7,7 1,5 1,38 0,25 0,01
3,3 4,5 0,8 0,57 0,1 0,05
5,8 8,4 1,2 1,23 0,12 0
10 7,8 1,4 1,54 0,44 0,02
4,7 2,4 0,2 0,47 0,17 0,07
7,7 4,8 0,8 1 0,01 0,04
4,5 2,5 0,6 0,46 0,18 0,02
8,6 3,4 1,3 0,93 0 0,14
5,9 2 0,4 0,53 0,12 0,02
6,3 4,1 0,6 0,8 0,01 0,04
ത𝑦 = 0.88 1.4 0.41
Promedio
𝑆𝐶𝑇 = 𝑆𝐶𝑅 + 𝑆𝐶𝐸
𝑆𝐶𝑇 = 1.4+0.41
𝑆𝐶𝑇 = 1.81
n=10
COEFICIENTE DE DETERMINACIÓN
EJEMPLO2: Hallar el coeficiente de correlación y determinación, de las variables Xi e Yi,
para el problema de la cadena de restaurantes?
𝑅2 = 
1.4
1.81
= 0.773
COEFICIENTE DE DETERMINACION MULTIPLE
COEFICIENTE DE CORRELACION MULTIPLE
Esto indica que el 77.3% de la variación de las ganancias mensuales Yi, queda estadísticamente 
explicado por las ventas locales X1 y por las ventas delivery X2.
Este coeficiente indica que el 87.9% de los valores de X1 y X2, son explicadas por Yi, correspondiente a la 
ecuación de regresión lineal múltiple.
R = 𝑅2 = 0.773
R= 0.879 Coeficiente de Correlación Múltiple
𝑅2 =
σ(෠𝑌 − ത𝑌) 2
σ(𝑌 − ത𝑌) 2
=
𝑆𝐶𝑅
𝑆𝐶𝑇
EJERCICIO ADICIONAL Nº 1
𝑌 𝑋1 𝑋2
8 4 20
10 3 22
12 6 23
13 6 26
15 7 27
18 8 30
𝑌 = −8.8947𝑋1 + 0.3684𝑋2 + 0.7895𝑋3
Se sabe que X1 y X2 son dos variables cuantitativas que explican el comportamiento de Y
Se sabe que el modelo de regresión que explica este comportamiento se muestra a continuación:
https://www.youtube.com/watch?v=RnKowBsV1nw
Compruebe el modelo de regresión con el excel
¿Halle el coeficiente de regresión e interprete?
https://www.youtube.com/watch?v=RnKowBsV1nw
EJERCICIO ADICIONAL Nº 2
Un embotellador está analizando las rutas de servicio de máquinas dispensadoras, está interesado en
predecir la cantidad de tiempo (minutos) requerida por el chofer para surtir las máquinas en el local
(Y). La actividad de servicio incluye llenar la máquina con refrescos y un mantenimiento menor. Se
tienen como variables el número de envases con que llena la máquina (X1) y la distancia que tiene
que caminar (X2). A continuación se tiene algunos resultados de 24 registros
Y_Tiempo = 2.34 + 1.62 X1_Envase + 0.0144 X2_DistanciaModelo de regresión
Suma de cuadrados regresión ( SCR)=5550.81092
Suma de cuadrados error (SCE)=233.731677
a) Interprete los coeficientes de regresión
b) Halle e interprete el coeficiente de determinación
CIERRE
¿QUÉ HEMOS APRENDIDO?
1. ¿Cuál es la utilidad de hacer un
análisis de la varianza?

Continuar navegando

Otros materiales