Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-195

¡Estudia con miles de materiales!

Vista previa del material en texto

Uso del modelo de regresión para estimación 
y predicción
Finalmente, una vez que se haya determinado que el modelo es efectivo para describir 
la relación entre y y las variables predictoras x1, x2, …, xk, el modelo se puede usar para 
estos fines:
• Estimar el valor promedio de y, E(y), para valores dados de x1, x2, …, xk
• Predecir un valor particular de y para valores dados de x1, x2, …, xk
Los valores de x1, x2, …, xk se introducen en la computadora y ésta genera el valor 
ajustado ŷ junto con su error estándar estimado y los intervalos de confianza y predic-
ción. Recuerde que el intervalo de predicción es siempre más ancho que el intervalo de 
confianza.
Veamos qué tan bien funciona nuestra predicción para los datos de bienes raíces, 
usando otra casa de la base de datos de la computadora, una casa con 1000 pies cuadra-
dos de superficie de vivienda, un piso, tres recámaras y dos baños, con precio de lista 
de $221 500. La salida impresa de la figura 13.6 muestra los intervalos de confianza y 
predicción para estos valores. El valor real cae dentro de dos intervalos, lo que indica 
que el modelo está funcionando muy bien.
 13.4 UN MODELO DE REGRESIÓN POLINOMIAL ❍ 559
Para valores dados de x1, 
x2, …, xk, el intervalo de 
predicción siempre será más 
ancho que el intervalo de 
confi anza.
Una ecuación cuadrática es 
y � a � bx � cx2. La gráfi ca 
forma una parábola.
CONSEJOMIMI
CONSEJOMIMI
Predicted Values for New Observations
New Obs Fit SE Fit 95% CI 95% PI
1 217.78 3.11 (210.86, 224.70) (201.02, 234.54)
Values of Predictors for New Observations
New Square Number of
Obs Feet Floors Bedrooms Baths
1 10.0 1.00 3.00 2.00
UN MODELO DE REGRESIÓN 
POLINOMIAL 
En la sección 13.3 explicamos en detalle las diversas partes de la salida impresa de 
regresión múltiple. Cuando se efectúa un análisis de regresión múltiple, se debe usar un 
método de paso a paso:
1. Obtener el modelo de predicción ajustada.
2. Usar el análisis de varianza de la prueba F y R2 para determinar qué tan bien se 
ajusta el modelo a los datos.
3. Verifi car las pruebas t para los coefi cientes de regresión parcial para ver cuáles 
están aportando información signifi cativa en presencia de los otros.
4. Si se escoge comparar varios modelos diferentes, use R2(adj) para comparar su 
efectividad.
5. Usar gráfi cas residuales generadas por computadora para ver si hay violación de 
las suposiciones de regresión.
Una vez tomados todos estos pasos, estamos listos para usar el modelo para estimación 
y predicción.
Las variables predictoras x1, x2, …, xk empleadas en el modelo lineal general no tienen 
que representar variables predictoras diferentes. Por ejemplo, si se sospecha que una 
variable independiente x afecta la respuesta y, pero que la relación es curvilínea más que 
lineal, entonces se podría escoger ajustar a un modelo cuadrático:
y � b0 � b1x � b2x
2 � e
13.4
FIGURA 13.6 
Intervalos de confi anza y 
predicción para el ejemplo 
13.2
●
Probabilidad_Mendenhall_13.indd 559Probabilidad_Mendenhall_13.indd 559 5/14/10 8:20:36 AM5/14/10 8:20:36 AM
 www.FreeLibros.me
560 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE
El modelo cuadrático es un ejemplo de un modelo de segundo orden porque contie-
ne un término cuyos exponentes suman 2 (en este caso, x2).† También es un ejemplo de 
un modelo polinomial, un modelo que toma la forma
y � a � bx � cx2 � dx3 � � � �
Para ajustar este tipo de modelo usando el programa de regresión múltiple, los valores 
observados de y, x y x2 se introducen en la computadora y la salida impresa se puede 
generar como en la sección 13.3.
En un estudio de variables que afecta la productividad en el comercio de comestibles al 
menudeo, W.S. Good usa valor agregado por hora de trabajo para medir la productividad 
de tiendas de comestibles al menudeo.1 Él defi ne “valor agregado” como “el excedente 
[dinero generado por el negocio] disponible para pagar empleados, mobiliario y ense-
res, y equipo”. Los datos consistentes con la relación entre valor agregado por hora de 
trabajo y y el tamaño x de una tienda de comestibles descrita en el artículo de Good, se 
muestran en la tabla 13.2 para 10 tiendas de alimentos fi cticias. Escoja un modelo para 
relacionar y con x.
E J E M P L O 13.3
Solución Se puede investigar la relación entre y y x al ver la gráfica de los puntos 
en la figura 13.7. La gráfica sugiere que la productividad, y, aumenta cuando el tama-
ño de la tienda de comestibles, x, aumenta hasta alcanzar un tamaño óptimo. Arriba de 
ese tamaño, la productividad tiende a disminuir. La relación parece ser curvilínea y un 
modelo cuadrático,
E(y) � b0 � b1x � b2x
2
†
 El orden de un término está determinado por la suma de los exponentes de variables que conforman ese término. 
Los términos que contienen x1 o x2 son de primer orden; los que contienen x
2
1, x
2
2 o x1x2 son de segundo orden. 
TABLA 13.2 
●
 Datos sobre tamaño de tienda y valor agregado
Tienda Valor agregado por hora de trabajo, y Tamaño de tienda (miles de pies cuadrados), x
 1 $4.08 21.0
 2 3.40 12.0
 3 3.51 25.2
 4 3.09 10.4
 5 2.92 30.9
 6 1.94 6.8
 7 4.11 19.6
 8 3.16 14.5
 9 3.75 25.0
10 3.60 19.1
4.0
3.5
3.0
2.5
2.0
 10 15 20 25 30
x
y
FIGURA 13.7
Gráfi ca del tamaño x y 
valor agregado y para el 
ejemplo 13.3
●
Probabilidad_Mendenhall_13.indd 560Probabilidad_Mendenhall_13.indd 560 5/14/10 8:20:36 AM5/14/10 8:20:36 AM
 www.FreeLibros.me
puede ser apropiado. Recuerde que, al escoger usar este modelo, no estamos diciendo 
que la verdadera relación sea cuadrática, sino sólo que puede dar estimaciones y predic-
ciones más precisas que, por ejemplo, un modelo lineal.
Consulte los datos sobre productividad de una tienda minorista de alimentos del ejemplo 
13.3. Se utilizó el MINITAB para ajustar un modelo cuadrático a los datos y para grafi car 
la curva cuadrática de predicción, junto con los puntos de datos grafi cados. Analice lo 
adecuado del modelo ajustado.
Solución De la salida impresa de la figura 13.8, se puede ver que la ecuación de 
regresión es
ŷ � �.159 � .392x � .00949x2
La gráfica de esta ecuación cuadrática junto con los puntos de datos se muestra en la 
figura 13.9.
E J E M P L O 13.4
Análisis de regresión: y contra x, x-sq
The regression equation is
y = - 0.159 + 0.392 x - 0.00949 x-sq
Predictor Coef St Coef T P
Constant -0.1594 0.5006 -0.32 0.760
x 0.39193 0.05801 6.76 0.000
x-sq -0.009495 0.001535 -6.19 0.000
S = 0.250298 R-Sq = 87.9% R-Sq(adj) = 84.5%
Analysis of Variance
Source DF SS MS F P
Regression 2 3.1989 1.5994 25.53 0.001
Residual Error 7 0.4385 0.0626
Total 9 3.6374
Source DF Seq SS
x 1 0.8003
x-sq 1 2.3986
4.0
3.5
3.0
2.5
2.0
 10 15 20 25 30
x
S 0.250298
R-Sq 87.9%
R-Sq(adj) 84.5%
Gráfica de recta ajustada
y � �0.1594 � 0.3919 x
�0.009495 x**2
y
Para evaluar lo adecuado del modelo cuadrático, la prueba de
H0 : b1 � b2 � 0
contra 
Ha : Ni b1 ni b2 son 0
se da en la salida impresa como
F � �
M
M
S
S
R
E
� � 25.53
Vea la salida impresa y 
encuentre las leyendas 
para “Predictor”. Esto le 
dirá cuáles variables se han 
usado en el modelo.
CONSEJOMIMI
FIGURA 13.9
Recta de regresión 
cuadrática ajustada para el 
ejemplo 13.4
●
FIGURA 13.8
Salida impresa MINITAB 
para el ejemplo 13.4
●
 13.4 UN MODELO DE REGRESIÓN POLINOMIAL ❍ 561
Probabilidad_Mendenhall_13.indd 561Probabilidad_Mendenhall_13.indd 561 5/14/10 8:20:36 AM5/14/10 8:20:36 AM
 www.FreeLibros.me
	13 ANÁLISIS DE REGRESIÓN MÚLTIPLE
	13.3 Un análisis de regresión múltiple
	Uso del modelo de regresión para estimación y predicción
	13.4 Un modelo de regresión polinomial

Continuar navegando