Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Uso del modelo de regresión para estimación y predicción Finalmente, una vez que se haya determinado que el modelo es efectivo para describir la relación entre y y las variables predictoras x1, x2, …, xk, el modelo se puede usar para estos fines: • Estimar el valor promedio de y, E(y), para valores dados de x1, x2, …, xk • Predecir un valor particular de y para valores dados de x1, x2, …, xk Los valores de x1, x2, …, xk se introducen en la computadora y ésta genera el valor ajustado ŷ junto con su error estándar estimado y los intervalos de confianza y predic- ción. Recuerde que el intervalo de predicción es siempre más ancho que el intervalo de confianza. Veamos qué tan bien funciona nuestra predicción para los datos de bienes raíces, usando otra casa de la base de datos de la computadora, una casa con 1000 pies cuadra- dos de superficie de vivienda, un piso, tres recámaras y dos baños, con precio de lista de $221 500. La salida impresa de la figura 13.6 muestra los intervalos de confianza y predicción para estos valores. El valor real cae dentro de dos intervalos, lo que indica que el modelo está funcionando muy bien. 13.4 UN MODELO DE REGRESIÓN POLINOMIAL ❍ 559 Para valores dados de x1, x2, …, xk, el intervalo de predicción siempre será más ancho que el intervalo de confi anza. Una ecuación cuadrática es y � a � bx � cx2. La gráfi ca forma una parábola. CONSEJOMIMI CONSEJOMIMI Predicted Values for New Observations New Obs Fit SE Fit 95% CI 95% PI 1 217.78 3.11 (210.86, 224.70) (201.02, 234.54) Values of Predictors for New Observations New Square Number of Obs Feet Floors Bedrooms Baths 1 10.0 1.00 3.00 2.00 UN MODELO DE REGRESIÓN POLINOMIAL En la sección 13.3 explicamos en detalle las diversas partes de la salida impresa de regresión múltiple. Cuando se efectúa un análisis de regresión múltiple, se debe usar un método de paso a paso: 1. Obtener el modelo de predicción ajustada. 2. Usar el análisis de varianza de la prueba F y R2 para determinar qué tan bien se ajusta el modelo a los datos. 3. Verifi car las pruebas t para los coefi cientes de regresión parcial para ver cuáles están aportando información signifi cativa en presencia de los otros. 4. Si se escoge comparar varios modelos diferentes, use R2(adj) para comparar su efectividad. 5. Usar gráfi cas residuales generadas por computadora para ver si hay violación de las suposiciones de regresión. Una vez tomados todos estos pasos, estamos listos para usar el modelo para estimación y predicción. Las variables predictoras x1, x2, …, xk empleadas en el modelo lineal general no tienen que representar variables predictoras diferentes. Por ejemplo, si se sospecha que una variable independiente x afecta la respuesta y, pero que la relación es curvilínea más que lineal, entonces se podría escoger ajustar a un modelo cuadrático: y � b0 � b1x � b2x 2 � e 13.4 FIGURA 13.6 Intervalos de confi anza y predicción para el ejemplo 13.2 ● Probabilidad_Mendenhall_13.indd 559Probabilidad_Mendenhall_13.indd 559 5/14/10 8:20:36 AM5/14/10 8:20:36 AM www.FreeLibros.me 560 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE El modelo cuadrático es un ejemplo de un modelo de segundo orden porque contie- ne un término cuyos exponentes suman 2 (en este caso, x2).† También es un ejemplo de un modelo polinomial, un modelo que toma la forma y � a � bx � cx2 � dx3 � � � � Para ajustar este tipo de modelo usando el programa de regresión múltiple, los valores observados de y, x y x2 se introducen en la computadora y la salida impresa se puede generar como en la sección 13.3. En un estudio de variables que afecta la productividad en el comercio de comestibles al menudeo, W.S. Good usa valor agregado por hora de trabajo para medir la productividad de tiendas de comestibles al menudeo.1 Él defi ne “valor agregado” como “el excedente [dinero generado por el negocio] disponible para pagar empleados, mobiliario y ense- res, y equipo”. Los datos consistentes con la relación entre valor agregado por hora de trabajo y y el tamaño x de una tienda de comestibles descrita en el artículo de Good, se muestran en la tabla 13.2 para 10 tiendas de alimentos fi cticias. Escoja un modelo para relacionar y con x. E J E M P L O 13.3 Solución Se puede investigar la relación entre y y x al ver la gráfica de los puntos en la figura 13.7. La gráfica sugiere que la productividad, y, aumenta cuando el tama- ño de la tienda de comestibles, x, aumenta hasta alcanzar un tamaño óptimo. Arriba de ese tamaño, la productividad tiende a disminuir. La relación parece ser curvilínea y un modelo cuadrático, E(y) � b0 � b1x � b2x 2 † El orden de un término está determinado por la suma de los exponentes de variables que conforman ese término. Los términos que contienen x1 o x2 son de primer orden; los que contienen x 2 1, x 2 2 o x1x2 son de segundo orden. TABLA 13.2 ● Datos sobre tamaño de tienda y valor agregado Tienda Valor agregado por hora de trabajo, y Tamaño de tienda (miles de pies cuadrados), x 1 $4.08 21.0 2 3.40 12.0 3 3.51 25.2 4 3.09 10.4 5 2.92 30.9 6 1.94 6.8 7 4.11 19.6 8 3.16 14.5 9 3.75 25.0 10 3.60 19.1 4.0 3.5 3.0 2.5 2.0 10 15 20 25 30 x y FIGURA 13.7 Gráfi ca del tamaño x y valor agregado y para el ejemplo 13.3 ● Probabilidad_Mendenhall_13.indd 560Probabilidad_Mendenhall_13.indd 560 5/14/10 8:20:36 AM5/14/10 8:20:36 AM www.FreeLibros.me puede ser apropiado. Recuerde que, al escoger usar este modelo, no estamos diciendo que la verdadera relación sea cuadrática, sino sólo que puede dar estimaciones y predic- ciones más precisas que, por ejemplo, un modelo lineal. Consulte los datos sobre productividad de una tienda minorista de alimentos del ejemplo 13.3. Se utilizó el MINITAB para ajustar un modelo cuadrático a los datos y para grafi car la curva cuadrática de predicción, junto con los puntos de datos grafi cados. Analice lo adecuado del modelo ajustado. Solución De la salida impresa de la figura 13.8, se puede ver que la ecuación de regresión es ŷ � �.159 � .392x � .00949x2 La gráfica de esta ecuación cuadrática junto con los puntos de datos se muestra en la figura 13.9. E J E M P L O 13.4 Análisis de regresión: y contra x, x-sq The regression equation is y = - 0.159 + 0.392 x - 0.00949 x-sq Predictor Coef St Coef T P Constant -0.1594 0.5006 -0.32 0.760 x 0.39193 0.05801 6.76 0.000 x-sq -0.009495 0.001535 -6.19 0.000 S = 0.250298 R-Sq = 87.9% R-Sq(adj) = 84.5% Analysis of Variance Source DF SS MS F P Regression 2 3.1989 1.5994 25.53 0.001 Residual Error 7 0.4385 0.0626 Total 9 3.6374 Source DF Seq SS x 1 0.8003 x-sq 1 2.3986 4.0 3.5 3.0 2.5 2.0 10 15 20 25 30 x S 0.250298 R-Sq 87.9% R-Sq(adj) 84.5% Gráfica de recta ajustada y � �0.1594 � 0.3919 x �0.009495 x**2 y Para evaluar lo adecuado del modelo cuadrático, la prueba de H0 : b1 � b2 � 0 contra Ha : Ni b1 ni b2 son 0 se da en la salida impresa como F � � M M S S R E � � 25.53 Vea la salida impresa y encuentre las leyendas para “Predictor”. Esto le dirá cuáles variables se han usado en el modelo. CONSEJOMIMI FIGURA 13.9 Recta de regresión cuadrática ajustada para el ejemplo 13.4 ● FIGURA 13.8 Salida impresa MINITAB para el ejemplo 13.4 ● 13.4 UN MODELO DE REGRESIÓN POLINOMIAL ❍ 561 Probabilidad_Mendenhall_13.indd 561Probabilidad_Mendenhall_13.indd 561 5/14/10 8:20:36 AM5/14/10 8:20:36 AM www.FreeLibros.me 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE 13.3 Un análisis de regresión múltiple Uso del modelo de regresión para estimación y predicción 13.4 Un modelo de regresión polinomial
Compartir