Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
f. ¿Hay otras conclusiones importantes que usted sienta que no se consideraron respecto a la ecuación de predicción ajustada? 13.30 El costo de volar ¿El costo de un vuelo en avión depende de la aerolínea y de la distancia recorrida? En el ejercicio 12.21, exploramos la primera parte de este problema. Los datos mostra- dos en esta tabla comparan el costo promedio y distancia recorrida para dos líneas aéreas diferentes, medidas para 11 rutas aéreas de gran movimiento en Estados Unidos.7 Ruta Distancia Costo Aerolínea Chicago-Detroit 238 148 American 164 United Chicago-Denver 901 256 American 312 United Chicago-St. Louis 262 136 American 152 United Chicago-Seattle 1736 424 American 520 United Chicago-Cleveland 301 129 American 139 United Los Angeles-Chicago 1757 361 American 473 United Chicago-Atlanta 593 162 American 183 United Nueva York-Los Angeles 2463 444 American 525 United Nueva York-Chicago 714 287 American 334 United Los Angeles-Honolulu 2556 323 American 333 United Nueva York-San Francisco 2574 513 American 672 United Use un paquete de computadora para analizar los datos con un análisis de regresión múltiple. Comente sobre el ajuste del modelo, las variables signifi cativas, cualesquiera interacciones que existan y suposiciones de regresión que puedan haber sido violadas. Resuma sus resultados en un informe, incluyendo salidas impresas y gráfi cas si posible. 13.31 En camino otra vez Hasta fechas recientes, las llantas de alto rendimiento se ajustaban principalmente en vehículos deportivos o de lujo. Ahora se han convertido en estándar en muchos sedanes de uso diario. Los mayores niveles de manejo y agarre al pavimento han aparecido a expensas del desgaste en el dibujo o superfi cie de rodamiento. Los datos que siguen se han resumido de un informe, sobre llantas de alto rendimiento de clasifi cación H por Consumer Reports8, en el que se evaluaron varios aspectos del rendimiento para n � 22 llantas diferentes y fueron: y � puntuación general x1 � frenado en seco x2 � frenado en húmedo x3 � manejo x4 � resistencia al rodamiento x5 � duración del dibujo DATOSMISMIS EX1330 DATOSMISMIS EX1331 Llanta Costo y x1 x2 x3 x4 x5 Dunlop® SP Sport 5000 81 85 5 5 4 4 4 Michelin® Pilot Exalto A/S 78 83 5 5 4 3 4 Falken® Ziex ZE 512 56 83 5 5 4 3 2 Continental® ContiProContact 77 81 4 5 4 4 2 Michelin Pilot XGT H4 98 81 5 5 4 1 2 Bridgestone® Potenza RE 950 80 80 5 5 4 2 2 BFGoodrich® Traction T/A 68 78 5 5 4 2 3 Yokohama® Avid H4s 62 77 5 5 4 3 4 Sumitomo® HTR H4 56 76 5 5 3 2 1 Bridgestone HP50 79 75 4 5 4 2 1 Michelin Energy MXV4 Plus 103 73 3 4 4 5 5 Goodyear® Assurance Triple Tred 85 72 3 4 3 3 5 Kumho Solus KH16 49 72 4 4 4 3 5 Pirelli® P6 Four Seasons 71 70 3 4 3 2 2 Bridgestone Potenza G009 62 70 4 4 4 2 2 Dayton® Daytona HR 46 69 4 4 3 2 2 Fuzion® HRi 49 69 4 4 4 1 2 Continental ContiPremierContact 91 68 3 4 4 5 5 Cooper® Lifeliner Touring SLE 61 65 3 3 3 2 2 Bridgestone Turanza EL400 91 63 3 3 4 2 2 Hankook® Optimo H418 51 62 3 2 3 3 4 General Exclaim 53 50 2 2 3 2 2 Las variables x1 a la x5 están codifi cadas usando la escala de 5 � excelente, 4 � muy buena, 3 � buena, 2 � regular y 1 � mala. a. Use un programa de su elección para hallar la matriz de correlación para las variables bajo estudio, que incluya costo. ¿El costo está significativamente correlacionado con cualquiera de las variables de estudio? ¿Cuáles variables parecen estar altamente correlacionadas con y, la puntuación total? b. Escriba un modelo para describir y, la puntuación total, como función de las variables x1 � frenado en seco, x2 � frenado en húmedo, x3 � manejo, x4 � resistencia al rodamiento y x5 � duración del dibujo. c. Use un programa de regresión de su elección para ajustar el modelo completo usando todas las variables predictoras. ¿Qué proporción de la variación en y está explicada por regresión? ¿Esto comunica la impresión de que el modelo explica en forma adecuada la variabilidad inherente en y? d. ¿Cuál variable o variables parecen ser buenas variables predictoras de y? ¿Cómo podría refinarse el modelo en vista de estos resultados? Use estas variables para reajustar el modelo. ¿Qué proporción de la variación es explicada por este modelo reajustado? Comente sobre lo adecuado de este modelo reducido en comparación con el modelo completo. 13.32 Atunes Los datos sobre atunes del ejercicio 11.16 se analizaron como un diseño completamente aleatorizado con cuatro tratamientos. No obstante, también podríamos ver el diseño experimental como un experimento factorial de 2 � 2 DATOSMISMIS EX1332 EJERCICIOS SUPLEMENTARIOS ❍ 589 Probabilidad_Mendenhall_13.indd 589Probabilidad_Mendenhall_13.indd 589 5/14/10 8:20:40 AM5/14/10 8:20:40 AM www.FreeLibros.me 590 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE con repeticiones desiguales. Los datos se muestran a continuación.9 Aceite Agua Atún claro 2.56 .62 .99 1.12 1.92 .66 1.92 .63 1.30 .62 1.23 .67 1.79 .65 .85 .69 1.23 .60 .65 .60 .67 .53 .60 1.41 .66 Atún blanco 1.27 1.49 1.29 1.22 1.29 1.00 1.19 1.27 1.27 1.22 1.35 1.28 Fuente: Estudio práctico “Tuna Goes Upscale” Copyright 2001 por Consumers Union of U.S. Inc., Yonkers, NY 10703-1057, organización sin fi nes de lucro. Reimpreso con permiso de la edición de junio de 2001 de Consumer Reports® sólo para fi nes educativos. No se permite uso comercial ni reproducción. www.ConsumerReports.org Los datos se pueden analizar usando el modelo y � b0 � b1x1 � b2x2 � b3x1x2 � e donde x1 � 0 si en aceite, 1 si en agua x2 � 0 si atún claro, 1 si atún blanco a. Demuestre cómo introduciría los datos en una hoja de trabajo de computadora, introduciendo los datos en las columnas para y, x1, x2 y x1x2. b. La salida impresa generada por MINITAB se muestra a continuación. ¿Cuál es la ecuación de predicción de mínimos cuadrados? Salida impresa MINITAB para el ejercicio 13.32 13.33 Atún, continúa Consulte el ejercicio 13.32. La hipótesis probada en el capítulo 11, que el promedio de precios para los cuatro tipos de atún es igual, es equivalente a decir que E(y) no cambiará cuando x1 y x2 cambien. Esto puede ocurrir sólo cuando b1 � b2 � b3 � 0. Use la salida impresa MINITAB para la ANOVA de una vía que se muestra a continuación para efectuar la prueba de igualdad de medias de tratamiento. Verifi que que esta prueba sea idéntica a la prueba para regresión signifi cativa del ejercicio 13.32. Salida impresa MINITAB para el ejercicio 13.33 Análisis de regresión: y contra x1, x2, x1x2 The regression equation is y = 1.15 - 0.251 x1 + 0.078 x2 + 0.306 x1x2 Predictor Coef SE Coef T P Constant 1.1473 0.1370 8.38 0.000 x1 -0.2508 0.1830 -1.37 0.180 x2 0.0777 0.2652 0.29 0.771 x1x2 0.3058 0.3330 0.92 0.365 S = 0.454287 R-Sq = 11.9% R-Sq(adj) = 3.9% Analysis of Variance Source DF SS MS F P Regression 3 0.9223 0.3074 1.49 0.235 Residual Error 33 6.8104 0.2064 Total 36 7.7328 c. ¿Hay interacción entre el tipo de atún y el tipo de líquido de empaque? d. ¿Cuál, si lo hay, de los principales efectos (tipo de atún y tipo de líquido de empaque) aporta información significativa para la predicción de y? e. ¿Qué tan bien se ajusta el modelo a los datos? Explique. ANOVA de una vía: claro en agua, blanco en aceite, blanco en agua, claro en aceite Source DF SS MS F P Factor 3 0.922 0.307 1.49 0.235 Error 33 6.810 0.206 Total 36 7.733 S = 0.4543 R-Sq = 11.93% R-Sq(adj) = 3.92% 13.34 Control de calidad Un fabricante registró el número de piezas defectuosas (y) producidas en un día determinado por cada uno de 10 operadores de máquinas y también registró la producción promedio por hora (x1) por cada operadory el tiempo en semanas desde el último servicio a una máquina (x2). y x1 x2 13 20 3.0 1 15 2.0 11 23 1.5 2 10 4.0 20 30 1.0 15 21 3.5 27 38 0 5 18 2.0 26 24 5.0 1 16 1.5 La salida impresas que sigue resultó cuando estos datos se analizaron usando el paquete MINITAB usando el modelo: E(y) � b0 � b1x1 � b2x2 Análisis de regresión: y contra x1, x2 The regression equation is y = -28.4 + 1.46 x1 + 3.84 x2 Predictor Coef SE Coef T P Constant -28.3906 0.8273 -34.32 0.000 x1 1.46306 0.02699 -54.20 0.000 x2 3.8446 0.1426 26.97 0.000 S = 0.548433 R-Sq = 99.8% R-Sq(adj) = 99.7% Analysis of Variance Source DF SS MS F P Regression 2 884.79 442.40 1470.84 0.000 Residual Error 7 2.11 0.30 Total 9 886.90 Source DF Seq SS x1 1 666.04 x2 1 218.76 DATOSMISMIS EX1334 Probabilidad_Mendenhall_13.indd 590Probabilidad_Mendenhall_13.indd 590 5/14/10 8:20:40 AM5/14/10 8:20:40 AM www.FreeLibros.me a. Interprete R2 y comente sobre el ajuste del modelo. b. ¿Hay evidencia para indicar que el modelo contribuye de manera significativa a la predicción de y al nivel de significancia de a � .01? c. ¿Cuál es la ecuación de predicción que relacione ŷ y x1 cuando x2 � 4? d. Use la ecuación de predicción ajustada para predecir el número de piezas defectuosas producidas por un operador cuya producción promedio por hora es 25, cuya máquina ha recibido servicio hace tres semanas. e. ¿Qué nos dicen las gráficas residuales acerca de la validez de las suposiciones de regresión? y 0.1 0.3 0.5 0.8 1.2 1.8 2.5 3.4 x 1 2 3 4 5 6 7 8 Los datos se ajustaron usando el modelo cuadrático, E(y) � b0 � b1x � b2x 2, con los siguientes resultados. 99 95 90 80 70 60 50 40 30 20 10 5 1 �1.0 �0.5 0.0 0.5 1.0 Residual Gráfica normal de probabilidad de los residuales (la respuesta es y) P or ce nt aj e 0.050 0.25 0.00 �0.25 �0.50 �0.75 0 5 10 15 20 25 30 Valor ajustado Valores residuales contra los ajustados (la respuesta es y) R es id ua l 13.35 Corrosión de metal y ácidos del suelo En una investigación para determinar la relación entre el grado de corrosión de metal y el tiempo que el metal se exponga a la acción de ácidos del suelo, el porcentaje de corrosión y tiempo de exposición se midieron semanalmente. DATOSMISMIS EX1335 a. ¿Qué porcentaje de la variación total es explicada por la regresión cuadrática de y en x? b. ¿La regresión en x y x2 es significativa al nivel de significancia de a � .05? c. ¿El coeficiente de regresión lineal es significativo cuando x2 está en el modelo? d. ¿El coeficiente de regresión cuadrática es significativo cuando x está en el modelo? e. Los datos se ajustaron a un modelo lineal sin el término cuadrático con los resultados que siguen. ¿Qué se puede decir acerca de la contribución del término cuadrático cuando está incluido en el modelo? Análisis de regresión: y contra x, x-sq The regression equation is y = 0.196 - 0.100 x + 0.0619 x-sq Predictor Coef SE Coef T P Constant 0.19643 0.07395 2.66 0.045 x -0.10000 0.03770 -2.65 0.045 x-sq2 0.061905 0.004089 15.14 0.000 S = 0.0530049 R-Sq = 99.9% R-Sq(adj) = 99.8% Analysis of Variance Source DF SS MS F P Regression 2 9.4210 4.7105 1676.61 0.000 Residual Error 5 0.0140 0.0028 Total 7 9.4350 Source DF Seq SS x 1 8.7771 x-sq 1 0.6438 Análisis de regresión: y contra x The regression equation is y = -0.732 + 0.457 x Predictor Coef SE Coef T P Constant -0.7321 0.2580 -2.84 0.030 x 0.45714 0.05109 8.95 0.000 S = 0.331124 R-Sq = 93.0% R-Sq(adj) = 91.9% Analysis of Variance Source DF SS MS F P Regression 1 8.7771 8.7771 80.05 0.000 Residual Error 6 0.6579 0.1096 Total 7 9.4350 f. La gráfica de los residuales del modelo de regre- sión lineal en el inciso e) muestra un modelo específico. ¿Cuál es el término del modelo que parece estar faltando? EJERCICIOS SUPLEMENTARIOS ❍ 591 Probabilidad_Mendenhall_13.indd 591Probabilidad_Mendenhall_13.indd 591 5/14/10 8:20:40 AM5/14/10 8:20:40 AM www.FreeLibros.me
Compartir