Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-205

¡Estudia con miles de materiales!

Vista previa del material en texto

f. ¿Hay otras conclusiones importantes que usted sienta 
que no se consideraron respecto a la ecuación de 
predicción ajustada?
13.30 El costo de volar ¿El costo de un 
vuelo en avión depende de la aerolínea y de la 
distancia recorrida? En el ejercicio 12.21, exploramos 
la primera parte de este problema. Los datos mostra-
dos en esta tabla comparan el costo promedio y distancia 
recorrida para dos líneas aéreas diferentes, medidas para 
11 rutas aéreas de gran movimiento en Estados Unidos.7
Ruta Distancia Costo Aerolínea
Chicago-Detroit 238 148 American
 164 United
Chicago-Denver 901 256 American
 312 United
Chicago-St. Louis 262 136 American
 152 United
Chicago-Seattle 1736 424 American
 520 United
Chicago-Cleveland 301 129 American
 139 United
Los Angeles-Chicago 1757 361 American
 473 United
Chicago-Atlanta 593 162 American
 183 United
Nueva York-Los Angeles 2463 444 American
 525 United
Nueva York-Chicago 714 287 American
 334 United
Los Angeles-Honolulu 2556 323 American
 333 United
Nueva York-San Francisco 2574 513 American
 672 United
Use un paquete de computadora para analizar los 
datos con un análisis de regresión múltiple. Comente 
sobre el ajuste del modelo, las variables signifi cativas, 
cualesquiera interacciones que existan y suposiciones 
de regresión que puedan haber sido violadas. Resuma 
sus resultados en un informe, incluyendo salidas 
impresas y gráfi cas si posible.
13.31 En camino otra vez Hasta fechas 
recientes, las llantas de alto rendimiento se 
ajustaban principalmente en vehículos deportivos o de 
lujo. Ahora se han convertido en estándar en muchos 
sedanes de uso diario. Los mayores niveles de manejo y 
agarre al pavimento han aparecido a expensas del desgaste 
en el dibujo o superfi cie de rodamiento. Los datos que 
siguen se han resumido de un informe, sobre llantas 
de alto rendimiento de clasifi cación H por Consumer 
Reports8, en el que se evaluaron varios aspectos del 
rendimiento para n � 22 llantas diferentes y fueron:
 y � puntuación general x1 � frenado en seco
x2 � frenado en húmedo x3 � manejo
x4 � resistencia al rodamiento x5 � duración del dibujo
DATOSMISMIS
EX1330
DATOSMISMIS
EX1331
Llanta Costo y x1 x2 x3 x4 x5
Dunlop® SP Sport 5000 81 85 5 5 4 4 4
Michelin® Pilot Exalto A/S 78 83 5 5 4 3 4
Falken® Ziex ZE 512 56 83 5 5 4 3 2
Continental® ContiProContact 77 81 4 5 4 4 2
Michelin Pilot XGT H4 98 81 5 5 4 1 2
Bridgestone® Potenza RE 950 80 80 5 5 4 2 2
BFGoodrich® Traction T/A 68 78 5 5 4 2 3
Yokohama® Avid H4s 62 77 5 5 4 3 4
Sumitomo® HTR H4 56 76 5 5 3 2 1
Bridgestone HP50 79 75 4 5 4 2 1
Michelin Energy MXV4 Plus 103 73 3 4 4 5 5
Goodyear® Assurance Triple Tred 85 72 3 4 3 3 5
Kumho Solus KH16 49 72 4 4 4 3 5
Pirelli® P6 Four Seasons 71 70 3 4 3 2 2
Bridgestone Potenza G009 62 70 4 4 4 2 2
Dayton® Daytona HR 46 69 4 4 3 2 2
Fuzion® HRi 49 69 4 4 4 1 2
Continental ContiPremierContact 91 68 3 4 4 5 5
Cooper® Lifeliner Touring SLE 61 65 3 3 3 2 2
Bridgestone Turanza EL400 91 63 3 3 4 2 2
Hankook® Optimo H418 51 62 3 2 3 3 4
General Exclaim 53 50 2 2 3 2 2
Las variables x1 a la x5 están codifi cadas usando la escala 
de 5 � excelente, 4 � muy buena, 3 � buena, 2 � regular 
y 1 � mala.
a. Use un programa de su elección para hallar la matriz 
de correlación para las variables bajo estudio, que 
incluya costo. ¿El costo está significativamente 
correlacionado con cualquiera de las variables de 
estudio? ¿Cuáles variables parecen estar altamente 
correlacionadas con y, la puntuación total?
b. Escriba un modelo para describir y, la puntuación 
total, como función de las variables x1 � frenado en 
seco, x2 � frenado en húmedo, x3 � manejo, x4 � 
resistencia al rodamiento y x5 � duración del dibujo.
c. Use un programa de regresión de su elección para 
ajustar el modelo completo usando todas las variables 
predictoras. ¿Qué proporción de la variación en y está 
explicada por regresión? ¿Esto comunica la impresión 
de que el modelo explica en forma adecuada la 
variabilidad inherente en y?
d. ¿Cuál variable o variables parecen ser buenas 
variables predictoras de y? ¿Cómo podría refinarse 
el modelo en vista de estos resultados? Use estas 
variables para reajustar el modelo. ¿Qué proporción de 
la variación es explicada por este modelo reajustado? 
Comente sobre lo adecuado de este modelo reducido 
en comparación con el modelo completo.
13.32 Atunes Los datos sobre atunes del 
ejercicio 11.16 se analizaron como un diseño 
completamente aleatorizado con cuatro tratamientos. 
No obstante, también podríamos ver el diseño 
experimental como un experimento factorial de 2 � 2 
DATOSMISMIS
EX1332
 EJERCICIOS SUPLEMENTARIOS ❍ 589
Probabilidad_Mendenhall_13.indd 589Probabilidad_Mendenhall_13.indd 589 5/14/10 8:20:40 AM5/14/10 8:20:40 AM
 www.FreeLibros.me
590 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE
con repeticiones desiguales. Los datos se muestran 
a continuación.9
 Aceite Agua
Atún claro 2.56 .62 .99 1.12
 1.92 .66 1.92 .63
 1.30 .62 1.23 .67
 1.79 .65 .85 .69
 1.23 .60 .65 .60
 .67 .53 .60
 1.41 .66
Atún blanco 1.27 1.49 1.29
 1.22 1.29 1.00
 1.19 1.27 1.27
 1.22 1.35 1.28
Fuente: Estudio práctico “Tuna Goes Upscale” Copyright 2001 por Consumers Union of U.S. 
Inc., Yonkers, NY 10703-1057, organización sin fi nes de lucro. Reimpreso con permiso de la 
edición de junio de 2001 de Consumer Reports® sólo para fi nes educativos. No se permite 
uso comercial ni reproducción. www.ConsumerReports.org
Los datos se pueden analizar usando el modelo
y � b0 � b1x1 � b2x2 � b3x1x2 � e
donde
 x1 � 0 si en aceite, 1 si en agua
 x2 � 0 si atún claro, 1 si atún blanco
a. Demuestre cómo introduciría los datos en una hoja de 
trabajo de computadora, introduciendo los datos en las 
columnas para y, x1, x2 y x1x2.
b. La salida impresa generada por MINITAB se muestra 
a continuación. ¿Cuál es la ecuación de predicción 
de mínimos cuadrados?
Salida impresa MINITAB para el ejercicio 13.32
13.33 Atún, continúa Consulte el ejercicio 13.32. 
La hipótesis probada en el capítulo 11, que el promedio 
de precios para los cuatro tipos de atún es igual, es 
equivalente a decir que E(y) no cambiará cuando x1 y x2 
cambien. Esto puede ocurrir sólo cuando b1 � b2 � 
b3 � 0. Use la salida impresa MINITAB para la ANOVA 
de una vía que se muestra a continuación para efectuar la 
prueba de igualdad de medias de tratamiento. Verifi que 
que esta prueba sea idéntica a la prueba para regresión 
signifi cativa del ejercicio 13.32.
Salida impresa MINITAB para el ejercicio 13.33
Análisis de regresión: y contra x1, x2, x1x2
The regression equation is
y = 1.15 - 0.251 x1 + 0.078 x2 + 0.306 x1x2
Predictor Coef SE Coef T P
Constant 1.1473 0.1370 8.38 0.000
x1 -0.2508 0.1830 -1.37 0.180
x2 0.0777 0.2652 0.29 0.771
x1x2 0.3058 0.3330 0.92 0.365
S = 0.454287 R-Sq = 11.9% R-Sq(adj) = 3.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 0.9223 0.3074 1.49 0.235
Residual Error 33 6.8104 0.2064
Total 36 7.7328
c. ¿Hay interacción entre el tipo de atún y el tipo de 
líquido de empaque?
d. ¿Cuál, si lo hay, de los principales efectos (tipo de 
atún y tipo de líquido de empaque) aporta información 
significativa para la predicción de y?
e. ¿Qué tan bien se ajusta el modelo a los datos? 
Explique.
ANOVA de una vía: claro en agua, blanco en aceite, 
blanco en agua, claro en aceite
Source DF SS MS F P
Factor 3 0.922 0.307 1.49 0.235
Error 33 6.810 0.206
Total 36 7.733
S = 0.4543 R-Sq = 11.93% R-Sq(adj) = 3.92%
13.34 Control de calidad Un fabricante 
registró el número de piezas defectuosas (y) 
producidas en un día determinado por cada uno de 10 
operadores de máquinas y también registró la producción 
promedio por hora (x1) por cada operadory el tiempo en 
semanas desde el último servicio a una máquina (x2).
y x1 x2
13 20 3.0
 1 15 2.0
11 23 1.5
 2 10 4.0
20 30 1.0
15 21 3.5
27 38 0
 5 18 2.0
26 24 5.0
 1 16 1.5
La salida impresas que sigue resultó cuando estos datos 
se analizaron usando el paquete MINITAB usando el 
modelo:
 E(y) � b0 � b1x1 � b2x2
Análisis de regresión: y contra x1, x2
The regression equation is
y = -28.4 + 1.46 x1 + 3.84 x2
Predictor Coef SE Coef T P
Constant -28.3906 0.8273 -34.32 0.000
x1 1.46306 0.02699 -54.20 0.000
x2 3.8446 0.1426 26.97 0.000
S = 0.548433 R-Sq = 99.8% R-Sq(adj) = 99.7%
Analysis of Variance
Source DF SS MS F P
Regression 2 884.79 442.40 1470.84 0.000
Residual Error 7 2.11 0.30
Total 9 886.90
Source DF Seq SS
x1 1 666.04
x2 1 218.76
DATOSMISMIS
EX1334
Probabilidad_Mendenhall_13.indd 590Probabilidad_Mendenhall_13.indd 590 5/14/10 8:20:40 AM5/14/10 8:20:40 AM
 www.FreeLibros.me
a. Interprete R2 y comente sobre el ajuste del modelo.
b. ¿Hay evidencia para indicar que el modelo contribuye 
de manera significativa a la predicción de y al nivel de 
significancia de a � .01?
c. ¿Cuál es la ecuación de predicción que relacione ŷ 
y x1 cuando x2 � 4?
d. Use la ecuación de predicción ajustada para 
predecir el número de piezas defectuosas producidas 
por un operador cuya producción promedio por hora 
es 25, cuya máquina ha recibido servicio hace tres 
semanas.
e. ¿Qué nos dicen las gráficas residuales acerca de la 
validez de las suposiciones de regresión?
y 0.1 0.3 0.5 0.8 1.2 1.8 2.5 3.4
x 1 2 3 4 5 6 7 8
Los datos se ajustaron usando el modelo cuadrático, 
E(y) � b0 � b1x � b2x
2, con los siguientes resultados.
99
95
90
80
70
60
50
40
30
20
10
5
1
 �1.0 �0.5 0.0 0.5 1.0
Residual
Gráfica normal de probabilidad de los residuales
(la respuesta es y)
P
or
ce
nt
aj
e
0.050
0.25
0.00
�0.25
�0.50
�0.75
 0 5 10 15 20 25 30
Valor ajustado
Valores residuales contra los ajustados 
(la respuesta es y)
R
es
id
ua
l
13.35 Corrosión de metal y ácidos del 
suelo En una investigación para determinar 
la relación entre el grado de corrosión de metal y el 
tiempo que el metal se exponga a la acción de ácidos del 
suelo, el porcentaje de corrosión y tiempo de exposición 
se midieron semanalmente.
DATOSMISMIS
EX1335
a. ¿Qué porcentaje de la variación total es explicada por 
la regresión cuadrática de y en x?
b. ¿La regresión en x y x2 es significativa al nivel de 
significancia de a � .05?
c. ¿El coeficiente de regresión lineal es significativo 
cuando x2 está en el modelo?
d. ¿El coeficiente de regresión cuadrática es significativo 
cuando x está en el modelo?
e. Los datos se ajustaron a un modelo lineal sin el 
término cuadrático con los resultados que siguen. 
¿Qué se puede decir acerca de la contribución del 
término cuadrático cuando está incluido en el modelo?
Análisis de regresión: y contra x, x-sq
The regression equation is
y = 0.196 - 0.100 x + 0.0619 x-sq
Predictor Coef SE Coef T P
Constant 0.19643 0.07395 2.66 0.045
x -0.10000 0.03770 -2.65 0.045
x-sq2 0.061905 0.004089 15.14 0.000
S = 0.0530049 R-Sq = 99.9% R-Sq(adj) = 99.8%
Analysis of Variance
Source DF SS MS F P
Regression 2 9.4210 4.7105 1676.61 0.000
Residual Error 5 0.0140 0.0028
Total 7 9.4350
Source DF Seq SS
x 1 8.7771
x-sq 1 0.6438
Análisis de regresión: y contra x
The regression equation is
y = -0.732 + 0.457 x
Predictor Coef SE Coef T P
Constant -0.7321 0.2580 -2.84 0.030
x 0.45714 0.05109 8.95 0.000
S = 0.331124 R-Sq = 93.0% R-Sq(adj) = 91.9%
Analysis of Variance
Source DF SS MS F P
Regression 1 8.7771 8.7771 80.05 0.000
Residual Error 6 0.6579 0.1096
Total 7 9.4350
f. La gráfica de los residuales del modelo de regre-
sión lineal en el inciso e) muestra un modelo 
específico. ¿Cuál es el término del modelo que 
parece estar faltando?
 EJERCICIOS SUPLEMENTARIOS ❍ 591
Probabilidad_Mendenhall_13.indd 591Probabilidad_Mendenhall_13.indd 591 5/14/10 8:20:40 AM5/14/10 8:20:40 AM
 www.FreeLibros.me

Continuar navegando