Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
para asegurarse que no haya grandes violaciones de las suposiciones de regresión. Estas gráficas, que se comportan como se esperaba para un modelo bien ajustado, se ven en la figura 13.14. † Si desea determinar que los datos dan sufi ciente evidencia para indicar que los profesores empiezan con salarios más altos, probaría H0: b2 � 0 contra la hipótesis alternativa Ha : b2 � 0. Consulte el ejemplo 13.6. ¿Los datos dan suficiente evidencia para indicar que la tasa anual de aumento, en salarios de profesores jóvenes, es mayor que la tasa anual de aumento en salarios de profesoras jóvenes? Es decir, ¿los datos dan suficiente evidencia para indicar que la pendiente de la recta de salarios de profesores es mayor que la pen- diente de la recta de salarios de profesoras? Solución Como b3 mide la diferencia en pendientes, las pendientes de las dos rectas serán idénticas si b3 � 0. Por tanto, se desea probar la hipótesis nula H0 : b3 � 0 esto es, las pendientes de las dos rectas son idénticas, contra la hipótesis alternativa Ha : b3 � 0 esto es, la pendiente de la recta de salarios de profesores es mayor que la pendiente de la recta de salarios de profesoras. El valor calculado de t correspondiente a b3, que se ve en el renglón marcada “x1x2” en la figura 13.12, es 2.99. Como la salida MINITAB de regresión da valores p para dos pruebas de significancia de dos colas, el valor p en la salida impresa, .017, es el doble de lo que sería para una prueba de una cola. Para esta prueba de una cola, el valor p es .017/2 � .0085 y la hipótesis nula es rechazada. Hay suficiente evidencia para in- dicar que la tasa anual de aumento en salarios de profesores excede de la tasa para mujeres.† E J E M P L O 13.7 FIGURA 13.14 Gráfi cas residuales MINITAB para el ejemplo 13.6 Residual Gráfica normal de probabilidad de los residuales (la respuesta es y) P or ce nt aj e 4003002001000�100�200�300�400�500 99 95 90 80 70 60 50 40 30 20 10 5 1 300 200 100 0 �100 �200 �300 59 000 60 000 61 000 62 000 63 000 64 000 65 000 66 000 Valor ajustado Residuales contra los valores ajustados (la respuesta es y) R es id ua l ● 13.5 USO DE VARIABLES PREDICTORAS CUANTITATIVAS Y CUALITATIVAS EN UN MODELO DE REGRESIÓN ❍ 571 Probabilidad_Mendenhall_13.indd 571Probabilidad_Mendenhall_13.indd 571 5/14/10 8:20:38 AM5/14/10 8:20:38 AM www.FreeLibros.me 572 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE TÉCNICAS BÁSICAS 13.17 Rendimiento en producción Suponga que se desea predecir el rendimiento en producción y como función de varias variables independientes de predicción. Indique si cada una de las siguientes variables independientes es cualitativa o cuantitativa. Si es cualitativa, defi na la(s) variable(s) fi cticia(s) apropiada(s). a. La tasa de interés prevaleciente en la región b. El precio por libra de un artículo empleado en el proceso de producción c. La planta (A, B o C) en la que se mide el rendimiento en producción d. El tiempo que la máquina de producción haya estado en operación e. El turno (de noche o de día) en el que se mide el rendimiento 13.18 Suponga que E(y) está relacionada con dos variables predictoras x1 y x2 por la ecuación E(y) � 3 � x1 � 2x2 � x1x2 a. Grafique la relación entre E(y) y x1 cuando x2 � 0. Repita para x2 � 2 y para x2 � �2. b. Repita las instrucciones del inciso a) para el modelo E(y) � 3 � x1 � 2x2 c. Observe que la ecuación para el inciso a) es exac- tamente igual que la ecuación del inciso b), excepto que hemos agregado el término x1x2. ¿En qué forma la adición del término x1x2 afecta las gráficas de las tres rectas? d. ¿Qué flexibilidad se agrega al modelo de primer orden E(y) � b0 � b1x1 � b2x2 por la adición del término b3x1x2, usando el modelo E(y) � b0 � b1x1 � b2x2 � b3x1x2? 13.19 Un modelo de regresión lineal múltiple que contiene una variable independiente cualitativa y una cuantitativa produjo esta ecuación de predicción: ŷ � 12.6 � .54x1 � 1.2x1x2 � 3.9x 2 2 a. ¿Cuál de las dos variables es la cuantitativa? Explique. b. Si x1 puede tomar sólo los valores 0 o 1, encuentre las dos posibles ecuaciones de predicción para este experimento. c. Grafique las dos ecuaciones halladas en el inciso b). Compare las formas de las dos curvas. APLICACIONES 13.20 Menos carne roja Los estadounidenses alardean de que intentan mejorar su bienestar personal “comiendo bien y ejercitándose más”. Un cambio deseable en la dieta es reducir la ingesta de carne roja y sustituir el pollo por pescado. Unos investigadores dieron seguimiento al consumo de carne roja y de pollo, y (en libras anuales por persona) y encontraron que el consumo de carne roja disminuyó y el de pollo aumentó en un periodo de siete años. En la tabla siguiente se ve un resumen de sus datos. Año Carne roja Pollo 1 85 37 2 89 36 3 76 47 4 76 47 5 68 62 6 67 74 7 60 79 Considere ajustar el siguiente modelo, que toma en cuenta ajustar simultáneamente dos rectas de regresión lineal simples: E(y) � b0 � b1x1 � b2x2 � b3x1x2 donde y es el consumo anual de carne (roja o de pollo) por persona, 1 si carne roja x1 � � y x2 � año 0 si pollo Salida impresa MINITAB para el ejercicio 13.20 EJERCICIOS13.5 DATOSMISMIS EX1320 Análisis de regresión: y contra x1, x2, x1x2 The regression equation is y = 23.6 + 69.0 x1 + 7.75 x2 - 12.3 x1x2 Predictor Coef SE Coef T P Constant 23.571 3.522 6.69 0.000 x1 69.000 4.981 13.85 0.000 x2 7.7500 0.7875 9.84 0.000 x1x2 -12.286 1.114 -11.03 0.000 S = 4.16705 R-Sq = 95.4% R-Sq(adj) = 94.1% Analysis of Variance Source DF SS MS F P Regression 3 3637.9 1212.6 69.83 0.000 Residual Error 10 173.6 17.4 Total 13 3811.5 Source DF Seq SS x1 1 1380.1 x2 1 144.6 x1x2 1 2113.1 Predicted Values for New Observations New Obs Fit SE Fit 95% CI 95% PI 1 56.29 3.52 (48.44, 64.13) (44.13, 68.44) Values of Predictors for New Observations New Obs x1 x2 x1x2 1 1.00 8.00 8.00 Probabilidad_Mendenhall_13.indd 572Probabilidad_Mendenhall_13.indd 572 5/14/10 8:20:38 AM5/14/10 8:20:38 AM www.FreeLibros.me a. ¿Qué tan bien ajusta el modelo? Use cualesquiera estadísticas relevantes y herramientas de diagnóstico de la salida impresa para contestar esta pregunta. b. Escriba las ecuaciones de las dos rectas que describen la tendencia en consumo durante el periodo de 7 años, para carne roja y para pollo. c. Use la ecuación de predicción para hallar una estimación puntual del promedio de consumo de carne roja por persona en el año 8. Compare este valor con el valor marcado “ajuste” de la salida impresa. d. Use la salida impresa para hallar un intervalo de confianza de 95% para el promedio de consumo de carne roja por persona en el año 8. ¿Cuál es el intervalo de predicción de 95% para el consumo de carne roja por persona en el año 8? ¿Hay algún problema con la validez del nivel de confianza de 95% para estos intervalos? 13.21 Algodón contra pepinos En el ejercicio 11.65 utilizamos el análisis del procedimiento de varianza, para analizar un experimento factorial de 2 � 3, en el que cada combinación de factor � nivel se repitió cinco veces. El experimento contenía el número de huevos puestos por moscas blancas enjauladas sobre dos plantas diferentes, a tres niveles diferentes de temperatura. Supongamos que varias de las moscas blancas murieron antes de completar el experimento, de modo que el número de repeticiones ya no fue el mismo para cada tratamiento. El análisis de fórmulas de varianza del capítulo 11 ya no se puede usar, pero el experimento puede ser analizado usando un análisis de regresión múltiple. Los resultados de este experimentofactorial de 2 � 3 con repeticiones iguales se muestran en la tabla siguiente. Algodón Pepino 70° 77° 82° 70° 77° 82° 37 34 46 50 59 43 21 54 32 53 53 62 36 40 41 25 31 71 43 42 37 69 49 31 48 51 a. Escriba un modelo para analizar este experimento. Asegúrese de incluir un término para la interacción entre planta y temperatura. b. Use un paquete de software para efectuar el análisis de regresión múltiple. c. ¿Los datos dan suficiente evidencia para indicar que el efecto de temperatura en el número de huevos puestos es diferente dependiendo del tipo de planta? d. Con base en los resultados del inciso c), ¿sugiere usted reajustar un modelo diferente? Si es así, vuelva a correr el análisis de regresión usando el nuevo modelo y analice la salida impresa. e. Escriba un párrafo que resuma los resultados de sus análisis. 13.22 Califi caciones de rendimiento III El Índice de Rendimiento Académico (API), descrito en el ejercicio 12.11, es una medida del rendimiento escolar con base en los resultados del Examen de Rendimiento Stanford 9. Las califi caciones del API para ocho escuelas elementales en el condado de Riverside, California, se muestran a continuación junto con varias variables independientes más.5 Escuela Califi cación API y Premios x1 % de comidas x2 1 588 Sí 58 2 659 No 62 3 710 Sí 66 4 657 No 36 5 669 No 40 6 641 No 51 7 557 No 73 8 743 Sí 22 99 95 90 80 70 60 50 40 30 20 10 5 1 �10 �5 0 5 10 Residual Gráfica normal de probabilidad de los residuales (la respuesta es y) P or ce nt aj e 5.0 2.5 0.0 �2.5 �5.0 �7.5 30 40 50 60 70 80 90 Valor ajustado Residuales contra los valores ajustados (la respuesta es y) R es id ua l Gráfi cas MINITAB de diagnóstico para el ejercicio 13.20 DATOSMISMIS EX1321 DATOSMISMIS EX1322 13.5 USO DE VARIABLES PREDICTORAS CUANTITATIVAS Y CUALITATIVAS EN UN MODELO DE REGRESIÓN ❍ 573 Probabilidad_Mendenhall_13.indd 573Probabilidad_Mendenhall_13.indd 573 5/14/10 8:20:38 AM5/14/10 8:20:38 AM www.FreeLibros.me 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE 13.5 Uso de variables predictoras cuantitativas y cualitativas en un modelo de regresión Ejercicios
Compartir