Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
526 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN 12.34 Laptops y aprendizaje, otra vez Consulte los datos dados en el ejercicio 12.25. La salida impresa MINITAB se reproduce aquí. Análisis de regresión: y versus x The regression equation is y = -26.8 + 1.26 x Predictor Coef SE Coef T P Constant -26.82 14.76 -1.82 0.086 x 1.2617 0.1685 7.49 0.000 S = 7.61912 R-Sq = 75.7% R-Sq(adj) = 74.3% Analysis of Variance Source DF SS MS F P Regression 1 3254.0 3254.0 56.05 0.000 Residual Error 18 1044.9 58.1 Total 19 4299.0 a. ¿Qué suposiciones deben hacerse acerca de la distribución del error aleatorio, 6? b. ¿Cuál es la mejor estimación de s2, la varianza del error aleatorio, 6? c. Use las gráfi cas de diagnóstico para estos datos para comentar sobre la validez de las suposiciones de regresión. 99 95 90 80 70 60 50 40 30 20 10 5 1 �20 �10 0 10 20 Residual Gráfica normal de probabilidad de los residuales (la respuesta es y) P or ce nt aj e 20 10 0 �10 �20 60 70 80 90 100 Valor ajustado Residuales versus los valores ajustados (la respuesta es y) R es id ua l 12.35 Televisores de alta defi nición En el ejercicio 3.19, Consumer Reports dio los precios para los 10 mejores televisores de pantalla de cristal líquido y alta defi nición (HDTVs), en la categoría de 30 a 40 pulgadas: ¿el precio de uno de éstos depende del tamaño de la pantalla? La tabla siguiente muestra los 10 costos otra vez, junto con el tamaño de la pantalla en pulgadas.7 Marca Precio Tamaño JVC LT-40FH96 $2900 40 Sony Bravia KDL-V32XBR1 1800 32 Sony Bravia KDL-V40XBR1 2600 40 Toshiba 37HLX95 3000 37 Sharp Aquos LC-32DA5U 1300 32 Sony Bravia KLV-S32A10 1500 32 Panasonic Viera TC-32LX50 1350 32 JVC LT-37X776 2000 37 LG 37LP1D 2200 37 Samsung LN-R328W 1200 32 ¿El precio de un HDTV depende del tamaño de la pantalla? Imagine que suponemos que la relación entre x y y es lineal, y efectuamos una regresión lineal, que resulta en un valor de r2 � .787. a. ¿Qué dice el valor de r2 acerca de la fuerza de la relación entre precio y tamaño de pantalla? b. La gráfi ca residual para estos datos, generada por MINITAB, se muestra a continuación. ¿Esta gráfi ca revela algún resultado atípico en el conjunto de datos? Si es así, ¿cuál punto es el resultado atípico? 800 600 400 200 0 �200 �400 Residuales versus valores ajustados (la respuesta es Precio) R es id ua l 1500 1750 2000 2250 2500 2750 3000 Valor ajustado c. Grafi que los valores de x y y usando una gráfi ca de dispersión. ¿Esta gráfi ca confi rma las sospechas del inciso b)? ¿Cuál HDTV representa el resultado atípico? ¿Es ésta una medición defectuosa que debe eliminarse del conjunto de datos? Explique. DATOSMISMIS EX1235 Probabilidad_Mendenhall_12.indd 526Probabilidad_Mendenhall_12.indd 526 5/14/10 8:37:40 AM5/14/10 8:37:40 AM www.FreeLibros.me 12.7 ESTIMACIÓN Y PREDICCIÓN USANDO LA RECTA AJUSTADA ❍ 527 ESTIMACIÓN Y PREDICCIÓN USANDO LA RECTA AJUSTADA Ahora que usted ha • probado y ajustado la recta de regresión, ŷ � a � bx, para asegurarse que es útil para predicción y • empleado las herramientas de diagnóstico para asegurarse que ninguna de las suposiciones de regresión han sido violadas está listo para usar la recta para uno de sus dos propósitos: • Estimar el valor promedio de y para un valor determinado de x • Predecir un valor particular de y para un valor determinado de x La muestra de n pares de observaciones han sido seleccionados de una población en la que el valor promedio de y está relacionado con el valor de la variable de pronóstico x por la recta de medias, E(y) � a � bx una recta desconocida, que se muestra como recta interrumpida en la fi gura 12.12. Recuerde que para un valor fi jo de x, por ejemplo x0, los valores particulares de y se des- vían desde la recta de medias. Estos valores de y se supone que tienen una distribución normal con media igual a a � bx0 y varianza s 2, como se ve en la fi gura 12.12. 12.7 x y x = x0 Recta de medias E(y) = α + βx FIGURA 12.12 Distribución de y para x � x0 ● Como los valores calculados de a y b varían de una muestra a otra, cada nueva mues- tra produce una diferente recta de regresión ŷ � a � bx, que se puede usar ya sea para estimar la recta de medias o para predecir un valor particular de y. La fi gura 12.13 mues- tra una de las posibles confi guraciones de la recta ajustada (azul), la recta de medias desconocida (gris), y un valor particular de y (el punto azul). Probabilidad_Mendenhall_12.indd 527Probabilidad_Mendenhall_12.indd 527 5/14/10 8:37:40 AM5/14/10 8:37:40 AM www.FreeLibros.me 528 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN ¿A qué distancia estará nuestro estimador ŷ � a � bx0 desde la cantidad a estimar o predecir? Esto depende, como siempre, de la variabilidad de nuestro estimador, medido por su error estándar. Se puede demostrar que ŷ � a � bx0 el valor estimado de y cuando x � x0, es un estimador insesgado de la recta de medias, a � bx0 y que ŷ está normalmente distribuida con el error estándar de ŷ estimado por SE( ŷ) � � __________________ MSE� 1 __ n � (x0 � x� ) 2 ________ Sxx � La estimación y prueba están basadas en la estadística t � ŷ � E(y) ________ SE(ŷ) que tiene una distribución t con (n � 2) grados de libertad. Para formar un intervalo de confi anza (1 � a)100% para el valor promedio de y cuando x � x0, medido por la recta de medios, a � bx0, se puede usar la forma usual para un intervalo de confi anza basado en la distribución t: ŷ � ta/2SE( ŷ) No obstante, si se escoge predecir un valor particular de y cuando x � x0, hay algún error adicional en la predicción debido a la desviación de y desde la recta de medias. Si examinamos la fi gura 12.13, se puede ver que el error en predicción tiene dos compo- nentes: • El error al usar la recta ajustada para estimar la recta de medias • El error causado por la desviación de y desde la recta de medias, medida por s2 La varianza de la diferencia entre y y ŷ es la suma de estas dos varianzas y forma la base para el error estándar de ( y � ŷ) empleado para predicción: SE(y � ŷ) � � ______________________ MSE 1 � 1 __ n � (x0 � x� ) 2 ________ Sxx � y el intervalo de predicción (1 � a)100% se forma como ŷ � ta/2SE( y � ŷ) x y x0 Valor real de y que se trata de predecir Error de estimar E(y) y = a + bx E(y) = α + βx Valor que se predice de y FIGURA 12.13 Error al estimar E (y) y predecir y ● Para un valor determinado de x, el intervalo de predicción es siempre más ancho que el intervalo de confi anza. CONSEJOMIMI Probabilidad_Mendenhall_12.indd 528Probabilidad_Mendenhall_12.indd 528 5/14/10 8:37:41 AM5/14/10 8:37:41 AM www.FreeLibros.me 12 REGRESIÓN LINEAL Y CORRELACIÓN 12.7 Estimación y predicción usando la recta ajustada
Compartir