Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
532 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN guías para comprar. El tiempo necesario para tomar una decisión se registró para 15 participantes en el estudio de investigación de mercado. Tiempo para decisión, y (segundos) 5, 8, 8, 7, 9 7, 9, 8, 9, 10 10, 11, 10, 12, 9 Número de alternativas, x 2 3 4 a. Encuentre la recta de mínimos cuadrados apropiada para estos datos. b. Grafi que los puntos y grafi que la recta como prueba en sus cálculos. c. Calcule s2. d. ¿Los datos dan sufi ciente evidencia para indicar que la duración está linealmente relacionada con el número de diseños alternativos de paquete? (Pruebe al nivel de signifi cancia de a � .05.) e. Encuentre el valor p aproximado para la prueba e interprete su valor. f. Si están disponibles, examine las gráfi cas de diagnóstico para verifi car la validez de las suposiciones de regresión. g. Estime el promedio de tiempo necesario para llegar a una decisión cuando se presenten tres alternativas, usando un intervalo de confi anza de 95%. 12.39 Precios de vivienda Si una persona trata de rentar un departamento o comprar una casa, encuentra que los vendedores fi jan rentas y precios de casas con base en la superfi cie en pies cuadrados de espacio con calefacción. Los datos de la tabla siguiente dan la superfi cie y precios de venta de n � 12 casas seleccionadas al azar de las vendidas en una ciudad pequeña. Use la salida impresa MINITAB para contestar las preguntas. Pies cuadrados, x Precio, y Pies cuadrados, x Precio, y 1460 $288 700 1977 $305 400 2108 309 300 1610 297 000 1743 301 400 1530 292 400 1499 291 100 1759 298 200 1864 302 400 1821 304 300 2391 314 900 2216 311 700 Gráfi ca de datos para el ejercicio 12.39 315 000 310 000 305 000 300 000 295 000 290 000 1500 1600 1700 1800 1900 2000 2100 2200 2300 2400 x (Pies cuadrados) y (P re ci o) Salida impresa MINITAB para el Ejercicio 12.39 Análisis de regresión: y versus x The regression equation is y = 251206 + 27.4 x Predictor Coef SE Coef T P Constant 251206 3389 74.13 0.000 x 27.406 1.828 14.99 0.000 S = 1792.72 R-Sq = 95.7% R-Sq(adj) = 95.3% Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 299989 526 (298817, 301161) (295826, 304151) 2 306018 602 (304676, 307360) (301804, 310232) Values of Predictors for New Observations New Obs x 1 1780 2 2000 a. ¿Se puede ver algún patrón que no sea una relación lineal en la gráfi ca original? b. El valor de r2 para estos datos es .957. ¿Qué nos dice esto acerca del ajuste de la recta de regresión? c. Vea las siguientes gráfi cas de diagnóstico para estos datos. ¿Se ve algún patrón en los residuales? ¿Esto sugiere que la relación entre precio y pies cuadrados es algo que no sea lineal? Salida impresa MINITAB para el ejercicio 12.39 99 95 90 80 70 60 50 40 30 20 10 5 1 �5000 �4000 �3000 �2000 �1000 0 1000 2000 3000 4000 Residual Gráfica normal de probabilidad de los residuales (la respuesta es y) P or ce nt aj e 3000 2000 1000 0 �1000 �2000 �3000 290,000 295,000 300,000 305,000 310,000 315,000 320,000 Valor ajustado Residuales contra valores ajustados (la respuesta es y) R es id ua l DATOSMISMIS EX1239 Probabilidad_Mendenhall_12.indd 532Probabilidad_Mendenhall_12.indd 532 5/14/10 8:37:41 AM5/14/10 8:37:41 AM www.FreeLibros.me 12.8 ANÁLISIS DE CORRELACIÓN ❍ 533 12.40 Precios de vivienda II Consulte el ejercicio 12.39 y el conjunto de datos EX1239. a. Estime el promedio de incremento en el precio para un aumento de 1 pie cuadrado para casas vendidas en la ciudad. Use un intervalo de confi anza de 99%. Interprete su estimación. b. Un vendedor de bienes raíces necesita estimar el promedio de precio de venta de casas con un total de 2000 pies cuadrados de espacio con calefacción. Use un intervalo de confi anza de 95% e interprete su estimación. c. Calcule el precio por pie cuadrado para cada casa y luego calcule la media muestral. ¿Por qué esta estimación del promedio de costo por pie cuadrado no es igual a la respuesta del inciso a)? ¿Debe ser igual? Explique. d. Suponga que una casa con 1780 pies cuadrados de espacio con calefacción se ofrece a la venta. Construya un intervalo de predicción de 95% para el precio al cual se venderá la casa. 12.41 Fresas III Los datos siguientes (ejercicios 12.16 y 12.24) se obtuvieron en un experimento que relacionaba la variable dependiente, y (textura de fresas), con x (temperatura de almacenamiento codifi cada). x �2 �2 0 2 2 y 4.0 3.5 2.0 0.5 0.0 a. Estime la textura esperada de fresas para una temperatura de almacenamiento codifi cada de x � �1. Use un intervalo de confi anza de 99%. b. Prediga el valor particular de y cuando x � 1 con un intervalo de predicción de 99%. c. ¿A qué valor de x permanecerá mínimo el ancho del intervalo de predicción para un valor particular de y, suponiendo que n permanece fi ja? 12.42 Tom Brady El número de pases completos y el número total de yardas pasadas para Tom Brady, mariscal de campo de los Patriotas de Nueva Inglaterra, se registraron en los 16 juegos regulares de la temporada de fútbol de 2006.8 En la semana 6 no se jugó y no hay datos reportados. Semana Completos Total yardas 1 11 163 2 15 220 3 31 320 4 15 188 5 16 140 6 * * 7 18 195 8 29 372 9 20 201 10 24 253 11 20 244 12 22 267 13 27 305 14 12 78 15 16 109 16 28 249 a. ¿Cuál es la recta de mínimos cuadrados que relaciona el total de yardas pasadas con el número de pases completos para Tom Brady? b. ¿Qué proporción de la variación total está explicada por la regresión de total de yardas pasadas (y) en el número de pases completos (x)? c. Si las hay, examine las gráfi cas de dispersión para comprobar la validez de las suposiciones de regresión. 12.43 Tom Brady, continúa Consulte el ejercicio 12.42. a. Estime el número promedio de yardas pasadas para juegos en los que Brady lanza 20 pases completos, usando un intervalo de confi anza de 95%. b. Prediga el número real de yardas pasadas para juegos en los que Brady lanza 20 pases completos usando un intervalo de confi anza de 95%. c. ¿Sería aconsejable usar la recta de mínimos cuadrados del ejercicio 12.42 para predecir el número total de yardas pasadas de Brady, para un juego en el que lanzó sólo 5 pases completos? Explique. DATOSMISMIS EX1242 ANÁLISIS DE CORRELACIÓN En el capítulo 3 introdujimos el coefi ciente de correlación como medida de la fuerza de la relación lineal entre dos variables. El coefi ciente de correlación, r, formalmente deno- minado coefi ciente de correlación muestral de momento de producto de Pearson, se defi ne a continuación. 12.8 Probabilidad_Mendenhall_12.indd 533Probabilidad_Mendenhall_12.indd 533 5/14/10 8:37:41 AM5/14/10 8:37:41 AM www.FreeLibros.me 534 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN COEFICIENTE DE CORRELACIÓN DE MOMENTO DE PRODUCTO DE PEARSON r � sxy ___ sxsy � sxy ____ sxxsyy para �1 r 1 Las varianzas y covarianza se pueden hallar por cálculo directo, con el uso de una calcu- ladora con capacidad de estadística de dos variables, o usando un paquete de estadística como el MINITAB. Las varianzas y covarianza se calculan como sxy � sxy _____ n � 1 s 2x � sxx _____ n � 1 s 2y � syy _____ n � 1 y use Sxy, Sxx y Syy, las mismas cantidades empleadas en análisis de regresión en este capítulo. En general, cuando una muestra de n individuos o unidades experimentales se selecciona y dos variables se miden en cada individuo o unidad, de modo que ambas variables sean aleatorias, el coefi ciente de correlación r es la medida apropiada de linealidad para usar en esta situación. Las estaturas y pesos de n � 10 jugadores atacantes de fútbol se seleccionan al azar deun equipo de estrellas de un condado. Calcule el coefi ciente de correlación para las esta- turas (en pulgadas) y pesos (en libras) dado en la tabla 12.4. r está siempre entre �1 y �1. CONSEJOMIMI E J E M P L O 12.7 Solución Debe usarse el método apropiado de entrada de datos de su calculadora científi ca para verifi car los cálculos para las sumas de cuadrados y productos cruz, Sxy � 328 Sxx � 60.4 Syy � 2610 usando las fórmulas de cálculo dadas antes en este capítulo. Entonces r � 328 _____________ � ___________ (60.4)(2610) � .8261 o sea r � .83. Este valor de r es más bien cercano a 1, el máximo valor posible de r, que indica una relación lineal positiva bastante fuerte entre estatura y peso. Hay una relación directa entre las fórmulas de cálculo para el coefi ciente de correla- ción r y la pendiente de la recta de regresión b. Como el numerador de ambas cantidades es Sxy, tanto r como b tienen el mismo signo. Por tanto, el coefi ciente de correlación tie- ne estas propiedades generales: • Cuando r � 0, la pendiente es b � 0 y no hay relación lineal entre x y y. • Cuando r es positiva, b también es positiva y hay una relación lineal positiva entre x y y. TABLA 12.4 ● Estaturas y pesos de n � 10 estrellas profundos Jugador Estatura, x Peso, y 1 73 185 2 71 175 3 75 200 4 72 210 5 72 190 6 75 195 7 67 150 8 69 170 9 71 180 10 69 175 El signo de r es siempre igual que el signo de la pendiente b. CONSEJOMIMI Probabilidad_Mendenhall_12.indd 534Probabilidad_Mendenhall_12.indd 534 5/14/10 8:37:41 AM5/14/10 8:37:41 AM www.FreeLibros.me 12 REGRESIÓN LINEAL Y CORRELACIÓN 12.8 Análisis de correlación
Compartir