Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-186

¡Estudia con miles de materiales!

Vista previa del material en texto

532 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN
guías para comprar. El tiempo necesario para tomar una 
decisión se registró para 15 participantes en el estudio de 
investigación de mercado.
Tiempo para 
 decisión, y (segundos) 5, 8, 8, 7, 9 7, 9, 8, 9, 10 10, 11, 10, 12, 9
Número de 
 alternativas, x 2 3 4
a. Encuentre la recta de mínimos cuadrados apropiada 
para estos datos.
b. Grafi que los puntos y grafi que la recta como prueba en 
sus cálculos.
c. Calcule s2.
d. ¿Los datos dan sufi ciente evidencia para indicar que la 
duración está linealmente relacionada con el número 
de diseños alternativos de paquete? (Pruebe al nivel de 
signifi cancia de a � .05.)
e. Encuentre el valor p aproximado para la prueba e 
interprete su valor.
f. Si están disponibles, examine las gráfi cas de 
diagnóstico para verifi car la validez de las 
suposiciones de regresión.
g. Estime el promedio de tiempo necesario para llegar 
a una decisión cuando se presenten tres alternativas, 
usando un intervalo de confi anza de 95%.
12.39 Precios de vivienda Si una persona 
trata de rentar un departamento o comprar una 
casa, encuentra que los vendedores fi jan rentas y precios 
de casas con base en la superfi cie en pies cuadrados de 
espacio con calefacción. Los datos de la tabla siguiente 
dan la superfi cie y precios de venta de n � 12 casas 
seleccionadas al azar de las vendidas en una ciudad pequeña. 
Use la salida impresa MINITAB para contestar las preguntas.
Pies cuadrados, x Precio, y Pies cuadrados, x Precio, y
 1460 $288 700 1977 $305 400
 2108 309 300 1610 297 000
 1743 301 400 1530 292 400
 1499 291 100 1759 298 200
 1864 302 400 1821 304 300
 2391 314 900 2216 311 700
Gráfi ca de datos para el ejercicio 12.39
315 000
310 000
305 000
300 000
295 000
290 000
 1500 1600 1700 1800 1900 2000 2100 2200 2300 2400
x (Pies cuadrados)
y 
(P
re
ci
o)
Salida impresa MINITAB para el Ejercicio 12.39
Análisis de regresión: y versus x
The regression equation is
y = 251206 + 27.4 x
Predictor Coef SE Coef T P
Constant 251206 3389 74.13 0.000
x 27.406 1.828 14.99 0.000
S = 1792.72 R-Sq = 95.7% R-Sq(adj) = 95.3%
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 299989 526 (298817, 301161) (295826, 304151)
2 306018 602 (304676, 307360) (301804, 310232)
Values of Predictors for New Observations
New Obs x
1 1780
2 2000
a. ¿Se puede ver algún patrón que no sea una relación 
lineal en la gráfi ca original?
b. El valor de r2 para estos datos es .957. ¿Qué nos dice 
esto acerca del ajuste de la recta de regresión?
c. Vea las siguientes gráfi cas de diagnóstico para estos 
datos. ¿Se ve algún patrón en los residuales? ¿Esto 
sugiere que la relación entre precio y pies cuadrados 
es algo que no sea lineal?
Salida impresa MINITAB para el ejercicio 12.39
99
95
90
80
70
60
50
40
30
20
10
5
1
 �5000 �4000 �3000 �2000 �1000 0 1000 2000 3000 4000
Residual
Gráfica normal de probabilidad de los residuales
(la respuesta es y)
P
or
ce
nt
aj
e
3000
2000
1000
0
�1000
�2000
�3000
 290,000 295,000 300,000 305,000 310,000 315,000 320,000
Valor ajustado
Residuales contra valores ajustados
(la respuesta es y)
R
es
id
ua
l
DATOSMISMIS
EX1239
Probabilidad_Mendenhall_12.indd 532Probabilidad_Mendenhall_12.indd 532 5/14/10 8:37:41 AM5/14/10 8:37:41 AM
 www.FreeLibros.me
 12.8 ANÁLISIS DE CORRELACIÓN ❍ 533
12.40 Precios de vivienda II Consulte el ejercicio 
12.39 y el conjunto de datos EX1239.
a. Estime el promedio de incremento en el precio para 
un aumento de 1 pie cuadrado para casas vendidas 
en la ciudad. Use un intervalo de confi anza de 99%. 
Interprete su estimación.
b. Un vendedor de bienes raíces necesita estimar el 
promedio de precio de venta de casas con un total 
de 2000 pies cuadrados de espacio con calefacción. 
Use un intervalo de confi anza de 95% e interprete su 
estimación.
c. Calcule el precio por pie cuadrado para cada casa 
y luego calcule la media muestral. ¿Por qué esta 
estimación del promedio de costo por pie cuadrado no 
es igual a la respuesta del inciso a)? ¿Debe ser igual? 
Explique.
d. Suponga que una casa con 1780 pies cuadrados 
de espacio con calefacción se ofrece a la venta. 
Construya un intervalo de predicción de 95% para el 
precio al cual se venderá la casa.
12.41 Fresas III Los datos siguientes (ejercicios 
12.16 y 12.24) se obtuvieron en un experimento que 
relacionaba la variable dependiente, y (textura de fresas), 
con x (temperatura de almacenamiento codifi cada).
x �2 �2 0 2 2
y 4.0 3.5 2.0 0.5 0.0
a. Estime la textura esperada de fresas para una 
temperatura de almacenamiento codifi cada de 
x � �1. Use un intervalo de confi anza de 99%.
b. Prediga el valor particular de y cuando x � 1 con un 
intervalo de predicción de 99%.
c. ¿A qué valor de x permanecerá mínimo el ancho del 
intervalo de predicción para un valor particular de y, 
suponiendo que n permanece fi ja?
12.42 Tom Brady El número de pases 
completos y el número total de yardas pasadas 
para Tom Brady, mariscal de campo de los Patriotas 
de Nueva Inglaterra, se registraron en los 16 juegos 
regulares de la temporada de fútbol de 2006.8 En la 
semana 6 no se jugó y no hay datos reportados.
Semana Completos Total yardas
 1 11 163
 2 15 220
 3 31 320
 4 15 188
 5 16 140
 6 * *
 7 18 195
 8 29 372
 9 20 201
 10 24 253
 11 20 244
 12 22 267
 13 27 305
 14 12 78
 15 16 109
 16 28 249
a. ¿Cuál es la recta de mínimos cuadrados que relaciona 
el total de yardas pasadas con el número de pases 
completos para Tom Brady?
b. ¿Qué proporción de la variación total está explicada 
por la regresión de total de yardas pasadas (y) en el 
número de pases completos (x)?
c. Si las hay, examine las gráfi cas de dispersión para 
comprobar la validez de las suposiciones de regresión.
12.43 Tom Brady, continúa Consulte el ejercicio 
12.42.
a. Estime el número promedio de yardas pasadas para 
juegos en los que Brady lanza 20 pases completos, 
usando un intervalo de confi anza de 95%.
b. Prediga el número real de yardas pasadas para juegos 
en los que Brady lanza 20 pases completos usando un 
intervalo de confi anza de 95%.
c. ¿Sería aconsejable usar la recta de mínimos cuadrados 
del ejercicio 12.42 para predecir el número total de 
yardas pasadas de Brady, para un juego en el que 
lanzó sólo 5 pases completos? Explique.
DATOSMISMIS
EX1242
ANÁLISIS DE CORRELACIÓN
En el capítulo 3 introdujimos el coefi ciente de correlación como medida de la fuerza de 
la relación lineal entre dos variables. El coefi ciente de correlación, r, formalmente deno-
minado coefi ciente de correlación muestral de momento de producto de Pearson, se 
defi ne a continuación. 
12.8
Probabilidad_Mendenhall_12.indd 533Probabilidad_Mendenhall_12.indd 533 5/14/10 8:37:41 AM5/14/10 8:37:41 AM
 www.FreeLibros.me
534 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN
COEFICIENTE DE CORRELACIÓN DE MOMENTO 
DE PRODUCTO DE PEARSON
r � 
sxy ___ sxsy � 
sxy ____ sxxsyy para �1 	 r 	 1
Las varianzas y covarianza se pueden hallar por cálculo directo, con el uso de una calcu-
ladora con capacidad de estadística de dos variables, o usando un paquete de estadística 
como el MINITAB. Las varianzas y covarianza se calculan como
sxy � 
sxy _____ 
n � 1
 s 2x � 
sxx _____ 
n � 1
 s 2y � 
syy _____ 
n � 1
 
y use Sxy, Sxx y Syy, las mismas cantidades empleadas en análisis de regresión en este 
capítulo. En general, cuando una muestra de n individuos o unidades experimentales se 
selecciona y dos variables se miden en cada individuo o unidad, de modo que ambas 
variables sean aleatorias, el coefi ciente de correlación r es la medida apropiada de 
linealidad para usar en esta situación.
Las estaturas y pesos de n � 10 jugadores atacantes de fútbol se seleccionan al azar deun equipo de estrellas de un condado. Calcule el coefi ciente de correlación para las esta-
turas (en pulgadas) y pesos (en libras) dado en la tabla 12.4.
r está siempre entre 
�1 y �1.
CONSEJOMIMI
E J E M P L O 12.7
Solución Debe usarse el método apropiado de entrada de datos de su calculadora 
científi ca para verifi car los cálculos para las sumas de cuadrados y productos cruz,
Sxy � 328 Sxx � 60.4 Syy � 2610
usando las fórmulas de cálculo dadas antes en este capítulo. Entonces
r � 328 _____________ 
 �
___________
 (60.4)(2610) 
 � .8261
o sea r � .83. Este valor de r es más bien cercano a 1, el máximo valor posible de r, que 
indica una relación lineal positiva bastante fuerte entre estatura y peso.
Hay una relación directa entre las fórmulas de cálculo para el coefi ciente de correla-
ción r y la pendiente de la recta de regresión b. Como el numerador de ambas cantidades 
es Sxy, tanto r como b tienen el mismo signo. Por tanto, el coefi ciente de correlación tie-
ne estas propiedades generales:
• Cuando r � 0, la pendiente es b � 0 y no hay relación lineal entre x y y.
• Cuando r es positiva, b también es positiva y hay una relación lineal positiva 
entre x y y.
TABLA 12.4 
●
 Estaturas y pesos de n � 10 estrellas profundos
Jugador Estatura, x Peso, y
 1 73 185
 2 71 175
 3 75 200
 4 72 210
 5 72 190
 6 75 195
 7 67 150
 8 69 170
 9 71 180
 10 69 175
El signo de r es siempre 
igual que el signo de la 
pendiente b.
CONSEJOMIMI
Probabilidad_Mendenhall_12.indd 534Probabilidad_Mendenhall_12.indd 534 5/14/10 8:37:41 AM5/14/10 8:37:41 AM
 www.FreeLibros.me
	12 REGRESIÓN LINEAL Y CORRELACIÓN
	12.8 Análisis de correlación

Continuar navegando