Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-184

¡Estudia con miles de materiales!

Vista previa del material en texto

526 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN
12.34 Laptops y aprendizaje, otra vez Consulte 
los datos dados en el ejercicio 12.25. La salida impresa 
MINITAB se reproduce aquí.
Análisis de regresión: y versus x
The regression equation is
y = -26.8 + 1.26 x
Predictor Coef SE Coef T P
Constant -26.82 14.76 -1.82 0.086
x 1.2617 0.1685 7.49 0.000
S = 7.61912 R-Sq = 75.7% R-Sq(adj) = 74.3%
Analysis of Variance
Source DF SS MS F P
Regression 1 3254.0 3254.0 56.05 0.000
Residual Error 18 1044.9 58.1
Total 19 4299.0
a. ¿Qué suposiciones deben hacerse acerca de la 
distribución del error aleatorio, 6?
b. ¿Cuál es la mejor estimación de s2, la varianza del 
error aleatorio, 6?
c. Use las gráfi cas de diagnóstico para estos datos para 
comentar sobre la validez de las suposiciones de 
regresión.
99
95
90
80
70
60
50
40
30
20
10
5
1
 �20 �10 0 10 20
Residual
Gráfica normal de probabilidad de los residuales
(la respuesta es y)
P
or
ce
nt
aj
e
20
10
0
�10
�20
 60 70 80 90 100
Valor ajustado
Residuales versus los valores ajustados
(la respuesta es y)
R
es
id
ua
l
12.35 Televisores de alta defi nición En el 
ejercicio 3.19, Consumer Reports dio los precios 
para los 10 mejores televisores de pantalla de cristal 
líquido y alta defi nición (HDTVs), en la categoría de 30 
a 40 pulgadas: ¿el precio de uno de éstos depende del 
tamaño de la pantalla? La tabla siguiente muestra 
los 10 costos otra vez, junto con el tamaño de la pantalla 
en pulgadas.7
Marca Precio Tamaño
JVC LT-40FH96 $2900 40
Sony Bravia KDL-V32XBR1 1800 32
Sony Bravia KDL-V40XBR1 2600 40
Toshiba 37HLX95 3000 37
Sharp Aquos LC-32DA5U 1300 32
Sony Bravia KLV-S32A10 1500 32
Panasonic Viera TC-32LX50 1350 32
JVC LT-37X776 2000 37
LG 37LP1D 2200 37
Samsung LN-R328W 1200 32
¿El precio de un HDTV depende del tamaño de la 
pantalla? Imagine que suponemos que la relación entre 
x y y es lineal, y efectuamos una regresión lineal, que 
resulta en un valor de r2 � .787.
a. ¿Qué dice el valor de r2 acerca de la fuerza de la 
relación entre precio y tamaño de pantalla?
b. La gráfi ca residual para estos datos, generada por 
MINITAB, se muestra a continuación. ¿Esta gráfi ca 
revela algún resultado atípico en el conjunto de datos? 
Si es así, ¿cuál punto es el resultado atípico?
800
600
400
200
0
�200
�400
Residuales versus valores ajustados
(la respuesta es Precio)
R
es
id
ua
l
1500 1750 2000 2250 2500 2750 3000
Valor ajustado
c. Grafi que los valores de x y y usando una gráfi ca de 
dispersión. ¿Esta gráfi ca confi rma las sospechas 
del inciso b)? ¿Cuál HDTV representa el resultado 
atípico? ¿Es ésta una medición defectuosa que debe 
eliminarse del conjunto de datos? Explique.
DATOSMISMIS
EX1235
Probabilidad_Mendenhall_12.indd 526Probabilidad_Mendenhall_12.indd 526 5/14/10 8:37:40 AM5/14/10 8:37:40 AM
 www.FreeLibros.me
 12.7 ESTIMACIÓN Y PREDICCIÓN USANDO LA RECTA AJUSTADA ❍ 527
ESTIMACIÓN Y PREDICCIÓN USANDO 
LA RECTA AJUSTADA
Ahora que usted ha
• probado y ajustado la recta de regresión, ŷ � a � bx, para asegurarse que es útil 
para predicción y
• empleado las herramientas de diagnóstico para asegurarse que ninguna de las 
suposiciones de regresión han sido violadas
está listo para usar la recta para uno de sus dos propósitos:
• Estimar el valor promedio de y para un valor determinado de x
• Predecir un valor particular de y para un valor determinado de x
La muestra de n pares de observaciones han sido seleccionados de una población en la 
que el valor promedio de y está relacionado con el valor de la variable de pronóstico x 
por la recta de medias,
E(y) � a � bx
una recta desconocida, que se muestra como recta interrumpida en la fi gura 12.12. 
Recuerde que para un valor fi jo de x, por ejemplo x0, los valores particulares de y se des-
vían desde la recta de medias. Estos valores de y se supone que tienen una distribución 
normal con media igual a a � bx0 y varianza s
2, como se ve en la fi gura 12.12.
12.7
x
y
x = x0
Recta de medias 
E(y) = α + βx
FIGURA 12.12
Distribución de y para 
x � x0
●
Como los valores calculados de a y b varían de una muestra a otra, cada nueva mues-
tra produce una diferente recta de regresión ŷ � a � bx, que se puede usar ya sea para 
estimar la recta de medias o para predecir un valor particular de y. La fi gura 12.13 mues-
tra una de las posibles confi guraciones de la recta ajustada (azul), la recta de medias 
desconocida (gris), y un valor particular de y (el punto azul).
Probabilidad_Mendenhall_12.indd 527Probabilidad_Mendenhall_12.indd 527 5/14/10 8:37:40 AM5/14/10 8:37:40 AM
 www.FreeLibros.me
528 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN
¿A qué distancia estará nuestro estimador ŷ � a � bx0 desde la cantidad a estimar o 
predecir? Esto depende, como siempre, de la variabilidad de nuestro estimador, medido 
por su error estándar. Se puede demostrar que
ŷ � a � bx0
el valor estimado de y cuando x � x0, es un estimador insesgado de la recta de medias, 
a � bx0 y que ŷ está normalmente distribuida con el error estándar de ŷ estimado por
SE( ŷ) � �
__________________
 MSE� 1 __ n � (x0 � x� )
2
 ________ 
Sxx
 � 
La estimación y prueba están basadas en la estadística
t � 
ŷ � E(y)
 ________ 
SE(ŷ)
 
que tiene una distribución t con (n � 2) grados de libertad.
Para formar un intervalo de confi anza (1 � a)100% para el valor promedio de y 
cuando x � x0, medido por la recta de medios, a � bx0, se puede usar la forma usual para 
un intervalo de confi anza basado en la distribución t:
ŷ � ta/2SE( ŷ)
No obstante, si se escoge predecir un valor particular de y cuando x � x0, hay algún 
error adicional en la predicción debido a la desviación de y desde la recta de medias. Si 
examinamos la fi gura 12.13, se puede ver que el error en predicción tiene dos compo-
nentes:
• El error al usar la recta ajustada para estimar la recta de medias
• El error causado por la desviación de y desde la recta de medias, medida por s2
La varianza de la diferencia entre y y ŷ es la suma de estas dos varianzas y forma la base 
para el error estándar de ( y � ŷ) empleado para predicción:
SE(y � ŷ) � �
______________________
 MSE
1 � 1 __ n � (x0 � x� )
2
 ________ 
Sxx
 � 
y el intervalo de predicción (1 � a)100% se forma como
ŷ � ta/2SE( y � ŷ)
x
y
x0
Valor real de y que se 
trata de predecir
Error de 
estimar 
E(y)
y = 
a + 
bx
E(y) =
 α + βx
Valor que se predice de y
FIGURA 12.13
Error al estimar E (y) 
y predecir y
●
Para un valor determinado de 
x, el intervalo de predicción 
es siempre más ancho que el 
intervalo de confi anza.
CONSEJOMIMI
Probabilidad_Mendenhall_12.indd 528Probabilidad_Mendenhall_12.indd 528 5/14/10 8:37:41 AM5/14/10 8:37:41 AM
 www.FreeLibros.me
	12 REGRESIÓN LINEAL Y CORRELACIÓN
	12.7 Estimación y predicción usando la recta ajustada

Continuar navegando