Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-178

¡Estudia con miles de materiales!

Vista previa del material en texto

508 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN
Entonces
b � 
Sxy ___ 
 Sxx
 � 1894 _____ 2474
 � .76556 y a � y� � bx� � 76 � (.76556)(46) � 40.78424
La recta de regresión de mínimos cuadrados es entonces
ŷ � a � bx � 40.78424 � .76556x
La gráfi ca de esta recta se ve en la fi gura 12.4. Ahora se puede usar para predecir y para 
un valor determinado de x, ya sea consultando la fi gura 12.4 o sustituyendo el valor 
apropiado de x en la ecuación. Por ejemplo, si un alumno de primer año obtuvo x � 50 
en el examen, la califi cación pronosticada de cálculo del estudiante es (usando precisión 
completa de decimales)
ŷ � a � b(50) � 40.78424 � (.76556)(50) � 79.06
TABLA 12.1 
●
 Cálculos para los datos de la tabla 12.1
 yi xi x 2i xiyi y 2i
 65 39 1521 2535 4225
 78 43 1849 3354 6084
 52 21 441 1092 2704
 82 64 4096 5248 6724
 92 57 3249 5244 8464
 89 47 2209 4183 7921
 73 28 784 2044 5329
 98 75 5625 7350 9604
 56 34 1156 1904 3136
 75 52 2704 3900 5625
Suma 760 460 23 634 36 854 59 816
Se puede predecir y para 
un valor determinado de x 
al sustituir x en la ecuación 
para hallar ŷ.
CONSEJOMIMI
¿Cómo estar seguro que mis cálculos son correctos?
• Tenga cuidado con los errores de redondeo. Lleve al menos seis cifras signifi cati-
vas y haga redondeo sólo al informar el resultado fi nal.
• Use una calculadora científi ca o grafi cadora para hacer todo el trabajo. Casi todas 
las calculadoras calcularán los valores de a y b si se le introducen correctamente 
los datos.
• Use un programa de computadora si tiene acceso a ella.
• Siempre grafi que los datos y la recta. Si la recta no se ajusta a los puntos, ¡es 
probable que el usuario tenga un error!
ENTRENADOR PERSONALMIMI
APPLETMIMI
Se puede usar el applet Method of Least Squares (Método de mínimos cuadrados) 
para hallar los valores de a y b que determinan la recta de mejor ajuste, ŷ � a � bx. 
La recta horizontal que se ve en la recta y � y�. Use el mouse de su PC para arrastrar 
la recta y vea que cambia el tamaño de los cuadros amarillos. El problema es hacer el 
SSE, el área total de los cuadros amarillos (azul claro en la fi gura 12.4) tan pequeña 
como sea posible. El valor de SSE es la parte roja de la barra a la izquierda del applet 
(azul oscuro en la fi gura 12.4) marcada SSE � . Cuando usted piense que ha 
reducido el SSE al mínimo, haga clic en el botón y ¡vea qué bien lo hizo!
Probabilidad_Mendenhall_12.indd 508Probabilidad_Mendenhall_12.indd 508 5/14/10 8:37:38 AM5/14/10 8:37:38 AM
 www.FreeLibros.me
 12.4 UN ANÁLISIS DE VARIANZA PARA REGRESIÓN LINEAL ❍ 509
UN ANÁLISIS DE VARIANZA 
PARA REGRESIÓN LINEAL
En el capítulo 11 utilizamos el análisis de procedimientos de varianza para dividir la 
variación total del experimento en partes atribuidas a diversos factores de interés para el 
experimentador. En un análisis de regresión, la respuesta y está relacionada con la varia-
ble independiente x. En consecuencia, la variación total de la variable de respuesta y, 
dada por
SS Total � Syy � S(yi � y�)
2 � Sy 2i � 
(Syi)
2
 _____ n 
está dividida en dos partes:
• La SSR (suma de cuadrados para regresión) mide la cantidad de variación expli-
cada al usar la recta de regresión con una variable independiente x
• La SSE (suma de cuadrados de error) mide la variación “residual” en los datos 
que no está explicada por la variable independiente x
de modo que
SS Total � SSR � SSE
Para un valor particular de la respuesta yi, se puede visualizar este desglose en la varia-
ción usando las distancias verticales ilustradas en la fi gura 12.5. Se puede ver que la SSR 
es la suma del cuadrado de desviaciones de las diferencias entre la respuesta estimada 
usando x ( y�) y la respuesta estimada usando x (la recta de regresión, ŷ); la SSE es la 
suma del cuadrado de diferencias entre la recta de regresión (ŷ) y el punto y.
No es demasiado difícil demostrar algebraicamente que
SSR � S( ŷi � y�i)
2 � S(a � bxi � y�)
2 � S( y� � bx� � bxi � y�)
2 � b2S(xi � x�)
2
 � � (Sxy)
 
 ____ 
Sxx
 �
2
Sxx � 
(Sxy)
2 
 _____ 
Sxx
 
Como SS Total � SSR � SSE, se puede completar la partición al calcular
SSE � SS Total � SSR � Syy � 
(Sxy)
2 
 _____ 
Sxx
 
FIGURA 12.5
Desviaciones desde la 
recta ajustada
●
20 30 40 50 60 70 80
 50
 60
 70
 80
 90
100
x
G
ra
d
e
y = 40.7842 + 0.76556x
Score
y
SSE
SSR
^
{
}
C
al
ifi
 c
ac
ió
n
Puntos
12.4
Probabilidad_Mendenhall_12.indd 509Probabilidad_Mendenhall_12.indd 509 5/14/10 8:37:38 AM5/14/10 8:37:38 AM
 www.FreeLibros.me
510 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN
Recuerde del capítulo 11 que cada una de las diversas fuentes de variación, cuando se 
dividen entre los grados de libertad apropiados, da una estimación de la variación del 
experimento. Estas estimaciones se denominan mínimos cuadrados, MS � SS/df, y se 
ven en una tabla ANOVA.
Al examinar los grados de libertad asociados con cada una de estas sumas de cuadra-
dos, observe que el total de grados de libertad para n mediciones es (n � 1). Como la 
estimación de la recta de regresión, ŷ � a � bxi � y� � bx� � bxi, abarca la estimación 
de un parámetro adicional b, hay un grado de libertad asociado con la SSR, dejando 
(n � 2) grados de libertad con la SSE.
Al igual que con todas las tablas ANOVA que hemos estudiado, el error medio cua-
drático
MSE � s 2 � SSE _____ 
n � 2
 
es un estimador insesgado de la varianza fundamental s2. El análisis de la tabla de 
varianza se ve en la tabla 12.3.
Para los datos de la tabla 12.1, se puede calcular
SS Total � Syy � Sy
2
i � 
(Syi)
2
 _____ n � 59 816 � 
(760)2
 ______ 
10
 � 2056
 SSR � 
(Sxy)
2
 _____ 
Sxx
 � 
(1894)2
 _______ 
2474
 � 1449.9741
de modo que
SSE � SS Total � SSR � 2056 � 1449.9741 � 606.0259
y
MSE � SSE _____ 
n � 2
 � 606.0259 ________ 
8
 � 75.7532
El análisis de la tabla de varianza, parte de la salida de regresión lineal generada por 
el MINITAB, es la sección inferior sombreada de la salida de computadora de la fi gura 
12.6. Las primeras dos rectas dan la ecuación de la recta de mínimos cuadrados, ŷ � 40.8 
� .766x. Las estimaciones de mínimos cuadrados a y b están dadas con mayor precisión 
en la columna marcada “Coef”. Se pueden hallar instrucciones para generar esta salida 
impresa en la sección “Mi MINITAB ” al fi nal de este capítulo.
TABLA 12.3 
●
 Análisis de varianza para regresión lineal
Fuente df SS MS
Regresión 1 
(Sxy)2 ____ 
 Sxx
 MSR
Error n � 2 Syy � 
(Sxy)2 ____ 
 Sxx
 MSE
Total n � 1 Syy
Probabilidad_Mendenhall_12.indd 510Probabilidad_Mendenhall_12.indd 510 5/14/10 8:37:38 AM5/14/10 8:37:38 AM
 www.FreeLibros.me
	12 REGRESIÓN LINEAL Y CORRELACIÓN
	12.4 Un análisis de varianza para regresión lineal

Continuar navegando