Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
508 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN Entonces b � Sxy ___ Sxx � 1894 _____ 2474 � .76556 y a � y� � bx� � 76 � (.76556)(46) � 40.78424 La recta de regresión de mínimos cuadrados es entonces ŷ � a � bx � 40.78424 � .76556x La gráfi ca de esta recta se ve en la fi gura 12.4. Ahora se puede usar para predecir y para un valor determinado de x, ya sea consultando la fi gura 12.4 o sustituyendo el valor apropiado de x en la ecuación. Por ejemplo, si un alumno de primer año obtuvo x � 50 en el examen, la califi cación pronosticada de cálculo del estudiante es (usando precisión completa de decimales) ŷ � a � b(50) � 40.78424 � (.76556)(50) � 79.06 TABLA 12.1 ● Cálculos para los datos de la tabla 12.1 yi xi x 2i xiyi y 2i 65 39 1521 2535 4225 78 43 1849 3354 6084 52 21 441 1092 2704 82 64 4096 5248 6724 92 57 3249 5244 8464 89 47 2209 4183 7921 73 28 784 2044 5329 98 75 5625 7350 9604 56 34 1156 1904 3136 75 52 2704 3900 5625 Suma 760 460 23 634 36 854 59 816 Se puede predecir y para un valor determinado de x al sustituir x en la ecuación para hallar ŷ. CONSEJOMIMI ¿Cómo estar seguro que mis cálculos son correctos? • Tenga cuidado con los errores de redondeo. Lleve al menos seis cifras signifi cati- vas y haga redondeo sólo al informar el resultado fi nal. • Use una calculadora científi ca o grafi cadora para hacer todo el trabajo. Casi todas las calculadoras calcularán los valores de a y b si se le introducen correctamente los datos. • Use un programa de computadora si tiene acceso a ella. • Siempre grafi que los datos y la recta. Si la recta no se ajusta a los puntos, ¡es probable que el usuario tenga un error! ENTRENADOR PERSONALMIMI APPLETMIMI Se puede usar el applet Method of Least Squares (Método de mínimos cuadrados) para hallar los valores de a y b que determinan la recta de mejor ajuste, ŷ � a � bx. La recta horizontal que se ve en la recta y � y�. Use el mouse de su PC para arrastrar la recta y vea que cambia el tamaño de los cuadros amarillos. El problema es hacer el SSE, el área total de los cuadros amarillos (azul claro en la fi gura 12.4) tan pequeña como sea posible. El valor de SSE es la parte roja de la barra a la izquierda del applet (azul oscuro en la fi gura 12.4) marcada SSE � . Cuando usted piense que ha reducido el SSE al mínimo, haga clic en el botón y ¡vea qué bien lo hizo! Probabilidad_Mendenhall_12.indd 508Probabilidad_Mendenhall_12.indd 508 5/14/10 8:37:38 AM5/14/10 8:37:38 AM www.FreeLibros.me 12.4 UN ANÁLISIS DE VARIANZA PARA REGRESIÓN LINEAL ❍ 509 UN ANÁLISIS DE VARIANZA PARA REGRESIÓN LINEAL En el capítulo 11 utilizamos el análisis de procedimientos de varianza para dividir la variación total del experimento en partes atribuidas a diversos factores de interés para el experimentador. En un análisis de regresión, la respuesta y está relacionada con la varia- ble independiente x. En consecuencia, la variación total de la variable de respuesta y, dada por SS Total � Syy � S(yi � y�) 2 � Sy 2i � (Syi) 2 _____ n está dividida en dos partes: • La SSR (suma de cuadrados para regresión) mide la cantidad de variación expli- cada al usar la recta de regresión con una variable independiente x • La SSE (suma de cuadrados de error) mide la variación “residual” en los datos que no está explicada por la variable independiente x de modo que SS Total � SSR � SSE Para un valor particular de la respuesta yi, se puede visualizar este desglose en la varia- ción usando las distancias verticales ilustradas en la fi gura 12.5. Se puede ver que la SSR es la suma del cuadrado de desviaciones de las diferencias entre la respuesta estimada usando x ( y�) y la respuesta estimada usando x (la recta de regresión, ŷ); la SSE es la suma del cuadrado de diferencias entre la recta de regresión (ŷ) y el punto y. No es demasiado difícil demostrar algebraicamente que SSR � S( ŷi � y�i) 2 � S(a � bxi � y�) 2 � S( y� � bx� � bxi � y�) 2 � b2S(xi � x�) 2 � � (Sxy) ____ Sxx � 2 Sxx � (Sxy) 2 _____ Sxx Como SS Total � SSR � SSE, se puede completar la partición al calcular SSE � SS Total � SSR � Syy � (Sxy) 2 _____ Sxx FIGURA 12.5 Desviaciones desde la recta ajustada ● 20 30 40 50 60 70 80 50 60 70 80 90 100 x G ra d e y = 40.7842 + 0.76556x Score y SSE SSR ^ { } C al ifi c ac ió n Puntos 12.4 Probabilidad_Mendenhall_12.indd 509Probabilidad_Mendenhall_12.indd 509 5/14/10 8:37:38 AM5/14/10 8:37:38 AM www.FreeLibros.me 510 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN Recuerde del capítulo 11 que cada una de las diversas fuentes de variación, cuando se dividen entre los grados de libertad apropiados, da una estimación de la variación del experimento. Estas estimaciones se denominan mínimos cuadrados, MS � SS/df, y se ven en una tabla ANOVA. Al examinar los grados de libertad asociados con cada una de estas sumas de cuadra- dos, observe que el total de grados de libertad para n mediciones es (n � 1). Como la estimación de la recta de regresión, ŷ � a � bxi � y� � bx� � bxi, abarca la estimación de un parámetro adicional b, hay un grado de libertad asociado con la SSR, dejando (n � 2) grados de libertad con la SSE. Al igual que con todas las tablas ANOVA que hemos estudiado, el error medio cua- drático MSE � s 2 � SSE _____ n � 2 es un estimador insesgado de la varianza fundamental s2. El análisis de la tabla de varianza se ve en la tabla 12.3. Para los datos de la tabla 12.1, se puede calcular SS Total � Syy � Sy 2 i � (Syi) 2 _____ n � 59 816 � (760)2 ______ 10 � 2056 SSR � (Sxy) 2 _____ Sxx � (1894)2 _______ 2474 � 1449.9741 de modo que SSE � SS Total � SSR � 2056 � 1449.9741 � 606.0259 y MSE � SSE _____ n � 2 � 606.0259 ________ 8 � 75.7532 El análisis de la tabla de varianza, parte de la salida de regresión lineal generada por el MINITAB, es la sección inferior sombreada de la salida de computadora de la fi gura 12.6. Las primeras dos rectas dan la ecuación de la recta de mínimos cuadrados, ŷ � 40.8 � .766x. Las estimaciones de mínimos cuadrados a y b están dadas con mayor precisión en la columna marcada “Coef”. Se pueden hallar instrucciones para generar esta salida impresa en la sección “Mi MINITAB ” al fi nal de este capítulo. TABLA 12.3 ● Análisis de varianza para regresión lineal Fuente df SS MS Regresión 1 (Sxy)2 ____ Sxx MSR Error n � 2 Syy � (Sxy)2 ____ Sxx MSE Total n � 1 Syy Probabilidad_Mendenhall_12.indd 510Probabilidad_Mendenhall_12.indd 510 5/14/10 8:37:38 AM5/14/10 8:37:38 AM www.FreeLibros.me 12 REGRESIÓN LINEAL Y CORRELACIÓN 12.4 Un análisis de varianza para regresión lineal
Compartir