Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
12.2 MODELO PROBABILÍSTICO LINEAL SIMPLE ❍ 505 La primera parte de la ecuación, a � bx, llamada recta de medias, describe el valor promedio de y para un valor determinado de x. El componente de error e permite que cada respuesta individual y se desvíe de la recta de medias en una pequeña cantidad. Para usar este modelo probabilístico para hacer inferencias, es necesario ser más específi co acerca de esta “pequeña cantidad”, e. SUPOSICIONES ACERCA DEL ERROR ALEATORIO e Suponga que los valores de e satisfacen estas condiciones: • Son independientes en el sentido probabilístico • Tienen una media de 0 y una varianza común igual a s2 • Tienen una distribución normal de probabilidad Estas suposiciones acerca del error aleatorio e se muestran en la fi gura 12.3 para tres valores fi jos de x, por ejemplo x1, x2 y x3. Observe la similitud entre estas suposiciones y las suposiciones necesarias para las pruebas en los capítulos 10 y 11. Repasaremos estas suposiciones más adelante en este capítulo y daremos algunas herramientas de diagnós- tico para que usted las use al verifi car la validez de ellas. 100 90 80 70 60 50 20 30 40 50 60 70 80 Puntos C al if ic ac ió n FIGURA 12.2 Gráfi ca de dispersión de datos de la tabla 12.1 ● x y x1 x2 x3 FIGURA 12.3 Modelo probabilístico lineal ● Probabilidad_Mendenhall_12.indd 505Probabilidad_Mendenhall_12.indd 505 5/14/10 8:37:38 AM5/14/10 8:37:38 AM www.FreeLibros.me 506 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN Recuerde que este modelo está creado para una población de mediciones que por lo general es desconocida, pero puede usar información muestral para estimar los valores de a y b, que son los coefi cientes de la recta de medias, E(y) � a � bx. Estas estimacio- nes se usan para formar la recta de mejor ajuste para un conjunto de datos determinado, llamado recta de mínimos cuadrados o recta de regresión. En la siguiente sección repasamos la forma de calcular el punto de cruce y la pendiente de esta recta. EL MÉTODO DE MÍNIMOS CUADRADOS El procedimiento estadístico para hallar la recta de mejor ajuste para un conjunto de datos bivariados hace, matemáticamente, lo que en forma visual se realiza cuando se mueve una regla hasta que se hayan reducido al mínimo las distancias verticales o desviaciones, de la regla a un conjunto de puntos. La fórmula de la recta de mejor ajuste es ŷ � a � bx donde a y b son las estimaciones de los parámetros a y b de punto de cruce y pendiente, respectivamente. La recta ajustada para los datos de la tabla 12.1 se muestra en el applet Method of Least Squares (Método de mínimos cuadrados), fi gura 12.4. Las rectas ver- ticales rojas (azul claro en la fi gura 12.4) trazadas de la recta de predicción a cada punto (xi, yi) representan las desviaciones de los puntos desde la recta. 12.3 FIGURA 12.4 Applet Method of Least Squares ● Para reducir al mínimo las distancias desde los puntos a la recta ajustada, se puede usar el principio de mínimos cuadrados. PRINCIPIO DE MÍNIMOS CUADRADOS La recta que reduce al mínimo la suma de cuadrados de las desviaciones de los valo- res observados de y desde los pronosticados es la recta de mejor ajuste. La suma del cuadrado de las desviaciones por lo general se denomina suma de cuadrados de error (SSE) y se defi ne como SSE � S( yi � ŷi) 2 � S( yi � a � bxi) 2 pendiente � coefi ciente de x. cruce con eje y � término constante. CONSEJOMIMI Probabilidad_Mendenhall_12.indd 506Probabilidad_Mendenhall_12.indd 506 5/14/10 8:37:38 AM5/14/10 8:37:38 AM www.FreeLibros.me 12.3 EL MÉTODO DE MÍNIMOS CUADRADOS ❍ 507 Observe la recta de regresión y los puntos de la fi gura 12.4. SSE es la suma del cuadrado de las distancias representada por el área de los cuadros amarillos (azul claro en la fi gura 12.4). Hallar los valores de a y b, las estimaciones de a y b, usa cálculo diferencial, que está fuera del propósito de este libro. En lugar de derivar sus valores, simplemente pre- sentaremos fórmulas para calcular los valores de a y b, llamados estimadores de míni- mos cuadrados de a y b. Usaremos una notación que está basada en las sumas de cuadrados para las variables del problema de regresión, que es semejante en forma a las sumas de cuadrados empleadas en el capítulo 11. Estas fórmulas se ven diferentes de las fórmulas presentadas en el capítulo 3, pero en realidad son idénticas desde el punto de vista del álgebra. Usted debe usar el método de entrada de datos para su calculadora científi ca para introducir los datos muestrales. • Si su calculadora tiene sólo una función estadística de una variable, todavía puede ahorrar tiempo al hallar las sumas necesarias y sumas de cuadrados. • Si su calculadora tiene una función estadística de dos variables o si tiene una calculadora grafi cadora, la calculadora en forma automática guarda todas las sumas y sumas de cuadradas, así como los valores de a, b y el coefi ciente de correlación r. • Asegúrese de consultar el manual de su calculadora para hallar la forma más fácil de obtener los estimadores de mínimos cuadrados. ESTIMADORES DE MÍNIMOS CUADRADOS DE a Y b b � Sxy ___ Sxx y a � y� � bx� donde las cantidades Sxy y Sxx están defi nidas como Sxy � S(xi � x�)( yi � y�) � Sxiyi � (Sxi)(Syi) ________ n y Sxx � S(xi � x�) 2 � Sx 2i � (Sxi) 2 _____ n Observe que la suma de cuadrados de los valores x se encuentra usando la fórmula de cómputo dada en la sección 2.3 y la suma de los productos cruz es el numerador de la covarianza defi nida en la sección 3.4. Encuentre la recta de predicción de mínimos cuadrados para los datos de la califi cación en cálculo de la tabla 12.1. Solución Use los datos de la tabla 12.2 y el método de introducción de datos en su calculadora científi ca para hallar las siguientes sumas de cuadrados: Sxx � Sx 2 i � (Sxi) 2 _____ n � 23 634 � (460)2 ______ 10 � 2474 Sxy � Sxiyi � (Sxi)(Syi) ________ n � 36 854 � (460)(760) _________ 10 � 1894 y� � Syi ___ n � 760 ____ 10 � 76 x� � Syi ___ n � 460 ____ 10 � 46 E J E M P L O 12.1 Probabilidad_Mendenhall_12.indd 507Probabilidad_Mendenhall_12.indd 507 5/14/10 8:37:38 AM5/14/10 8:37:38 AM www.FreeLibros.me 12 REGRESIÓN LINEAL Y CORRELACIÓN 12.3 El método de mínimos cuadrados
Compartir