Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
13.3 UN ANÁLISIS DE REGRESIÓN MÚLTIPLE ❍ 553 E J E M P L O 13.1 Observe que el modelo y suposiciones de regresión simple son muy semejantes al modelo y suposiciones empleados para regresión lineal. Es probable que no lo sorprenda el que los procedimientos de prueba y estimación también sean extensiones de los empleados en el capítulo 12. Los modelos de regresión simple son muy flexibles y pueden tomar muchas formas, dependiendo de la forma en que las variables independientes x1, x2, …, xk se introduzcan en el modelo. Empezamos con un simple modelo de regresión múltiple, explicando los conceptos y procedimientos básicos con un ejemplo. A medida que nos familiarice- mos con los procedimientos de regresión múltiple, aumentamos la complejidad de los ejem- plos y veremos que los mismos procedimientos se pueden usar para modelos de formas diferentes, dependiendo de la aplicación particular. Suponga que se desea relacionar una variable aleatoria y con dos variables independien- tes x1 y x2. El modelo de regresión múltiple es y � b0 � b1x1 � b2x2 � e con el valor medio de y dado como E(y) � b0 � b1x1 � b2x2 Esta ecuación es una extensión en tres dimensiones de la recta de medias del capítulo 12 y traza un plano en el espacio tridimensional (véase la figura 13.1). La constante b0 se denomina punto de cruce, que es el valor promedio de y cuando x1 y x2 son 0 ambas. Los coeficientes b1 y b2 se denominan pendientes parciales o coeficientes de regresión parciales. La pendiente parcial bi (para i � 1 o 2) mide el cambio en y para un cambio unitario en xi cuando todas las otras variables independientes se mantengan constantes. El valor del coeficiente de regresión parcial, por ejemplo b1, con x1 y x2 en el modelo generalmente no es igual que la pendiente cuando se ajuste una recta sólo con x1. Estos coeficientes son las constantes desconocidas, que deben ser estimadas usando datos muestrales para obtener la ecuación de predicción. En lugar de x y y grafi cadas en un espacio en dos dimensiones, y y x1, x2, …, xk tienen que grafi carse en (k � 1) dimensiones. CONSEJOMIMI x2x1 E(y) UN ANÁLISIS DE REGRESIÓN MÚLTIPLE Un análisis de regresión múltiple comprende procedimientos de estimación, prueba y diagnóstico diseñados para ajustar el modelo de regresión múltiple E( y) � b0 � b1x1 � b2x2 � � � � � bkxk 13.3 FIGURA 13.1 Plano de medias para el ejemplo 13.1 ● Probabilidad_Mendenhall_13.indd 553Probabilidad_Mendenhall_13.indd 553 5/14/10 8:20:36 AM5/14/10 8:20:36 AM www.FreeLibros.me 554 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE a un conjunto de datos. Debido a la complejidad de los cálculos involucrados, estos pro- cedimientos casi siempre se ponen en práctica con un programa de regresión de uno de los varios paquetes de software. Todos dan resultados similares en formas ligeramente diferentes. Seguimos con patrones básicos puestos en regresión lineal simple, empe- zando con un resumen de los procedimientos generales e ilustrados con un ejemplo. El método de mínimos cuadrados La ecuación de predicción ŷ � b0 � b1x1 � b2x2 � � � � � bkxk es la recta que reduce la SSE al mínimo, la suma de cuadrados de las desviaciones de los valores y observados en los valores pronosticados ŷ. Estos valores se calculan usando un programa de regresión. ¿En qué forma los vendedores de bienes raíces determinan el precio de venta para un con- dominio recién inscrito en lista? La base de datos de una computadora en una pequeña comunidad contiene el precio de venta de lista y (en miles de dólares), la cantidad de área de vivienda x1 (en cientos de pies cuadrados), así como los números de pisos x2, recámaras x3 y baños x4, para n � 15 condominios seleccionados al azar actualmente en el mercado. Los datos se muestran en la tabla 13.1. E J E M P L O 13.2 El modelo de regresión múltiple es E(y) � b0 � b1x1 � b2x2 � b3x3 � b4x4 que se ajusta usando el paquete de software MINITAB. En la sección “Mi MINITAB ”, al final de este capítulo, se pueden hallar instrucciones para generar esta salida. La primera parte de la salida de regresión se ve en la figura 13.2. Se encontrará la ecuación de regre- sión ajustada en los primeros dos renglones de la salida impresa: ŷ � 119 � 6.27x1 � 16.2x2 � 2.67x3 � 30.3x4 Los coeficientes de regresión parcial se muestran con ligeramente más precisión en la segunda sección. Las columnas son una lista del nombre dado a cada variable indepen- diente de pronóstico, su coeficiente de regresión estimado, su error estándar y los valores t y p que se usan para probar su significancia en presencia de todas las otras variables pre- dictoras. En una sección más adelante explicamos estas pruebas con más detalle. TABLA 13.1 ● Datos sobre 15 condominios Observación Precio de lista, y Área de vivienda, x1 Pisos, x2 Recámaras, x3 Baños, x4 1 169.0 6 1 2 1 2 218.5 10 1 2 2 3 216.5 10 1 3 2 4 225.0 11 1 3 2 5 229.9 13 1 3 1.7 6 235.0 13 2 3 2.5 7 239.9 13 1 3 2 8 247.9 17 2 3 2.5 9 260.0 19 2 3 2 10 269.9 18 1 3 2 11 234.9 13 1 4 2 12 255.0 18 1 4 2 13 269.9 17 2 4 3 14 294.5 20 2 4 3 15 309.9 21 2 4 3 Probabilidad_Mendenhall_13.indd 554Probabilidad_Mendenhall_13.indd 554 5/14/10 8:20:36 AM5/14/10 8:20:36 AM www.FreeLibros.me El análisis de varianza para regresión múltiple El análisis de varianza divide la variación total en la variable de respuesta y, SS Total � Syi 2 � (S n yi) 2 en dos partes: • La SSR (suma de cuadrados para regresión) mide la cantidad de variación expli- cada usando la ecuación de regresión. • La SSE (suma de cuadrados para error) mide la variación residual en los datos que no está explicada por las variables independientes. de modo que SS Total � SSR � SSE Los grados de libertad para estas sumas de cuadrados se encuentran usando el siguiente argumento. Hay (n � 1) grados de libertad en total. Estimar la recta de regresión requie- re estimar k coeficientes desconocidos; la constante b0 es una función de _ y y de las otras estimaciones. En consecuencia, hay k grados de libertad de regresión, dejando (n � 1) � k grados de libertad para error. Al igual que en capítulos previos, las medias cuadrá- ticas se calculan como MS � SS/df. La tabla ANOVA para los datos de bienes raíces de la tabla 13.1 se muestran en la segunda parte de la salida impresa MINITAB en la figura 13.3. Hay n � 15 observaciones y k � 4 variables predictoras independientes. Se puede verificar que el total de grados de libertad, (n � 1) � 14, se divide en k � 4 para regresión y (n � k � 1) � 10 para error. Análisis de regresión: lista de precios contra pies cuadrados, número de pisos, recámaras, baños The regression equation is List Price = 119 + 6.27 Square Feet - 16.2 Number of Floors - 2.67 Bedrooms + 30.3 Baths Predictor Coef SE Coef T P Constant 118.763 9.207 12.90 0.000 Square Feet 6.2698 0.7252 8.65 0.000 Number of Floors -16.203 6.212 -2.61 0.026 Bedrooms -2.673 4.494 -0.59 0.565 Baths 30.271 6.849 4.42 0.001 S = 6.84930 R-Sq = 97.1% R-Sq(adj) = 96.0% Analysis of Variance Source DF SS MS F P Regression 4 15913.0 3978.3 84.80 0.000 Residual Error 10 469.1 46.9 Total 14 16382.2 Source DF Seq SS Square Feet 1 14829.3 Number of Floors 1 0.9 Bedrooms 1 166.4 Baths 1 916.5 La mejor estimación de la variable aleatoria s2 en el experimento, es decir la variación que no es explicada por las variables predictoras, como de costumbre está dada por s2 � MSE � n � S S k E � 1 � 46.9 FIGURA 13.3 Parte de la salida impresa MINITAB para el ejemplo 13.2 ● FIGURA 13.2 Parte de la salida impresa MINITAB para el ejemplo13.2 ● 13.3 UN ANÁLISIS DE REGRESIÓN MÚLTIPLE ❍ 555 Probabilidad_Mendenhall_13.indd 555Probabilidad_Mendenhall_13.indd 555 5/14/10 8:20:36 AM5/14/10 8:20:36 AM www.FreeLibros.me 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE 13.3 Un análisis de regresión múltiple El método de mínimos cuadrados El análisis de varianza para regresión múltiple
Compartir