Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-193

¡Estudia con miles de materiales!

Vista previa del material en texto

13.3 UN ANÁLISIS DE REGRESIÓN MÚLTIPLE ❍ 553
E J E M P L O 13.1
Observe que el modelo y suposiciones de regresión simple son muy semejantes al modelo 
y suposiciones empleados para regresión lineal. Es probable que no lo sorprenda el que 
los procedimientos de prueba y estimación también sean extensiones de los empleados 
en el capítulo 12.
Los modelos de regresión simple son muy flexibles y pueden tomar muchas formas, 
dependiendo de la forma en que las variables independientes x1, x2, …, xk se introduzcan 
en el modelo. Empezamos con un simple modelo de regresión múltiple, explicando los 
conceptos y procedimientos básicos con un ejemplo. A medida que nos familiarice-
mos con los procedimientos de regresión múltiple, aumentamos la complejidad de los ejem-
plos y veremos que los mismos procedimientos se pueden usar para modelos de formas 
diferentes, dependiendo de la aplicación particular.
Suponga que se desea relacionar una variable aleatoria y con dos variables independien-
tes x1 y x2. El modelo de regresión múltiple es
y � b0 � b1x1 � b2x2 � e
con el valor medio de y dado como
E(y) � b0 � b1x1 � b2x2
Esta ecuación es una extensión en tres dimensiones de la recta de medias del capítulo 
12 y traza un plano en el espacio tridimensional (véase la figura 13.1). La constante 
b0 se denomina punto de cruce, que es el valor promedio de y cuando x1 y x2 son 0 
ambas. Los coeficientes b1 y b2 se denominan pendientes parciales o coeficientes de 
regresión parciales. La pendiente parcial bi (para i � 1 o 2) mide el cambio en y para 
un cambio unitario en xi cuando todas las otras variables independientes se mantengan 
constantes. El valor del coeficiente de regresión parcial, por ejemplo b1, con x1 y x2 en el 
modelo generalmente no es igual que la pendiente cuando se ajuste una recta sólo con x1. 
Estos coeficientes son las constantes desconocidas, que deben ser estimadas usando 
datos muestrales para obtener la ecuación de predicción.
En lugar de x y y grafi cadas 
en un espacio en dos 
dimensiones, y y x1, x2, …, xk 
tienen que grafi carse en 
(k � 1) dimensiones.
CONSEJOMIMI
x2x1
E(y)
UN ANÁLISIS DE REGRESIÓN MÚLTIPLE
Un análisis de regresión múltiple comprende procedimientos de estimación, prueba y 
diagnóstico diseñados para ajustar el modelo de regresión múltiple
E( y) � b0 � b1x1 � b2x2 � � � � � bkxk
13.3
FIGURA 13.1
Plano de medias para el 
ejemplo 13.1
●
Probabilidad_Mendenhall_13.indd 553Probabilidad_Mendenhall_13.indd 553 5/14/10 8:20:36 AM5/14/10 8:20:36 AM
 www.FreeLibros.me
554 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE
a un conjunto de datos. Debido a la complejidad de los cálculos involucrados, estos pro-
cedimientos casi siempre se ponen en práctica con un programa de regresión de uno de 
los varios paquetes de software. Todos dan resultados similares en formas ligeramente 
diferentes. Seguimos con patrones básicos puestos en regresión lineal simple, empe-
zando con un resumen de los procedimientos generales e ilustrados con un ejemplo.
El método de mínimos cuadrados
La ecuación de predicción
ŷ � b0 � b1x1 � b2x2 � � � � � bkxk
es la recta que reduce la SSE al mínimo, la suma de cuadrados de las desviaciones de los 
valores y observados en los valores pronosticados ŷ. Estos valores se calculan usando un 
programa de regresión.
¿En qué forma los vendedores de bienes raíces determinan el precio de venta para un con-
dominio recién inscrito en lista? La base de datos de una computadora en una pequeña 
comunidad contiene el precio de venta de lista y (en miles de dólares), la cantidad de 
área de vivienda x1 (en cientos de pies cuadrados), así como los números de pisos x2, 
recámaras x3 y baños x4, para n � 15 condominios seleccionados al azar actualmente en 
el mercado. Los datos se muestran en la tabla 13.1.
E J E M P L O 13.2
El modelo de regresión múltiple es
E(y) � b0 � b1x1 � b2x2 � b3x3 � b4x4
que se ajusta usando el paquete de software MINITAB. En la sección “Mi MINITAB ”, al 
final de este capítulo, se pueden hallar instrucciones para generar esta salida. La primera 
parte de la salida de regresión se ve en la figura 13.2. Se encontrará la ecuación de regre-
sión ajustada en los primeros dos renglones de la salida impresa:
ŷ � 119 � 6.27x1 � 16.2x2 � 2.67x3 � 30.3x4
Los coeficientes de regresión parcial se muestran con ligeramente más precisión en la 
segunda sección. Las columnas son una lista del nombre dado a cada variable indepen-
diente de pronóstico, su coeficiente de regresión estimado, su error estándar y los valores t 
y p que se usan para probar su significancia en presencia de todas las otras variables pre-
dictoras. En una sección más adelante explicamos estas pruebas con más detalle.
TABLA 13.1 
●
 Datos sobre 15 condominios
Observación Precio de lista, y Área de vivienda, x1 Pisos, x2 Recámaras, x3 Baños, x4
 1 169.0 6 1 2 1
 2 218.5 10 1 2 2
 3 216.5 10 1 3 2
 4 225.0 11 1 3 2
 5 229.9 13 1 3 1.7
 6 235.0 13 2 3 2.5
 7 239.9 13 1 3 2
 8 247.9 17 2 3 2.5
 9 260.0 19 2 3 2
10 269.9 18 1 3 2
11 234.9 13 1 4 2
12 255.0 18 1 4 2
13 269.9 17 2 4 3
14 294.5 20 2 4 3
15 309.9 21 2 4 3
Probabilidad_Mendenhall_13.indd 554Probabilidad_Mendenhall_13.indd 554 5/14/10 8:20:36 AM5/14/10 8:20:36 AM
 www.FreeLibros.me
El análisis de varianza para regresión 
múltiple
El análisis de varianza divide la variación total en la variable de respuesta y,
SS Total � Syi
2 � 
(S
n
yi)
2
en dos partes:
• La SSR (suma de cuadrados para regresión) mide la cantidad de variación expli-
cada usando la ecuación de regresión.
• La SSE (suma de cuadrados para error) mide la variación residual en los datos 
que no está explicada por las variables independientes.
de modo que
SS Total � SSR � SSE
Los grados de libertad para estas sumas de cuadrados se encuentran usando el siguiente 
argumento. Hay (n � 1) grados de libertad en total. Estimar la recta de regresión requie-
re estimar k coeficientes desconocidos; la constante b0 es una función de 
_
 y y de las otras 
estimaciones. En consecuencia, hay k grados de libertad de regresión, dejando (n � 1) 
� k grados de libertad para error. Al igual que en capítulos previos, las medias cuadrá-
ticas se calculan como MS � SS/df.
La tabla ANOVA para los datos de bienes raíces de la tabla 13.1 se muestran en la 
segunda parte de la salida impresa MINITAB en la figura 13.3. Hay n � 15 observaciones 
y k � 4 variables predictoras independientes. Se puede verificar que el total de grados 
de libertad, (n � 1) � 14, se divide en k � 4 para regresión y (n � k � 1) � 10 para 
error.
Análisis de regresión: lista de precios contra pies cuadrados, 
número de pisos, recámaras, baños
The regression equation is
List Price = 119 + 6.27 Square Feet - 16.2 Number of Floors 
 - 2.67 Bedrooms + 30.3 Baths
Predictor Coef SE Coef T P
Constant 118.763 9.207 12.90 0.000
Square Feet 6.2698 0.7252 8.65 0.000
Number of Floors -16.203 6.212 -2.61 0.026
Bedrooms -2.673 4.494 -0.59 0.565
Baths 30.271 6.849 4.42 0.001
S = 6.84930 R-Sq = 97.1% R-Sq(adj) = 96.0%
Analysis of Variance
Source DF SS MS F P
Regression 4 15913.0 3978.3 84.80 0.000
Residual Error 10 469.1 46.9
Total 14 16382.2
Source DF Seq SS
Square Feet 1 14829.3
Number of Floors 1 0.9
Bedrooms 1 166.4
Baths 1 916.5 
La mejor estimación de la variable aleatoria s2 en el experimento, es decir la variación 
que no es explicada por las variables predictoras, como de costumbre está dada por
s2 � MSE � 
n �
S
 
S
k 
E
� 1
 � 46.9
FIGURA 13.3
Parte de la salida impresa 
MINITAB para el ejemplo 
13.2
●
FIGURA 13.2
Parte de la salida impresa 
MINITAB para el ejemplo13.2
●
 13.3 UN ANÁLISIS DE REGRESIÓN MÚLTIPLE ❍ 555
Probabilidad_Mendenhall_13.indd 555Probabilidad_Mendenhall_13.indd 555 5/14/10 8:20:36 AM5/14/10 8:20:36 AM
 www.FreeLibros.me
	13 ANÁLISIS DE REGRESIÓN MÚLTIPLE
	13.3 Un análisis de regresión múltiple
	El método de mínimos cuadrados
	El análisis de varianza para regresión múltiple

Continuar navegando