Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
550 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN CASO PRÁCTICO ¿Su auto está “Hecho en EE.UU.”? DATOSMISMIS Autos extranjeros La frase “Hecho en EE.UU.” se ha convertido en un conocido grito de batalla porque los trabajadores de Estados Unidos tratan de proteger sus trabajos de la competencia extranjera. En las últimas décadas, un importante desequilibrio en la balanza comer- cial en Estados Unidos ha estado causando una inundación de productos importados que entran al país y se venden a menor costo que artículos comparables hechos en él. Una preocupación principal es la industria automotriz, en la que el número de autos importados aumentó continuamente durante las décadas de 1970 y 1980. La indus- tria automotriz de ese país ha estado siendo acosada con quejas por la calidad de sus productos, despidos de trabajadores y altos precios, y ha gastado miles de millones de dólares en publicidad e investigación para producir un auto hecho en Estados Unidos que satisfaga las demandas del consumidor. ¿Han tenido éxito para detener la inundación de autos importados comprados por consumidores estadounidenses? Los datos de la tabla siguiente representan los números de autos importados y vendidos en Estados Unidos (en millones) durante los años 1969-2005.21 Para simplifi car el análisis, hemos codifi cado el año usando la variable codifi cada x � Año – 1969. Número de Número de Año (Año � 1969), x autos importados, y Año (Año � 1969), x autos importados, y 1969 0 1.1 1987 18 3.1 1970 1 1.3 1988 19 3.1 1971 2 1.6 1989 20 2.8 1972 3 1.6 1990 21 2.5 1973 4 1.8 1991 22 2.1 1974 5 1.4 1992 23 2.0 1975 6 1.6 1993 24 1.8 1976 7 1.5 1994 25 1.8 1977 8 2.1 1995 26 1.6 1978 9 2.0 1996 27 1.4 1979 10 2.3 1997 28 1.4 1980 11 2.4 1998 29 1.4 1981 12 2.3 1999 30 1.8 1982 13 2.2 2000 31 2.1 1983 14 2.4 2001 32 2.2 1984 15 2.4 2002 33 2.3 1985 16 2.8 2003 34 2.2 1986 17 3.2 2004 35 2.2 2005 36 2.3 1. Usando una gráfi ca de dispersión, grafi que los datos para los años 1969-1988. ¿Le parece que hay una relación lineal entre el número de autos importados y el año? 2. Use un paquete de software para hallar la recta de mínimos cuadrados para predecir el número de autos importados como función del año para los años 1969-1988. 3. ¿Hay una relación lineal signifi cativa entre el número de autos importados y el año? 4. Use el programa de cómputo para predecir el número de autos que serán importados usando intervalos de predicción de 95% para cada uno de los años 2003, 2004 y 2005. 5. Ahora vea los datos reales para los años 2003-2005. ¿Las predicciones obtenidas en el paso 4 dan estimaciones precisas de los valores reales observados en estos años? Explique. 6. Agregue los datos para 1989-2005 a su base de datos y recalcule la recta de regresión. ¿Qué efecto tienen los nuevos puntos sobre la pendiente? ¿Cuál es el efecto en el SSE? 7. Dada la forma de la gráfi ca de dispersión para los años 1969-2005, ¿le parece que una recta da un modelo preciso para los datos? ¿Qué otro tipo de modelo podría ser más apropiado? (Use gráfi cas residuales para ayudar a contestar esta pregunta.) Probabilidad_Mendenhall_12.indd 550Probabilidad_Mendenhall_12.indd 550 6/2/10 9:24:00 AM6/2/10 9:24:00 AM www.FreeLibros.me 551 Análisis de regresión múltiple “Hecho en EE.UU.”; otra mirada En el capítulo 12, empleamos análisis de regre- sión lineal simple para tratar de predecir el nú- mero de autos importados en Estados Unidos en un periodo de años. Desafortunadamente, el nú- mero de autos importados no sigue en realidad un modelo de tendencia lineal y nuestras prediccio- nes estuvieron lejos de ser precisas. Examinamos de nuevo los mismos datos al fi nal de este capí- tulo, usando los métodos de análisis de regresión múltiple. OBJETIVO GENERAL En este capítulo, extendemos los conceptos de regresión y correlación lineales a una situación donde el valor promedio de una variable aleatoria y está relacionada con varias variables independientes, que son x1, x2, . . ., xk, en modelos que son más fl exibles que el modelo de recta del capítulo 12. Con el análisis de regresión múltiple, podemos usar la información proporcionada por las variables independientes para ajustar varios tipos de modelos a los datos muestrales, para evaluar la utilidad de estos modelos y fi nalmente para estimar el valor promedio de y o predecir el valor real de y para valores dados de x1, x2, . . ., xk. ÍNDICE DEL CAPÍTULO ● R 2 ajustada (13.3) ● El análisis de varianza de la prueba F (13.3) ● Análisis de varianza para regresión múltiple (13.3) ● Casualidad y multicolinealidad (13.9) ● El coefi ciente de determinación R 2(13.3) ● Estimación y predicción usando el modelo de regresión (13.3) ● El modelo y suposiciones lineales generales (13.2) ● El método de mínimos cuadrados (13.3) ● Modelo polinomial de regresión (13.4) ● Variables cualitativas en un modelo de regresión (13.5) ● Gráfi cas residuales (13.3) ● Sumas secuenciales de cuadrados (13.3) ● Análisis de regresión por pasos (13.8) ● Prueba de los coefi cientes de regresión parcial (13.3) ● Prueba de los grupos de coefi cientes de regresión (13.6) Probabilidad_Mendenhall_13.indd 551Probabilidad_Mendenhall_13.indd 551 5/14/10 8:20:35 AM5/14/10 8:20:35 AM 13 © Vladzetter/Dreamstime www.FreeLibros.me 552 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE 13.1 13.2 INTRODUCCIÓN La regresión lineal múltiple es una extensión de regresión lineal simple para tomar en cuenta más de una variable independiente. Esto es, en lugar de usar sólo una variable independiente x para explicar la variación en y, se pueden usar simultáneamente varias variables independientes (o elementos de predicción). Con el uso de más de una variable independiente, se debe hacer un mejor trabajo de explicar la variación en y y en conse- cuencia hacer predicciones más precisas. Por ejemplo, las ventas regionales y del producto de una compañía podrían estar rela- cionadas con tres factores: • x1: la cantidad gastada en publicidad en televisión • x2: la cantidad gastada en publicidad en periódicos • x3: el número de vendedores asignados a la región Un investigador recolectaría datos para medir las variables y: x1, x2 y x3, y luego usaría estos datos muestrales para construir una ecuación de predicción que relacionara y con las tres variables predictoras. Desde luego que aparecen varias preguntas, al igual que con regresión lineal simple: • ¿Qué tan bien se ajusta el modelo? • ¿Qué tan fuerte es la relación entre y y las variables predictoras? • ¿Se han violado suposiciones importantes? • ¿Qué tan buenas son las estimaciones y predicciones? Para contestar estas preguntas se pueden usar métodos de análisis de regresión múlti- ple, que casi siempre se hacen con un programa de cómputo. Este capítulo contiene una breve introducción al análisis de regresión múltiple y a la difícil tarea de construcción de modelos, es decir, escoger el modelo correcto para una aplicación práctica. EL MODELO DE REGRESIÓN MÚLTIPLE El modelo de regresión múltiple para un análisis de regresión múltiple describe una respuesta particular y usando el modelo que damos a continuación. MODELO Y SUPOSICIONES LINEALES GENERALES y � b0 � b1x1 � b2x2 � � � � � bkxk � e donde • y es la variable de respuesta que se desea predecir. • b0, b1, b2, …, bk son constantes desconocidas. • x1, x2, …, xk son variables predictoras independientes que se miden sin error. • e es el error de variable, que permite que cada respuesta se desvíe del valor promedio de y en una cantidad e. Se debe suponer que los valores de e:1) son independientes; 2) tienen una media de 0 y una varianza común s2 para cualquier conjunto x1, x2, …, xk, y 3) están normalmente distribuidas. Cuando se satisfagan estas suposiciones acerca de e, el valor promedio de y para un conjunto dado de valores x1, x2, …, xk es igual a la parte determinista del modelo: E(y) � b0 � b1x1 � b2x2� � � � � bkxk Probabilidad_Mendenhall_13.indd 552Probabilidad_Mendenhall_13.indd 552 5/14/10 8:20:36 AM5/14/10 8:20:36 AM www.FreeLibros.me 12 REGRESIÓN LINEAL Y CORRELACIÓN CASO PRÁCTICO: ¿Su auto está “Hecho en EE.UU.”? 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE 13.1 Introducción 13.2 El modelo de regresión múltiple
Compartir