Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Salida impresa MINITAB para el ejercicio 13.12 se midió la respuesta del monitor. Los resultados para un tipo de monitor mostraron un patrón lineal (véase el ejercicio 12.14). Los resultados para otro tipo de monitor se dan en la tabla siguiente. Ozono (ppm/h), x .06 .12 .18 .31 .57 .65 .68 1.29 Densidad relativa de fl uorescencia, y 8 18 27 33 42 47 52 61 a. Grafique los datos. ¿Qué modelo se esperaría que diera el mejor ajuste a los datos? Escriba la ecuación de ese modelo. b. Use un paquete de software de computadora para ajustar el modelo del inciso a). c. Encuentre la recta de regresión de mínimos cuadrados que relacione la respuesta del monitor a la concentración de ozono. d. ¿El modelo aporta información significativa para la predicción de la respuesta del monitor basada en exposición al ozono? Use el valor p apropiado para tomar una decisión. e. Encuentre R2 en la salida impresa. ¿Qué dice este valor acerca de la efectividad del análisis de regresión múltiple? 13.15 Utilidades corporativas Para estudiar la relación de publicidad e inversión de capital con utilidades corporativas, los datos siguientes, registrados en unidades de $100 000, se recolectaron para 10 empresas de mediano tamaño en el mismo año. La variable y representa utilidad para el año, x1 representa inversión de capital y x2 representa gasto en publicidad. y x1 x2 y x1 x2 15 25 4 1 20 0 16 1 5 16 12 4 2 6 3 18 15 5 3 30 1 13 6 4 12 29 2 2 16 2 a. Usando el modelo y � b0 � b1x � b2x2 y un paquete apropiado de software, encuentre la ecuación de predicción de mínimos cuadrados para estos datos. b. Use la prueba F general para determinar si el modelo aporta información significativa para la predicción de y. Use a � .01. c. El gasto en publicidad x2 aporta información significativa para la predicción de y, dado que x1 ya está en el modelo? Use a � .01. d. Calcule el coeficiente de determinación, R2. ¿Qué porcentaje de la variación general está explicado por el modelo? Análisis de regresión: y contra x1, x2, x3, x4 The regression equation is y = 59.8 + 0.129 x1 - 0.580 x2 + 8.50 x3 + 0.0488 x4 Predictor Coef SE Coef T P Constant 59.85 35.68 1.68 0.137 x1 0.1287 0.3391 0.38 0.716 x2 -0.5805 0.2888 -2.01 0.084 x3 8.498 3.472 2.45 0.044 x4 0.04876 0.04062 1.20 0.269 S = 12.7199 R-Sq = 49.9% R-Sq(adj) = 21.3% Analysis of Variance Source DF SS MS F P Regression 4 1128.4 282.1 1.74 0.244 Residual Error 7 1132.6 161.8 Total 11 2261.0 Source DF Seq SS x1 1 11.2 x2 1 19.6 x3 1 864.5 x4 1 233.2 a. Comente sobre el ajuste del modelo usando el estadístico de la prueba para el ajuste general y el coeficiente de determinación, R2. b. Si desea reajustar el modelo al eliminar una de las variables independientes, ¿cuál eliminaría? ¿Por qué? 13.13 Hamburguesas de verduras II Consulte el ejercicio 13.12. Un comando en el menú MINITAB de regresión da la salida impresa en la que R2 y R2(adj) se calculan para todos los posibles subconjuntos de las cuatro variables independientes. La salida impresa es la siguiente. Salida impresa MINITAB para el ejercicio 13.13 Mejor regresión de conjuntos: y contra x1, x2, x3, x4 Response is y R-Sq Mallows x x x x Vars R-Sq (adj) C-p s 1 2 3 4 1 17.0 8.7 3.6 13.697 X 1 6.9 0.0 5.0 14.506 X 2 37.2 23.3 2.8 12.556 X X 2 20.3 2.5 5.1 14.153 X X 3 48.9 29.7 3.1 12.020 X X X 3 39.6 16.9 4.4 13.066 X X X 4 49.9 21.3 5.0 12.720 X X X X a. Si tuviera que comparar estos modelos y escoger el mejor, ¿cuál modelo escogería? Explique. b. Comente sobre la utilidad del modelo que escogió en el inciso a). ¿Su modelo es valioso para predecir una calificación del gusto basada en las variables predictoras escogidas? 13.14 Contaminación del aire III Un experimento está diseñado para comparar varios tipos diferentes de monitores de contaminación del aire.3 Cada monitor se instaló y luego se le expuso a diferentes concentraciones de ozono, de entre 15 y 230 partes por millón (ppm), durante periodos de 8 a 72 horas. A continuación se analizaron los fi ltros del monitor y DATOSMISMIS EX1314 DATOSMISMIS EX1315 13.4 UN MODELO DE REGRESIÓN POLINOMIAL ❍ 565 Probabilidad_Mendenhall_13.indd 565Probabilidad_Mendenhall_13.indd 565 5/14/10 8:20:37 AM5/14/10 8:20:37 AM www.FreeLibros.me 566 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE 13.16 YouTube El sitio YouTube de videos compartidos atrajo 19.6 millones de visitantes en junio de 2006, un aumento de casi 300% desde enero de ese mismo año. A pesar del fenomenal crecimiento de YouTube, algunos analistas cuestionaron si el sitio puede hacer una transición de un servicio gratuito a uno que pueda hacer dinero. La tendencia de crecimiento para YouTube de agosto de 2005 a junio de 2006 se da en la tabla siguiente.4 Total de visitantes únicos Tiempo Tiempo codifi cado (000) 8/2005 1 72 9/2005 2 100 10/2005 3 750 11/2005 4 990 12/2005 5 1600 1/2006 6 2800 2/2006 7 4100 3/2006 8 5700 4/2006 9 6600 5/2006 10 12 600 6/2006 11 12 800 Las gráfi cas ajustadas lineal y cuadrática para estos datos son como sigue: a. Con base en las estadísticas de resumen de las gráficas de líneas, ¿cuál de los dos modelos ajusta mejor los datos? b. Escriba la ecuación para el modelo cuadrático. c. Use la siguiente salida impresa para determinar si el término cuadrático aporta información significativa a la predicción de y, en presencia del término lineal. x S 1849.88 R-Sq 85.8% R-Sq(adj) 84.2% Gráfica de recta ajustada y � �3432 � 1301 x y 0 121086420 5000 10,000 15,000 x S 944.385 R-Sq 96.7% R-Sq(adj) 95.9% Gráfica de recta ajustada y � 886 � 691.9 x � 166.1 x**2 y 121086420 0 14 000 12 000 10 000 8000 6000 4000 2000 DATOSMISMIS EX1316 Análisis de regresión: número contra tiempo, tiempo-sq The regression equation is Number = 886 - 692 Time + 166 Time-sq Predictor Coef SE Coef T P Constant 886 1037 0.85 0.418 Time -691.9 397.2 -1.74 0.120 Time-sq 166.07 32.24 5.15 0.001 S = 944.381 R-Sq = 96.7% R-Sq(adj) = 95.9% Analysis of Variance Source DF SS MS F P Regression 2 209848944 104924472 117.65 0.000 Residual Error 8 7134840 891855 Total 10 216983783 USO DE VARIABLES PREDICTORAS CUANTITATIVAS Y CUALITATIVAS EN UN MODELO DE REGRESIÓN Una razón por la que los modelos de regresión múltiple son muy flexibles es que toman en cuenta el uso de variables predictoras cualitativas y cuantitativas. Para los métodos de regresión múltiple que se usan en este capítulo, la variable de respuesta y debe ser cuantitativa, midiendo una variable aleatoria numérica que tiene una distribución nor- mal (de acuerdo con las suposiciones de la sección 13.2). No obstante, cada variable independiente predictora puede ser cuantitativa o cualitativa, cuyos niveles representan cualidades o características y sólo pueden ser categorizados. 13.5 Probabilidad_Mendenhall_13.indd 566Probabilidad_Mendenhall_13.indd 566 5/14/10 8:20:37 AM5/14/10 8:20:37 AM www.FreeLibros.me Las variables cuantitativas y cualitativas introducen el modelo de regresión en formas diferentes. Para complicar las cosas, podemos permitir una combinación de tipos dife- rentes de variables en el modelo y podemos permitir que las variables interactúen, un concepto que puede serle familiar a usted en el experimento factorial del capítulo 11. Consideremosestas opciones una por una. Una variable cuantitativa x puede introducirse como término lineal, x o elevado a alguna potencia de grado superior como x2 o x3, como en el modelo cuadrático del ejem- plo 13.3. Cuando sea necesaria más de una variable cuantitativa, la interpretación de los posibles modelos se hace más complicada. Por ejemplo, con dos variables cuantitativas x1 y x2, se puede usar un modelo de primer orden como lo es E(y) � b0 � b1x1 � b2x2 que traza un plano en espacio tridimensional (véase la figura 13.1). No obstante, puede ser que una de las variables, por ejemplo x2, no esté relacionada con y en la misma forma cuando x1 � 1 con lo está cuando x1 � 2. Para permitir que x2 se comporte de manera diferente dependiendo del valor de x1, sumamos un término de interacción, x1x2, y permitimos que el plano bidimensional se tuerza. El modelo es ahora un modelo de segundo orden: E(y) � b0 � b1x1 � b2x2 � b3x1x2 Los modelos se hacen complicados más rápidamente cuando se permite que relaciones curvilíneas e interacción para las dos variables. Una forma de determinar sobre el tipo de modelo que se necesita es graficar algunos de los datos, quizá y contra x1, y contra x2, y y contra x2 para varios valores de x1. En contraste con variables predictoras cuantitativas, las variables predictoras cuali- tativas se introducen en un modelo de regresión a través de variables ficticias o in- dicadoras. Por ejemplo, en un modelo que relacione el salario medio de un grupo de empleados con varias variables predictoras, se puede incluir el antecedente étnico del em- pleado. Si cada empleado incluido en su estudio pertenece a uno de tres grupos étnicos, A, B o C, se puede introducir la variable cualitativa “etnia” en su modelo usando dos variables ficticias: 1 si grupo B 1 si grupo C x1 � � x2 � � 0 si no 0 si no Vea el efecto que estas dos variables tienen en el modelo E(y) � b0 � b1x1 � b2x2: para empleados del grupo A, E(y) � b0 � b1(0) � b2(0) � b0 para empleados del grupo B, E(y) � b0 � b1(1) � b2(0) � b0 � b1 y para los del grupo C, E(y) � b0 � b1(0) � b2(1) � b0 � b2 El modelo permite una respuesta promedio diferente para cada grupo. b1 mide la dife- rencia en las respuestas promedio entre los grupos B y A, en tanto que b2 mide la di- ferencia entre los grupos C y A. Cuando una variable cualitativa contiene k categorías o niveles, (k � 1) variables ficti- cias deben agregarse al modelo de regresión. Este modelo puede contener otras variables predictoras, cuantitativas o cualitativas, así como productos cruzados (interacciones) de las variables ficticias con otras variables que aparecen en el modelo. Como se puede ver, el proceso de construir un modelo, es decir, decidir sobre los términos apropiados a introducir en el modelo de regresión, puede ser bastante complicado. No obstante, usted Introduzca variables cuantitativas como • una sola x • una potencia de orden superior, x2 o x3 • una interacción con otra variable. Las variables cualitativas se introducen como variables fi cticias, una menos que el número de categorías o niveles. CONSEJOMIMI CONSEJOMIMI 13.5 USO DE VARIABLES PREDICTORAS CUANTITATIVAS Y CUALITATIVAS EN UN MODELO DE REGRESIÓN ❍ 567 Probabilidad_Mendenhall_13.indd 567Probabilidad_Mendenhall_13.indd 567 5/14/10 8:20:37 AM5/14/10 8:20:37 AM www.FreeLibros.me 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE 13.5 Uso de variables predictoras cuantitativas y cualitativas en un modelo de regresión
Compartir