Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
12.6 HERRAMIENTAS DE DIAGNÓSTICO PARA VERIFICAR SUPOSICIONES DE LA REGRESIÓN ❍ 523 SUPOSICIONES DE REGRESIÓN • La relación entre y y x debe ser lineal, dada por el modelo y � a � bx � e • Los valores del término de error aleatorio e: 1) son independientes, 2) tienen una media de 0 y una varianza común s2, independiente de x, y 3) están normalmente distribuidos. Como estas suposiciones son bastante similares a las presentadas en el capítulo 11 para un análisis de varianza, no debe sorprender hallar que las herramientas de diagnóstico para verifi car estas suposiciones son las mismas que las que empleamos en ese capítulo. Estas herramientas incluyen el análisis del error residual, la variación no explicada en cada observación una vez que la variación explicada por el modelo de regresión se haya eliminado. Términos de error dependientes Es frecuente que los términos de error sean dependientes cuando las observaciones se recolectan a intervalos de tiempo regulares. Cuando éste es el caso, las observaciones forman una serie de tiempo cuyos términos de error están correlacionados. Esto, a su vez, causa un sesgo en las estimaciones de parámetros de modelo. Los datos de la serie de tiempo deben ser analizados usando métodos de serie de tiempo. Una explicación del análisis de una serie de tiempo se encuentra en el texto Statistics for Management and Economics, 7ª edición, de Mendenhall, Beaver y Beaver. Gráfi cas residuales Las otras suposiciones de regresión se pueden verifi car con el uso de gráfi cas residua- les, que son bastante complicadas de hacer manualmente pero fáciles si se grafi can en computadora. En regresión lineal simple, se puede usar la gráfi ca de residuales contra ajuste para verifi car una varianza constante así como asegurarse que el modelo lineal en verdad sea adecuado. Esta gráfi ca debe estar libre de modelos y aparecer como dispersión aleatoria de puntos alrededor de 0 en el eje vertical, con aproximadamente la misma dispersión vertical para todos los valores de ŷ. Una propiedad de los residuales es que suman 0 y, por tanto, tienen una media muestral de 0. La gráfi ca de los residuales versus ajuste para el ejemplo de las califi caciones en cálculo se ve en la fi gura 12.10. No hay modelos aparentes en esta gráfi ca residual, lo cual indica que las suposiciones del modelo parecen estar satisfechas para estos datos. 15 10 5 0 �5 �10 60 70 80 90 100 Valor ajustado Residuales contra valor ajustado (la respuesta es y) R es id ua l FIGURA 12.10 Gráfi ca de los residuales contra ŷ para el ejemplo 12.1 ● Probabilidad_Mendenhall_12.indd 523Probabilidad_Mendenhall_12.indd 523 5/14/10 8:37:40 AM5/14/10 8:37:40 AM www.FreeLibros.me 524 ❍ CAPÍTULO 12 REGRESIÓN LINEAL Y CORRELACIÓN Recuerde del capítulo 11 que la gráfi ca normal de probabilidad es una gráfi ca que traza los residuales contra el valor esperado del residual si hubiera venido de una distri- bución normal. Cuando los residuales estén distribuidos normalmente o que en forma aproximada estén así distribuidos, la gráfi ca debe aparecer como una recta con pendiente hacia arriba. La gráfi ca normal de probabilidad para los residuales del ejemplo 12.1 está en la fi gura 12.11. Con la excepción de los puntos grafi cados cuarto y quinto, los puntos restantes parecen estar casi sobre la recta. Esta gráfi ca no es rara y no indica anormalidad fundamental. Las violaciones más serias de la suposición de normalidad por lo gene- ral aparecen en las colas de la distribución porque aquí es donde la distribución normal difi ere de la mayor parte de otros tipos de distribuciones con media y medida de disper- sión similares. En consecuencia, la curvatura en cualquiera de los extremos o en ambos de la gráfi ca normal de probabilidad indica no normalidad. Residuales versus ajustes dispersión aleatoria. Gráfi ca normal línea recta, pendiente ascendente. CONSEJOMIMI 99 95 90 80 70 60 50 40 30 20 10 5 1 �20 �10 0 10 20 Residual Gráfica normal de probabilidad de los residuales (la respuesta es y) P or ce nt aj e FIGURA 12.11 Gráfi ca normal de probabilidad de residuales para el ejemplo 12.1 ● TÉCNICAS BÁSICAS 12.28 ¿Cuál gráfi ca de diagnóstico se puede usar para determinar si los datos satisfacen la suposición de normalidad? ¿Cómo se vería la gráfi ca para residuales normales? 12.29 ¿Cuál gráfi ca de diagnóstico se puede usar para determinar si se ha usado el modelo incorrecto? ¿Cómo se vería la gráfi ca si se ha usado el modelo incorrecto? 12.30 ¿Cuál gráfi ca de diagnóstico se puede usar para determinar si se ha violado la suposición de igual varianza? ¿Cómo se vería la gráfi ca cuando las varianzas son iguales para todos los valores de x? 12.31 Consulte los datos del ejercicio 12.7. La gráfi ca normal de probabilidad y las gráfi cas de residuales contra valores ajustados generadas por MINITAB se muestran a EJERCICIOS12.6 continuación. ¿Le parece que alguna de las suposiciones de regresión ha sido violada? Explique. Salida impresa MINITAB para el ejercicio 12.31 99 95 90 80 70 60 50 40 30 20 10 5 1 �0.4 �0.3 �0.2 �0.1 0.0 01. 02. 0.3 0.4 Residual Gráfica normal de probabilidad de los residuales (la respuesta es y) P or ce nt aj e Probabilidad_Mendenhall_12.indd 524Probabilidad_Mendenhall_12.indd 524 5/14/10 8:37:40 AM5/14/10 8:37:40 AM www.FreeLibros.me 12.6 HERRAMIENTAS DE DIAGNÓSTICO PARA VERIFICAR SUPOSICIONES DE LA REGRESIÓN ❍ 525 0.2 0.1 0.0 �0.1 �0.2 �0.3 2.5 3.0 3.5 4.0 4.5 5.0 5.5 Valor ajustado Residuales contra valor ajustado (la respuesta es y) R es id ua l APLICACIONES 12.32 Contaminación del aire Consulte el ejercicio 12.20, en el que se registró la respuesta al ozono de un monitor de contaminación del aire, para varias concentraciones diferentes de ozono. Use gráfi cas re- siduales MINITAB para comentar sobre la validez de las suposiciones de regresión. Salida impresa MINITAB para el ejercicio 12.32 0.50 0.25 0.00 �0.25 �0.50 2 4 6 8 10 12 Valor ajustado Residuales contra el valor ajustado (la respuesta es NO3) R es id ua l 99 95 90 80 70 60 50 40 30 20 10 5 1 �1.0 �0.5 0.0 0.5 1.0 Residual Gráfica normal de probabilidad de los residuales (la respuesta es NO3) P or ce nt aj e 12.33 Profesor Asimov, otra vez Consulte el ejercicio 12.8, en el que el número x de libros escritos por Isaac Asimov está relacionado con el número de meses y que tardó en escribirlos. A continuación, una gráfi ca de los datos. 500 450 400 350 300 250 200 100 200 300 400 500 y( T ie m po e n m es es ) a. ¿Se puede ver un modelo que no sea una relación lineal en la gráfi ca original? b. El valor de r2 para estos datos es .959. ¿Qué dice esto acerca del ajuste de la recta de regresión? c. Vea las siguientes gráfi cas de diagnóstico para estos datos. ¿Se ve algún patrón en los residuales? ¿Sugiere esto que la relación entre el número de meses y el número de libros escritos es algo que no sea lineal? 20 10 0 �10 �20 �30 250 300 350 400 450 500 550 Valor ajustado Residuales contra los valores ajustados (la respuesta es y) R es id ua l 99 95 90 80 70 60 50 40 30 20 10 5 1 �50 �25 0 25 50 Residual Gráfica normal de probabilidad de los residuales (la respuesta es y) P or ce nt aj e Probabilidad_Mendenhall_12.indd 525Probabilidad_Mendenhall_12.indd 525 5/14/10 8:37:40 AM5/14/10 8:37:40 AM www.FreeLibros.me 12 REGRESIÓN LINEAL Y CORRELACIÓN 12.6 Herramientas de diagnóstico para verificar suposiciones de la regresión Términos de error dependientes Gráficas residuales Ejercicios
Compartir