Logo Studenta

introduccion a la probabilidad y estadistica ejercicios-197

¡Estudia con miles de materiales!

Vista previa del material en texto

Salida impresa MINITAB para el ejercicio 13.12 se midió la respuesta del monitor. Los resultados para 
un tipo de monitor mostraron un patrón lineal (véase el 
ejercicio 12.14). Los resultados para otro tipo de monitor 
se dan en la tabla siguiente.
Ozono 
(ppm/h), x .06 .12 .18 .31 .57 .65 .68 1.29
Densidad 
relativa de
fl uorescencia, y 8 18 27 33 42 47 52 61
a. Grafique los datos. ¿Qué modelo se esperaría que 
diera el mejor ajuste a los datos? Escriba la ecuación 
de ese modelo.
b. Use un paquete de software de computadora para 
ajustar el modelo del inciso a).
c. Encuentre la recta de regresión de mínimos 
cuadrados que relacione la respuesta del monitor 
a la concentración de ozono.
d. ¿El modelo aporta información significativa para 
la predicción de la respuesta del monitor basada en 
exposición al ozono? Use el valor p apropiado para 
tomar una decisión.
e. Encuentre R2 en la salida impresa. ¿Qué dice este 
valor acerca de la efectividad del análisis de regresión 
múltiple?
13.15 Utilidades corporativas Para 
estudiar la relación de publicidad e inversión de 
capital con utilidades corporativas, los datos siguientes, 
registrados en unidades de $100 000, se recolectaron 
para 10 empresas de mediano tamaño en el mismo año. 
La variable y representa utilidad para el año, x1 representa 
inversión de capital y x2 representa gasto en publicidad.
y x1 x2 y x1 x2
15 25 4 1 20 0
16 1 5 16 12 4
 2 6 3 18 15 5
 3 30 1 13 6 4
12 29 2 2 16 2
a. Usando el modelo
y � b0 � b1x � b2x2
 y un paquete apropiado de software, encuentre la 
ecuación de predicción de mínimos cuadrados para 
estos datos.
b. Use la prueba F general para determinar si el modelo 
aporta información significativa para la predicción de 
y. Use a � .01.
c. El gasto en publicidad x2 aporta información 
significativa para la predicción de y, dado que x1 ya 
está en el modelo? Use a � .01.
d. Calcule el coeficiente de determinación, R2. ¿Qué 
porcentaje de la variación general está explicado por 
el modelo?
Análisis de regresión: y contra x1, x2, x3, x4
The regression equation is
y = 59.8 + 0.129 x1 - 0.580 x2 + 8.50 x3 + 0.0488 x4
Predictor Coef SE Coef T P
Constant 59.85 35.68 1.68 0.137
x1 0.1287 0.3391 0.38 0.716
x2 -0.5805 0.2888 -2.01 0.084
x3 8.498 3.472 2.45 0.044
x4 0.04876 0.04062 1.20 0.269
S = 12.7199 R-Sq = 49.9% R-Sq(adj) = 21.3%
Analysis of Variance
Source DF SS MS F P
Regression 4 1128.4 282.1 1.74 0.244
Residual Error 7 1132.6 161.8
Total 11 2261.0
Source DF Seq SS
x1 1 11.2
x2 1 19.6
x3 1 864.5
x4 1 233.2
a. Comente sobre el ajuste del modelo usando el 
estadístico de la prueba para el ajuste general y 
el coeficiente de determinación, R2.
b. Si desea reajustar el modelo al eliminar una de las 
variables independientes, ¿cuál eliminaría? ¿Por qué?
13.13 Hamburguesas de verduras II Consulte el 
ejercicio 13.12. Un comando en el menú MINITAB de 
regresión da la salida impresa en la que R2 y R2(adj) se 
calculan para todos los posibles subconjuntos de las 
cuatro variables independientes. La salida impresa es la 
siguiente.
Salida impresa MINITAB para el ejercicio 13.13
Mejor regresión de conjuntos: y contra x1, x2, x3, x4
Response is y
 R-Sq Mallows x x x x
Vars R-Sq (adj) C-p s 1 2 3 4
 1 17.0 8.7 3.6 13.697 X
 1 6.9 0.0 5.0 14.506 X
 2 37.2 23.3 2.8 12.556 X X 
 2 20.3 2.5 5.1 14.153 X X
 3 48.9 29.7 3.1 12.020 X X X
 3 39.6 16.9 4.4 13.066 X X X
 4 49.9 21.3 5.0 12.720 X X X X
a. Si tuviera que comparar estos modelos y escoger el 
mejor, ¿cuál modelo escogería? Explique.
b. Comente sobre la utilidad del modelo que escogió 
en el inciso a). ¿Su modelo es valioso para predecir 
una calificación del gusto basada en las variables 
predictoras escogidas?
13.14 Contaminación del aire III Un 
experimento está diseñado para comparar varios 
tipos diferentes de monitores de contaminación del aire.3 
Cada monitor se instaló y luego se le expuso a diferentes 
concentraciones de ozono, de entre 15 y 230 partes 
por millón (ppm), durante periodos de 8 a 72 horas. 
A continuación se analizaron los fi ltros del monitor y 
DATOSMISMIS
EX1314
DATOSMISMIS
EX1315
 13.4 UN MODELO DE REGRESIÓN POLINOMIAL ❍ 565
Probabilidad_Mendenhall_13.indd 565Probabilidad_Mendenhall_13.indd 565 5/14/10 8:20:37 AM5/14/10 8:20:37 AM
 www.FreeLibros.me
566 ❍ CAPÍTULO 13 ANÁLISIS DE REGRESIÓN MÚLTIPLE
13.16 YouTube El sitio YouTube de videos 
compartidos atrajo 19.6 millones de visitantes 
en junio de 2006, un aumento de casi 300% desde enero 
de ese mismo año. A pesar del fenomenal crecimiento de 
YouTube, algunos analistas cuestionaron si el sitio 
puede hacer una transición de un servicio gratuito a uno 
que pueda hacer dinero. La tendencia de crecimiento para 
YouTube de agosto de 2005 a junio de 2006 se da en la 
tabla siguiente.4
 Total de visitantes únicos
Tiempo Tiempo codifi cado (000)
8/2005 1 72
9/2005 2 100
10/2005 3 750
11/2005 4 990
12/2005 5 1600
1/2006 6 2800
2/2006 7 4100
3/2006 8 5700
4/2006 9 6600
5/2006 10 12 600
6/2006 11 12 800
Las gráfi cas ajustadas lineal y cuadrática para estos datos 
son como sigue:
a. Con base en las estadísticas de resumen de las gráficas 
de líneas, ¿cuál de los dos modelos ajusta mejor los 
datos?
b. Escriba la ecuación para el modelo cuadrático.
c. Use la siguiente salida impresa para determinar si el 
término cuadrático aporta información significativa a 
la predicción de y, en presencia del término lineal.
x
S 1849.88
R-Sq 85.8%
R-Sq(adj) 84.2%
Gráfica de recta ajustada
y � �3432 � 1301 x
y
0
121086420
5000
10,000
15,000
x
S 944.385
R-Sq 96.7%
R-Sq(adj) 95.9%
Gráfica de recta ajustada
y � 886 � 691.9 x
� 166.1 x**2
y
121086420
0
14 000
12 000
10 000
8000
6000
4000
2000
DATOSMISMIS
EX1316
Análisis de regresión: número contra tiempo, tiempo-sq
The regression equation is
Number = 886 - 692 Time + 166 Time-sq
Predictor Coef SE Coef T P
Constant 886 1037 0.85 0.418
Time -691.9 397.2 -1.74 0.120
Time-sq 166.07 32.24 5.15 0.001
S = 944.381 R-Sq = 96.7% R-Sq(adj) = 95.9%
Analysis of Variance
Source DF SS MS F P
Regression 2 209848944 104924472 117.65 0.000
Residual Error 8 7134840 891855
Total 10 216983783
USO DE VARIABLES PREDICTORAS 
CUANTITATIVAS Y CUALITATIVAS 
EN UN MODELO DE REGRESIÓN
Una razón por la que los modelos de regresión múltiple son muy flexibles es que toman 
en cuenta el uso de variables predictoras cualitativas y cuantitativas. Para los métodos 
de regresión múltiple que se usan en este capítulo, la variable de respuesta y debe ser 
cuantitativa, midiendo una variable aleatoria numérica que tiene una distribución nor-
mal (de acuerdo con las suposiciones de la sección 13.2). No obstante, cada variable 
independiente predictora puede ser cuantitativa o cualitativa, cuyos niveles representan 
cualidades o características y sólo pueden ser categorizados. 
13.5
Probabilidad_Mendenhall_13.indd 566Probabilidad_Mendenhall_13.indd 566 5/14/10 8:20:37 AM5/14/10 8:20:37 AM
 www.FreeLibros.me
Las variables cuantitativas y cualitativas introducen el modelo de regresión en formas 
diferentes. Para complicar las cosas, podemos permitir una combinación de tipos dife-
rentes de variables en el modelo y podemos permitir que las variables interactúen, un 
concepto que puede serle familiar a usted en el experimento factorial del capítulo 11. 
Consideremosestas opciones una por una.
Una variable cuantitativa x puede introducirse como término lineal, x o elevado a 
alguna potencia de grado superior como x2 o x3, como en el modelo cuadrático del ejem-
plo 13.3. Cuando sea necesaria más de una variable cuantitativa, la interpretación de los 
posibles modelos se hace más complicada. Por ejemplo, con dos variables cuantitativas 
x1 y x2, se puede usar un modelo de primer orden como lo es
E(y) � b0 � b1x1 � b2x2
que traza un plano en espacio tridimensional (véase la figura 13.1). No obstante, puede 
ser que una de las variables, por ejemplo x2, no esté relacionada con y en la misma forma 
cuando x1 � 1 con lo está cuando x1 � 2. Para permitir que x2 se comporte de manera 
diferente dependiendo del valor de x1, sumamos un término de interacción, x1x2, y 
permitimos que el plano bidimensional se tuerza. El modelo es ahora un modelo de 
segundo orden:
E(y) � b0 � b1x1 � b2x2 � b3x1x2
Los modelos se hacen complicados más rápidamente cuando se permite que relaciones 
curvilíneas e interacción para las dos variables. Una forma de determinar sobre el tipo 
de modelo que se necesita es graficar algunos de los datos, quizá y contra x1, y contra x2, 
y y contra x2 para varios valores de x1.
En contraste con variables predictoras cuantitativas, las variables predictoras cuali-
tativas se introducen en un modelo de regresión a través de variables ficticias o in-
dicadoras. Por ejemplo, en un modelo que relacione el salario medio de un grupo de 
empleados con varias variables predictoras, se puede incluir el antecedente étnico del em-
pleado. Si cada empleado incluido en su estudio pertenece a uno de tres grupos étnicos, 
A, B o C, se puede introducir la variable cualitativa “etnia” en su modelo usando dos 
variables ficticias:
 1 si grupo B 1 si grupo C
x1 � � x2 � �
 
0 si no 0 si no
Vea el efecto que estas dos variables tienen en el modelo E(y) � b0 � b1x1 � b2x2: para 
empleados del grupo A,
E(y) � b0 � b1(0) � b2(0) � b0
para empleados del grupo B,
E(y) � b0 � b1(1) � b2(0) � b0 � b1
y para los del grupo C,
E(y) � b0 � b1(0) � b2(1) � b0 � b2
El modelo permite una respuesta promedio diferente para cada grupo. b1 mide la dife-
rencia en las respuestas promedio entre los grupos B y A, en tanto que b2 mide la di-
ferencia entre los grupos C y A.
Cuando una variable cualitativa contiene k categorías o niveles, (k � 1) variables ficti-
cias deben agregarse al modelo de regresión. Este modelo puede contener otras variables 
predictoras, cuantitativas o cualitativas, así como productos cruzados (interacciones) de 
las variables ficticias con otras variables que aparecen en el modelo. Como se puede ver, 
el proceso de construir un modelo, es decir, decidir sobre los términos apropiados a 
introducir en el modelo de regresión, puede ser bastante complicado. No obstante, usted 
Introduzca variables 
cuantitativas como
• una sola x
• una potencia de orden 
superior, x2 o x3
• una interacción con otra 
variable.
Las variables cualitativas se 
introducen como variables 
fi cticias, una menos que 
el número de categorías o 
niveles.
CONSEJOMIMI
CONSEJOMIMI
 13.5 USO DE VARIABLES PREDICTORAS CUANTITATIVAS Y CUALITATIVAS EN UN MODELO DE REGRESIÓN ❍ 567
Probabilidad_Mendenhall_13.indd 567Probabilidad_Mendenhall_13.indd 567 5/14/10 8:20:37 AM5/14/10 8:20:37 AM
 www.FreeLibros.me
	13 ANÁLISIS DE REGRESIÓN MÚLTIPLE
	13.5 Uso de variables predictoras cuantitativas y cualitativas en un modelo de regresión

Continuar navegando