Logo Studenta

ESustitutorio_solución EDA

¡Estudia con miles de materiales!

Vista previa del material en texto

________________________________________________________________________________________________ 
 
1 
 
ESTADÍSTICA APLICADA 
SEMESTRE 2017-II 
LUNES, 27 DE NOVIEMBRE DE 2017 
EJERCICIO 1 (4 puntos) 
La salida de Minitab después de estimar un modelo de regresión lineal múltiple para predecir el 
contenido de alquitrán es la siguiente: 
 
Coeficientes 
 EE del 
Término Coef coef. T P IC de 95% VIF 
Constante 247,347 46,8031 5,2848 0,000 (151 ,315; 343,379) 
Velocidad -0,167 0,0315 -5,3105 0,000 ( -0 ,232; -0,103) 208,260 
Temperatura 1,577 0,1291 12,2126 0,000 ( 1 ,312; 1,842) 1,121 
Velocidad^2 0,000 0,0000 4,3187 0,000 ( 0 ,000; 0,000) 206,768 
 
 
Análisis de varianza 
Fuente GL SC Ajust. F P 
Regresión 3 5910,75 0,0000000 
 Velocidad 1 606,84 28,201 0,0000132 
 Temperatura 1 3209,43 149,148 0,0000000 
 Velocidad^2 1 401,34 401,34 0,0001896 
Error 27 581,00 
Total 30 6491,74 
 
a) Calcule el valor del ���������	. (1 punto) 
b) Escriba las hipótesis del test F, calcule el valor de dicho estadístico (que no aparece en la 
tabla), e indique si se acepta o rechaza la hipótesis nula interpretando este resultado. (1 
punto) 
c) ¿Cuál es la variable más significativa del modelo y en cuánto varía el contenido de alquitrán 
cuando esta variable aumenta en 1 unidad? (0.5 puntos) 
d) Si se quiere saber si el añadir un catalizador o no añadirlo, influye en el contenido de 
alquitrán, cómo plantearía el modelo de regresión? (1 punto) 
e) Escriba el modelo exponencial para el contenido de alquitrán, teniendo como variables 
regresoras: la velocidad y la temperatura (0.5 puntos) 
 
SOLUCIÓN 
a) ���������	 
 1 �


� �����⁄


� �����⁄
 
���������	 
 1 �
581/�31 � 4�
6491.74/�31 � 1�
 
���������	 
 90.06% 
 
 
 
2 
 
 
b) "#: &� 
 &� 
 &' 
 0 
"�: &� ≠ 0 	 &� ≠ 0 	 &' ≠ 0 
 El p-valor correspondiente al test F es: 
) = **+ 3⁄**, (- − 3)⁄
= 5910.75 3⁄581/(31 − 4) = 
 Para ese valor, la tabla indica un p-valor=0,000003, que es menor que 0.05, por tanto, 
se rechaza la hipótesis nula con un nivel de significancia del 5%. Esto quiere decir que al 
menos una de las variables incluidas en el modelo es significativa. 
 
c) La variable más significativa es la temperatura porque tiene la variabilidad explicada más 
alta, el p-valor más bajo. 
Cuando la temperatura aumenta en 1º, el contenido de alquitrán aumenta en 1.58 
unidades. 
 
d) Para saber si el añadir o no un catalizador influye se debe incluir una variables ficticias: 
.� = /1 0	- 0���123��	40 sin 0���123��	4 8 
 
e) ln(�1:�2�4á-) = ln<&0= + &1?@1	02��� + &2B@CD + ln (E) 
 
EJERCICIO 2 (3 puntos) 
Responda verdadero o falso (+0.5 puntos respuesta correcta, -0.25 respuesta incorrecta) 
a) Las variables regresoras en un modelo de regresión lineal deben seguir una distribución 
normal. Falso 
b) La variabilidad no explicada en un diseño factorial no siempre disminuye al incluir un factor o 
una interacción más. Falso 
c) La resolución de un modelo con confusión F = GHI , tiene resolución IV. Verdadero 
d) El número de efectos principales y de interacciones a estimar en un modelo JK es 32. Falso 
e) Un modelo completo de dos factores a dos niveles se escribe como LMN = O + PJFG +
QJFH + RMN. Falso 
f) Un diseño fraccionado JS�T tiene confusiones de los efectos y la media total, de 4 en 4. 
Verdadero 
 
 
 
3 
 
EJERCICIO 3 (3.5 puntos) 
Responda las siguientes cuestiones: 
a) Se quiere hacer un estudio para analizar cómo influyen 5 factores en una variable respuesta. Si 
cada experimento cuesta 100 dólares y se dispone de 1200 dólares. ¿Qué diseño de 
experimentos inicial propondría?. Escriba la tabla con la que recogerá sus datos. (1 punto) 
b) Si en el análisis que planteó en a) concluye que los factores A y E no son significativos (ni sus 
interacciones), podría estimar la varianza residual del modelo? ¿por qué?. (0.5 puntos) 
c) Para estudiar la fuerza de corte en un proceso de torneado se prueban 3 tipos de herramientas, 
3 velocidades de corte y 2 velocidades de avance. ¿Cuántos experimentos debe realizar como 
mínimo para estimar el modelo factorial completo?. Si en el modelo que considera los 3 
factores y la interacción entre herramienta y velocidad de corte se obtienen las siguientes 
variabilidades: (2 puntos): 
 ∙ Variabilidad explicada por las herramientas = UVV 
∙ Variabilidad explicada por la velocidad de corte = WV 
. Variabilidad explicada por la interacción herramienta x vel. corte = SV 
. Variabilidad explicada por la velocidad de avance = 30 
. Variabilidad no explicada = 120 
 
i. Escriba la ecuación del modelo a estimar. 
ii. Escriba la tabla ANOVA correspondiente. 
Factor Variabilidad Grados de libertad Varianza F 
 
 
 
a) Se propondría un diseño JK�J que implica realizar 8 experimentos iniciales (800 dólares). El 
diseño con máxima resolución podría ser, por ejemplo: F = GHI X = GH. Es un diseño con 
resolución III. La tabla de recogida de datos sería igual a: 
A B C D E 
- - - - + 
+ - - + - 
- + - + - 
+ + - - + 
 
 
4 
 
- - + + + 
+ - + - - 
- + + - - 
+ + + + + 
 
Podrían hacerse otros diseños con la misma resolución, por ejemplo: F = GHI X =
HI Y X = GI. O asignar el factor X a la interacción de tercer orden y el factor F a una 
interacción de segundo orden. 
 
b) No se podría estimar la varianza residual porque no hay grados de libertad, son 8 datos y hay 
que estimar 8 parámetros. 
 
c) Se necesitan como mínimo 36 experimentos, es decir, un diseño con una replicación. 
 
 
i. El modelo sería: 
Z[\ = E + ][ + &\ + (]&)[\ + �[\ 0	- 2 = 1,2,3 � = 1,2,3. 
 
ii. Utilizando los datos del enunciado se calcula la suma de cuadrados total: 
Como: 100 + 80 + 70 + 30 + 120 = 400 . 
 
La tabla ANOVA es por tanto es igual a: 
 
Factor Variabilidad g.d.l Varianza F 
Herramienta 100 _ − 1 = 2 50 10.85 
Velocidad de corte 80 ` − 1 = 2 40 8.68 
Herram. x Vel. Corte 70 (_ − 1)(` − 1) = 4 17.5 3.79 
Velocidad de avance 30 a − 1 = 1 30 6.51 
Residual 120 _`a� − 2 − 2
− 4 − 1 = 26 
4.61 
Total 400

Continuar navegando