Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
________________________________________________________________________________________________ 1 ESTADÍSTICA APLICADA SEMESTRE 2017-II LUNES, 27 DE NOVIEMBRE DE 2017 EJERCICIO 1 (4 puntos) La salida de Minitab después de estimar un modelo de regresión lineal múltiple para predecir el contenido de alquitrán es la siguiente: Coeficientes EE del Término Coef coef. T P IC de 95% VIF Constante 247,347 46,8031 5,2848 0,000 (151 ,315; 343,379) Velocidad -0,167 0,0315 -5,3105 0,000 ( -0 ,232; -0,103) 208,260 Temperatura 1,577 0,1291 12,2126 0,000 ( 1 ,312; 1,842) 1,121 Velocidad^2 0,000 0,0000 4,3187 0,000 ( 0 ,000; 0,000) 206,768 Análisis de varianza Fuente GL SC Ajust. F P Regresión 3 5910,75 0,0000000 Velocidad 1 606,84 28,201 0,0000132 Temperatura 1 3209,43 149,148 0,0000000 Velocidad^2 1 401,34 401,34 0,0001896 Error 27 581,00 Total 30 6491,74 a) Calcule el valor del ��������� . (1 punto) b) Escriba las hipótesis del test F, calcule el valor de dicho estadístico (que no aparece en la tabla), e indique si se acepta o rechaza la hipótesis nula interpretando este resultado. (1 punto) c) ¿Cuál es la variable más significativa del modelo y en cuánto varía el contenido de alquitrán cuando esta variable aumenta en 1 unidad? (0.5 puntos) d) Si se quiere saber si el añadir un catalizador o no añadirlo, influye en el contenido de alquitrán, cómo plantearía el modelo de regresión? (1 punto) e) Escriba el modelo exponencial para el contenido de alquitrán, teniendo como variables regresoras: la velocidad y la temperatura (0.5 puntos) SOLUCIÓN a) ��������� 1 � � �����⁄ � �����⁄ ��������� 1 � 581/�31 � 4� 6491.74/�31 � 1� ��������� 90.06% 2 b) "#: &� &� &' 0 "�: &� ≠ 0 &� ≠ 0 &' ≠ 0 El p-valor correspondiente al test F es: ) = **+ 3⁄**, (- − 3)⁄ = 5910.75 3⁄581/(31 − 4) = Para ese valor, la tabla indica un p-valor=0,000003, que es menor que 0.05, por tanto, se rechaza la hipótesis nula con un nivel de significancia del 5%. Esto quiere decir que al menos una de las variables incluidas en el modelo es significativa. c) La variable más significativa es la temperatura porque tiene la variabilidad explicada más alta, el p-valor más bajo. Cuando la temperatura aumenta en 1º, el contenido de alquitrán aumenta en 1.58 unidades. d) Para saber si el añadir o no un catalizador influye se debe incluir una variables ficticias: .� = /1 0 - 0���123�� 40 sin 0���123�� 4 8 e) ln(�1:�2�4á-) = ln<&0= + &1?@1 02��� + &2B@CD + ln (E) EJERCICIO 2 (3 puntos) Responda verdadero o falso (+0.5 puntos respuesta correcta, -0.25 respuesta incorrecta) a) Las variables regresoras en un modelo de regresión lineal deben seguir una distribución normal. Falso b) La variabilidad no explicada en un diseño factorial no siempre disminuye al incluir un factor o una interacción más. Falso c) La resolución de un modelo con confusión F = GHI , tiene resolución IV. Verdadero d) El número de efectos principales y de interacciones a estimar en un modelo JK es 32. Falso e) Un modelo completo de dos factores a dos niveles se escribe como LMN = O + PJFG + QJFH + RMN. Falso f) Un diseño fraccionado JS�T tiene confusiones de los efectos y la media total, de 4 en 4. Verdadero 3 EJERCICIO 3 (3.5 puntos) Responda las siguientes cuestiones: a) Se quiere hacer un estudio para analizar cómo influyen 5 factores en una variable respuesta. Si cada experimento cuesta 100 dólares y se dispone de 1200 dólares. ¿Qué diseño de experimentos inicial propondría?. Escriba la tabla con la que recogerá sus datos. (1 punto) b) Si en el análisis que planteó en a) concluye que los factores A y E no son significativos (ni sus interacciones), podría estimar la varianza residual del modelo? ¿por qué?. (0.5 puntos) c) Para estudiar la fuerza de corte en un proceso de torneado se prueban 3 tipos de herramientas, 3 velocidades de corte y 2 velocidades de avance. ¿Cuántos experimentos debe realizar como mínimo para estimar el modelo factorial completo?. Si en el modelo que considera los 3 factores y la interacción entre herramienta y velocidad de corte se obtienen las siguientes variabilidades: (2 puntos): ∙ Variabilidad explicada por las herramientas = UVV ∙ Variabilidad explicada por la velocidad de corte = WV . Variabilidad explicada por la interacción herramienta x vel. corte = SV . Variabilidad explicada por la velocidad de avance = 30 . Variabilidad no explicada = 120 i. Escriba la ecuación del modelo a estimar. ii. Escriba la tabla ANOVA correspondiente. Factor Variabilidad Grados de libertad Varianza F a) Se propondría un diseño JK�J que implica realizar 8 experimentos iniciales (800 dólares). El diseño con máxima resolución podría ser, por ejemplo: F = GHI X = GH. Es un diseño con resolución III. La tabla de recogida de datos sería igual a: A B C D E - - - - + + - - + - - + - + - + + - - + 4 - - + + + + - + - - - + + - - + + + + + Podrían hacerse otros diseños con la misma resolución, por ejemplo: F = GHI X = HI Y X = GI. O asignar el factor X a la interacción de tercer orden y el factor F a una interacción de segundo orden. b) No se podría estimar la varianza residual porque no hay grados de libertad, son 8 datos y hay que estimar 8 parámetros. c) Se necesitan como mínimo 36 experimentos, es decir, un diseño con una replicación. i. El modelo sería: Z[\ = E + ][ + &\ + (]&)[\ + �[\ 0 - 2 = 1,2,3 � = 1,2,3. ii. Utilizando los datos del enunciado se calcula la suma de cuadrados total: Como: 100 + 80 + 70 + 30 + 120 = 400 . La tabla ANOVA es por tanto es igual a: Factor Variabilidad g.d.l Varianza F Herramienta 100 _ − 1 = 2 50 10.85 Velocidad de corte 80 ` − 1 = 2 40 8.68 Herram. x Vel. Corte 70 (_ − 1)(` − 1) = 4 17.5 3.79 Velocidad de avance 30 a − 1 = 1 30 6.51 Residual 120 _`a� − 2 − 2 − 4 − 1 = 26 4.61 Total 400
Compartir