Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA INTRODUCCIÓN AL DISEÑO EXPERIMENTAL ING. SERGIO DAVID MADRIGAL ESPINOZA, DR. DISEÑO DE EXPERIMENTOS 24 DE AGOSTO DE 2022 1 / 62 Contenido Definición de Estadística Cinco conceptos básicos de la Estadística Pruebas de hipótesis Contrastes de la t con muestras aparejadas Análisis de varianza unifactorial Diseño bifactorial 2 / 62 Estadística La Estadística es el arte de aprender de los datos. Se relaciona con su recopilación, descripción y análisis. Esto con el fin de extraer conclusiones. 3 / 62 Contenido Definición de Estadística Cinco conceptos básicos de la Estadística Pruebas de hipótesis Contrastes de la t con muestras aparejadas Análisis de varianza unifactorial Diseño bifactorial 4 / 62 Población El conjunto de elementos de interés de cualquier investigación, recibe el nombre de población. 5 / 62 Muestra y muestra aleatoria Una muestra es cualquier subconjunto de una población. Una muestra aleatoria es aquella que consiste de individuos de la población tomados en forma aleatoria (Cada miembro de la población tiene la misma probabilidad de ser elegido). A menos que se indique lo contrario, se utilizará el término muestra para referirse a una muestra aleatoria. 6 / 62 Parámetro Un parámetro es un valor que representa una característica determinada sobre la población de interés. Los parámetros pueden ser conocidos únicamente si se estudia de forma particular a cada miembro de la población. 7 / 62 Estadístico Se define a un estadístico como una función de los datos de una muestra. Por ejemplo, la media y la varianza de una muestra son estadísticos. Un estadístico es a su vez una variable aleatoria con distribución de probabilidad, valor esperado y demás medidas asociadas a una variable de este tipo. 8 / 62 Estimador Un estimador es un estadístico cuyos valores dependen de la muestra particular extraída. Se utiliza el valor del estimador, llamado valor estimado, para aproximar el valor de un parámetro. 9 / 62 Ejemplo Asocie los conceptos anteriores al siguiente enunciado: Una encuesta reciente, aplicada a 1500 mexi- canos elegidos aleatoriamente, pone de mani- fiesto que 22% de la población total de nuestro país está a dieta. 10 / 62 Contenido Definición de Estadística Cinco conceptos básicos de la Estadística Pruebas de hipótesis Contrastes de la t con muestras aparejadas Análisis de varianza unifactorial Diseño bifactorial 11 / 62 Introducción Con frecuencia, el interés de una investigación consiste en contrastar el parámetro de una población contra un valor especificado de antemano. Puesto que esta comparación no puede realizarse de manera directa, es necesario hacer hipótesis sobre el valor del parámetro y medir su verosimilitud. 12 / 62 Algunos ejemplos ¿Será cierto que ... ▶ la proporción de recién nacidos del genero masculino es de 50%? ▶ la aceleración de la gravedad terrestre es de 9.8m/s2? ▶ el contenido de una lata de refresco de cola es de 335ml? 13 / 62 Hipótesis Una hipótesis es una sentencia acerca de un parámetro de la población. En términos prácticos, podemos decir que una hipótesis es una sospecha que se fundamenta en la experiencia y que puede ser sometida a experimentación para su comprobación. 14 / 62 Hipótesis alternativa La hipótesis alternativa, denota por H1, es aquella que corresponde a la sospecha que se desea demostrar. Su comprobación implicaría un nuevo conocimiento. 15 / 62 Hipótesis nula La hipótesis nula, denotada por H0, es lo opuesto a la alternativa. Por lo tanto, la comprobación de H0 no implicaría ningún hallazgo. A pesar de que durante la experimentación se supone que H0 es verdadera en realidad el propósito de la prueba es desacreditarla, es decir, demostrar que es poco probable. 16 / 62 Por ejemplo, en el caso del genero de un recién nacido, se puede plantear lo siguiente: H0 : P{X =m} = 0.50. Si se sospecha que H0 no es verdadera, se procede a contrastarla contra su opuesto (H1): H1 : P{X =m} ̸= 0.50. 17 / 62 Errores Al contrastar H0 vs. H1, es posible cometer uno de estos dos errores: Error tipo I Rechazar la hipótesis nula cuando es verdadera. Error tipo II No rechazar la hipótesis nula cuando es falsa. 18 / 62 El p–valor La probabilidad de obtener los datos observados suponiendo que H0 es verdadera recibe el nombre de p–valor. Viene del inglés p-value (probabilistic value). 19 / 62 Nivel de Significancia y Criterio de Rechazo Después de formular las hipótesis se debe definir cuál es la probabilidad de cometer el Error Tipo I que estamos dispuestos a correr. A esta probabilidad se le llama nivel de significancia y se representa con la letra griega α. De esta manera, si p–valor es menor o igual que α, la hipótesis nula debe rechazarse. En la práctica los valores típicos de α son 0.05 y 0.01. 20 / 62 Estadístico del contraste Algunas veces resulta impráctico obtener el p–valor de la prueba. Cuando esto sucede, se utiliza en su lugar el Estadístico del Contraste cuyo valor debería ocurrir fuera de cierta región de valores cuando H0 es falsa. De cumplirse esto, simplemente se dice que la hipótesis nula ha sido rechazada. 21 / 62 Pasos para contrastar hipótesis (1) Establecimiento de las hipótesis. (2) Determinar el criterio de rechazo de la hipótesis nula. (3) Cálculo del estadístico del contraste o del p–valor. (4) Conclusiones. 22 / 62 Ejemplo Suponga que usted tienen la sospecha (hipótesis) de que una moneda está cargada de tal forma que al lanzar un volado con ella, es más probable obtener águila que sello. Formule un contraste de hipótesis estadísticas para comprobar su sospecha. La muestra consta de cinco volados en los que siempre se observó águila. 23 / 62 Solución 1. H0: No está cargada al águila (P{águila} ≤ 1/2). H1: Sí está cargada al águila (P{águila} > 1/2). α = 0.05. 2. Rechazar H0 si p–valor ≤ α. 3. p–valor = probabilidad de obtener la muestra dado que la nula es verdadera, = (1/2)5, = 0.03125. 4. Se rechaza H0. La evidencia indica que la moneda está cargada. 24 / 62 ¿De donde sale (1/2)5? Sea X el número de águilas en n = 5 volados. La probabilidad de obtener águila en cada volado es p = 1/2. Entonces, P{X = } = � n � p(1 − p)n−, P{X = 5} = � 5 5 � (1/2)5(1 − 1/2)5−5, = (1/2)5. 25 / 62 Contenido Definición de Estadística Cinco conceptos básicos de la Estadística Pruebas de hipótesis Contrastes de la t con muestras aparejadas Análisis de varianza unifactorial Diseño bifactorial 26 / 62 Universidad Autónoma de Nuevo León Facultad de Ingenierı́a Mecánica y Eléctrica Actividad 1 del curso de Diseño de experimentos, clave (MCCCXXXI). Alumno: Matrı́cula 1. Doce inspectores midieron el diámetro de un cojinete de bolas, utilizando cada uno dos tipos diferentes de calibradores. ¿Existen diferencias significativas entre los calibradores? Utilice α = 0.05. Inspector Calibrador 1 Calibrador 2 1 0.265 0.264 2 0.265 0.265 3 0.266 0.264 4 0.267 0.266 5 0.267 0.267 6 0.265 0.268 7 0.267 0.264 8 0.267 0.265 9 0.265 0.265 10 0.268 0.267 11 0.268 0.268 12 0.265 0.269 Situación Suponga que X1, . . . , Xm y Y1, . . . , Ym son muestras del mismo tamaño procedentes de dos poblaciones normales con medias μ y μy, respectivamente. Además, existe una relación entre los valores de los datos X y Y. Es decir, los pares (X, Y), = 1, . . . ,m, no son independientes. 28 / 62 Contrastes y sus respectivos cálculos H0 H1 Cál. del TS Rechazar H0 si: p–valor μd = 0 μd ̸= 0 p m D̄ Sd |TS| ≥ tm−1,α/2 2P{Tm−1 ≥ |TS|} μd ≤ 0 μd > 0 p m D̄ Sd TS ≥ tm−1,α P{Tm−1 ≥ TS} Nota: se define μd = μ − μy, D = X − Y para = 1, . . . ,m, D̄ y Sd son la media y la desviación estándar de D, respectivamente. 29 / 62 Ejemplo Para estudiar la efectividad de cierto producto reductor de peso, éste fue suministrado a nueve individuos a los que se sometió a cierto régimen dietético durante dos semanas. Se registraron sus pesos, en libras, antes del programay seis meses después. Los resultados son los siguientes: 30 / 62 Datos Sujeto Antes Después 1 197 185 2 212 220 3 188 180 4 226 217 5 170 185 6 194 197 7 233 219 8 166 170 9 205 202 Cuadro 1: Resultados del programa en libras. Pruebe la hipótesis alternativa de que la dieta funciona. Utilice α = 0.05. 31 / 62 Solución 1. H0: μ ≤ μy =⇒ μ − μy ≤ 0 =⇒ μd ≤ 0. H1: μ > μy =⇒ μ − μy > 0 =⇒ μd > 0. α = 0.05. 2. Rechazar H0 si TS ≥ tm−1,α, con t8,0.05 = 1.8595. 3. TS = p m D̄ Sd , = p 9 1.7778 9.8714 , = 0.5403. 4. No se rechaza H0. La evidencia de reducción de peso es insuficiente. 32 / 62 Ejemplo Se desea averiguar el efecto que tiene un aditivo de la gasolina que se ha desarrollado recientemente sobre la distancia recorrida por unidad de carburante. Para obtener información, se han seleccionado siete coches, y las millas (por galón de gasolina) se registraron posteriormente. Para cada coche, esto se hizo usando gasolina sin aditivo y con aditivo. Se obtuvieron los siguientes resultados: 33 / 62 Datos Coche Sin aditivo Con aditivo 1 24.2 23.5 2 30.4 29.6 3 32.7 32.3 4 19.8 17.6 5 25.0 25.3 6 24.9 25.4 7 22.2 20.6 Cuadro 2: Resultados de las pruebas en millas por galón. Pruebe la hipótesis nula de que el aditivo no influye sobre la distancia. 34 / 62 Solución 1. H0: μ = μy =⇒ μ − μy = 0 =⇒ μd = 0. H1: μ ̸= μy =⇒ μ − μy ̸= 0 =⇒ μd ̸= 0. α = 0.05. 2. Rechazar H0 si |TS| ≥ tm−1,α/2 donde t6,0.025 = 2.4469. 3. TS = p m D̄ Sd , = p 7 0.7 0.9661 , = 1.917. 4. No se rechaza H0. No hay evidencia de que el aditivo influya sobre el millage. 35 / 62 Contenido Definición de Estadística Cinco conceptos básicos de la Estadística Pruebas de hipótesis Contrastes de la t con muestras aparejadas Análisis de varianza unifactorial Diseño bifactorial 36 / 62 Universidad Autónoma de Nuevo León Facultad de Ingenierı́a Mecánica y Eléctrica Actividad 2 del curso de Diseño de experimentos, clave (MCCCXXXI). Alumno: Matrı́cula Se estudia el crecimiento, en centı́metros, de cierta planta que crece en 6 diferentes áreas pantanosas. Se eligie- ron muestras de 5 plantas aleatoriamente y se midió su crecimiento en las distintas áreas. ¿Influye el área en el crecimiento de las plantas? Utilice α = 0.01. Área 1 Área 2 Área 3 Área 4 Área 5 Área 6 1 2.96 4.93 6.62 4.11 5.53 7.67 2 6.77 3.49 5.28 4.02 5.11 6.52 3 3.60 3.76 7.02 3.98 5.01 6.34 4 6.99 4.48 6.67 4.98 4.72 6.59 5 5.94 2.69 8.33 4.34 3.85 9.02 Situación Se tienen n muestras, cada una de tamaño m. Las muestras son independientes y normalmente distribuidas con media μj (j = 1, . . . , n) y varianza común σ2. 38 / 62 Realización de la prueba 1. Las hipótesis se plantean de la siguiente manera: H0: μ1 = μ2 = · · · = μn. H1: No todas las medias son iguales. 2. Rechazar H0 si TS ≥ Fn−1,n(m−1),α. 3. Sean X̄j y S2j la media y la varianza de la muestra j, respectivamente. El estadístico del contraste es: TS = mS̄2 ∑n j=1 S2 j /n , donde S̄2 = ∑n j=1 (X̄j − ¯̄X)2 n − 1 , (1) siendo ¯̄X la media de todas las medias. 4. Conclusiones. 39 / 62 Ejemplo Un investigador de una cooperativa de consumidores, diseñó un estudio de distancias asociadas a tres marcas de gasolina. Usó 15 motores idénticos para conseguir la misma velocidad. El investigador asignó aleatoriamente cada marca de gasolina a 5 de los citados motores. Después, se puso en marcha cada motor con 10 galones de gasolina. Las millas recorridas en cada caso fueron las siguientes: 40 / 62 Gasolina 1 Gasolina 2 Gasolina 3 220 244 252 251 235 272 226 232 250 246 242 238 260 225 256 Cuadro 3: Resultados de las pruebas. ¿Tienen el mismo rendimiento las tres gasolinas? Utilice α = 0.01. 41 / 62 Solución 1. H0: μ1 = μ2 = μ3. H1: Al menos una media es diferente del resto. α = 0.01. 2. Rechazar H0 si TS ≥ Fn−1,n(m−1),α donde F2,12,0.01 = 6.927. 3. TS = mS̄2 ∑n j=1 S2 j /n , = 5(86.3333) 165.9667 , = 2.6009. 4. No se rechaza H0. La evidencia indica que las gasolinas no influyen en el rendimiento. 42 / 62 Ejemplo Los siguientes datos se refieren al número de muertos por cada 10000 adultos en una gran ciudad durante las distintas estaciones del año: Año Invierno Primavera Verano Otoño 1982 33.6 31.4 29.8 32.1 1983 32.5 30.1 28.5 29.9 1984 35.3 33.2 29.5 28.7 1985 34.4 28.6 33.9 30.1 1986 37.3 34.1 28.5 29.4 ¿Depende la tasa de mortalidad de la estación? 43 / 62 Solución 1. H0: μ1 = μ2 = μ3 = μ4. H1: Al menos una media es diferente del resto. α = 0.05. 2. Rechazar H0 si TS ≥ Fn−1,n(m−1),α con F3,16,0.05 = 3.239. 3. TS = mS̄2 ∑n j=1 S2 j /n , = 5(4.6633) 3.7325 , = 6.2469. 4. Se rechaza H0. La evidencia indica que las estaciones del año si influyen sobre la tasa de mortandad. 44 / 62 Contenido Definición de Estadística Cinco conceptos básicos de la Estadística Pruebas de hipótesis Contrastes de la t con muestras aparejadas Análisis de varianza unifactorial Diseño bifactorial 45 / 62 Situación Se tiene el factor fila (donde = 1, . . . ,m representa el índice de sus niveles) y el factor columna (j = 1, . . . , n). Las observaciones son acomodadas en una tabla como la siguiente: X11 X12 · · · X1j · · · X1n X21 X22 · · · X2j · · · X2n ... ... ... ... ... ... X1 X2 · · · Xj · · · Xn ... ... ... ... ... ... Xm1 Xm2 · · · Xmj · · · Xmn 46 / 62 Supuestos Los valores Xj, son variables aleatorias normales e independientes con varianza común σ2. El esperado de cada Xj es E � Xj � = μ + α + βj donde μ es la desviación total, α es la desviación debida a la fila , βj es la desviación de la columna j. Las desviaciones debidas a las filas y columnas, cumplen lo siguiente: m ∑ =1 α = n ∑ j=1 βj = 0 47 / 62 Estimación Defínanse los siguientes estadísticos X· = ∑n j=1 Xj n X·j = ∑m =1 Xj m X·· = ∑m =1 ∑n j=1 Xj mn Es posible demostrar que ▶ X·· estima a μ (μ̂ = X··) ▶ X· − X·· estima a cada α (α̂ = X· − X··) ▶ X·j − X·· estima a cada βj (β̂j = X·j − X··) 48 / 62 Ejemplo Se han utilizado tres lavadoras distintas para probar la efectividad de cuatro detergentes diferentes con los siguientes resultados: Lavadora Detergente 1 2 3 1 53 50 59 2 54 54 60 3 56 58 63 4 50 45 58 Estime μ, α y βj. 49 / 62 Solución Lavadora Detergente 1 2 3 X· 1 53 50 59 54 2 54 54 60 56 3 56 58 63 59 4 50 45 58 51 X·j 53.25 51.75 60 X·· = 55 50 / 62 Solución Por lo tanto, μ̂ = X·· = 55 α̂1 = X1· − X·· = − 1 α̂2 = X2· − X·· = 1 α̂3 = X3· − X·· = 4 α̂4 = X4· − X·· = − 4 β̂1 = X·1 − X·· = − 1.75 β̂2 = X·2 − X·· = − 3.25 β̂3 = X·3 − X·· = 5.00 51 / 62 Universidad Autónoma de Nuevo León Facultad de Ingenierı́a Mecánica y Eléctrica Actividad 3 del curso de Diseño de experimentos Alumno: Matrı́cula Los datos mostrados en el cuadro, representan el número de piezas defectuosas producidas por cuatro trabajadores que utilizan, cua- tro máquinas diferentes. Utilice su calculadora y α = 0.01 para contestar las siguiente preguntas: 1. 50 puntos ¿Influyen las máquinas en el número de defectos? 2. 50 puntos ¿Influyen los trabajadores? Máquina Trabajador 1 2 3 4 1 41 42 40 35 2 35 42 43 36 3 42 39 44 47 4 38 35 38 32 Pregunta: 1 2 Total Puntos: 50 50 100 Calificación: Realización de la prueba (filas) 1. Las hipótesis asociadas a las filas son: H0: α = 0 para toda . H1: No todos los valores son cero. 2. Rechazar H0 si TS ≥ Fm−1,(m−1)(n−1),α. 3. El estadístico del contraste es: TS = nVar(X·) SSe/[(m − 1)(n − 1)] , donde Var(X·) es la varianza de las medias de las filas y, SSe = m ∑ =1 n ∑ j=1 (Xj − X· − X·j + X··)2. 4. Conclusiones. 53 / 62 Realización de la prueba (columnas) 1. Las hipótesis asociadas a las columnas son: H0: βj = 0 para toda j. H1: No todos los valores son cero. 2. Rechazar H0 si TS ≥ Fn−1,(m−1)(n−1),α. 3. El estadístico del contraste es: TS = mVar � X.j � SSe/[(m − 1)(n − 1)] , donde Var � X·j � es la varianza de las medias de las columnas. 4. Conclusiones. 54 / 62 Ejemplo Determine si los detergentes y las lavadoras influyen sobrelas puntuaciones de efectividad. 55 / 62 Solución (cálculos previos) Lavadora Detergente 1 2 3 X· 1 0.75 -0.75 0 54 2 -0.25 1.25 -1 56 3 -1.25 2.25 -1 59 4 0.75 -2.75 2 51 X·j 53.25 51.75 60 X·· = 55 Var(X·) = 11.3333, Var � X·j � = 19.3125, SSe = (0.75)2 + (−0.75)2 + · · · + (2)2, = 23.5. 56 / 62 Solución (filas) 1. H0: α1 = α2 = α3 = α4 = 0. H1: No todos los valores son cero. α = 0.05. 2. Rechazar H0 si TS ≥ Fm−1,(m−1)(n−1),α, donde F3,6,0.05 = 4.757. 3. . TS = nVar(X·) SSe/[(m − 1)(n − 1)] , = 3(11.33) 23.5/6 , = 8.6809. 4. Se rechaza H0. El detergente si influye sobre las puntuaciones de efectividad. 57 / 62 Solución (columnas) 1. H0: β1 = β2 = β3 = 0. H1: No todos los valores son cero. α = 0.05. 2. Rechazar H0 si TS ≥ Fn−1,(m−1)(n−1),α, donde F2,6,0.05 = 5.143. 3. . TS = mVar � X.j � SSe/[(m − 1)(n − 1)] , = 4(19.3125) 23.5/6 , = 19.7234. 4. Se rechaza H0. Las lavadoras también influyen sobre las puntuaciones. 58 / 62 Ejemplo Cinco estudiantes se sometieron a cuatro test de lectura diferentes. Sus puntuaciones fueron: Examen 1 2 3 4 5 1 75 73 60 70 86 2 78 71 64 72 90 3 80 69 62 70 85 4 73 67 63 80 92 Determine si el tipo de examen y el alumno influyen en las puntuaciones. 59 / 62 Solución (cálculos previos) Examen 1 2 3 4 5 X. 1 -0.3 4.2 -1.05 -1.8 -1.05 72.8 2 0.5 0 0.75 -2 0.75 75.0 3 4.3 -0.2 0.55 -2.2 -2.45 73.2 4 -4.5 -4 -0.25 6 2.75 75.0 X.j 76.50 70.00 62.25 73.00 88.25 X·· = 74 Var(X·) = 1.36, Var � X·j � = 91.09375. SSe = 138.1. 60 / 62 Solución (filas) 1. H0: α1 = α2 = α3 = α4 = 0. H1: No todos los valores son cero. α = 0.05. 2. Rechazar H0 si TS ≥ Fm−1,(m−1)(n−1),α, donde F3,12,0.05 = 3.49. 3. . TS = nVar(X·) SSe/[(m − 1)(n − 1)] , = 5(1.36) 138.1/12 , = 0.5909. 4. No se rechaza H0. No hay evidencia de que el tipo de examen influya en la calificación. 61 / 62 Solución (columnas) 1. H0: β1 = β2 = β3 = β4 = β5 = 0. H1: No todos los valores son cero. α = 0.05. 2. Rechazar H0 si TS ≥ Fn−1,(m−1)(n−1),α, donde F4,12,0.05 = 3.259. 3. . TS = mVar � X.j � SSe/[(m − 1)(n − 1)] , = 4(91.09375) 138.1/12 , = 31.6618. 4. Se rechaza H0. Evidentemente, los alumnos sí influyen sobre las calificaciones. 62 / 62 Definición de Estadística Cinco conceptos básicos de la Estadística Pruebas de hipótesis Contrastes de la t con muestras aparejadas Análisis de varianza unifactorial Diseño bifactorial
Compartir