Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Laboratorio de Estadística Industrial 1 UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE INGENIERÍA INDUSTRIAL INFORME FINAL DE LABORATORIO PROFESOR: ING. PÉREZ QUISPE, VÍCTOR CURSO: ESTADÍSTICA INDUSTRIAL INTEGRANTES: CASTILLO CHUMACERO DIEGO YOEL 12170092 Laboratorio de Estadística Industrial 2 INDICE: PRUEBA DE HIPOTESIS DE LA MEDIA DE LA POBLACION: ............................................................................................3 PRUEBA DE HIPOTESIS DE DOS MEDIAS POBLACIONALES: ..........................................................................................5 PRUEBA DE HIPOTESIS PARA PROPORCIONES ............................................................................................................6 PRUEBA DE HIPOTESIS PARA PROPORCIONEDS CON OBSERVACIONES INDEPENDIENTES ..........................................7 PRUEBA DE HIPOTESIS T STUDENT ..............................................................................................................................9 PRUEBA DE HIPOTESIS PARA DIFERENCIA ENTRE DOS MEDIAS ................................................................................. 11 PRUEBA DE HIPOTESIS DE MUESTRA PAREADA ......................................................................................................... 14 COMPARACION DE DOS VARIANZAS POBLACIONALES ............................................................................................... 17 ANOVA UNA DIRECCION: ............................................................................................................................................ 19 PROBLEMAS 1.-................................................................................................................................................................. 19 PROBLEMA 2.- .................................................................................................................................................................. 21 ANOVA DOS DIRECCIONES: ........................................................................................................................................ 24 PROBLEMA 1.- .................................................................................................................................................................. 24 PROBLEMA 2.- .................................................................................................................................................................. 27 REGRESION SIMPLE: .................................................................................................................................................. 31 PROBLEMA 1.- .................................................................................................................................................................. 31 PROBLEMA 2.- .................................................................................................................................................................. 32 PROBLEMA 3.- .................................................................................................................................................................. 35 PROBLEMA 4.- .................................................................................................................................................................. 38 REGRESION MULTIPLE ............................................................................................................................................... 39 METODOS NO PARAMETRICOS: .................................................................................................................................. 53 SERIE DE TIEMPO: ………………………………………………………………………………………………………………………………75 Laboratorio de Estadística Industrial 3 LABORATORIO DE ESTADISTICA INDUSTRIAL PRUEBA DE HIPOTESIS DE LA MEDIA DE LA POBLACION: PRUEBA BILATERAL DE DOS COLAS: Problema 1.- En Western University, la media histórica en las puntuaciones de los solicitantes de una beca es 900. La desviación estándar poblacional histórica que se considera conocida es s=180. Cada año, el decano asistente utiliza una muestra de las solicitudes para determinar si la puntuación media ha cambiado entre los solicitantes de becas. a) Establezca la hipótesis. b) ¿Cuál es el intervalo de 95% de confianza para la estimación de la media poblacional de las puntuaciones en el examen si en una muestra de 200 de estudiantes la media muestral es 935? c) Use el intervalo de confianza para realizar una prueba de hipótesis. Manejando α = 0.05, ¿a que conclusión llega? d) ¿Cuál es el valor p? SOLUCION: 1) Ho: µ = 900 Ha: µ ≠ 900 2) α =0.05 3) Z, n≥30 4) El valor crítico es -1.96 Intervalos: R.C = <-∞, -1.96> U <1.96, ∞> R.A = [-1.96 , 1.96] Zk ɛ R.C : Rechazo Ho , acepto Ha. 5) 𝑧 = 900 − 935 180 √200 = −2.75 Interpretación: La puntuación media de los solicitantes de becas ha cambiado. Calculando el valor de p Para z = -2.75 → 0.003 P= 2 x 0.003 = 0.006 P < α → Rechazo Ho, acepto Ha. Laboratorio de Estadística Industrial 4 Solución Minitab: Pasos a seguir en Minitab: En la opción de la barra de menu selecciona las opciones estadísticas. Luego la opción z de una muestra. Opción datos resumidos (tamaño de la muestra, media). Luego escogemos si es una prueba de una cola o dos colas. PRUEBA UNILATERAL DERECHA Problema 2.- Una empresa de venta de bienes raíces a nivel estatal, Farm Associates, se especializa en ventas de propiedades rurales en el estado de Nebraska. Sus registros indican que el tiempo medio de venta de una granja es de 90 días. Debido a sus recientes condiciones de sequía, estima que el tiempo de venta será superior a 90 días. Un estudio a nivel estatal de 100 granjas vendidas recientemente revelo que el tiempo medio de venta era 94 días, con una desviación estándar de 22 días. Al nivel de significancia de 0.10, ¿se puede concluir que el tiempo de venta ha aumentado? SOLUCION: 1) Ho: µ = 90 Ha: µ > 90 2) α = 0.10 3) Z , n≥30 4) Intervalos: R.C : <1.282 , ∞> R.A : < -∞ , 1.282] Zk ɛ R.C. Rechazo Ho, acepto Ha. 5) 𝑧 = 94 − 90 22 √100 = 1.82 Interpretación: El tiempo promedio de venta de bienes raíces a nivel estatal de la empresa Farm Associates especialista en ventas de propiedades rurales en el estado de Nebraska aumento. Laboratorio de Estadística Industrial 5 Solución Minitab. Pasos a seguir en Minitab: En la opción de la barra de menu selecciona las opciones estadísticas. Luego la opción z de una muestra. Opción datos resumidos (tamaño de la muestra, media). Luego escogemos si es una prueba de una cola o dos colas. PRUEBA DE HIPOTESIS DE DOS MEDIAS POBLACIONALES: PRUEBA BILATERAL DOS COLAS Problema- Se esperaba que el día de san Valentín el gasto promedio fuera de 100.89 (USA Today, 13 de febrero de 2006). Hay diferencia en las cantidades que desembolsan los hombres y las mujeres? el gasto promedio en una muestra de 40 hombres fue de 135.67 y en una muestra de 30 mujeres fue de 68.64. Por estudios anteriores se sabe que la desviación estándar poblacional en el consumo de los hombres es 35 y en el de las mujeres es 20. a) ¿Cuál es la estimación puntual de la diferencia entre el gasto medio poblacional de los hombres y el gasto medio poblacional de las mujeres? b) Elabore un intervalo de confianza de 99% para la diferencia entre las dos medias poblacionales. SOLUCION: 1) Ho: µ1 = µ2 Ha: µ1 ≠ µ2 2) α = 0.01 3) Z , n ≥ 30 4) Para α = 0.01 → Z = 2.575 5) 𝑍 = 135.67 − 68.64 √35 2 40 + 202 30 = 10.1 Laboratorio de Estadística Industrial 6 Intervalos:R.C : ˂-∞,-2.575˃U<2.575,∞˃ RA:[-2.575,2.575] Zk ɛ R.C, Acepto Ha, rechazo Ho. Interpretación: No hay diferencia en el gasto promedio en el día de San Valentín de hombres y mujeres. PRUEBA DE HIPOTESIS PARA PROPORCIONES PRUEBA UNILATERAL DERECHA Problema 1.- Un artículo reciente, publicado en el diario USA Today, indica que solo a uno de cada tres egresados recientes de una universidad les espera un puesto de trabajo. En una investigación a 100 egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo. ¿Puede concluirse, en el nivel de significancia 0.02, que en su universidad la proporción de estudiantes que tienen trabajo es mayor? SOLUCION: 1) Ho: P= 0.333 Ha: P > 0.333 2) α = 0.02 3) Z 4) Para α = 0.02 → Z = 2.05 5) 𝑍 = 0.8 − 0.333 √0.333 ∗ (1 − 0.333) 100 = 9.91 Intervalos: R.C: < -∞ , 2.05> R.A: [2.05 , ∞> Zk ɛ RC → Rechazo Ho, acepto Ha. Interpretación: Podemos concluir que la proporción de egresados de dicha universidad es mayor a 0.333. Utilizando Minitab: Prueba e IC para una proporción Prueba de p = 0.333 vs. p no = 0.333 Muestra X N Muestra p IC de 95% Valor Z Valor P 1 80 100 0.800000 (0.721601, 0.878399) 9.91 0.000 Uso de la aproximación normal. Laboratorio de Estadística Industrial 7 Pasos en Minitab: En la opción de la barra de menu selecciona las opciones estadísticas y luego estadísticas básicas. Luego la opción 1proporcion de una muestra. Opción datos resumidos (número de eventos y numero de ensayos). Escogemos también una proporción hipotética. Luego escogemos si es una prueba de una cola o dos colas. PRUEBA DE HIPOTESIS PARA PROPORCIONEDS CON OBSERVACIONES INDEPENDIENTES PRUEBA BILATERAL: Problema 1.- En una prueba de calidad de dos comerciales de televisión, cada anuncio se transmitió, en áreas separadas de prueba, seis veces en una semana. A la semana siguiente se realizó una encuesta telefónica para identificar individuos que vieron los comerciales. A estas personas se les pidió su opinión sobre cuál era el principal mensaje de los anuncios. Se obtuvieron los siguientes resultados. Comercial A Comercial B Número de personas que vio el comercial 150 200 Número de personas que recordaba el mensaje 63 60 a) Use α=0.05 y pruebe la hipótesis de que entre los dos comerciales no hay diferencia en las proporciones poblacionales de personas que recordaron el mensaje. b) Calcule un intervalo de 95% de confianza para la diferencia entre las proporciones de personas que recordaron el mensaje en las dos poblaciones. SOLUCION: 1) Ho: p1=p2 Ha: p1≠p2 2) α 3) Z, n>30 4) Para α=0.05: Z=1.64 5) 𝑍 = 0.412−0.3 √0.35(1−0.35)( 1 150 + 1 200 ) = 2.174 Intervalos: RC: <-∞;-1.64>U<1.64; ∞> RA: [-1.64;1.64] Zk ɛ RC → Rechazo Ho, acepto Ha. Interpretación: Se concluye que hay diferencia en la proporción de personas que recordaron el mensaje del comercial A y la proporción de personas que recordaron el mensaje del comercial B. Utilizando con Minitab: Prueba e IC para dos proporciones Muestra X N Muestra p 1 63 150 0.420000 2 60 200 0.300000 Laboratorio de Estadística Industrial 8 Diferencia = p (1) - p (2) Estimado de la diferencia: 0.12 IC de 95% para la diferencia: (0.0186488, 0.221351) Prueba para la diferencia = 0 vs. No = 0: Z = 2.33 Valor P = 0.020 Como el valor de p=0.02<0.05 rechazamos la hipótesis nula y concluimos que hay diferencia en la proporción de personas que recordaron el mensaje del comercial A y la proporción de personas que recordaron el mensaje del comercial B. Pasos para Minitab: En la opción de la barra de menu selecciona las opciones estadísticas y luego estadísticas básicas. Luego la opción 1proporcion de una muestra. Opción datos resumidos (número de eventos y numero de ensayos). Escogemos también una proporción hipotética. Luego escogemos si es una prueba de una cola o dos colas. PRUEBA BILATERAL: Problema 2.- Una muestra aleatoria de 1000 ciudadanos nacidos en EUA, revelo que 198 estuvieron a favor de la reanudación de las relaciones diplomáticas con cuba. Análogamente 117 ciudadanos de una muestra de 500 estadounidenses no nacidos en EUA, estuvieron a favor. Al nivel de significancia de 0.05, ¿hay diferencia en la proporción de ciudadanos de EUA nacidos ahí que estén a favor de la reanudación de las relaciones diplomáticas con Cuba, y la proporción de los estadounidenses no nacidos en el país que están a favor de tales relaciones? SOLUCION: Nacidos EUA No Nacidos en EUA X1=198 X2=177 N1=1000 N2=500 P1= 198 1000 =0.198 P2= 177 500 =0.354 Pc= 198+177 1000+500 =0.25 1) Ho: P1=P2 Ha:P1 ≠P2 2) α = 0.05 3) Z , n ≥ 30 4) Para α=0.05 (dos colas) →Z=1.96 5) 𝑍 = 0.198 − 𝑂. 354 √0.25 × (1 − 0.25) × ( 1 1000 + 1 500 ) = −6.28 Zk ɛ R.C, Rechazo Ho, Acepto Ha. Laboratorio de Estadística Industrial 9 Pasos para Minitab: En la opción de la barra de menu selecciona las opciones estadísticas y luego estadísticas básicas. Luego la opción 1proporcion de una muestra. Opción datos resumidos (número de eventos y numero de ensayos). Escogemos también una proporción hipotética. Luego escogemos si es una prueba de una cola o dos colas. Interpretación: Hay diferencia en la proporción de ciudadanos de EUA nacidos ahí que estén a favor de la reanudación de las relaciones diplomáticas con Cuba, y la proporción de los estadounidenses no nacidos en el país que están a favor de tales relaciones. PRUEBA DE HIPOTESIS T STUDENT PRUEBA UNILATERAL IZQUIERDA Problema 1.- El fabricante de las motocicletas Ososki asegura q éstas dan un rendimiento promedio de 87 millas por galón de gasolina. En una muestra de ocho motocicletas los rendimientos fueron: 88 82 81 87 80 78 79 89 En el nivel de significancia 0.05, ¿el rendimiento es inferior a 87 millas por galón? SOLUCION: 1) Ho: µ1=µ2 Ha: µ1 < µ2 2) α= 0.05 3) t 4) Para α=0.05 → t=-1.89 GL=7 Intervalos: R.C: < - ∞, -1.89> R.A: [ -1.89 , ∞> Tk ɛ R.C → Rechazo Ho , acepto Ha. 5) Laboratorio de Estadística Industrial 10 𝑡 = 87 − 83 4.34 √7 = −2.61 Interpretación: El rendimiento promedio de las motocicletas Ososki es menor de 87 millas por galón de gasolina. Pasos para Minitab: En la barra de menú seleccionamos la opción de estadísticos, luego estadísticos básicos. Luego seleccionamos la opción de seleccionamos t de una muestra. Seleccionamos datos en columnas. Ponemos como dato una media hipotética. PRUEBA UNITALERAL IZQUIERDA: Problema 2.- El consumo anual per cápita de leche en Estados Unidos es de 21.6 galones. Usted cree que en el oeste medio el consumo de leche es mayor y desea fundamentar su opinión. En una muestra de 16 persona en Webster City, pueblo del oeste medio, la media muestral del consumo anual es de 21.4 galones y la desviación estándar es s=4.8 a) Elabore una prueba de hipótesis que se pueda usar para determinar si el consumo medio anual en webster city es mayor que la media nacional. b) t ¿Cuál sería una estimación puntual de la diferencia entre el consumo medio anual en webster city y la media nacional? Laboratorio de Estadística Industrial 11 SOLUCION: 1) Ho:µ=21.6 Ha: µ˂21.6 2) α= 0.05 3) t 4) G.L=16-1=15 R.A:[-1.75,∞> R.C:˂∞,-1.75> Tk ɛ R.A → Rechazo Ha, acepto Ho. 5) t= 21.4−21.6 4.8 √16 =-0.17 Interpretacion: El promedio de consumo de leche en el oeste medio es igual al consumo de leche anual per capita de leche en Estados Unidos. Pasos para Minitab: En la barra de menú seleccionamosla opción de estadísticos, luego estadísticos básicos. Luego seleccionamos la opción de seleccionamos t de una muestra. Seleccionamos datos en columnas. PRUEBA DE HIPOTESIS PARA DIFERENCIA ENTRE DOS MEDIAS Problema 1.- Con cierta periodicidad, Merrill Lynch solicita a sus clientes evaluaciones sobre los consultores y los servicios financieros que les proporciona. Las puntuaciones más altas en la encuesta de satisfacción del cliente indican mejor servicio con 7 como la puntuación más alta. A continuación se presentan en forma resumida las puntuaciones otorgadas a dos consultores financieros por los miembros de dos muestras aleatorias independientes. El consultor A tiene10 años de experiencia, mientras que el consultor B tiene solo 1 año. Use α=0.05 y realice una prueba para determinar si el consultor con más experiencia tiene la media poblacional más alta en la evaluación del servicio. Consultor A Consultor B N1=16 n2=10 Laboratorio de Estadística Industrial 12 X1(media muestral 1)=6.82 x2(media muestral 2)=6.25 S1=0.64 s2=0.75 SOLUCION: 1) Ho: µA = µB Ha: µA > µB 2) α= 0.05 3) t 4) Para α=0.05 → t=1.711 GL=16 +10 – 2= 24 5) 𝑡 = 6.82 − 6.75 √15 ∗ 0.64 2 + 9 ∗ 0.752 16 + 10 − 2 ∗ ( 1 16 + 1 10) = 2.07 Intervalos: R.A: <-∞, 1.711] R.C:<1.711 , ∞> Tk ɛ R.C → Rechazo Ho, acepto Ha. Interpretación: El consultor con más experiencia tiene la media poblacional más alta en la evaluación del servicio. Pasos para Minitab: En la barra de menú seleccionamos la opción de estadísticos, luego estadísticos básicos. Luego seleccionamos la opción de seleccionamos t de dos muestra. Seleccionamos datos resumidos (tamaño de una muestra, desviación, etc.). PRUEBA UNILATERAL IZQUIERDA: Problema 2.- El gerente de una empresa de servicios de mensajería considera que los paquetes enviados al final del mes son más pesados que los enviados al principio del mes. Como un experimento, pesó una muestra aleatoria de 20 paquetes remitidos a principio de un mes. Encontró que el peso medio era de 20.25 libras, y la desviación estándar, 5.84 libras. Al final del mes se seleccionaron al azar diez paquetes y se encontró que su peso medio era 24.80 libras, y la desviación estándar, 5.67 lb. Al nivel de significancia de 0.05 lb, ¿puede concluirse que los paquetes enviados al final del mes son más pesados? SOLUCION: Laboratorio de Estadística Industrial 13 INICIO DEL MES FINAL DEL MES S1=5.84 S2=5.67 N1=20 N2=10 X1=20.25 X2=24.80 1) Ho: µ1 = µ2 Ha: µ1 ˂ µ2 2) α = 0.05 3) t, n ˂ 30 4) GL=20+10-2=28 T(0.05,28)=-1.701 5) Sp2= 19×5.842+9×5.672 28 =33.48 t= 20.25−24.80 √33.48×( 1 20 + 1 10) =-2.03 tk ɛ R.C, Rechazo Ho, Acepto Ha. Interpretación: El peso medio de los paquetes enviados al final del mes es más pesado que los enviados al principio del mes. 0.4 0.3 0.2 0.1 0.0 X D e n si d a d -1.701 0.05 0 Gráfica de distribución T, df=28 Laboratorio de Estadística Industrial 14 Minitab: Pasos para Minitab: En la barra de menú seleccionamos la opción de estadísticos, luego estadísticos básicos. Luego seleccionamos la opción de seleccionamos t de dos muestra. Seleccionamos datos resumidos (tamaño de una muestra, desviación, etc.). PRUEBA DE HIPOTESIS DE MUESTRA PAREADA PRUEBA UNILATERAL IZQUIERDA PROBLEMA 1.- Scott Seggity, propietario de Seggity Software, Inc., adquirió recientemente un circuito integrado especial, un coprocesador matemático que reduciría de modo significativo el tiempo de procesamiento para probar el circuito, seleccionó una muestra de 12 programas, los cuales fueron utilizados en 2 computadoras idénticas, una con el circuito y la otra sin él. A continuación se reportan los tiempos de procesamiento, en segundos. Al nivel de significancia de 0.05, ¿puede concluir el señor Seggity que el nuevo coprocesador matemático reducirá el tiempo de procesamiento? Determine el valor p. PROGRAMA SIN COPROCESADOR CON PROCESADOR DIFERENCIA 1 1.23 0.60 -0.63 2 0.69 0.93 0.24 3 1.28 0.95 -0.33 4 1.19 1.37 0.18 5 0.78 0.62 -0.16 6 1.02 0.99 -0.03 7 1.30 0.60 -0.7 8 1.37 1.35 -0.02 9 1.29 0.67 -0.62 10 1.17 0.89 -0.28 11 1.14 1.29 0.15 12 1.09 1.00 -0.9 SOLUCION: 1) Ho: µd = 0 Ha: µd < 0 2) Para α= 0.05 3) T Laboratorio de Estadística Industrial 15 4) Para α= 0.05, G.L = 12-1=11 → t=- 1.796 5) �̅� = −3.1 12 = −0.258 𝑠�̅� = √2.408 − −3.12 12 11 = 0.38 𝑡 = −0.258 0.38 √12 = −2.03 Intervalos: R.C:˂-∞,-1.796 > R.A :<-1.796, ∞> Tk Ɛ R.C → Rechazo Ho, acepto Ha. Interpretación: Puede concluir el señor Seggity que el nuevo coprocesador matemático reducirá el tiempo de procesamiento. En minitab: Pasos en minitab: Seleccionamos de la barra de menú la opción estadísticas. Luego estadísticas básicas, la opción de t de muestra pareada. Colocamos los datos de la primera muestra y la segunda muestra. PRUEBA UNILATERAL DERECHA: Problema 2.- Una firma de investigación de mercados usa una muestra de individuos para calificar el potencial de compra de un determinado producto antes y después de que los individuos vean un comercial de televisión que lo promociona. La calificación del potencial de compra se efectúa con una escala del al 10, con los valores más altos indicando un mayor potencial. En la hipótesis nula se establece que la media de las calificaciones de “después” será menor o igual a la media de las calificaciones de “antes”. El rechazo de esta hipótesis indica que el comercial mejora la media de la calificación del potencial de compra. Use α=0.05 y los datos de la siguiente tabla para probar esta hipótesis y exprese un comentario sobre la utilidad del comercial. Laboratorio de Estadística Industrial 16 CALIFICACION DE COMPRA d INDIVIDUOS DESPUES ANTES 1 6 5 1 2 6 4 2 3 7 7 0 4 4 3 1 5 3 5 -2 6 9 8 1 7 7 5 2 8 6 6 0 SOLUCION: Después (µ2) Antes (µ1) 1) Ho: µd=0 Ha: µd>0 2) α = 0.05 3) t, n ˂ 30 4) GL=8-1=7 T(0.05,7)=1.895 5) ∑ 𝑑 = 5 ∑ 𝑑2=15 Sd= ∑ 𝑑2− (∑ 𝑑) 2 8 7 = 15− 52 8 7 =1.30 T= 0.625 1.30 √8 =1.36 Tk ɛ R.A, Rechazo Ha, Acepto Ho. Interpretación: La media de las calificaciones de potencial de compra de un determinado producto después de ver el comercial en la televisión será igual a la media de las calificaciones antes de ver el comercial. Solución con minitab: Laboratorio de Estadística Industrial 17 Pasos en minitab: Seleccionamos de la barra de menú la opción estadística. Luego estadísticas básicas, la opción de t de muestra pareada. Colocamos los datos de la primera muestra y la segunda muestra. COMPARACION DE DOS VARIANZAS POBLACIONALES Problema 1.- La mayoría de los conductores sabe que el gasto anual medio en reparaciones de un automóvil depende de la antigüedad del vehículo. Un investigador desea saber si la varianza de los gastos anuales que se aplican en reparación también aumenta con la antigüedad del vehículo. En una muestra de 26 automóviles de 4 años de antigüedad, la desviación estándar muestral para los gastos anuales en reparación fue de $170, y en una muestra de 25 automóviles de 2 años de antigüedad fue de $100. a) Establezca las versiones nula y alternativa de la hipótesis de investigación de que la varianza en los gastos anuales por reparación es mayor entre más viejos son los automóviles. b) Empleando 0.01 como nivel de significancia SOLUCION: 1) Ho: σ1 =σ2 Ha: σ1 >σ2 2) α= 0.01 3) F 4) F = 2.59 5) 𝐹 = 1702 1002 = 2.89 Intervalos:R.C: ˂2.59 , ∞> R.A: ˂-∞, 2.59] Fk Ɛ R.C → Rechazo Ho, acepto Ha. Solución en minitab: Laboratorio de Estadística Industrial 18 Interpretación: La varianza en los gastos anuales por reparación es mayor entre más viejos son los automóviles. Pasos en minitab: En la barra de menú opción estadísticas. Opción estadísticas básicas. Luego la opción de dos varianzas. Como tenemos de dato la desviación estándar y el tamaño de la muestra en datos seleccionamos esa opción. Luego en el cuadro de dialogo opciones escogemos el n.s. luego aceptar, aceptar. PRUEBA BILATERAL: Problema 2.- La compañía Stargell Research Associates realizó un estudio acerca de los hábitos de los radioescuchas, tanto de hombres como de mujeres. Un aspecto del estudio comprendió el tiempo promedio de audición. Se descubrió que el tiempo promedio para los varones es de 35 minutos al día. La desviación estándar en la muestra de los 10 hombres que se estudiaron fue 10 minutos por día. El tiempo promedio de audición para las 12 mujeres estudiadas fue también 35 minutos, pero la desviación estándar fue 12 minutos. Al nivel de significancia 0.10, ¿es posible concluir que existe diferencia éntre la variación de los tiempos de audición de hombres y mujeres? SOLUCION: VARONES MUJERES X1=35 X2=35 N1=10 N2=12 S1=10 S2=12 1) Ho: Ϭ12=Ϭ22 Ha :Ϭ12 ≠Ϭ22 2) α = 0.10 3) Para: F(0.05,11,9)=3.11 F(0.05,9,11)=2.90 1 2.90 =0.48 RA:[0.48,3.11] Laboratorio de Estadística Industrial 19 Fk= 144 100 =1.44 Fk ɛ R.A, Rechazo Ha, Acepto Ho Interpretación: La variación del hábito del tiempo promedio de audición entre hombres y mujeres es igual. Minitab: Pasos en minitab: En la barra de menú opción estadísticas. Opción estadísticas básicas. Luego la opción de dos varianzas. Como tenemos de dato la desviación estándar y el tamaño de la muestra en datos seleccionamos esa opción. Luego en el cuadro de dialogo opciones escogemos el n.s. luego aceptar, aceptar. ANOVA UNA DIRECCION: Problemas 1.- El director de personal de Cander Machine Products está investigando el “perfeccionismo” en el trabajo .Se aplicó una prueba diseñada para medir tal acción a una muestra aleatoria de 18 empleados .Las puntuaciones fueron de 20 a casi 40 .Una de las facetas del estudio incluyo los antecedentes de cada empleado ¿Proviene el laborante de una región rural, de una ciudad pequeña o de una metrópoli? Las puntuaciones son: a) Al nivel de significancia de 0.05 ¿Se puede concluir que hay diferencia en las tres puntuaciones medias? b) Si se rechaza la hipótesis nula .¿Se puede decir que la puntuación media de los empleados que provienen de zonas rurales es diferente de la puntuación de los que vienen de una ciudad grande? ∑ 𝑇𝑐 ∑ 𝑥2 REGION RURAL CIUDAD PEQUEÑA METROPOLI 35 28 24 30 24 28 36 25 26 38 30 30 29 32 34 34 28 31 233 167 142 7823 4693 4092 Laboratorio de Estadística Industrial 20 a) SSTOTAL=∑ 𝑋2 - (∑ 𝑋)2 𝑁 =16608- 5422 18 =287.8 SST=116.3 SSE=171.5 1) Ho:µ1=µ2=µ3 Ha: Al menos una de las tres puntuaciones medias es diferente 2) α= 0.05 3) F 4) F(0.05,3-1,18-3) =F(0.05,2,15)=3.68ç 5) De la tabla anova F =5.09 Fk ε R.C: Rechazo Ho, Acepto Ha. Al menos una puntuación media de una de las tres regiones es diferente de los empleados para investigar su perfeccionismo. FV GRADO.LIBERTAD SUMA DE CUADRADO MEDIAS DE CUADRADO F TRATAMIENTO 2 116.3 58.2 5.09 ERROR 18-3 171.5 11.4 TOTAL 18-1 287.8 Laboratorio de Estadística Industrial 21 b) (X1-X3)±√𝑀𝑆𝐸 × ( 1 𝑁1 + 1 𝑁3 (33.56-26.66)±√11.4 ∗ ( 1 7 + 1 5 ) =8.87 ˄4.92 Intervalo: (4.92, 8.87) El intervalo son signos iguales por lo tanto las medias son diferentes: X1≠X3 Pasos en minitab: Seleccionamos las opciones estadísticas. Luego escogemos ANOVA. Luego anova de un solo factor. Luego escogemos nuestro factor y respuesta, luego aceptar. Problema 2.- En un estudio publicado en el Journal of Small Business Management se concluyó que los individuos que se auto emplean no experimentan tanta satisfacción en el trabajo como los que no se auto emplean. En este estudio, la satisfacción en el trabajo se midió empleando 18 puntos, cada uno de los cuales se evaluaban con una escala de Liker con 1-5 opciones de respuesta que iban de totalmente de acuerdo a totalmente en desacuerdo. En esta escala con una puntuación mayor corresponde a mayor satisfacción con el trabajo. La suma de las puntuaciones de los 18 puntos, que iba de 18-90, se empleó para medir la satisfacción con el trabajo. Suponga que se emplea este método para medir la satisfacción con el trabajo. Suponga que se emplea este método para medir la satisfacción en el trabajo de abogados, terapeutas físicos, carpinteros y analistas de sistemas. A continuación se encuentra los resultados obtenidos en una muestra de 10 individuos de cada profesión. Para α=0.05 Laboratorio de Estadística Industrial 22 SOLUCION: TRATAMIENTO: 1) Ho: m1= m2 =m3= m4. Ha: Al menos es diferente. 2) α=0.05 3) F 4) Abogados (1) Terapeutas físicos (2) Carpinteros (3) Analistas de sistemas (4) 44 55 54 44 42 78 65 73 74 80 79 71 42 86 69 60 53 60 79 64 50 59 64 66 45 62 59 41 48 52 78 55 64 55 84 76 38 50 60 62 Laboratorio de Estadística Industrial 23 F= 2.866 5) Intervalos: R.C: <2.866, ∞> R.A: <-∞, 2.866] Fk ԑ R.C → Rechazamos Ho, aceptamos Ha. Interpretación: El nivel de satisfacción en el trabajo de abogados, terapeutas físicos, carpinteros y analistas de sistemas, al menos uno es diferente. Pasos en minitab: Seleccionamos las opciones estadísticas. Luego escogemos ANOVA. Luego anova de un solo factor. Luego escogemos nuestro factor y respuesta, luego aceptar. Laboratorio de Estadística Industrial 24 ANOVA DOS DIRECCIONES: Problema 1.- En un estudio publicado en el Journal of the American Medical Association se investigaba la demanda cardiaca al apalear grandes cantidades de nieve. Diez hombres saludables se sometieron a pruebas de ejercicio empleando una corredora y una bicicleta ergonómica para brazos. Después estos mismos hombres limpiaron dos tramos de nieve mojada y pesada con una pala ligera para nieve y una máquina eléctrica para despejar nieve. Se midió el ritmo cardiaco, la presión sanguínea y el consumo de oxigeno de cada uno de los participantes en las pruebas, durante la remoción de nieve, y estos valores se compararon con los valores durante la prueba de ejercicio. En la tabla siguiente se presentan los valores de ritmo cardiaco, dados en pulsaciones por minuto, de cada uno de los 10 individuos. Sujeto Corredora Bici ergonómica Para brazos Pala para nieve Máquina eléctrica 1 177 205 180 98 2 151 177 164 120 3 184 166 167 111 4 161 152 173 122 5 192 142 179 151 6 193 172 205 158 7 164 191 156 117 8 207 170 160 123 9 177 181 175 127 10 174 154 191 109 Con α=0.05, como nivel de significancia, realice una prueba para determinar si existe diferencia significativa entre los diversos tratamientos. SOLUCION: TRATAMIENTO: 1) Ho: m1 =m2 =m3 =m4 Ha: AL menos uno es diferente 2) Para α = 0.05 3) F 4) Laboratorio de Estadística Industrial 25 Laboratorio de Estadística Industrial 26 F= 2.96 5) Intervalos: R.C: <2.96, ∞> R.A: < -∞, 2.96] Fk ɛ R.C → Rechazo Ho, acepto Ha. Interpretación: Existe diferencias en los valores de ritmo cardiaco, dados en pulsaciones por minuto, segúnlas maquinas. BLOQUE: 1) Ho: m1= m2=m3=m4=…m10. Ha: Al menos una es diferente. 2) Para α=0.05 3) F 4) Laboratorio de Estadística Industrial 27 F= 2.25 5) Intervalos: R.C: <2.25, ∞> R.A: <-∞, 2.25] Fk= 1.06 ɛ R.A →Acepto Ho, rechazo Ha. Interpretación: No existen diferencias en los valores de ritmo cardiaco, dados en pulsaciones por minuto, según los sujetos. Problema 2.- Wegman’s Food Markets y Top Friendly Markets son cadenas grandes de tiendas de abarrotes en una zona de Nueva York. Cuando Wal-Mart abrió un supermercado en esta zona, los expertos predijeron que Wal-Mart vendería más barato que estas dos tiendas locales. Un periódico publicó los precios de 15 artículos que se presentan en la siguiente tabla. Artículo Tops Wal-Mart Wegman Plátanos (1lb) 0.49 0.48 0.49 Sopa Cambell’s (10.75 oz) 0.60 0.54 0.77 Pechuga de pollo (3 lb) 10.47 8.61 8.07 Pasta de dientes (6.2 oz) 1.99 2.40 1.97 Huevos (1 docena) 1.59 0.88 0.79 Salsa cátsup (36 oz) 2.59 1.78 2.59 Jell-o (3 oz) 0.67 0.42 0.65 Cacahuatina (18 oz) 2.29 1.78 2.09 Leche (descremada, ½ gal) 1.34 1.24 1.34 Oscar Meyer hotdogs (1 lb) 3.29 1.50 3.39 Salsa ragú para pasta (1 lb, 10 oz) 2.09 1.50 1.25 Galleta Ritz (1 lb) 3.29 2.00 3.39 Detergente Tid (líquido, 100 oz) 6.79 5.24 5.99 Jugo de naranja Tropicana (1/2 gal) 2.50 2.50 2.50 Twizzlers (frambuesas, 1 lb) 1.19 1.27 1.69 Con α=0.05 como nivel de significancia, pruebe si hay una diferencia significativa entre las tiendas en las medias del precio de estos 15 artículos. SOLUCION: TRATAMIENTO. 1) Ho: m1 = m2 =m3. Ha: Al menos uno es diferente. 2) Para α=0.05 Laboratorio de Estadística Industrial 28 3) F 4) F= 3.34 5) Laboratorio de Estadística Industrial 29 Intervalos: R.C: <3.34, ∞> R.A: <-∞, 3.34] Fk= 5.64 ԑ R.C →Rechazo Ho, acepto Ha. Interpretación: Si hay una diferencia significativa entre las medias del precio de estos 15 artículos, según los supermercados. Laboratorio de Estadística Industrial 30 BLOQUE: 1) Ho: m1 = m2= …m15 Ha: Al menos uno es diferente. 2) Para α = 0.05 3) F 4) F= 2.06 5) Intervalos: R.C: <2.06 , ∞> R.A: <-∞, 2.06] Fk= 64.18 ԑ R.C → Rechazo Ho, acepto Ha. Interpretación: Si hay una diferencia significativa entre las medias del precio , según los 15 artículos. Laboratorio de Estadística Industrial 31 REGRESION SIMPLE: Problema 1.- Un gerente de ventas recolectó los datos siguientes sobre ventas anuales y años de experiencia. (Problema 9 pág. 556 anderson) Vendedor Años de experiencia Ventas anuales (miles de $) 1 1 80 2 3 97 3 4 92 4 4 102 5 6 103 6 8 111 7 10 119 8 10 123 9 11 117 10 13 136 a) Elabore un diagrama de dispersión con estos datos, en el que la variable independiente sean los años de experiencia. b) Dé la ecuación de regresión estimada que puede emplearse para predecir las ventas anuales cuando se conocen los años de experiencia. Laboratorio de Estadística Industrial 32 INTERPRETACION: Por cada año de experiencia de un trabajador las ventas anuales aumentan en 4. c) Use la ecuación de regresión estimada para pronosticar las ventas anuales de un vendedor de 9 años de experiencia. Para un vendedor de 9 años de experiencia: Y=80 +4x =80 +4×9=116 INTERPRETACION: Para un vendedor de tiene 9 años de experiencia sus ventas anules serán de 116 miles de dólares anuales. Problema 2.- Una aplicación importante del análisis de regresión a la contaduría es la estimación de costos. Con datos sobre volumen de producción y costos y empleando el método de mínimos cuadrados para obtener la ecuación de regresión estimada que relacione volumen de producción y costos, los contadores pueden estimar los costos correspondientes a Laboratorio de Estadística Industrial 33 un determinado volumen de producción. Considere la siguiente muestra de datos sobre volumen de producción y costos totales de una operación de fabricación. Volumen de producción (unidades) Costos totales ($) 400 4000 450 5000 550 5400 600 5900 700 6400 750 7000 a) Con estos datos obtenga la ecuación de regresión estimada para pronosticar los costos totales dado un volumen de producción. Técnica de mínimos cuadrados: Pendiente de la línea de regresión: 𝑏 = 𝑛 × ∑ 𝑥𝑦 − ∑ 𝑥 × ∑ 𝑦 𝑛 × ∑ 𝑥2 − (∑ 𝑥)2 𝑏 = 7.6 Intersección con el eje x: 𝑎 = ∑ 𝑦 𝑛 − 𝑏 × ∑ 𝑦 𝑦 𝑎 = 1247 Donde la ecuación de regresión es: 𝑌 = 1247 + 7.6 × 𝑥 INTERPRETACION: Por cada unidad de volumen de producción los costos totales aumentan en un 7.6. b) ¿Cuál es el costo por unidad producida? Para 400 unidades: 𝑌 = 1247 + 7.6 × 400 = 4287 Para 450 unidades: 𝑌 = 1247 + 7.6 × 450 = 4667 Para 550 unidades: 𝑌 = 1247 + 7.6 × 550 = 5427 Para 600 unidades: 𝑌 = 1247 + 7.6 × 600 = 5807 Para 700 unidades: 𝑌 = 1247 + 7.6 × 700 = 6567 Para 750 unidades: 𝑌 = 1247 + 7.6 × 750 = 6947 Laboratorio de Estadística Industrial 34 c) Calcule el coeficiente de determinación. ¿Qué porcentaje de la variación en los costos totales puede ser explicada por el volumen de producción? Coeficiente de determinación: INTERPRETACION: El 95.9% de la variación de los costos totales se debe al número de unidades del volumen de producción d) De acuerdo con el programa de producción de empresa, el mes próximo se deberán producir 500 unidades. ¿Cuál es el costo total estimado de esta operación? Para 500 unidades: 𝑌 = 1247 + 7.6 × 500 = 5047 Laboratorio de Estadística Industrial 35 Problema 3.- Al gerente de comercialización de una cadena grande de supermercados le gustaría determinar el efecto del espacio en estantes sobre las ventas de comida para mascotas. Se selecciona una muestra aleatoria de 12 supermercados de igual tamaño y los resultados se presentan a continuación: SOLUCIÓN: (n=12, α=0.05) ∑ 𝑥 = 150 ∑ 𝑥2 = 2250 ∑ 𝑦 = 28.5 ∑ 𝑦2 = 70.69 ∑ 𝑥𝑦 = 384 a) Coeficiente de correlación 𝑟 = (10)(5220) − (200)(197) √(10(6000) − 1502)(12(70.69) − 28,52) = 0.827 b) Coeficiente de determinación r2 = 0.684 c) Coeficiente de no determinación 1-r2 =0.316 d) Y=a+bX 𝑏 = 12𝑥384 − 150𝑥28.5 12𝑥2250 − 1502 = 0.074 𝑎 = 28.5 12 − 0.074𝑥 150 12 = 1.45 Y=1.45+0.074X e) Error estándar 𝑆𝑌𝑋 = √ 70.69 − 1.45𝑥28.5 − 0.074𝑥384 12 − 2 = 0.308 Inferencia sobre los coeficientes de regresión Tienda Espacio en estante, X (pies) Ventas semanales, Y (cientos de dólares) 1 5 1.6 2 5 2.2 3 5 1.4 4 10 1.9 5 10 2.4 6 10 2.6 7 15 2.3 8 15 2.7 9 15 2.8 10 20 2.6 11 20 2.9 12 20 3.1 Laboratorio de Estadística Industrial 36 1) Ho: β = 0 Ha: β ≠ 0 2) α=0.05 3) t 4) t(0.05,10)=2.228 5) 𝑆𝑏1 = 0.308 √2250− 1502 12 = 0.016 𝑡 = 0.074 − 0 0.016 = 4.625 Inferencia sobre el coeficiente de correlación 1) Ho: p = 0 Ha: p ≠ 0 2) α=0.05 3) t 4) t(0.05,10)=2.228 5) 𝑡 = 0.827√12−2 √1−0.684 = 4.65 Estimado del intervalo de confianza (α=0.05) 0.074 − 2.228𝑥0.016 ≤ 𝛽 ≤ 0.074 + 2.228𝑥0.016 0.038 ≤ 𝛽 ≤ 0.11 Intervalo de confianza (α=0.05) X=8: Y=1.45+0.074(8)=2.042 𝐼𝐶 = 2.042 ± 2.228𝑥0.308√ 1 12 + (8 − 12.5)2 2250 − 1502 12 IC=[1.7878 ; 2.296] Intervalo de predicción (α=0.05) 𝐼𝑃 = 2.042 ± 2.228𝑥0.308√1 + 1 12 + (8 − 12.5)2 2250 − 1502 12 IP=[1.31 ; 2.77] Laboratorio de Estadística Industrial 37 Laboratorio de Estadística Industrial 38 Problema 4.- A un agrónomo le gustaría determinar el efecto de un fertilizante orgánico natural sobre la producción de tomates. Se van a utilizar 5 cantidades diferentes de fertilizante sobre 10 parcelas equivalentes: 0, 10 , 20 , 30 y 40 libras por cada 100 pies cuadrados. Los nivelesde fertilizante son designados aleatoriamente a las parcelas con los siguientes resultados: SOLUCIÓN (n=10 , α=0.05) ∑ 𝑥 = 200 ∑ 𝑥2 = 6000 ∑ 𝑦 = 197 ∑ 𝑦2 = 4735 ∑ 𝑥𝑦 = 5220 a) Coeficiente de correlación 𝑟 = (10)(5220) − (200)(197) √(10(6000) − 2002)(10(4735) − 1972) = 0.98 b) Coeficiente de determinación r2 = 0.96 c) Coeficiente de no determinación 1-r2 =0.04 d) Y=a+bX 𝑏 = (10)(5220) − (200)(197) 10(6000) − 2002 = 0.64 𝑎 = 197 10 − 0.64𝑥 200 10 = 6.9 Y=6.9+0.64X e) Error estándar 𝑆𝑌𝑋 = √ 4735 − 6.9𝑥197 − 0.64𝑥5220 10 − 2 = 2.0886 Inferencia sobre los coeficientes de regresión 1) Ho: β = 0 Parcela Cantidad de fertilizante X (lb/100 pies2) Producción Y (lb) 1 0 6 2 0 8 3 10 11 4 10 14 5 20 18 6 20 23 7 30 25 8 30 28 9 40 30 10 40 34 Laboratorio de Estadística Industrial 39 Ha: β ≠ 0 2) α=0.05 3) t 4) t(0.05,8)=2.306 5) 𝑆𝑏1 = 2.0886 √6000− 2002 10 = 0.0467 𝑡 = 0.64 − 0 0.0467 = 13.7 Inferencia sobre el coeficiente de correlación 1) Ho: p = 0 Ha: p ≠ 0 2) α=0.05 3) t 4) t(0.05,8)=2.306 5) 𝑡 = 0.98√10−2 √1−0.96 = 13.86 Estimado del intervalo de confianza (α=0.05) 0.64 − 2.306𝑥0.0467 ≤ 𝛽 ≤ 0.64 + 2.306𝑥0.0467 0.5323 ≤ 𝛽 ≤ 0.7477 Intervalo de confianza (α=0.05) X=15: Y=6.9+0.64(15)=16.5 𝐼𝐶 = 16.5 ± 2.306𝑥2.0886√ 1 10 + (15 − 20)2 6000 − 2002 10 IC=[14.88 ; 18.1] Intervalo de predicción (α=0.05) 𝐼𝑃 = 16.5 ± 2.306𝑥2.0886√1 + 1 10 + (15 − 20)2 6000 − 2002 10 IP=[11.42 ; 21.58] REGRESION MULTIPLE PROBLEMA 1: Montgomery y Peck (1982) describen el empleo de un modelo de regresión para relacionar la cantidad de tiempo requerido por un vendedor de ruta (chofer) para abastecer una maquina vendedora de refrescos con el número de latas que incluye la misma, y la distancia del vehículo de servicio a la ubicación de la máquina. Este modelo se empleo para el diseño de la ruta, el programa y el despacho de vehículos. La tabla presenta 25 observaciones respecto al tiempo de entrega tomadas del mismo estudio descrito por Montgomery y Peck. Laboratorio de Estadística Industrial 40 Numero de observaciones Tiempo de entrega (min.) Numero de latas Distancias(pies) 1 9.95 2 50 2 24.45 8 110 3 31.75 11 120 4 35.00 10 550 5 25.02 8 295 6 16.8 4 200 7 14.38 2 375 8 9.60 2 52 9 24.35 9 100 10 27.50 8 300 11 17.08 4 412 12 37.00 11 400 13 41.95 12 500 14 11.66 2 360 15 21.65 4 205 16 17.89 4 400 17 69.00 20 600 18 10.30 1 585 19 34.93 10 540 20 46.59 15 250 21 44.88 15 290 22 54.12 16 510 23 56.63 17 590 24 22.13 6 100 Laboratorio de Estadística Industrial 41 25 21.15 5 400 Determine la ecuación de regresión. Calcule R2.Interprete. Estimar el tiempo de entrega si se sabe que el número de latas es 20 y la distancia del vehículo es 110. Solucion: �̌� = 2.26 + 2.74(20) + 0.0125(110) �̌� = 58.435 Coeficiente de determinación: es 0.981, entonces el 98.1% del tiempo de un vendedor para abastecer una maquina vendedora puede ser explicado mediante el número de latas y la distancia del camión. 𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = 0 𝐻1: 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑐𝑜𝑛𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛 𝑛𝑜 𝑒𝑠 0 Laboratorio de Estadística Industrial 42 Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de P=0.000 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al menos un coeficiente de regresión no es 0. Interpretación: Observamos un relación lineal entre la variable dependiente Nro. De latas con respecto al T.de entrega (Variable independiente), y en menor grado de linealidad Distancia Vs Tiempo de entrega. Laboratorio de Estadística Industrial 43 Laboratorio de Estadística Industrial 44 Contribución de la variable X1 sabiendo que X2 está incluida SSR(X1 / X2) = SSR(X1 y X2) – SSR(X2) =5992.4-5887.3=105.1 𝐹 = 105.1 5.2 = 20.23 Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,20.23>4.3 Entonces la variable X1(nro de latas), si contribuye significativamente a la ecuación de regresión Contribución de la variable X2 sabiendo que X1 está incluida SSR(X2 / X1) =SSR(X1 y X2) – SSR(X1) Laboratorio de Estadística Industrial 45 =5992.4-1483.9=4508.5 𝐹 = 4508.5 5.2 = 867.019 Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,867.019>4.3 Entonces la variable X2(distancia), si contribuye significativamente a la ecuación de regresión, y podríamos concluir que es más importante que la varia X1. Laboratorio de Estadística Industrial 46 PROBLEMA 2 En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente cuadro. Laboratorio de Estadística Industrial 47 Alumno PHP Algoritmos Base de Datos Programación 1 13 15 15 13 2 13 14 13 12 3 13 16 13 14 4 15 20 14 16 5 16 18 18 17 6 15 16 17 15 7 12 13 15 11 8 13 16 14 15 9 13 15 14 13 10 13 14 13 10 11 11 12 12 10 12 14 16 11 14 13 15 17 16 15 14 15 19 14 16 15 15 13 15 10 Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Programación. Determine la ecuación de regresión. Calcule R2.Interprete. Estimar la nota del curso de PHP si se sabe que en Algoritmos tiene 15 , Base de Datos 16 y Programación 17. Solucion: Laboratorio de Estadística Industrial 48 �̌� = 2.55 + 0.583(15) + 0.373(16) − 0.242(17) �̌� = 13.149 Coeficiente de determinación: es 0. 697 , entonces el 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programación. 𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = 0 𝐻1: 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑐𝑜𝑛𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛 𝑛𝑜 𝑒𝑠 0 Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de P=0.003 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al menos un coeficiente de regresión no es 0. Laboratorio de Estadística Industrial 49 Interpretación: Podemos observar que hay una buena relación de linealidad entre las variables dependientes con la dependiente. Laboratorio de Estadística Industrial 50 Laboratorio de Estadística Industrial 51 Laboratorio de Estadística Industrial 52 Laboratorio de Estadística Industrial 53 METODOS NO PARAMETRICOS: PRUEBA CHI_CUADRADO: PROBLEMA 1: Un estudio referente a la relación entre la edad y la presión que el personal de ventas sienten con respecto a su trabajo presentó la información muestral que sigue. A nivel de significancia de 0.01, ¿Existe alguna relación entre la presión laboral y la edad? Nivel de presión en el trabajo Edad (años) Bajo Mediano Alto Menor de 25 20 18 22 25 a 40 50 46 44 40 a 60 58 63 59 Mayor a 60 34 43 43 Solución: H0: No existe relación entre la edad y la presión que el personal de ventas siente con respecto a su trabajo H1: Existe relación entre la edad y la presión que el personal de ventas siente con respecto a su trabajo Prueba Chi-cuadrada: BAJO, MEDIANO, ALTO Laboratorio de Estadística Industrial 54 Los conteos esperados se imprimen debajo de los conteos observados Las contribuciones Chi-cuadradas se imprimen debajo de los conteosesperados BAJO MEDIANO ALTO Total 1 20 18 22 60 19.44 20.40 20.16 0.016 0.282 0.168 2 50 46 44 140 45.36 47.60 47.04 0.475 0.054 0.196 3 58 63 59 180 58.32 61.20 60.48 0.002 0.053 0.036 4 34 43 43 120 38.88 40.80 40.32 0.613 0.119 0.178 Total 162 170 168 500 Chi-cuadrada = 2.191, GL = 6, Valor P = 0.901 Hallamos el valor crítico de X2 con un nivel de significancia de 0.01 y grados de libertad de 6. 𝑋0.01 2 = 16.81 CONCLUSIÓN: Puesto que el valor del estadístico calculado de ji cuadrada (2.191) se encuentra en la región a la izquierda de 16.81, no se rechaza la hipótesis nula al nivel de 0.01. Se concluye que no hay una relación entre la edad y la presión que sufre el personal de ventas PRUEBA DE POISSON El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tiene una distribución de Poisson. Use α 0.10 y los datos siguientes para probar esta suposición. Laboratorio de Estadística Industrial 55 Solución: I) PLANTEAMINETO DE LA HIPOTESIS II) NIVEL DE SIGNIFICANCIA 𝛼 = 0.01 III) ESTADISTICO DE PRUEBA Utilizaremos el estadístico de chi –cuadrado, mediante la siguiente Formula. IV) INTERVALO DE CONFIANZA Ho: la población del número llamadas telefónicas que llegan por minuto al conmutador de la empresa sigue una distribución de poisson Ha: la población del número llamadas telefónicas que llegan por minuto al conmutador de la empresa sigue una distribución de poisson Gl= n-1=6 Laboratorio de Estadística Industrial 56 V) CALCULOS Y RESULTADOS Haciendo los cálculos para calcular la media , que se realiza por media ponderada: 𝑢 = 0 ∗ 15 + 31 + 2 ∗ 20 +∗ 15 + 4 ∗ 13 + 5 ∗ 4 + 6 ∗ 2 80 = 2 Para hallar las frecuencias esperadas realizaremos la tabla de poisson, para lo cual haremos ayuda de minitab. Laboratorio de Estadística Industrial 57 Elegimos la variable a analizar que seria el numero de llamadas que llegan por minuto al conmutador de una empresa se muestra la tabla del almacenamiento de los datos y la tabla de distribución de probabilidad poisson. Operaciones para calcular el estadístico de chi-cuadrado , se muestran fe y fo. # accidentes fo probabilidad (fe) (fo-fe) (fo-fe)^2 (fo-fe)^2/fe 0 34 0.36787944 29.43 4.56964471 20.88165274 0.70952771 1 25 0.36787944 29.43 -4.43035529 19.62804803 0.66693208 2 11 0.18393972 14.72 -3.71517765 13.80254495 0.93798018 3 7 0.06131324 4.905 2.09494078 4.38877689 0.89474494 4 3 0.01532831 1.226 1.7737352 3.146136546 2.56562574 5.77481065 Calculo de X2 (k)=5.413 numero de llamadas telefonicas fo probabilidad fe (fo-fe) (fo-fe)^2 (fo-fe)^2/fe 0 15 0.13533528 13.5335283 1.46647168 2.15053918 0.1589045 1 31 0.27067057 27.0670566 3.93294335 15.4680434 0.5714712 2 20 0.27067057 27.0670566 -7.06705665 49.9432897 1.8451688 3 15 0.18044704 18.0447044 -3.04470443 9.27022508 0.5137366 4 13 0.09022352 9.02235222 3.97764778 15.8216819 1.7536094 5 4 0.03608941 3.60894089 0.39105911 0.15292723 0.0423745 6 2 0.0120298 1.2029803 0.7970197 0.63524041 0.5280555 5.4133207 Laboratorio de Estadística Industrial 58 PRUEBA DE SIGNO (MUESTRA PEQUEÑA) Muchos corredores de valores con poca experiencia se resisten a hacer presentaciones ante banqueros y otros grupos. Al percibir esta falta de confianza en ellos mismos, la dirección hizo arreglos para que un grupo muestra de nuevos corredores asistiera a un seminario para lograr la autoconfianza; contrato así a una organización capacitadora para que impartiera un curso de tres semanas. Antes de la primera sesión, los instructores midieron el nivel de confianza de cada participante y volvieron a medirlo después de concretado el seminario. Los niveles de confianza antes y después para los 14 asistentes al curso, se indican a continuación. La autoconfianza se clasifico como negativa, baja, alta o muy alta. Establecer la hipótesis nula y alternativa. a) Usando nivel de significancia 0.05, exprese la regla de solución con palabras o en diagramas. Corredor Antes del seminario Después del seminario Signo Numeración Probabilidad de éxito Probabilidad acumulada Martin Negativa Baja + 0 0 1 Jaimes Negativa Negativa 0 1 0.002 1 Hammer Baja Alta + 2 0.01 0.998 Jones Muy alta Baja - 3 0.035 0.988 Cornwall Baja Alta + 4 0.087 0.953 Skeen Baja Alta + 5 0.157 0.866 Salas Negativa Alta + 6 0.209 0.709 Ortega Baja Muy alta + 7 0.209 0.5 Ford Baja Alta + 8 0.157 0.291 Ugalde Negativa Baja + 9 0.087 0.134 Marcos Baja Alta + 10 0.035 0.047 Arms Negativa Baja + 11 0.01 0.012 Pierre Baja Alta + 12 0.002 0.002 Walker Baja Muy alta + 13 0 0 Solución: 1. Ho: p≤0.5 No hay cambio con respecto a la autoconfianza de los corredores, como resultado del seminario proporcionado por la organización capacitadora. Ha: p≥0.5 Si hay cambio con respecto a la autoconfianza de los corredores, como resultado del seminario proporcionado por la organización capacitadora. 2. α=0.05 3. Distribución Binomial 4. Conclusiones: Como x2 (k) pertenece a la región de aceptación, entonces podemos afirmar que la población del número de llamadas entrantes sigue una distribución binomial Laboratorio de Estadística Industrial 59 5. Numero de signo positivos: 12 12 ɛ R.C. Rechazamos Ho, aceptamos Ha. Interpretación: Si hay cambio con respecto a la autoconfianza de los corredores de valores con poca experiencia, como resultado del seminario proporcionado por la organización capacitadora. Pasos en minitab: Utilizamos de la barra de menú la opción estadística. Luego a métodos no paramétricos. La opción prueba de signo. Luego escogemos nuestra variable y aceptar. PRUEBA DE WILCONSON: 1.Un estudio busca evaluar la ganancia potencial de peso con cierto alimento aviar .Una muestra de 12 aves se usó durante un periodo de seis meses .Cada una de las aves se pesó antes y después de un periodo de prueba .Las diferencias entre los pesos antes y después observados en las 12 aves son: 1.5,1.2,-0.2,0,0.5,0.7,0.8,1,0,0.6,0.2,- 0.01.Valores negativos indican pérdida de peso durante el periodo de prueba y los ceros indican que no hubo ninguna variación durante el periodo de prueba .Use 0.05 como nivel de significancia y determine si este nuevo alimento parece ocasionar un aumento de peso en las aves. SOLUCION: 1. Ho: Los pesos de las aves con cierto alimento aviar son iguales Ha:Los pesos de las aves con cierto alimento aviar son diferentes 2. α=0.05 3. Z ,T Laboratorio de Estadística Industrial 60 PESO DIFERENCIA VALOR ABSOLUTO LUGAR RANGO CON SIGNO 1 1.50 1.50 10 10 2 1.20 1.20 9 9 3 -0.20 0.20 2.5 -2.5 4 0.00 0.00 5 0.50 0.50 4 4 6 0.70 0.70 6 6 7 0.80 0.80 7 7 8 1.00 1.00 8 8 9 0.00 0.00 10 0.60 0.60 5 5 11 0.20 0.20 2.5 2.5 12 -0.01 0.01 1 -1 T=48 u =0 Ϭ=√ 10×11×21 6 =19.62 𝑧 = 48 − 0 19.62 = 2.45 Zk Є RC: Rechazo Ho ,Acepto Ha INTERPRETACION: El nuevo alimento aviar provoca un aumento en el peso de las aves ,es decir con un nivel de significancia de 0.05 los pesos difieren luego del cambio. En minitab: Pasos en minitab: Utilizamos la opción estadísticos Luego métodos no paramétricos. La opción de wilcoxon para una muestra. Escogemos la opción de mediana de la prueba. Luego aceptar. Laboratorio de Estadística Industrial 61 PRUEBA DE MWW: MUESTRA PEQUEÑA: 1.Se enseña un procedimiento de ensamble a un grupo de obreros empleando una secuencia de pasos yaconocida ,se enseña a otro grupo usando una técnica experimental .Los tiempos ,en segundos, necesarios para el ensamblaje , para una muestra de empleados se presentan a continuación : Método Actual: 41, 36, 42, 39, 36, 48, 49,38. Método Experimental: 21, 27, 36, 20, 19, 21, 39, 24,22. Al nivel de significancia de 0.05 ¿Se puede concluir que el método experimental es mas rápido? Supóngase que la distribución de líneas de ensamblaje no es normal. SOLUCION: 1. Ho: Las dos poblaciones son idénticas en términos del tiempo en segundos necesarios por el ensamblaje Ha: Las dos poblaciones no son idénticas en términos del tiempo en segundos necesarios por el ensamblaje 2. α=0.05 3. Definir el estadístico MWW. 4. Definir la RA y RC: TL(0.05,8,9)=55 TU=8×(8+9+1)-55=89 5. METODO ACTUAL METODO EXPERIMENTAL 41 14 21 3.5 36 9 27 7 42 15 36 9 39 12.5 20 2 36 9 19 1 48 16 21 3.5 49 17 39 12.5 38 11 24 6 22 5 ∑ 𝑅1 = 103.5 R1 Є RC : Rechazo Ho ,Acepto Ha INTERPRETACION: Las dos poblaciones no son idénticas en base al tiempo utilizado por un grupo de obreros para realizar un ensamblaje, los obreros capacitados por el método experimental son más rápidos que los que realizan un procedimiento ya conocido. MINITAB: Laboratorio de Estadística Industrial 62 Pasos en minitab: Opción en la barra de menú de estadísticas. Luego métodos no paramétricos. La opción de mann wihtney. Escogemos nuestras dos muestras y luego aceptar. METODO DE KRUSKALL WALLIS: Un cliente desea saber si hay una diferencia significativa entre los tiempos que se requieren para realizar un programa de evaluación por tres métodos diferentes. A continuación se presentan los tiempos (en horas) requeridos por cada uno de los 18 evaluadores para llevar a cabo el programa de evaluación. METODO 1 METODO 2 METODO3 68 8.5 62 4.5 58 2 74 15 73 14 67 7 65 6 75 16 69 10 76 17 68 8.5 57 1 77 18 72 12.5 59 3 72 12.5 70 11 62 4.5 77 66.5 27.5 Use α=0.05 y realice una prueba para ver si existe una diferencia significativa entre los tiempos requeridos por los tres métodos. Solución: 1. Ho: Son iguales las distribuciones de los tiempos que se requieren para realizar un programa de evaluación por tres métodos diferentes. Ha: No son iguales las distribuciones de los tiempos que se requieren para realizar un programa de evaluación por tres métodos diferentes. 2. α= 0.05 3. X2 4. Laboratorio de Estadística Industrial 63 5. 𝐻 = 12 18 ∗ 19 ( 772 + 66.52 + 27.52 6 ) − 3 ∗ 19 = 7.956 H ԑ R.C., Rechazamos Ho, aceptamos Ha. Interpretación: No son iguales las distribuciones de los tiempos (horas) que se requieren para realizar un programa de evaluación por tres métodos diferentes. Pasos en minitab: Opción en la barra de menú de estadísticas. Luego métodos no paramétricos. La opción de kruskall wallis. Escogemos nuestro factor y nuestra respuesta. Le damos aceptar. CORRELACION DE RANGO: 1. La Far West University ofrece clases matutinas y vespertinas en administración empresarial .Se realizara una extensa encuesta .Una pregunta implica a estudiantes de segundo grado y la forma en la que perciben el prestigio asociado con ciertas profesiones. A cada estudiante se le pidió que calificara las carreras de 1 a 8 ,con 1 a la mayor renombre ,y con 8 la de menor prestigio .Los resultados compuestos son: Laboratorio de Estadística Industrial 64 CARRERA PUNTUACION DE CURSOS MATUTINOS PUNTUACION DE CURSOS VESPERTINOS DIFERENCIA CONTADOR 6 3 3 PROGRAMADOR EN COMPUTACION 7 2 5 GERENTE DE SUCURSAL BANCARIA 2 6 -4 ADMINISTRADOR DE HOSPITAL 5 4 1 ESTADISTICO 1 7 -6 INVESTIGADOR DE MERCADOTECNIA 4 8 -4 ANALISTA DE BOLSA 3 5 -2 GERENTE DE PRODUCCION 8 1 7 Determine el coeficiente de correlación: SOLUCION: 𝑟𝑠 = 1 − 6 × 156 8 × (82 − 1) = −0.85 El coeficiente de correlación es -0.85 PRUEBA DE SIGNIFICANCIA PARA LA CORRELACION DE RANGO: 𝑢𝑟𝑠 = 0 Ϭrs=√ 1 8−1 =0.38 1. Ho: ps=0 Ha: ps≠0 2. α=0.05 3. Z 4. Calculo de estadístico: 𝑧 = −0.85 + 0 0.38 = −2.24 Zk Є RC: Rechazo Ho, Acepto Ha. INTERPRETACION: El coeficiente de correlación es diferente de cero es decir hay diferencia de correlación en la forma en la que perciben el prestigio asociado con ciertas profesiones. Laboratorio de Estadística Industrial 65 SERIE DE TIEMPO: SUAVIZAMIENTO EXPONENCIAL: En la serie de tiempo siguiente se dan las ventas de un determinado producto en los últimos 12 meses. MES VENTAS 1 105 2 135 3 120 4 105 5 90 6 120 7 145 8 140 9 100 10 80 11 100 12 110 a) Emplee α =0.3 y calcule los valores que se obtienen para esta serie con el método de suavizamiento exponencial. F1=Y1=105 F2=Y2=0.3 × 105 + (1 − 0.3) × 105 = 105 F3=Y3=0.3 × 135 + (1 − 0.3) × 105 = 114 F4=Y4=0.3 × 120 + (1 − 0.3) × 114 = 115.8 F5=Y5=0.3 × 105 + (1 − 0.3) × 115.8 = 112.56 F6=Y6=0.3 × 90 + (1 − 0.3) × 112.56 = 105.792 F7=Y7=0.3 × 120 + (1 − 0.3) × 105.792 = 110.054 F8=Y8=0.3 × 145 + (1 − 0.3) × 110.054 = 120.538 F9=Y9=0.3 × 140 + (1 − 0.3) × 120.538 = 126.377 F10=Y10=0.3 × 100 + (1 − 0.3) × 126.377 = 118.464 F11=Y11=0.3 × 80 + (1 − 0.3) × 118.464 = 106.925 F12=Y12=0.3 × 100 + (1 − 0.3) × 106.925 = 104.847 MES VENTAS PRONOSTICO DE SUAVIZAMIENTO EXPONENCIAL 1 105 105,000 2 135 105,000 3 120 114,000 4 105 115,800 5 90 112,560 6 120 105,792 7 145 110,054 8 140 120,538 9 100 126,377 10 80 118,464 11 100 106,925 12 110 104,847 Laboratorio de Estadística Industrial 66 MINITAB: b) c) Use la constante de suavizamiento α =0.5 .calcular los valores de suavizamiento exponencial ¿Con cuál valor 0.3 o 0.5 .de las constante α se obtiene un mejor pronóstico? Laboratorio de Estadística Industrial 67 MES VENTAS PRONOSTICO DE SUAVIZAMIENTO EXPONENCIAL 1 105 105,000 2 135 105,000 3 120 120,000 4 105 120,000 5 90 112,500 6 120 101,250 7 145 110,625 8 140 127,813 9 100 133,906 10 80 116,953 11 100 98,477 12 110 99,238 F1=Y1=105 F2=Y2=0.5 × 105 + (1 − 0.3) × 105 = 105 F3=Y3=0.5 × 135 + (1 − 0.3) × 105 = 120 F4=Y4=0.5 × 120 + (1 − 0.3) × 114 = 120 F5=Y5=0.5 × 105 + (1 − 0.3) × 115.8 = 112.5 F6=Y6=0.5 × 90 + (1 − 0.3) × 112.56 = 101.25 F7=Y7=0.5 × 120 + (1 − 0.3) × 105.792 = 110.625 F8=Y8=0.5 × 145 + (1 − 0.3) × 110.054 = 127.813 F9=Y9=0.5 × 140 + (1 − 0.3) × 120.538 = 133.906 F10=Y10=0.5 × 100 + (1 − 0.3) × 126.377 = 116.953 F11=Y11=0.5 × 80 + (1 − 0.3) × 118.464 = 98.477 F12=Y12=0.5 × 100 + (1 − 0.3) × 106.925 = 99.238 MINITAB: Laboratorio de Estadística Industrial 68 CONCLUSION: El mejor pronóstico de ventas se observa para la constante de suavizamiento de 0.3 aunque para 0.5 se observa ventas altas los primeros meses se escoge 0.3 porque se mantiene altas el pronóstico de suaviza miento de ventas. MODELO MULTIPLICATIVO: PROMEDIOS MOVILES-INDICES ESTACIONALES: A continuación se presenta los datos, correspondientes a los últimos tres años de ventas trimestrales (número de ejemplares vendidos) de un libro de texto universitario. a) Para esta serie de tiempo de los promedios móviles de cuatro trimestres y los promedios móviles centrados. TRIMESTRE AÑO1 AÑO 2 AÑO 3 1 1690 1800 1850 2 940 900 1100 3 2625 29002930 4 2500 2360 2615 Trimestre Ventas por año Promedio móvil PROMEDIO MOVIL CENTRADO 1 1690 2 940 Laboratorio de Estadística Industrial 69 Gráfica del Promedio móvil: Gráfica del Promedio móvil: 1938,75 3 2625 1952,50 1966,25 4 2500 1961,25 1956,25 1 1800 1990,63 2025,00 2 900 2007,50 1990,00 3 2900 1996,25 2002,50 4 2360 2027,50 2052,50 1 1850 2056,25 2060,00 2 1100 2091,88 2123,75 3 2930 4 2615 Laboratorio de Estadística Industrial 70 b) Calcule los índices estacionales de los cuatro trimestres Trimestre Ventas por año Promedio móvil PROMEDIO MOVIL CENTRADO VALOR ESTACIONAL IRREGULAR 1 1690 2 940 1938,75 3 2625 1952,50 1.344 1966,25 4 2500 1961,25 1.274 1956,25 1 1800 1990,63 0.904 2025,00 2 900 2007,50 0.448 1990,00 3 2900 1996,25 1.453 2002,50 4 2360 2027,50 1.164 2052,50 1 1850 2056,25 0.900 2060,00 2 1100 2091,88 0.526 2123,75 3 2930 4 2615 Laboratorio de Estadística Industrial 71 HALLO EL FACTOR DE CORRECCION: o FACTOR DE CORRECCION: = 4 𝑇𝑂𝑇𝐴𝐿 𝑀𝐸𝐷𝐼𝐴 = 4 4.0065 = 0.998 ≈ 1 INDICES REALES 1 0.902 2 0.487 3 1.3985 4 1.219 INDICES ESTACIONALES VENTAS POR AÑO VENTAS DESESTACIONALIZADAS 1 1 0.902 1690 1524.38 2 2 0.487 940 457.78 3 3 1.3985 2625 3671.0625 4 4 1.219 2500 3047.5 5 1 0.902 1800 1623.6 6 2 0.487 900 438.3 7 3 1.3985 2900 4055.65 8 4 1.219 2360 2876.84 9 1 0.902 1850 1668.7 TRIMESTRE INDICES ESTACIONAL 1 0.904 0.900 0.902 2 0.448 0.526 0.487 3 1.344 1.453 1.3985 4 1.274 1.164 1.219 4.0065 Laboratorio de Estadística Industrial 72 10 2 0.487 1100 535.7 11 3 1.3985 2930 4097.605 12 4 1.219 2615 3187.685 LA ECUACION: y = 1593 + 103 x GRAFICA: c) ¿Cuándo obtiene la editorial el mayor índice estacional? ¿Parece ser razonable este resultado? Explique. o La editorial obtiene mayor índice estacional en el tercer trimestre es decir es 139.85% se encuentra 39.85 % se encuentra por arriba del promedio anual. TENDENCIA LINEAL: Durante los últimos siete años, la empresa Hudson Marine ha sido distribuidor autorizado de los radios náuticos de C&D.En la tabla siguiente se da el número de radios vendidos por año por esa empresa. AÑO 1 2 3 4 5 6 7 NUMERO VENDIDO 35 50 75 90 105 110 130 a) Laboratorio de Estadística Industrial 73 b) c) Trace la gráfica de esta serie de tiempo d) Obtenga la ecuación de tendencia lineal de esta serie de tiempo Ecuación de tendencia ajustada Yt = 22.86 + 15.5*t De la ecuación: El valor 15.5 indica que los radios vendidos por año de cada empresa aumenta en 15.5 ventas por año y 22.86 es el valor de ventas estimadas para el año cero. Laboratorio de Estadística Industrial 74 e) f) A partir de la ecuación de tendencia lineal obtenida en el inciso b pronostique las ventas anuales del año 8. Pronostico: En base a las ventas anteriores, la estimación del año 8 es de 147.143. MINITAB:
Compartir