Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Módulo 2 Unidad 2 y 3 Lectura 2 Pruebas de Hipótesis Materia: Herramientas Matemáticas V – Estadística II Profesora: Mgter. Verónica Herrero Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 2 Unidad 2: Prueba de Hipótesis 2.1 Pruebas de Hipótesis - Fundamentos 2.1.1 Concepto y estrategia general de las pruebas de hipótesis En algunas ocasiones, el estadístico debe proveer soporte para responder un interrogante sobre si es cierta o no determinada idea previa que tenemos, por ejemplo, sobre el valor de algún parámetro. Para poder dar respuesta, las pruebas de hipótesis tienen la siguiente lógica: si conocemos la distribución muestral de un estadístico que relacione el parámetro sobre el cual nos interesa comprobar una afirmación, con un estimador del mismo, podemos decidir que la afirmación es aceptable si en la muestra obtenemos un resultado razonablemente cercano al previsto en la afirmación. Si por el contrario, la evidencia de la muestra arroja un valor muy alejado, desconfiaremos de la validez de la idea supuesta sobre el valor del parámetro. Como puede verse, este tipo de razonamiento es de lo más habitual en la forma de proceder y tomar decisiones a diario: someter nuestras ideas a alguna evidencia (siempre parcial, limitada, accesible, como una muestra), y considerar válida la idea en el caso de que la información recogida parezca consistente con ella, y descartarla en caso contrario. Como permite ver esta estrategia, de lo más práctica por cierto, estamos dispuestos a asumir ciertos riesgos de equivocarnos, justamente por basar nuestra decisión en información parcial. La realidad podría ser diferente a la situación descripta por los datos que reunimos en nuestra muestra, y en definitiva, estar tomando una decisión equivocada acerca del valor del parámetro poblacional. De estos aspectos se trata la unidad que comenzamos a recorrer. Bibliografía Básica Para cumplir con los objetivos de la Unidad 2 del programa, es necesario profundizar en los temas desarrollados en el Capítulo 11 del texto de Bibliografía Básica. (Berenson & Levine, 1996), relacionándolos con los comentarios, ejemplos y recomendaciones de las lecturas del módulo. Capítulos: 11 (Apartados 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8, 11.9, 11.10, 11.11, 11.12) Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 3 Algunas analogías útiles para comprender esta metodología Antes de iniciar el abordaje estadístico de las pruebas de hipótesis, recorreré algunas comparaciones útiles que suelen presentarse en la literatura: 1. Se desea informar sobre la presencia de alguien o algo en una habitación cerrada. Sólo podemos observar por la rendija de la puerta (la zona que nos permite observar sería nuestra muestra). Si alguien o algo es visible en ese sector, podemos tomar una decisión correcta. Si no aparece nada en la muestra, podría ser tanto que efectivamente no hay nadie en la habitación, como que, hay alguien o algo, pero se encuentra en una zona de la habitación no accesible desde nuestro punto de observación. Este es uno de los errores de las pruebas estadísticas que estudiaremos. Muestra: Observación por la cerradura de una habitación cerrada Error posible: - Considerar que no hay nada o nadie por no observarlo en la muestra. 2. Otro ejemplo interesante es el vinculado con un juicio, donde se está analizando la culpabilidad o inocencia de un acusado de un crimen. El proceso trata de reunir pruebas para determinar la culpabilidad o inocencia del acusado. La decisión que se tome en base a la evidencia (muestral, de las pruebas), puede ser correcta, si se lo declara inocente y efectivamente no cometió el crimen. También es correcta si el acusado es culpable y el veredicto así lo determina. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 4 Muestra: Evidencia reunida por la fiscalía (o por los querellantes, de acuerdo con las reglas del proceso legal); o las coartadas del acusado. Errores posibles: - Declarar culpable a un inocente. - Declarar inocente a un culpable. Sin embargo, hay dos situaciones que claramente reflejan errores (que nos harían pensar en “injusticias” en una situación de juicio): si el acusado es culpable y se lo declara inocente, como también si el acusado es inocente y se lo declara culpable). Los sistemas de justicia están diseñados de acuerdo a cuál de estos errores se desee minimizar, cuando por ejemplo, “nadie es culpable hasta que se pruebe lo contrario”, o cuando un acusado debe “demostrar su inocencia”. 3. Como estudiantes (en su caso) y como docente en el mío, la situación que les mencionaré ahora, es una de las que más nos ocupa cotidianamente: establecer a través de un examen o evaluación, si los alumnos comprendieron o aprendieron una serie de temas. Permanentemente en el sistema educativo estamos emitiendo este tipo de juicios, basados en la evidencia de muestras (las evaluaciones mismas son muestras donde se han seleccionado temas del conjunto total de tópicos incluidos en el temario a evaluar, como también de ejercicios o competencias que resultan de interés). Por supuestos que si una evaluación aprueba a un alumno que efectivamente conoce / comprende los temas, estamos tomando una decisión correcta. Idénticamente, si se reprueba a quien no sabe los contenidos. Los problemas aparecen si un alumno que sabe los contenidos es reprobado en la evaluación, o bien, si se aprueba a quien realmente no los conoce. En este caso también los docentes suelen definir sus estrategias evaluativas de manera de minimizar el error que consideran más grave o dañino de los dos. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 5 Muestra: la evaluación Errores posibles: - Aprobar a quien no sabe los contenidos - Reprobar a quien sabe los contenidos Hipótesis nula y alternativa La primera tarea consiste en definir de manera correcta cuál va a ser la hipótesis que queremos someter a contraste o prueba. Comenzaremos trabajando en este módulo con hipótesis referidas a valores de un parámetro poblacional en particular. En todos los problemas aparecen dos hipótesis contrapuestas: la hipótesis nula y la hipótesis alternativa. Cada una de ellas representa un estado de la naturaleza que involucra valores del parámetro poblacional. En la hipótesis nula siempre aparece un igual (ya sea un igual estricto o, un mayor o igual, o un menor o igual), referido a cierto valor del parámetro. La hipótesis alternativa de cada caso respectivo siempre es una negación de la hipótesis nula, de manera de resultar cierta siempre que sea falsa la hipótesis nula. La hipótesis alternativa nunca incluye el signo igual. La hipótesis nula es la idea previa sobre el valor del parámetro que se va a probar. La hipótesis alternativa (establecida siempre como lo opuesto a lo afirmado en la hipótesis nula) indica la conclusión que es verdadera si se lograr rechazar la hipótesis nula. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 6 La hipótesis nula se representa simbólicamente de la siguiente manera: Ho. La hipótesis alternativa se indica con alguna de las simbologías: H1 ó Ha Veamos algunos ejemplos. Supongamos una prueba referida a la media poblacional µ: Ho: µ =15 H1: µ ≠15 Ho: µ ≥15 H1: µ <15 Ho: µ ≤15 H1: µ >15 n las pruebas de hipótesis, a través de la evidencia muestral, se decidirá rechazar la hipótesis nula si así permiten los datos analizados, o bien, no rechazarla. Observen atentamente que no decimos “aceptarla”, ya que no tenemosinformación suficientemente contundente, por el hecho de ser muestral y estar por tanto sometida a los riesgos vinculados con este tipo de información. Tal como indican Berenson y Levine: “La metodología de prueba de hipótesis está diseñada de modo que nuestro rechazo de la hipótesis nula esté basado en evidencias, aportadas por la muestra, de que es más probable de que nuestra hipótesis alternativa sea verdadera. Sin embargo, el hecho de no rechazar la hipótesis nula no es una prueba de que ésta sea verdadera”. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 7 Valor crítico del estadístico de la prueba Cuando describimos en términos generales el procedimiento lógico implicado en las pruebas de hipótesis indicamos que rechazaríamos la hipótesis nula si de la evidencia muestral resultara un valor muy alejado al hipotetizado, así como no la rechazaríamos en caso de obtener de la muestra un valor relativamente cercano al establecido en la Ho. Deberemos trabajar con las distribuciones correspondientes para establecer qué es demasiado cercano o demasiado alejado de la idea previa explícita en la hipótesis nula. El valor crítico definirá un punto de corte para tomar la decisión estadística, un valor que antes de considerar la información muestral, será el criterio para definir la regla de decisión, estableciendo qué valores se tomarán como cercanos al establecido en la hipótesis nula, y cuáles (por estar más allá del valor crítico) como demasiado alejados del establecido en la Ho. Determinación de las zonas de rechazo y no rechazo Los (o el valor crítico, según se trate de una prueba bilateral o unilaterial) del estadístico van a determinar las zonas de rechazo y no rechazo de la hipótesis nula en la distribución muestral del estadístico de prueba. Si el estadístico de prueba calculado en base a los datos de la muestra, cae en la zona de rechazo, se tomará esa decisión; y por el contrario, si el estadístico resulta más alejado del valor hipotético del parámetro (es decir, cae en la zona de rechazo), se tomara esta otra decisión estadística, vale decir, rechazar la hipótesis nula. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 8 Figura: Valores críticos y determinación de las zonas de rechazo y no rechazo en una prueba bilaterial La figura anterior, se muestra cómo se relacionan las zonas de rechazo en una prueba bilateral (donde aparece un signo de igualdad estricta en la hipótesis nula y una desigualdad en la hipótesis alternativa) con los valores críticos. 2.2. Errores deTipo 1 y 2 Riesgos considerados en las pruebas de hipótesis Como presentamos en las analogías a las pruebas de hipótesis, la decisión estadística tiene asociados riesgos o errores derivados de tomar una decisión incorrecta. Bibliografía Básica Recuerde revisar este tema en detalle en el texto de Berenson & Levine (1996). El punto 11.2.4 complementa lo explicado en este apartado. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 9 Se comete el error tipo I, cuando la hipótesis nula es cierta, pero se la rechaza (esto ocurre cuando la evidencia de la muestra indica que es inverosímil nuestra hipótesis, lo cual nos lleva a tomar esa decisión incorrecta). El error tipo II está implicado en el no rechazo de la hipótesis nula cuando ésta es falsa. Si bien debería ser rechazada, también a instancias de un valor muestral no tan alejado, se toma una decisión incorrecta. Veamos las situaciones posibles que pueden encontrarse en las decisiones de una prueba estadística: Estado de la naturaleza Decisión Ho cierta Ho falsa No rechazar Ho Decisión correcta Probabilidad asociada: Coeficiente de confianza: 1-α Decisión incorrecta Probabilidad asociada: Riesgo: β Rechazar Ho Decisión incorrecta Probabilidad asociada: Nivel de significación: α Decisión correcta Probabilidad asociada: Potencia de la prueba: 1-β El coeficiente de confianza (1-α) indica la probabilidad de no rechazar la Ho cuando ésta es verdadera. El nivel de significación (α) es la probabilidad de cometer el error tipo I, es decir, de rechazar la Ho cuando ésta es verdadera. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 10 El riesgo (β) es la probabilidad de cometer un error tipo II, o lo que es lo mismo, de no rechazar la hipótesis nula cuando ésta es falsa. La potencia de la prueba (1-β) es la probabilidad de rechazar la Ho cuando ésta es falsa. Las probabilidades α y β están relacionadas, de manera que si una de ellas disminuye, la otra aumenta. Por ello, la manera de disminuir ambos riesgos es aumentar el tamaño de la muestra. 2.3. Clasificación de las pruebas de hipótesis Como hemos explicado anteriormente, las pruebas de hipótesis pueden ser de uno o dos extremos (unilaterales o bilaterales). Esto dependerá del planteo de la hipótesis nula, en función del cuál, la zona de rechazo se ubicará en uno de los extremos o se distribuirá entre ambos. Este concepto se desarrollará mejor a medida que se presenten cada uno de los casos de pruebas de hipótesis. Pasos para realizar una prueba de hipótesis En todos los casos y ejercicios de pruebas de hipótesis se deben desarrollar ordenadamente los siguientes pasos: 1. Establecer la hipótesis nula 2. Establecer la hipótesis alternativa 3. Seleccionar el nivel de significación 4. Definir el tamaño de la muestra 5. Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba 6. Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisión) Potencia de una Prueba Este punto del programa será tratado en detalle más adelante, juntamente con el desarrollo de la prueba de hipótesis de la media en la Unidad 3. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 11 7. A partir de los datos muestrales, obtener el valor del estadístico muestral 8. Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales 9. Tomar la decisión estadística en base a la regla de decisión 10. Indicar la conclusión del problema Unidad 3: Pruebas de Estimadores 3.1 Prueba respecto de una media 3.1.1 Prueba de hipótesis para la media poblacional con varianza conocida Prueba z Dado que esta es la prueba más sencilla, es la que se utilizará para explicar el proceso general de prueba de hipótesis que complementa lo tratado en la Unidad 2, siguiendo el orden presentado en la Bibliografía básica. Prueba de hipótesis para la media poblacional Varianza conocida Prueba Z Supongamos que queremos someter a prueba una hipótesis referida a la edad de emigración promedio de los ciudadanos de determinado país. Expertos en la problemática de la emigración refieren que para la corriente migratoria que se analiza, la edad promedio es de 25 años. Se conoce que la varianza de esta variable es 3,5 años2. Se tomó una muestra de 24 emigrantes seleccionados al azar en un período de 6 meses, y se obtuvo que la edad promedio era de 22 años. Con una significación α=0,05, ¿puede considerarse verdadera la hipótesis? En este caso estamos analizando una prueba bilateral, porque se trata de someter a prueba una igualdad estricta versus una desigualdad. Prueba de Hipótesis para una media Este punto del programa se desarrolla en la unidad 9 del texto de Berenson & Levine (1996), dado que los autores toman este primer caso para explicar los aspectos generales del procedimiento de prueba de hipótesis. Tenga presenteque este procedimiento se replicará en cada una de las pruebas que siguen en el programa. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 12 Sigamos cada uno de los pasos planteados: 1. Establecer la hipótesis nula Ho: µ=25 años Es decir, la edad promedio al momento de emigrar es de 25 años. 2. Establecer la hipótesis alternativa Ho: µ ≠25 años Es decir, la edad promedio al momento de emigrar es distinta de 25 años. 3. Seleccionar el nivel de significación Se trabajará con α=0,05 4. Definir el tamaño de la muestra La muestra de trabajo consta de 24 casos. 5. Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba Como se conoce la varianza, se trabajará con el estadístico Z: n xZ /σ μ− = 6. Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisión) Como se pidió trabajar con una significación de 0,05, los valores críticos de Z serán -1,96 y 1,96. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 13 Así, quederá determinada la siguiente regla de decisión (indicada también en la siguiente figura): • Si el estadístico muestral resultante es inferior a -1,96, o si es mayor a 1,96, se rechazará la hipótesis nula. • Si el estadístico muestral es mayor a -1,96 y menor a 1,96, entonces, no se rechaza la hipótesis nula. Figura: Determinación de zona de rechazo y no rechazo, en la distribución normal estándar -Z1- α/2=-1,96 0 Z1-α/2=1,96 7. A partir de los datos muestrales, obtener el valor del estadístico muestral Bajo Ho cierta: n xZ /σ μ− = 24/87,1 2522 − =Z 85,7−=Z Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 14 8. Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales El valor del estadístico muestral se ubica en la zona crítica o zona de rechazo. 9. Tomar la decisión estadística en base a la regla de decisión Se debe rechazar la Ho. 10. Indicar la conclusión del problema Con la evidencia muestral disponible no puede suponerse que la edad promedio de emigración es 25 años. Casos de pruebas de hipótesis: uno y dos extremos En los casos en los cuales queremos someter a prueba una hipótesis referida a la igualdad del parámetro a determinado valor, contra la hipótesis alternativa de desigualdad de ese valor. En ese caso, tanto si la evidencia muestral resulta en valores muy elevados o muy reducidos del parámetro, sospechamos de la veracidad de la hipótesis nula, y optaremos por rechazarla. Por lo tanto en estos caso, situamos la probabilidad de rechazar una hipótesis nula siendo cierta (significación) en los extremos superior e inferior de la distribución que estamos considerando. Este tipo de pruebas se conoce como prueba de dos extremos o de dos colas. En tales caso, el nivel de significación se reparte entre ambas colas (α/2 en cada una). Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 15 Figura Prueba de dos colas (o dos extremos): Ho: θ=θ0 H1: θ≠θ0 Donde θ representa un parámetro cualquiera )ˆ(θf θ ˆ En el gráfico puede observarse cómo la significación se reparte entre los dos extremos. Fuente: Elaboración propia Cuando estamos sometiendo a prueba una hipótesis nula con una desigualdad contra su complemento, todo el riesgo se ubica en uno de los extremos. Estas son las pruebas de un extremo o una cola. Figura Prueba de una cola (o un extremo): Ho: θ≤θ0 H1: θ>θ0 )ˆ(θf θ ˆ Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 16 Ho: θ≥θ0 H1: θ<θ0 Donde θ representa un parámetro cualquiera )ˆ(θf θ ˆ En el gráfico puede observarse cómo la significación se ubica en el extremo donde se ubican los valores muestrales que hacen sospechar de la veracidad de la hipótesis nula. Fuente: Elaboración propia Vinculación entre la prueba de hipótesis y la estimación por intervalos Tanto las pruebas de hipótesis como la estimación por intervalos se derivan de los conceptos que permiten hacer inferencia basados en una muestra. Un aspecto que suele generar confusión cuando se enfrenta por primera vez los procedimientos de prueba de hipótesis y estimación, es la equivalencia de los valores correspondientes a los límites de los intervalos de confianza y los valores críticos que delimitan las zonas de rechazo y no rechazo (en términos no estandarizados). En definitiva, los valores que forman parte del intervalo de valores que se estiman, también son los que hacen, numéricamente, aceptables la hipótesis nula. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 17 Pese a esta especie de dualidad, los propósitos de ambos tipos de procedimientos son substancialmente diferentes en el marco de las correspondientes investigaciones que los enmarcan. Valor p Otra manera en la que puede abordarse y resolverse una prueba de hipótesis es determinar el nivel de significación que tiene asociado el valor resultante del estadístico con los datos muestrales. El valor p es la probabilidad de obtener un estadístico igual o mayor que el valor muestral, siendo la hipótesis nula cierta. R. Weiers, en su texto de Estadística para los negocios, indica la siguiente analogía, en una prueba de salto en alto: “… equivale a que Ud. saltara tan alto como pudiera sin tener que pasar sobre una barra, y que luego los jueces le indicaran a qué altura la habría rebasado si la barra estuviera en el lugar” (pp. 432). Esta modalidad de resolución es de gran practicidad en el caso de contar con resultados procesados a través de software estadístico, que directamente aproximan numéricamente el cálculo de probabilidad implicado, arrojando para la muestra, el valor p (o p-valor como también se lo conoce). Simplemente el investigador compara esa significación con la que considera para su investigación (el valor α), y si el valor p supera al α, entonces no se rechaza la hipótesis nula, y en cambio, si α es mayor que p, entonces se rechaza la hipótesis nula. Obviamente, esta regla de decisión se relaciona con el hecho de que si la significación del estadístico muestral es mayor que α, entonces, ese valor se encuentra en la zona de rechazo, y viceversa. Siguiendo al texto de la materia, los pasos correspondientes a una prueba de hipótesis utilizando el valor p, se sintetizan de la siguiente manera: Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 18 1. Establecer la hipótesis nula 2. Establecer la hipótesis alternativa 3. Seleccionar el nivel de significación (α) 4. Considerar el tamaño de la muestra 5. Determinar la prueba y el estadístico que se utilizarán. 6. Calcular el estadístico con los datos muestrales 7. Estimar el valor p para el estadístico muestral a. Considerar la distribución bajo hipótesis nula cierta b. Utilizar un gráfico de la distribución y ubicar el valor del estadístico muestral calculado. c. Calcular la probabilidad deseada ayudado de las tablas o programa estadístico apropiado 8. Comparar el valor p con α 9. Tomar la decisión estadística 10. Elaborar la conclusión Potencia de una prueba La potencia de la prueba es la sensibilidad que ésta tiene para detectar situaciones en las cuales corresponde rechazar la hipótesis nula por ser ésta falsa. Como mencionamos anteriormente,la potencia tiene una probabilidad 1-α, ya que es el complemento del riesgo β (asociado con el error tipo II, correspondiente a no rechazar Ho cuando ésta es falsa). En general, el cálculo de la potencia de una prueba es una tarea compleja, cuando puede llegar a calcularse. Intuitivamente se puede comprender que es más alta esta probabilidad a medida que más alejada está la hipótesis nula de la realidad: mientras más distanciado sea el valor que se postula en la hipótesis nula referido al parámetro, del que realmente tiene, es más probable que la evidencia muestral nos señale el error. Por el contrario, cuando el valor que se postula en la hipótesis nula está próximo (aunque no exacto) al verdadero, la Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 19 evidencia muestral nos confundirá, ya que en muchos casos caerá el estadístico muestral en la zona de no rechazo. El siguiente ejemplo está elaborado teniendo en cuenta la distribución de la media muestral, en una prueba de hipótesis para la media poblacional. El sitio http://www.seeingstatistics.com/seeing1999/resources/opening.html permite ver cómo varía la potencia de la prueba para diferentes escenarios que suponemos referidos al verdadero valor de la media poblacional. Como permiten ver los paneles gráficos de las siguientes páginas, en los casos en los cuales el verdadero valor está alejado de lo hipotetizado, la probabilidad de rechazar la hipótesis nula es alta. La potencia de la prueba está identicada como el área sombreada de azul en cada una de las figuras. Las áreas sombreadas de rojo corresponden a la significación (que tiene una probabilidad α), y se grafican en la distribución que supone que la hipótesis nula es cierta. La probabilidad de rechazar la hipótesis nula siendo falsa se ilustra en la distribución correspondiente a cada verdadero valor alternativo (asociado con ese escenario en particular). En todos los casos, se supone en la hipótesis nula que la media poblacional es igual a 10. Figura: la potencia de la prueba Escenario 1: El verdadero valor de la media es 7,69. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 20 Escenario 2: El verdadero valor de la media es 7,89. Escenario 3: El verdadero valor de la media es 8,13. Escenario 4: El verdadero valor de la media es 8,38. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 21 Escenario 5: El verdadero valor de la media es 8,87. Escenario 6: El verdadero valor de la media es 9,13. Escenario 7: El verdadero valor de la media es 9,7. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 22 Escenario 8: El verdadero valor de la media es 10,02. Escenario 9: El verdadero valor de la media es 11,56. Escenario 10: El verdadero valor de la media es 12,12. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 23 Escenario 11: El verdadero valor de la media es 12,51. Escenario 12: El verdadero valor de la media es 12,98. Fuente. Elaboración propia con la herramienta de simulación provista por: http://www.seeingstatistics.com/seeing1999/resources/opening.html Reflexione sobre la información que proveen los gráficos. ¿Qué información le está faltando si Ud. quiere corroborar estos cálculos de probabilidades, considerando que se trata de una distribución normal? Sinteticemos la información del ejemplo, en una tabla donde se consignen los valores de la potencia. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 24 Tabla: Relación entre el verdadero del valor del parámetro y la potencia Escenario Verdadero valor de la media poblacional Potencia 1 7,69 0,98 2 7,89 0,96 3 8,13 0,90 4 8,38 0,80 5 8,87 0,50 6 9,13 0,32 7 9,7 0,08 8 10,02 0,05 9 11,56 0,77 10 12,12 0,96 11 12,5 0,99 12 12,98 1 Fuente: Elaboración propia La relación descripta en la tabla anterior puede representarse en un gráfico que se denomina Curva de potencia. El gráfico presenta un mínimo en el valor correspondiente al que se postula en la hipótesis nula. La potencia en ese caso es igual a la significación. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 25 Curva de potencia Fuente: Elaboración propia 3.1.2 Prueba de hipótesis para la media poblacional con varianza desconocida Prueba t Un docente sostiene la idea de que el promedio de horas de estudio de sus alumnos ha sido inferior a 3 horas diarias en la semana previa a una evaluación. A fin de comprobar su idea previa, realiza una breve encuesta anónima, y obtiene la siguiente información a partir de una muestra de 15 alumnos tomados al azar del total (muy elevado) de los alumnos de las 10 divisiones que tiene a su cargo: Prueba t para una media Esta prueba sigue el mismo procedimiento estudiado en la prueba z pero utilizando el estadístico t, tal como lo vimos en el módulo 1. Revise en detalle el tema en el capítulo 12 (apartado 12.3) del texto de Berenson & Levine (1996). Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 26 Alumno (muestra) Cantidad de horas que estudió en la semana previa a la evaluación 1 3 2 6 3 7 4 2 5 1 6 0,5 7 1 8 2 9 2,5 10 2 11 1 12 2 13 3 14 2 15 0,5 En este caso estamos analizando una prueba unilateral, porque se plantea una desigualdad. Sigamos cada uno de los pasos planteados: 1. Establecer la hipótesis nula Ho: µ≥ 3 horas Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 27 Note cómo se seleccionó la hipótesis nula. Si bien se sostiene que la cantidad de horas de estudio promedio fue inferior a esa cantidad, se utiliza en la hipótesis nula la afirmación complementaria porque incluye la igualdad. Y en particular, si se encuentra evidencia que permita refutar la hipótesis nula, haberla planteado de esta manera, nos permite un resultado más sólido. 2. Establecer la hipótesis alternativa Ho: µ<3 horas 3. Seleccionar el nivel de significación Se trabajará con α=0,05 4. Definir el tamaño de la muestra La muestra de trabajo consta de 15 casos. 5. Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba Como se desconoce la varianza, se trabajará con el estadístico t, con n-1 grados de libertad: ns xt / μ− = 6. Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisión) Como se pidió trabajar con una significación de 0,05, el valor crítico de t, con 14 grados de libertad es -1,7613 Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 28 Luego, quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura): • Si el estadístico muestral resultante es inferior a -1,7613, se rechazará la hipótesis nula. • Si el estadístico muestral es mayor a -1,7613, entonces, no se rechaza la hipótesis nula. Figura: Determinación de zona de rechazo y no rechazo, en la distribución t -t1-α; n-1=-1,7613 0 t 7. A partir de los datos muestrales, obtener el valor del estadístico muestral Bajo Ho cierta: ns xt / μ− = 15/866,1 337,2 − =t 315,1−=tMateria: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 29 8. Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales. El valor del estadístico muestral se ubica en la zona de no rechazo. 9. Tomar la decisión estadística en base a la regla de decisión No se debe rechazar la Ho. 10. Indicar la conclusión del problema Con la evidencia muestral disponible no puede descartarse que el promedio de horas de estudio haya sido mayor o igual a 3. 3.2 Pruebas para diferencias de medias En muchas ocasiones necesitamos conocer si existe diferencia en las características de dos poblaciones de interés. Es habitual cuando se obtienen medidas de resumen de muestras correspondientes a dos poblaciones, preguntarse si realmente hay una diferencia significativa entre ellas, o bien, si podrían considerarse iguales, pese a la diferencia muestral observada (quizá derivada del azar). Para poder responder este tipo de preguntas, las pruebas de hipótesis vinculadas con dos medias, brindan una herramienta de gran aplicación en diversos usos de investigación y toma de decisiones. Pruebas para muestras independientes y dependientes: diferencias entre ambos tipos de muestras En el caso de las pruebas sobre diferencias de medias podemos enfrentar alguna de las siguientes situaciones, dependiendo qué tipo de diseño de investigación se utilizó: 1. muestras independientes 2. muestras relacionadas o apareadas Prueba para diferencias de medias Existen varias pruebas para contrastar hipótesis sobre diferencias de medias, teniendo en cuenta algunas condiciones. Tenga precaución en identificar correctamente cada caso. Estas pruebas se desarrollan en detalle en el capítulo 13 (Apartados 13.1, 13.2, 13.3, 13.4, 13.9) del texto de Berenson & Levine (1996). Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 30 La selección del tipo de comparación que se realice está fundamentalmente asociada con el problema que se enfrente, y el tipo de dato que se disponga a partir de un experimento, observación o encuesta. Se dice que las muestras son independientes si la aparición o selección de un individuo en una muestra no tiene ninguna relación con la aparición o selección de ningún individuo o elemento en la otra muestra. Este caso se aplica cuando los individuos de cada una de las muestras pertenecen a dos poblaciones distintas, cuya diferencia de medias es el propósito principal de la prueba. Cuando las dos muestras se han construido de manera que la inclusión de un individuo en una de las muestras condiciona la selección de otro en la otra muestra considerado, o bien, se analiza repetidamente información (generalmente a lo largo del tiempo) sobre un mismo individuo, decimos que son muestras relacionadas o apareadas. En el caso de muestras independientes, consideraremos dos pruebas de hipótesis referidas a las diferencias entre medias de ambas muestras, teniendo en cuenta qué supuestos corresponda aplicar. Prueba de diferencia de medias para muestras independientes Caso de varianza conjunta Consideremos el siguiente problema: Una marca de combustibles ha desarrollado un nuevo combustible Premium que reemplazaría al que se produce actualmente, para lo cual quiere analizar si realmente hay una diferencia en cuanto a rendimiento. Se contrata a un experto en combustibles para determinar si existe alguna diferencia de estos combustibles de la marca, en el mismo modelo de automóvil. El combustible A, que se está evaluando para considerar su introducción en el mercado, se probó en 20 autos, y se calculó una media muestral de 14 km por litro (con una desviación estándar de 2 km por litro), mientras que el combustible B que se probó en 10 automóviles, produjo una media de rendimiento de 13,2 kilómetros por litro, con una desviación estándar de 2,1 km por litro. Suponiendo varianzas iguales, ¿existe Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 31 evidencia de que el nuevo combustible, A, supera al que se produce en la actualidad? Veamos paso a paso cómo comprobamos esta hipótesis. 1. Establecer la hipótesis nula Ho: μ1−μ2≤ 0 Vamos a llamar muestra 1 a la correspondiente al nuevo combustible (A), y 2 a la del combustible que se produce actualmente. Dado que nos interesa ver si el nuevo combustible tiene más rendimiento que el actual, en la hipótesis nula planteamos el estado de la naturaleza que si se puede se descartará con evidencia muestral contundente. 2. Establecer la hipótesis alternativa H1: μ1−μ2> 0 3. Seleccionar el nivel de significación Se trabajará con α=0,05 4. Definir el tamaño de la muestra Las muestras de trabajo constan de 20 casos y 10 casos respectivamente. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 32 5. Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba El estadístico tiene distribución t, con n1+n2-2 grados de libertad: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + −−− = 21 2 2121 11 )()( nn s xxt p μμ Donde, la varianza conjunta se construye de la siguiente manera a partir de las varianzas muestrales de cada muestra respectiva: )1()1( )1()1( 21 2 22 2 112 −+− −+− = nn snsn s p 6. Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisión) Como se pidió trabajar con una significación de 0,05, el valor crítico de t, con 28 grados de libertad es 1,701. Luego, quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura): • Si el estadístico muestral resultante es mayor a 1,701, se rechazará la hipótesis nula. • Si el estadístico muestral es menor a 1,701, entonces, no se rechaza la hipótesis nula. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 33 Figura: Determinación de zona de rechazo y no rechazo, en la distribución t 0 t=1,701 7. A partir de los datos muestrales, obtener el valor del estadístico muestral Bajo Ho cierta: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + −−− = 21 2 2121 11 )()( nn s xx t p μμ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + −− = 10 1 20 11318,4 0)2,1314(t 0162,1=t Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 34 Donde )1()1( )1()1( 21 2 22 2 112 −+− −+− = nn snsn s p )110()120( 41,4)110(4)120(2 −+− −+− =ps 1318,42 =ps 8. Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales El valor del estadístico muestral (t= 1,01602) se ubica en la zona de no rechazo. 9. Tomar la decisión estadística en base a la regla de decisión No se debe rechazar la Ho. 10. Indicar la conclusión del problema Con la evidencia muestral disponible no puede descartarse que el rendimiento del nuevo combustible sea igual o menor que el combustible actual. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 35 Prueba de diferencia de medias para muestras independientes Caso de varianzas separadas Cuando no podemos asumir que las dos poblaciones tienen iguales varianzas, adoptamos esta prueba. Vamos a desarrollar también un ejemplo en este caso. El dueño de una veterinaria desea comprobar si existe diferencia en la cantidad total de dinero gastada por mes entre los dueños de perros y los dueños degatos. Se consideró una muestra de individuos que sólo poseía una de estas mascotas, considerando animales (tanto perros como gatos) de un rango de peso de 3 a 5 kilos. En el caso de los dueños de gatos, se obtuvo una media muestral de $19,16 por semana, para una muestra de 26 casos, con una desviación estándar de $8,52. En la muestra de 37 dueños de perros se estimó que en promedio gastan $26,47 por semana, con una desviación estándar de $9,45. ¿Existe una diferencia significativa en el gasto promedio? 1. Establecer la hipótesis nula Ho: μ1−μ2= 0 Vamos a llamar muestra 1 a la correspondiente a los dueños de gatos y 2 a la muestra de dueños de perros. Planeamos una prueba bilateral ya que se desea saber si existe o no diferencia. 2. Establecer la hipótesis alternativa H1: μ1−μ2≠ 0 Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 36 3. Seleccionar el nivel de significación Se trabajará con α=0,05 4. Definir el tamaño de la muestra Las muestras de trabajo constan de 26 casos de dueños de gatos y 37 casos de dueños de perros. 5. Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba El estadístico tiene distribución t, con v grados de libertad: 2 2 2 1 2 1 2121 )()( n s n s xxt + −−− = μμ Donde, v está dado por: 11 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + = n n s n n s n s n s v 6. Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisión) Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 37 Aproximemos en primer lugar el valor de v: 11 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + = n n s n n s n s n s v 137 37 6809,89 126 26 5904,72 37 6809,89 26 5904,72 22 2 − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + =v 27,57=v Se procede a tomar la parte entera del valor obtenido de v: 57. Como se pidió trabajar con una significación de 0,05, los valores críticos de t, con 57 grados de libertad son -2 y 2. Luego, quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura): • Si el estadístico muestral resultante es menor a -2 o mayor a 2, se rechazará la hipótesis nula. • Si el estadístico muestral es mayor a -2 y menor a 2, entonces, no se rechaza la hipótesis nula. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 38 Figura: Determinación de zona de rechazo y no rechazo, en la distribución t Se sombrean en el gráfico las zonas de rechazo de la hipótesis. 7. A partir de los datos muestrales, obtener el valor del estadístico muestral Bajo Ho cierta: 2 2 2 1 2 1 2121 )()( n s n s xx t + −−− = μμ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + −− = 37 6809,89 26 5904,72 0)47,2616,19(t 20,3−=t 8. Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales El valor del estadístico muestral se ubica en la zona de rechazo. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 39 9. Tomar la decisión estadística en base a la regla de decisión Se debe rechazar la Ho. 10. Indicar la conclusión del problema Con la evidencia muestral disponible no puede sostenerse la idea de que los dueños de perros y gatos gastan lo mismo semanalmente en sus mascotas. Prueba de diferencia de medias para muestras relacionadas El caso de las muestras relacionadas es de amplia utilización cuando se necesita disponer de comparaciones entre sujetos con mínima variabilidad entre sí o en pruebas sucesivas repetidas (estudios “antes y después” sobre un mismo sujeto). En este caso, analizamos la diferencia específica para el par de observaciones apareadas, que denominaremos D. 21 iii XXD −= Esta diferencia para cada par de datos que estamos estudiando representa las diferencias uno a uno. Por ejemplo, si es un estudio entre gemelos, en el cual a uno de los gemelos de cada conjunto de hermanos gemelos que se está estudiando se le aplicó un tratamiento, cuyo efecto se quiere comprobar, la diferencia D es la medida de la distancia en la variable de respuesta para ambos sujetos. Justamente lo que se pretende someter a prueba es la existencia o no de tal diferencia entre los sujetos que fueron sometidos a tratamiento y los que no, aún en estos casos, en los cuales los sujetos poseen mucha homogeneidad entre sí. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 40 El promedio muestral de tales diferencias se obtiene considerando todas las D para los n pares de sujetos de estudio: n D D i∑= Denotaremos Dμ a la diferencia poblacional, que se somete a prueba. La prueba se lleva a cabo con el mismo procedimiento utilizado previamente para los diversos casos de pruebas de hipótesis. Las hipótesis nula y alternativa en este caso serán: Ho: 0=Dμ H1: 0≠Dμ El estadístico de prueba será: n s Dt D D 2 μ− = Este estadístico posee n-1 grados de libertad. Para el cálculo de la desviación estándar muestral se deberá considerar la siguiente fórmula: Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 41 1 22 − − = ∑ n DnD s iD 3.3. Pruebas de hipótesis para datos categóricos En muchas ocasiones el problema de decisión planteado tiene que ver con un valor asignado en la hipótesis a la proporción de individuos de la población que poseen cierta característica. Prueba de hipótesis para la proporción poblacional Debido a que el procedimiento no difiere respecto del ya desarrollado, simplemente en estos casos indicaremos cuál es el estadístico de prueba. En el caso de las pruebas para proporciones, el estadístico bajo hipótesis nula cierta se distribuye normal: n PP PpZ )1( − − = Prueba para la diferencia de dos proporciones En el caso de las pruebas para diferencia de proporciones, para muestras independientes, el estadístico bajo hipótesis nula cierta se distribuye normal: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ +− −−− = 21 2121 11)1( )()( nn pp PPpp Z Bibliografía Básica Recuerde estudiar esta prueba en detalle en el punto 15.1 del texto de Berenson & Levine (1996). Preste atención a los ejemplos allí presentados. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 42 Donde: 21 21 )( nn XXp + + = 3.4 Prueba de hipótesis para la varianza Prueba Chi cuadrado También es posible llevar a cabo hipótesis referidas a valores particulares de la varianza poblacional. En este caso, el único aspecto novedoso se relaciona con el estadístico muestral que incluye tanto a la varianza poblacional como a su estimador, la varianza muestral. Este estadístico posee distribución Chi cuadrado1, una variable aleatoria que presentaremos a continuación. 2 2 2 1 )1( σ χ snn − =− Vamos a considerar el problema propuesto por Berenson y Levine, en la sección de ejercicios del tema (página 441, ejercicio 12.22). Problema: Un investigador de mercado está realizando un estudio encargado por una concesionaria de automóviles que tiene sucursales en todo el país, en relación con las reparaciones de autos. En particular tiene interés en averiguar cuál es el gasto promedio en reparaciones. Para estimar cuántos casos incluir en la muestra, debe considerar un valor de la desviaciónestándar. En base a su experiencia cree apropiado considerar una desviación estándar de $200 del gasto realizado en reparaciones. No 1 Esta distribución corresponde a una variable no negativa, cuya forma depende del parámetro grados de libertad que posea. Mientras más reducidos son los grados de libertad, más sesgada a la derecha es la forma de la distribución. Bibliografía Básica Recuerde estudiar esta prueba en detalle en el punto 12.5 (Capítulo 12) del texto de Berenson & Levine (1996). Preste atención a los ejemplos allí presentados y al modo de trabajar con la Tabla Chi- Cuadrado. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 43 obstante, decide corroborar su hipótesis a través de una encuesta piloto a 25 dueños de automóviles. Una vez que lleva a cabo este estudio preliminar, resulta una desviación estándar de la muestra de $237,52. ¿Aún puede trabajar con su idea previa de la desviación estándar para calcular el tamaño muestral? Apliquemos una vez más los pasos de la prueba de hipótesis: 1. Establecer la hipótesis nula Ho: σ2≠ 40.000 pesos2. Note que se estableció la hipótesis en términos de la varianza, y que se tuvo en cuenta la unidad de medida correspondiente también elevada al cuadrado. 2. Establecer la hipótesis alternativa Ho: σ2≠ 40.000 pesos2 3. Seleccionar el nivel de significación Se trabajará con α=0,10 4. Definir el tamaño de la muestra La muestra de trabajo consta de 25 casos. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 44 5. Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba Se utilizará el estadístico Chi cuadrado presentado, con n-1 grados de libertad: 2 2 2 1 )1( σ χ snn − =− 6. Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisión) Con una significación de 0,10, los valores críticos de la distribución Chi cuadrado, con 24 grados de libertad son: 13,848 y 36,415, respectivamente. Luego, quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura): • Si el estadístico muestral resultante es inferior a 13,848 ó mayor a 36,415, se rechazará la hipótesis nula. • Si el estadístico muestral es menor a 13,848 ó mayor a 36,415, entonces, no se rechaza la hipótesis nula. Figura: Determinación de zona de rechazo y no rechazo, en la distribución Chi cuadrado χ2 24, 0,05=13,848 χ2 24, 0,95=36,415 Tabla Chi-cuadrado Ud. cuenta con una tabla Chi-cuadrado disponible en los anexos del módulo. También hay una tabla al final del texto de Berenson y Levine (1996). Siga detenidamente la manera en que los autores realizan el procedimiento de resolución del ejemplo en el punto 12.5 del texto. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 45 7. A partir de los datos muestrales, obtener el valor del estadístico muestral Bajo Ho cierta: 2 2 2 1 )1( σ χ snn − =− 40000 75,56415)24(2 24 =χ 85,33224 =χ 8. Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales El valor del estadístico muestral se ubica en la zona de no rechazo. 9. Tomar la decisión estadística en base a la regla de decisión No se debe rechazar la Ho. 10. Indicar la conclusión del problema Con la evidencia muestral disponible no puede descartarse que la varianza sea igual a 40000 pesos2 (o que la desviación estándar sea igual a 200 pesos), tal como supone el investigador. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 46 La siguiente figura ilustra los casos de pruebas de hipótesis referidas a la varianza, para pruebas bilaterales y unilaterales. Figura Prueba bilateral Ho: σ2 = σ20 H1: σ2 ≠ σ20 Prueba unilateral Ho: σ2 ≤ σ20 H1: σ2 > σ20 �2 Prueba unilateral Ho: σ2 ≥ σ20 H1: σ2 <σ20 �2 Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 47 Ejercitación Resuelva los siguientes ejercicios, si tiene dudas o consultas, envíelas a su tutor virtual. 1. El siguiente caso ha sido tomado de un estudio real llevado a cabo en Estados Unidos. Tras lanzar una variedad de papas fritas reducidas en grasa, la empresa Pringles realizó un estudio para conocer si los consumidores las identificaban o no respecto de las papas normales. Se indagaron 44 participantes de un estudio, a quienes se les ofrecía dos tazas separadas de papas de la marca. En una de las tazas había papas normales y en la otra las reducidas en grasa. En promedio, si las papas hubieran tenido el mismo sabor, se espera que el 50% de los catadores hubiera identificado correctamente las papas normales. En el estudio, 25 catadores lograron identificarlas correctamente. ¿Significa este resultado que las papas reducidas en grasa tienen un sabor distinto o la diferencia entre lo obtenido y el 50% esperado es sólo un valor al azar? Fuente: Introducción a la Estadística para Negocios. Ronald Weiers. (2005). 5ª Edición. a. ¿Qué prueba de hipótesis se lleva a cabo? b. Plantee las hipótesis nula y alternativa c. Complete los pasos de la prueba de hipótesis d. Responda la pregunta planteada. 2. En un estudio reciente sobre audiencia televisiva, se reportó que los hombres jóvenes estadounidenses tienen una exposición promedio de 56,2 minutos a la televisión en las horas de máxima audiencia. Un experto europeo considera que en el Viejo continente la exposición es más elevada. Se toma una muestra de 1300 hombres en las mismas edades en Europa, y se detecta que en promedio ven 50,5 minutos en ese horario. Si bien no se conocen las varianzas, se pueden considerar iguales, y en el estudio para Estados Unidos surgió una varianza muestral de 45 minutos2, mientras que en la muestra europea, alcanza unos 46 minutos2. a. ¿Qué prueba de hipótesis se lleva a cabo? b. Plantee las hipótesis nula y alternativa c. Complete los pasos de la prueba de hipótesis d. Elabore una conclusión Anexo de Ejercitación Además de estos ejercicios, Ud. encontrará en el anexo del módulo una guía de ejercicios y sus respectivas soluciones. Le recomendamos que realice toda la ejercitación posible para identificar con claridad las situaciones en las que se aplica cada prueba estudiada. Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 48 3. En la etiqueta de una bebida en base a frutas dice que en promedio contiene 1 gramo por litro o menos de grasa. Diseñe un experimento para poder realizar una prueba para comprobarlo. Establezca la probabilidad de cometer un error tipo II si el verdadero valor de la cantidad de grasa promedio es 2 gramos por litro (tenga en cuenta una desviación estándar de 0,25 gramos por litro, con una significación de 0,05, y una muestra de tamaño 20 unidades). ¿Y si es 1,5 el verdadero valor de la cantidad promedio de grasa? a. Responda las preguntas planteadas b. Grafique c. Elabore una conclusión 4. El presidente de una compañía que fabrica electrodomésticos afirmó recientemente en una entrevista que al menos 85% de sus clientes hogareños están completamente satisfechos con el producto de su marca que compraron. ¿Qué tipo de prueba se debe realizar para corroborarlo? Establezca las hipótesis nula y alternativa. 5. Al realizar las pruebas de alcoholemia, para determinar si un conductorbebió alguna bebida alcohólica por encima de los niveles permitidos, se está trabajando con una especie de prueba de hipótesis. Plantee las hipótesis. Indique cuáles serían el error tipo I y tipo II. ¿Cuál es uno de los problemas estadísticos que plantea este tipo de test? 6. Según el gerente comercial de una moderna sala de cine, que desea terciarizar el servicio de venta de alimentos, los clientes gastan en promedio $20 en golosinas y pochoclo para consumir durante las películas, con una desviación estándar de $4. Estos gastos por cliente se distribuyen normal. Una posible concesionaria realiza un estudio basado en una muestra de 18 clientes, y en su estudio la media resulta de $16. Con un nivel de significación de 0,05, ¿Ud. creería la afirmación del gerente comercial? a. ¿Qué prueba se está llevando a cabo? b. Realice la prueba correspondiente c. Elabore una recomendación para la concesionaria interesada. 7. Una máquina debe empaquetar automáticamente envases de especias con un contenido promedio de 70 gramos. Se realizó una muestra de 35 envases en la última semana y en promedio el peso de cada unidad es 65 gramos La desviación estándar muestral es de 1 gramo. Con un nivel de significación de 0,01, ¿cree que la máquina está envasando de acuerdo con sus especificaciones técnicas? Materia: Herramientas Matemáticas V (Estadística II) Profesora: Mgter. Verónica Herrero | 49 8. La edad promedio del parque automotor en el país es 8,4 años. Para una muestra aleatoria de 34 automóviles del estacionamiento de un hipermercado, la edad promedio es 9,7 años con una desviación estándar de 3.1 años. Con una significación de 0,05, ¿se puede afirmar que la edad promedio de los autos de ese supermercado es idéntica a la del total nacional? 9. Se está analizando la producción de programas televisivos para las personas que esperan en las colas de las cajas de supermecados. Para establecer la duración de los programas, se consideró un supuesto acerca de la demora promedio en las cajas, que se supone de 8 minutos. Se realizó una muestra de 120 clientes, y la muestra resultante dio una media de 8,5 minutos, con una desviación estándar de 3,2 minutos. ¿Cuál es le valor p? Elabore una conclusión. 10. Se considera que entre los ejecutivos hay una proporción elevada de individuos diestros. Se conoce que el 85% de la población en general es diestra. En una muestra de 300 ejecutivos se detectó que el 96% era diestro, ¿podemos considerar que el porcentaje de diestros es superior entre los ejecutivos? Bibliografía Lectura 2 Berenson & Levine (1996). Estadística para administración y economía. Sexta Edición. Ed. Prentice Hall Hispanoamericana. México. www.uesiglo21.edu.ar
Compartir