Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 1 Significancia estadística El método básico para hacer inferencias estadísticas es generalizar a partir de los resultados de la muestra en relación con las características de la población. Un aspecto fundamental de la inferencia estadística es que es posible que los números sean diferentes en un sentido matemático, pero no muy diferentes en un sentido estadístico. Por ejemplo, suponga que a un grupo de bebedores de refrescos de cola se le pide que pruebe dos bebidas de cola en una prueba a ciegas e indique cuál prefiere; los resultados muestran que 51% prefiere uno de los productos y 49% el otro. Hay una diferencia matemática en los resultados, pero podría parecer menor e intrascendente. Quizá la diferencia se encuentra dentro del rango de precisión de la habilidad de los investigadores para medir las preferencias y, por tanto, es probable que no sea significativa en un sentido estadístico. Es posible aplicar tres conceptos distintos a la idea de las diferencias al hablar de los resultados de las muestras: -Diferencia matemáticas: Por definición, si los números no son exactamente iguales, son diferentes. -Significancia estadística: Si una diferencia en particular es suficientemente grande para que haya pocas probabilidades de que procura por casualidad o por el error de muestreo, entonces es estadísticamente significativa. -Diferencias administrativamente importantes: Podemos argumentar que una diferencia es importante desde una perspectiva gerencial sólo si los resultados o los números son lo suficientemente diferentes. Comprobación de hipótesis Una hipótesis es un supuesto o teoría presentada por un investigador o gerente acerca de alguna característica de la población investigada. En la comprobación de hipótesis el investigador determina si una hipótesis relacionada con alguna característica de la población es probable que sea cierta, en vista de las evidencias. La prueba de una hipótesis estadística permite calcular la probabilidad de observar un resultado en particular si la hipótesis establecida es verdadera. Existen dos explicaciones básicas para una diferencia observada entre un valor hipotético y el resultado de una investigación en particular. Ninguna de las hipótesis es verdadera y quizá la diferencia observada se debe a un error de muestreo, o bien la hipótesis es falsa y el valor real es algún otro. -Pasos en la comprobación de Hipótesis: -Paso 1: Formulación de la hipótesis: Las hipótesis se formulan utilizando dos formas básicas: la hipótesis nula H0 y la hipótesis alternativa Ha. La hipótesis nula H0 (conocida en ocasiones como la hipótesis de statu quo) es la hipótesis que se comprueba frente a su complemento, la hipótesis alternativa Ha) que en ocasiones se conoce como hipótesis de interés de la investigación). Supongamos que el gerente de Burger City cree que sus procedimientos operativos garantizaran que el cliente promedio espere dos minutos en la fila de la ventanilla de atención en el auto. Hace una investigación, basada en la observación de 1000 clientes en establecimientos aleatoriamente seleccionados a horas aleatoriamente seleccionadas. El cliente promedio observado en este estudio pasa 2.4 minutos en la fila de la ventanilla de atención en el auto. La hipótesis nula y la hipótesis alternativa podrían formularse de la siguiente manera: -Hipótesis nula H0: Tiempo medio de espera = 2 minutos. Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 2 -Hipótesis alternativa Ha: Tiempo medio de espera ≠2 minutos. Cabe señalar que la hipótesis nula y la hipótesis alternativa deben formularse de tal manera que no sea posible que las dos sean ciertas. La idea es usar la evidencia disponible para saber cuál de ellas tiene más probabilidades de ser cierta. -Paso 2: Elegir la prueba estadística apropiada: El analista debe elegir la prueba estadística apropiada, dadas las características de la situación investigada. -Paso 3: Desarrollo de una regla de decisión: Se necesita una regla de decisión para determinar si rechazar o no rechazar la hipótesis nula. Los expertos en estadísticas establecen esas reglas de decisión en términos de los niveles de significancia. El nivel de significancia (α) es crucial en el proceso de elegir entre las hipótesis nula y alternativa. El nivel de significancia (por ejemplo, 0.10, 0.05) es la probabilidad de que se considere demasiado bajo para justificar la aceptación de la hipótesis nula. El rechazo de la hipótesis nula equivale a apoyar la hipótesis alternativa. -Paso 4: Cálculo del valor de la estadística de prueba: En este paso el investigador hace lo siguiente: -Utiliza la fórmula apropiada para calcular el valor de la estadística para la prueba elegida. -Compara el valor recién calculado para el valor crítico de la estadística (a partir de la tabla apropiada), con base en la regla de decisión elegida. -Con base en la comparación, determina rechazar o no rechazar la hipótesis nula H0. Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 3 -Paso 5: Formulación de la conclusión: La conclusión resume los resultados de la prueba. Es preciso formularla desde la perspectiva de la pregunta de investigación original. Tipos de errores en la prueba Las pruebas de hipótesis están sujetas a dos tipos de errores generales, que por lo regular se conocen como error tipo I y error tipo II. Un error tipo I comprende el rechazo de la hipótesis nula cuando, en realidad, es verdadera. Es probable que el investigador llegue a esta conclusión equivocada porque la diferencia observada entre los valores de la muestra y la población se deba al error de muestreo. El investigador debe decidir cuán dispuesto está a cometer un error tipo I. La probabilidad de cometer este error se conoce como nivel alfa (α). Por el contrario, 1-α es la probabilidad de tomar una decisión correcta al no rechazar la hipótesis nula cuando, de hecho, es verdadera. Un error tipo II comprende el hecho de no rechazar la hipótesis nula cuando en realidad es falsa. Un error tipo II se conoce como error beta (β). El valor 1-β refleja la probabilidad de tomar una decisión correcta al rechazar la hipótesis nula cuando en realidad es falsa. Al considerar los diversos tipos de pruebas de hipótesis, tenga en mente que cuando un investigador rechaza o no la hipótesis nula, esta decisión nunca se toma con una certeza de 100%. Existe una probabilidad de que la decisión sea correcta y otra probabilidad de que no lo sea. El investigador establece el nivel de α, después de consultar con su cliente, considerando los recursos disponibles para el proyecto, y las implicaciones de cometer errores de tipo I y tipo II. Aceptar H0 o no rechazar H0 Los investigadores a menudo no distinguen entre aceptar H0 y no rechazar H0. Sin embargo, existe una diferencia muy importante entre estas dos decisiones. Al probar una hipótesis se supone que H0 es verdadera hasta que se demuestra que es probable que sea falsa. En una situación de comprobación de hipótesis, la única que puede ser aceptada es la hipótesis alternativa Ha. Ya sea que existan suficientes evidencias para apoyar Ha (rechazar H0) o que no las haya (no rechazar H0). La verdadera pregunta es si hay suficientes evidencias en los datos para llegar a la conclusión de que Ha es correcta. Si no rechazamos H0, decimos que la información no respalda de manera suficiente la afirmación hecha en Ha, no que aceptamos la afirmación hecha en H0. Prueba de una cola frente a prueba de dos colas. Las pruebas pueden ser de una o dos colas. La decisión sobre cuál utilizar depende de la naturaleza de la situación y lo que el investigador trata de demostrar. Por ejemplo, cuando el departamento de control de calidad de una organización de comida rápida recibe un embarque de pechugas de pollo deuno de sus proveedores y necesita determinar si el producto cumple con las especificaciones del contenido de grasa, es apropiada una prueba de una cola. El embarque será rechazado si no cumple con las especificaciones mínimas. Por otra parte, los gerentes de la empresa de carne que abastece el producto deben realizar pruebas de dos colas para determinar dos factores. En primer lugar, deben asegurarse de que el producto cumpla con las especificaciones mínimas de su cliente antes de enviarlo. En segundo, quieren determinar si el producto excede las especificaciones, porque esto puede ser muy costoso para ellos. Pruebas de hipótesis estadística utilizadas con frecuencia -Muestras independientes frente a relacionadas: En algunos casos, uno necesita probar la hipótesis de que el valor de una variable en una población es igual al valor de esa misma variable en otra población. La selección de la estadística de prueba apropiada requiere que el investigador considere si las muestras son independientes o relacionadas. Las muestras Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 4 independientes son aquellas en las que la medición de la variable de interés en una muestra no tiene ningún efecto en la medición de la variable en la otra muestra. No es necesario que haya dos encuestas diferentes, solo que la medición de la variable en una población no tenga efecto en la medición de la variable en la otra población. En el caso de muestras relacionadas, la medición de la variable de interés en una muestra puede influir en la medición de la variable en la otra muestra. Si, por ejemplo, se entrevista a hombres y mujeres en una encuesta particular sobre su frecuencia de comer fuera, es imposible que la respuesta de un hombre afecte o cambie la manera en que una mujer respondería a una pregunta de la encuesta. Así, este sería un ejemplo de muestras independientes. En contraste, considérese una situación en la que el investigador debiera determinar el efecto de una nueva campaña publicitaria en la notoriedad de una marca particular para el consumidor. Para hacer esto, el investigador podría encuestar a una muestra aleatoria de consumidores antes de lanzar la nueva campana y luego encuestar a la misma muestra de consumidores 90 días después de lanzada la nueva campaña. Estas muestras no son independientes. La medición de notoriedad 90 días después del inicio de la campana podría verse afectada por la primera medición. -Grados de libertad: El número de grados de libertad es el número de observaciones en un problema estadístico que no están restringidas o son libres de variar. El número de grados de libertad (gl) es igual al número de observaciones menos el número de supuestos o limitaciones necesarias para calcular una estadística. Bondad de ajuste -Prueba de ji cuadrada: La prueba de ji cuadrada (X2) permite al analista de la investigacion determinar si un patrón de frecuencias observado corresponde o se ajusta a un patrón “esperado”. Prueba la “bondad de ajuste” de la distribución observada a una distribución esperada. -Prueba de ji cuadrada de una sola muestra: esta prueba se aplica como sigue: 1) Especificar las hipótesis nula y alternativa. 2) Determinar el número de visitantes que se esperarían en cada categoría si la hipótesis nula fuera correcta (Ei) 3) Calcular el valor de X2 utilizando la formula 4) Seleccionar el nivel de significancia α. 5) Exprese el resultado. -Prueba de ji cuadrada de dos muestras independientes: Los investigadores de marketing a menudo necesitan determinar si existe alguna asociación entre dos o más variables. Esta prueba se aplica como sigue: 1) Especificar las hipótesis nula y alternativa. 2) Colocar las frecuencias observadas (muestra) en una tabla k x r (tabulación cruzada o tabla de contingencias), utilizando las columnas k para los grupos de la muestra y las filas r para las condiciones o tratamientos. Calcule la suma de cada fila y cada columna. Registre esos totales en los márgenes de la tabla (se conocen como totales marginales). Asimismo, calcule el total de toda la tabla (N). 3) Determine la frecuencia esperada para cada celda en la tabla de contingencias calculando el producto de los dos totales marginales comunes para esa celda y dividiendo ese valor entre N. 4) Calcular el valor de X2 utilizando la formula Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 5 5) Exprese el resultado. Hipótesis acerca de una media -Prueba Z: Si el tamaño de la muestra es suficientemente grande (n≥30), la estadística de prueba apropiada para comprobar una hipótesis acerca de una media es la prueba Z. 1) Especificar las hipótesis nula y alternativa. 2) Especificar el nivel de error de muestreo (α) permitido. 3) Determinar la desviación estándar (S) de la muestra. 4) Calcular el error estándar estimado de la media, utilizando la fórmula: 5) Calcular la estadística de prueba: 6) Expresar le resultado. La hipótesis nula se puede rechazar porque el valor calculado de Z es mayor que el valor crítico Z. -Prueba t: Para las muestras pequeñas (n<30), la prueba t con n-1 grados de libertad es la prueba apropiada para realizar inferencias estadísticas. La distribución t también es teóricamente correcta para muestras grandes (n≥30). Sin embargo, se aproxima y se vuelve imposible de distinguir de la distribución normal para las muestras de 30 o más observaciones. Aunque la prueba Z se usa generalmente para pruebas grandes, casi todo el software estadístico utiliza la prueba t para cualquier tamaño de muestra. 1) Especificar las hipótesis nula y alternativa. 2) Especificar el nivel de error de muestreo (α) permitido. 3) Determinar la desviación estándar (S) de la muestra. 4) Calcular el error estándar estimado de la media (Sx), utilizando la fórmula: 5) Calcular la estadística de la prueba t: 6) Expresar le resultado. La hipótesis nula se puede rechazar porque el valor calculado de t es menor que el valor crítico t. Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 6 Hipótesis acerca de dos medias Con frecuencia, a los especialistas en marketing les interesa probar las diferencias entre grupos. La comprobación de esta hipótesis comprende de los pasos siguientes: 1) Especificar las hipótesis nula y alternativa. 2) Especificar el nivel de error de muestreo (α) permitido. 3) Calcular el error estándar estimado de las diferencias entre las dos medias, como sigue: 4) Calcular la estadística de prueba Z, como sigue: 5) Expresar le resultado. El Valor calculado de Z es mayor que el valor critico de modo que se rechaza la hipótesis nula. Hipótesis acerca de las proporciones En muchas situaciones los investigadores se preocupan por fenómenos expresados en términos de porcentajes. Por ejemplo, quizá a los especialistas en marketing les interesa probar la proporción de entrevistados que prefieren la marca A frente a aquellos que prefieren la marca B. -Proporción en una muestra: Prueba para determinar si la diferencia entre las proporciones es mayor que la esperada debido al error de muestreo. El procedimiento para la prueba de la hipótesis de las proporciones es el siguiente: 1) Especificar las hipótesis nula y alternativa. 2) Especificar el nivel de error de muestreo (α) permitido. 3) Calcular el error estándar estimado, utilizando el valor de P especificado en la hipótesis nula: 4) Calcular la estadística de prueba, como sigue: Se rechaza la hipótesis nula porque el valor Z calculado es mayor que el valor Z crítico. -Dos Proporciones en muestras independientes: En muchos casos la gerencia se interesa por la diferencia entre las proporciones de personas en dos grupos diferentes que participan en cierta actividad o tienen cierta característica. Las especificaciones requeridas y el procedimiento para probar esta hipótesis son lossiguientes: 1) Especificar las hipótesis nula y alternativa. 2) Especificar el nivel de error de muestreo (α) permitido. Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 7 3) Calcular el error estándar estimado de las diferencias entre las dos proporciones, como sigue: 4) Calcular la estadística de prueba: 5) Expresar el resultado. Se rechaza la hipótesis nula porque el valor Z calculado es mayor que el valor Z crítico. Análisis de varianza (ANOVA) Cuando la meta es probar las diferencias entre las medias de dos muestras independientes o más, el análisis de varianza es una herramienta estadística apropiada. Aunque se puede usar para probar las diferencias entre dos medias, el ANOVA se utiliza con mayor frecuencia para probar hipótesis acerca de las diferencias entre las medias de varios grupos independientes (C) (donde C≥3). Es una técnica estadística que permite al investigador determinar si la variabilidad entre y en todas las medias de la muestra C es mayor que la esperada debido al error de muestreo. 1) Especificar las hipótesis nula y alternativa. 2) 3) Calcular la variación entre las medias del grupo medidas por la suma media de cuadrados entre los grupos (MSA). Se calcula como sigue: 𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝐷𝐷𝐷𝐷 𝐶𝐶𝑆𝑆𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐸𝐸𝐸𝐸𝐶𝐶𝐷𝐷 𝐺𝐺𝑆𝑆𝐶𝐶𝐺𝐺𝐶𝐶𝑆𝑆 (𝑆𝑆𝑆𝑆𝑆𝑆) 𝐺𝐺𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐷𝐷 𝐿𝐿𝐿𝐿𝐿𝐿𝐷𝐷𝐶𝐶𝐸𝐸𝑆𝑆𝐷𝐷 (𝑔𝑔𝑔𝑔) 4) Sumar las diferencias cuadradas entre cada observación (Xij) y su media de muestra asociada (Xj), acumuladas en todos los niveles C (grupos). También conocida como la suma de los cuadrados entre grupos o en la variación de los grupos, por lo general se llama suma de cuadrado del error (SSE). El SSE se calcula como sigue: 5) Calcular la variación en los grupos de la muestra según se mide por la suma media de los cuadrados entre los grupos. Conocido como error cuadrado de la media (MSE), representa una estimación del error aleatorio en los datos. El MSE se calcula como sigue: Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 8 𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝐷𝐷𝐷𝐷 𝐶𝐶𝑆𝑆𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐸𝐸𝐸𝐸𝐶𝐶𝐷𝐷 𝐺𝐺𝑆𝑆𝐶𝐶𝐺𝐺𝐶𝐶𝑆𝑆 (𝑆𝑆𝑆𝑆𝐷𝐷) 𝐺𝐺𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐷𝐷 𝐿𝐿𝐿𝐿𝐿𝐿𝐷𝐷𝐶𝐶𝐸𝐸𝑆𝑆𝐷𝐷 (𝑔𝑔𝑔𝑔) El número de grados de libertad es igual a la suma de los tamaños de las muestras para todos los grupos menos el número de grupos (C): Una distribución de muestreo conocida como la distribución F permite al investigador determinar la probabilidad de que un valor calculado F haya ocurrido por causalidad y no como resultado del efecto del tratamiento, la distribución F, al igual que la distribución t, es en realidad un conjunto de distribuciones cuya forma cambia ligeramente dependiendo del número y el tamaño de las muestras involucradas. Para usar la prueba F, es necesario calcular los grados de libertad para el numerador y el denominador. 6) Calcular la estadística F, como sigue: 𝑓𝑓 = 𝑀𝑀𝑀𝑀𝑀𝑀 𝑀𝑀𝑀𝑀𝑀𝑀 7) Expresar los resultados. Valores p y pruebas de significancia Este enfoque no da la probabilidad exacta de obtener una estadística de prueba calculada que se deba en gran medida a la causalidad. Los cálculos para estimar esta probabilidad, que por lo regular se conoce como valor p, son tediosos de realizar a mano. El valor p es la probabilidad exacta de obtener una estadística de prueba calculada que se deba a la causalidad. Mientras más bajo sea el valor p, menor será la probabilidad de que el resultado observado ocurra debido a la causalidad.
Compartir