Logo Studenta

Capitulo 16

¡Estudia con miles de materiales!

Vista previa del material en texto

Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 
 
1 
 
Significancia estadística 
El método básico para hacer inferencias estadísticas es generalizar a partir de los resultados de 
la muestra en relación con las características de la población. Un aspecto fundamental de la 
inferencia estadística es que es posible que los números sean diferentes en un sentido 
matemático, pero no muy diferentes en un sentido estadístico. Por ejemplo, suponga que a un 
grupo de bebedores de refrescos de cola se le pide que pruebe dos bebidas de cola en una 
prueba a ciegas e indique cuál prefiere; los resultados muestran que 51% prefiere uno de los 
productos y 49% el otro. Hay una diferencia matemática en los resultados, pero podría parecer 
menor e intrascendente. Quizá la diferencia se encuentra dentro del rango de precisión de la 
habilidad de los investigadores para medir las preferencias y, por tanto, es probable que no 
sea significativa en un sentido estadístico. Es posible aplicar tres conceptos distintos a la idea 
de las diferencias al hablar de los resultados de las muestras: 
 -Diferencia matemáticas: Por definición, si los números no son exactamente iguales, 
son diferentes. 
 -Significancia estadística: Si una diferencia en particular es suficientemente grande 
para que haya pocas probabilidades de que procura por casualidad o por el error de muestreo, 
entonces es estadísticamente significativa. 
 -Diferencias administrativamente importantes: Podemos argumentar que una 
diferencia es importante desde una perspectiva gerencial sólo si los resultados o los números 
son lo suficientemente diferentes. 
Comprobación de hipótesis 
Una hipótesis es un supuesto o teoría presentada por un investigador o gerente acerca de 
alguna característica de la población investigada. En la comprobación de hipótesis el 
investigador determina si una hipótesis relacionada con alguna característica de la población 
es probable que sea cierta, en vista de las evidencias. La prueba de una hipótesis estadística 
permite calcular la probabilidad de observar un resultado en particular si la hipótesis 
establecida es verdadera. 
Existen dos explicaciones básicas para una diferencia observada entre un valor hipotético y el 
resultado de una investigación en particular. Ninguna de las hipótesis es verdadera y quizá la 
diferencia observada se debe a un error de muestreo, o bien la hipótesis es falsa y el valor real 
es algún otro. 
-Pasos en la comprobación de Hipótesis: 
 -Paso 1: Formulación de la hipótesis: Las hipótesis se formulan utilizando dos formas 
básicas: la hipótesis nula H0 y la hipótesis alternativa Ha. La hipótesis nula H0 (conocida en 
ocasiones como la hipótesis de statu quo) es la hipótesis que se comprueba frente a su 
complemento, la hipótesis alternativa Ha) que en ocasiones se conoce como hipótesis de 
interés de la investigación). Supongamos que el gerente de Burger City cree que sus 
procedimientos operativos garantizaran que el cliente promedio espere dos minutos en la fila 
de la ventanilla de atención en el auto. Hace una investigación, basada en la observación de 
1000 clientes en establecimientos aleatoriamente seleccionados a horas aleatoriamente 
seleccionadas. El cliente promedio observado en este estudio pasa 2.4 minutos en la fila de la 
ventanilla de atención en el auto. La hipótesis nula y la hipótesis alternativa podrían 
formularse de la siguiente manera: 
-Hipótesis nula H0: Tiempo medio de espera = 2 minutos. 
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 
 
2 
 
-Hipótesis alternativa Ha: Tiempo medio de espera ≠2 minutos. 
Cabe señalar que la hipótesis nula y la hipótesis alternativa deben formularse de tal manera 
que no sea posible que las dos sean ciertas. La idea es usar la evidencia disponible para saber 
cuál de ellas tiene más probabilidades de ser cierta. 
 -Paso 2: Elegir la prueba estadística apropiada: El analista debe elegir la prueba 
estadística apropiada, dadas las características de la situación investigada. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
-Paso 3: Desarrollo de una regla de decisión: Se necesita una regla de decisión para 
determinar si rechazar o no rechazar la hipótesis nula. Los expertos en estadísticas establecen 
esas reglas de decisión en términos de los niveles de significancia. 
El nivel de significancia (α) es crucial en el proceso de elegir entre las hipótesis nula y 
alternativa. El nivel de significancia (por ejemplo, 0.10, 0.05) es la probabilidad de que se 
considere demasiado bajo para justificar la aceptación de la hipótesis nula. El rechazo de la 
hipótesis nula equivale a apoyar la hipótesis alternativa. 
 -Paso 4: Cálculo del valor de la estadística de prueba: En este paso el investigador 
hace lo siguiente: 
 -Utiliza la fórmula apropiada para calcular el valor de la estadística para la 
prueba elegida. 
 -Compara el valor recién calculado para el valor crítico de la estadística (a 
partir de la tabla apropiada), con base en la regla de decisión elegida. 
 -Con base en la comparación, determina rechazar o no rechazar la hipótesis 
nula H0. 
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 
 
3 
 
 -Paso 5: Formulación de la conclusión: La conclusión resume los resultados de la 
prueba. Es preciso formularla desde la perspectiva de la pregunta de investigación original. 
 
Tipos de errores en la prueba 
Las pruebas de hipótesis están sujetas a dos tipos de errores generales, que por lo regular se 
conocen como error tipo I y error tipo II. Un error tipo I comprende el rechazo de la hipótesis 
nula cuando, en realidad, es verdadera. Es probable que el investigador llegue a esta 
conclusión equivocada porque la diferencia observada entre los valores de la muestra y la 
población se deba al error de muestreo. El investigador debe decidir cuán dispuesto está a 
cometer un error tipo I. La probabilidad de cometer este error se conoce como nivel alfa (α). 
Por el contrario, 1-α es la probabilidad de tomar una decisión correcta al no rechazar la 
hipótesis nula cuando, de hecho, es verdadera. 
Un error tipo II comprende el hecho de no rechazar la hipótesis nula cuando en realidad es 
falsa. Un error tipo II se conoce como error beta (β). El valor 1-β refleja la probabilidad de 
tomar una decisión correcta al rechazar la hipótesis nula cuando en realidad es falsa. 
Al considerar los diversos tipos de pruebas de hipótesis, tenga en mente que cuando un 
investigador rechaza o no la hipótesis nula, esta decisión nunca se toma con una certeza de 
100%. Existe una probabilidad de que la decisión sea correcta y otra probabilidad de que no lo 
sea. El investigador establece el nivel de α, después de consultar con su cliente, considerando 
los recursos disponibles para el proyecto, y las implicaciones de cometer errores de tipo I y 
tipo II. 
Aceptar H0 o no rechazar H0 
Los investigadores a menudo no distinguen entre aceptar H0 y no rechazar H0. Sin embargo, 
existe una diferencia muy importante entre estas dos decisiones. Al probar una hipótesis se 
supone que H0 es verdadera hasta que se demuestra que es probable que sea falsa. En una 
situación de comprobación de hipótesis, la única que puede ser aceptada es la hipótesis 
alternativa Ha. Ya sea que existan suficientes evidencias para apoyar Ha (rechazar H0) o que no 
las haya (no rechazar H0). La verdadera pregunta es si hay suficientes evidencias en los datos 
para llegar a la conclusión de que Ha es correcta. Si no rechazamos H0, decimos que la 
información no respalda de manera suficiente la afirmación hecha en Ha, no que aceptamos la 
afirmación hecha en H0. 
Prueba de una cola frente a prueba de dos colas. 
Las pruebas pueden ser de una o dos colas. La decisión sobre cuál utilizar depende de la 
naturaleza de la situación y lo que el investigador trata de demostrar. Por ejemplo, cuando el 
departamento de control de calidad de una organización de comida rápida recibe un 
embarque de pechugas de pollo deuno de sus proveedores y necesita determinar si el 
producto cumple con las especificaciones del contenido de grasa, es apropiada una prueba de 
una cola. El embarque será rechazado si no cumple con las especificaciones mínimas. Por otra 
parte, los gerentes de la empresa de carne que abastece el producto deben realizar pruebas de 
dos colas para determinar dos factores. En primer lugar, deben asegurarse de que el producto 
cumpla con las especificaciones mínimas de su cliente antes de enviarlo. En segundo, quieren 
determinar si el producto excede las especificaciones, porque esto puede ser muy costoso 
para ellos. 
Pruebas de hipótesis estadística utilizadas con frecuencia 
-Muestras independientes frente a relacionadas: En algunos casos, uno necesita probar la 
hipótesis de que el valor de una variable en una población es igual al valor de esa misma 
variable en otra población. La selección de la estadística de prueba apropiada requiere que el 
investigador considere si las muestras son independientes o relacionadas. Las muestras 
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 
 
4 
 
independientes son aquellas en las que la medición de la variable de interés en una muestra 
no tiene ningún efecto en la medición de la variable en la otra muestra. No es necesario que 
haya dos encuestas diferentes, solo que la medición de la variable en una población no tenga 
efecto en la medición de la variable en la otra población. En el caso de muestras relacionadas, 
la medición de la variable de interés en una muestra puede influir en la medición de la variable 
en la otra muestra. Si, por ejemplo, se entrevista a hombres y mujeres en una encuesta 
particular sobre su frecuencia de comer fuera, es imposible que la respuesta de un hombre 
afecte o cambie la manera en que una mujer respondería a una pregunta de la encuesta. Así, 
este sería un ejemplo de muestras independientes. En contraste, considérese una situación en 
la que el investigador debiera determinar el efecto de una nueva campaña publicitaria en la 
notoriedad de una marca particular para el consumidor. Para hacer esto, el investigador podría 
encuestar a una muestra aleatoria de consumidores antes de lanzar la nueva campana y luego 
encuestar a la misma muestra de consumidores 90 días después de lanzada la nueva campaña. 
Estas muestras no son independientes. La medición de notoriedad 90 días después del inicio 
de la campana podría verse afectada por la primera medición. 
-Grados de libertad: El número de grados de libertad es el número de observaciones en un 
problema estadístico que no están restringidas o son libres de variar. El número de grados de 
libertad (gl) es igual al número de observaciones menos el número de supuestos o limitaciones 
necesarias para calcular una estadística. 
 
 
Bondad de ajuste 
-Prueba de ji cuadrada: La prueba de ji cuadrada (X2) permite al analista de la investigacion 
determinar si un patrón de frecuencias observado corresponde o se ajusta a un patrón 
“esperado”. Prueba la “bondad de ajuste” de la distribución observada a una distribución 
esperada. 
 -Prueba de ji cuadrada de una sola muestra: esta prueba se aplica como sigue: 
 1) Especificar las hipótesis nula y alternativa. 
 2) Determinar el número de visitantes que se esperarían en cada categoría si la 
hipótesis nula fuera correcta (Ei) 
 3) Calcular el valor de X2 utilizando la formula 
 
 4) Seleccionar el nivel de significancia α. 
 5) Exprese el resultado. 
 -Prueba de ji cuadrada de dos muestras independientes: Los investigadores de 
marketing a menudo necesitan determinar si existe alguna asociación entre dos o más 
variables. Esta prueba se aplica como sigue: 
 1) Especificar las hipótesis nula y alternativa. 
 2) Colocar las frecuencias observadas (muestra) en una tabla k x r (tabulación 
cruzada o tabla de contingencias), utilizando las columnas k para los grupos de la muestra y las 
filas r para las condiciones o tratamientos. Calcule la suma de cada fila y cada columna. 
Registre esos totales en los márgenes de la tabla (se conocen como totales marginales). 
Asimismo, calcule el total de toda la tabla (N). 
 3) Determine la frecuencia esperada para cada celda en la tabla de 
contingencias calculando el producto de los dos totales marginales comunes para esa celda y 
dividiendo ese valor entre N. 
 4) Calcular el valor de X2 utilizando la formula 
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 
 
5 
 
 
 5) Exprese el resultado. 
 
Hipótesis acerca de una media 
-Prueba Z: Si el tamaño de la muestra es suficientemente grande (n≥30), la estadística de 
prueba apropiada para comprobar una hipótesis acerca de una media es la prueba Z. 
 1) Especificar las hipótesis nula y alternativa. 
 2) Especificar el nivel de error de muestreo (α) permitido. 
 3) Determinar la desviación estándar (S) de la muestra. 
 4) Calcular el error estándar estimado de la media, utilizando la fórmula: 
 
 5) Calcular la estadística de prueba: 
 
 6) Expresar le resultado. La hipótesis nula se puede rechazar porque el valor 
calculado de Z es mayor que el valor crítico Z. 
-Prueba t: Para las muestras pequeñas (n<30), la prueba t con n-1 grados de libertad es la 
prueba apropiada para realizar inferencias estadísticas. La distribución t también es 
teóricamente correcta para muestras grandes (n≥30). Sin embargo, se aproxima y se vuelve 
imposible de distinguir de la distribución normal para las muestras de 30 o más observaciones. 
Aunque la prueba Z se usa generalmente para pruebas grandes, casi todo el software 
estadístico utiliza la prueba t para cualquier tamaño de muestra. 
 1) Especificar las hipótesis nula y alternativa. 
 2) Especificar el nivel de error de muestreo (α) permitido. 
 3) Determinar la desviación estándar (S) de la muestra. 
 
 4) Calcular el error estándar estimado de la media (Sx), utilizando la fórmula: 
 
 5) Calcular la estadística de la prueba t: 
 
 6) Expresar le resultado. La hipótesis nula se puede rechazar porque el valor 
calculado de t es menor que el valor crítico t. 
 
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 
 
6 
 
Hipótesis acerca de dos medias 
Con frecuencia, a los especialistas en marketing les interesa probar las diferencias entre 
grupos. La comprobación de esta hipótesis comprende de los pasos siguientes: 
 1) Especificar las hipótesis nula y alternativa. 
 2) Especificar el nivel de error de muestreo (α) permitido. 
 3) Calcular el error estándar estimado de las diferencias entre las dos medias, 
como sigue: 
 
 4) Calcular la estadística de prueba Z, como sigue: 
 
 5) Expresar le resultado. El Valor calculado de Z es mayor que el valor critico de 
modo que se rechaza la hipótesis nula. 
 
Hipótesis acerca de las proporciones 
En muchas situaciones los investigadores se preocupan por fenómenos expresados en 
términos de porcentajes. Por ejemplo, quizá a los especialistas en marketing les interesa 
probar la proporción de entrevistados que prefieren la marca A frente a aquellos que prefieren 
la marca B. 
 
-Proporción en una muestra: Prueba para determinar si la diferencia entre las proporciones es 
mayor que la esperada debido al error de muestreo. El procedimiento para la prueba de la 
hipótesis de las proporciones es el siguiente: 
 1) Especificar las hipótesis nula y alternativa. 
 2) Especificar el nivel de error de muestreo (α) permitido. 
 3) Calcular el error estándar estimado, utilizando el valor de P especificado en 
la hipótesis nula: 
 
4) Calcular la estadística de prueba, como sigue: 
 
Se rechaza la hipótesis nula porque el valor Z calculado es mayor que el valor Z 
crítico. 
-Dos Proporciones en muestras independientes: En muchos casos la gerencia se interesa por la 
diferencia entre las proporciones de personas en dos grupos diferentes que participan en 
cierta actividad o tienen cierta característica. Las especificaciones requeridas y el 
procedimiento para probar esta hipótesis son lossiguientes: 
 1) Especificar las hipótesis nula y alternativa. 
 2) Especificar el nivel de error de muestreo (α) permitido. 
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 
 
7 
 
 3) Calcular el error estándar estimado de las diferencias entre las dos 
proporciones, como sigue: 
 
 4) Calcular la estadística de prueba: 
 
 5) Expresar el resultado. Se rechaza la hipótesis nula porque el valor Z 
calculado es mayor que el valor Z crítico. 
 
Análisis de varianza (ANOVA) 
Cuando la meta es probar las diferencias entre las medias de dos muestras independientes o 
más, el análisis de varianza es una herramienta estadística apropiada. Aunque se puede usar 
para probar las diferencias entre dos medias, el ANOVA se utiliza con mayor frecuencia para 
probar hipótesis acerca de las diferencias entre las medias de varios grupos independientes (C) 
(donde C≥3). Es una técnica estadística que permite al investigador determinar si la 
variabilidad entre y en todas las medias de la muestra C es mayor que la esperada debido al 
error de muestreo. 
 1) Especificar las hipótesis nula y alternativa. 
 2) 
 
 3) Calcular la variación entre las medias del grupo medidas por la suma media 
de cuadrados entre los grupos (MSA). Se calcula como sigue: 
 𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝐷𝐷𝐷𝐷 𝐶𝐶𝑆𝑆𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐸𝐸𝐸𝐸𝐶𝐶𝐷𝐷 𝐺𝐺𝑆𝑆𝐶𝐶𝐺𝐺𝐶𝐶𝑆𝑆 (𝑆𝑆𝑆𝑆𝑆𝑆)
𝐺𝐺𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐷𝐷 𝐿𝐿𝐿𝐿𝐿𝐿𝐷𝐷𝐶𝐶𝐸𝐸𝑆𝑆𝐷𝐷 (𝑔𝑔𝑔𝑔)
 
 4) Sumar las diferencias cuadradas entre cada observación (Xij) y su media de 
muestra asociada (Xj), acumuladas en todos los niveles C (grupos). También conocida como la 
suma de los cuadrados entre grupos o en la variación de los grupos, por lo general se llama 
suma de cuadrado del error (SSE). El SSE se calcula como sigue: 
 
 5) Calcular la variación en los grupos de la muestra según se mide por la suma media 
de los cuadrados entre los grupos. Conocido como error cuadrado de la media (MSE), 
representa una estimación del error aleatorio en los datos. El MSE se calcula como sigue: 
 
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones 
 
8 
 
 𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝐷𝐷𝐷𝐷 𝐶𝐶𝑆𝑆𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐸𝐸𝐸𝐸𝐶𝐶𝐷𝐷 𝐺𝐺𝑆𝑆𝐶𝐶𝐺𝐺𝐶𝐶𝑆𝑆 (𝑆𝑆𝑆𝑆𝐷𝐷)
𝐺𝐺𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐷𝐷 𝐿𝐿𝐿𝐿𝐿𝐿𝐷𝐷𝐶𝐶𝐸𝐸𝑆𝑆𝐷𝐷 (𝑔𝑔𝑔𝑔)
 
El número de grados de libertad es igual a la suma de los tamaños de las muestras para todos 
los grupos menos el número de grupos (C): 
 
Una distribución de muestreo conocida como la distribución F permite al investigador 
determinar la probabilidad de que un valor calculado F haya ocurrido por causalidad y no como 
resultado del efecto del tratamiento, la distribución F, al igual que la distribución t, es en 
realidad un conjunto de distribuciones cuya forma cambia ligeramente dependiendo del 
número y el tamaño de las muestras involucradas. Para usar la prueba F, es necesario calcular 
los grados de libertad para el numerador y el denominador. 
 6) Calcular la estadística F, como sigue: 
𝑓𝑓 =
𝑀𝑀𝑀𝑀𝑀𝑀
𝑀𝑀𝑀𝑀𝑀𝑀
 
 7) Expresar los resultados. 
 
 
 
Valores p y pruebas de significancia 
 
Este enfoque no da la probabilidad exacta de obtener una estadística de prueba calculada que 
se deba en gran medida a la causalidad. Los cálculos para estimar esta probabilidad, que por lo 
regular se conoce como valor p, son tediosos de realizar a mano. El valor p es la probabilidad 
exacta de obtener una estadística de prueba calculada que se deba a la causalidad. Mientras 
más bajo sea el valor p, menor será la probabilidad de que el resultado observado ocurra 
debido a la causalidad.

Continuar navegando