Capitulo 16

•

SIN SIGLA

Esteban Darío Linares

19/6/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Investigación de Mercado / Investigación Operacional

1054 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Capítulo 16 – Pruebas estadísticas de diferencias y relaciones

Significancia estadística
El método básico para hacer inferencias estadísticas es generalizar a partir de los resultados de
la muestra en relación con las características de la población. Un aspecto fundamental de la
inferencia estadística es que es posible que los números sean diferentes en un sentido
matemático, pero no muy diferentes en un sentido estadístico. Por ejemplo, suponga que a un
grupo de bebedores de refrescos de cola se le pide que pruebe dos bebidas de cola en una
prueba a ciegas e indique cuál prefiere; los resultados muestran que 51% prefiere uno de los
productos y 49% el otro. Hay una diferencia matemática en los resultados, pero podría parecer
menor e intrascendente. Quizá la diferencia se encuentra dentro del rango de precisión de la
habilidad de los investigadores para medir las preferencias y, por tanto, es probable que no
sea significativa en un sentido estadístico. Es posible aplicar tres conceptos distintos a la idea
de las diferencias al hablar de los resultados de las muestras:
-Diferencia matemáticas: Por definición, si los números no son exactamente iguales,
son diferentes.
-Significancia estadística: Si una diferencia en particular es suficientemente grande
para que haya pocas probabilidades de que procura por casualidad o por el error de muestreo,
entonces es estadísticamente significativa.
-Diferencias administrativamente importantes: Podemos argumentar que una
diferencia es importante desde una perspectiva gerencial sólo si los resultados o los números
son lo suficientemente diferentes.
Comprobación de hipótesis
Una hipótesis es un supuesto o teoría presentada por un investigador o gerente acerca de
alguna característica de la población investigada. En la comprobación de hipótesis el
investigador determina si una hipótesis relacionada con alguna característica de la población
es probable que sea cierta, en vista de las evidencias. La prueba de una hipótesis estadística
permite calcular la probabilidad de observar un resultado en particular si la hipótesis
establecida es verdadera.
Existen dos explicaciones básicas para una diferencia observada entre un valor hipotético y el
resultado de una investigación en particular. Ninguna de las hipótesis es verdadera y quizá la
diferencia observada se debe a un error de muestreo, o bien la hipótesis es falsa y el valor real
es algún otro.
-Pasos en la comprobación de Hipótesis:
-Paso 1: Formulación de la hipótesis: Las hipótesis se formulan utilizando dos formas
básicas: la hipótesis nula H0 y la hipótesis alternativa Ha. La hipótesis nula H0 (conocida en
ocasiones como la hipótesis de statu quo) es la hipótesis que se comprueba frente a su
complemento, la hipótesis alternativa Ha) que en ocasiones se conoce como hipótesis de
interés de la investigación). Supongamos que el gerente de Burger City cree que sus
procedimientos operativos garantizaran que el cliente promedio espere dos minutos en la fila
de la ventanilla de atención en el auto. Hace una investigación, basada en la observación de
1000 clientes en establecimientos aleatoriamente seleccionados a horas aleatoriamente
seleccionadas. El cliente promedio observado en este estudio pasa 2.4 minutos en la fila de la
ventanilla de atención en el auto. La hipótesis nula y la hipótesis alternativa podrían
formularse de la siguiente manera:
-Hipótesis nula H0: Tiempo medio de espera = 2 minutos.
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones

-Hipótesis alternativa Ha: Tiempo medio de espera ≠2 minutos.
Cabe señalar que la hipótesis nula y la hipótesis alternativa deben formularse de tal manera
que no sea posible que las dos sean ciertas. La idea es usar la evidencia disponible para saber
cuál de ellas tiene más probabilidades de ser cierta.
-Paso 2: Elegir la prueba estadística apropiada: El analista debe elegir la prueba
estadística apropiada, dadas las características de la situación investigada.

-Paso 3: Desarrollo de una regla de decisión: Se necesita una regla de decisión para
determinar si rechazar o no rechazar la hipótesis nula. Los expertos en estadísticas establecen
esas reglas de decisión en términos de los niveles de significancia.
El nivel de significancia (α) es crucial en el proceso de elegir entre las hipótesis nula y
alternativa. El nivel de significancia (por ejemplo, 0.10, 0.05) es la probabilidad de que se
considere demasiado bajo para justificar la aceptación de la hipótesis nula. El rechazo de la
hipótesis nula equivale a apoyar la hipótesis alternativa.
-Paso 4: Cálculo del valor de la estadística de prueba: En este paso el investigador
hace lo siguiente:
-Utiliza la fórmula apropiada para calcular el valor de la estadística para la
prueba elegida.
-Compara el valor recién calculado para el valor crítico de la estadística (a
partir de la tabla apropiada), con base en la regla de decisión elegida.
-Con base en la comparación, determina rechazar o no rechazar la hipótesis
nula H0.
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones

-Paso 5: Formulación de la conclusión: La conclusión resume los resultados de la
prueba. Es preciso formularla desde la perspectiva de la pregunta de investigación original.

Tipos de errores en la prueba
Las pruebas de hipótesis están sujetas a dos tipos de errores generales, que por lo regular se
conocen como error tipo I y error tipo II. Un error tipo I comprende el rechazo de la hipótesis
nula cuando, en realidad, es verdadera. Es probable que el investigador llegue a esta
conclusión equivocada porque la diferencia observada entre los valores de la muestra y la
población se deba al error de muestreo. El investigador debe decidir cuán dispuesto está a
cometer un error tipo I. La probabilidad de cometer este error se conoce como nivel alfa (α).
Por el contrario, 1-α es la probabilidad de tomar una decisión correcta al no rechazar la
hipótesis nula cuando, de hecho, es verdadera.
Un error tipo II comprende el hecho de no rechazar la hipótesis nula cuando en realidad es
falsa. Un error tipo II se conoce como error beta (β). El valor 1-β refleja la probabilidad de
tomar una decisión correcta al rechazar la hipótesis nula cuando en realidad es falsa.
Al considerar los diversos tipos de pruebas de hipótesis, tenga en mente que cuando un
investigador rechaza o no la hipótesis nula, esta decisión nunca se toma con una certeza de
100%. Existe una probabilidad de que la decisión sea correcta y otra probabilidad de que no lo
sea. El investigador establece el nivel de α, después de consultar con su cliente, considerando
los recursos disponibles para el proyecto, y las implicaciones de cometer errores de tipo I y
tipo II.
Aceptar H0 o no rechazar H0
Los investigadores a menudo no distinguen entre aceptar H0 y no rechazar H0. Sin embargo,
existe una diferencia muy importante entre estas dos decisiones. Al probar una hipótesis se
supone que H0 es verdadera hasta que se demuestra que es probable que sea falsa. En una
situación de comprobación de hipótesis, la única que puede ser aceptada es la hipótesis
alternativa Ha. Ya sea que existan suficientes evidencias para apoyar Ha (rechazar H0) o que no
las haya (no rechazar H0). La verdadera pregunta es si hay suficientes evidencias en los datos
para llegar a la conclusión de que Ha es correcta. Si no rechazamos H0, decimos que la
información no respalda de manera suficiente la afirmación hecha en Ha, no que aceptamos la
afirmación hecha en H0.
Prueba de una cola frente a prueba de dos colas.
Las pruebas pueden ser de una o dos colas. La decisión sobre cuál utilizar depende de la
naturaleza de la situación y lo que el investigador trata de demostrar. Por ejemplo, cuando el
departamento de control de calidad de una organización de comida rápida recibe un
embarque de pechugas de pollo deuno de sus proveedores y necesita determinar si el
producto cumple con las especificaciones del contenido de grasa, es apropiada una prueba de
una cola. El embarque será rechazado si no cumple con las especificaciones mínimas. Por otra
parte, los gerentes de la empresa de carne que abastece el producto deben realizar pruebas de
dos colas para determinar dos factores. En primer lugar, deben asegurarse de que el producto
cumpla con las especificaciones mínimas de su cliente antes de enviarlo. En segundo, quieren
determinar si el producto excede las especificaciones, porque esto puede ser muy costoso
para ellos.
Pruebas de hipótesis estadística utilizadas con frecuencia
-Muestras independientes frente a relacionadas: En algunos casos, uno necesita probar la
hipótesis de que el valor de una variable en una población es igual al valor de esa misma
variable en otra población. La selección de la estadística de prueba apropiada requiere que el
investigador considere si las muestras son independientes o relacionadas. Las muestras
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones

independientes son aquellas en las que la medición de la variable de interés en una muestra
no tiene ningún efecto en la medición de la variable en la otra muestra. No es necesario que
haya dos encuestas diferentes, solo que la medición de la variable en una población no tenga
efecto en la medición de la variable en la otra población. En el caso de muestras relacionadas,
la medición de la variable de interés en una muestra puede influir en la medición de la variable
en la otra muestra. Si, por ejemplo, se entrevista a hombres y mujeres en una encuesta
particular sobre su frecuencia de comer fuera, es imposible que la respuesta de un hombre
afecte o cambie la manera en que una mujer respondería a una pregunta de la encuesta. Así,
este sería un ejemplo de muestras independientes. En contraste, considérese una situación en
la que el investigador debiera determinar el efecto de una nueva campaña publicitaria en la
notoriedad de una marca particular para el consumidor. Para hacer esto, el investigador podría
encuestar a una muestra aleatoria de consumidores antes de lanzar la nueva campana y luego
encuestar a la misma muestra de consumidores 90 días después de lanzada la nueva campaña.
Estas muestras no son independientes. La medición de notoriedad 90 días después del inicio
de la campana podría verse afectada por la primera medición.
-Grados de libertad: El número de grados de libertad es el número de observaciones en un
problema estadístico que no están restringidas o son libres de variar. El número de grados de
libertad (gl) es igual al número de observaciones menos el número de supuestos o limitaciones
necesarias para calcular una estadística.

Bondad de ajuste
-Prueba de ji cuadrada: La prueba de ji cuadrada (X2) permite al analista de la investigacion
determinar si un patrón de frecuencias observado corresponde o se ajusta a un patrón
“esperado”. Prueba la “bondad de ajuste” de la distribución observada a una distribución
esperada.
-Prueba de ji cuadrada de una sola muestra: esta prueba se aplica como sigue:
1) Especificar las hipótesis nula y alternativa.
2) Determinar el número de visitantes que se esperarían en cada categoría si la
hipótesis nula fuera correcta (Ei)
3) Calcular el valor de X2 utilizando la formula

4) Seleccionar el nivel de significancia α.
5) Exprese el resultado.
-Prueba de ji cuadrada de dos muestras independientes: Los investigadores de
marketing a menudo necesitan determinar si existe alguna asociación entre dos o más
variables. Esta prueba se aplica como sigue:
1) Especificar las hipótesis nula y alternativa.
2) Colocar las frecuencias observadas (muestra) en una tabla k x r (tabulación
cruzada o tabla de contingencias), utilizando las columnas k para los grupos de la muestra y las
filas r para las condiciones o tratamientos. Calcule la suma de cada fila y cada columna.
Registre esos totales en los márgenes de la tabla (se conocen como totales marginales).
Asimismo, calcule el total de toda la tabla (N).
3) Determine la frecuencia esperada para cada celda en la tabla de
contingencias calculando el producto de los dos totales marginales comunes para esa celda y
dividiendo ese valor entre N.
4) Calcular el valor de X2 utilizando la formula
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones

5) Exprese el resultado.

Hipótesis acerca de una media
-Prueba Z: Si el tamaño de la muestra es suficientemente grande (n≥30), la estadística de
prueba apropiada para comprobar una hipótesis acerca de una media es la prueba Z.
1) Especificar las hipótesis nula y alternativa.
2) Especificar el nivel de error de muestreo (α) permitido.
3) Determinar la desviación estándar (S) de la muestra.
4) Calcular el error estándar estimado de la media, utilizando la fórmula:

5) Calcular la estadística de prueba:

6) Expresar le resultado. La hipótesis nula se puede rechazar porque el valor
calculado de Z es mayor que el valor crítico Z.
-Prueba t: Para las muestras pequeñas (n<30), la prueba t con n-1 grados de libertad es la
prueba apropiada para realizar inferencias estadísticas. La distribución t también es
teóricamente correcta para muestras grandes (n≥30). Sin embargo, se aproxima y se vuelve
imposible de distinguir de la distribución normal para las muestras de 30 o más observaciones.
Aunque la prueba Z se usa generalmente para pruebas grandes, casi todo el software
estadístico utiliza la prueba t para cualquier tamaño de muestra.
1) Especificar las hipótesis nula y alternativa.
2) Especificar el nivel de error de muestreo (α) permitido.
3) Determinar la desviación estándar (S) de la muestra.

4) Calcular el error estándar estimado de la media (Sx), utilizando la fórmula:

5) Calcular la estadística de la prueba t:

6) Expresar le resultado. La hipótesis nula se puede rechazar porque el valor
calculado de t es menor que el valor crítico t.

Capítulo 16 – Pruebas estadísticas de diferencias y relaciones

Hipótesis acerca de dos medias
Con frecuencia, a los especialistas en marketing les interesa probar las diferencias entre
grupos. La comprobación de esta hipótesis comprende de los pasos siguientes:
1) Especificar las hipótesis nula y alternativa.
2) Especificar el nivel de error de muestreo (α) permitido.
3) Calcular el error estándar estimado de las diferencias entre las dos medias,
como sigue:

4) Calcular la estadística de prueba Z, como sigue:

5) Expresar le resultado. El Valor calculado de Z es mayor que el valor critico de
modo que se rechaza la hipótesis nula.

Hipótesis acerca de las proporciones
En muchas situaciones los investigadores se preocupan por fenómenos expresados en
términos de porcentajes. Por ejemplo, quizá a los especialistas en marketing les interesa
probar la proporción de entrevistados que prefieren la marca A frente a aquellos que prefieren
la marca B.

-Proporción en una muestra: Prueba para determinar si la diferencia entre las proporciones es
mayor que la esperada debido al error de muestreo. El procedimiento para la prueba de la
hipótesis de las proporciones es el siguiente:
1) Especificar las hipótesis nula y alternativa.
2) Especificar el nivel de error de muestreo (α) permitido.
3) Calcular el error estándar estimado, utilizando el valor de P especificado en
la hipótesis nula:

4) Calcular la estadística de prueba, como sigue:

Se rechaza la hipótesis nula porque el valor Z calculado es mayor que el valor Z
crítico.
-Dos Proporciones en muestras independientes: En muchos casos la gerencia se interesa por la
diferencia entre las proporciones de personas en dos grupos diferentes que participan en
cierta actividad o tienen cierta característica. Las especificaciones requeridas y el
procedimiento para probar esta hipótesis son lossiguientes:
1) Especificar las hipótesis nula y alternativa.
2) Especificar el nivel de error de muestreo (α) permitido.
Capítulo 16 – Pruebas estadísticas de diferencias y relaciones

3) Calcular el error estándar estimado de las diferencias entre las dos
proporciones, como sigue:

4) Calcular la estadística de prueba:

5) Expresar el resultado. Se rechaza la hipótesis nula porque el valor Z
calculado es mayor que el valor Z crítico.

Análisis de varianza (ANOVA)
Cuando la meta es probar las diferencias entre las medias de dos muestras independientes o
más, el análisis de varianza es una herramienta estadística apropiada. Aunque se puede usar
para probar las diferencias entre dos medias, el ANOVA se utiliza con mayor frecuencia para
probar hipótesis acerca de las diferencias entre las medias de varios grupos independientes (C)
(donde C≥3). Es una técnica estadística que permite al investigador determinar si la
variabilidad entre y en todas las medias de la muestra C es mayor que la esperada debido al
error de muestreo.
1) Especificar las hipótesis nula y alternativa.
2)

3) Calcular la variación entre las medias del grupo medidas por la suma media
de cuadrados entre los grupos (MSA). Se calcula como sigue:
𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝐷𝐷𝐷𝐷 𝐶𝐶𝑆𝑆𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐸𝐸𝐸𝐸𝐶𝐶𝐷𝐷 𝐺𝐺𝑆𝑆𝐶𝐶𝐺𝐺𝐶𝐶𝑆𝑆 (𝑆𝑆𝑆𝑆𝑆𝑆)
𝐺𝐺𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐷𝐷 𝐿𝐿𝐿𝐿𝐿𝐿𝐷𝐷𝐶𝐶𝐸𝐸𝑆𝑆𝐷𝐷 (𝑔𝑔𝑔𝑔)

4) Sumar las diferencias cuadradas entre cada observación (Xij) y su media de
muestra asociada (Xj), acumuladas en todos los niveles C (grupos). También conocida como la
suma de los cuadrados entre grupos o en la variación de los grupos, por lo general se llama
suma de cuadrado del error (SSE). El SSE se calcula como sigue:

5) Calcular la variación en los grupos de la muestra según se mide por la suma media
de los cuadrados entre los grupos. Conocido como error cuadrado de la media (MSE),
representa una estimación del error aleatorio en los datos. El MSE se calcula como sigue:

Capítulo 16 – Pruebas estadísticas de diferencias y relaciones

𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝐷𝐷𝐷𝐷 𝐶𝐶𝑆𝑆𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐸𝐸𝐸𝐸𝐶𝐶𝐷𝐷 𝐺𝐺𝑆𝑆𝐶𝐶𝐺𝐺𝐶𝐶𝑆𝑆 (𝑆𝑆𝑆𝑆𝐷𝐷)
𝐺𝐺𝐶𝐶𝑆𝑆𝐷𝐷𝐶𝐶𝑆𝑆 𝐷𝐷𝐷𝐷 𝐿𝐿𝐿𝐿𝐿𝐿𝐷𝐷𝐶𝐶𝐸𝐸𝑆𝑆𝐷𝐷 (𝑔𝑔𝑔𝑔)

El número de grados de libertad es igual a la suma de los tamaños de las muestras para todos
los grupos menos el número de grupos (C):

Una distribución de muestreo conocida como la distribución F permite al investigador
determinar la probabilidad de que un valor calculado F haya ocurrido por causalidad y no como
resultado del efecto del tratamiento, la distribución F, al igual que la distribución t, es en
realidad un conjunto de distribuciones cuya forma cambia ligeramente dependiendo del
número y el tamaño de las muestras involucradas. Para usar la prueba F, es necesario calcular
los grados de libertad para el numerador y el denominador.
6) Calcular la estadística F, como sigue:
𝑓𝑓 =
𝑀𝑀𝑀𝑀𝑀𝑀
𝑀𝑀𝑀𝑀𝑀𝑀

7) Expresar los resultados.

Valores p y pruebas de significancia

Este enfoque no da la probabilidad exacta de obtener una estadística de prueba calculada que
se deba en gran medida a la causalidad. Los cálculos para estimar esta probabilidad, que por lo
regular se conoce como valor p, son tediosos de realizar a mano. El valor p es la probabilidad
exacta de obtener una estadística de prueba calculada que se deba a la causalidad. Mientras
más bajo sea el valor p, menor será la probabilidad de que el resultado observado ocurra
debido a la causalidad.