Capitulo 14

•

SIN SIGLA

Esteban Darío Linares

19/6/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Investigación de Mercado / Investigación Operacional

1054 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Capítulo 14 – Tamaño de la muestra
Determinación del tamaño de las muestras probabilísticas
El proceso para determinar el tamaño de las muestras probabilísticas incluye aspectos financieros, estadísticos y administrativos. Por regla general, mientras más grande es la muestra, menor es el error de muestreo. Sin embargo, las muestras más grandes cuestan más dinero y los recursos disponibles para un proyecto siempre son limitados.
-Presupuesto Disponible: El tamaño de la muestra para un proyecto a menudo es determinado por el presupuesto disponible. Un gerente de marca puede tener $50000 disponibles en el presupuesto para probar un nuevo producto. Después de deducir otros costos del proyecto (por ejemplo, diseño de investigación, desarrollo de cuestionarios, procesamiento de datos), la cantidad restante determina el tamaño de la muestra que es posible entrevistar. Desde luego, si el dinero disponible no produce un tamaño adecuado de la muestra, la gerencia debe tomar una decisión: es necesario encontrar fondos adicionales o el proyecto deberá cancelarse.
Este enfoque del “presupuesto disponible” obliga al investigador a explorar enfoques alternos para la recolección de datos y a considerar con detenimiento el valor de la información en relación con su costo.
-Regla general: Si el investigador determina que el tamaño de la muestra solicitado no es adecuado para respaldar los objetivos de la investigación propuesta, tiene la responsabilidad profesional de presentar argumentos para un tamaño de muestra más grande para el cliente y dejar que éste tome la decisión final.
-Número de subgrupos analizados: En cualquier problema de determinación del tamaño de la muestra es preciso considerar el número y el tamaño anticipado de los diversos subgrupos de la muestra total que es necesario analizar y sobre los que hay que llevar a cabo inferencias estadísticas. Por ejemplo, un investigador puede decidir que una muestra de 400 es en general muy adecuada. Sin embargo, si es necesario analizar por separado a los hombres y mujeres entrevistados y se espera que la muestra sea 50% hombres y 50% mujeres, el tamaño esperado de la muestra para cada subgrupo es de sólo 200.
-Métodos estadísticos tradicionales: Se requieren tres piezas de información para realizar los cálculos necesarios para el resultado de una muestra:
-Un estimado de la desviación estándar de la población
-El nivel aceptable de error de muestreo
-El nivel deseado de confianza de que el resultado de la muestra quede dentro de cierto rango (resultado + o – error de muestreo) de los valores reales de la población.
Con estas tres piezas de información, el investigador puede calcular el tamaño de la muestra aleatoria simple.
Distribución normal
-Distribución Normal: Es una distribución continua que tiene forma de campana y es asimétrica en relación con la media; la media, la mediana y la moda son iguales. La distribución normal es crucial para la inferencia estadística clásica. Hay varias razones por las que es importante. La primera es que muchas de las variables que enfrentan los mercadólogos tienen distribuciones de probabilidad cercanas a la distribución normal. Algunos ejemplos incluyen el número de latas, botellas o vasos de bebida consumidos por los usuarios de este tipo de bebidas. En segundo lugar, la distribución normal es útil por varias razones teóricas; una de la más importantes de éstas se relaciona con el teorema del límite central (idea de que una distribución de un número mayor de medias o proporciones de la muestra se aproximará a una distribución normal, sin importar la distribución de la población de la que fueron tomadas). Una distribución normal tiene varias características importantes:
1) La distribución normal tiene forma de campana y sólo una moda. La moda es una medida de la tendencia central y es el valor particular que ocurre con mayor frecuencia.
2) Una distribución normal en particular se define de manera única por su media y desviación estándar.
3) El área de una región debajo de la curva de la distribución normal entre dos valores de una variable es igual a la probabilidad de observar un valor en ese rango cuando una observación se secciona al azar de la distribución.
4) El área entre la media y un número determinado de desviaciones estándar de la media es igual para todas las distribuciones normales.
-Distribución normal estándar: Tiene las mismas características que cualquier distribución normal. Sin embargo, la mediana de la distribución normal estándar siempre es igual a cero, y la desviación estándar siempre es igual a uno. La fórmula es:
Población y distribuciones de muestras
Una distribución de la población es una distribución de la frecuencia de todos los elementos de la población. Tiene una media, casi siempre representada por la letra griega µ, y una desviación estándar, representada por lo general con una letra griega.
Una distribución de muestra es una distribución de la frecuencia de todos los elementos de una muestra individual (sencilla). Es una distribución de muestra, la media está representada casi siempre por X y la desviación estándar por S.
Distribución de muestreo de la media
Entender esta distribución es crucial como base para calcular el error de muestreo para muestras aleatorias simples. La distribución de muestreo de la media es una distribución de probabilidad conceptual y teórica de las medias de todas las muestras posibles de un tamaño determinado tomadas de una población especifica. Aunque esta distribución rara vez se calcula, sus propiedades conocidas tienen gran importancia práctica. En realidad, obtener una distribución de las medias de la muestra comprende tomar gran cantidad de muestras aleatorias simples (por ejemplo, 25000) de cierto tamaño de una población en particular. Luego, se calcula las medias para las muestras y se ordenan en una distribución de la frecuencia. Como cada muestra está compuesta por un subconjunto diferente de elementos de la muestra, no todas las medias de la muestra serán exactamente iguales. Si las muestras son suficientemente grandes y aleatorias, la distribución resultante de las medias de la muestra se aproximará a una distribución normal. Esta afirmación se basa en el teorema del límite central, que establece que conforme aumenta el tamaño de la muestra, la distribución de las medias de gran cantidad de muestras aleatorias tomadas prácticamente de cualquier población se acerca a una distribución normal con una media igual a µ y una desviación estándar SX, donde n = tamaño de la muestra y
El error estándar de la media (Sx) se calcula de esta manera debido a que la varianza, o dispersión, dentro de una distribución particular de las medias de la muestra será menor si se basa en muestras más grandes.
-Conceptos Básicos:
La distribución de muestreo de la media para las medias aleatorias simples grandes (30 observaciones o más) tiene las características siguientes:
-La distribución es una distribución normal.
-La distribución tiene una media igual a la media de la población.
-La distribución tiene una desviación estándar (el error estándar de la media) igual a la desviación estándar de la población dividida entre la raíz cuadrada del tamaño de la muestra:
Hay que tener en mente que estos cálculos solo aplican a una muestra aleatoria simple. Otros tipos de muestras de probabilidad (por ejemplo, muestras estratificadas y de conglomerados) requieren de fórmulas más complejas para calcular el error estándar.
Estimación
Proceso que consiste en usar la información disponible en la muestra para arribar a un valor (o rango de valores) que, en algún sentido, se acerquen lo más posible al valor poblacional que ser quiere estimar. Los resultados de una muestra se pueden usar para generar dos tipos de estimados de la media de una población: estimados de punto y de intervalo.
-Estimador: es un estadístico cuya forma funcional no involucra ningún parámetro y que se construye con la intención de atribuir un valor que pudiera representar un parámetro de interés desconocidode la población.
-Estimación puntual: Es el valor asumido por un estimador cuando se evalúan los valores obtenidos de una muestra particular.
-Estimación de intervalo: es un intervalo o rango de valores en particular en el que se estima que cae el valor real de la población. Además de establecer el tamaño del intervalo, el investigador establece, por lo regular, la probabilidad de que el intervalo incluya el valor real de la media de la población. Esta probabilidad se conoce como nivel de confianza, coeficiente de confianza, y el intervalo se llama intervalo de confianza.
Distribución de la muestra de la proporción
Los investigadores de mercados están interesados, con frecuencia, en calcular las proporciones o porcentajes en lugar o además de estimar las medias. Algunos ejemplos comunes incluyen estimar lo siguiente:
-El porcentaje de la población que está consciente de un anuncio en particular
-El porcentaje de la población que tiene acceso a internet una o más veces en una semana
-El porcentaje de la población que ha visitado un restaurante de comida rápida
-El porcentaje de la población que ve un programa de televisión en particular.
En situaciones en las que una proporción o un porcentaje de la población es de interés, se utiliza la distribución de muestreo de la proporción.
La distribución de muestreo de la proporción es una distribución de la frecuencia relativa de las proporciones de un número alto de muestras aleatorias de un tamaño determinado tomadas de una población en particular. La distribución de muestreo de una proporción tiene las siguientes características:
-Se aproxima a una distribución normal.
-La proporción de la media para todas las muestras posibles es igual a la proporción de la población.
-El error estándar de una distribución de muestreo de la proporción se puede calcular con la siguiente formula:
Determinación del tamaño de la muestra
La selección del tamaño muestral es un proceso donde se debe tener en cuenta tanto los requerimientos de precisión sobre las estimaciones como las capacidades y restricciones operativas.
-Problemas que comprenden las medias: Considere calcular cuántas veces el usuario promedio de restaurantes de comida rápida visita uno de estos lugares en un mes promedio. La gerencia necesita un cálculo de numero promedio de visitas para tomar una decisión relacionada con una nueva campaña promocional que está desarrollando. Para realizar este cálculo, el gerente de investigación de mercados de la organización tiene la intención de entrevistar una muestra aleatoria simple de todos los usuarios de restaurantes de comida rápida. La fórmula para calcular el tamaño de la muestra requerido para los problemas que comprende el cálculo de la media es la siguiente:
Se necesita tres piezas de información para calcular el tamaño de la muestra requerido:
1) El nivel aceptable o permitido de error de muestreo E.
2) El nivel de confianza Z aceptable.
3) Un estimado de la desviación estándar de la población σ.
El nivel de confianza Z y el error de muestreo permisible por el investigador E para este cálculo deben ser determinados por el investigador después de consultar con su cliente. El nivel de confianza y la cantidad de error se basan no sólo en criterios estadísticos, sino también en criterios financieros y administrativos.
Hacer un cálculo de la desviación estándar de la población presenta un problema más serio. Si se conociera la desviación estándar de la población, también se conociera la media de la población (la media de la población es necesaria para calcular la desviación estándar de la población), y no habría necesidad de tomar una muestra. Uno de los siguientes métodos o una combinación de los cuatro podría utilizarse para solucionar este problema:
1) Usar los resultados de la encuesta anterior. En muchos casos, la empresa puede haber realizado una encuesta anterior que trataba sobre el mismo tema o uno similar.
2) Realizar una encuesta o estudio piloto. Si se trata de un proyecto a gran escala, quizá sea posible dedicar tiempo y recursos a una encuesta de la población a menor escala. Los resultados de esta encuesta piloto se pueden usar para desarrollar una estimación de la desviación estándar de la población.
3) Usar datos secundarios.
4) Emplear el juicio. Si todo lo demás falla, es posible desarrollar una estimación de la desviación estándar de la población basada sólo en el juicio. Puede solicitar la opinión de distintos gerentes que estén en posición de realizar juicios educados sobre los parámetros de la población requeridos.
-Problemas que comprenden proporciones: Los cálculos son los siguientes:
El proceso de determinar el tamaño de la muestra necesario para calcular una proporción es más fácil que el proceso de determinar el tamaño de la muestra requerido para calcular una media: si no hay una base para estimar P, el investigador puede hacer la que en ocasiones se conoce como el supuesto más pesimista, o del peor de los casos, acerca del valor de P.
-Determinación del tamaño de la muestra para muestras estratificadas y de conglomerados: También hay fórmulas para determinar el tamaño de la muestra y el error de muestreo requeridos para otros tipos de muestras probabilísticas como las estratificadas y las de conglomerados. Las fórmulas especificas son mucho más complicadas. Además, estas fórmulas requieren de información que con frecuencia no está disponible o es difícil de obtener.
-Tamaños de la población y de la muestra: Ninguna de las fórmulas para determinar el tamaño de la muestra toma en cuenta el tamaño de la población de ninguna manera. Por lo regular no existe una relación directa entre el tamaño de la población y el tamaño de la muestra necesario para estimar un parámetro de la población en particular con un nivel de error especifico y un nivel de confianza particular. Una regla general es que es necesario realizar un ajuste en el tamaño de la muestra si éste es mayor de 5% del tamaño de la población total. El supuesto normal es que los elementos de la muestra se toman de manera independiente uno de otro (supuesto de independencia). Este supuesto está justificado cuando la muestra es pequeña en relación con la población. Sin embargo, no resulta apropiado cuando la muestra es una proporción de la población relativamente grande (5% o más). Como resultado de ello, el investigador debe ajustar los resultados obtenidos con las fórmulas estándar. Por ejemplo, la fórmula para el error estándar de la media, es la siguiente:
El factor (N-n)/(N-1) se conoce como el factor de corrección de la población finita (FPC).
-Factores a tener en cuenta: Hay dos factores a tener en cuenta, uno es la variabilidad de la población y el otro es el tamaño de la población.
-Pasos para el cálculo de la muestra:
-Determinación del número de elementos de muestra necesarios: Sin importar cómo se determina el tamaño de la muestra meta, el investigador enfrenta el problema práctico de calcular cuántos elementos de muestra (números telefónicos, domicilios, etc.) se requiere para realizar la tarea asignada. Por ejemplo, si el tamaño de la muestra meta es de 400, obviamente se necesitarán más de 400 números telefónicos para realizar una encuesta telefónica. Esta estimación debe calcularse de manera razonablemente precisa, porque el investigador quiere evitar tener que pagar por más números de los que son necesarios, pero por otro lado no quiere quedarse sin números durante la encuesta y tener que esperar más.
Poder Estadístico
Aunque en la investigación de mercados una práctica estándar consiste en usar las fórmulas, éstas se enfocan en el error tipo I, o el error de llegar a la conclusión de que hay una diferencia cuando en realidad no la hay. Y no manejan de forma explícita el error tipo II, o el error de establecer que no hay ninguna diferencia cuando en realidad si la hay. La probabilidad de no cometer el error tipo II se llama poder estadístico.
8