Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
VI. Fundamentos de muestreo El concepto de muestreo se basa en la probabilidad de que un conjunto de elementos escogidos de forma aleatoria de una población sean distribuidos de forma que representen dicha población en todas sus características. El muestreo es el procedimiento que se utiliza para los siguientes elementos: Determinar el tamaño de la muestra (n) Seleccionar los elementos de la población que constituyen la muestra Analizar los indicadores y medidas resultantes de los datos obtenidos a través de la muestra. El muestreo se utiliza como forma de reducir el consumo tiempo y de otros recursos, y obtener información más precisa sobre las características de los elementos de una población que constituyen la muestra. 7.1. Algunos conceptos importantes. Población. Es la totalidad de los elementos con características comunes para un determinado fin. Generalmente la población se representa por N. Población objetivo. Es el conjunto de unidades del que se desea realizar un análisis y tomar alguna decisión. Este conjunto debe ser definido de tal forma que manera segura, si una unidad específica pertenece o no a dicha población. El tamaño de la población. es la cantidad de elementos o unidades que constituye dicha población, se presenta por N. Elemento muestral. Entendemos cada uno de los orígenes de la información o sucesos que intentamos medir. Digamos que sería cada uno de los “elementos” de esa población. Unidad muestral. Es cada uno de los individuos o fuentes de la información que se pretende medir, es decir, cada uno de los posibles componentes de la muestra. Marco muestral. Es una enumeración exhaustiva de todas las unidades muestrales. La utilización del marco muestral tiene como finalidad la extracción de un conjunto de unidades. Se define como lista de todas las unidades que componen la población objetivo. Alcance de una muestra. Viene determinado por las limitaciones que establezca el propio investigador en la descripción del marco muestral. Es decir son los límites que pone el investigador. 7.2. Tamaño de la muestra (n) Una vez seleccionado el método de muestreo a utilizar se procederá al cálculo del tamaño de la muestra. Es la cantidad de elementos de la población necesarios para hacer un análisis estadístico que explique la situación de los elementos de la población de acuerdo a las características de interés. El tamaño de la muestra depende de: El porcentaje de fiabilidad o nivel de confianza deseado (ẞ) El error máximo permitido (e) ó (d). La varianza entre los elementos la población (σ2). El tamaño de la población (N). El detalle de los resultados de la muestra La disponibilidad de recursos (c). En caso que la variable utilizada para calcular el tamaño de la muestra se mida a través de una proporción, se usa las siguientes formulas. Si la población es infinita, es decir se desconoce la cantidad de elementos de la población. Ejemplo: Se requiere determinar el tamaño de la muestra, para estudiar las características demográficas de la población ocupada y desocupada en la provincia de Dajabón. Si la proporción que trabaja es de p=0.76. Si el usuario principal de los resultados de la investigación acepta error de muestreo es (e=d=6.4%) con un nivel de confianza ẞ=0.96, el cual equivale a Z=2.05. Usando la siguiente fórmula: Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántas del total tendremos que estudiar la respuesta seria. Donde: Z depende del nivel de confianza establecido (ẞ) 2,05 2 x 0.76 x (1-0.76) n = ---------------------------- = 187. 0.064 2 N es el tamaño de la población p = proporción de casos que cumplen con la condición objetivo de la variable de muestreo q = 1 – p es proporción de casos que no cumplen con la condición objetivo de la variable de muestreo e= d = es el error de muestreo establecido, la diferencia máxima aceptado entre una medida de muestra y su valor correspondiente en la población. Ejemplo: Se requiere determinar el tamaño de la muestra, para estudiar las características demográficas de la población ocupada y desocupada en la provincia de Dajabón. La población económicamente activa es N=23,586, la cual se obtuvo que la proporción que trabaja es de p=0.76. Si el usuario principal de los resultados de la investigación acepta error de muestreo es (e=d=6.4%) con un nivel de confianza ẞ=0.96, el cual equivale a Z=2.05. Aplicando la formula anterior: En caso que la variable utilizada para calcular el tamaño de la muestra se mida a través de un promedio, se usa la siguiente formula. Si la población es finita, es decir se conoce la cantidad de elementos de la población. Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula. Donde: n = el tamaño de la muestra. N = tamaño de la población. σ2 = La varianza entre los elementos la población (σ2). Z = depende del nivel de confianza establecido (ẞ) e= d = es el error de muestreo establecido, la diferencia máxima aceptado entre una medida de muestra y su valor correspondiente en la población. 23,586*2,05 2 *0.76*(1-0.76) n = ------------------------------------------------- = 185.68 = 186 personas 0.064 2 *(23,586-1)+2.05 2 *0.76*(1-0.76) Ejemplo: Usando como variable de muestreo el gasto diario de los hogares, que es una variable continua, calcule el tamaño de la muestra requerido para un estudio de mercado. Tamaño de población N Cantidad de hogares 256,000 Varianza σ2 = Varianza del gasto diario de los hogares estimado 2,400,473.19 Promedio µ= Gasto promedio diario de los hogares estimado 3,693.17 ꞵ=0.96 → Z= Nivel de confianza 2.05 Error =5% de µ→ e= Diferencia máxima permitida entre el promedio resultante de la muestra y el de la población µ. 184.66 Tamaño de la muestra Cantidad mínima de hogares a ser seleccionada para el análisis 256,000*2,400,473.19*2.052 n=―――――――――――――――― =296 ((256,000-1)*184.662 +2,400,473.19*2.052) Valores de Z para distintos niveles de confianza. Zα/2 ẞ α=1-ẞ Zα/2 ẞ α=1-ẞ 3.09 0.997 0.003 1.60 0.890 0.110 2.33 0.980 0.020 1.56 0.880 0.120 2.17 0.970 0.030 1.51 0.870 0.130 2.05 0.960 0.040 1.48 0.860 0.140 1.96 0.950 0.050 1.44 0.850 0.150 1.88 0.940 0.060 1.41 0.840 0.160 1.81 0.930 0.070 1.37 0.830 0.170 1.75 0.920 0.080 1.35 0.820 0.180 1.70 0.910 0.090 0.88 0.810 0.190 1.65 0.900 0.100 El error de muestreo o error muestral se calcula en base a la siguiente fórmula Cantidad de muestras posibles tamaño “n”. Al calcular el tamaño de la muestra podemos determinar la cantidad de muestras de ese mismo tamaño que podrían extraerse de la Población N. Esa cantidad se calcula a través de la siguiente expresión: Haciendo el mismo calculo dentro de cada estrato, sería: Por Ejemplo: de una población de tamaño (N=10 elementos) se pueden obtener 210 combinaciones o muestras tamaño (n=4). M= C N n= N! / ( n! x (N=n)!) M= C10,4 = 10!/( 4! x (10 - 4)! )=210. Fracción de muestreo. Es la proporción de población que forma parte de la muestra. Es justo la relación inversa.f =n / N Distribución de la muestra. hace referencia a las distintas muestras del mismo tamaño extraídas de una misma población y la frecuencia con que los estimadores muestrales toman el mismo valor. Factor de Expansión. Es la cantidad de elementos de la población que representa cada elemento de la muestra. W=N / n. Encuesta por muestreo. Es la técnica de investigación a través de la cual se toman datos sobre ciertas característicasde cada uno de los elementos de la población que forman la muestra. Las ventajas de las encuestas por muestreo son: Reducción del tiempo Reducción de los costos y el uso de otros recursos Control del proceso Mayor calidad de los datos colectados 7.3. Tipos de muestreos. Tenemos dos tipos de muestreos, los probabilísticos y los no probabilísticos. Los muestreos probabilísticos se basan en que cada elemento del universo o población tiene una probabilidad conocida de formar parte de la muestra. Existen diversas modalidades. 7.3.1. Muestreos probabilísticos Muestreo aleatorio simple. Debemos conocer el tamaño de la muestra objeto de estudio y además disponer de una lista completa de los individuos que forman parte de la población o universo (he aquí la dificultad). Se elegirá a los individuos mediante un procedimiento estadístico o bien identificando las posibles muestras y se escogerá una de ellas mediante un procedimiento estadístico. Muestreo aleatorio sistemático (o con arranque sistemático).Se necesita también una lista de la población (N) y el tamaño de la muestra (n) y se calcula el coeficiente de elevación (k=N/n). Se selecciona aleatoriamente un miembro de la muestra y se obtienen los demás seleccionando al individuo que se encuentra N/n posiciones después del primero, repitiendo la operación hasta completar la muestra. El primero elemento se toma de forma aleatoria entre 1 y k, el cual estará ubicado en la posición i del listado, donde(1 ≤ i ≤ k). Elemento Posición 1 1 ≤ i ≤ k 2 i+k 3 i+2k … … i=n i+(i-1)k Muestreo estratificado. Se usa cuando se conoce la existencia de diversos grupos en la población que sean representativos, y se quiere mantener una proporción en la muestra. El criterio a seguir en la formación de los estratos será formarlos de tal manera que haya la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato y la máxima heterogeneidad entre los estratos Cuando de utiliza este tipo de muestreo, es necesario incluir el concepto de factor de expansión (Wh). Este representa la cantidad de elementos del estrato “h” que representa cada elemento de dicho estrato (nh). Wh = Nh / nh Fracción de muestreo (fh) por estrato. Es la proporción de la cantidad de elementos del estrato “h” que representa cada elemento de dicho estrato (nh). fh = nh / Nh La cantidad de muestra posibles tamaño nh en cada estrado Nh sería. Distribución de la muestra general entre los distintos estratos Una vez calculado el tamaño de la muestra, se procede a su distribución entre los diferentes grupos o estratos identificados; el proceso se llama afijación. Veamos tres tipos de afijación. Afijación simple. Reparto a partes iguales de la muestra entre el número de estratos conocidos, donde nh= n /L, siendo el número de estratos. / Afijación proporcional. Reparto de la muestra entre los estratos de forma proporcional al tamaño de los mismos. donde El número de elementos muestrales de cada estrato es directamente proporcional al tamaño del estrato dentro de la población. nh=Nh / N x n ! ! ! h h N h n h h h N C n N n En el caso específico de la afijación proporcional se dice que la muestra es autoponderada, porque cada submuestra representa en la muestra general la misma proporción que la que representa su correspondiente estrato en la población. Afijación óptima. Si se conoce la variabilidad de la característica o variable de muestreo en cada estrato la muestra se distribuye entre los estratos de la siguiente manera: El tamaño de la muestra de cada estrato viene dado por: En este caso se elige nh de forma que minimicen la varianza. El costo viene dado por ch, el cual representa el costo promedio por unidad en el estrato h. Muestreo por conglomerados. Consiste en la selección aleatoria de los grupos o conglomerados de unidades muestrales. Luego dentro los conglomerados seleccionados se dividen e grupos de unidades a una menor escala, y después se seleccionan otros subgrupos más pequeños, hasta llegar a la sección de las unidades mínimas, de las cuales se escogen los elementos a que se les aplican las entrevistas o se toman los datos requeridos para el análisis. El siguiente esquema muestra este proceso de manera gráfica. La población (N) está dividida en 16 conglomerados identificados de la A a la P y cada uno subdividido en 4 segmentos (círculos), y los círculos están compuestos por los puntos que representan los individuos que pueden ser hogares, personas u otros elementos simples de análisis. Por Ejemplo: Primea se seleccionaron aleatoriamente las áreas o conglomerados C, F, H, J, K, N y P. Luego dentro de los conglomerados seleccionados se tomaron los subgrupos que aparecen en los círculos: C →2 y 4 K →1 y 2 F →2 y 3 N →2 y 4 H →1 y 4 P→3 y 4 J→3 y 4 Y finalmente dentro de cada círculo se seleccionaron aleatoriamente los individuos, que aparecen representados por los puntos. Por lo estos puntos se seleccionan usando un muestreo sistemático o aleatorio simple dentro de cada circulo. Otro Ejemplo: El país está dividido por regiones, las regiones en provincias y las provincias en municipios, los municipios en urbano y rural, la zona urbana en barrios y la rural en secciones y parajes. Tanto los barrios como los parajes se dividen en UPM’s. En este cado la aplicación del muestro por conglomerados consiste en primero, seleccionar en cada región las provincias que la representan para hacer el estudio. Luego dentro de las provincias seleccionadas se escogen aleatoriamente o por un criterio de importancia, los municipios a incluir en dicho estudio, en esos municipios escogidos se toman los barrios de la zona urbana y en la rural las secciones y parajes, y por último de manera al azar se seleccionan los UPM’s que en mayoría de los casos son los segmentos censales que ha establecidos la Oficina Nacional de Estadística. En este procedimiento se debe establecer y asegurar la participación de todas las áreas geográficas hasta donde se requiere la representatividad de la muestra general. 7.3.2. Características de los tipos de muestreos probabilísticos Tipo de muestreo Características Ventajas Inconvenientes Aleatorio simple Se selecciona una muestra de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de inclusión n/N. Sencillo y de fácil comprensión. Es uno de los más precisos, en términos de los errores de muestreo Requiere de un listado de todos los elementos de la población. Sistemático Un listado de los N elementos de la población Determinar la muestra n. Calcula k = N/n. Elegir un número aleatorio “i”, entre 1 y k. Seleccionar los elementos de la lista usando la formula i+(i-1)k. Fácil de aplicar. Asegura una cobertura de los elementos de cada uno de los “n” subgrupos. Requiere de un listado de todos los elementos de la población. Los resultados pueden ser afectados por algún ordenamiento de los elementos en el listado. Estratificado Dividir la población en estratos Se requiere conocer la composición de la población. La muestra de distribuye entre los distintos estratos definidos. Los estratos deben ser internamente homogéneos, y externamente heterogéneos. Asegura que la muestra represente a la población en cada uno de los grupos. Se ha de conocer la distribución en la población por las variables utilizadas para la estratificación. Conglomerados Se realizan varias etapas de muestreo sucesivas La necesidad de listados de las unidades de las etapas principales. Se requiere del auxilio de otros tipos de muestreo para seleccionar los elementos requeridosen cada etapa. Es muy eficiente cuando la población es muy grande y dispersa. No es preciso tener un listado de toda la población, sólo para las principales etapas. El costo por unidad muestral es menor que en otros tipos de muestreo. El error estándar es mayor que en el muestreo aleatorio simple o estratificado. El cálculo del error estándar es complejo. 7.3.3. Fórmulas estadísticas de mayor uso en los muestreos probabilísticos. 7.3.4. Muestreo no probabilísticos Los métodos de muestreo no probabilísticos no garantizan la representatividad de la muestra, por lo tanto no permiten realizar inferencias sobre la población. Es aquel utilizado en forma empírica, es decir, no se efectúa bajo normas probabilística de selección, por lo que sus procesos intervienen opiniones y criterios personales del investigador o muestrista o no existe norma bien definida o validada. Normalmente se acude a este tipo de muestreo cuando es difícil enumerar, listar o precisar el universo objeto de estudio o cuando no existen registros de los datos. Los métodos de muestreo no probabilísticos no garantizan la representatividad de la muestra y por lo tanto no permiten realizar inferencias sobre una medida en la población completa. Son procedimientos de selección de los elementos donde se desconoce la probabilidad que tienen los elementos de la población para integrar la muestra, o por conveniencia y las características del análisis, se requiere la participación de elementos específicos en la muestra. Muestreo causal o accidental. Es un procedimiento que permite elegir arbitrariamente los elementos sin un juicio o criterio preestablecido. Por Ejemplo: la gente que circula por determinada calle a una hora especifica del día, los visitantes que acuden a un museo en un determinado lapso, etc. Muestreo intencional. En este caso los elementos son escogidos con base en criterios o juicios preestablecidos por el investigador. Ejemplo: Para un estudio sobre calidad de la educación, previamente, se establecen como criterios de selección de la muestra poseer mínimo de 20 años de experiencia en el campo educativo los siguientes: Haber ocupado un cargo directivo Muestreo por cuotas. Consiste en dividir a la población bajo estudio en subgrupos o cuotas según ciertas características: edad, sexo, estado civil, etc. Por Ejemplo: 30 hombres y 50 mujeres, 45 hombres mayores de 25 años; 40 mujeres divorciadas desde hace más de 5años, etc. Se trata de fijar un conjunto de condiciones que deben cumplir los individuos para entrar a formar parte de la muestra. Muestreo bola de nieve. Particularmente útil cuando se muestrean poblaciones cuyos componentes, por motivos morales, ideológicos, legales o políticos tienen a ocultar su identidad. A partir de unos pocos individuos el entrevistador, con ayuda de los primeros va “conociendo” a nuevos miembros de la muestra. Muestreo de juicios. En este muestreo accedemos a expertos en la materia para que nos ayuden en la determinación de una muestra representativa. Muestreo no probabilísticos Las unidades no tienen igual probabilidad de participar en la muestra. No se puede calcular el error muestral Alto riesgo de invalidar
Compartir