Logo Studenta

Teoría del Muestreo

¡Este material tiene más páginas!

Vista previa del material en texto

VI. Fundamentos de muestreo 
 
El concepto de muestreo se basa en la probabilidad de que un conjunto de elementos 
escogidos de forma aleatoria de una población sean distribuidos de forma que representen 
dicha población en todas sus características. 
 
El muestreo es el procedimiento que se utiliza para los siguientes elementos: 
 
 Determinar el tamaño de la muestra (n) 
 Seleccionar los elementos de la población que constituyen la muestra 
 Analizar los indicadores y medidas resultantes de los datos obtenidos a través de la muestra. 
 
El muestreo se utiliza como forma de reducir el consumo tiempo y de otros recursos, y 
obtener información más precisa sobre las características de los elementos de una población 
que constituyen la muestra. 
 
7.1. Algunos conceptos importantes. 
 
 Población. Es la totalidad de los elementos con características comunes para un 
determinado fin. Generalmente la población se representa por N. 
 
 Población objetivo. Es el conjunto de unidades del que se desea realizar un análisis y tomar 
alguna decisión. Este conjunto debe ser definido de tal forma que manera segura, si una 
unidad específica pertenece o no a dicha población. 
 
 El tamaño de la población. es la cantidad de elementos o unidades que constituye dicha 
población, se presenta por N. 
 
 Elemento muestral. Entendemos cada uno de los orígenes de la información o sucesos que 
intentamos medir. Digamos que sería cada uno de los “elementos” de esa población. 
 
 Unidad muestral. Es cada uno de los individuos o fuentes de la información que se 
pretende medir, es decir, cada uno de los posibles componentes de la muestra. 
 
 Marco muestral. Es una enumeración exhaustiva de todas las unidades muestrales. La 
utilización del marco muestral tiene como finalidad la extracción de un conjunto de 
unidades. Se define como lista de todas las unidades que componen la población objetivo. 
 
 Alcance de una muestra. Viene determinado por las limitaciones que establezca el propio 
investigador en la descripción del marco muestral. Es decir son los límites que pone el 
investigador. 
 
7.2. Tamaño de la muestra (n) 
 
Una vez seleccionado el método de muestreo a utilizar se procederá al cálculo del tamaño 
de la muestra. Es la cantidad de elementos de la población necesarios para hacer un análisis 
estadístico que explique la situación de los elementos de la población de acuerdo a las 
características de interés. 
 
El tamaño de la muestra depende de: 
 
 El porcentaje de fiabilidad o nivel de confianza deseado (ẞ) 
 El error máximo permitido (e) ó (d). 
 La varianza entre los elementos la población (σ2). 
 El tamaño de la población (N). 
 El detalle de los resultados de la muestra 
 La disponibilidad de recursos (c). 
 
En caso que la variable utilizada para calcular el tamaño de la muestra se mida a través de 
una proporción, se usa las siguientes formulas. 
 
Si la población es infinita, es decir se desconoce la cantidad de elementos de la población. 
 
 
 
Ejemplo: 
 
Se requiere determinar el tamaño de la muestra, para estudiar las características demográficas 
de la población ocupada y desocupada en la provincia de Dajabón. 
 
Si la proporción que trabaja es de p=0.76. Si el usuario principal de los resultados de la 
investigación acepta error de muestreo es (e=d=6.4%) con un nivel de confianza ẞ=0.96, el 
cual equivale a Z=2.05. 
 
Usando la siguiente fórmula: 
 
 
 
 
Si la población es finita, es decir conocemos el total de la población y deseásemos saber 
cuántas del total tendremos que estudiar la respuesta seria. 
 
 
Donde: 
 
 Z depende del nivel de confianza establecido (ẞ) 
 2,05
2 
x 0.76 x (1-0.76) 
n = ---------------------------- = 187. 
 0.064
2
 
 N es el tamaño de la población 
 p = proporción de casos que cumplen con la condición objetivo de la variable de 
muestreo 
 q = 1 – p es proporción de casos que no cumplen con la condición objetivo de la 
variable de muestreo 
 e= d = es el error de muestreo establecido, la diferencia máxima aceptado entre una 
medida de muestra y su valor correspondiente en la población. 
 
Ejemplo: 
 
Se requiere determinar el tamaño de la muestra, para estudiar las características 
demográficas de la población ocupada y desocupada en la provincia de Dajabón. 
 
La población económicamente activa es N=23,586, la cual se obtuvo que la proporción 
que trabaja es de p=0.76. Si el usuario principal de los resultados de la investigación 
acepta error de muestreo es (e=d=6.4%) con un nivel de confianza ẞ=0.96, el cual 
equivale a Z=2.05. 
 
Aplicando la formula anterior: 
 
 
 
En caso que la variable utilizada para calcular el tamaño de la muestra se mida a través 
de un promedio, se usa la siguiente formula. 
 
Si la población es finita, es decir se conoce la cantidad de elementos de la población. 
 
Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula. 
 
 
 
Donde: 
 
 n = el tamaño de la muestra. 
 N = tamaño de la población. 
 σ2 = La varianza entre los elementos la población (σ2). 
 Z = depende del nivel de confianza establecido (ẞ) 
 e= d = es el error de muestreo establecido, la diferencia máxima aceptado entre una 
medida de muestra y su valor correspondiente en la población. 
 
 
 23,586*2,05
2
*0.76*(1-0.76) 
n = ------------------------------------------------- = 185.68 = 186 personas 
 0.064
2
*(23,586-1)+2.05
2
*0.76*(1-0.76) 
Ejemplo: Usando como variable de muestreo el gasto diario de los hogares, que es una 
variable continua, calcule el tamaño de la muestra requerido para un estudio de mercado. 
Tamaño de población N Cantidad de hogares 256,000 
Varianza σ2 = 
Varianza del gasto diario de 
los hogares estimado 2,400,473.19 
Promedio µ= 
Gasto promedio diario de los 
hogares estimado 
3,693.17 
ꞵ=0.96 → Z= Nivel de confianza 2.05 
Error =5% de µ→ e= 
Diferencia máxima permitida 
entre el promedio resultante 
de la muestra y el de la 
población µ. 
184.66 
Tamaño de la muestra 
 
Cantidad mínima de hogares 
a ser seleccionada para el 
análisis 
 
256,000*2,400,473.19*2.052 
n=―――――――――――――――― =296 
 ((256,000-1)*184.662 +2,400,473.19*2.052) 
 
Valores de Z para distintos niveles de confianza. 
 
Zα/2 ẞ α=1-ẞ Zα/2 ẞ α=1-ẞ 
3.09 0.997 0.003 1.60 0.890 0.110 
2.33 0.980 0.020 1.56 0.880 0.120 
2.17 0.970 0.030 1.51 0.870 0.130 
2.05 0.960 0.040 1.48 0.860 0.140 
1.96 0.950 0.050 1.44 0.850 0.150 
1.88 0.940 0.060 1.41 0.840 0.160 
1.81 0.930 0.070 1.37 0.830 0.170 
1.75 0.920 0.080 1.35 0.820 0.180 
1.70 0.910 0.090 0.88 0.810 0.190 
1.65 0.900 0.100 
 
El error de muestreo o error muestral se calcula en base a la siguiente fórmula 
 
 
 
 Cantidad de muestras posibles tamaño “n”. Al calcular el tamaño de la muestra podemos 
determinar la cantidad de muestras de ese mismo tamaño que podrían extraerse de la 
Población N. Esa cantidad se calcula a través de la siguiente expresión: 
 
Haciendo el mismo calculo dentro de cada estrato, sería: 
 
 
 
Por Ejemplo: de una población de tamaño (N=10 elementos) se pueden obtener 210 
combinaciones o muestras tamaño (n=4). 
 
M= C
N
n= N! / ( n! x (N=n)!) 
M= C10,4 = 10!/( 4! x (10 - 4)! )=210. 
 
 Fracción de muestreo. Es la proporción de población que forma parte de la muestra. Es 
justo la relación inversa.f =n / N 
 
 Distribución de la muestra. hace referencia a las distintas muestras del mismo tamaño 
extraídas de una misma población y la frecuencia con que los estimadores muestrales toman 
el mismo valor. 
 
 Factor de Expansión. Es la cantidad de elementos de la población que representa cada 
elemento de la muestra. W=N / n. 
 
 Encuesta por muestreo. Es la técnica de investigación a través de la cual se toman datos 
sobre ciertas característicasde cada uno de los elementos de la población que forman 
la muestra. 
 
 Las ventajas de las encuestas por muestreo son: 
 Reducción del tiempo 
 Reducción de los costos y el uso de otros recursos 
 Control del proceso 
 Mayor calidad de los datos colectados 
 
7.3. Tipos de muestreos. 
 
Tenemos dos tipos de muestreos, los probabilísticos y los no probabilísticos. Los muestreos 
probabilísticos se basan en que cada elemento del universo o población tiene una 
probabilidad conocida de formar parte de la muestra. Existen diversas modalidades. 
 
7.3.1. Muestreos probabilísticos 
 
 Muestreo aleatorio simple. Debemos conocer el tamaño de la muestra objeto de 
estudio y además disponer de una lista completa de los individuos que forman parte de 
la población o universo (he aquí la dificultad). Se elegirá a los individuos mediante un 
procedimiento estadístico o bien identificando las posibles muestras y se escogerá una 
de ellas mediante un procedimiento estadístico. 
 
 Muestreo aleatorio sistemático (o con arranque sistemático).Se necesita también 
una lista de la población (N) y el tamaño de la muestra (n) y se calcula el coeficiente 
de elevación (k=N/n). Se selecciona aleatoriamente un miembro de la muestra y se 
obtienen los demás seleccionando al individuo que se encuentra N/n posiciones 
después del primero, repitiendo la operación hasta completar la muestra. 
 
 El primero elemento se toma de forma aleatoria entre 1 y k, el cual estará ubicado en la 
posición i del listado, donde(1 ≤ i ≤ k). 
 
 
 
 
 
Elemento Posición 
1 1 ≤ i ≤ k 
2 i+k 
3 i+2k 
… … 
i=n i+(i-1)k 
 
 Muestreo estratificado. Se usa cuando se conoce la existencia de diversos grupos en 
la población que sean representativos, y se quiere mantener una proporción en la 
muestra. 
El criterio a seguir en la formación de los estratos será formarlos de tal manera que 
haya la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato 
y la máxima heterogeneidad entre los estratos 
 
Cuando de utiliza este tipo de muestreo, es necesario incluir el concepto de factor de 
expansión (Wh). Este representa la cantidad de elementos del estrato “h” que representa 
cada elemento de dicho estrato (nh). 
 
 Wh = Nh / nh 
 
Fracción de muestreo (fh) por estrato. Es la proporción de la cantidad de elementos 
del estrato “h” que representa cada elemento de dicho estrato (nh). 
 fh = nh / Nh 
 
La cantidad de muestra posibles tamaño nh en cada estrado Nh sería. 
 
 
 
Distribución de la muestra general entre los distintos estratos 
 
Una vez calculado el tamaño de la muestra, se procede a su distribución entre los 
diferentes grupos o estratos identificados; el proceso se llama afijación. Veamos tres 
tipos de afijación. 
 
 Afijación simple. Reparto a partes iguales de la muestra entre el número de estratos 
conocidos, donde nh= n /L, siendo el número de estratos. 
/ 
 Afijación proporcional. Reparto de la muestra entre los estratos de forma 
proporcional al tamaño de los mismos. donde 
 
El número de elementos muestrales de cada estrato es directamente proporcional al 
tamaño del estrato dentro de la población. 
 
nh=Nh / N x n 
 
 
!
! !
h
h
N h
n
h h h
N
C
n N n


En el caso específico de la afijación proporcional se dice que la muestra es 
autoponderada, porque cada submuestra representa en la muestra general la misma 
proporción que la que representa su correspondiente estrato en la población. 
 
 
 Afijación óptima. Si se conoce la variabilidad de la característica o variable de 
muestreo en cada estrato la muestra se distribuye entre los estratos de la siguiente 
manera: 
 
El tamaño de la muestra de cada estrato viene dado por: 
 
 
En este caso se elige nh de forma que minimicen la varianza. El costo viene dado por ch, 
el cual representa el costo promedio por unidad en el estrato h. 
 
 Muestreo por conglomerados. 
 
Consiste en la selección aleatoria de los grupos o conglomerados de unidades muestrales. 
Luego dentro los conglomerados seleccionados se dividen e grupos de unidades a una 
menor escala, y después se seleccionan otros subgrupos más pequeños, hasta llegar a la 
sección de las unidades mínimas, de las cuales se escogen los elementos a que se les 
aplican las entrevistas o se toman los datos requeridos para el análisis. 
 
El siguiente esquema muestra este proceso de manera gráfica. La población (N) está 
dividida en 16 conglomerados identificados de la A a la P y cada uno subdividido en 4 
segmentos (círculos), y los círculos están compuestos por los puntos que representan los 
individuos que pueden ser hogares, personas u otros elementos simples de análisis. 
 
 
 
 
Por Ejemplo: 
 
Primea se seleccionaron aleatoriamente las áreas o conglomerados C, F, H, J, K, N y P. 
Luego dentro de los conglomerados seleccionados se tomaron los subgrupos que aparecen 
en los círculos: 
C →2 y 4 K →1 y 2 
F →2 y 3 N →2 y 4 
H →1 y 4 P→3 y 4 
J→3 y 4 
 
Y finalmente dentro de cada círculo se seleccionaron aleatoriamente los individuos, que 
aparecen representados por los puntos. Por lo estos puntos se seleccionan usando un muestreo 
sistemático o aleatorio simple dentro de cada circulo. 
 
Otro Ejemplo: 
 
El país está dividido por regiones, las regiones en provincias y las provincias en municipios, 
los municipios en urbano y rural, la zona urbana en barrios y la rural en secciones y parajes. 
Tanto los barrios como los parajes se dividen en UPM’s. 
En este cado la aplicación del muestro por conglomerados consiste en primero, seleccionar 
en cada región las provincias que la representan para hacer el estudio. Luego dentro de las 
provincias seleccionadas se escogen aleatoriamente o por un criterio de importancia, los 
municipios a incluir en dicho estudio, en esos municipios escogidos se toman los barrios de 
la zona urbana y en la rural las secciones y parajes, y por último de manera al azar se 
seleccionan los UPM’s que en mayoría de los casos son los segmentos censales que ha 
establecidos la Oficina Nacional de Estadística. 
 
En este procedimiento se debe establecer y asegurar la participación de todas las áreas 
geográficas hasta donde se requiere la representatividad de la muestra general. 
 
 
7.3.2. Características de los tipos de muestreos probabilísticos 
 
Tipo de 
muestreo 
Características Ventajas Inconvenientes 
Aleatorio simple  Se selecciona una muestra de 
tamaño n de una población de 
N unidades, cada elemento 
tiene una probabilidad de 
inclusión n/N. 
Sencillo y de fácil 
comprensión. 
Es uno de los más 
precisos, en términos de 
los errores de muestreo 
Requiere de un listado de 
todos los elementos de la 
población. 
 
Sistemático  Un listado de los N elementos 
de la población 
 Determinar la muestra n. 
 Calcula k = N/n. 
 Elegir un número aleatorio “i”, 
entre 1 y k. 
 Seleccionar los elementos de 
la lista usando la formula 
i+(i-1)k. 
Fácil de aplicar. 
Asegura una cobertura de 
los elementos de cada uno 
de los “n” subgrupos. 
Requiere de un listado de 
todos los elementos de la 
población. 
Los resultados pueden ser 
afectados por algún 
ordenamiento de los 
elementos en el listado. 
Estratificado  Dividir la población en 
estratos 
 Se requiere conocer la 
composición de la población. 
La muestra de distribuye entre 
los distintos estratos definidos. 
 Los estratos deben ser 
internamente homogéneos, y 
externamente heterogéneos. 
Asegura que la muestra 
represente a la población 
en cada uno de los grupos. 
 
Se ha de conocer la 
distribución en la 
población por las variables 
utilizadas para la 
estratificación. 
 
Conglomerados  Se realizan varias etapas de 
muestreo sucesivas 
 La necesidad de listados de las 
unidades de las etapas 
principales. 
 Se requiere del auxilio de otros 
tipos de muestreo para 
seleccionar los elementos 
requeridosen cada etapa. 
Es muy eficiente cuando la 
población es muy grande y 
dispersa. 
No es preciso tener un 
listado de toda la 
población, sólo para las 
principales etapas. 
El costo por unidad 
muestral es menor que en 
otros tipos de muestreo. 
El error estándar es mayor 
que en el muestreo 
aleatorio simple o 
estratificado. 
El cálculo del error 
estándar es complejo. 
 
 
7.3.3. Fórmulas estadísticas de mayor uso en los muestreos probabilísticos. 
 
 
 
 
7.3.4. Muestreo no probabilísticos 
 
Los métodos de muestreo no probabilísticos no garantizan la representatividad de la 
muestra, por lo tanto no permiten realizar inferencias sobre la población. 
 
Es aquel utilizado en forma empírica, es decir, no se efectúa bajo normas probabilística de 
selección, por lo que sus procesos intervienen opiniones y criterios personales del 
investigador o muestrista o no existe norma bien definida o validada. Normalmente se acude 
a este tipo de muestreo cuando es difícil enumerar, listar o precisar el universo objeto de 
estudio o cuando no existen registros de los datos. 
 
Los métodos de muestreo no probabilísticos no garantizan la representatividad de la muestra 
y por lo tanto no permiten realizar inferencias sobre una medida en la población completa. 
 
Son procedimientos de selección de los elementos donde se desconoce la probabilidad que 
tienen los elementos de la población para integrar la muestra, o por conveniencia y las 
características del análisis, se requiere la participación de elementos específicos en la 
muestra. 
 
 Muestreo causal o accidental. Es un procedimiento que permite elegir arbitrariamente 
los elementos sin un juicio o criterio preestablecido. Por Ejemplo: la gente que circula por 
determinada calle a una hora especifica del día, los visitantes que acuden a un museo en 
un determinado lapso, etc. 
 
 Muestreo intencional. En este caso los elementos son escogidos con base en criterios o 
juicios preestablecidos por el investigador. Ejemplo: Para un estudio sobre calidad de la 
educación, previamente, se establecen como criterios de selección de la muestra poseer 
mínimo de 20 años de experiencia en el campo educativo los siguientes: Haber ocupado 
un cargo directivo 
 
 Muestreo por cuotas. Consiste en dividir a la población bajo estudio en subgrupos o 
cuotas según ciertas características: edad, sexo, estado civil, etc. Por Ejemplo: 30 hombres 
y 50 mujeres, 45 hombres mayores de 25 años; 40 mujeres divorciadas desde hace más de 
5años, etc. 
 
Se trata de fijar un conjunto de condiciones que deben cumplir los individuos para entrar 
a formar parte de la muestra. 
 
 Muestreo bola de nieve. Particularmente útil cuando se muestrean poblaciones cuyos 
componentes, por motivos morales, ideológicos, legales o políticos tienen a ocultar su 
identidad. A partir de unos pocos individuos el entrevistador, con ayuda de los primeros 
va “conociendo” a nuevos miembros de la muestra. 
 
 Muestreo de juicios. En este muestreo accedemos a expertos en la materia para que nos 
ayuden en la determinación de una muestra representativa. 
 
 Muestreo no probabilísticos 
 Las unidades no tienen igual probabilidad de participar en la muestra. 
 No se puede calcular el error muestral 
 Alto riesgo de invalidar

Continuar navegando