Teoría del Muestreo

Estadística II

•

SIN SIGLA

Luis Mario Ramirez

23/10/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Estadística II

3262 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

VI. Fundamentos de muestreo

El concepto de muestreo se basa en la probabilidad de que un conjunto de elementos
escogidos de forma aleatoria de una población sean distribuidos de forma que representen
dicha población en todas sus características.

El muestreo es el procedimiento que se utiliza para los siguientes elementos:

 Determinar el tamaño de la muestra (n)
 Seleccionar los elementos de la población que constituyen la muestra
 Analizar los indicadores y medidas resultantes de los datos obtenidos a través de la muestra.

El muestreo se utiliza como forma de reducir el consumo tiempo y de otros recursos, y
obtener información más precisa sobre las características de los elementos de una población
que constituyen la muestra.

7.1. Algunos conceptos importantes.

 Población. Es la totalidad de los elementos con características comunes para un
determinado fin. Generalmente la población se representa por N.

 Población objetivo. Es el conjunto de unidades del que se desea realizar un análisis y tomar
alguna decisión. Este conjunto debe ser definido de tal forma que manera segura, si una
unidad específica pertenece o no a dicha población.

 El tamaño de la población. es la cantidad de elementos o unidades que constituye dicha
población, se presenta por N.

 Elemento muestral. Entendemos cada uno de los orígenes de la información o sucesos que
intentamos medir. Digamos que sería cada uno de los “elementos” de esa población.

 Unidad muestral. Es cada uno de los individuos o fuentes de la información que se
pretende medir, es decir, cada uno de los posibles componentes de la muestra.

 Marco muestral. Es una enumeración exhaustiva de todas las unidades muestrales. La
utilización del marco muestral tiene como finalidad la extracción de un conjunto de
unidades. Se define como lista de todas las unidades que componen la población objetivo.

 Alcance de una muestra. Viene determinado por las limitaciones que establezca el propio
investigador en la descripción del marco muestral. Es decir son los límites que pone el
investigador.

7.2. Tamaño de la muestra (n)

Una vez seleccionado el método de muestreo a utilizar se procederá al cálculo del tamaño
de la muestra. Es la cantidad de elementos de la población necesarios para hacer un análisis
estadístico que explique la situación de los elementos de la población de acuerdo a las
características de interés.

El tamaño de la muestra depende de:

 El porcentaje de fiabilidad o nivel de confianza deseado (ẞ)
 El error máximo permitido (e) ó (d).
 La varianza entre los elementos la población (σ2).
 El tamaño de la población (N).
 El detalle de los resultados de la muestra
 La disponibilidad de recursos (c).

En caso que la variable utilizada para calcular el tamaño de la muestra se mida a través de
una proporción, se usa las siguientes formulas.

Si la población es infinita, es decir se desconoce la cantidad de elementos de la población.

Ejemplo:

Se requiere determinar el tamaño de la muestra, para estudiar las características demográficas
de la población ocupada y desocupada en la provincia de Dajabón.

Si la proporción que trabaja es de p=0.76. Si el usuario principal de los resultados de la
investigación acepta error de muestreo es (e=d=6.4%) con un nivel de confianza ẞ=0.96, el
cual equivale a Z=2.05.

Usando la siguiente fórmula:

Si la población es finita, es decir conocemos el total de la población y deseásemos saber
cuántas del total tendremos que estudiar la respuesta seria.

Donde:

 Z depende del nivel de confianza establecido (ẞ)
2,05
2
x 0.76 x (1-0.76)
n = ---------------------------- = 187.
0.064
2

 N es el tamaño de la población
 p = proporción de casos que cumplen con la condición objetivo de la variable de
muestreo
 q = 1 – p es proporción de casos que no cumplen con la condición objetivo de la
variable de muestreo
 e= d = es el error de muestreo establecido, la diferencia máxima aceptado entre una
medida de muestra y su valor correspondiente en la población.

Ejemplo:

Se requiere determinar el tamaño de la muestra, para estudiar las características
demográficas de la población ocupada y desocupada en la provincia de Dajabón.

La población económicamente activa es N=23,586, la cual se obtuvo que la proporción
que trabaja es de p=0.76. Si el usuario principal de los resultados de la investigación
acepta error de muestreo es (e=d=6.4%) con un nivel de confianza ẞ=0.96, el cual
equivale a Z=2.05.

Aplicando la formula anterior:

En caso que la variable utilizada para calcular el tamaño de la muestra se mida a través
de un promedio, se usa la siguiente formula.

Si la población es finita, es decir se conoce la cantidad de elementos de la población.

Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula.

Donde:

 n = el tamaño de la muestra.
 N = tamaño de la población.
 σ2 = La varianza entre los elementos la población (σ2).
 Z = depende del nivel de confianza establecido (ẞ)
 e= d = es el error de muestreo establecido, la diferencia máxima aceptado entre una
medida de muestra y su valor correspondiente en la población.

23,586*2,05
2
*0.76*(1-0.76)
n = ------------------------------------------------- = 185.68 = 186 personas
0.064
2
*(23,586-1)+2.05
2
*0.76*(1-0.76)
Ejemplo: Usando como variable de muestreo el gasto diario de los hogares, que es una
variable continua, calcule el tamaño de la muestra requerido para un estudio de mercado.
Tamaño de población N Cantidad de hogares 256,000
Varianza σ2 =
Varianza del gasto diario de
los hogares estimado 2,400,473.19
Promedio µ=
Gasto promedio diario de los
hogares estimado
3,693.17
ꞵ=0.96 → Z= Nivel de confianza 2.05
Error =5% de µ→ e=
Diferencia máxima permitida
entre el promedio resultante
de la muestra y el de la
población µ.
184.66
Tamaño de la muestra

Cantidad mínima de hogares
a ser seleccionada para el
análisis

256,000*2,400,473.19*2.052
n=―――――――――――――――― =296
((256,000-1)*184.662 +2,400,473.19*2.052)

Valores de Z para distintos niveles de confianza.

Zα/2 ẞ α=1-ẞ Zα/2 ẞ α=1-ẞ
3.09 0.997 0.003 1.60 0.890 0.110
2.33 0.980 0.020 1.56 0.880 0.120
2.17 0.970 0.030 1.51 0.870 0.130
2.05 0.960 0.040 1.48 0.860 0.140
1.96 0.950 0.050 1.44 0.850 0.150
1.88 0.940 0.060 1.41 0.840 0.160
1.81 0.930 0.070 1.37 0.830 0.170
1.75 0.920 0.080 1.35 0.820 0.180
1.70 0.910 0.090 0.88 0.810 0.190
1.65 0.900 0.100

El error de muestreo o error muestral se calcula en base a la siguiente fórmula

 Cantidad de muestras posibles tamaño “n”. Al calcular el tamaño de la muestra podemos
determinar la cantidad de muestras de ese mismo tamaño que podrían extraerse de la
Población N. Esa cantidad se calcula a través de la siguiente expresión:

Haciendo el mismo calculo dentro de cada estrato, sería:

Por Ejemplo: de una población de tamaño (N=10 elementos) se pueden obtener 210
combinaciones o muestras tamaño (n=4).

M= C
N
n= N! / ( n! x (N=n)!)
M= C10,4 = 10!/( 4! x (10 - 4)! )=210.

 Fracción de muestreo. Es la proporción de población que forma parte de la muestra. Es
justo la relación inversa.f =n / N

 Distribución de la muestra. hace referencia a las distintas muestras del mismo tamaño
extraídas de una misma población y la frecuencia con que los estimadores muestrales toman
el mismo valor.

 Factor de Expansión. Es la cantidad de elementos de la población que representa cada
elemento de la muestra. W=N / n.

 Encuesta por muestreo. Es la técnica de investigación a través de la cual se toman datos
sobre ciertas característicasde cada uno de los elementos de la población que forman
la muestra.

 Las ventajas de las encuestas por muestreo son:
 Reducción del tiempo
 Reducción de los costos y el uso de otros recursos
 Control del proceso
 Mayor calidad de los datos colectados

7.3. Tipos de muestreos.

Tenemos dos tipos de muestreos, los probabilísticos y los no probabilísticos. Los muestreos
probabilísticos se basan en que cada elemento del universo o población tiene una
probabilidad conocida de formar parte de la muestra. Existen diversas modalidades.

7.3.1. Muestreos probabilísticos

 Muestreo aleatorio simple. Debemos conocer el tamaño de la muestra objeto de
estudio y además disponer de una lista completa de los individuos que forman parte de
la población o universo (he aquí la dificultad). Se elegirá a los individuos mediante un
procedimiento estadístico o bien identificando las posibles muestras y se escogerá una
de ellas mediante un procedimiento estadístico.

 Muestreo aleatorio sistemático (o con arranque sistemático).Se necesita también
una lista de la población (N) y el tamaño de la muestra (n) y se calcula el coeficiente
de elevación (k=N/n). Se selecciona aleatoriamente un miembro de la muestra y se
obtienen los demás seleccionando al individuo que se encuentra N/n posiciones
después del primero, repitiendo la operación hasta completar la muestra.

 El primero elemento se toma de forma aleatoria entre 1 y k, el cual estará ubicado en la
posición i del listado, donde(1 ≤ i ≤ k).

Elemento Posición
1 1 ≤ i ≤ k
2 i+k
3 i+2k
… …
i=n i+(i-1)k

 Muestreo estratificado. Se usa cuando se conoce la existencia de diversos grupos en
la población que sean representativos, y se quiere mantener una proporción en la
muestra.
El criterio a seguir en la formación de los estratos será formarlos de tal manera que
haya la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato
y la máxima heterogeneidad entre los estratos

Cuando de utiliza este tipo de muestreo, es necesario incluir el concepto de factor de
expansión (Wh). Este representa la cantidad de elementos del estrato “h” que representa
cada elemento de dicho estrato (nh).

Wh = Nh / nh

Fracción de muestreo (fh) por estrato. Es la proporción de la cantidad de elementos
del estrato “h” que representa cada elemento de dicho estrato (nh).
fh = nh / Nh

La cantidad de muestra posibles tamaño nh en cada estrado Nh sería.

Distribución de la muestra general entre los distintos estratos

Una vez calculado el tamaño de la muestra, se procede a su distribución entre los
diferentes grupos o estratos identificados; el proceso se llama afijación. Veamos tres
tipos de afijación.

 Afijación simple. Reparto a partes iguales de la muestra entre el número de estratos
conocidos, donde nh= n /L, siendo el número de estratos.
/
 Afijación proporcional. Reparto de la muestra entre los estratos de forma
proporcional al tamaño de los mismos. donde

El número de elementos muestrales de cada estrato es directamente proporcional al
tamaño del estrato dentro de la población.

nh=Nh / N x n

 
!
! !
h
h
N h
n
h h h
N
C
n N n


En el caso específico de la afijación proporcional se dice que la muestra es
autoponderada, porque cada submuestra representa en la muestra general la misma
proporción que la que representa su correspondiente estrato en la población.

 Afijación óptima. Si se conoce la variabilidad de la característica o variable de
muestreo en cada estrato la muestra se distribuye entre los estratos de la siguiente
manera:

El tamaño de la muestra de cada estrato viene dado por:

En este caso se elige nh de forma que minimicen la varianza. El costo viene dado por ch,
el cual representa el costo promedio por unidad en el estrato h.

 Muestreo por conglomerados.

Consiste en la selección aleatoria de los grupos o conglomerados de unidades muestrales.
Luego dentro los conglomerados seleccionados se dividen e grupos de unidades a una
menor escala, y después se seleccionan otros subgrupos más pequeños, hasta llegar a la
sección de las unidades mínimas, de las cuales se escogen los elementos a que se les
aplican las entrevistas o se toman los datos requeridos para el análisis.

El siguiente esquema muestra este proceso de manera gráfica. La población (N) está
dividida en 16 conglomerados identificados de la A a la P y cada uno subdividido en 4
segmentos (círculos), y los círculos están compuestos por los puntos que representan los
individuos que pueden ser hogares, personas u otros elementos simples de análisis.

Por Ejemplo:

Primea se seleccionaron aleatoriamente las áreas o conglomerados C, F, H, J, K, N y P.
Luego dentro de los conglomerados seleccionados se tomaron los subgrupos que aparecen
en los círculos:
C →2 y 4 K →1 y 2
F →2 y 3 N →2 y 4
H →1 y 4 P→3 y 4
J→3 y 4

Y finalmente dentro de cada círculo se seleccionaron aleatoriamente los individuos, que
aparecen representados por los puntos. Por lo estos puntos se seleccionan usando un muestreo
sistemático o aleatorio simple dentro de cada circulo.

Otro Ejemplo:

El país está dividido por regiones, las regiones en provincias y las provincias en municipios,
los municipios en urbano y rural, la zona urbana en barrios y la rural en secciones y parajes.
Tanto los barrios como los parajes se dividen en UPM’s.
En este cado la aplicación del muestro por conglomerados consiste en primero, seleccionar
en cada región las provincias que la representan para hacer el estudio. Luego dentro de las
provincias seleccionadas se escogen aleatoriamente o por un criterio de importancia, los
municipios a incluir en dicho estudio, en esos municipios escogidos se toman los barrios de
la zona urbana y en la rural las secciones y parajes, y por último de manera al azar se
seleccionan los UPM’s que en mayoría de los casos son los segmentos censales que ha
establecidos la Oficina Nacional de Estadística.

En este procedimiento se debe establecer y asegurar la participación de todas las áreas
geográficas hasta donde se requiere la representatividad de la muestra general.

7.3.2. Características de los tipos de muestreos probabilísticos

Tipo de
muestreo
Características Ventajas Inconvenientes
Aleatorio simple  Se selecciona una muestra de
tamaño n de una población de
N unidades, cada elemento
tiene una probabilidad de
inclusión n/N.
Sencillo y de fácil
comprensión.
Es uno de los más
precisos, en términos de
los errores de muestreo
Requiere de un listado de
todos los elementos de la
población.

Sistemático  Un listado de los N elementos
de la población
 Determinar la muestra n.
 Calcula k = N/n.
 Elegir un número aleatorio “i”,
entre 1 y k.
 Seleccionar los elementos de
la lista usando la formula
i+(i-1)k.
Fácil de aplicar.
Asegura una cobertura de
los elementos de cada uno
de los “n” subgrupos.
Requiere de un listado de
todos los elementos de la
población.
Los resultados pueden ser
afectados por algún
ordenamiento de los
elementos en el listado.
Estratificado  Dividir la población en
estratos
 Se requiere conocer la
composición de la población.
La muestra de distribuye entre
los distintos estratos definidos.
 Los estratos deben ser
internamente homogéneos, y
externamente heterogéneos.
Asegura que la muestra
represente a la población
en cada uno de los grupos.

Se ha de conocer la
distribución en la
población por las variables
utilizadas para la
estratificación.

Conglomerados  Se realizan varias etapas de
muestreo sucesivas
 La necesidad de listados de las
unidades de las etapas
principales.
 Se requiere del auxilio de otros
tipos de muestreo para
seleccionar los elementos
requeridosen cada etapa.
Es muy eficiente cuando la
población es muy grande y
dispersa.
No es preciso tener un
listado de toda la
población, sólo para las
principales etapas.
El costo por unidad
muestral es menor que en
otros tipos de muestreo.
El error estándar es mayor
que en el muestreo
aleatorio simple o
estratificado.
El cálculo del error
estándar es complejo.

7.3.3. Fórmulas estadísticas de mayor uso en los muestreos probabilísticos.

7.3.4. Muestreo no probabilísticos

Los métodos de muestreo no probabilísticos no garantizan la representatividad de la
muestra, por lo tanto no permiten realizar inferencias sobre la población.

Es aquel utilizado en forma empírica, es decir, no se efectúa bajo normas probabilística de
selección, por lo que sus procesos intervienen opiniones y criterios personales del
investigador o muestrista o no existe norma bien definida o validada. Normalmente se acude
a este tipo de muestreo cuando es difícil enumerar, listar o precisar el universo objeto de
estudio o cuando no existen registros de los datos.

Los métodos de muestreo no probabilísticos no garantizan la representatividad de la muestra
y por lo tanto no permiten realizar inferencias sobre una medida en la población completa.

Son procedimientos de selección de los elementos donde se desconoce la probabilidad que
tienen los elementos de la población para integrar la muestra, o por conveniencia y las
características del análisis, se requiere la participación de elementos específicos en la
muestra.

 Muestreo causal o accidental. Es un procedimiento que permite elegir arbitrariamente
los elementos sin un juicio o criterio preestablecido. Por Ejemplo: la gente que circula por
determinada calle a una hora especifica del día, los visitantes que acuden a un museo en
un determinado lapso, etc.

 Muestreo intencional. En este caso los elementos son escogidos con base en criterios o
juicios preestablecidos por el investigador. Ejemplo: Para un estudio sobre calidad de la
educación, previamente, se establecen como criterios de selección de la muestra poseer
mínimo de 20 años de experiencia en el campo educativo los siguientes: Haber ocupado
un cargo directivo

 Muestreo por cuotas. Consiste en dividir a la población bajo estudio en subgrupos o
cuotas según ciertas características: edad, sexo, estado civil, etc. Por Ejemplo: 30 hombres
y 50 mujeres, 45 hombres mayores de 25 años; 40 mujeres divorciadas desde hace más de
5años, etc.

Se trata de fijar un conjunto de condiciones que deben cumplir los individuos para entrar
a formar parte de la muestra.

 Muestreo bola de nieve. Particularmente útil cuando se muestrean poblaciones cuyos
componentes, por motivos morales, ideológicos, legales o políticos tienen a ocultar su
identidad. A partir de unos pocos individuos el entrevistador, con ayuda de los primeros
va “conociendo” a nuevos miembros de la muestra.

 Muestreo de juicios. En este muestreo accedemos a expertos en la materia para que nos
ayuden en la determinación de una muestra representativa.

 Muestreo no probabilísticos
 Las unidades no tienen igual probabilidad de participar en la muestra.
 No se puede calcular el error muestral
 Alto riesgo de invalidar