MUESTREO Filminas_Clases1y2

•
UNAM

isabelpb64
6/11/2022
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Probabilidad y Estadística

29.966 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
MUESTREO PROBABILISTICO
PROBLEMA: Por razones de gobierno se desea conocer el 
ingreso total (o el ingreso promedio que es otra forma de 
presentar la información) de los habitantes de la provincia 
de Jujuy "en un momento dado", entrevistando para tal 
propósito a las unidades familiares que viven en la 
provincia
POBLACION (o UNIVERSO) de nuestro estudio: 
¿conjunto de unidades familiares en la provincia?
La población es el conjunto de ingresos totales ($) de las 
citadas unidades familiares.
Nos interesan las mediciones de la variable "ingreso" ($) y 
no la entidad física "unidad familiar".
POBLACION es la totalidad de observaciones en 
las que se está interesado.
Métodos alternativos para reunir la información 
necesaria:
(a) CENSAR: Esto es, entrevistar a todos los 
integrantes de la población.
(b) MUESTREAR: Entrevistar solamente a un 
subconjunto de la población.
Una MUESTRA es un subconjunto de la población.
VENTAJAS DEL MUESTREO
1) Casos en los que siempre debe muestrearse
(debido a características de la población, naturaleza 
del método de estudio, etc.):
Población infinita.
Población de tamaño desconocido.
Muestreo destructivo.
2) A menudo conviene muestrear por razones de:
Tiempo: oportunidad – cambios en la población
Costo
Calidad
DESVENTAJAS DEL MUESTREO
1) La información de una muestra no es la de la 
población. Se introduce un elemento más de 
aproximación.
2) Cuando se quiere desagregar mucho a los datos 
(clasificaciones cruzadas por varios atributos), la cantidad 
de información juega un papel preponderante. Aún los 
censos pueden resultar insuficientes para que ciertas 
clasificaciones cruzadas tengan relevancia estadística.
En lo sucesivo supondremos que por alguna razón 
de las expuestas, o por otras, ya se ha decidido tomar 
solo una muestra. Ejemplos del censo
TIPOS DE MUESTRAS
Si las inferencias de la muestra para la población han 
de ser válidas, es importante obtener muestras 
representativas de la población.
a) Muestra seleccionada "por expertos" De alguna 
manera especial se decide la muestra que se tomará, basada 
en razonamientos o consideraciones de algún tipo.
b) Muestra Probabilística : Es aquella en la que los 
elementos de la muestra se seleccionan con base en 
probabilidades conocidas.
b1) "Al azar o aleatorio": Las formas más sencillas de este 
método consiste en poner a toda la población en una urna, y 
extraer al azar, con reposición o sin ella, la muestra del 
tamaño deseado. Es decir se pueden utilizar dos métodos 
básicos para seleccionar la muestra al azar: con reemplazo o 
sin reemplazo. 
Con Reemplazamiento: 
Todas las muestras tienen la misma probabilidad 
de ser seleccionadas y 
Todas las unidades de la población tiene la 
misma probabilidad de ser seleccionadas para 
formar parte de la muestra. 
Coincide con el muestreo de poblaciones 
infinitas.
Sin Reemplazamiento: 
Cada una de las Comb(N, n) muestras, tiene la 
misma probabilidad de ser escogida. N: tamaño 
de la Población y n: tamaño de la muestra.
Todas las unidades de la población tienen la 
misma probabilidad de ser extraídas, pero si la 
población es finita, la probabilidad de que salga 
un elemento dependerá de los que fueron 
separados anteriormente para formar parte de 
la muestra y dejaron, por lo tanto, de pertenecer 
a los seleccionables. 
También se llama a este método: muestreo 
irrestricto aleatorio o muestreo aleatorio simple
(muestreo al azar sin reemplazamiento).
Ya sea que se realice el muestreo con 
reemplazo en poblaciones finitas o sin 
reemplazo en poblaciones infinitas (tal como 
algunos procesos continuos de producción) las 
fórmulas que se utilizan son las mismas.
El muestreo “al azar” se utiliza cuando a 
priori no conocemos que elementos de la 
población tendrán valores altos de ella.
Cuando dispongamos de información sobre la población, 
conviene tenerla en cuenta al seleccionar la muestra.
b.2 Se denomina MUESTREO ESTRATIFICADO aquel en que 
los elementos de la población se dividen en clases o 
estratos, y la muestra se toma asignando un número 
determinado de miembros a cada estrato y escogiendo 
por muestreo al azar dentro del estrato.
Existen dos criterios básicos para dividir el tamaño 
total entre los estratos:
a) A cada estrato le corresponde igual número de 
elementos muéstrales. 
b) Proporcionalmente al tamaño relativo del 
estrato en la población. La distribución se hace de 
acuerdo con el peso (tamaño) de la población en cada 
estrato. 
Ejemplo de muestreo Estratificado
b.3 Otro tipo de muestreo que se utiliza cuando 
los elementos de la población están ordenados 
en listas es el MUESTREO SISTEMATICO.
Si la población tiene tamaño N, se desea una 
muestra de tamaño n.
Sea k = entero más próximo a N/n.
Se elige al azar un elemento entre los primeros k 
elementos de la lista → n1 es el orden elegido.
Tomamos los elementos n1+k; n1+2k, etc., a 
intervalos fijos de k hasta completar la muestra.
• Si el orden de los elementos en la lista es al 
azar, este procedimiento es equivalente al 
muestreo al azar o aleatorio.
• Si el orden de los elementos es tal que los 
individuos próximos tienden a ser mas 
semejantes que los alejados, el muestreo 
sistemático tiende a ser más preciso que el 
muestreo al azar, al cubrir más 
homogéneamente toda la población.
El muestreo sistemático puede utilizarse 
conjuntamente con el estratificado, para 
seleccionar la muestra dentro de cada estrato.
Ejemplo de muestreo Sistemático
b.4 
Para poblaciones muy heterogéneas se utiliza el MUESTREO 
POLIETAPICO por Conglomerados: Por ejemplo para seleccionar una 
muestra de personas de S.S. de Jujuy podemos seleccionar por muestreo 
aleatorio simple barrios, después calles dentro de los barrios, luego 
viviendas de la calle y finalmente, el piso dentro de la vivienda, etc.
MUESTERO ALEATORIO POR CONGLOMERADOS
La unidad muestral ya no son los individuos, sino un conjunto de individuos que bajo 
determinados aspectos, se considera que forman una unidad.
Busca, al contrario que el estratificado, heterogeneidad dentro de los estratos y 
homogeneidad entre estratos. En pequeña escala, cada conglomerado es una 
representación del universo.
MUESTREO POLIETÁPICO POR CONGLOMERADOS
Es un submuestreo del conglomerado.
Se utiliza cuando el número de conglomerados es elevado.
Selecciona los individuos por etapas, configurando sucesivamente grupos (estratos o 
conglomerados) y subgrupos denominados Unidades de Muestreo primarias, 
secundarias, terciarias, etc.
Ejemplo de muestreo por Conglomerados
La regla general que se aplica a todos los 
procedimientos de muestreo es que cualquier 
información previa debe utilizarse para subdividir 
la población y asegurar la mayor representatividad 
de la muestra. Una vez que disponemos de 
subpoblaciones homogéneas, la selección dentro 
de ellas debe realizarse por muestreo al azar.
En todo lo que sigue SUPONDREMOS SIEMPRE que 
la muestra proviene de un muestreo al azar.
Resumen Tipos de Muestreo
MODELO PARA MUESTREO AL AZAR CON 
REPOSICION
Por algún procedimiento práctico adecuado, 
se va a seleccionar al azar, con reposición a n 
familias y se va a preguntar a las respectivas 
familias sus ingresos totales, por ejemplo en el 
último año anterior al día del relevamiento.
Familia 1 Familia 2 Familia 3
… Familia n-ésima
Ingreso x1 Ingreso x2 Ingresox3 ... 
Ingreso xn
x1, x2, ... , xn será una muestra al azar con 
reposición de ingresos ($)
Si nuestro interés: El ingreso promedio de las 174.763 
familias de la provincia de Jujuy), podemos tomar el ingreso 
promedio de las n familias entrevistadas 
n
x
x
n
1i
i

 (1) 
Evaluemos el verdadero valor y alcance de la medida (1). 
Si la selección hubiera recaído en otras n familias (lo que es 
completamente factible, pues la selección fue hecha "al 
azar"), ¿ x podría haber tomado un valor distinto? 
¿Podrían haberse presentado valores muy alejados del 
que obtuvimos, de manera que por"pura casualidad" 
tengamos un valor excepcionalmente alto o bajo? 
 Para analizar todas estas cuestiones, utilizamos el hecho 
básico de que la selección fue hecha al azar y utilizaremos 
algunas ideas de probabilidad y variables aleatorias. 
MODELO: Usemos la v.a. X para designar a la variable o 
característica que se quiere investigar. 
En el ejemplo: 
X es el “ingreso total de una unidad familiar” 
X tiene una distribución de frecuencias relativas, que muestra las 
proporciones de unidades familiares que tiene cada nivel de ingreso 
total. 
Si x es un valor de X → x es el ingreso de una unidad familiar. 
Si hay k familias con ingreso x → k/ 174.763 es la proporción 
 de familias con ingreso x. 
LA POBLACION ES UNA VARIABLE ALEATORIA X QUE 
TIENE ALGUNA DISTRIBUCION DE FRECUENCIAS 
RELATIVAS (que sumen 1). 
Por cada valor de X distinto, se ponen en la urna tantas bolillas 
como veces ese valor aparezca en la población y tendremos una 
urna con bolillas en la misma proporción que la distribución de 
frecuencias relativas. 
Se extrae de esa población o urna, una muestra al azar de tamaño 
n= 1. 
Proposición Fundamental: Si designamos por X1 el valor que 
resultará seleccionado, X1 es una variable aleatoria cuya 
distribución de probabilidad es la distribución de frecuencias 
relativas de X. 
Conclusión: FX1(x1) = FX(x1). 
Por ejemplo P(X1 ≤ 10.000) = P(X ≤ 10.000) 
Si X2 registra el valor que resultará seleccionado en la segunda 
unidad muestral, X2 es una variable aleatoria con la misma 
distribución de X y es INDEPENDIENTE de X1. 
Conclusión: Si X1, X2,...,Xn son las variables aleatorias del 
muestreo al azar con reposición, entonces 
FX i = FX para cada i = 1, 2, …, n. Esto es P( X i ≤ a ) = P( X ≤ a ) 
 
Si X1, X2,...,Xn son variables aleatorias INDEPENDIENTES cada 
una con la distribución de probabilidad de X, definimos X1, 
X2,...,Xn como una MUESTRA ALEATORIA de variables 
aleatorias de la población X. 
MUESTREO AL AZAR SIN REPOSICION (SIMPLE) 
Hasta X1 es lo mismo que en el modelo anterior. 
Proposición: Si X1, X2,...,Xn son las variables aleatorias del 
muestreo sin reposición de una población de tamaño N > n, y X es 
la variable aleatoria de la población, entonces X1, X2,...,Xn tienen 
marginalmente la misma distribución de X pero no son 
independientes. 
(Es así pues X2 es el valor que resultará seleccionado y hasta tanto 
no salga seleccionado x1 la distribución de X2 será igual a la 
Distribución de X). 
 Mientras que al censar conocemos toda la distribución de X, 
con el muestreo al azar obtenemos información probabilística sobre 
esa distribución pues cada Xi tiene la distribución de probabilidad 
de X. 
RESUMEN: En el muestreo al azar queremos distinguir entre los 
números que se observan al disponer de los datos x1, x2,..., xn y las 
variables aleatorias X1, X2, ... ,Xn que constituyen la 
CONTRAPARTE TEORICA de las observaciones. 
Con los números observados podemos hacer cálculos, gráficos 
etc., pero para aclarar el valor intrínseco de las observaciones, 
y para tener en cuenta que provienen de un muestreo al azar, 
recurrimos al análisis de las correspondientes variables 
aleatorias.
5.- NOTAS SOBRE MUESTREO AL AZAR 
Con reposición: teóricamente el más fácil, pues las 
observaciones X1, X2, ..., Xn son independientes en sentido 
probabilístico, e idénticamente distribuidas (tienen la 
distribución de la población).
Sin reposición: Es el más eficiente, pues la información que da 
un elemento no aparece sino una sola vez. Si por ejemplo 
tuviésemos una población muy chica, el muestreo sin 
reposición rápidamente nos proporcionaría toda la 
información, mientras que el muestreo con reposición seguiría 
manteniendo ciertos niveles de probabilidad.
Proposición: Aún en el caso del muestreo sin 
reposición, cada una de las observaciones X1, X2, 
..., Xn tiene (marginalmente) la misma 
distribución que la población. Sin embargo las 
observaciones no son independientes en el 
sentido probabilístico.
No demostraremos esta aseveración en general, 
sino que daremos un ejemplo para ver por qué 
se cumple.
Ejemplo: Sea una urna con 100 bolillas de las cuales 20 están 
marcadas con el número uno, 30 con el dos y 50 con el tres. Analice 
el experimento aleatorio consistente en extraer dos bolillas al azar, 
con y sin reposición. 
La distribución de probabilidad 
de v.a. poblacional X “la 
puntuación de bolilla extraída” 
es: 
 
x P(X = x) 
1 0,20 
2 0,30 
3 0,50 
Las posibles muestras de tamaño 2 y sus respectivas 
probabilidades se presentan en la tabla siguiente: 
Caso A: Extracciones con reposición 
 
P(X1 = x1, X2 = x2 ) = P(X1 = x1)*P(X2 = x2 │ X1= x1)= P(X1 = x1)*P(X2 
=x2 ) 
Caso B: Extracciones sin reposición 
 
P(X1 = x1, X2 = x2 ) = P(X1 = x1) P(X2 = x2 │ X1 = x1) 
Como 198/990 = 0,20, 297/990 = 0,30 y 495/990 = 0,50, en este 
caso resulta que marginalmente los acontecimientos “1”, “2” y “3” 
tienen las misma probabilidades en ambos casos. Note sin embargo 
que el cuerpo de las tablas es distinto y que en el caso sin 
reposición no hay independencia. 
6.- NOTA SOBRE TERMINOLOGIA
La dualidad entre los valores muestrales
observados (xi ) y su contraparte teórica, las 
variables aleatorias Xi , hace que existan dos 
maneras de caracterizar a la mayoría de los 
elementos en juego. Presentamos ambas formas 
en el cuadro siguiente. 
D E F I N I C I O N E S 
Concepto En Muestreo En términos de variables aleatorias 
 Población Conjunto de mediciones de una 
característica, para los individuos 
de un grupo bien definido. 
A menudo también la población 
física (personas, ratones, etc.) 
Variable aleatoria (X) y su distribución de 
probabilidad. 
(Nota: ver definición “alternativa” de v.a. en 
las notas – Claramente la variable poblacional 
X concuerda con esa definición, y es una v. a.) 
Muestra Subconjunto de la población Muestra al azar 
Conjunto de observaciones muestrales (Xi ), 
cada una es una variable aleatoria. 
Muestreo al 
azar 
Selección de una muestra con 
probabilidades conocidas 
Parámetro Cualquier característica 
mensurable de la población 
Parámetro (o función paramétrica) de la 
distribución de la variable aleatoria (cuando la 
v. a. tiene una distribución paramétrica). 
Estadístico Característica mensurable de la 
muestra 
Función de las variables aleatorias muestrales, 
y por lo tanto también una v. a. 
 
Parte 2
7.- EL CONCEPTO DE LA DISTRIBUCIÓN MUESTRAL DE 
UN ESTADÍSTICO 
Ya dijimos que estamos interesados en analizar el promedio 
observado n
x
x
n
i
i
 1 o la suma observada 


n
i
ix
1 , no como números 
dados sino tomados desde el punto de vista que las xi tienen como 
contraparte teórica las variables aleatorias Xi. Vale decir que 
queremos analizar como variables aleatorias a n
X
X
n
i
i
 1 , 


n
i
iX
1 , etc. 
Entonces en el marco de las variables aleatorias involucradas 
usamos la siguiente definición (2): 
Definición: Se llama ESTADISTICO a cualquier función de las 
variables aleatorias del muestreo y solo de ellas, y por lo tanto 
también es una variable aleatoria- 
U es un estadístico ↔ U = U (X1, X2, ..., Xn) 
 
Una primera observación es que estos estadísticos son también 
variables aleatorias, pues son transformaciones (simples o 
complicadas) de las variables aleatorias X1, X2, ..., Xn. Como 
además sabemos algo de la distribución de las Xi, podemos aspirar a 
analizar a los estadísticos (tomados como variables aleatorias) con 
mucho detalle. 
Por ejemplo, si el muestreo fue al azar con reposición, los Xi son 
independientes y tienen la distribución FX de la población X. 
Si el muestreo fue al azar sin reposición (al azar simple), los Xi 
tienen todavía marginalmente la misma distribución FX (de la 
población X), pero no son independientes. 
Ejemplo: Con o sin reposición, E 
X1+X2+ … + Xn
n
 = E(X) , esto es 
E(x ) = E(X). 
Demostración:E(x ) = E 
X1+X2+ … + Xn
n
 =
1
n
E X1 + X2 + … + Xn =
 
1
n
E X1) + E(X2) + … + E( Xn =
1
n
 n E(X) = E(X) 
Notas: (1) La reposición o falta de ella no afecta este resultado, pues 
la clave está en la “linealidad de la esperanza matemática”. 
(1) E X1 + X2 + … + Xn = n E X , depende de n; en 
consecuencia es un poco menos útil que el estadístico 
media aritmética, si bien en este caso ambos pueden 
sustituirse prácticamente para todos los fines. 
Por ser un estadístico una variable aleatoria tiene una distribución 
de probabilidad que se llama “Distribución muestral del 
estadístico”. 
Definición: Llamamos distribución muestral de un estadístico a su 
distribución de probabilidad cuando se lo considera una variable 
aleatoria. 
Ejemplos: 
Si x
1
, x
2
, ... , xn son los números obtenidos en el muestreo, todas las 
operaciones con esos números nos permiten definir estadísticos. 
x1+ x2+ … + xn= t —→ será un valor del estadístico T = X1 + X2 
+ ... + Xn 
x1+x2+ … + xn
n
= x —→ será un valor del estadístico 
 x =
X1+X2+ … + Xn
n
 
Entonces, desde un punto de vista teórico T y x son variables 
aleatorias cuyas distribuciones de probabilidad se llaman 
“Distribución Muestral de T” y “Distribución Muestral de x ”. 
Problemas típicos con respecto a la distribución muestral de un 
estadístico: 
(1) Problema amplio: Dada una cierta distribución de 
probabilidad de la población X, deducir la distribución muestral 
de un estadístico. 
(2) Problema reducido: Dada cierta información con 
respecto a la distribución de probabilidad de la población 
X, deducir algunas partes de la distribución muestral de 
un estadístico, e incluso decir algo sobre toda la 
distribución si fuera posible. 
Típicamente estos problemas son resueltos por la estadística 
matemática, los resultados se expresan en la forma siguiente: 
Si la v.a. poblacional X tiene una cierta distribución (específica) FX 
y U = U (X1, X2, ..., Xn) es un estadístico muestral función de las 
variables aleatorias Xi , y Xi se distribuye como X para cada 
subíndice i, entonces U tiene la distribución FX. 
En otros casos puede decirse: Si E(X) =  , entonces x satisface E(x ) 
=  . Esto es lo que demostramos más arriba 
8.- OTROS ESTADÍSTICOS IMPORTANTES 
Si X1, X2, ..., Xn es una muestra aleatoria de v. a. (iid) son de 
interés, entre otros, los siguientes estadísticos ya estudiados en 
estadística descriptiva que miden donde se concentra la distribución 
muestral, su variabilidad, como así también posiciones no centrales 
de dicha distribución. 
x = 
X1+X2+ … + Xn
n
 Media o promedio muestral 
x Mediana Muestral 
S2 = 
 X i− X 
2n
i=1
n−1
 Varianza muestral 
S = 𝑆2 Desviación estándar muestral 
K = Mín (X1, X2, ..., Xn) Mínimo de la muestra 
M = Máx (X1, X2, ..., Xn) Máximo de la muestra 
R = M – K Rango muestral 
Estadísticos de orden: 𝑋(𝑗 )
𝑛 j-ésima observación de la muestra 
ordenada (en orden creciente) j = 1, 2, …, n 
𝑋(1)
𝑛 ≤ 𝑋(2)
𝑛 ≤ 𝑋(3)
𝑛 ≤ … ≤ 𝑋(𝑛)
𝑛 
Obviamente 𝑋(1)
𝑛 = 𝐾 𝑋(𝑛)
𝑛 = 𝑀 
9.- EJEMPLO de la CONSTRUCCION DE LA 
DISTRIBUCION MUESTRAL DE UN ESTADISTICO 
(25/08)
Para ilustrar los conceptos, consideremos una 
población extremadamente sencilla (la que 
seguramente no daría origen a un problema de 
muestreo en la vida real) que nos permite deducir 
la distribución muestral de algunos estadísticos en 
forma completa sin tener que resolver un problema 
matemático complicado.
Las distribuciones muestrales pueden construirse 
empíricamente a partir de poblaciones finitas. Para 
ello se procede como sigue:
1.- De una población finita de tamaño N, se extraen 
al azar todas las muestras posibles de tamaño n.
2.-Se calcula el estadístico de interés para cada 
muestra.
3.-Se listan en una columna los distintos valores 
observados del estadístico, y en otra columna las 
frecuencias relativas correspondientes de cada 
valor observado.
Problema: Sea una urna con 100 bolillas de las cuales 20 están 
marcadas con el número uno, 30 con el dos y 50 con el tres. Se 
extraen dos bolillas al azar con reposición. Determine: 
a) Distribución de probabilidad, esperanza y varianza de la 
población. 
b) Distribución de probabilidad de la muestra. 
a) Distribución de probabilidad, esperanza y varianza de la 
media muestral y de la varianza muestral. 
Solución: a) Denominando X a la puntuación de la bolilla 
extraída, la distribución de probabilidad de X es 
x pX(x) 
1 0,2 
2 0,3 
3 0,5 
Calculamos su esperanza y varianza. E(X) =  = 2,3 V(X) = 2 
= 0,61 
a) Las posibles muestras seleccionadas al azar, con reposición y sus 
respectivas probabilidades fueron calculadas en el ejemplo del 
punto 4) Tabla A (Probabilidades Conjuntas de X1, X2) 
 
b) Veamos a continuación el valor de la media y la varianza para 
cada posible muestra: 
Muestra 
(x1, x2) 
x s2 
 P(X1= x1, 
X2= x2) 
(1,1) 1 0 0,04 
(1,2) 1,5 0,5 0,06 
(1,3) 2 2 0,10 
(2,1) 1,5 0,5 0,06 
(2,2) 2 0 0,09 
(2,3) 2,5 0,5 0,15 
(3,1) 2 2 0,10 
(3,2) 2,5 0,5 0,15 
(3,3) 3 0 0,25 
 
Por lo tanto las distribuciones de probabilidad de la media 
muestral y de la varianza muestral son: 
x P( X = x ) 
1 P{(1,1)} = 0,04 
1,5 P{(1,2), (2,1)}= 0,06 + 0,06 
= 0,12 
2 P{(1,3), (2,2), (3,1)}= 0,10 
+ 0,09 + 0,10 = 0,29 
2,5 P{(2,3), (3,2)}= 0,15 + 0,15 
=0,30 
3 P{(3,3)} = 0,25 
 
E(X ) = 1∙ 0,04 + 1,5 ∙ 0,12 + 2∙ 0,29 +2,5 ∙ 0,30 + 3 ∙ 0,25 = 2,3 
= E(X) 
E(X 2 ) = 12∙ 0,04 + 1,52 ∙ 0,12 + 22∙ 0,29 +2,52 ∙ 0,30 + 32 ∙ 0,25 = 
5,59 
V(X ) = 5,59 – 2,32 = 0,305 = 
σ2
n
 = 
0,61
2
 
s2 P(S
2 = s2) 
0 
P{(1,1), (2,2), (3,3)}= 
0,04+0,09+0,25 = 0,38 
0,5 
P{(1,2), (2,1), (2,3), (3,2)}= 0,06 + 
0,06 + 0,15 + 0,15 = 0,42 
2 P{(1,3), (3,1)}= 0,10 + 0,10 = 0,20 
 
E(S2) = 0∙ 0,38 + 0,5 ∙ 0,42 + 2∙ 0,20 = 0,61 = V(X) 
E(S2 ) = 02∙ 0,38 + 0,52 ∙ 0,42 + 22∙ 0,20 = 0,905 
V(S2) = 0,905 – 0,612 = 0,5329 
 
El problema central de la estadística inferencial consiste en utilizar 
la información disponible sobre distribuciones como las de X y S2 
del ejemplo, para emitir juicios respecto a (la distribución) de la 
población. 
Nótese que la distribución muestral de un estadístico depende de la 
distribución de la población, por supuesto de la fórmula definitoria 
del estadístico y del proceso de muestreo incluso el tamaño muestral. 
Si el muestreo hubiera sido sin reposición, las distribuciones podrían 
haber sido diferentes, por ejemplo. Estas consideraciones son válidas 
para la mayoría de las distribuciones muestrales. 
 El alumno debe tener en cuenta que en la realidad la población 
nunca es conocida en forma completa, no es razonable suponer que 
sea tan elemental como en el ejemplo. Además debe reconocer que 
en la mayoría de los casos útiles no es posible deducir la distribución 
muestral enumerando los casos, como hicimos en el ejemplo. 
10. MOMENTOS DE ALGUNAS DISTRIBUCIONES 
MUESTRALES 
Normalmente, para una distribución muestral, se tiene interés 
en conocer tres cosas: media, varianza y forma funcional. 
Es bien conocida la dificultad que existe para elaborar una 
distribución muestral de acuerdo al procedimiento anterior 
cuando la población es muy grande. También constituye un 
problema cuando la población es infinita. En este caso lo mejor 
que se puede hacer es aproximar la distribución del muestreo 
para el estadístico. 
Ambos problemas pueden evitarse por medio de la 
matemática 
El problema que tratamos es el siguiente: Sea X1, X2, … , Xn 
una muestra al azar de una variable aleatoria (población) X 
con distribución acumulada FX. Sea U = U (X1, X2, … , Xn) un 
estadístico, función solo de las observaciones muestrales (no 
depende de parámetros poblacionales, por ejemplo). 
Queremos encontrar momentos de U, esto es, momentos de 
la distribución muestral de U. Por ejemplo queremos saber que 
son 
 E(U), E[U – E(U)]2 = Var(U), etc.Consideramos algunos casos particulares: 
10.1 Para el Caso de Muestreo al Azar Con Reposición de 
una población X con E(X)= , Var(X) = 2 
Momentos de X 
1°) E(X ) = E(X) =  
Demostración: 
E(𝑋 ) = 𝐸 
𝑋1+𝑋2+ … + 𝑋𝑛
𝑛
 =
1
𝑛
𝐸 𝑋1 + 𝑋2 + … + 𝑋𝑛 =
 
1
𝑛
𝐸 𝑋1) + 𝐸(𝑋2) + … + 𝐸( 𝑋𝑛 =
1
𝑛
 𝑛 = 𝐸(𝑋) 
Notas: (1) La reposición o falta de ella no afecta este 
resultado, pues la clave está en la “linealidad de la esperanza 
matemática”. 
2°) V(X ) = 
V(X)
n
 = 
σ2
n
 pues las variables son X1, X2, … , Xn 
son independientes por ser el muestreo con reposición. 
Demostración: 
V(𝑋 ) = E [𝑋 - E(𝑋 )]2 = E [𝑋 –  ]2 = E 
 𝑋𝑖
𝑛
𝑖=1
𝑛
− 𝜇 
2
 = E 
 
 𝑋𝑖
𝑛
𝑖=1
𝑛
−
𝑛𝜇
𝑛
 
2
= E 
 𝑋𝑖
𝑛
𝑖=1
𝑛
−
 𝜇𝑛𝑖=1
𝑛
 
2
 
 = 
1
𝑛2
 E (𝑋𝑖
𝑛
𝑖=1 − 𝜇) 
2 
= 
1
𝑛2
 E (𝑋𝑖
𝑛
𝑖=1 − 𝜇) (𝑋𝑗
𝑛
𝑗=1 − 𝜇) 
= 
1
𝑛2
 E (𝑋𝑖
𝑛
𝑗=1 − 𝜇)
𝑛
𝑖=1 (𝑋𝑗 − 𝜇) 
= 
1
𝑛2
 𝐸 𝑋𝑖 − 𝜇 𝑋𝑗 − 𝜇 
𝑛
𝑗=1
𝑛
𝑖=1 
= 
1
𝑛2
 (𝑋𝑖
𝑛
𝑖=1 −𝜇)
2 + 𝐸 𝑋𝑖 − 𝜇 𝑋𝑗 − 𝜇 
𝑛
𝑗=1
𝑛
𝑖=1 
 iǂj 
 =
1
𝑛2
 𝑉 𝑋𝑖 
𝑛
𝑖=1 + 𝐶𝑜𝑣 (𝑋𝑖 ,𝑋𝑗 )
𝑛
𝑗=1
𝑛
𝑖=1 
𝐶𝑜𝑣 𝑋𝑖 ,𝑋𝑗 = 0 por ser las Xi independientes 
 iǂj 
 = 
1
𝑛2
 𝑛 𝜎2 = 
𝜎2
𝑛
 
 
Momentos de S2 
S2 = 
 X i− X 
2n
i=1
n−1
 
1°) E(S2 ) = 2 
2°) Si X es normal, V(S2) = 
2σ4
n−1
 
 
Momentos de S’2 S’2 = 
 X i− X 
2n
i=1
n
 
 1°) E(S’2 ) = 
n−1
n
 2 
2°) Si X es normal, V(S′2) = 
n−1
n
 
2σ4
n
 
10.2 Para el Caso de Muestreo “Simple al Azar” (Sin 
Reposición) de una Población Finita X 
Los momentos de estadísticos presentados, corresponden 
al caso en que se muestrea con reposición. Esto es 
equivalente a considerar una población infinitamente grande, 
en el sentido de que no se altera por la extracción de una 
muestra de tamaño n, finito. 
 Un caso distinto ocurre cuando la población es finita, de 
tamaño N, y extraemos una muestra al azar simple, esto es sin 
reposición. Ya vimos que en este caso las observaciones 
muestrales Xi siguen teniendo marginalmente la misma 
distribución que X, pero que son dependientes. En 
consecuencia cuando calculemos momentos es necesario 
tener en cuenta este hecho; por ejemplo el cálculo de la 
varianza de X que reproducimos más arriba, no es válido 
cuando las Xi no son independientes. 
Parámetros 
𝜇 = 𝐸 𝑋 = 
1
𝑁
 
 
𝑋𝑗
𝑁
𝑗=1 
𝜎2 = 𝑉 𝑋 = 
1
𝑁
 
 
(𝑋𝑗 − 𝜇)
2
= 𝐸 𝑋 − 𝐸(𝑋) 2𝑁𝑗=1
 
Momentos de X 
1°) E(X ) =  . Demostrado en 9.1 
2°) V(X ) = 
V(X)
n
 = 
σ2
n
 
N−n
N−1
 . 
El factor 
N−n
N−1
 es efecto de la dependencia y se llama factor 
de corrección por población finita (cpf) 
N−n
N−1
 puede omitirse cuando el tamaño de la muestra es 
pequeño en comparación con el tamaño de la población. 
Criterio: La mayoría de los estadísticos no utilizan el cpf a 
menos que la muestra contenga más del 5% de las 
observaciones de la población. 
O sea se ignora el cpf si 
n
N
 ≤ 0,05 
Ejemplo: Una muestra de tamaño 100 de una población de 
tamaño N= 100.000 unidades tiene la misma precisión que una 
muestra de tamaño 100 de una población de tamaño N = 
100.000.000 
n = 100, N = 100.000 
V(X )= 
σ2
n
 
100000−100
100000−1
 = 
99900
99999
 
σ2
n
 = 0,99900999 
σ2
n
 
 
n = 100, N = 100.000.000 
V(X )= 
σ2
n
 
100000000 −100
100000000 −1
 = 
99999900
99999999
 
σ2
n
 = 0,99900001 
σ2
n
 
Notaciones : 
Para el valor esperado de X : E(X ) o μX 
Para la varianza de X : V (X ) o σX 
 2 
 
DISTRIBUCION MUESTRAL DE ALGUNOS 
ESTADISTICOS 
11.- DISTRIBUCION MUESTRAL DE LA MEDIA 
MUESTRAL 𝑋 = 
𝑋1+𝑋2+ … + 𝑋𝑛
𝑛
 y/o del Total T= 𝑋1 + 𝑋2 +
 … + 𝑋𝑛 
Reconsideramos los teoremas estudiados en 
Combinaciones Lineales de variables aleatorias a la luz 
de la teoría de Muestreo. 
11.1 Muestreo de poblaciones normales (Teorema 13 
de Combinaciones Lineales) 
Sea X1, X2, … , Xn una muestra aleatoria de una 
población X con distribución normal con media  y 
varianza 2, entonces con cualquier tamaño de muestra 
n, 𝑋 está normalmente distribuida (con media  y 
varianza 2/n), al igual que el total T (con media n  y 
varianza n 2). Esto es 
𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋 
 2 = 
𝜎2
𝑛
 
T ~ N 𝜇𝑇 = 𝑛 𝜇 , 𝜎𝑇
 2 = 𝑛 𝜎2 
Ejemplo 𝑋 : La duración de cierto tipo de baterías está 
normalmente distribuida con media de 8 horas y desviación 
estándar de 1 hora. 
a) Si se escoge aleatoriamente una batería, ¿cuál es la 
probabilidad de que dure por lo menos 8,5 horas? 
b) Si las baterías se venden en paquetes de 4 baterías. ¿Cuál es 
la probabilidad de que la duración promedio de las 4 baterías, de 
un paquete seleccionado, sea por lo menos de 8,5 horas? 
Ejemplo T: Un elevador de carga grande puede transportar un 
máximo de 10.000 libras (5 toneladas). Suponga que una carga 
que contiene 45 cajas se debe transportar mediante el elevador. 
La experiencia ha demostrado que el peso X de una caja de este 
tipo de carga se ajusta a una distribución de probabilidad con una 
media de  = 200 libras y una desviación estándar de  = 55 
libras. ¿Qué probabilidad hay de que las 45 cajas se puedan 
cargar en el elevador de carga y transportarse simultáneamente? 
 
11.2 Muestreo de una población Bernoullí (Teoremas 
10 y 11 de Combinaciones Lineales) 
Sea X1, X2, … , Xn una muestra aleatoria de una 
población X con distribución Bernoullí entonces 
Distribución muestral del total de éxitos de la muestra 
T= 𝑋1 + 𝑋2 + … + 𝑋𝑛 ; T tiene distribución binomial con 
parámetros n y p, 
T representa el número de éxitos en la muestra de tamaño 
n 
 
Distribución Muestral de la Proporción Muestral PS 
𝑋 =
𝑇
𝑛
 =
𝑋1+𝑋2+ … + 𝑋𝑛
𝑛
 (=PS) tiene distribución binomial 
de proporciones 
PS representa la proporción de éxitos en la muestra 
Ejemplo: Se toma una muestra de 250 casas de una 
población de edificios antiguos para estimar la 
proporción de casas de este tipo. Supongamos que el 
30% de todos los edificios son antiguos. Hallar la 
probabilidad de que la proporción de edificios antiguos 
esté entre 0.25 y 0.35. 
n*p y n*q ambos ≥5 
E(PS)= p 
VAR(PS)= 
𝑝∗𝑞
𝑛
 
Factor de corrección por continuidad 
𝑃(𝑎 −
1
2 ∗ 𝑛
 ≤ 𝑃 ≤ 𝑏 +
1
2 ∗ 𝑛
) 
11.3 Muestreo de una población X de cualquier 
forma funcional (Teorema Central del Límite) 
Dada una población X de cualquier forma funcional con 
una media  y varianza 2 finita y sea X1, X2, … , Xn 
una muestra aleatoria de esa población. Si n es 
suficientemente grande 𝑋 tiene aproximadamente 
distribución Normal. Esto es 
Si n es grande, 𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋 
 2 = 
𝜎2
𝑛
 
¿Qué tan grande debe ser la muestra para que el TCL 
sea aplicable? 
Regla empírica: En la mayoría de las aplicaciones 
prácticas una muestra de tamaño 30 es suficiente. 
En general, la aproximación a la normalidad de 𝑋 mejora 
a medida que crece el tamaño de la muestra. 
12.- Distribución Muestral de la diferencia entre dos 
medias muestrales 𝑿 − 𝒀 
Si se extraen al azar muestras independientes de 
tamaños n1 y n2 de dos poblaciones, discretas o 
continuas, con medias μ1 y μ2 y varianzas σ12 y σ22, 
respectivamente, entonces la distribución muestral de 
las diferencias de las medias muestrales 𝐗 − 𝐘 , tendrá 
las siguientes propiedades: 
1°) 𝜇𝑋 −𝑌 = E(𝑋 − 𝑌 )= E(𝑋 ) − 𝐸(𝑌 )= μ1 —μ2 
 𝜎𝑋 −𝑌 
2 = 𝑉 𝑋 − 𝑌 = 𝑉 𝑋 ) + 𝑉(𝑌 = 
𝜎1
2
𝑛1
+ 
𝜎2
2
𝑛2
 
2°) Si ambas poblaciones son normales, 
X ~ N(μ1, σ12) e Y ~ N(μ2 , σ22 ) 
Entonces 𝑋 ~ N 𝜇1 ,
𝜎1
2
𝑛1
 e 𝑌 ~ N 𝜇2 ,
𝜎2
2
𝑛2
 
Luego 𝑋 − 𝑌 ~ N 𝜇1 —𝜇2 ,
𝜎1
2
𝑛1
+ 
𝜎2
2
𝑛2Entonces la diferencia tiene una distribución normal exacta 
sin importar los tamaños de las muestras n1 y n2. 
3°) Si las poblaciones no son normales, entonces si n1 y n2 
son suficientemente grandes 
𝑋 − 𝑌 ~ aproximadamente N 𝜇1 —𝜇2 ,
𝜎1
2
𝑛1
+ 
𝜎2
2
𝑛2
 si n1 ≥ 
30 y n2 ≥ 30 
Teorema : Si se extraen al azar muestras independientes de 
tamaños n1 y n2 de dos poblaciones, discretas o continuas, 
con medias μ1 y μ2 y varianzas σ12 y σ22, respectivamente, 
entonces la distribución muestral de las diferencias de las 
medias muestrales , está distribuida aproximadamente de 
forma normal con media y varianzas dadas por 
E(𝑋 − 𝑌 )= μ1 —μ2 ; 𝑉 𝑋 − 𝑌 = 
𝜎1
2
𝑛1
+ 
𝜎2
2
𝑛2
 
De aquí 𝑍 = 
 𝑋 −𝑌 −(𝜇1 —𝜇2) 
 𝜎1
2 𝑛1 +𝜎2
2 𝑛2 
 es aproximadamente una 
variable normal estándar. 
•Si n1 y n2 son mayores o iguales a 30, la aproximación 
normal para la diferencia de 𝑋 − 𝑌 es muy buena sin 
importar las formas de las dos poblaciones. Sin embargo, 
aun cuando n1 y n2 sean menores que 30, la 
aproximación normal es razonablemente buena excepto 
cuando las dos poblaciones no son definitivamente 
normales. 
•Por supuesto, si ambas poblaciones son normales, 
entonces la diferencia 𝑋 − 𝑌 tiene una distribución 
normal exacta sin importar los tamaños de las muestras 
n1 y n2. 
Ejemplo: En una población de bovinos de la sierra 
central, la producción de leche promedio es de 12 litros 
con una desviación estándar de 4 litros. 
En otra población de bovinos de la sierra sur la 
producción promedio es de 10 litros con una desviación 
estándar de 3 litros. Si se obtiene una muestra aleatoria 
simple de 24 bovinos de la sierra central y otra de 30 de 
la sierra sur ¿cuál es la probabilidad de que la media 
muestral para la muestra aleatoria de la sierra central 
exceda a la de la sierra sur en más de 2 litros. 
13.- Distribución Muestral de la Varianza muestral S2 
Sea X1, X2, … , Xn una muestra aleatoria de una 
población X con distribución normal con media  y 
varianza 2 y sea S2 la varianza muestral 
S2 = 
 X i− X 
2n
i=1
n−1
 
Entonces se tiene lo siguiente 
a) E(S2 ) = 2 
b) Si 𝑋 ~ 𝑁(𝜇,𝜎2), entonces 
 𝑛−1 𝑆2
𝜎2
 tiene una 
distribución chi- cuadrado con n – 1 grados de libertad y 
V(S2) = 
2𝜎4
𝑛−1
 
Demostración 
a) 𝑋𝑖 − 𝑋 
2 = 𝑋𝑖 − 𝜇 + 𝜇 − 𝑋 
2 =𝑛𝑖=1
𝑛
𝑖=1
 [ 𝑋𝑖 − 𝜇 + 𝜇 − 𝑋 ]
2 𝑛𝑖=1 
 
= (𝑋𝑖 − 𝜇)
2 + 2(𝑋𝑖 − 𝜇) 𝜇 − 𝑋 + 𝜇 − 𝑋 
2 𝑛𝑖=1 
 
= (𝑋𝑖 − 𝜇)
2𝑛
𝑖=1 + 2 𝜇 − 𝑋 𝑋𝑖 − 𝜇 + 𝜇 −
𝑛
𝑖=1
𝑛
𝑖=1
𝑋 2 
 
= (𝑋𝑖 − 𝜇)
2𝑛
𝑖=1 + 2 𝜇 − 𝑋 𝑛 𝑋 − 𝜇 +n 𝑋 − 𝜇 
2 
 = (𝑋𝑖 − 𝜇)
2𝑛
𝑖=1 − 𝑛 𝑋 − 𝜇 
2 
Entonces 
𝐸 𝑆2 = 𝐸 
 X i− X 
2n
i=1
n−1
 = 
1
𝑛−1
𝐸 𝑋𝑖 − 𝜇 
2𝑛
𝑖=1 −
𝑛 𝑋 − 𝜇 2 
=
1
𝑛−1
 𝐸 𝑋𝑖 − 𝜇 
2𝑛
𝑖=1 − 𝑛 𝐸 𝑋 − 𝜇 
2 
=
1
𝑛−1
 𝑉 𝑋𝑖 
𝑛
𝑖=1 − 𝑛 𝑉 𝑋 
= 
1
𝑛−1
 𝑛𝜎2 − 𝑛
𝜎2
𝑛
 
= 
𝑛−1
𝑛−1
𝜎2 
= 𝜎2 
Ejemplo: 
El tiempo que ocupan los estudiantes mirando televisión 
en las semanas anteriores a los exámenes finales (en horas) 
tiene una distribución normal con desvió estándar de 4,5 
hs. Se tomó una muestra de 30 estudiantes: 
Indique si la probabilidad de que el desvío estándar 
muestral supere las 3,5 hs es mayor a 0,95. 
14.- Distribución Muestral de la razón de 2 varianzas 
muestrales 𝑺𝟏
𝟐 𝑺𝟐
𝟐 
 Un problema que surge en los experimentos 
industriales es comparar la variabilidad de dos procesos 
𝜎1
2 𝜎2
2 
Se toma una muestra al azar con reposición de n1 
artículos, usando el proceso X y se toma una muestra 
aleatoria de n2 artículos, usando el proceso Y. se 
comparan las varianzas muestrales para cada proceso, 
o sea 𝑆1
2 𝑆2
2 . Si esta razón es cercana a la unidad, las 
variabilidades se juzgan como casi equivalentes; si esta 
razón es muy diferente a la unidad, las variabilidades se 
juzgan como no equivalentes. Para tomar buenas 
decisiones y para cuantificar la expresión de “cercana a 
la unidad”, es necesario examinar la distribución de 
𝑆1
2 𝑆2
2 
Sea 𝑋1 , 𝑋2 ,… ,𝑋𝑛1 una muestra aleatoria de n1 v. a. 
independientes de una población normal X ~ N(μ1, σ12) y 
sea 𝑌1 , 𝑌2 ,… ,𝑌𝑛2 una muestra aleatoria de n2 v. a. 
independientes de una población normal Y ~ N(μ2 , σ22 ); 
además sean todas las X’s e Y´s independientes.χ1 
 
La distribución de 𝜒1
2 =
 𝑛1−1 𝑆1
2
𝜎1
2 es entonces chi- 
cuadrado con n1 – 1 grados de libertad. 
De modo similar 𝜒2
2 =
 𝑛2−1 𝑆2
2
𝜎2
2 es también chi- cuadrado 
con n2 – 1 grados de libertad. 
Además estas dos variables 𝜒1
2 y 𝜒2
2 son 
independientes porque las X’s y las Y´s lo son. 
Entonces la variable aleatoria 
𝐹 =
𝜒1
2 
 𝑛1−1 
 
𝜒2
2
 𝑛2−1 
 
=
 𝑛1−1 𝑆1
2
𝜎1
2 𝑛1−1 
 𝑛2−1 𝑆2
2
𝜎2
2 𝑛2−1 
= 
𝑆1
2
𝜎1
2
𝑆2
2
𝜎2
2
 tiene una 
distribución F con n1 – 1 y n2 – 1 grados de libertad. 
• BIBLIOGRAFÍA: ELEMENTOS DE LA TEORIA DEL 
MUESTREO (Versión Preliminar)- Dr. Raúl 
Pedro MENTZ - Instituto de Investigaciones 
Estadísticas (INIE) - Universidad Nacional de 
Tucumán