Logo Studenta

UNIDAD 05-TEORÍA

¡Estudia con miles de materiales!

Vista previa del material en texto

1 
 
 
 UNIDAD N° 05 
 Muestreo y Estimación Puntual e Intervalar 
 
1.-Muestreo de una población 
En muchos casos, el muestreo es la única forma de determinar alguna característica acerca 
de la población. Existen diversas razones por las cuales el muestreo se hace necesario, entre 
ellas: 
a) La imposibilidad física, en algunos casos, de revisar todos los integrantes de la 
población. 
b) Es posible que resulte prohibitivo el costo de estudiar a todos los elementos de la 
población. 
c) Puede resultar imposible localizar o revisar todos los elementos de la población. 
d) Los resultados de una muestra pueden dar una estimación adecuada del parámetro de la 
población, lo que permite ahorrar tiempo y dinero. 
 
2.- Métodos de muestreo probabilísticos y no probabilísticos 
Para obtener muestra de una población determinada, existen distintos métodos .Ellos 
pueden ser: 
 Probabilístico 
Cuando cada una de las unidades de análisis, pertenecientes a la población en estudio, tiene 
una probabilidad conocida (pero distinta de cero) de ser incluida en la muestra. En este 
caso, se dice que es un muestreo representativo.. 
No existe un método que sea “el mejor” para tomar una muestra probabilística de una 
población .Entre los distintos tipos de muestreo probabilístico , el más utilizado es el 
muestreo aleatorio simple .En este tipo de muestro, cada integrante de la población tiene la 
misma probabilidad de quedar incluido en la muestra . 
 No probabilístico 
 
2 
 
 
Cuando no todas las unidades de análisis de la población tienen la posibilidad de 
pertenecer a la muestra. El muestreo no probabilístico puede ser: 
a) Intencional: Se busca, con intención, al sujeto con determinadas características. 
b) Autogenerado: La elección de uno de los sujetos me lleva o induce a otro que tenga las 
mismas características. 
c) Accidental: Se toma la muestra, en un determinado tiempo y espacio. Ello no puede 
asegurar que toda la población pueda registrarse en dicho momento seleccionado. 
 
Nota: Con el muestreo no probabilístico, no se pueden realizar inferencias o conjeturas 
acerca de la población correspondiente ya que la muestra no es representativa de dicha 
población. 
 
3.-Error de muestreo 
Aún cuando se emplean métodos de muestreo probabilístico, es poco probable que la media 
muestral coincida con la correspondiente poblacional, al igual que la desviación estándar o 
cualquier otra medida calculada desde la muestra. 
Dicha diferencia, entre un valor estadístico de muestra y su parámetro de población 
correspondiente, se la llama error de muestreo. 
 
4.-Distribución de muestreo de medias muestrales 
Es una distribución de probabilidades que consta de todas las medias muestrales posibles y 
sus probabilidades de ocurrencia. 
Ejemplo: Si una población consta de los valores: 3,7,9,15 para una determinada 
característica de la misma , la media es 𝜇 = 8,5. 
Veamos ahora la distribución de muestreo de medias para una muestra de tamaño 2. 
Para ello, calculamos el número total de muestras posibles, de tamaño 2, y sin reposición, 
mediante la fórmula: NCn .Entonces 4C2=
!
!. !
= 6 
3 
 
Se tiene entonces 6 muestras, donde a cada una le corresponde un valor de la media 
muestral: 
 
Muestra �̅� 
(3,7) 5 
(3,9) 6 
(3,15) 9 
(7,9) 8 
(7,15) 11 
(9,15) 12 
 
Distribución de muestreo de las medias para n=2 
 
Media muestral(𝑋 ) Número de medias Probabilidad 
 5 1 1/6 
 6 1 1/6 
 9 1 1/6 
 8 1 1/6 
 11 1 1/6 
 12 1 1/6 
 6 1 
 
E(𝑋) = ( �̅� + �̅� + ⋯ … . +�̅� ) = 8,5. Es decir que se verifica: E(𝑋) = 𝜇. Lo que 
significa que la 𝑋 es un buen estimador de 𝜇. La distribución de 𝑋 tiene media 𝜇 ̅=8,5 y 
desviación estándar 𝜎 ̅= 2,5 
De este modo 𝑋 es una variable aleatoria que tiene una función de densidad asociada con 
parámetros 𝜇 ̅=8,5 y desviación estándar 𝜎 ̅ = 2,5 
 
Notas: 
a) El que E(𝑋) = 𝜇 significa que 𝑋 es un estimador insesgado de 𝜇. Este resultado, se 
puede probar, en general ,como sigue: 
E(𝑋) = 𝐸
∑
= 𝐸(∑ 𝑋 )= ∑ 𝐸(𝑋 ) = .(𝜇 + 𝜇 + ⋯ … … + 𝜇) = . 𝑛. 𝜇 = 𝜇 
Donde la segunda y tercera igualdad, se cumplen, por ser propiedades de la Esperanza. 
b)Que un estimador sea consistente significa que, cuando n se hace suficientemente grande 
(n→ ∞), éste se asemeja mucho al correspondiente parámetro. 
c) Que un estimador insesgado sea eficiente significa que tiene la menor varianza posible. 
d) Que un estimador sea suficiente significa que contiene la suficiente cantidad de 
información de la distribución. Por ejemplo, 𝑋es un estimador suficiente ya que involucra a 
todos los datos. 
 
4 
 
4.-El Teorema Central del Límite 
Este teorema establece que para muestras aleatorias grandes, la forma de La distribución de 
medias muestrales se acerca a la de la distribución del tipo normal Esa aproximación 
aumenta conforme lo hace el tamaño de las muestras. 
De este Teorema se desprende lo siguiente: 
 Si la población está distribuida normalmente, entonces para cualquier tamaño de la 
muestra también lo estará. 
 Si la población está distribuida de cualquier otra forma, por ejemplo en forma 
sesgada o tiene extremos significativos, entonces la convergencia hacia una 
distribución normal es suficiente con que el tamaño de las muestras sea (según la 
mayoría de los estadísticos) de al menos 30. 
. 
5.- La Media Muestral y el Error Estándar de la Media Muestral. 
El Teorema Central del Límite no hace mención acerca de la dispersión de la distribución 
de medias muestrales o respecto de alguna comparación entre el valor medio de las medias 
muestrales y el de la población. Sin embargo, se puede concluir que: 
 La media de la distribución muestral es exactamente igual a la media poblacional, 
siempre que se pueden seleccionar todas las muestras posibles de un determinado 
tamaño. Aún, si no se tomaran todas las muestras se puede esperar que la media de 
la distribución de la media muestral que sea cercana a la media poblacional. 
 Si la población original se distribuye normalmente y la desviación estándar de la 
población es 𝜎, se puede demostrar que el error estándar de la media V(𝑋) = 𝜎 ̅ 
cumple lo siguiente : 𝜎 ̅ =
√
 donde n es el tamaño de la muestra. En consecuencia 
habrá menos dispersión en la distribución muestral que en la poblacional, más aún, 
la primera es inversamente proporcional al tamaño n. 
 Si la población original no se distribuye normalmente y la desviación estándar de 
la población es 𝜎 y el tamaño de la muestra es suficientemente grande, entonces la 
distribución de 𝑋 es aproximadamente normal con media µ y desvío estándar 
√
. . 
 
6.- Uso de la distribución de muestreo de la media muestral 
1.-Hemos visto que si X es una variable aleatoria tal que X~N(µ,σ), la probabilidad de 
cualquier valor , se realiza estandarizando: 
X~N(µ,σ) → 𝑍 = ~𝑁(0,1) 
5 
 
Sin embargo, la mayor parte de las decisiones se basan en muestras y no sólo en una 
observación. Por esto interesa la distribución de 𝑋, la media muestral y no la de X, el valor 
de una observación. Por consiguiente, para encontrar la probabilidadde que un valor 
muestral esté en un determinado intervalo, se utiliza la fórmula similar a la anterior , 
reemplazando X por 𝑋 y σ por 
√
 .Esto es : z=
√
.. 
2.- Hay muchas situaciones , en las que no se sabe mucho acerca de la población. La 
potencia del Teorema Central del Límite, ayuda, en el sentido que: cualquiera sea la forma 
de la distribución de la población, si se toma una muestra suficientemente grande , la 
distribución muestral seguirá la distribución normal( al menos n= 30 ). 
3.- Con frecuencia se desconoce la desviación estándar poblacional. Si n ≥30 , ésta se 
estima con la desviación estándar muestral. Por consiguiente, para encontrar la probabilidad 
de que un valor muestral esté en un determinado intervalo, se utiliza la fórmula similar a la 
anterior , reemplazando X por 𝑋 y σ por 
√
 .Esto es : z=
√
. 
 
7.- Consideraciones sobre estimación de parámetros poblacionales de manera puntual 
o por intervalos de confianza. 
 Una estimación puntual es un valor del estadístico que se usa para estimar un valor 
poblacional. 
Por ejemplo, la media muestral �̅� es una estimación puntual de la media 
poblacional 𝜇, p una proporción muestral que es una estimación puntual de 𝜋, s la 
desviación estándar muestral es una estimación puntual de 𝜎. 
Una estimación puntual no da mucha información, no se sabe qué tan cerca está del 
verdadero valor poblacional. 
 La estimación por intervalos de confianza, proporciona un conjunto de valores 
obtenidos a partir de los de una muestra, en el que el coeficiente o nivel de 
confianza nos provee un intervalo que cubre el parámetro. 
El coeficiente de confianza se interpreta como que, si se extraen reiteradas muestras 
todas de igual tamaño y ,para cada una de ellas se construyen intervalos de 
confianza , es de esperar que el (1-𝛼).100% de estos intervalos cubran al verdadero 
valor del parámetro. 
Los valores más comunes de 𝛼 son 0.10, 0.05 y 0.01 para el 90%, 95% y 99% de 
confianza respectivamente. 
 
 
6 
 
 8.-Estimación por intervalos 
 
La estimación puntual no da mucha información. Como se espera que la estimación puntual 
esté cerca del parámetro poblacional, sería deseable saber qué tan cerca está en realidad. El 
intervalo de confianza cumple este propósito. 
A continuación se muestra cómo se obtiene un intervalo de confianza para la media 
poblacional. 
 
8.1- Intervalos de confianza en poblaciones normales para la media poblacional 
 
Primer Caso: La muestra es extraída de una población normal con varianza conocida. 
Sabemos que si X es una variable aleatoria con distribución normal: X ~𝑁(𝜇, 𝜎), entonces 
𝑋 se distribuye como 𝑁 𝜇,
√
 . Por lo tanto, Z= 
√
 se distribuye normalmente como 
𝑁(0,1). 
De aquí que, si P(−𝑧 / <
√
< 𝑧 / )=1 − 𝛼, entonces P(𝑋−𝑧 / .
√
< 𝜇 <
 𝑋+𝑧 / .
√
) = 1 − 𝛼 nos da un intervalo de confianza para la media poblacional 𝜇, con 
varianza conocida 𝜎 y al nivel 1 − 𝛼, sustituyendo 𝑋 por el valor observado �̅� : 
 �̅�−𝑧 / .
√
, �̅�+𝑧 / .
√
 
Segundo Caso: La muestra es extraída de una población normal con varianza desconocida 
( n ≥30). 
Sabemos que si X es una variable aleatoria con distribución normal: X ~𝑁(𝜇, 𝜎), entonces 
𝑋 se distribuye como 𝑁 𝜇,
√
 . Pero, si no se conoce 𝜎 y n ≥30, la variable aleatoria 
Z= 
√
 también sigue una distribución normal. 
De aquí que, en el intervalo de confianza anterior, solamente cabe sustituir σ por s. O sea: 
 �̅�−𝑧 / .
√
, �̅�+𝑧 / .
√
 
 
7 
 
Tercer Caso: La muestra es extraída de una población normal con varianza desconocida 
( n <30). 
 
Sabemos que si X es una variable aleatoria con distribución normal: X ~𝑁(𝜇, 𝜎), entonces 
𝑋 se distribuye como 𝑁 𝜇,
√
 . Pero, si no se conoce 𝜎 y n <30 , la variable aleatoria 
T= 
√
 se distribuye como t de Student con (𝑛 − 1) g.l. 
De aquí que, si P(−𝑡 , / <
√
< 𝑡 , / )=1 − 𝛼, entonces P(𝑋−𝑡 , / .
√
< 𝜇 <
 𝑋−𝑡 , / .
√
) = 1 − 𝛼 nos da un intervalo de confianza para la media poblacional 𝜇, 
con varianza desconocida 𝜎 y al nivel 1 − 𝛼, sustituyendo 𝑋 por el valor observado �̅� : 
 �̅�−𝑡 , / .
√
, �̅�+𝑡 , / .
√
 
 
Ejemplo: 
Encontrar un intervalo al 95% de confianza para la resistencia a la ruptura de cables, 
suponiendo normalidad y usando una muestra de 20 valores de resistencias a la ruptura con 
media 114,208 kg y desviación típica 9,534 kg. 
 I= 114,208−𝑡 ; , .
,
√
, 114,208 + 𝑡 ; , .
,
√
 
. 
Observación: 
Hemos focalizado la construcción de intervalos de confianza para el parámetro poblacional: 
µ. Se pueden obtener, bajo ciertas condiciones, intervalos de confianza para otros 
parámetros poblacionales. 
 
8.2-Mínimo tamaño muestral 
Un problema muy relacionado con la construcción de intervalos de confianza es el de 
determinar el mínimo tamaño muestral que necesitamos para que nuestra estimación tenga 
una determinada precisión, es decir, cuántos elementos tenemos que observar para que el 
error cometido con la estimación no supere cierta cantidad. 
8 
 
Definición: El error de una estimación por intervalos de confianza (al nivel 1 - ∝) es la 
semi-amplitud del intervalo obtenido. 
 
 Ejemplo: 
¿Cuál debe ser el mínimo tamaño de una muestra aleatoria de una población N( µ, 5), para 
que el error de la estimación no sea superior a 0,5 ( con un nivel de confianza del 95%). 
En este caso, lo que se pretende, es estimar µ mediante un intervalo de confianza de la 
forma: 
 �̅�−𝑧 / .
√
, �̅�+𝑧 / .
√
 
Como se acaba de indicar, el error de la estimación es 𝑧 / .
√
 y, por tanto, lo que queremos 
encontrar es el mínimo valor de n, que verifique: 
 𝑧 / .
√
≤ 0,5 
Donde para σ=5 y 𝑧 / = 𝑧 , = 1,96. Sustituyendo y despejando n, se obtiene que 
n≥ 384,16. Es decir, necesitaríamos observar 385 elementos para conseguir la precisión 
deseada para esa estimación

Continuar navegando

Materiales relacionados