Logo Studenta

DistribuciÃn de muestreo presentacion 2 - Aleja Gomez

¡Este material tiene más páginas!

Vista previa del material en texto

Distribución de muestreo
Describe las características de los valores de los promedios de las muestras aleatorias seleccionadas de una población con promedio µ y desviación estándar σ.
También describen las características de las proporciones de las muestras tomadas de una población con proporción p. 
Para conocer en detalle la distribución de promedios muestrales consideremos una población de N = 6 datos, de la cual seleccionamos muestras de tamaño n = 3
La población podríamos considerarla como las edades de 6 personas.
A = 25
B = 32			La media y la desviación poblacionales valen
C= 34			µ =39,8333
D= 40			σ = 11,4661
E = 48
F = 60
De los 6 datos tomamos muestras de n = 3
Resultan en total 20 muestras
	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20
	25	25	25	25	25	25	25	25	25	25	32	32	32	32	32	32	34	34	34	40
	32	32	32	32	34	34	34	40	40	48	34	34	34	40	40	48	40	40	48	48
	34	40	48	60	40	48	60	48	60	60	40	48	60	48	60	60	48	60	60	60
Los promedios de todas las muestras se presentan en la parte inferior de la tabla(color rojo)
	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20
	25	25	25	25	25	25	25	25	25	25	32	32	32	32	32	32	34	34	34	40
	32	32	32	32	34	34	34	40	40	48	34	34	34	40	40	48	40	40	48	48
	34	40	48	60	40	48	60	48	60	60	40	48	60	48	60	60	48	60	60	60
	30,33	32,33	35,00	39,00	33,00	35,67	39,67	37,67	41,67	44,33	35,33	38,00	42,00	40,00	44,00	46,67	40,67	44,67	47,33	49,33
Al calcular el promedio de todos los promedios tomados de una población, obtenemos: 39,833
Este valor coincide con el promedio de la población. Y realmente no es una coincidencia. Es una propiedad de la media.
Esto quiere decir que el promedio de promedios es siempre igual a la media de la población. Ambas se expresarán con el símbolo µ.
µ, entonces tiene dos interpretaciones: Media de una población o Media de los promedios tomados de una población,
Error estándar de la media
Al calcular la desviación estándar de todos los promedios muestrales obtenemos un valor de 5,128
La desviación estándar de los promedios es menor que la desviación estándar de la población. Recuerde que la de la población es σ = 11,466
El valor de la desviación estándar de promedios, o también llamada Error estándar de la media:
Esta fórmula se puede reducir cuando el tamaño de la muestra sea menos del 5% de la población. En dicho caso la expresión quedaría:
Al realizar los cálculos para el ejemplo de las edades ya presentado, obtenemos:
σ = 11,466
N = 6
n = 3
Este dato es igual al que se obtuvo calculando la desviación estándar de todos los promedios de las muestras
Forma de la distribución de promedios muestrales
La forma de la curva o la distribución de promedios muestrales se obtiene del TEOREMA DE LIMITE CENTRAL.
El teorema tiene dos partes:
1. Si de una población con distribución normal se seleccionan muestras de tamaño n (cualquier valor), la forma de la distribución de los promedios de dichas muestras será normal.
2. Si de una población cualquiera, se seleccionan muestras de tamaño n, la distribución de los promedios de dichas muestras será normal , siempre que el tamaño de la muestra sea suficientemente grande (n ≥30).
Es decir, si la población es normal la distribución de promedios será normal sin importar el tamaño de la muestra, pero, si la población no es norma (o no sabemos cómo es), la distribución será normal cuando el tamaño de la muestra sea de al menos 30 elementos.
Distribución de proporciones muestrales
Dada una población con proporción p, la distribución de las proporciones de las muestras tomadas de la población anterior se distribuyen normal, siempre que el tamaño de la muestra se suficientemente grande
Si p está muy cerca de 0 o de 1 se debe usar el modelo binomial.
Si los productos np y el producto nq son ambos mayores a 5 se puede usar el modelo normal y en ese caso la media de la distribución es p, mientras que la desviación estándar es 
Nota. El símbolo q representa la probabilidad complementaria de p. Así cuando p = 0,25 entonces q = 1 – p = 0,75
Ejemplo 1:
La distribución de los gastos diarios en transporte es aproximadamente normal con un promedio de 120 (miles de pesos) y una desviación estándar de 25 (miles de pesos). 
a. Cuál es la probabilidad de que un día cualquiera los gastos superen los $150.000?
b. Cuál es la probabilidad de que al seleccionar una muestra de 18 días, los gastos estén por encima de $140.000? 
En la pregunta (a) se requiere hallar la probabilidad de gasto de un día. Como la curva es normal, según lo indica el enunciado, entonces
P(x > 150). 
Para poder hallar el área o la probabilidad normal debemos usar la tabla de distribución normal, pero, previamente debemos tener el valor de z para la x del ejercicio.
Como ya lo estudiamos 
Según la tabla normal el área de cola para z = 1,2 es igual a 0,1151
El literal (b) ya no pregunta por la probabilidad del gasto de un día, sino por la probabilidad del promedio de gasto en 18 días. Ya no podemos trabajar con la variable x, sino con la variable 
Como la población es normal (dato del problema) la distribución de los promedios muestrales también será normal no importa el tamaño de la muestra. Teorema del límite central parte a
El valor de z para promedios muestrales es:
 
En donde es el promedio en donde empieza el sombreado. µ es la media de la distribución de promedios (igual a la media poblacional) y σ es la desviación estándar poblacional
El área de cola superior para z = 3,39 se puede aproximar a 0 ya que la z es mayor que 3.
Ejemplo 2:
La distribución de los salarios en una población presentan un promedio de 850 (miles de pesos) y una desviación estándar de 210 (miles de pesos).
a. Cuál es la probabilidad de que al seleccionar al azar una persona, su salario sea inferior a $750.000
b. Cuál es la probabilidad de que al seleccionar al azar a 30 personas, su salario promedio sea inferior a $750.000 
El valor de z para promedios se obtiene usando la expresión:
El literal (a) pide probabilidad de un valor x (o menos), pero el problema no indica la forma de la distribución de x. Por ninguna parte dice que es normal.. Por lo tanto no es posible resolver el ejercicio hasta conocer la forma de la distribución. 
El literal (b) pide la probabilidad de un promedio (o menos). Sin embargo aunque el problema no señala la forma de la distribución de la variable , el teorema del límite central dice en su parte b, que si la muestra es 30 o más la forma de la distribución de los promedios será normal no importa como sea la población.
Usaremos, entonces la curva normal de promedios.
 		
La probabilidad de que z sea menor o igual a -2,61 es 0,0045
La probabilidad de que el promedio de salario en una muestra de 30 personas sea menor a $750000 es 0,0045
Ejemplo 3:
El 30% de los estudiantes tiene crédito ICETEX. Cuál es la probabilidad de que en una muestra de 120 estudiantes menos de 50 tengan crédito ICETEX?
La pregunta corresponde a la probabilidad de una proporción. 
El valor de p = 0,3
q = 0,7
N = 120
np= 120(0,3) = 36
nq = 120(0,7) = 84. Como ambos productos son mayores que 5, se puede usar la normal para describir la distribución de proporciones. 
Como se necesita la media y la desviación estándar, sus valores son:
µ = p = 0,3; σ =

Más contenidos de este tema