Logo Studenta

10_Muestras Aleatorias (repaso)

¡Este material tiene más páginas!

Vista previa del material en texto

Estadística
Prof.Laura Lanzarini
Estadística
 La estadística proporciona métodos para 
organizar y resumir datos. 
 Ej: utilizando medidas generales como el valor 
medio, la mediana y la desviación estándar.
 También para sacar conclusiones a partir 
de la información que contienen.
 Ej: A partir de las pruebas realizadas en 
pacientes a los que se les aplicó cierta droga 
puede estimarse si hubo mejora en su salud o 
no.
Prof.Laura Lanzarini
Población y muestra
Por cuestiones prácticas se 
trabaja con una muestra
(un subconjunto de la 
población)
MUESTRAPOBLACION
Prof.Laura Lanzarini
Ramas de la Estadística
 Estadística Descriptiva
 Se dedica a los métodos de recolección, 
descripción, visualización y resumen de los 
datos.
 Inferencia Estadística
 Se dedica a la generación de los modelos, 
inferencias y predicciones asociadas a los 
fenómenos en cuestión teniendo en cuenta 
la aleatoriedad de las observaciones. 
Prof.Laura Lanzarini
Estadística Descriptiva
 Medidas de Resumen Numéricas
 Media y Mediana
 Cuartiles
 Medidas de dispersión
 Representaciones gráficas
 Diagramas de caja.
 Histograma.
Prof.Laura Lanzarini
Media Muestral
 La media muestral x de un conjunto de 
observaciones x1, x2, … , xn está dada por
n
x
n
xxx
x
n
i
i
n



 121
...
Prof.Laura Lanzarini
Media Muestral
Alumno Nota
Angioni Formia, Bruno Gabriel (bgangioni) 8.75
Aparicio, Ivan Agustin (in5f480) 9.00
Apezteguia, Matias (matiasap) 8.25
Archuby, Federico (archu) 9.00
… …
Trujillo, Leticia Vanesa (trulet05p) 9.25
Vallejos, Fernando (yabran) 9.00
n
x
X
n
i
i
 1
Prof.Laura Lanzarini
Media Muestral
8.1571
1571.81 


n
x
X
n
i
i
(medida de resumen numérica)
Prof.Laura Lanzarini
Mediana
 Ordenar las muestras de menor a mayor y 
tomar como valor para la mediana 
 El valor del medio de la lista si la 
cantidad de elementos es impar.
 El promedio de los valores centrales si 
la cantidad de elementos de la lista es 
par.
x~
Prof.Laura Lanzarini
Mediana
Nota # Orden
5,5 1
… …
8,25 52
8,25 53
8,25 54
… …
10 105
Ordenar las 
notas de menor 
a mayor y tomar 
la nota del que 
está al medio
25,8~ x
Prof.Laura Lanzarini
Cuartiles
 La mediana divide al conjunto de datos en 
dos partes iguales.
 Los cuartiles dividen los datos en 4 
partes con la misma cantidad de valores
7.25 9
8.25
Prof.Laura Lanzarini
Medidas en Excel
Medidas numéricas Valor Función Excel
Media 8,1571 =AVERAGE(B2:B106)
Mediana 8,25 =MEDIAN(B2:B106)
Primer Cuartil 7,25 =QUARTILE(B2:B106; 1)
Segundo Cuartil 8,25 =QUARTILE(B2:B106; 2)
Tercer Cuartil 9 =QUARTILE(B2:B106; 3)
Prof.Laura Lanzarini


n
i
x
1
Medidas de Dispersión
 Suma de las desviaciones



n
i
i xx
1
)( 

n
i
ix
1
xn .
Prof.Laura Lanzarini
Medidas de Dispersión
 Suma de las desviaciones



n
i
i xx
1
)( 

n
i
ix
1
xn .


n
i
ix
n 1
1
0
¿Cómo cambiar las desviaciones a cantidades 
no negativas?
Medidas de Dispersión
 Opción 1  Opción 2
 ¿Cómo cambiar las desviaciones a 
cantidades no negativas?
n
xx
n
i



1
||
n
xx
n
i



1
2)(
La función valor absoluto tiene alguna dificultades 
teóricas entonces usamos esta
Medidas de Dispersión
 Opción 1  Opción 2
 ¿Cómo cambiar las desviaciones a 
cantidades no negativas?
n
xx
n
i



1
||
n
xx
n
i



1
2)(
En realidad, se divide por n-1
Prof.Laura Lanzarini
Varianza Muestral
 La varianza muestral se denota por S2 y 
se define como
 La desviación muestral se denota por S
y es la raíz cuadrada positiva de S2
1
)(
1
2
2





n
xx
S
n
i
Prof.Laura Lanzarini
Varianza Muestral
 Volviendo al ejemplo de las calificaciones 
de la primera autoevaluación
Medida 
numéricas
Valor Función Excel
Varianza 1,2094 =VAR(B2:B106)
Desviación 1,0997 =STDEV(B2:B106)
Prof.Laura Lanzarini
Ejemplo
 El tiempo que tarda un conductor en reaccionar a 
las luces de freno de un vehículo en 
desaceleración tiene una distribución normal con 
valor medio 1.25 segundos y desviación estándar 
0.46 segundos.
 Analizar 6 muestras formadas por el tiempo de 
respuesta de 10 conductores cada una.
Prof.Laura Lanzarini
Ejemplo
Nro. Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6
1 2,1230 1,4750 1,3066 2,2239 1,4109 1,7338
2 0,9071 1,0563 1,5586 1,3302 0,8332 1,5900
3 1,2096 1,3621 1,5233 1,5126 0,7559 1,3493
4 0,9780 2,0770 1,0361 0,7811 1,3896 0,7226
5 1,0719 0,9561 1,6450 0,5599 1,5712 1,0043
6 1,8029 1,2427 1,7326 1,7384 1,2130 1,6203
7 1,2374 1,1200 1,1444 1,0040 0,0208 1,1875
8 0,6790 1,6861 1,5334 1,3784 1,6667 1,0838
9 1,5620 2,2011 1,4218 0,9477 1,1868 1,3452
10 1,4220 2,1642 1,8251 2,0382 1,5130 1,0518
X 1.2993 1.5341 1.4727 1.3515 1.1561 1.2689
S 0.4374 0.4728 0.2502 0.5422 0.4986 0.3183
Note que la media muestral y la desviación estándar muestral
difieren de una muestra a otra
 = 1.25 seg.
 = 0.46 seg.
Prof.Laura Lanzarini
Estadístico
 Un estadístico es cualquier cantidad cuyo valor 
se calcula a partir de los datos de la muestra (ej: 
media muestral X)
 Antes de obtener los datos hay incertidumbre con 
respecto al valor que se obtendrá para un 
estadístico en particular. Por lo tanto, un 
estadístico es una v.a.
 Cualquier estadístico, que es una v.a., tiene una 
distribución de probabilidad también llamada 
distribución de muestreo.
Prof.Laura Lanzarini
Muestra aleatoria
 Se dice que las v.a. X1, X2, …, Xn forman una 
muestra aleatoria (simple) de tamaño n si
 Las Xi son v.a. independientes.
 Todas las Xi tienen la misma distribución 
de probabilidad.
Prof.Laura Lanzarini
Distribución de la media muestral
 Sea X1, X2, …, Xn una muestra aleatoria de una 
distribución con media  y desviación estándar , 
entonces
 Además, To= X1+X2+ …+ Xn
n
y
n
XV
XE
XX
X






2
2)(.2
)(.1
nTE o )(  nynTV
oTo
 2)(
Prof.Laura Lanzarini
Caso de una distribución normal
 Sea X1, X2, …, Xn una v.a. de una distribución 
normal con media  y desviación estándar , 
entonces para cualquier n, 
 X tiene una distribución normal con media 
 y desviación estándar /n
 To también tiene una distribución normal 
pero con media n y desviación estándar
n
Prof.Laura Lanzarini
Caso de una distribución normal
Prof.Laura Lanzarini
Ejemplo 10.1
 La densidad del sedimento de cierto líquido 
(g/cm3) tiene una distribución normal con 
media 2.65 y desviación estándar 0.85.
 Si se dispone de una muestra aleatoria 
formada por 6 observaciones de dicho líquido 
 ¿Cuál es la probabilidad de que la densidad 
promedio muestral sea a lo sumo 3?
 y de que esté entre 2.65 y 3.00?
Prof.Laura Lanzarini
Ejemplo 10.1
Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 Muestra 7 Muestra 8
x1 3,3793 3,2365 1,6279 3,8529 2,5997 2,1029 2,3798 3,1412
x2 3,7159 3,3433 2,6332 1,9657 1,7910 2,9733 3,5808 2,6843
x3 1,2953 3,2551 2,5168 3,0994 3,1723 1,7923 1,0571 3,2255
x4 1,4252 3,7467 1,2865 2,8364 3,0816 2,6334 3,0140 3,1336
x5 3,1355 3,2183 2,8687 1,8664 4,0886 2,6090 3,4113 2,4327
x6 2,3101 3,6622 1,7520 0,8049 3,1526 2,6500 3,2713 2,3292
x 2,5435 3,4104 2,1142 2,4043 2,9809 2,4602 2,7857 2,8244
85.0;65.2  
),( 2NX 
)3( XP = ?  nNX 2,
Prof.Laura Lanzarini
Ejemplo 10.1 85.0;65.2  
),( 2NX 
)3( XP = ?
 nNX 2,







 



685.0
65.23
n
X
P


  8435.00086.1  ZP
El 84,35% de las muestras tendrán un valor de 
densidad del sedimento promedio inferior a 3.
Verifique este porcentaje con las muestras de la 
transparencia anterior
Prof.Laura Lanzarini
Ejemplo 10.2
 Qué tan grande debería ser el tamaño de 
la muestra para asegurar que la 
probabilidad de que la densidad promedio 
muestral sea a lo sumo 3 (la que 
calculamos antes) sea por lo menos 0.99?
 Es decir, cuánto debe valer n para que
85.0;65.2  
),( 2NX   nNX 2,
99.0)3( XPProf.Laura Lanzarini
= ?
Ejemplo 10.2
)3( XP 99.0
85.0
65.23







 



nn
X
P


85.0;65.2  
),( 2NX   nNX 2,
99.0
85.0
65.23







 

n
ZP
33.2
Prof.Laura Lanzarini
= ?
Ejemplo 10.2
)3( XP 99.0
85.0
65.23







 



nn
X
P


85.0;65.2  
),( 2NX   nNX 2,
99.0
85.0
65.23







 

n
ZP
33.2
85.0
)65.23(


n
Falta despejar 
n
Prof.Laura Lanzarini
Ejemplo 10.2 85.0;65.2  
),( 2NX   nNX 2,
33.2
85.0
)65.23(


n
)65.23(
85.0*33.2

n
33.2
85.0
)65.23(*

n
6586.5n
26586.5n 0198.32n
El tamaño mínimo de la muestra debería 
ser 33
Prof.Laura Lanzarini
Ejemplo 10.2 85.0;65.2  
 nNX 2,
Prof.Laura Lanzarini
Ejemplo 10.2
 La densidad del sedimento de cierto líquido 
(g/cm3) tiene una distribución normal con 
media 2.65 y desviación estándar 0.85.
 Se realizan 6 observaciones de dicho 
líquido. Sean X1, X2, …, X6 sus densidades 
de sedimento.
 ¿Cuál es la probabilidad de que la densidad 
total To=X1+X2+ …+X6 para las 6 
observaciones esté entre 14 y 16 g/cm3?
Prof.Laura Lanzarini
Ejemplo
 Si X1, X2, …, X6 tienen distribución normal 
entonces To también. Sus parámetros son
 Luego
90.15)65.2(6   n
oT
0821.23350.4)85.0(6
0
222  TT no 





 



0821.2
9.1516
0821.2
9.1514
)1614( ZPTP o
3384.0)9125.0()048.0()048.09125.0(  ZP
85.0;65.2  
),( 2NX   20 ,  nnNT 
Prof.Laura Lanzarini
Ejemplo 85.0;65.2  
 20 ,  nnNT 
Prof.Laura Lanzarini
Teorema Central del Límite
 Sea X1, X2, …, Xn una muestra aleatoria de una 
distribución con media  y varianza 2, entonces 
si n es suficientemente grande
 X tiene una distribución normal con media 
 y varianza 2/n
 To también tiene una distribución normal 
pero con media n y varianza n2
Regla empírica
Si n>30 se puede usar el Teorema Central del Límite
Prof.Laura Lanzarini
Aprox.Normal a la Distrib.Binomial
 El TCL se puede utilizar para aproximar las 
probabilidades de algunas v.a. discretas cuando 
es difícil calcularlas exactamente para valores 
grandes de los parámetros.
 Si X  B(n,p) hay dos formas de calcular P(X  k) 

 Usando las tablas de fda; pero no existen para 
valores grandes de n lo que nos obliga a hacer 
la suma anterior.



k
i
iXPkXP
0
)()(
Prof.Laura Lanzarini
Aprox.Normal a la Distrib.Binomial
 Como una opción podemos considerar a X como 
suma de v.a. más simples, específicamente, si 
definimos
entonces cada Xi  B(1,p) y además X1, X2, …, Xn
son independientes




0
1
iX
si en la i-ésima repetición de  ocurre éxito
en caso contrario i=1,2,… n
Prof.Laura Lanzarini
Aprox.Normal a la Distrib.Binomial
 Si X1, X2, …, Xn tienen distribución B(1,p), por el 
TCL, To tiene distribución normal con media np y 
varianza np(1-p).
 El tamaño de la muestra necesario para que la 
aproximación funcione depende de p. 
 Note que la distribución de cada Xi es simétrica 
cuando p es cercana a 0.5 y sesgada cuando está 
cerca de 0 o 1.
 Se recomienda usar la aproximación cuando 
np  10 y n(1-p)  10
Prof.Laura Lanzarini
Corrección por continuidad
 Según el TCL, si X  B(n,p) para n 
suficientemente grande puede usarse
X  N(np, np(1-p))
 Dado que la binomial es discreta y la normal 
continua, deben hacerse algunas correcciones







2
1
2
1
)( kXkPkXP







2
1
)( kXPkXP 






2
1
)( kXPkXP
Prof.Laura Lanzarini
B(n,p) aprox. por N(np, np(1-p))

Continuar navegando