Logo Studenta

UNIDAD 5 (con Demostraciones)

¡Este material tiene más páginas!

Vista previa del material en texto

1
X = Peso de la masa grasa (kg) de mujeres nadadoras
X ~ N( ; )
μ es peso medio de la masa grasa de las 
mujeres nadadoras
Distribuciones de algunos 
Estadísticos
2
Una muestra aleatoria de individuos de tamaño n,
es un conjunto de n mujeres nadadoras, elegidas
de forma tal que todas tengan la misma
probabilidad de ingresar a la muestra.
Distribuciones de algunos 
Estadísticos
3
Si otro experimentador repite la experiencia y
toma una muestra aleatoria de tamaño n de X,
seguramente será distinta de la anterior.
También las medias tienen resultados distintos.
Esto sugiere que los valores que tenemos en
una muestra particular son aleatorios, es decir,
son valores de ciertas variables aleatorias.
Distribuciones de algunos 
Estadísticos
4
Los siguientes datos corresponden al peso de la
masa grasa (kg) de 10 mujeres nadadoras, provistos
por algunos experimentadores. En la última columna
se muestran las medias muestrales
Distribuciones de algunos 
Estadísticos
Exp. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Media
1 14,1 15,1 11,4 14,3 9,2 12,7 13,7 11,9 10,7 8,7 12,18
2 11,2 10,1 9,4 9,2 12,3 8,2 15,6 14,2 10,1 13,5 11,38
3 13,7 10,1 12,7 8,5 15,1 11,4 9,4 14,1 9,6 10,5 11,51
4 8,5 13,5 10,2 11,9 8,5 14,2 10,5 9,5 15,6 10,5 11,29
5 9,3 14,2 10,5 11,2 10,3 9,5 12,3 15,6 8,2 13,1 11,42
5
Sea X = Peso de la masa grasa de mujeres
nadadoras
X1 = peso de la masa grasa de la primer mujer
nadadora de la muestra de tamaño 10
X1 tiene la misma distribución que X, porque
todas las mujeres de la población pueden ser
la primer mujer de la muestra y todas tienen la
misma probabilidad de serlo.
Muestra Aleatoria
6
X2 = peso de la masa grasa de la segunda mujer
nadadora de la muestra de tamaño 10
Por la misma razón que antes, X2 es una variable
aleatoria que tiene la misma distribución que X.
Además X1 y X2 son independientes, porque, al
elegir aleatoriamente la muestra, el peso de la
masa grasa de la segunda mujer nadadora no
dependerá del peso de la masa grasa de la
primera.
Muestra Aleatoria
7
Xn = peso de la masa grasa de la n-ésima mujer
nadadora de la muestra de tamaño 10
Por la misma razón que antes, Xn es una variable
aleatoria que tiene la misma distribución que X.
Además X1, X2,…,Xn son independientes.
Muestra Aleatoria
8
X1, X2,..., Xn es una muestra aleatoria de
tamaño n de una variable aleatoria X si:
▪ cada Xi es una variable aleatoria que tiene la
misma distribución que X (i = 1, 2,..., n)
▪ X1, X2,..., Xn son todas independientes entre sí.
Muestra Aleatoria (Definición)
9
Si se toman varias muestras de tamaño 10, se
observa que los valores de las medias tienen
resultados distintos. Es decir la media
muestral es una variable aleatoria.
X = media muestral de muestras de tamaño n
X = Peso de la masa grasa de mujeres nadadoras
Muestra Aleatoria
= Peso promedio de la masa grasa de 10 mujeres nadadorasX
10
Por ser variable aleatoria se indica con letras
mayúsculas.
Con minúscula se indica un valor particular de la
variable.
Muestra Aleatoria
11
Un estadístico es una función de la muestra.
Si consideramos una muestra aleatoria de una
variable X, un estadístico será: g(X1,X2,...,Xn).
Por lo tanto, todo estadístico es a su vez una
variable aleatoria.
Como el estimador era un estadístico, entonces
es una variable aleatoria, por lo tanto tiene
sentido calcularle la esperanza y la varianza.
Estimadores


12
es una variable aleatoria que depende de la
muestra X1,X2,…Xn. Si tomamos una muestra
particular X1,X2,…Xn obtenemos un valor
particular del estimador que será cercano a θ si
el estimador es bueno.
Si tomamos un gran número de muestras
particulares tendremos también un gran número
de valores de . La media de todos esos posibles
valores es .
Estimadores






)(

E
13
Es deseable que el estimador sea tal que su
media coincida con el valor del parámetro
desconocido θ.
Definición: Decimos que es un estimador
insesgado de θ si y sólo si
Estimadores


 )(

E
14
La da una medida de la dispersión de los
valores de alrededor de su media, por lo tanto
es deseable que sea lo más pequeña posible.
Estimadores
)(

VAR


15
Definición: Llamamos error estándar de un
estimador a la raíz cuadrada de su varianza:
Estimadores


)()( 

VARES 
16
Volviendo a las muestras aleatorias de la variable 
X, obtenidas por los experimentadores
Algunos valores de la variable aleatoria X son
¿Qué distribución sigue ? X
Exp. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Media
1 14,1 15,1 11,4 14,3 9,2 12,7 13,7 11,9 10,7 8,7 12,18
2 11,2 10,1 9,4 9,2 12,3 8,2 15,6 14,2 10,1 13,5 11,38
3 13,7 10,1 12,7 8,5 15,1 11,4 9,4 14,1 9,6 10,5 11,51
4 8,5 13,5 10,2 11,9 8,5 14,2 10,5 9,5 15,6 10,5 11,29
5 9,3 14,2 10,5 11,2 10,3 9,5 12,3 15,6 8,2 13,1 11,42
17
Si X1, X2,..., Xn es una muestra aleatoria de
tamaño n de una variable aleatoria X, llamamos
media a :



n
1i
iX
n
1
X es una variable aleatoria
Distribución de X
Como cada Xi es una variable aleatoria resulta
que es una variable aleatoria.X
18
La varianza de la muestra aleatoria de
tamaño n de una variable aleatoria X es:





n
1i
2
i
2 )XX(
1n
1
S
S2 es una variable aleatoria.
Notar que son todas letras mayúsculas que
indican variables aleatorias.
Distribución de X
19
 )X(E)X(E
Si X es una variable aleatoria tal que E(X)=μ y
X1; X2;...;Xn es una muestra aleatoria de X,
entonces:
Demostrar
Propiedad 5.1
20
Si X es una variable aleatoria tal que Var(X)=σ2
y X1; X2;...;Xn es una muestra aleatoria de X,
entonces:
nn
)X(Var
)X(Var
2

Demostrar
Propiedad 5.2
21
Como consecuencia de esta propiedad podemos
calcular el error estándar de :X
nn
XVARXES  
2
)()(
Error Estándar de X
22
Si X ~ N(μ;σ) entonces ~
Demostrar
Propiedad 5.3
X );(
n
N 
23
Si X ~ N(μ;σ) entonces ~ N(0;1)
Demostrar
Propiedad 5.4
n
X


24
Si X es una variable aleatoria cualquiera tal que
E(X) = μ y Var(X) = σ2 para n suficientemente
grande, la variable aleatoria
Propiedad 5.5
n
X
Z



sigue aproximadamente una distribución N(0;1)
25
Distribución de la media muestral
Si obtenemos 1000 muestras, obtendremos 1000
valores de , para estos 1000 valores realizamos el
histograma:
X
1 2 3 4 5 6
0
0,05
0,1
0,15
0,2
0,25
X
fr
e
c
u
e
n
c
ia
re
la
ti
v
a
Distribución de la media muestral
26
Continuación
Si el tamaño de la muestra es grande, aunque la
variable no sea normal, la media muestral sigue
aproximadamente distribución normal.
27
Muestra de
observaciones
Población de
observaciones
Media X 
Desviación
estándar
S 
conocidos desconocidos
Propiedades
variables fijos
Nombre Estadísticos Parámetros
28
X = Peso de la masa grasa (kg) de mujeres nadadoras
X ~ N( ; )
μ es peso medio de la masa grasa de las mujeres
nadadoras (Desconocido)
Si se quiere estimar μ, se toma una
muestra aleatoria de X y se calcula la
media muestral
Xˆ 
Estimación por Intervalos
29
Estimación por Intervalos
Si se toma una muestra aleatoria de X y resulta 
18,12x
Se estima μ con 12,18 kg
¿Cuán confiable es esta estimación?
30
P(L1 < θ < L2) = 1- 0<<1
Sea θ un parámetro desconocido
Un intervalo de confianza de nivel (1-) 
para θ es un intervalo [L1 , L2] tal que:
Estimación con Intervalos de Confianza
31
El valor  se fija pequeño: 0,05 ; 0,01 
L1 y L2 son estadísticos, es decir, se calculan a
partir de una muestra. Como es lógico, dependen
también del nivel de confianza 1- elegido
Estimación con Intervalos de Confianza
32
Suposiciones del modelo: X ~ N(μ;)  conocido
P(L1 <  < L2) = 1- L1 y L2 ?? Xˆ 
)1;0(N~
n
X
Z


Si X ~ N( ; ) entonces:
P( -Z /2 < Z < Z /2 ) = 1 - 
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza conocida
33





1)Z
n/
X
Z(P
2/2/


1)n/ZXn/Z(P
2/2/
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianzaconocida
Multiplico por n/
34
  1)n/ZXn/ZX(P 2/2/
  1)n/ZXn/ZX(P 2/2/
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza conocida
Resto X
Multiplico por (-1)
35
  1)n/ZXn/ZX(P 2/2/
L1 L2
Son estadísticos porque  es conocida
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza conocida
36
: variable aleatoria que depende de la muestra.
: número fijo conocido, que depende de .
σ : número fijo conocido.
n : número fijo conocido.
μ : número fijo desconocido.
Observemos que:
X
2
z
37
Cuando se reemplaza por los valores obtenidos
en una muestra, no hay más variables aleatorias
y no se puede hablar de probabilidad. Se pone
confianza
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza conocida
   1)//( 2/2/ nZXnZXC
38
✓ Si aumenta la confianza, también
aumenta la longitud del intervalo
✓ Si se aumenta el tamaño de la muestra,
disminuye la longitud del intervalo.
✓ Si aumenta la varianza, también
aumenta la longitud del intervalo.
Siempre se desea hallar intervalos de
alta confianza y corta longitud
Propiedades
39
La altura de las plantas de un invernadero tiene
una varianza de 2,56 cm2. Se extrae una muestra
al azar de 20 plantas y se obtiene una altura
promedio de 10,6 cm. Estimar, con un coeficiente
de confianza de 95%, la altura media de las
plantas del invernadero.
Ejemplo 1
Ejemplo 1 (continuación)
X: altura de las plantas de un invernadero
X ~ N(μ;1,6) con σ = 1,6
n = 20
6,10X
Los extremos del intervalo son:
40
nZX /2/   nZX /2/  
Ejemplo 1 (continuación)
Reemplazando, obtenemos:
30,1170,06,1020/6,196,16,10 
95,0)30,1190,9(  C
41
90,970,06,1020/6,196,16,10 
42
El intervalo de confianza resultó
C (9,90 < μ < 11,30) = 0,95
Para el Ejemplo 1
¿Qué significa este intervalo?
Quiere decir que tenemos una confianza del 95%
de que el intervalo (9,90 ; 11,30) contiene al
verdadero valor μ.
43
Aclaremos este concepto. Si en lugar de tomar
esa muestra particular hubiésemos tomado otra
tendríamos otro valor de , y, por lo tanto, otro
intervalo distinto. Quiere decir que si repitiésemos
la experiencia con muchas muestras distintas,
tendríamos muchos intervalos distintos.
X
44
El verdadero valor de μ es fijo, pero no lo
conocemos. Supongamos que lo conocemos,
algunos intervalos lo contendrán y otros no. La
confianza del 95% indica que, el 95% de los
intervalos contienen al verdadero μ.
Con el método empleado solo el 5 % de los
intervalos no lo contienen.
45
Construcción repetida de un intervalo de 
confianza para la media μ
Si los intervalos de confianza mostrados son del 95% significa que si se
construye un gran número de ellos, el 95% de ellos contendrá a la
media.

46
Se desea estimar la esperanza de una variable
aleatoria X ~ N(, 5) mediante un intervalo del
95% de confianza. ¿Qué tamaño de muestra se
debe tomar para que el intervalo tenga una
longitud menor que 2,35 ?
Ejemplo 2
Ejemplo 2 (continuación)
X ~ N(μ;5) con σ = 1,6
n = 49
L < 2,35
35,2
49
5
2/2 2/2/    ZnZL
645,1
10
7
.35,22/ Z
47
nZnZXnZXLLL /2)/(/ 2/2/2/12   
90,01 
48
Si en lugar de tomar esa muestra particular
hubiésemos tomado otra, tendríamos otro valor
de , y por lo tanto, otro intervalo distinto.
Si repitiésemos la experiencia con muchas
muestras distintas, tendríamos muchos intervalos
distintos.
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza conocida
x
49
Algunos intervalos contendrán a μ y otros no.
La confianza del 95% indica que el 95% de los
intervalos contienen al verdadero μ.
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza conocida
50
X sigue distribución cuadrado con n grados
de libertad (X ~ ) , si y sólo si
2
n
2
2
2
1 ZZZX  
donde Zi ~ N(0 ; 1) independientes i = 1, 2,..., n
Distribución cuadrado
2
2
n
51
La función de densidad es siempre positiva
si X ~ 2n es P(X > 
2
n;) = 
Distribución cuadrado
T
A
B
L
A
52
Si X ~ entonces E(X) = n
Demostrar
Propiedad 5.6
2
n
53
Si X1 ~ ; X2 ~
X1 y X2 independientes, entonces
Propiedad 5.7
2
1n
 2
2n

2
21 nn 
X1 + X2 ~ 
54
Si X ~ N(μ;σ) y X1 ; X2;…; Xn es una muestra
aleatoria de X, entonces
Demostrar
Propiedad 5.8







 
n
i
iX
1
2

 2
n~
55
Sea X1 ; X2;…; Xn una muestra aleatoria de
tamaño n de una variable aleatoria X.
Sea la media de la muestra.
Llamamos varianza de la muestra a:
 
2
1
2
1
1





n
i
i XX
n
S
Variable Aleatoria S2
X
56
E(S2) = 2
S2 es estimador insesgado de σ2.
Si X es una variable aleatoria tal que E(X)=μ
Var(X)=σ2 ; X1; X2;...;Xn es una muestra aleatoria
de X, entonces:
Demostrar
Propiedad 5.9
22 )1(
1
1
 

 n
n
57


























 n
X
X
n
S
n
i
in
i
i
2
1
1
22
1
1 XnXX
n
X
n
i
i
n
i
i .
1
11
 

  2
2
2
1
.
.
Xn
n
Xn
n
X
n
i
i

















 

)(.)(
1
1
)( 2
1
22 XEnXE
n
SE
n
i
i
 22 )()()( XEXEXVar 
 22 )()()( XEXVarXE 
 22 )()()( iii XEXVarXE 
222)(  iXE
 22 )()()( XEXVarXE 
2
2
2 )( 


n
XE














 

2
2
1
222 )(
1
1
)( 


n
n
n
SE
n
i
 22222 )(
1
1
)(  nn
n
SE 


 22222
1
1
)(  nnn
n
SE 


 222
1
1
)(  

 n
n
SE
1
1
Por ser (X1;…Xi;….Xn)
muestra aleatoria:
Aplicamos la esperanza:
2
2y3
3








 

2
1
2 .
1
1
XnX
n
n
i
i
58
Volviendo a las muestras aleatorias de la variable 
X, obtenidas por los experimentadores
Algunos valores de la variable aleatoria S2 son
¿Qué distribución sigue S2? 
Exp. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Varianza
1 14,1 15,1 11,4 14,3 9,2 12,7 13,7 11,9 10,7 8,7 4,8
2 11,2 10,1 9,4 9,2 12,3 8,2 15,6 14,2 10,1 13,5 5,91
3 13,7 10,1 12,7 8,5 15,1 11,4 9,4 14,1 9,6 10,5 5,11
4 8,5 13,5 10,2 11,9 8,5 14,2 10,5 9,5 15,6 10,5 5,94
5 9,3 14,2 10,5 11,2 10,3 9,5 12,3 15,6 8,2 13,1 5,5
59
S2 no sigue una distribución conocida, pero, 
utilizando la propiedad 5.8 
Distribución de S2
~
2
n
y reemplazando a μ por , se pierde un
grado de libertad, tenemos entonces la
siguiente propiedad.







 
n
i
iX
1
2


X
60
Si X ~ N(μ;σ) y X1, X2,…,Xn es una muestra 
aleatoria de X, entonces 
Distribución de S2









 n
i
i XX
1
2

~
2
1n
y podemos demostrar la propiedad siguiente. 
61
2
1n2
2
~
S)1n(



X ~ N(μ;σ) X1; X2;...;Xn es una muestra
aleatoria de X entonces:
Propiedad 5.10
Demostrar
62
2
1n2
2
~
S)1n(



Demostración









 n
i
i XX
1
2

~
2
1n
 


n
i
i XX
1
2
2
1

~
2
1n
Pero,   2
1
2
)1( SnXX
n
i
i 

Entonces, 
63
La variable aleatoria T sigue distribución t de
Student con n grados de libertad (T ~ tn) ,
si y sólo si
Z ~ N(0 ; 1) ; X ~ ; Z y X independientes
n/X
Z
T 
Distribución t de Student
64
Su función de densidad es simétrica y muy
parecida a la Normal, es más alta en las colas y
más baja en el centro.
A medida que aumenta n la tn se acerca a Z.
Distribución t de Student
65
Si T~ tn es 
P( T > tn ; /2 ) = /2
La Tabla da los valores de los puntos críticos
tn ; /2
P( -tn ; /2 < T < tn ; /2 ) = 1 - 
Distribución t de Student
T
A
B
L
A
66
Distribución t de Student
67
Si X ~ N(μ;σ) entonces:
1nt~
nS
X


Demostrar
Propiedad 5.11
68
Si X ~ N(μ;σ) entonces:
Demostración
n
X
Z


 ~ N(0;1)
2
2)1(

Sn
Y

 ~
2
1n
Por definición de v.a. Student
1

n
Y
Z
T ~ 1nt
69
1nt~
nS
X


Demostración
 
S
nX
n
Sn
n
X
T










1
)1(
2
2
70
P(L1 <  < L2) = 1- 
L1 y L2 ?? Xˆ 
Suposiciones del modelo: 
X ~ N(μ;)  desconocido
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza desconocida
71
1nt~
nS
X


Si X ~ N( ; ) entonces:










  1t
nS
X
tP 2/;1n2/;1n
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza desconocida
72
    1nStXnStXP 2/;1n2/;1n
Despejando, igual que en el intervalo anterior, es:
L1 L2
Son estadísticos  son variables aleatorias
μ es un número fijo, desconocido
Intervalo de Confianza para la Media de
una Variable Aleatoria Normal con
Varianza desconocida
73
Hallar un intervalo de 95% de confianza para la
hemoglobina media de animales expuestos a un
compuesto químico nocivo. Los siguientes datos
corresponden a la hemoglobina de una muestra
de 16 animales. Los datos son:
Ejemplo 3
74
X = hemoglobina de animales expuestos a un
compuesto químico nocivo.
Suponemos que X ~ N(μ;) ;  desconocido
Ejemplo 3 (continuación)
μ : hemoglobina media de animales expuestos a
un compuesto químico nocivo.
75
s = 1,48n = 16
Los datos de la muestra son:
Ejemplo 3 (continuación)
15,6 13,8 18,6 16,4 
14,8 14,0 16,2 13,9 
14,4 17,3 14,7 14,8 
16,6 17,4 15,7 17,5 
 
7,15X
76
nStX 2/;1n  
Es: 1- = 0,95  = 0,05
t15 ; 0,05/2 = 2,131
Los extremos del IC 95% para μ son:
De la tabla de la distribución t es:
Ejemplo 3 (continuación)
(*)
77
15,7 ± 2,131 . 1,48/4  15,7 ± 0,79
IC 95% : 14,9 ; 16,5
C(14,9 < < 16,5) = 95%
Reemplazando en (*), obtenemos:
Ejemplo 3 (continuación)
78
Ejemplo 4
Volvamos al ejemplo analizado en la unidad anterior.
Los datos de la tabla corresponden al peso de la
masa grasa (kg) de 10 mujeres nadadoras, provistos
por algunos experimentadores. En la 4 últimas
columnas se muestran las medias muestrales, los
desvíos correspondientes y los extremos de los
intervalos.
79
Extremos del IC 95% para 
Ejemplo 4 (continuación)
Exp. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Media s L1 L2
1 14,1 15,1 11,4 14,3 9,2 12,7 13,7 11,9 10,7 8,7 12,18 2,2 10,61 13,75
2 11,2 10,1 9,4 9,2 12,3 8,2 15,6 14,2 10,1 13,5 11,38 2,4 9,66 13,1
3 13,7 10,1 12,7 8,5 15,1 11,4 9,4 14,1 9,6 10,5 11,51 2,3 9,86 13,16
4 8,5 13,5 10,2 11,9 8,5 14,2 10,5 9,5 15,6 10,5 11,29 2,4 9,57 13,01
5 9,3 14,2 10,5 11,2 10,3 9,5 12,3 15,6 8,2 13,1 11,42 2,3 9,77 13,07
Sea X ~ N(10;2)
80
Observar que los extremos del IC son variables aleatorias
El IC calculado con la muestra 1, no contiene al
verdadero valor de μ = 10.
¿Cuántos intervalos se espera que no contengan a
μ?
Ejemplo 4 (continuación)
81
Forma general de los Intervalos de confianza:
X ~ N(μ;) Los extremos del IC para μ eran:
 es conocida
 es desconocidanStX 2/;1n  
n/ZX 2/  
Intervalos de Confianza
82
 ˆX )ˆ(ES)X(ESn/ 
 ˆS )ˆ(ESn/n/S 
)ˆ(ESTablaˆ 2/  
θ parámetro desconocido
IC : 
Intervalos de Confianza
83
P(L1 < 
2 < L2) = 1-  L1 y L2 ??
2
1n2
2
~
S)1n(


Si X es normal
22 S

Suposición: X ~ N(μ;)  es desconocida
S2 no sigue una distribución conocida, pero
Intervalo de Confianza para la Varianza
de una Variable Aleatoria Normal
84












  1
S)1n(
P 2 2/;1n2
2
2
2/1;1n
Intervalo de Confianza para la Varianza
de una Variable Aleatoria Normal
85















 
1
S)1n(
1
S)1n(
P
2
2
2/;1n
22
2
2/1;1n















1
S)1n(S)1n(
P
2
2/;1n
2
2
2
2/1;1n
2
Intervalo de Confianza para la Varianza
de una Variable Aleatoria Normal
86















1
S)1n(S)1n(
P
2
2/1;1n
2
2
2
2/;1n
2
L1 L2
Son estadísticos 
Si se quiere un intervalo de confianza para , se 
saca la raíz cuadrada
Intervalo de Confianza para la Varianza
de una Variable Aleatoria Normal
87
Para estimar la varianza de una variable aleatoria
X ~ N(μ, ) mediante un intervalo de confianza
del 95% se tomó una muestra de tamaño 10. Si
la longitud de dicho intervalo resultó menor que
0,86 ¿cuáles pueden ser los valores del varianza
muestral?
Ejemplo 5
Ejemplo 5
X ~ N(μ;σ) con σ desconocido
n = 10 1 -  = 0,95
L < 0,86
4,00 2  S
88
86,0)
919,16
1
325,3
1
(9
)1()1( 2
2
2
;1
2
2
2
1;1
2
12 





S
SnSn
LLL
nn
 

Otros materiales