Logo Studenta

Cap 1 (apuntes correa) - Zaida Moreno Páez

¡Este material tiene más páginas!

Vista previa del material en texto

Inferencia Estadística 2010/2
Profesor: Víctor Correa S.
2
INDICE DE CONTENIDOS DEL CURSO
0. Estadística descriptiva: Análisis exploratorio de datos
1. Complementos de probabilidades, población, muestra, estadísticos
2. Estimación puntual de parámetros
3. Intervalos de confianza
4. Pruebas de hipótesis
5. Temas complementarios
1. Complementos de probabilidades, población, muestra, estadísticos
3
Capitulo 1: Complementos de Probabilidades
A. Población, Muestra aleatoria simple, Estadísticos de una muestra, 
Ley de los grandes números. 
B. Distribuciones, Chi-Cuadrado, t-student, F-Fisher.
Este capítulo introduce cuatro conceptos importantes en Estadística:
“muestra aleatoria simple”, “método de muestreo”, “estadísticos” y “error estándar de un estadístico”
Una propiedad clave, la Ley de los Grandes Números.
Sin embargo, este capítulo todavía pertenece al ámbito de las Probabilidades. Es decir, el experimento aleatorio aún 
no ha sido realizado (es decir, la extracción u observación de la muestra) y la distribución de la variable aleatoria 
(población) es conocida .
44
A. Población, muestra aleatoria simple y estadísticos 
1 En Estadística interesan las distribuciones de variables aleatorias denominadas
Poblaciones.
2 Def. Muestra aleatoria simple de tamaño “n” de una Población
Conjunto de variables X1 , … , Xn independientes e idénticamente distribuidas
(IID), según la población X ∼ dX.. 
m.a.s de X : X1 , … , Xn ∼ iid dX
55
3 Ejemplo
Considera la urna con fichas, X: 1 1 1 6 6. Se extraerán sucesivamente al azar
y con reemplazo, n = 4 fichas. Se definen las variables:
Xi (ω) = Número en i-ésima ficha en ω, i = 1, 2, 3, 4.
( X1, X2, X3, X4 ) es una muestra aleatoria simple de X y describe todas las
posibles muestras de tamaño n = 4 que se pueden observar.
Por ejemplo, si ωobs= ( Ficha 4, Ficha 1, Ficha 2, Ficha 1 ), entonces, la
muestra observadaresulta,
( X1(ωobs), X2(ωobs), X3(ωobs), X4( ωobs) ) = ( 6, 1, 1, 1). ■
Las variables IID, X1 , … , Xn representan un modelo para describir el “muestreo” de la población X. 
66
3 a Muestreo en Poblaciones Finitas
El muestreo de una población X consiste en observar las variables X1 , … , Xn ∼ iid dX . Lo anterior equivale
a observar la población X independientemente “n” veces. Para observar las variables o equivalentemente
realizar n observaciones independientes de la población X, a veces, es necesario realizar un sorteo aleatorio. 
Muestreo Aleatorio Simple con reemplazo
En el caso de una población finita o urna,X: x1 , … , xN el método de muestreo descrito en el ejemplo 3 se
denomina Muestreo Aleatorio Simple (MAS) con reemplazo y consiste en realizar n extracciones sucesivas al
azar con reemplazo de fichas de la urna X. Una extracción es al azar, si todas las fichas de la urna tienen igual
probabilidad, 1/N,de ser extraídas. 
El término “aleatorio” es sinónimo de “al azar”. 
Muestreo Aleatorio Simple sin reemplazo
Este método es similar al anterior pero con la diferencia que cada fichas extraída no es retornada a la urna.
En el muestreo con reemplazo el tamaño de muestra puede ser arbitrario, en cambio sin reemplazo la muestra la
muestra no puede ser mayor que n = N el tamaño de la urna.
Cuando las extracciones son sin reemplazo las variables que describen el muestreo X1 , … , Xn tienen
distribuciones iguales a la urna pero no son independientes. Sin embargo, si el tamaño de la población N es 
muy grande comparado con el de la muestra n, entonces, la correlación entre las variable s es muy pequeña y
se consideran independientes. Una regla práctica es, “N es muy grande comparado con n” si n/N < 0,05, es
decir, si el tamaño de la muestra es menor o igual al 5% de la población.
77
Es este curso, siempre se supondrá que el método de selección es un 
Muestreo es Aleatorio Simple con reemplazo o sin reemplazo, pero, donde la
población es muy grande comparada con la muestra.
3 b Métodos de Muestreo Complejos 
La mayoría de los estudios que se hacen a personas y hogares utilizan métodos complejos. La razón, es que
para utilizar un muestreo aleatorio simple se necesita construir un Marco de Muestreo, es decir, un listado con
la identificación y ubicación de todos los individuos del universo. Construir un Marco de Muestro confiable
para 3.000.000 de personas y mantenerlo actualizado es muy pero muy caro.
3 b1 Muestreo Aleatorio Estratificado (MAE)
1. En ocasiones, la población es una mezcla de subpoblacionesllamadas estratos, que conviene separar.
2. En cada estrato, se selecciona con un MAS, una muestra y luego se unen las muestras por estrato para formar la
muestra total. 
88
3 b2 Muestreo Aleatorio por Conglomerados (MAC)
1. Se divide el universo en N1 conglomerados o grupos de entidades. 
2. Se seleccionan con un MAS, n1 de los N1 conglomerados.
3. Se observan todas las entidades en cada conglomerado sorteado y luego se unen para formar la muestra total.
3 b3 Muestreo Aleatorio en dos Etapas (MA2E)
1. Se divide el universo en N1 conglomerados o grupos de entidades. 
2. Primera Etapa: Se seleccionan con un MAS, n1 de los N1 conglomerados.
3. Segunda etapa: De cada conglomerado seleccionado en 2. se seleccionan con un MAS m entidades.
Luego las n1×m entidades forman la muestra total 
3 b4 Muestreo sistemático (MS)
1. Al igual que el MAS, se requiere un listado 1, 2, 3, . . . , N. 
2. Se selecciona un número al azar “x” entre 1 y k = N/n (parte entera). 
Se incluyen en la muestra, la entidad ubicada en la posición “x” del listado y a partir de “x”, las ubicadas cada “k”
posiciones, hasta completar n.
99
3b5 Métodos complejos
Se construyen combinando los métodos anteriores y son los más utilizados en la práctica para investigar personas y
hogares.
3b6 Ejemplo: Método complejo para una encuesta de opinión en el Gran Santiago.
- El Gran Santiago se divide en ≈ 35.000 manzanas. Las manzanas definen conglomerados de aproximadamente 35
viviendas.
- Las 32 comunas del Gran Santiago se considera estratos. Es decir, en cada comuna se realizan selecciones
independientes. .
- Primera Etapa: En cada estrato, se seleccionan manzanas que totalizaron 300 manzanas de las 35.000.
- Segunda Etapa:En cada una de las 300 manzanas, se seleccionan 4 viviendas. En cada vivienda se pregunta la
opinión, sobre el tema del estudio, de una persona seleccionada al azar de la vivienda.
Las fórmulas que estudiaremos, sólo funcionan con el Muestreo Aleatorio
Simple, no con métodos complejos.
Sin embargo, los conceptos estadísticos detrás de las fórmulas también se
aplican a métodos de muestreo complejos. 
1010
4 Def. Estadístico de una muestra aleatoria simple
Cualquier variable aleatoria función de las variables de una m.a.s.
T(X1 , … , Xn ) : Ω → IR
ω → T( X1(ω ),X2(ω ),. . . ,Xn(ω ) )
Un estadístico sólo es función de las variables de la muestra. Es decir, siempre podemos observar, es decir, calcular
su valor con la muestra observada.
4 a La notación estándar para una realización de un estadístico es T( x1, x2 , . . . , xn ). 
Sin embargo, en estos apuntes anotaremos con frecuencia: T( ωobs ) dado que, un estadístico es una variable
aleatoria y por tanto función del resultado ω de un experimento (selección de una muestra), así,
T( ωobs ) = T( X1(ωobs ),X2(ωobs ),. . . ,Xn(ωobs ) ) . 
1111
5 Ejemplo
Sea X1 , . . . ,Xn , m.a.sde una poblaciónX, entonces, algunos estadísticos:
5a Suma muestral: 
5b Promedio muestral: 
5c Varianza muestral:
5d Frecuencia de “x”:
5f Frecuencia acumulada hasta “x”: 
5g Mínimo y Máximo: Min := Min( X1 , … , Xn ), Max := Max( X1 , … , Xn ) 
 : 21
n
XXX
X n
+⋅⋅⋅++=
1
)(
 : 1
2
2
−
−
= ∑ =
n
XX
S
n
i i
 : ),...,( 211 n
Not
n XXXSumXXT +⋅⋅⋅++==
 
),...,1 , / (#
:)(^
n
nixXi
xf in
===
 
),...,1 , / (#
:)(^
n
nixXi
xF in
=≤=
1212
5h Ejemplo (continuación)
Población con distribución BernoulliX ∼ B(π).
En este caso los estadísticos, Suma, Promedio y Varianza muestral tienen interpretaciones especiales:
Sum : = X1 + X2+ …+ Xn Recuento de éxitos en la muestra
Proporción de éxitos en la muestra. ■
5i Propiedad, si X ∼ B(π ), entonces, .)1(
1
 
1
)(
 
n
1i
2
2 PP
n
n
n
XX
S
i
−
−
=
−
−
=
∑
=
 : 21
n
XXX
P n
+⋅⋅⋅++=
Ejemplo de 5i . 
Considera una muestra observada de n = 10 de X ∼ B(π ), 1 0 1 0 1 1 1 0 0 1.
Entonces, para calcular S2 no conviene usar la definición en 5c, es más fácil usar la propiedad en 5i, entonces: 
P = 6/10 = 0,6; así, S2 = (10/9)×0,6×0,4 = 0,27. Cuando n es grande, a menudo se aproxima, S2 ≈ P(1- P). 
1313
6 Def. Distribución en el muestreo de un estadístico T
Distribución de T (función de probabilidad o de densidad)como variable aleatoria. 
Como cualquier variable aleatoria, un estadístico tiene una distribución de probabilidad, denominada
“Distribución en el muestreo” dado que el muestreo es el que genera la aleatoriedad del estadístico.
7 La observación de un estadístico (su cálculo) no depende de la distribución de la población, solo depende de los
valores en la muestra, sin embargo, la distribución de un estadístico puede depender de la distribución poblacional o
de algunos de sus parámetros:
X ∼ dX (θ ) ⇒ Xi ∼ dX(θ ) ⇒ T(X1 , . . . ,Xn ) ∼ dT (θ )
La población y un estadístico están relacionados por medio de sus
distribuciones (ambas pueden depender del mismo parámetro).
1414
8 Ejemplo
De probabilidad, se conoce la distribución en el muestreo de algunos estadísticos, dadas algunas distribuciones
poblacionales.
Población m.a.s Estadísticos
X ∼ dX (θ )
X∼ B(π ) X1 , … , Xn Sum= X1 + X2+ …+ Xn ∼ B( n, π )
X∼ Poisson(λ ) “ Sum= X1 + X2+ …+ Xn ∼ Poisson(λn )
X∼ N( µ , σ2 ) “ Sum= X1 + X2+ …+ Xn ∼ N( nµ , nσ2 )
_ 
“ X ∼ N ( µ , σ2/n )
Cualquiera n > 30 “ Sum= X1 + X2+ …+ Xn ∼a N( nµ , nσ2 ) (TLC)
_ 
X ∼ a N ( µ , σ2/n ) (TLC) ■
1515
9 Ejemplo
Considera la urna con fichas, X: 1 1 1 6 6, con media 3 y varianza 6. 
Se extraerán sucesivamente al azar y con reemplazo, n = 49 fichas. 
Considera los estadísticos, 
Sum= X1 + X2+…+ X49 ;
Entonces,
Sum ~a N( 147 , (17,1)2 ); ■
 
49
 4921
XXX
X
+⋅⋅⋅++=
;(17,1) )( ;147)( 2== SumVarSumE 2(0,35) )( ;3 )( == XVarXE
)(0,35) ,3( ~ 2NX a
6 Dada la urna X : x1, x2 . . . , xN , entonces, la media y varianza de la urna, son:
 
...
: 1
N
xx N++=µ
N
xxx N
22
2
2
12 )(...)()(: 
µµµσ −++−+−=
1616
10 Error Estándar de un estadístico
Recordemos la desviación estándar de una cantidad aleatoria,
La desviación estándar de un Estadístico se rebautiza por “Error Estándar”.
El término “desviación estándar” se reserva para la desviación estándar de la población σ. 
El término “Error estándar” quedara claro en capitulo de Estimación.
11Def. Error Estándar de un estadístico.
El error estándar es una desviación media del estadístico respecto de su valor esperado..
12 Interpretación Intuitiva: El Error Estándar es la diferencia probable entre la 
realización del estadístico y su valor esperado.
))}(({:)(:)( 2TETETVarTEE −==
))}(({:)(:)( 2TETETVarTDE −==
1717
13a Ejemplo
Estadístico: Suma Promedio Proporción
Error Estándar:
13b Ejemplo
Considera la urna con fichas, X: 1 1 1 6 6, con media 3 y varianza 6.
Se extraerán sucesivamente al azar y con reemplazo, n = 49 fichas.
Entonces, cuando la muestra sea extraída, la suma de las 49 fichas resultará
alrededor del valor esperado 147 con una desviación probable de 17,1. 
Entonces, el promedio de las 49 fichas resultará alrededor de 3 con una
desviación probable de 0,35. ■
n
σ
XEE )( = )( nσSumEE =
n
PEE
)1(
)(
ππ −=
1818
14 Nota Técnica: Los Estadísticos Suma y promedio con Muestreo Aleatorio Simple sin reemplazo 
14a En el caso del muestreo sin reemplazo se siguen cumpliendo las propiedades 
14b Pero las varianzas cambian 
14c El factor se suele llamar “factor de corrección por finitud”. El factor anterior aparece porque al no
haber reemplazo, las variables de la muestra resultan correlacionadas. Si el numero de fichas en la urna es muy
grande comparado con el tamaño de la muestra, el no reemplazar una ficha tiene un efecto muy pequeño sobre las
extracciones de las otras fichas, asi, las variables resultan aproximadamente independientes. Si en la urna hay
infinitas fichas o hay reemplazo, las variables son independientes, asi vemos que el factor aparece porque no hay 
reemplazo y la urna tiene un número finito de fichas.
14d Notar que si n = 1, las formulas anteriores coinciden con las del caso con reemplazo dado que al seleccionar
una sola ficha, da igual si es con o sin reemplazo.
14e Si n = N, entonces, las varianza en 14b son nulas. Es decir, cuando no hay reemplazo y seleccionamos todas las
fichas, la suma y promedio de la muestra no flutuan con el muestreo, son cantidades no aleatorias, en cada 
muestra arrojan el mismo valor, Sum = Nµ y = µ. 
14f Se tiene, para todo tamaño de muestra n, que, fcp≤ 1, lo anterior significa que la suma y promedio muestral
tienen menos variabilidad bajo el MAS sin reemplazo que con reemplazo. Una razón intuitiva de la propiedad 
anterior es que cuando hay reemplazo y extraemos un ficha con un valor muy grande o muy pequeño, esa ficha no 
puede volver a aparecer en la muestra, de modo que no aportara más variabilidad al estadístico.
µ )( =XEµnSumE )( =
2
1
)( σn
N
nN
SumVar MASsr ⋅−
−=
nN
nN
XVar MASsr
2
1
)(
σ⋅
−
−=
X
1−
−=
N
nN
fcp
1919
Muestreo Aleatorio Simple sin reemplazo (continuación)
14g Cuando la fracción de la muestra n es inferior al 5% respecto del tamaño de la urna N, las varianzas con y sin 
reemplazo se consideran iguales. 
Notar que si, n/N ≈ 0, con mayor razón, 1/N ≈ 0 y entonces, fcp ≈ 1 . Es decir, cuando el tamaño de la muestra 
n es muy pequeño comparado con el tamaño de la urna ,N, entonces, las varianza con y sin reemplazo son muy 
próximas. 
Por ejemplo, si N = 10.000y n =500, es decir, la fracción de muestreo es un 5%, entonces, fcp = 0,95, es 
decir, la varianza con y sin reemplazo sólo se diferencian en un 5%. 
14h El comentario anterior es importante porque en la práctica casi simpre se aplica un MAS sin reemplazo dado que
no tiene sentido tener observaciones repetidas en la muesta. Sin ambargo, usulamente el tamaño de la muestra 
es muy pequeño comparado con la urna, asi que se utilizan las varianzas del muestreo con reemplazo como 
aproximación de las verdaderas.
14k Si la población es muy grande comparada con la población, entonces, se sigue cumpliendo el TLC: 
. Sum= X1 + X2+ …+ Xn ~
a N( nµ , nσ2 ) y ) ,( ~ 
2
n
σ
NX
a
µ
20
15 Ley de los Grandes Números (LGN)
Sean X1 , X2 . . . Xn , . . . independientes, con E(Xi ) = µ y Var(Xi ) = σ2. 
Entonces,
16 Ejemplo
Una urna tiene fichas con media igual a 3,0. 
Entonces, a medida que se extraen más y más fichas al azar y con reemplazo de la urna, el promedio de las
extracciones efectuadas, se aproximara más y más a 3,0 (la media de la urna).■
16a Si n es muy grande (n > 30) :
µ=→++=
∞→
 )( 
...1
i
n
n XE
n
XX
X
µω )( ≈obsX
21
Consecuencias de la LGN 
17 Sea X1 , X2 , . . . Xn , . . . IID B( π ). Entonces,
18 Ejemplo
Una urna tiene un 20% de fichas con unos (1 de cada 5) y el resto con cero.
Entonces, a medida que se extraen más y más fichas al azar con reemplazo de la urna, la proporción de unos en las 
extracciones efectuadas se aproximará más y más al 20% (la proporción de unos en la urna). ■
19 Si n es muy grande (n > 30) :
π ...1
∞→
→++=
n
n
n
XX
P
πω )( ≈obsP
20 Repetiremos un experimento un número indefinido de veces y observaremos, la 
frecuencia con que ocurrirá el eventoA, en las primeras n repeticiones.
Entonces, 
Es decir, a medida que aumenta el número de repeticiones, la frecuencia (relativa) de veces que ocurre el evento A 
tiende a su probabilidad P(A),
P(A)Af
n
n )(
^
∞→
→
22
Muestra aleatoria (no observada) Población (conocda) 
Promedio 
 
 
Esperanza: 
 
Varianza: 
 
 
Varianza: 
Función de frecuencias (caso continuo): 
 
 
 
Función de probabilidad: 
Función de frecuencias acumuladas: 
 
 
 
Función de probabilidad acumulada: 
Histograma (caso continuo): 
 
 
 
 
Función de densidad: 
Percentil p, 0 < p <1: 
 
 xp^ = Min{ x / F n̂(x) ≥ p } 
Percentil p, 0 < p <1: 
 
 xp = Min{ x / F(x) ≥ p } 
 
n
XX
X n
++
=
...1 ∑==
x
)( )( xxfXE Xµ
n
XX
S
n
i i
n
∑ = −= 1
2
2
)(
 ∑ −==
x
X xfxX )()( )(Var 
22 µσ
)()( xXPxf X ==
n
xXi
xf in
) / (#
)(^
=
=
)()( xXPxFX ≤= 
) / (#
)(^
n
xXi
xF in
≤
=



 ≤≤≤<= −
−
no si 0
 si 
)/(#
)( 1
1
kk
kik axa
nL
aXai
xh )( xf X
21 Tabla: Resultados relacionados con la LGN
23
Más resultados de la LGN 
22 LGN para una transformación g(X)
Sean X1 ,…, Xn independientes, entonces, dada una función g : IR → IR, se tiene, 
22.a Nota Técnica: Simulación de Montecarlo
Cuando es complicado calcular g(E(X)), a veces, se puede aproximar la cantidad anterior, simulando 
artificialmente (con una computadora) realizaciones de x1, x2, . . ., xn de X con n muy grande y se usa:
El método anterior se llama “Simulación de Montecarlo”. 
En Estadística el método de estimación es similar al anterior, con la diferencia que la “simulación” se reemplaza
por el “muestreo”. 
22.b Ejercicio: Sean X1 ,…, Xn independientes, con E(Xi) = µ y Var(Xi) = σ
2, Utiliza la LGN para mostrar que,
. 
))(( 
)(...)( 1 XgE
n
XgXg
n
n
∞→
→++
22
22
1 
... µσ +→++
∞→n
n
n
XX
n
xgxgxg n)(...)()(E(g(X)) 21
+++≈
24
23 ¿Por qué funciona la LGN? Tres razones intuitivas:
23a Porque, 
23b Porque, 
23c Porque, 
0 )(y )(
∞→
→==
nn
σ
XEEXE µ
44 344 21
),0( 
2
aleatorioError 
n
d
X
σε
µ
∼
+=
A medida que n crece, la 
distribución de resulta 
más y más concentrada 
en torno µ.
X
0 )}({)( 2
∞→
→=−=
nn
σ
XEXEE µ
Si n tiende a infinito el tamaño 
medio del error aleatorio tiende a 
cero.
Si n tiende a infinito, la desviación 
media del promedio de la muestra 
respecto de la media de la 
población, tiende a cero.
25
B. Distribuciones Chi-cuadrado, t-student, F-Fisher
1 La distribución Chi-cuadrado
a. Sean Z1, Z2, . . ., Zn ∼ ind N( 0,1) ,entonces, Z12+ Z2 2+ . . . + Zn2 ∼ χ2n.
b. E[ χ2k ] = k y Var[ χ2k ] = 2k
c. Sean Y1 ∼ χ2k1 y Y2 ∼ χ2k2 , independientes, entonces, Y1 +Y2 ∼ χ2k1+k2. 
d. Notas:
d1 Chi cuadrado: χ2k ≡ Gama( α = k/2, β = 2 )
d2. Ejercicio: Usa el TLC para mostrar que para k muy grande, χ2k ≈ N( k, 2k).
26
e. En una población normal X∼ N( µ , σ2 ) :
e1
e2 E( S2) = σ2 y
e3 Ejercicio: Encuentra, para n muy grande, la distribución de S2.
2 La tabla 3 entrega algunos percentilesde la distribución anterior, para distintos k (grados de libertad).
2a Ejemplo:
Sea, χ2 ∼ χ219, verificar mirando la tabla 3 que,
a) Percentil 5% , χ219 ; 0,05 = 10,117
b) Percentil 95%, χ219 ; 0,95 = 30,144
 
1
2
)(
4
2
−
=
n
SVar
σ
2
1
2
2
22
1 ~
1
n-
n S
n-
σ
XX
σ
XX χ
σ
=





 −+⋅⋅⋅+





 −
2727
Tabla Distribución Chi cuadrado Acumulada
Valor Tabulado = x, P( X2 < x ) = Probabilida d
Probabilidad
g.l 0,005 0,01 0,025 0,05 0,1 0,25 0,75 0,9 0,95 0,975 0,99 0,995
1 0,000 0,000 0,001 0,004 0,016 0,102 1,323 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 0,575 2,773 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 1,213 4,108 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 1,923 5,385 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 1,610 2,675 6,626 9,236 11,070 12,832 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 3,455 7,841 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 4,255 9,037 12,017 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 3,490 5,071 10,219 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 5,899 11,389 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 12,549 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 7,584 13,701 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 14,845 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,041 9,299 15,984 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 10,165 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,037 18,245 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 11,912 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 12,792 20,489 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 13,675 21,605 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 14,562 22,718 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 23,828 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 16,344 24,935 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 17,240 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 18,137 27,141 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 19,037 28,241 33,196 36,415 39,364 42,980 45,558
25 10,520 11,524 13,120 14,611 16,473 19,939 29,339 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 20,843 30,435 35,563 38,885 41,923 45,642 48,290
27 11,808 12,878 14,573 16,151 18,114 21,749 31,528 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 22,657 32,620 37,916 41,337 44,461 48,278 50,994
29 13,121 14,256 16,047 17,708 19,768 23,567 33,711 39,087 42,557 45,722 49,588 52,335
30 13,787 14,953 16,791 18,493 20,599 24,478 34,800 40,256 43,773 46,979 50,892 53,672
3 Tabla Chi cuadrado
28
4 La distribución t-Student
a. Definición
Dadas variables Z ∼ N(0,1) y W ∼ χ2k , independientes, entonces:
La distribuciónt k se denomina t–Studentcon k grados de libertad (g.l.) 
kt
kW
Z
T 
)/(
∼=
Densidad t-Student
b. Propiedad
En una población normal X∼ N( µ , σ2 ) :
1 ~ 
/
n-t
nS
X µ−
29
5 La tabla 8 entrega algunos percentilesde la distribución anterior, para distintos grados de libertad.
5a Ejemplo
Sea, t ∼ t19 , verificar, mirando la tabla en 8, que:
a) Percentil 95%, t19 ; 0,95 = 1,7291
b) Percentil 97,5%, t19 ; 0,975 = 2,0930
6 Ambas distribuciones de t y N(0,1) están centradas en cero y son simétricas con forma de campana, pero 
Var( tk ) = k/(k-2) >1para k >2. Lo anterior significa que las colas de una “t” tienen áreas más grandes que las
colas de la N(0,1). 
Por ejemplo, si k = 19, 
P( 2,0930 < Z < 2,5395 ) = 0,013 < P( 2,0930 < t19 < 2,5395 ) = 0,015
7 Para k > 30, se tiene: Tabla t-Student≈ Tabla N(0,1), es decir, 
P( t k < x ) ≈ P( Z < x ), Z ~ N( 0, 1 ).
30
Tabla Distribución t Student Acumulada
Valor Tabulado = t, P( T < t ) = Probabilidad
Probabilidad
g.l 0,75 0,9 0,95 0,975 0,99 0,995
1 1,0000 3,0777 6,3137 12,7062 31,8210 63,6559
2 0,8165 1,8856 2,9200 4,3027 6,9645 9,9250
3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8408
4 0,7407 1,5332 2,1318 2,7765 3,7469 4,6041
5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0321
6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074
7 0,7111 1,4149 1,8946 2,3646 2,9979 3,4995
8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554
9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498
10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693
11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058
12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545
13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123
14 0,69241,3450 1,7613 2,1448 2,6245 2,9768
15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467
16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208
17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982
18 0,6884 1,3304 1,7341 2,1009 2,5524 2,8784
19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609
20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453
21 0,6864 1,3232 1,7207 2,0796 2,5176 2,8314
22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188
23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073
24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7970
25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874
26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787
27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707
28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633
29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564
30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500
31 0,6825 1,3095 1,6955 2,0395 2,4528 2,7440
32 0,6822 1,3086 1,6939 2,0369 2,4487 2,7385
33 0,6820 1,3077 1,6924 2,0345 2,4448 2,7333
34 0,6818 1,3070 1,6909 2,0322 2,4411 2,7284
35 0,6816 1,3062 1,6896 2,0301 2,4377 2,7238
36 0,6814 1,3055 1,6883 2,0281 2,4345 2,7195
37 0,6812 1,3049 1,6871 2,0262 2,4314 2,7154
38 0,6810 1,3042 1,6860 2,0244 2,4286 2,7116
39 0,6808 1,3036 1,6849 2,0227 2,4258 2,7079
40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045
8 Tabla t-Student
31
9 La distribución F-Fisher
b. Propiedades
1. Sean dos muestras independientes de tamaños n1 y n2 de poblaciones
normales X, Y. entonces:
2. Relación entre percentilesα y 1 -α, f n, m, α = 1/f m, n, 1-α
mnFmW
nW
F ,
2
1 
/
/ ∼=
 nnF
S
S
)1,1(~
/
/
122
1
2
1
2
2
2
2 −−
σ
σ
a. Definición
Sean W1 ∼ χ2n y W2 ∼ χ2m independientes, entonces, la variable: 
Fn, m: distribución de Fisher con n grados de libertad en el numerador y m
en el denominador.
32
10 Ejemplo
a. Verificar mirando la tabla de la página siguiente que, f(20,10; 0,95) = 2,77
b. f(20,10; 0,05) = ?
No hay tabla para, f(20,10; 0,05), pero, por la propiedad 9b2,
f(20,10; 0,05) = 1 / f(10,20, 1- 0,05) = 1 / f(10,20, 0,95) = 1/2,35 = 0,426
33
P(F(g.l.numer,g.l.denom) < valor tabulado) = 0.95
g.l.numer.
g.l.denom. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 242,98 243,91 244,69 245,36 245,95 246,46 246,92 247,32 247,69 248,01 248,31 248,58 248,83 249,05 249,26
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,42 19,42 19,43 19,43 19,44 19,44 19,44 19,45 19,45 19,45 19,45 19,45 19,46
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,73 8,71 8,70 8,69 8,68 8,67 8,67 8,66 8,65 8,65 8,64 8,64 8,63
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,89 5,87 5,86 5,84 5,83 5,82 5,81 5,80 5,79 5,79 5,78 5,77 5,77
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,66 4,64 4,62 4,60 4,59 4,58 4,57 4,56 4,55 4,54 4,53 4,53 4,52
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,98 3,96 3,94 3,92 3,91 3,90 3,88 3,87 3,86 3,86 3,85 3,84 3,83
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,55 3,53 3,51 3,49 3,48 3,47 3,46 3,44 3,43 3,43 3,42 3,41 3,40
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,26 3,24 3,22 3,20 3,19 3,17 3,16 3,15 3,14 3,13 3,12 3,12 3,11
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,05 3,03 3,01 2,99 2,97 2,96 2,95 2,94 2,93 2,92 2,91 2,90 2,89
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,89 2,86 2,85 2,83 2,81 2,80 2,79 2,77 2,76 2,75 2,75 2,74 2,73
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,76 2,74 2,72 2,70 2,69 2,67 2,66 2,65 2,64 2,63 2,62 2,61 2,60
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,66 2,64 2,62 2,60 2,58 2,57 2,56 2,54 2,53 2,52 2,51 2,51 2,50
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,58 2,55 2,53 2,51 2,50 2,48 2,47 2,46 2,45 2,44 2,43 2,42 2,41
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,51 2,48 2,46 2,44 2,43 2,41 2,40 2,39 2,38 2,37 2,36 2,35 2,34
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,45 2,42 2,40 2,38 2,37 2,35 2,34 2,33 2,32 2,31 2,30 2,29 2,28
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,40 2,37 2,35 2,33 2,32 2,30 2,29 2,28 2,26 2,25 2,24 2,24 2,23
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,35 2,33 2,31 2,29 2,27 2,26 2,24 2,23 2,22 2,21 2,20 2,19 2,18
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,31 2,29 2,27 2,25 2,23 2,22 2,20 2,19 2,18 2,17 2,16 2,15 2,14
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,28 2,26 2,23 2,21 2,20 2,18 2,17 2,16 2,14 2,13 2,12 2,11 2,11
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,25 2,22 2,20 2,18 2,17 2,15 2,14 2,12 2,11 2,10 2,09 2,08 2,07
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,22 2,20 2,18 2,16 2,14 2,12 2,11 2,10 2,08 2,07 2,06 2,05 2,05
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,20 2,17 2,15 2,13 2,11 2,10 2,08 2,07 2,06 2,05 2,04 2,03 2,02
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,18 2,15 2,13 2,11 2,09 2,08 2,06 2,05 2,04 2,02 2,01 2,01 2,00
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,15 2,13 2,11 2,09 2,07 2,05 2,04 2,03 2,01 2,00 1,99 1,98 1,97
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,14 2,11 2,09 2,07 2,05 2,04 2,02 2,01 2,00 1,98 1,97 1,96 1,96
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,12 2,09 2,07 2,05 2,03 2,02 2,00 1,99 1,98 1,97 1,96 1,95 1,94
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13 2,10 2,08 2,06 2,04 2,02 2,00 1,99 1,97 1,96 1,95 1,94 1,93 1,92
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,09 2,06 2,04 2,02 2,00 1,99 1,97 1,96 1,95 1,93 1,92 1,91 1,91
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,08 2,05 2,03 2,01 1,99 1,97 1,96 1,94 1,93 1,92 1,91 1,90 1,89
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09 2,06 2,04 2,01 1,99 1,98 1,96 1,95 1,93 1,92 1,91 1,90 1,89 1,88
31 4,16 3,30 2,91 2,68 2,52 2,41 2,32 2,25 2,20 2,15 2,11 2,08 2,05 2,03 2,00 1,98 1,96 1,95 1,93 1,92 1,91 1,90 1,88 1,88 1,87
32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,10 2,07 2,04 2,01 1,99 1,97 1,95 1,94 1,92 1,91 1,90 1,88 1,87 1,86 1,85
33 4,14 3,28 2,89 2,66 2,50 2,39 2,30 2,23 2,18 2,13 2,09 2,06 2,03 2,00 1,98 1,96 1,94 1,93 1,91 1,90 1,89 1,87 1,86 1,85 1,84
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,08 2,05 2,02 1,99 1,97 1,95 1,93 1,92 1,90 1,89 1,88 1,86 1,85 1,84 1,83
35 4,12 3,27 2,87 2,64 2,49 2,37 2,29 2,22 2,16 2,11 2,07 2,04 2,01 1,99 1,96 1,94 1,92 1,91 1,89 1,88 1,87 1,85 1,84 1,83 1,82
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,07 2,03 2,00 1,98 1,95 1,93 1,92 1,90 1,88 1,87 1,86 1,85 1,83 1,82 1,81
37 4,11 3,25 2,86 2,63 2,47 2,36 2,27 2,20 2,14 2,10 2,06 2,02 2,00 1,97 1,95 1,93 1,91 1,89 1,88 1,86 1,85 1,84 1,83 1,82 1,81
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02 1,99 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,83 1,82 1,81 1,80
39 4,09 3,24 2,85 2,61 2,46 2,34 2,26 2,19 2,13 2,08 2,04 2,01 1,98 1,95 1,93 1,91 1,89 1,88 1,86 1,85 1,83 1,82 1,81 1,80 1,79
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,97 1,95 1,92 1,90 1,89 1,87 1,85 1,84 1,83 1,81 1,80 1,79 1,78
41 4,08 3,23 2,83 2,60 2,44 2,33 2,24 2,17 2,12 2,07 2,03 2,00 1,97 1,94 1,92 1,90 1,88 1,86 1,85 1,83 1,82 1,81 1,80 1,79 1,78
42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,11 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,87 1,86 1,84 1,83 1,81 1,80 1,79 1,78 1,77
43 4,07 3,21 2,82 2,59 2,43 2,32 2,23 2,16 2,11 2,06 2,02 1,99 1,96 1,93 1,91 1,89 1,87 1,85 1,83 1,82 1,81 1,79 1,78 1,77 1,76
44 4,06 3,21 2,82 2,58 2,43 2,31 2,23 2,16 2,10 2,05 2,01 1,98 1,95 1,92 1,90 1,88 1,86 1,84 1,83 1,81 1,80 1,79 1,78 1,77 1,76
45 4,06 3,20 2,81 2,58 2,42 2,31 2,22 2,15 2,10 2,05 2,01 1,97 1,94 1,92 1,89 1,87 1,86 1,84 1,82 1,81 1,80 1,78 1,77 1,76 1,75
46 4,05 3,20 2,81 2,57 2,42 2,30 2,22 2,15 2,09 2,04 2,00 1,97 1,94 1,91 1,891,87 1,85 1,83 1,82 1,80 1,79 1,78 1,77 1,76 1,75
47 4,05 3,20 2,80 2,57 2,41 2,30 2,21 2,14 2,09 2,04 2,00 1,96 1,93 1,91 1,88 1,86 1,84 1,83 1,81 1,80 1,78 1,77 1,76 1,75 1,74
48 4,04 3,19 2,80 2,57 2,41 2,29 2,21 2,14 2,08 2,03 1,99 1,96 1,93 1,90 1,88 1,86 1,84 1,82 1,81 1,79 1,78 1,77 1,76 1,75 1,74
49 4,04 3,19 2,79 2,56 2,40 2,29 2,20 2,13 2,08 2,03 1,99 1,96 1,93 1,90 1,88 1,85 1,84 1,82 1,80 1,79 1,78 1,76 1,75 1,74 1,73
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95 1,92 1,89 1,87 1,85 1,83 1,81 1,80 1,78 1,77 1,76 1,75 1,74 1,73
51 4,03 3,18 2,79 2,55 2,40 2,28 2,20 2,13 2,07 2,02 1,98 1,95 1,92 1,89 1,87 1,85 1,83 1,81 1,79 1,78 1,77 1,75 1,74 1,73 1,72
52 4,03 3,18 2,78 2,55 2,39 2,28 2,19 2,12 2,07 2,02 1,98 1,94 1,91 1,89 1,86 1,84 1,82 1,81 1,79 1,78 1,76 1,75 1,74 1,73 1,72
53 4,02 3,17 2,78 2,55 2,39 2,28 2,19 2,12 2,06 2,01 1,97 1,94 1,91 1,88 1,86 1,84 1,82 1,80 1,79 1,77 1,76 1,75 1,74 1,72 1,71
54 4,02 3,17 2,78 2,54 2,39 2,27 2,18 2,12 2,06 2,01 1,97 1,94 1,91 1,88 1,86 1,83 1,82 1,80 1,78 1,77 1,75 1,74 1,73 1,72 1,71
55 4,02 3,16 2,77 2,54 2,38 2,27 2,18 2,11 2,06 2,01 1,97 1,93 1,90 1,88 1,85 1,83 1,81 1,79 1,78 1,76 1,75 1,74 1,73 1,72 1,71
56 4,01 3,16 2,77 2,54 2,38 2,27 2,18 2,11 2,05 2,00 1,96 1,93 1,90 1,87 1,85 1,83 1,81 1,79 1,78 1,76 1,75 1,74 1,72 1,71 1,70
57 4,01 3,16 2,77 2,53 2,38 2,26 2,18 2,11 2,05 2,00 1,96 1,93 1,90 1,87 1,85 1,82 1,81 1,79 1,77 1,76 1,74 1,73 1,72 1,71 1,70
58 4,01 3,16 2,76 2,53 2,37 2,26 2,17 2,10 2,05 2,00 1,96 1,92 1,89 1,87 1,84 1,82 1,80 1,78 1,77 1,75 1,74 1,73 1,72 1,71 1,70
59 4,00 3,15 2,76 2,53 2,37 2,26 2,17 2,10 2,04 2,00 1,96 1,92 1,89 1,86 1,84 1,82 1,80 1,78 1,77 1,75 1,74 1,73 1,71 1,70 1,69
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92 1,89 1,86 1,84 1,82 1,80 1,78 1,76 1,75 1,73 1,72 1,71 1,70 1,69
Tabla Fischer al 95%

Continuar navegando