Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 X = Peso de la masa grasa (kg) de mujeres nadadoras X ~ N( ; ) μ es peso medio de la masa grasa de las mujeres nadadoras Distribuciones de algunos Estadísticos 2 Una muestra aleatoria de individuos de tamaño n, es un conjunto de n mujeres nadadoras, elegidas de forma tal que todas tengan la misma probabilidad de ingresar a la muestra. Distribuciones de algunos Estadísticos 3 Si otro experimentador repite la experiencia y toma una muestra aleatoria de tamaño n de X, seguramente será distinta de la anterior. También las medias tienen resultados distintos. Esto sugiere que los valores que tenemos en una muestra particular son aleatorios, es decir, son valores de ciertas variables aleatorias. Distribuciones de algunos Estadísticos 4 Los siguientes datos corresponden al peso de la masa grasa (kg) de 10 mujeres nadadoras, provistos por algunos experimentadores. En la última columna se muestran las medias muestrales Distribuciones de algunos Estadísticos Exp. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Media 1 14,1 15,1 11,4 14,3 9,2 12,7 13,7 11,9 10,7 8,7 12,18 2 11,2 10,1 9,4 9,2 12,3 8,2 15,6 14,2 10,1 13,5 11,38 3 13,7 10,1 12,7 8,5 15,1 11,4 9,4 14,1 9,6 10,5 11,51 4 8,5 13,5 10,2 11,9 8,5 14,2 10,5 9,5 15,6 10,5 11,29 5 9,3 14,2 10,5 11,2 10,3 9,5 12,3 15,6 8,2 13,1 11,42 5 Sea X = Peso de la masa grasa de mujeres nadadoras X1 = peso de la masa grasa de la primer mujer nadadora de la muestra de tamaño 10 X1 tiene la misma distribución que X, porque todas las mujeres de la población pueden ser la primer mujer de la muestra y todas tienen la misma probabilidad de serlo. Muestra Aleatoria 6 X2 = peso de la masa grasa de la segunda mujer nadadora de la muestra de tamaño 10 Por la misma razón que antes, X2 es una variable aleatoria que tiene la misma distribución que X. Además X1 y X2 son independientes, porque, al elegir aleatoriamente la muestra, el peso de la masa grasa de la segunda mujer nadadora no dependerá del peso de la masa grasa de la primera. Muestra Aleatoria 7 Xn = peso de la masa grasa de la n-ésima mujer nadadora de la muestra de tamaño 10 Por la misma razón que antes, Xn es una variable aleatoria que tiene la misma distribución que X. Además X1, X2,…,Xn son independientes. Muestra Aleatoria 8 X1, X2,..., Xn es una muestra aleatoria de tamaño n de una variable aleatoria X si: ▪ cada Xi es una variable aleatoria que tiene la misma distribución que X (i = 1, 2,..., n) ▪ X1, X2,..., Xn son todas independientes entre sí. Muestra Aleatoria (Definición) 9 Si se toman varias muestras de tamaño 10, se observa que los valores de las medias tienen resultados distintos. Es decir la media muestral es una variable aleatoria. X = media muestral de muestras de tamaño n X = Peso de la masa grasa de mujeres nadadoras Muestra Aleatoria = Peso promedio de la masa grasa de 10 mujeres nadadorasX 10 Por ser variable aleatoria se indica con letras mayúsculas. Con minúscula se indica un valor particular de la variable. Muestra Aleatoria 11 Un estadístico es una función de la muestra. Si consideramos una muestra aleatoria de una variable X, un estadístico será: g(X1,X2,...,Xn). Por lo tanto, todo estadístico es a su vez una variable aleatoria. Como el estimador era un estadístico, entonces es una variable aleatoria, por lo tanto tiene sentido calcularle la esperanza y la varianza. Estimadores 12 es una variable aleatoria que depende de la muestra X1,X2,…Xn. Si tomamos una muestra particular X1,X2,…Xn obtenemos un valor particular del estimador que será cercano a θ si el estimador es bueno. Si tomamos un gran número de muestras particulares tendremos también un gran número de valores de . La media de todos esos posibles valores es . Estimadores )( E 13 Es deseable que el estimador sea tal que su media coincida con el valor del parámetro desconocido θ. Definición: Decimos que es un estimador insesgado de θ si y sólo si Estimadores )( E 14 La da una medida de la dispersión de los valores de alrededor de su media, por lo tanto es deseable que sea lo más pequeña posible. Estimadores )( VAR 15 Definición: Llamamos error estándar de un estimador a la raíz cuadrada de su varianza: Estimadores )()( VARES 16 Volviendo a las muestras aleatorias de la variable X, obtenidas por los experimentadores Algunos valores de la variable aleatoria X son ¿Qué distribución sigue ? X Exp. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Media 1 14,1 15,1 11,4 14,3 9,2 12,7 13,7 11,9 10,7 8,7 12,18 2 11,2 10,1 9,4 9,2 12,3 8,2 15,6 14,2 10,1 13,5 11,38 3 13,7 10,1 12,7 8,5 15,1 11,4 9,4 14,1 9,6 10,5 11,51 4 8,5 13,5 10,2 11,9 8,5 14,2 10,5 9,5 15,6 10,5 11,29 5 9,3 14,2 10,5 11,2 10,3 9,5 12,3 15,6 8,2 13,1 11,42 17 Si X1, X2,..., Xn es una muestra aleatoria de tamaño n de una variable aleatoria X, llamamos media a : n 1i iX n 1 X es una variable aleatoria Distribución de X Como cada Xi es una variable aleatoria resulta que es una variable aleatoria.X 18 La varianza de la muestra aleatoria de tamaño n de una variable aleatoria X es: n 1i 2 i 2 )XX( 1n 1 S S2 es una variable aleatoria. Notar que son todas letras mayúsculas que indican variables aleatorias. Distribución de X 19 )X(E)X(E Si X es una variable aleatoria tal que E(X)=μ y X1; X2;...;Xn es una muestra aleatoria de X, entonces: Demostrar Propiedad 5.1 20 Si X es una variable aleatoria tal que Var(X)=σ2 y X1; X2;...;Xn es una muestra aleatoria de X, entonces: nn )X(Var )X(Var 2 Demostrar Propiedad 5.2 21 Como consecuencia de esta propiedad podemos calcular el error estándar de :X nn XVARXES 2 )()( Error Estándar de X 22 Si X ~ N(μ;σ) entonces ~ Demostrar Propiedad 5.3 X );( n N 23 Si X ~ N(μ;σ) entonces ~ N(0;1) Demostrar Propiedad 5.4 n X 24 Si X es una variable aleatoria cualquiera tal que E(X) = μ y Var(X) = σ2 para n suficientemente grande, la variable aleatoria Propiedad 5.5 n X Z sigue aproximadamente una distribución N(0;1) 25 Distribución de la media muestral Si obtenemos 1000 muestras, obtendremos 1000 valores de , para estos 1000 valores realizamos el histograma: X 1 2 3 4 5 6 0 0,05 0,1 0,15 0,2 0,25 X fr e c u e n c ia re la ti v a Distribución de la media muestral 26 Continuación Si el tamaño de la muestra es grande, aunque la variable no sea normal, la media muestral sigue aproximadamente distribución normal. 27 Muestra de observaciones Población de observaciones Media X Desviación estándar S conocidos desconocidos Propiedades variables fijos Nombre Estadísticos Parámetros 28 X = Peso de la masa grasa (kg) de mujeres nadadoras X ~ N( ; ) μ es peso medio de la masa grasa de las mujeres nadadoras (Desconocido) Si se quiere estimar μ, se toma una muestra aleatoria de X y se calcula la media muestral Xˆ Estimación por Intervalos 29 Estimación por Intervalos Si se toma una muestra aleatoria de X y resulta 18,12x Se estima μ con 12,18 kg ¿Cuán confiable es esta estimación? 30 P(L1 < θ < L2) = 1- 0<<1 Sea θ un parámetro desconocido Un intervalo de confianza de nivel (1-) para θ es un intervalo [L1 , L2] tal que: Estimación con Intervalos de Confianza 31 El valor se fija pequeño: 0,05 ; 0,01 L1 y L2 son estadísticos, es decir, se calculan a partir de una muestra. Como es lógico, dependen también del nivel de confianza 1- elegido Estimación con Intervalos de Confianza 32 Suposiciones del modelo: X ~ N(μ;) conocido P(L1 < < L2) = 1- L1 y L2 ?? Xˆ )1;0(N~ n X Z Si X ~ N( ; ) entonces: P( -Z /2 < Z < Z /2 ) = 1 - Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza conocida 33 1)Z n/ X Z(P 2/2/ 1)n/ZXn/Z(P 2/2/ Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianzaconocida Multiplico por n/ 34 1)n/ZXn/ZX(P 2/2/ 1)n/ZXn/ZX(P 2/2/ Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza conocida Resto X Multiplico por (-1) 35 1)n/ZXn/ZX(P 2/2/ L1 L2 Son estadísticos porque es conocida Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza conocida 36 : variable aleatoria que depende de la muestra. : número fijo conocido, que depende de . σ : número fijo conocido. n : número fijo conocido. μ : número fijo desconocido. Observemos que: X 2 z 37 Cuando se reemplaza por los valores obtenidos en una muestra, no hay más variables aleatorias y no se puede hablar de probabilidad. Se pone confianza Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza conocida 1)//( 2/2/ nZXnZXC 38 ✓ Si aumenta la confianza, también aumenta la longitud del intervalo ✓ Si se aumenta el tamaño de la muestra, disminuye la longitud del intervalo. ✓ Si aumenta la varianza, también aumenta la longitud del intervalo. Siempre se desea hallar intervalos de alta confianza y corta longitud Propiedades 39 La altura de las plantas de un invernadero tiene una varianza de 2,56 cm2. Se extrae una muestra al azar de 20 plantas y se obtiene una altura promedio de 10,6 cm. Estimar, con un coeficiente de confianza de 95%, la altura media de las plantas del invernadero. Ejemplo 1 Ejemplo 1 (continuación) X: altura de las plantas de un invernadero X ~ N(μ;1,6) con σ = 1,6 n = 20 6,10X Los extremos del intervalo son: 40 nZX /2/ nZX /2/ Ejemplo 1 (continuación) Reemplazando, obtenemos: 30,1170,06,1020/6,196,16,10 95,0)30,1190,9( C 41 90,970,06,1020/6,196,16,10 42 El intervalo de confianza resultó C (9,90 < μ < 11,30) = 0,95 Para el Ejemplo 1 ¿Qué significa este intervalo? Quiere decir que tenemos una confianza del 95% de que el intervalo (9,90 ; 11,30) contiene al verdadero valor μ. 43 Aclaremos este concepto. Si en lugar de tomar esa muestra particular hubiésemos tomado otra tendríamos otro valor de , y, por lo tanto, otro intervalo distinto. Quiere decir que si repitiésemos la experiencia con muchas muestras distintas, tendríamos muchos intervalos distintos. X 44 El verdadero valor de μ es fijo, pero no lo conocemos. Supongamos que lo conocemos, algunos intervalos lo contendrán y otros no. La confianza del 95% indica que, el 95% de los intervalos contienen al verdadero μ. Con el método empleado solo el 5 % de los intervalos no lo contienen. 45 Construcción repetida de un intervalo de confianza para la media μ Si los intervalos de confianza mostrados son del 95% significa que si se construye un gran número de ellos, el 95% de ellos contendrá a la media. 46 Se desea estimar la esperanza de una variable aleatoria X ~ N(, 5) mediante un intervalo del 95% de confianza. ¿Qué tamaño de muestra se debe tomar para que el intervalo tenga una longitud menor que 2,35 ? Ejemplo 2 Ejemplo 2 (continuación) X ~ N(μ;5) con σ = 1,6 n = 49 L < 2,35 35,2 49 5 2/2 2/2/ ZnZL 645,1 10 7 .35,22/ Z 47 nZnZXnZXLLL /2)/(/ 2/2/2/12 90,01 48 Si en lugar de tomar esa muestra particular hubiésemos tomado otra, tendríamos otro valor de , y por lo tanto, otro intervalo distinto. Si repitiésemos la experiencia con muchas muestras distintas, tendríamos muchos intervalos distintos. Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza conocida x 49 Algunos intervalos contendrán a μ y otros no. La confianza del 95% indica que el 95% de los intervalos contienen al verdadero μ. Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza conocida 50 X sigue distribución cuadrado con n grados de libertad (X ~ ) , si y sólo si 2 n 2 2 2 1 ZZZX donde Zi ~ N(0 ; 1) independientes i = 1, 2,..., n Distribución cuadrado 2 2 n 51 La función de densidad es siempre positiva si X ~ 2n es P(X > 2 n;) = Distribución cuadrado T A B L A 52 Si X ~ entonces E(X) = n Demostrar Propiedad 5.6 2 n 53 Si X1 ~ ; X2 ~ X1 y X2 independientes, entonces Propiedad 5.7 2 1n 2 2n 2 21 nn X1 + X2 ~ 54 Si X ~ N(μ;σ) y X1 ; X2;…; Xn es una muestra aleatoria de X, entonces Demostrar Propiedad 5.8 n i iX 1 2 2 n~ 55 Sea X1 ; X2;…; Xn una muestra aleatoria de tamaño n de una variable aleatoria X. Sea la media de la muestra. Llamamos varianza de la muestra a: 2 1 2 1 1 n i i XX n S Variable Aleatoria S2 X 56 E(S2) = 2 S2 es estimador insesgado de σ2. Si X es una variable aleatoria tal que E(X)=μ Var(X)=σ2 ; X1; X2;...;Xn es una muestra aleatoria de X, entonces: Demostrar Propiedad 5.9 22 )1( 1 1 n n 57 n X X n S n i in i i 2 1 1 22 1 1 XnXX n X n i i n i i . 1 11 2 2 2 1 . . Xn n Xn n X n i i )(.)( 1 1 )( 2 1 22 XEnXE n SE n i i 22 )()()( XEXEXVar 22 )()()( XEXVarXE 22 )()()( iii XEXVarXE 222)( iXE 22 )()()( XEXVarXE 2 2 2 )( n XE 2 2 1 222 )( 1 1 )( n n n SE n i 22222 )( 1 1 )( nn n SE 22222 1 1 )( nnn n SE 222 1 1 )( n n SE 1 1 Por ser (X1;…Xi;….Xn) muestra aleatoria: Aplicamos la esperanza: 2 2y3 3 2 1 2 . 1 1 XnX n n i i 58 Volviendo a las muestras aleatorias de la variable X, obtenidas por los experimentadores Algunos valores de la variable aleatoria S2 son ¿Qué distribución sigue S2? Exp. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Varianza 1 14,1 15,1 11,4 14,3 9,2 12,7 13,7 11,9 10,7 8,7 4,8 2 11,2 10,1 9,4 9,2 12,3 8,2 15,6 14,2 10,1 13,5 5,91 3 13,7 10,1 12,7 8,5 15,1 11,4 9,4 14,1 9,6 10,5 5,11 4 8,5 13,5 10,2 11,9 8,5 14,2 10,5 9,5 15,6 10,5 5,94 5 9,3 14,2 10,5 11,2 10,3 9,5 12,3 15,6 8,2 13,1 5,5 59 S2 no sigue una distribución conocida, pero, utilizando la propiedad 5.8 Distribución de S2 ~ 2 n y reemplazando a μ por , se pierde un grado de libertad, tenemos entonces la siguiente propiedad. n i iX 1 2 X 60 Si X ~ N(μ;σ) y X1, X2,…,Xn es una muestra aleatoria de X, entonces Distribución de S2 n i i XX 1 2 ~ 2 1n y podemos demostrar la propiedad siguiente. 61 2 1n2 2 ~ S)1n( X ~ N(μ;σ) X1; X2;...;Xn es una muestra aleatoria de X entonces: Propiedad 5.10 Demostrar 62 2 1n2 2 ~ S)1n( Demostración n i i XX 1 2 ~ 2 1n n i i XX 1 2 2 1 ~ 2 1n Pero, 2 1 2 )1( SnXX n i i Entonces, 63 La variable aleatoria T sigue distribución t de Student con n grados de libertad (T ~ tn) , si y sólo si Z ~ N(0 ; 1) ; X ~ ; Z y X independientes n/X Z T Distribución t de Student 64 Su función de densidad es simétrica y muy parecida a la Normal, es más alta en las colas y más baja en el centro. A medida que aumenta n la tn se acerca a Z. Distribución t de Student 65 Si T~ tn es P( T > tn ; /2 ) = /2 La Tabla da los valores de los puntos críticos tn ; /2 P( -tn ; /2 < T < tn ; /2 ) = 1 - Distribución t de Student T A B L A 66 Distribución t de Student 67 Si X ~ N(μ;σ) entonces: 1nt~ nS X Demostrar Propiedad 5.11 68 Si X ~ N(μ;σ) entonces: Demostración n X Z ~ N(0;1) 2 2)1( Sn Y ~ 2 1n Por definición de v.a. Student 1 n Y Z T ~ 1nt 69 1nt~ nS X Demostración S nX n Sn n X T 1 )1( 2 2 70 P(L1 < < L2) = 1- L1 y L2 ?? Xˆ Suposiciones del modelo: X ~ N(μ;) desconocido Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza desconocida 71 1nt~ nS X Si X ~ N( ; ) entonces: 1t nS X tP 2/;1n2/;1n Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza desconocida 72 1nStXnStXP 2/;1n2/;1n Despejando, igual que en el intervalo anterior, es: L1 L2 Son estadísticos son variables aleatorias μ es un número fijo, desconocido Intervalo de Confianza para la Media de una Variable Aleatoria Normal con Varianza desconocida 73 Hallar un intervalo de 95% de confianza para la hemoglobina media de animales expuestos a un compuesto químico nocivo. Los siguientes datos corresponden a la hemoglobina de una muestra de 16 animales. Los datos son: Ejemplo 3 74 X = hemoglobina de animales expuestos a un compuesto químico nocivo. Suponemos que X ~ N(μ;) ; desconocido Ejemplo 3 (continuación) μ : hemoglobina media de animales expuestos a un compuesto químico nocivo. 75 s = 1,48n = 16 Los datos de la muestra son: Ejemplo 3 (continuación) 15,6 13,8 18,6 16,4 14,8 14,0 16,2 13,9 14,4 17,3 14,7 14,8 16,6 17,4 15,7 17,5 7,15X 76 nStX 2/;1n Es: 1- = 0,95 = 0,05 t15 ; 0,05/2 = 2,131 Los extremos del IC 95% para μ son: De la tabla de la distribución t es: Ejemplo 3 (continuación) (*) 77 15,7 ± 2,131 . 1,48/4 15,7 ± 0,79 IC 95% : 14,9 ; 16,5 C(14,9 < < 16,5) = 95% Reemplazando en (*), obtenemos: Ejemplo 3 (continuación) 78 Ejemplo 4 Volvamos al ejemplo analizado en la unidad anterior. Los datos de la tabla corresponden al peso de la masa grasa (kg) de 10 mujeres nadadoras, provistos por algunos experimentadores. En la 4 últimas columnas se muestran las medias muestrales, los desvíos correspondientes y los extremos de los intervalos. 79 Extremos del IC 95% para Ejemplo 4 (continuación) Exp. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 Media s L1 L2 1 14,1 15,1 11,4 14,3 9,2 12,7 13,7 11,9 10,7 8,7 12,18 2,2 10,61 13,75 2 11,2 10,1 9,4 9,2 12,3 8,2 15,6 14,2 10,1 13,5 11,38 2,4 9,66 13,1 3 13,7 10,1 12,7 8,5 15,1 11,4 9,4 14,1 9,6 10,5 11,51 2,3 9,86 13,16 4 8,5 13,5 10,2 11,9 8,5 14,2 10,5 9,5 15,6 10,5 11,29 2,4 9,57 13,01 5 9,3 14,2 10,5 11,2 10,3 9,5 12,3 15,6 8,2 13,1 11,42 2,3 9,77 13,07 Sea X ~ N(10;2) 80 Observar que los extremos del IC son variables aleatorias El IC calculado con la muestra 1, no contiene al verdadero valor de μ = 10. ¿Cuántos intervalos se espera que no contengan a μ? Ejemplo 4 (continuación) 81 Forma general de los Intervalos de confianza: X ~ N(μ;) Los extremos del IC para μ eran: es conocida es desconocidanStX 2/;1n n/ZX 2/ Intervalos de Confianza 82 ˆX )ˆ(ES)X(ESn/ ˆS )ˆ(ESn/n/S )ˆ(ESTablaˆ 2/ θ parámetro desconocido IC : Intervalos de Confianza 83 P(L1 < 2 < L2) = 1- L1 y L2 ?? 2 1n2 2 ~ S)1n( Si X es normal 22 S Suposición: X ~ N(μ;) es desconocida S2 no sigue una distribución conocida, pero Intervalo de Confianza para la Varianza de una Variable Aleatoria Normal 84 1 S)1n( P 2 2/;1n2 2 2 2/1;1n Intervalo de Confianza para la Varianza de una Variable Aleatoria Normal 85 1 S)1n( 1 S)1n( P 2 2 2/;1n 22 2 2/1;1n 1 S)1n(S)1n( P 2 2/;1n 2 2 2 2/1;1n 2 Intervalo de Confianza para la Varianza de una Variable Aleatoria Normal 86 1 S)1n(S)1n( P 2 2/1;1n 2 2 2 2/;1n 2 L1 L2 Son estadísticos Si se quiere un intervalo de confianza para , se saca la raíz cuadrada Intervalo de Confianza para la Varianza de una Variable Aleatoria Normal 87 Para estimar la varianza de una variable aleatoria X ~ N(μ, ) mediante un intervalo de confianza del 95% se tomó una muestra de tamaño 10. Si la longitud de dicho intervalo resultó menor que 0,86 ¿cuáles pueden ser los valores del varianza muestral? Ejemplo 5 Ejemplo 5 X ~ N(μ;σ) con σ desconocido n = 10 1 - = 0,95 L < 0,86 4,00 2 S 88 86,0) 919,16 1 325,3 1 (9 )1()1( 2 2 2 ;1 2 2 2 1;1 2 12 S SnSn LLL nn
Compartir