Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística Prof.Laura Lanzarini Estadística La estadística proporciona métodos para organizar y resumir datos. Ej: utilizando medidas generales como el valor medio, la mediana y la desviación estándar. También para sacar conclusiones a partir de la información que contienen. Ej: A partir de las pruebas realizadas en pacientes a los que se les aplicó cierta droga puede estimarse si hubo mejora en su salud o no. Prof.Laura Lanzarini Población y muestra Por cuestiones prácticas se trabaja con una muestra (un subconjunto de la población) MUESTRAPOBLACION Prof.Laura Lanzarini Ramas de la Estadística Estadística Descriptiva Se dedica a los métodos de recolección, descripción, visualización y resumen de los datos. Inferencia Estadística Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Prof.Laura Lanzarini Estadística Descriptiva Medidas de Resumen Numéricas Media y Mediana Cuartiles Medidas de dispersión Representaciones gráficas Diagramas de caja. Histograma. Prof.Laura Lanzarini Media Muestral La media muestral x de un conjunto de observaciones x1, x2, … , xn está dada por n x n xxx x n i i n 121 ... Prof.Laura Lanzarini Media Muestral Alumno Nota Angioni Formia, Bruno Gabriel (bgangioni) 8.75 Aparicio, Ivan Agustin (in5f480) 9.00 Apezteguia, Matias (matiasap) 8.25 Archuby, Federico (archu) 9.00 … … Trujillo, Leticia Vanesa (trulet05p) 9.25 Vallejos, Fernando (yabran) 9.00 n x X n i i 1 Prof.Laura Lanzarini Media Muestral 8.1571 1571.81 n x X n i i (medida de resumen numérica) Prof.Laura Lanzarini Mediana Ordenar las muestras de menor a mayor y tomar como valor para la mediana El valor del medio de la lista si la cantidad de elementos es impar. El promedio de los valores centrales si la cantidad de elementos de la lista es par. x~ Prof.Laura Lanzarini Mediana Nota # Orden 5,5 1 … … 8,25 52 8,25 53 8,25 54 … … 10 105 Ordenar las notas de menor a mayor y tomar la nota del que está al medio 25,8~ x Prof.Laura Lanzarini Cuartiles La mediana divide al conjunto de datos en dos partes iguales. Los cuartiles dividen los datos en 4 partes con la misma cantidad de valores 7.25 9 8.25 Prof.Laura Lanzarini Medidas en Excel Medidas numéricas Valor Función Excel Media 8,1571 =AVERAGE(B2:B106) Mediana 8,25 =MEDIAN(B2:B106) Primer Cuartil 7,25 =QUARTILE(B2:B106; 1) Segundo Cuartil 8,25 =QUARTILE(B2:B106; 2) Tercer Cuartil 9 =QUARTILE(B2:B106; 3) Prof.Laura Lanzarini n i x 1 Medidas de Dispersión Suma de las desviaciones n i i xx 1 )( n i ix 1 xn . Prof.Laura Lanzarini Medidas de Dispersión Suma de las desviaciones n i i xx 1 )( n i ix 1 xn . n i ix n 1 1 0 ¿Cómo cambiar las desviaciones a cantidades no negativas? Medidas de Dispersión Opción 1 Opción 2 ¿Cómo cambiar las desviaciones a cantidades no negativas? n xx n i 1 || n xx n i 1 2)( La función valor absoluto tiene alguna dificultades teóricas entonces usamos esta Medidas de Dispersión Opción 1 Opción 2 ¿Cómo cambiar las desviaciones a cantidades no negativas? n xx n i 1 || n xx n i 1 2)( En realidad, se divide por n-1 Prof.Laura Lanzarini Varianza Muestral La varianza muestral se denota por S2 y se define como La desviación muestral se denota por S y es la raíz cuadrada positiva de S2 1 )( 1 2 2 n xx S n i Prof.Laura Lanzarini Varianza Muestral Volviendo al ejemplo de las calificaciones de la primera autoevaluación Medida numéricas Valor Función Excel Varianza 1,2094 =VAR(B2:B106) Desviación 1,0997 =STDEV(B2:B106) Prof.Laura Lanzarini Ejemplo El tiempo que tarda un conductor en reaccionar a las luces de freno de un vehículo en desaceleración tiene una distribución normal con valor medio 1.25 segundos y desviación estándar 0.46 segundos. Analizar 6 muestras formadas por el tiempo de respuesta de 10 conductores cada una. Prof.Laura Lanzarini Ejemplo Nro. Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 1 2,1230 1,4750 1,3066 2,2239 1,4109 1,7338 2 0,9071 1,0563 1,5586 1,3302 0,8332 1,5900 3 1,2096 1,3621 1,5233 1,5126 0,7559 1,3493 4 0,9780 2,0770 1,0361 0,7811 1,3896 0,7226 5 1,0719 0,9561 1,6450 0,5599 1,5712 1,0043 6 1,8029 1,2427 1,7326 1,7384 1,2130 1,6203 7 1,2374 1,1200 1,1444 1,0040 0,0208 1,1875 8 0,6790 1,6861 1,5334 1,3784 1,6667 1,0838 9 1,5620 2,2011 1,4218 0,9477 1,1868 1,3452 10 1,4220 2,1642 1,8251 2,0382 1,5130 1,0518 X 1.2993 1.5341 1.4727 1.3515 1.1561 1.2689 S 0.4374 0.4728 0.2502 0.5422 0.4986 0.3183 Note que la media muestral y la desviación estándar muestral difieren de una muestra a otra = 1.25 seg. = 0.46 seg. Prof.Laura Lanzarini Estadístico Un estadístico es cualquier cantidad cuyo valor se calcula a partir de los datos de la muestra (ej: media muestral X) Antes de obtener los datos hay incertidumbre con respecto al valor que se obtendrá para un estadístico en particular. Por lo tanto, un estadístico es una v.a. Cualquier estadístico, que es una v.a., tiene una distribución de probabilidad también llamada distribución de muestreo. Prof.Laura Lanzarini Muestra aleatoria Se dice que las v.a. X1, X2, …, Xn forman una muestra aleatoria (simple) de tamaño n si Las Xi son v.a. independientes. Todas las Xi tienen la misma distribución de probabilidad. Prof.Laura Lanzarini Distribución de la media muestral Sea X1, X2, …, Xn una muestra aleatoria de una distribución con media y desviación estándar , entonces Además, To= X1+X2+ …+ Xn n y n XV XE XX X 2 2)(.2 )(.1 nTE o )( nynTV oTo 2)( Prof.Laura Lanzarini Caso de una distribución normal Sea X1, X2, …, Xn una v.a. de una distribución normal con media y desviación estándar , entonces para cualquier n, X tiene una distribución normal con media y desviación estándar /n To también tiene una distribución normal pero con media n y desviación estándar n Prof.Laura Lanzarini Caso de una distribución normal Prof.Laura Lanzarini Ejemplo 10.1 La densidad del sedimento de cierto líquido (g/cm3) tiene una distribución normal con media 2.65 y desviación estándar 0.85. Si se dispone de una muestra aleatoria formada por 6 observaciones de dicho líquido ¿Cuál es la probabilidad de que la densidad promedio muestral sea a lo sumo 3? y de que esté entre 2.65 y 3.00? Prof.Laura Lanzarini Ejemplo 10.1 Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 Muestra 7 Muestra 8 x1 3,3793 3,2365 1,6279 3,8529 2,5997 2,1029 2,3798 3,1412 x2 3,7159 3,3433 2,6332 1,9657 1,7910 2,9733 3,5808 2,6843 x3 1,2953 3,2551 2,5168 3,0994 3,1723 1,7923 1,0571 3,2255 x4 1,4252 3,7467 1,2865 2,8364 3,0816 2,6334 3,0140 3,1336 x5 3,1355 3,2183 2,8687 1,8664 4,0886 2,6090 3,4113 2,4327 x6 2,3101 3,6622 1,7520 0,8049 3,1526 2,6500 3,2713 2,3292 x 2,5435 3,4104 2,1142 2,4043 2,9809 2,4602 2,7857 2,8244 85.0;65.2 ),( 2NX )3( XP = ? nNX 2, Prof.Laura Lanzarini Ejemplo 10.1 85.0;65.2 ),( 2NX )3( XP = ? nNX 2, 685.0 65.23 n X P 8435.00086.1 ZP El 84,35% de las muestras tendrán un valor de densidad del sedimento promedio inferior a 3. Verifique este porcentaje con las muestras de la transparencia anterior Prof.Laura Lanzarini Ejemplo 10.2 Qué tan grande debería ser el tamaño de la muestra para asegurar que la probabilidad de que la densidad promedio muestral sea a lo sumo 3 (la que calculamos antes) sea por lo menos 0.99? Es decir, cuánto debe valer n para que 85.0;65.2 ),( 2NX nNX 2, 99.0)3( XPProf.Laura Lanzarini = ? Ejemplo 10.2 )3( XP 99.0 85.0 65.23 nn X P 85.0;65.2 ),( 2NX nNX 2, 99.0 85.0 65.23 n ZP 33.2 Prof.Laura Lanzarini = ? Ejemplo 10.2 )3( XP 99.0 85.0 65.23 nn X P 85.0;65.2 ),( 2NX nNX 2, 99.0 85.0 65.23 n ZP 33.2 85.0 )65.23( n Falta despejar n Prof.Laura Lanzarini Ejemplo 10.2 85.0;65.2 ),( 2NX nNX 2, 33.2 85.0 )65.23( n )65.23( 85.0*33.2 n 33.2 85.0 )65.23(* n 6586.5n 26586.5n 0198.32n El tamaño mínimo de la muestra debería ser 33 Prof.Laura Lanzarini Ejemplo 10.2 85.0;65.2 nNX 2, Prof.Laura Lanzarini Ejemplo 10.2 La densidad del sedimento de cierto líquido (g/cm3) tiene una distribución normal con media 2.65 y desviación estándar 0.85. Se realizan 6 observaciones de dicho líquido. Sean X1, X2, …, X6 sus densidades de sedimento. ¿Cuál es la probabilidad de que la densidad total To=X1+X2+ …+X6 para las 6 observaciones esté entre 14 y 16 g/cm3? Prof.Laura Lanzarini Ejemplo Si X1, X2, …, X6 tienen distribución normal entonces To también. Sus parámetros son Luego 90.15)65.2(6 n oT 0821.23350.4)85.0(6 0 222 TT no 0821.2 9.1516 0821.2 9.1514 )1614( ZPTP o 3384.0)9125.0()048.0()048.09125.0( ZP 85.0;65.2 ),( 2NX 20 , nnNT Prof.Laura Lanzarini Ejemplo 85.0;65.2 20 , nnNT Prof.Laura Lanzarini Teorema Central del Límite Sea X1, X2, …, Xn una muestra aleatoria de una distribución con media y varianza 2, entonces si n es suficientemente grande X tiene una distribución normal con media y varianza 2/n To también tiene una distribución normal pero con media n y varianza n2 Regla empírica Si n>30 se puede usar el Teorema Central del Límite Prof.Laura Lanzarini Aprox.Normal a la Distrib.Binomial El TCL se puede utilizar para aproximar las probabilidades de algunas v.a. discretas cuando es difícil calcularlas exactamente para valores grandes de los parámetros. Si X B(n,p) hay dos formas de calcular P(X k) Usando las tablas de fda; pero no existen para valores grandes de n lo que nos obliga a hacer la suma anterior. k i iXPkXP 0 )()( Prof.Laura Lanzarini Aprox.Normal a la Distrib.Binomial Como una opción podemos considerar a X como suma de v.a. más simples, específicamente, si definimos entonces cada Xi B(1,p) y además X1, X2, …, Xn son independientes 0 1 iX si en la i-ésima repetición de ocurre éxito en caso contrario i=1,2,… n Prof.Laura Lanzarini Aprox.Normal a la Distrib.Binomial Si X1, X2, …, Xn tienen distribución B(1,p), por el TCL, To tiene distribución normal con media np y varianza np(1-p). El tamaño de la muestra necesario para que la aproximación funcione depende de p. Note que la distribución de cada Xi es simétrica cuando p es cercana a 0.5 y sesgada cuando está cerca de 0 o 1. Se recomienda usar la aproximación cuando np 10 y n(1-p) 10 Prof.Laura Lanzarini Corrección por continuidad Según el TCL, si X B(n,p) para n suficientemente grande puede usarse X N(np, np(1-p)) Dado que la binomial es discreta y la normal continua, deben hacerse algunas correcciones 2 1 2 1 )( kXkPkXP 2 1 )( kXPkXP 2 1 )( kXPkXP Prof.Laura Lanzarini B(n,p) aprox. por N(np, np(1-p))
Compartir