Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Dr. Guillermo Pastor Morales Romero Estadística Descriptiva. Medidas descriptivas. UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio Nacional SEMINARIO DE ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EDUCACIONAL Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Medidas descriptivas Cuando se trabaja con tablas y gráficos o estos ya han sido construidos a partir de una colección de datos, se requieren medidas más exactas que faciliten el análisis de los datos. Existen cuatro tipos de medidas de resumen: Medidas de tendencia central Media aritmética, mediana y moda. Medidas de dispersión Rango, varianza, desviación estándar y el coeficiente de variación. Medidas de distribución (forma) Asimetría y curtosis Medidas de posición Cuartiles, quintiles, y deciles. ‹Nº› Taller de Estadística Aplicada Medidas descriptivas que pueden aplicarse Nominal Ordinal Intervalo/Razón Medidas de posición Todos Todos Medidas de tendencia central Moda · Moda · Mediana · Moda · Mediana · Media Medidas de dispersión · Mínimo · Máximo · Desvíación estándar · Varianza · Rango · Error estándar de la media Medidas de distribución · Asimetría · Curtosis ‹Nº› Taller de Estadística Aplicada Gráficos que pueden realizarse 1º Tipo 2º Nivel 3º Característica 4º Representación Cualitativa Nominal Clasifica Gráfico de Barras Gráfico de Sectores Ordinal Clasifica Orden Gráfico de Barras Cuantitativa Discreta Enteros Clasifica Distancia Gráfico de Bastones Continua Clasifica Distancia Decimales Histograma Polígono Análisis exploratorio: Tallos y hojas ‹Nº› Taller de Estadística Aplicada Agenda Medidas de Tendencia Central Medidas de Dispersión Medidas de Distribución ‹Nº› Taller de Estadística Aplicada Medidas de Tendencia Central Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Medidas de tendencia central Media Es el promedio del conjunto de datos. Mediana Es un valor del conjunto de datos que mide el elemento central: La mitad de los elementos se encuentran por arriba y la otra mitad por debajo de él. Moda Es el valor que se repite más dentro de un conjunto de datos. ‹Nº› Taller de Estadística Aplicada Medidas de tendencia central Análisis La media, la mediana y la moda son idénticas en una distribución simétrica. La mediana puede ser la idónea en distribuciones sesgadas, ya que no se afecta tanto por valores extremos. La moda es recomendable usar en variables cualitativas ‹Nº› Taller de Estadística Aplicada Media o promedio ‹Nº› Taller de Estadística Aplicada Mediana ‹Nº› Taller de Estadística Aplicada Mediana ‹Nº› Taller de Estadística Aplicada Mediana para datos agrupados Donde: n : número de datos de la muestra. Li : límite inferior del intervalo que contiene a la mediana. Fi-1: Frecuencia absoluta acumulada inmediata inferior a la frecuencia acumulada Fi. fi : frecuencia absoluta del intervalo de la clase mediana (es aquel que contiene a Fi ). Ci : amplitud del intervalo de la clase mediana. Se considera el menor intervalo i, tal que Fi >n/2 ‹Nº› Taller de Estadística Aplicada Pasos para calcular la mediana para datos agrupados 1ro. Se determinan las frecuencias acumulada absolutas (Fi). 2do. Se halla n/2. 3ro. Ubicar n/2 en la columna de las Fi. 4to. Si n/2 no coincide con algún Fi, ubicar un Fi como la inmediata superior a n/2, para determinar el dato Xi o el intervalo Mediano correspondiente. Fi =Es la Frecuencia absoluta acumulada inmediata superior a n/2. Fi-1= es la Frecuencia absoluta acumulada inmediata anterior a Fi. ‹Nº› Taller de Estadística Aplicada Pasos para calcular la mediana para datos agrupados Punto medio del intervalo Intervalo mediano ‹Nº› Taller de Estadística Aplicada Pasos para calcular la mediana para datos agrupados ‹Nº› Taller de Estadística Aplicada Moda Es la medida de tendencia central, que se define como el valor que se presenta con mayor frecuencia en una serie o distribución de datos. Ejemplo 1: Encontrar la Moda en la serie: 6, 8, 6, 9, 10, 3, 6, 3 La moda es 6, porque se repite con mayor frecuencia, es una serie unimodal. Ejemplo 2: Hallar la Moda en la serie: 4, 7, 8, 9, 10, 3, 8, 4 Presenta dos modas, que son 4 y 8, porque se repite con mayor frecuencia, es una serie bimodal. ‹Nº› Taller de Estadística Aplicada Moda para datos agrupados La clase modal es el intervalo con mayor frecuencia Li =Límite inferior de la clase Modal d1 = Diferencia de la frecuencia simple de la clase Modal y la frecuencia de la clase inmediata inferior. d2 =Diferencia de la frecuencia simple de la clase Modal y la frecuencia de la clase inmediata superior. C =Tamaño o amplitud del intervalo. ‹Nº› Taller de Estadística Aplicada Moda para datos agrupados Punto medio del intervalo Intervalo modal d1 d2 ‹Nº› Taller de Estadística Aplicada Moda para datos agrupados Luego: ‹Nº› Taller de Estadística Aplicada Medidas de dispersión Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Medidas de dispersión Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. ‹Nº› Taller de Estadística Aplicada Medidas de dispersión Hay varias medidas de dispersión, siendo las más comunes las siguientes: El rango Desviación media La varianza La desviación estándar El coeficiente de variación ‹Nº› Taller de Estadística Aplicada Medidas de dispersión Rango R = X máx – X min El rango es el resultado de restar el máximo valor menos el mínimo valor. ‹Nº› Taller de Estadística Aplicada Medidas de dispersión Desviación Media Datos no agrupados Datos no agrupados Se define como la media de las diferencias en valor absoluto de los valores de la variable a la media. ‹Nº› Taller de Estadística Aplicada Medidas de dispersión Varianza Datos no agrupados Datos agrupados La varianza cuantifica la variabilidad de los datos con respecto a la media aritmética. En el caso de tratarse de una muestra n se disminuye en 1 (n-1). Si fuera la población se divide entre N. Población (N) Muestra (n) ‹Nº› Taller de Estadística Aplicada Medidas de dispersión Desviación estándar Datos no agrupados Datos agrupados La desviación estándar es simplemente el "promedio" o variación esperada con respecto a la media aritmética. Es la raíz cuadrada de la varianza Población (N) Muestra (n) ‹Nº› Taller de Estadística Aplicada Medidas de dispersión Coeficiente de variación El CV es igual al cociente entre la desviación típica y la media. Se expresa como porcentaje Si encontramos que el coeficiente de variación es próximo o mayor que 0.5 y no puede haber datos negativos, la distribución no es normal. Según el porcentaje de coeficiente de variación: CV<10% Poca dispersión 10%<CV<33% Dispersión aceptable 33%<CV<50% Dispersión alta CV>50% La dispersión es muy alta ‹Nº› Taller de Estadística Aplicada Ejemplo 1 Sea una distribución estadística de una muestra que viene dada por la siguiente tabla: xi 61 64 67 70 73 fi 5 18 42 27 8 Calcular: 1. La moda, mediana y media. 2. El rango, desviación media, varianza, desviación típica y el coeficiente de variación. 3. Interpretar. ‹Nº› Taller de Estadística Aplicada Solución 1 Tabla de frecuencias Moda Mo = 67 Mediana 100/2 = 50 Me = 67 Media Desviación media Rango r = 73 − 61 = 12 Desviación estándar Coeficiente de Variación 2.93 ‹Nº› Taller de Estadística Aplicada Solución 1 InterpretaciónEl dato que más se repite es 67 (Moda=67), el 50% de los datos están sobre 67 y el 50% de los datos debajo de este valor (Mediana=67). El promedio de los datos es 67.45 (Media=67.45). El mínimo dato es 61 y el máximo dato es 73. La mediana y la media están próximos esto indica que los datos tienden a ser homogéneos. En promedio los datos se desvían de la media en 2.265(Desviación media=2.265). Existe poca dispersión de los datos (4%). Los datos se dispersan en un promedio de 2.93 (Desviación estándar). ‹Nº› Taller de Estadística Aplicada Ejemplo 2 Hallar la media, desviación media, la varianza y la desviación típica de la series de números : 2, 3, 6, 8, 11. Media: Desviación media Varianza ó Desviación típica ‹Nº› Taller de Estadística Aplicada Práctica dirigida 2 Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Medidas de distribución Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Medidas de distribución Simetría Se establece que la distribución es simétrica cuando los datos de una población se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media aritmética. Si la distribución de frecuencias es unimodal, entonces: Mediana = Moda = Media Mas medidas de distribución son aplicadas en función a la representación gráfica de los datos. Comparan la forma gráfica con la distribución normal. ‹Nº› Taller de Estadística Aplicada Medidas de distribución Simetría Si la distribución de frecuencia es simétrica, entonces Mediana = Moda = Media (el recíproco no siempre es cierto) La simetría determina que la población es homogénea en relación a la variable de estudio. Para distribuciones bimodales y rectangulares sólo la media y la mediana son idénticas: ‹Nº› Taller de Estadística Aplicada Medidas de distribución Asimetría Se clasifica como asimétrica la distribución donde los datos por debajo de la medias más frecuentes que aquellos por encima de la media, o viceversa. En este caso, establece que la población es heterogénea para la variable en estudio. 1. Distribución asimétrica a la derecha: los datos por encima de la media son menos frecuentes La media tiene el valor más grande de las tres medidas de tendencia central en una distribución asimétrica positiva. ‹Nº› Taller de Estadística Aplicada Medidas de distribución Asimetría 2. Distribución asimétrica a la izquierda: los datos por debajo de la media son menos frecuentes. La media tiene el valor más pequeño de las tres medidas de tendencia central en una distribución asimétrica negativa ‹Nº› Taller de Estadística Aplicada Medidas de distribución Coeficiente de Asimetría Resultados: Si Sk > 0 distribución es asimétrica positiva (sesgada a la derecha) Si Sk < 0 distribución es asimétrica negativa (sesgada a la izquierda) Si Sk = 0 la distribución puede ser simétrica ‹Nº› Taller de Estadística Aplicada Medidas de distribución Ejemplo 1: En la tabla que se presenta: ¿Qué grupo tiene mejor rendimiento? ¿Qué grupo es más homogéneo? Grupo 1 Grupo 2 8 11 8 8 12 12 13 13 15 15 9 9 5 10 10 16 11 11 8 8 7 9 11 11 9 9 14 13 9 14 12 ‹Nº› Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Medidas de distribución Curtosis Las medidas de apuntamiento o curtosis tratan de estudiar la distribución de frecuencias en la zona media. El mayor o menor número de valores de la variable alrededor de la media dará lugar a una distribución más o menos apuntada. Para estudiar el apuntamiento hay que definir una distribución tipo que nos sirva de referencia. Esta distribución es conocida como distribución Normal o curva de Gauss y se corresponde con numerosos fenómenos de la naturaleza. Su forma es la de una campana en donde la gran mayoría de los valores se encuentran concentrados alrededor de la media, siendo escasos los valores que están muy distanciados de ésta. Al tomar como referencia la distribución normal se dice que otra distribución es más apuntada que la distribución normal (leptocúrtica) o menos apuntada (platicúrtica). ‹Nº› Taller de Estadística Aplicada Medidas de distribución Curtosis A las distribuciones que se asemejan a la distribución normal se les denomina mesocúrticas. Dependiendo entonces del valor del coeficiente de curtosis g llamamos: Mesocúrtica (Normal) si g = 0 Leptocúrtica si g > 0 (positivo) Platicúrtica si g < 0 (negativo) ‹Nº› Taller de Estadística Aplicada Curtosis ‹Nº› Taller de Estadística Aplicada Calcular la curtosis Donde: g2 : Coeficiente de curtosis n: Número de datos Xi : dato i-ésimo X : Media s : Desviación estándar Cuando los datos están agrupados en clases, se calcula la curtosis usando la marca de clase en xi ‹Nº› Taller de Estadística Aplicada Calcular la curtosis (Datos agrupados en clases) INTERVALOS xi fi Fi hi Hi hi% Hi% xifi (xi-x)2fi [60-70[ 65 3 3 0.1 0.1 10% 10% 195 1633.33 [70-80[ 75 6 9 0.2 0.3 20% 30% 450 1066.67 [80-90[ 85 7 16 0.23 0.53 23% 53% 595 77.78 [90-100[ 95 9 25 0.3 0.83 30% 83% 855 400.00 [100-110[ 105 2 27 0.07 0.9 7% 90% 210 555.56 [110-120] 115 3 30 0.1 1 10% 100% 345 2133.33 TOTAL ---- 30 ---- 1 ------ 100% ------ 2650 5866.67 1.- Se calcula la media y la desviación estándar. ‹Nº› Taller de Estadística Aplicada Calcular la curtosis (Datos agrupados en clases) INTERVALOS xi fi Fi hi Hi hi% Hi% xifi (xi-x)2fi [60-70[ 65 3 3 0.1 0.1 10% 10% 195 1633.33 [70-80[ 75 6 9 0.2 0.3 20% 30% 450 1066.67 [80-90[ 85 7 16 0.23 0.53 23% 53% 595 77.78 [90-100[ 95 9 25 0.3 0.83 30% 83% 855 400.00 [100-110[ 105 2 27 0.07 0.9 7% 90% 210 555.56 [110-120] 115 3 30 0.1 1 10% 100% 345 2133.33 TOTAL ---- 30 ---- 1 ------ 100% ------ 2650 5866.67 2.- Se calcula la curtosis Como el coeficiente de curtosis es mayor que cero g2 > 0, entonces la distribución es Leptocúrtica ‹Nº› Taller de Estadística Aplicada Practica dirigida 3 Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Práctica dirigida 3 1. Dados los siguientes valores de la tendencia central : Media = 14, Mediana = 12, Moda = 10. Media = 14, Mediana = 16, Moda = 18. Media = 14, Mediana = 14, Moda = 14. Media = 14, Mediana = 17, Moda = 14. Para cada caso: a) Determine si la distribución es simétrica. b) ¿Está sesgada en forma positiva o negativa?. Explique. ‹Nº› Taller de Estadística Aplicada Práctica dirigida 3 2. La edades de un grupo de personas se reflejan en la siguiente tabla: Intervalos fi 7 – 9 4 9 - 11 18 11 - 12 14 12 - 13 27 13 - 14 42 14 – 15 31 15 – 17 20 17 – 19 1 a) Estudie la simetría de la variable. Halle la curtosis e interprete . ‹Nº› Taller de Estadística Aplicada n x X n i i å = = 1 _ n x f X n i i i å = = 1 _ i i i i C f F n L Me ú ú ú û ù ê ê ê ë é - + = - 1 2 i i i i C f F n L Me ú ú ú û ù ê ê ê ë é - + = - 1 2 85 , 80 85 , 0 80 7 6 80 7 9 15 80 10 7 9 2 30 80 = + = + = - + = ú ú ú û ù ê ê ê ë é - + = Me i i o C d d d L M ú û ù ê ë é + + = 2 1 1 C d d d L M i o ú û ù ê ë é + + = 2 1 1 10 7 2 9 2 7 9 90 2 1 = = - = = - = = c d d L i 22 , 92 22 , 2 90 9 20 90 10 7 2 2 90 = + = + = ú û ù ê ë é + + = o M å = - = n i i m x x n D 1 1 i k i i m f x x n D å = - = 1 1 estándar Desviación Mediana) 3(media S k - = estándar Desviación Moda) 3(media S k - =
Compartir