Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Página 1 de 10 Unidad 7: Análisis Cuantitativo CLASE 2 En esta nueva clase comenzaremos con el análisis estadístico propiamente dicho, comenzaremos con los conceptos fundamentales de las medidas de tendencia central, que son fundamentales en estadística. ¡Comencemos! 2.2 Medidas de tendencia central y de posición Con estas medidas se persigue reducir en pocas cifras significativas el conjunto de observaciones de una variable y describir con ellas ciertas características de los conjuntos, logrando así una comparación más precisa de los datos que aquella que se puede conseguir con tablas y gráficas. Se emplean para: a) Representar a un conjunto mediante un solo valor y a través del se puede establecer el comportamiento del conjunto. Ejemplo: salario promedio de los habitantes de una ciudad, gasto promedio de una familia, etc. b) Efectuar comparaciones entre diferentes conjuntos estadísticos Ejemplo: comparar el promedio de edad de estudiantes de distintos cursos, comparar promedio de ventas mensuales entre dos o más empresas, etc. Medidas de tendencia central Los promedios son una medida de posición que dan una descripción compacta de cómo están centrados los datos y una visualización más clara del nivel que alcanza la variable. Pueden servir de base para medir o evaluar valores extremos o raros y brinda mayor facilidad para efectuar comparaciones. Es importante poner en relieve que la notación de promedio lleva implícita la idea de variación y que este número promedio debe cumplir con la condición de ser representativo del conjunto de datos. Página 2 de 10 El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable. 2.1.1 Media Aritmética (�̅� ) Es una medida matemática, un número individual que representa razonablemente el comportamiento de todos los datos. Debemos distinguir si estamos trabajando con datos crudos o si los datos están bajo arreglo o distribución de frecuencia. Cálculo de (�̅� ) Para datos crudos: �̅� = 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛 𝑛 �̅� = ∑ 𝑥𝑖 𝑛 𝑖=1 𝑛 Donde n es la cantidad de datos. Ejemplo: Recordemos las calificaciones de 1ro 4ta. 4 5 6 6 6 6 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 9 9 9 9 10 10 10 10 Para calcular la media, hay que sumar todas las calificaciones y dividirlas por el número de datos, para este caso n=30 �̅� = 229 30 = 7,633 Página 3 de 10 Para Arreglo y distribución de frecuencias: �̅� = 𝑓1𝑥1 + 𝑓2𝑥2 + 𝑓3𝑥3 + ⋯ + 𝑓𝑛𝑥𝑛 𝑛 �̅� = ∑ 𝑓𝑖𝑥𝑖 𝑛 𝑖=1 𝑛 Volvamos a ver la tabla de distribución de frecuencias. A efectos práctico solo veremos las frecuencias absolutas. xi Frecuencia absoluta fi 4 1 5 1 6 4 7 8 8 8 9 4 10 4 �̅� = 1𝑥4 + 1𝑥5 + 4𝑥6 + 8𝑥7 + 8𝑥8 + 4𝑥9 + 4𝑥10 30 = 229 30 = 7,633 Podemos concluir que en promedio los estudiantes de 1ro 4ta tienen una calificación igual a 7,633 Página 4 de 10 Para distribución de frecuencias agrupadas: Tomemos como ejemplo la tabla de distribución de frecuencias agrupadas de las estaturas de los estudiantes de 1ro 4ta. Intervalos de clase Marca de clase Xi Frecuencia absoluta fi [155 ; 161) 158 1 [161 ; 167) 164 6 [167 ; 173) 170 10 [173 ; 179) 176 4 [179 ; 185) 182 7 [185 ; 191) 188 2 Para este caso en particular tengan en cuenta que se multiplica cada frecuencia absoluta por la marca de clase correspondiente, se suman y luego se divide por el número total de datos. �̅� = 1𝑥158 + 6𝑥164 + 10𝑥170 + 4𝑥176 + 7𝑥182 + 2𝑥188 30 = 5196 30 = 173,2 𝑐𝑚 Podemos decir que en promedio los estudiantes de 1ro 4ta tienen una altura de 173,2 cm Características de la media: 1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta la media. 2. Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser afectada por los valores extremos, y de esa forma llegar a ser una medida menos representativa, por lo que, si la distribución es asimétrica, la media aritmética no constituye un valor típico. 3. Cada uno de los datos del conjunto puede ser sustituido por la media aritmética ( X ) sin que se altere el valor de esta, ni la suma de los valores de los conjuntos. Página 5 de 10 4. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y solo una media aritmética 2.1.2 LA MEDIANA (�̃�) Es la medida de tendencia central que por su ubicación dentro del conjunto de datos lo divide exactamente a la mitad. Geométricamente la mediana es el valor de la variable que corresponde a la vertical que divide al histograma en dos áreas iguales. Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños con respecto a los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo, en esos casos es conveniente utilizar la mediana como medida de tendencia central. Cálculo de la mediana (�̃�) Para datos crudos y Arreglo de frecuencias: Debemos tener en cuenta lo siguiente si la cantidad de datos es par o impar: ✓ Impar: la �̃�pertenece al conjunto de datos ✓ Par: la �̃�es un valor agregado determinado por la semisuma de los datos centrales Procedimiento: 1) Se listan los datos de forma ascendente o descendente 2) Se determina la ubicación de la �̃� • Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2 una vez que los datos han sido ordenados (en orden creciente o decreciente), porque éste es el valor central. Es decir: �̃� = 𝑥 𝑛+1 2 Por ejemplo, si tenemos 5 datos, que ordenados son: 𝑥1 = 3 𝑥2 = 6 𝑥3 = 7 𝑥4 = 8 𝑥5 = 9 Página 6 de 10 El valor central es el tercero, puesto que: �̃� = 𝑥 5+1 2 = 𝑥3 = 7 • Si n es par, la mediana es la media aritmética de los dos valores centrales. Cuando n es par, los dos datos que están en el centro de la muestra ocupan las posiciones n/2 y (n/2)+1. Es decir que: �̃� = 𝑥𝑛 2 + 𝑥𝑛 2 +1 2 Tomemos como ejemplo las calificaciones de 1ro 4ta, recuerden que n=30: 4 5 6 6 6 6 7 7 7 7 7 7 7 7 X15 = 8 X16 = 8 8 8 8 8 8 8 9 9 9 9 10 10 10 10 En este caso los valores centrales (8 y 8) se encuentran en la posición 15 y 16 ya que: 𝑛 2 = 30 2 = 15 𝑦 𝑛 2 + 1 = 30 2 + 1 = 16 Aplicamos la formula y calculamos la mediana: �̃� = 𝑥30 2 +𝑥30 2 +1 2 = 𝑥15+𝑥16 2 = 8+8 2 = 16 2 = 8 Para datos agrupados: La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre 𝑛 2 Página 7 de 10 La fórmula para encontrar la mediana en datos agrupados es: �̃� = 𝐿𝑖 + 𝑛 2 + 𝐹𝑖−1 𝑓𝑖 𝑎𝑖 Dónde: • 𝐿𝑖 es el límite inferior de la clase donde se encuentra la mediana • 𝑛 2 es la semisuma de las frecuencias absolutas. • 𝑓𝑖 es la frecuencia absoluta de la clase donde se encuentra la mediana. • 𝐹𝑖−1 es la frecuencia acumulada anterior a la clase donde se encuentra la mediana. • 𝑎𝑖 es la amplitud de la clase. Ejemplo: Calculemos la mediana de la altura de los estudiantes de 1ro 4ta Intervalos de clase Marca de clase Xi Frecuencia absoluta fi Frecuencia acumulada Fi [155 ; 161) 158 1 1 [161 ; 167) 164 6 7 [167 ; 173) 170 10 17 [173 ; 179) 176 4 21 [179 ; 185) 182 7 28 [185 ; 191) 188 2 30 Página 8 de 10 1. Tenemos que buscar el intervalo en el que se encuentre 𝑛 2 𝑛 2 = 30 2 = 15 Entonces podemos ver que la mediana se encuentra en el intervalo [167 ; 173) 2. Aplicamos la fórmula: �̃� = 167 + 15 + 7 170 𝑥 6 = 167,77 𝑐𝑚 Podemos ver quela mediana se aproxima a la media pero no necesariamente tienen que ser iguales. Características de la mediana 1. Es un promedio de posición no afectado por los valores extremos. 2. No está definida algebraicamente 3. La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de tendencia central. 2.1.3 La Moda (Mo) Es el valor de un conjunto de datos que ocurre más frecuentemente, se considera como el valor más típico de una serie de datos. Es el valor que tiene mayor frecuencia absoluta. La moda puede no ser única, las distribuciones que presentan dos o más máximos relativos se designan de modo general como bimodales o multimodales. Calculo de la Moda (Mo) Para datos crudos En este caso la moda se determina por observación de los datos. Ejemplo: observamos la tabla de frecuencia de calificaciones de 1ro 4ta y ubicamos el mayor valor de la frecuencia absoluta. Página 9 de 10 xi Frecuencia absoluta fi 4 1 5 1 6 4 7 8 8 8 9 4 10 4 Para este ejemplo la Moda es 7 y 8 (Bimodal) ya que la frecuencia absoluta es la misma para ambos y es la mayor. Para datos agrupados: Aplicamos la siguiente fórmula: 𝑀𝑜 = 𝐿𝑖 + 𝑓𝑖+1 𝑓𝑖−1 + 𝑓𝑖+1 𝑎𝑖 Dónde: • 𝐿𝑖 es el límite inferior de la clase donde se encuentra la Moda. • 𝑓𝑖 es la frecuencia absoluta de la clase donde se encuentra la Moda. • 𝑓𝑖−1 es la frecuencia absoluta inmediatamente inferior a la clase donde está la Moda. • 𝑓𝑖+1 es la frecuencia absoluta inmediatamente posterior a la clase donde está la Moda. • 𝑎𝑖 es la amplitud de la clase. Página 10 de 10 Ejemplo: Calculemos la Moda de la altura de los estudiantes de 1ro 4ta Intervalos de clase Marca de clase Xi Frecuencia absoluta fi Frecuencia acumulada Fi [155 ; 161) 158 1 1 [161 ; 167) 164 6 7 [167 ; 173) 170 10 17 [173 ; 179) 176 4 21 [179 ; 185) 182 7 28 [185 ; 191) 188 2 30 𝑀𝑜 = 167 + 4 6 + 4 𝑥 6 = 169,4 𝑐𝑚 La moda es 169,4 cm Características de la moda 1. Representa más elementos que cualquier otro valor 2. La moda para una distribución de frecuencias de datos agrupados no puede ser calculada exactamente, el valor de la moda puede ser afectado por el método de agrupación de los intervalos de clase. 3. La moda no permite conocer la mayor parte de los datos 4. Puede usarse para datos cuantitativos como cualitativos 5. Cuando se tienen dos o más modas es difícil su interpretación IMPORTANTE: en el caso de que una muestra no tenga moda es un error decir que Mo= 0, decir que es igual a cero, es decir que el dato que más se repite es el valor “cero”. Simplemente hay que decir que la muestra no tiene Moda
Compartir