Logo Studenta

Apunte Analisis Cuantitativo

¡Estudia con miles de materiales!

Vista previa del material en texto

Página 1 de 10 
 
 
Unidad 7: Análisis Cuantitativo 
CLASE 2 
 
En esta nueva clase comenzaremos con el análisis estadístico propiamente dicho, 
comenzaremos con los conceptos fundamentales de las medidas de tendencia central, que son 
fundamentales en estadística. ¡Comencemos! 
 
2.2 Medidas de tendencia central y de posición 
 Con estas medidas se persigue reducir en pocas cifras significativas el conjunto de 
observaciones de una variable y describir con ellas ciertas características de los conjuntos, logrando 
así una comparación más precisa de los datos que aquella que se puede conseguir con tablas y gráficas. 
Se emplean para: 
a) Representar a un conjunto mediante un solo valor y a través del se puede establecer el 
comportamiento del conjunto. Ejemplo: salario promedio de los habitantes de una ciudad, 
gasto promedio de una familia, etc. 
 
b) Efectuar comparaciones entre diferentes conjuntos estadísticos 
Ejemplo: comparar el promedio de edad de estudiantes de distintos cursos, comparar promedio de 
ventas mensuales entre dos o más empresas, etc. 
 
Medidas de tendencia central 
 Los promedios son una medida de posición que dan una 
descripción compacta de cómo están centrados los datos y una 
visualización más clara del nivel que alcanza la variable. Pueden 
servir de base para medir o evaluar valores extremos o raros y 
brinda mayor facilidad para efectuar comparaciones. 
 Es importante poner en relieve que la notación de promedio lleva implícita la idea de variación 
y que este número promedio debe cumplir con la condición de ser representativo del conjunto de 
datos. 
Página 2 de 10 
 
 El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás 
valores de la variable. 
 
2.1.1 Media Aritmética (�̅� ) 
 Es una medida matemática, un número individual que representa razonablemente el 
comportamiento de todos los datos. 
 Debemos distinguir si estamos trabajando con datos crudos o si los datos están bajo arreglo o 
distribución de frecuencia. 
Cálculo de (�̅� ) 
Para datos crudos: 
�̅� = 
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
𝑛
 
�̅� =
∑ 𝑥𝑖
𝑛
𝑖=1
𝑛
 
Donde n es la cantidad de datos. 
Ejemplo: 
Recordemos las calificaciones de 1ro 4ta. 
4 5 6 6 6 6 7 7 7 7 
7 7 7 7 8 8 8 8 8 8 
8 8 9 9 9 9 10 10 10 10 
 Para calcular la media, hay que sumar todas las calificaciones y dividirlas por el número de 
datos, para este caso n=30 
 
�̅� =
229
30
= 7,633 
 
 
 
Página 3 de 10 
 
Para Arreglo y distribución de frecuencias: 
 
�̅� =
𝑓1𝑥1 + 𝑓2𝑥2 + 𝑓3𝑥3 + ⋯ + 𝑓𝑛𝑥𝑛
𝑛
 
�̅� =
∑ 𝑓𝑖𝑥𝑖
𝑛
𝑖=1
𝑛
 
 Volvamos a ver la tabla de distribución de frecuencias. A efectos práctico solo veremos las 
frecuencias absolutas. 
xi 
Frecuencia 
absoluta 
fi 
4 1 
5 1 
6 4 
7 8 
8 8 
9 4 
10 4 
 
�̅� =
1𝑥4 + 1𝑥5 + 4𝑥6 + 8𝑥7 + 8𝑥8 + 4𝑥9 + 4𝑥10
30
=
229
30
= 7,633 
 
Podemos concluir que en promedio los estudiantes de 1ro 4ta tienen una calificación igual a 7,633 
 
 
 
 
 
 
 
 
 
 
Página 4 de 10 
 
Para distribución de frecuencias agrupadas: 
Tomemos como ejemplo la tabla de distribución de frecuencias agrupadas de las estaturas de 
los estudiantes de 1ro 4ta. 
 
Intervalos de clase 
 
Marca de clase 
Xi 
 
Frecuencia absoluta 
fi 
[155 ; 161) 158 1 
[161 ; 167) 164 6 
[167 ; 173) 170 10 
[173 ; 179) 176 4 
[179 ; 185) 182 7 
[185 ; 191) 188 2 
 
Para este caso en particular tengan en cuenta que se multiplica cada frecuencia absoluta por 
la marca de clase correspondiente, se suman y luego se divide por el número total de datos. 
 
 
�̅� =
1𝑥158 + 6𝑥164 + 10𝑥170 + 4𝑥176 + 7𝑥182 + 2𝑥188
30
=
5196
30
= 173,2 𝑐𝑚 
 
 
Podemos decir que en promedio los estudiantes de 1ro 4ta tienen una altura de 173,2 cm 
 
Características de la media: 
1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta la 
media. 
2. Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser 
afectada por los valores extremos, y de esa forma llegar a ser una medida menos 
representativa, por lo que, si la distribución es asimétrica, la media aritmética no constituye 
un valor típico. 
3. Cada uno de los datos del conjunto puede ser sustituido por la media aritmética ( X ) sin que 
se altere el valor de esta, ni la suma de los valores de los conjuntos. 
 
Página 5 de 10 
 
 
4. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y solo una 
media aritmética 
 
2.1.2 LA MEDIANA (�̃�) 
Es la medida de tendencia central que por su 
ubicación dentro del conjunto de datos lo divide 
exactamente a la mitad. Geométricamente la mediana 
es el valor de la variable que corresponde a la vertical 
que divide al histograma en dos áreas iguales. 
 Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños 
con respecto a los demás, entonces la media aritmética se puede distorsionar y perder su carácter 
representativo, en esos casos es conveniente utilizar la mediana como medida de tendencia central. 
 
Cálculo de la mediana (�̃�) 
Para datos crudos y Arreglo de frecuencias: 
Debemos tener en cuenta lo siguiente si la cantidad de datos es par o impar: 
✓ Impar: la �̃�pertenece al conjunto de datos 
✓ Par: la �̃�es un valor agregado determinado por la semisuma de los datos centrales 
Procedimiento: 
1) Se listan los datos de forma ascendente o descendente 
2) Se determina la ubicación de la �̃� 
• Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2 una vez que los datos 
han sido ordenados (en orden creciente o decreciente), porque éste es el valor central. Es 
decir: 
�̃� = 𝑥
 
𝑛+1
2
 
Por ejemplo, si tenemos 5 datos, que ordenados son: 
𝑥1 = 3 𝑥2 = 6 𝑥3 = 7 𝑥4 = 8 𝑥5 = 9 
 
 
Página 6 de 10 
 
El valor central es el tercero, puesto que: 
 
�̃� = 𝑥
 
5+1
2
= 𝑥3 = 7 
• Si n es par, la mediana es la media aritmética de los dos valores centrales. Cuando n es par, 
los dos datos que están en el centro de la muestra ocupan las posiciones n/2 y (n/2)+1. Es 
decir que: 
 �̃� = 
𝑥𝑛
2
+ 𝑥𝑛
2
+1
2
 
Tomemos como ejemplo las calificaciones de 1ro 4ta, recuerden que n=30: 
 
4 5 6 6 6 6 7 7 7 7 
7 7 7 7 X15 = 8 X16 = 8 8 8 8 8 
8 8 9 9 9 9 10 10 10 10 
 En este caso los valores centrales (8 y 8) se encuentran en la posición 15 y 16 ya que: 
𝑛
2
=
30
2
= 15 𝑦 
𝑛
2
+ 1 =
30
2
+ 1 = 16 
 Aplicamos la formula y calculamos la mediana: 
 �̃� = 
𝑥30
2
+𝑥30
2 +1
2
=
𝑥15+𝑥16
2
=
8+8
2
=
16
2
= 8 
 
Para datos agrupados: 
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad 
de la suma de las frecuencias absolutas. 
Es decir tenemos que buscar el intervalo en el que se encuentre 
𝑛
2
 
 
 
Página 7 de 10 
 
 
 La fórmula para encontrar la mediana en datos agrupados es: 
 
�̃� = 𝐿𝑖 +
𝑛
2
+ 𝐹𝑖−1
𝑓𝑖
 𝑎𝑖 
Dónde: 
• 𝐿𝑖 es el límite inferior de la clase donde se encuentra la mediana 
• 
𝑛
2
 es la semisuma de las frecuencias absolutas. 
• 𝑓𝑖 es la frecuencia absoluta de la clase donde se encuentra la mediana. 
• 𝐹𝑖−1 es la frecuencia acumulada anterior a la clase donde se encuentra la mediana. 
• 𝑎𝑖 es la amplitud de la clase. 
 
Ejemplo: Calculemos la mediana de la altura de los estudiantes de 1ro 4ta 
Intervalos de clase 
 
Marca de clase 
Xi 
 
Frecuencia absoluta 
fi 
Frecuencia acumulada 
Fi 
[155 ; 161) 158 1 1 
[161 ; 167) 164 6 7 
[167 ; 173) 170 10 17 
[173 ; 179) 176 4 21 
[179 ; 185) 182 7 28 
[185 ; 191) 188 2 30 
 
 
 
 
Página 8 de 10 
 
1. Tenemos que buscar el intervalo en el que se encuentre 
𝑛
2
 
𝑛
2
=
30
2
= 15 
 Entonces podemos ver que la mediana se encuentra en el intervalo [167 ; 173) 
2. Aplicamos la fórmula: 
�̃� = 167 +
15 + 7
170
 𝑥 6 = 167,77 𝑐𝑚 
Podemos ver quela mediana se aproxima a la media pero no necesariamente tienen que ser iguales. 
 
Características de la mediana 
1. Es un promedio de posición no afectado por los valores extremos. 
2. No está definida algebraicamente 
3. La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de 
tendencia central. 
 
2.1.3 La Moda (Mo) 
 Es el valor de un conjunto de datos que ocurre más frecuentemente, se 
considera como el valor más típico de una serie de datos. 
Es el valor que tiene mayor frecuencia absoluta. 
 La moda puede no ser única, las distribuciones que presentan dos o más 
máximos relativos se designan de modo general como bimodales o multimodales. 
 
Calculo de la Moda (Mo) 
Para datos crudos 
En este caso la moda se determina por observación de los datos. 
Ejemplo: observamos la tabla de frecuencia de calificaciones de 1ro 4ta y ubicamos el mayor valor de 
la frecuencia absoluta. 
 
Página 9 de 10 
 
 
xi 
Frecuencia 
absoluta 
fi 
4 1 
5 1 
6 4 
7 8 
8 8 
9 4 
10 4 
 
Para este ejemplo la Moda es 7 y 8 (Bimodal) ya que la frecuencia absoluta es la misma para 
ambos y es la mayor. 
 
Para datos agrupados: 
Aplicamos la siguiente fórmula: 
 
𝑀𝑜 = 𝐿𝑖 +
𝑓𝑖+1
𝑓𝑖−1 + 𝑓𝑖+1
 𝑎𝑖 
Dónde: 
• 𝐿𝑖 es el límite inferior de la clase donde se encuentra la Moda. 
• 𝑓𝑖 es la frecuencia absoluta de la clase donde se encuentra la Moda. 
• 𝑓𝑖−1 es la frecuencia absoluta inmediatamente inferior a la clase donde está la Moda. 
• 𝑓𝑖+1 es la frecuencia absoluta inmediatamente posterior a la clase donde está la Moda. 
• 𝑎𝑖 es la amplitud de la clase. 
 
 
Página 10 de 10 
 
 
Ejemplo: Calculemos la Moda de la altura de los estudiantes de 1ro 4ta 
Intervalos de clase 
 
Marca de clase 
Xi 
 
Frecuencia absoluta 
fi 
Frecuencia acumulada 
Fi 
[155 ; 161) 158 1 1 
[161 ; 167) 164 6 7 
[167 ; 173) 170 10 17 
[173 ; 179) 176 4 21 
[179 ; 185) 182 7 28 
[185 ; 191) 188 2 30 
 
𝑀𝑜 = 167 +
4
6 + 4
 𝑥 6 = 169,4 𝑐𝑚 
 
La moda es 169,4 cm 
Características de la moda 
1. Representa más elementos que cualquier otro valor 
2. La moda para una distribución de frecuencias de datos agrupados no puede ser calculada 
exactamente, el valor de la moda puede ser afectado por el método de agrupación de los 
intervalos de clase. 
3. La moda no permite conocer la mayor parte de los datos 
4. Puede usarse para datos cuantitativos como cualitativos 
5. Cuando se tienen dos o más modas es difícil su interpretación 
 
 
 
IMPORTANTE: en el caso de que una muestra no tenga moda es un error decir que Mo= 0, decir 
que es igual a cero, es decir que el dato que más se repite es el valor “cero”. Simplemente hay 
que decir que la muestra no tiene Moda

Continuar navegando