Medidas de Centralización y Dispersión

Probabilidad y Estadística

•

SIN SIGLA

0

Gimena Arias

5/9/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Probabilidad y Estadística

29.919 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Medidas de Centralización 
Nos dan un valor central de la distribución de frecuencias, es un valor que se puede tomar como 
representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un 
conjunto de datos. Algunas de las medidas son: 
 
Promedio o Media 
Es la medida de posición más frecuentemente usada. 
a) Se usa para datos numéricos. 
b) Representa el centro de gravedad o el punto de equilibrio de los datos. 
Podemos imaginar a los datos como un sistema físico, en el que cada dato tiene una "masa" unitaria y lo 
ubicamos sobre una barra en la posición correspondiente a su valor. La media representa la posición en que 
se debería ubicar el punto de apoyo para que el sistema esté en equilibrio. 
c) La suma de las distancias de los datos a la media es cero. Esta propiedad está relacionada con el hecho 
que la media es el centro de gravedad de los datos. 
c) Es muy sensible a la presencia de datos atípicos Con solo modificar un dato la media se desplaza. En 
este caso la media no es una buena medida de posición de los datos. 
Se Calcula: 
�̅� = 
∑ 𝑥𝑖𝑖
𝑛
 
No siempre se conocen todos los datos, la información viene tabulada agrupada en intervalos de clase, a 
esto se lo conoce como datos agrupados. 
Para datos agrupados, se reemplaza xi por la marca de clase mi, (es el punto medio del intervalo de clase) 
entonces queda �̅� = 
∑ 𝑚𝑖 𝑓𝑖𝑖
𝑛
 
 
Mediana Muestral 
La mediana es el dato que ocupa la posición central en la muestra ordenada de menor a mayor. 
se puede hallar sólo para variables cuantitativas. 
1. Se ordenan los datos de menor a mayor. 
2. La mediana es el dato que ocupa la posición (
𝑛+1
2
) en la lista ordenada. 
• Si el número de datos es impar, la mediana ( 𝑥 o Me ) es el dato que ocupa la posición central. 
• Si el número de datos es par, la mediana ( 𝑥 o Me ) es el promedio de los dos datos centrales. 
 
Para datos agrupados, la mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta 
la mitad de la suma de las frecuencias absolutas, es decir, se tiene que buscar el intervalo en el que se 
encuentre. n / 2 . Luego se puede calcular con la siguiente fórmula: 
 
Me = Li + 
n
2
− Fi−1
fi
 Ai 
Donde: 
 
• Li es el límite inferior de la clase donde se encuentra la mediana. 
• n / 2 es la semisuma de los datos. 
• Fi - 1 es la frecuencia acumulada anterior del intervalo de clase donde se encuentra la mediana. 
• fi es la frecuencia absoluta del intervalo donde se encuentra la mediana. 
• Ai es la amplitud de los intervalos. 
 
Ejemplo: En la siguiente tabla se muestran las edades de un grupo de personas. 
 
Edad Marca clase fi Fi 
[0-10) 5 3 5 
[10-20) 15 6 9 
[20- 30) 25 7 16 
[30-40) 35 12 28 
[40 - 50) 45 3 31 
 
 
1. Calculemos la media aritmética: n = 31 entonces 
 
�̅� = 
5 . 3 + 15 . 6 + 25 . 7 + 35 . 12 + 45 . 3
31
= 26,94 
 
2. Calculemos la mediana (Me). Lo primero que se debe hacer para poder calcular la mediana es 
identificar la clase que contiene la mediana, se busca el intervalo en el que se encuentre n / 2 
en este caso n/ 2 = 3 1 / 2 = 15,5. 
Se debe buscar el intervalo donde la frecuencia acumulada (F¡) contenga el valor obtenido (15,5). 
La clase que lo contiene es la que esta remarcada en la tabla. 
 
Edad Marca clase fi Fi 
[0-10) 5 3 5 
[10-20) 15 6 9 
[20- 30) 25 7 16 
[30-40) 35 12 28 
[40 - 50) 45 3 31 
 
 Reemplazando en la fórmula, queda: 
Me = 20 + 
15,5 − 9
7
 10 = 29,285 
Moda 
La moda (M0), es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta 
es mayor. No tiene por qué ser única. 
 
 
Para datos agrupados, la moda se encuentra en el intervalo de clase que contiene la mayor frecuencia 
absoluta de los datos, se calcula: 
 
Mo = Li + 
fi−1
fi−1 + fi+1 
 Ai 
Donde: 
• Li es el límite inferior del intervalo de clase donde se encuentra la moda. 
• fi - 1 es la frecuencia absoluta anterior del intervalo de clase donde se encuentra la moda. 
• fi +1 es la frecuencia absoluta del intervalo posterior del intervalo de clase donde se encuentra la 
moda. 
• Ai es la amplitud de los intervalos 
 
Observando el ejemplo anterior, el intervalo que contiene a la moda es el que esta remarcado en la siguiente 
tabla: 
Edad Marca clase fi Fi 
[0-10) 5 3 5 
[10-20) 15 6 9 
[20- 30) 25 7 16 
[30-40) 35 12 28 
[40 - 50) 45 3 31 
 
Reemplazando en la fórmula, queda: 
 
Mo = 30 + 
7
7 + 3 
 10 = 37 
 
Se dice que una distribución es simétrica cuando coinciden la media, la mediana y la moda. 
 
Medidas de Dispersión 
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las 
medidas de dispersión nos dicen hasta qué punto estas medidas de tendencia central son representativas 
como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la 
variabilidad de los valores de la distribución respecto al valor central. Algunas de estas medidas son: 
 
Varianza 
La varianza (s2), es el promedio del cuadrado de las distancias entre cada observación y la media aritmética 
del conjunto de observación 
 
𝑠2 = 
∑ (𝑥𝑖 − �̅�)
2 𝑓𝑖𝑖
𝑛 − 1
 
Si los datos están agrupados se utiliza la marca de clase mi en vez de xi , es decir, 
 
𝑠2 = 
∑ (𝑚𝑖 − �̅�)
2 𝑓𝑖𝑖
𝑛 − 1
 
 
Desviación Típica (s) 
La varianza viene dada por las mismas unidades que la variable, pero al cuadrado, para evitar este problema 
podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva 
de la varianza, es decir: 
 
𝑠 = √𝑠2, o sea s = √
∑ (𝑥𝑖− �̅�)2 𝑓𝑖𝑖
𝑛−1
 
 
Recorrido o Rango Muestral 
El Recorrido o Rango Muestral (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. 
Re = xmax - xmjn