Medidas de Centralizacion y Dispersión _ Clase

Probabilidad y Estadística

•

SIN SIGLA

0

Gimena Arias

5/9/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Probabilidad y Estadística

29.917 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Estadística Descriptiva
Medidas de Centralización y 
Dispersión
Medidas de Centralización
Dan un valor central de la distribución de frecuencias, siendo un valor que se puede
tomar como representativo de todos los datos. Hay diferentes modos para definir el
"centro" de las observaciones en un conjunto de datos. Algunas de las medidas
son:
Promedio o Media 
➢ Es la medida de posición más frecuentemente usada. Se usa para datos
numéricos.
➢ Podemos imaginar a los datos como un sistema físico, en el que cada dato
tiene una "masa" unitaria y lo ubicamos sobre una barra en la posición
correspondiente a su valor. La media representa la posición en que se debería
ubicar el punto de apoyo para que el sistema esté en equilibrio.
➢ La suma de las distancias de los datos a la media es cero. Esta propiedad está
relacionada con el hecho que la media es el centro de gravedad de los datos.
➢ Es muy sensible a la presencia de datos atípicos. En este caso la media no es una
buena medida de posición de los datos.
➢ Se Calcula: തx =
σ
i
xi
n
Ejemplo: 
Número de llamadas que entran a una Central Telefónica por minuto: 84, 91, 72, 68, 
87 y 78. Hallar la media muestral
n = 6 y se calcula la media
തx =
84+91+72+68+87+78
6
= 
480
6
= 80 llamadas por minuto
Verificaremos que la suma de las distancias a la media es cero:
(84 – 80) + (91-80) + (72-80) + (68-80) + (87-80) + (78-80) = 4 +11 – 8 – 12 + 7 – 2 = 0
Diap. 5
➢ Cuando la información esta tabulada en intervalos de clase, es decir, datos
agrupados, la media se calcula reemplazando xi por la marca de clase mi,
entonces: തx =
σimi fi
n
Ejemplo: En la siguiente tabla se muestran las edades de un grupo de personas
Edad Marca clase fi Fi
[0-10) 5 3 3
[10-20) 15 6 9
[20- 30) 25 7 16
[30-40) 35 12 28
[40 - 50) 45 3 31
Calculamos la media: n = 31, entonces 
തx =
5 . 3 + 15 . 6 + 25 . 7 + 35 . 12 + 45 . 3
31
= 26,94 años
Diap. 5
Media datos no agrupados
Media datos agrupados
0
0,2
0,4
0,6
0,8
1
1,2
68 72 78 84 87 91
f
0
5
10
15
5 15 25 35 45
f
Diap. 3 Diap. 4
.
.
Mediana Muestral
La mediana es el dato que ocupa la posición central en la muestra ordenada de
menor a mayor. se puede hallar sólo para variables cuantitativas.
❑ Se ordenan los datos de menor a mayor.
❑ La mediana es el dato que ocupa la posición
n+1
2
en la lista ordenada.
➢Si el número de datos es impar, la mediana ( �ු� o Me ) es el dato que ocupa la
posición central, es decir, Me = xු = xn+1
2
➢Si el número de datos es par, la mediana ( �ු� o Me ) es el promedio de los dos
datos centrales: Me = xු =
xn
2
+ xn
2
+1
2
Diap. 7
Ejemplo: 
✓ Para n impar
Hallar la mediana de la siguiente serie de números: 3,5,2,6,5,9,5,2,8
Primero se ordenan de menor a mayor, entonces queda: 2,2,3,5,5,5,6,8,9
n = 9 , Me = xු = xn+1
2
= 5
✓ Para n par
El número de llamadas que entran a una Central Telefónica por minuto: 84, 91, 72, 
68, 87 y 78. Primero se ordenan de menor a mayor, entonces queda:
68, 72, 78, 84, 87, 91 
n = 6 , entonces Me = xු = 
xn
2
+ xn
2
+1
2
= 
x3 + x4
2
= 
78+84
2
= 81
Diap. 6
0
2
4
2 3 5 6 8 9
f
0
0,5
1
1,5
68 72 78 84 87 91
f
➢ Para datos agrupados, la mediana se encuentra en el intervalo donde la
frecuencia acumulada llega hasta la mitad de la suma de las frecuencias
absolutas, es decir, se tiene que buscar el intervalo en el que se encuentre
n / 2. Además, se puede calcular con la siguiente fórmula:
xු = Me = Li +
n
2
− Fi−1
fi
Ai
Donde:
▪ Li es el límite inferior de la clase donde se encuentra la mediana.
▪ n / 2 es la semisuma del número de datos.
▪ Fi - 1 es la frecuencia acumulada anterior del intervalo de clase donde se
encuentra la mediana.
▪ fi es la frecuencia absoluta del intervalo donde se encuentra la mediana.
▪ Ai es la amplitud de los intervalos.
Diap. 9
Ejemplo:
Hallar la mediana en la siguiente tabla que se muestran las edades de un grupo de
personas. Edad Marca clase fi Fi
[0-10) 5 3 3
[10-20) 15 6 9
[20- 30) 25 7 16
[30-40) 35 12 28
[40 - 50) 45 3 31
Se identificar la clase que contiene la mediana, para ello se busca el intervalo en el que
se encuentre n / 2 = 31/2 = 15,5.
Edad Marca clase fi Fi
[0-10) 5 3 3
[10-20) 15 6 9
[20- 30) 25 7 16
[30-40) 35 12 28
[40 - 50) 45 3 31
Reemplazando en la fórmula, queda:
xු = Me = 20 +
15,5−9
7
10 = 29,285
Diap. 8
0
5
10
15
5 15 25 35 45
f
Moda Muestral
La moda (M0), es el valor de la variable que más veces se repite, es decir, no
necesariamente es un único valor.
Ejemplo:
Hallar la moda de la siguiente serie de números: 3,5,2,6,5,9,5,2,8
Primero se ordenan de menor a mayor, entonces queda: 2,2,3,5,5,5,6,8,9
Mo = 5
0
1
2
3
4
2 3 5 6 8 9
f
➢ Para datos agrupados, la moda se encuentra en el intervalo de clase que contiene
la mayor frecuencia absoluta de los datos, se calcula:
Mo = Li +
fi−1
fi−1 + fi+1
Ai
Donde:
▪ Li es el límite inferior del intervalo de clase donde se encuentra la moda.
▪ fi - 1 es la frecuencia absoluta anterior del intervalo de clase donde se encuentra 
la moda.
▪ fi +1 es la frecuencia absoluta del intervalo posterior del intervalo de clase donde 
se encuentra la moda.
▪ Ai es la amplitud de los intervalos
Diap. 12
Diap. 11 
Ejemplo:
Hallar la moda en la siguiente tabla que se muestran las edades de un grupo de
personas. Edad Marca clase fi Fi
[0-10) 5 3 3
[10-20) 15 6 9
[20- 30) 25 7 16
[30-40) 35 12 28
[40 - 50) 45 3 31
El intervalo que contiene a la moda es: Edad Marca clase fi Fi
[0-10) 5 3 3
[10-20) 15 6 9
[20- 30) 25 7 16
[30-40) 35 12 28
[40 - 50) 45 3 31
Reemplazando en la fórmula, queda:
Mo = 30 +
7
7 + 3
10 = 37
0
5
10
15
5 15 25 35 45
f
Medidas de Dispersión
Las medidas de dispersión cuantifican la separación, la variabilidad de los valores de
la distribución respecto al valor central.
Algunas de estas medidas son:
➢ Recorrido o Rango Muestral
Es la diferencia entre el valor de la observación mayor y la observación menor.
Re = xmax - xmjn
➢ Varianza (s2)
Es el promedio del cuadrado de las distancias entre cada observación y la media del
conjunto de observación
s2 =
σi xi − തx
2 fi
n − 1
✓ Si los datos están agrupados se utiliza la marca de clase mi en vez de xi , es decir:
s2 =
σi mi − തx
2 fi
n − 1
➢ Desviación Típica (s)
La varianza viene dada por las mismas unidades que la variable, pero al cuadrado, para
evitar este problema se puede usar como medida de dispersión la desviación típica que
se define:
s = s2, o sea s =
σi xi− തx
2 fi
n−1 Diap. 16 Diap. 17 
Diap. 15
Ejemplo: 
El número de llamadas que entran a una Central Telefónica por minuto: 84, 91, 72, 68,
87 y 78. Hallar la varianza y la Desviación Típica o Estándar.
n = 6 y തx = 80
s2=
(84−80)2+(91−80)2+(72 −80)2+(68−80)2+(87 −80)2+(78 −80)2
5 =
16 + 121 + 64 + 144 + 49 + 4
5
=
398
5
= 79,6 (llamadas por minuto)2
s = s2 = 79,6 Kg2 = 8,9 llamadas por minuto
Desviación Desviación
Ejemplo para datos agrupados
En la siguiente tabla se muestran las edades de un grupo de personas
Edad Marca clase fi Fi
[0-10) 5 3 3
[10-20) 15 6 9
[20- 30) 25 7 16
[30-40) 35 12 28
[40 - 50) 45 3 31
Calcular la varianza y la desviación típica o estándar, sabiendo que n = 31 y
തx = 26,94 años
s2 =
5 − 26,94 2. 3 + 15 − 26,94 2. 6 + 25 − 26,94 2. 7 + 35 − 26,94 2. 12 + 45 − 26,94 2 . 3
30
s2 =
1444,11 +855,36+26,32+779,52+978,48
30
=
4083,79
30
= 136,13 años2 , entonces
s = 136,13 años2 = 11,67 años
Diap. 15
0
5
10
15
5 15 25 35 45
f
DesviaciónDesviación