Logo Studenta

Medidas de Dispersão em Estatística Descritiva

¡Este material tiene más páginas!

Vista previa del material en texto

Docente: Ing. Marta Almada
Análisis de los datos no agrupados y agrupados (medida de dispersión)
RETROALIMENTACIÓN 
• Estadística descriptiva 
• Clasificación de Variables 
• Organización de los datos en la tabla de frecuencias
• Análisis de los datos no agrupados y agrupados: (Medidas de Tendencia Central)
BIOESTADISTICA E Informática
En estadística, las medidas de dispersión es el
grado en que una distribución se estira o exprime.
La varianza: Es la desviación cuadrada de la media.
Medidas de Dispersión
DATOS NO AGRUPADOS DATOS AGRUPADOS
S²=
∑(𝐱−𝐱 )²
𝐧−𝟏
muestra
σʹ=
∑(𝐱−𝐱 )²
𝐧
poblacion
S²=
∑ 𝐱− 𝐱 2∗𝐟𝐢
𝐧−𝟏
muestra
σʹ=
∑ 𝐱− 𝐱 2∗𝐟𝐢
𝐧
población
S²: es el símbolo de la varianza
X: es el punto medio de la clase
f: es la frecuencia de clase.
n: es el número de observaciones
 𝐱 : designa la media muestral.
La desviación estándar: Es la raíz cuadrada de la
varianza.
Rango: Es la más elemental de las medidas, es la
diferencia entre el dato mayor y el dato menor.
Medidas de Dispersión
FORMULAS
S= S² muestra
σ= σ² poblacion
R= Vmax-Vmin
Coeficiente de variación: es una medida estadística
que nos informa acerca de la dispersión relativa de
un conjunto de datos. Su cálculo se obtiene de dividir
la desviación típica entre el valor absoluto de la
media del conjunto y por lo general se expresa en
porcentaje para su mejor comprensión.
Cv=
𝒔
𝐱
*100
Medidas de Dispersión
EJEMPLO 01 
Banco continental seleccionó una muestra de 20 cuentas de cheques de estudiantes. A
continuación aparecen sus saldos en dólares de fin de mes.
Determine la media, la varianza y la desviación estándar de la siguiente distribución de
frecuencias.
5 7 8 9 8
10 8 5 7 5
9 10 20 9 15
15 20 9 15 9
Saldos
x 
5
7
8
9
10
15
20
sumatoria
Frecuencia Ab.
fi
3
2
3
5
2
3
2
20
D
A
T
O
S
N
O
A
G
R
U
P
A
D
O
S
RESOLUCION
Producto
(x*fi)
15
14
24
45
20
45
40
203
Saldos
x 
5
7
8
9
10
15
20
sumatoria
(𝐱 − 𝐱 )²
(5 − 10)²= 25
7 − 10 2 =9
8 − 10 2= 4
9 − 10 2=1
10 − 10 2= 0
15 − 10 2=25
20 − 10 2 =100
164
Frecuencia 
fi
3
2
3
5
2
3
2
20
Rango R= Vmax-Vmin 20-5= 15
Coeficiente
de
variación:
Cv=
𝒔
𝐱
*100
(3/10)*100= 30%
Media (𝐱 )=
∑ 𝐱∗𝐟𝐢
𝐧
203
20
= 10
Varianza S²=
∑(𝐱−𝐱 )²
𝐧−𝟏
muestra =
164
19
= 9
Desviación
estándar
S= S² 9 = 3
x − x 2 ∗ fi
911,25
650,25
147
33,75
464,75
1058
3265
Media (𝐱 )=
∑ 𝒙 ∗ 𝒇𝒊
𝒏
𝟏𝟓𝟔𝟎
𝟔𝟎
= 𝟐𝟔 𝒂ñ𝒐𝒔
Varianza S²ʹ=
∑ 𝐱− 𝐱 2∗𝐟𝐢
𝐧−𝟏
S²=
𝟑𝟐𝟔𝟓
𝟓𝟗
= 55 años
Desviación estándar S= S² S= 55 = 7 años
Coeficiente de variación Cv=
S
𝐱
*100 Cv=
𝟕
𝟐𝟔
∗ 𝟏𝟎𝟎 = 27% heterogéneos
Rango R= vmax-vmin R=37,5-12,5= 25
Obtenemos una muestra de la edad de 60 personas, con los datos disponibles
calcular: la media, varianza, desviación estándar, rango y coeficiente de variación
Intervalos de Clases
Edades
L. I L. S
[10 15)
[15 20)
[20 25)
[25 30)
[30 35)
[35 40]
Total 
Marca 
de Clase 
x
12,5
17,5
22,5
27,5
32,5
37,5
Frecuencias 
Absoluta 
fi
5
9
12
15
11
8
60
(x*fi)
62,5
157,5
270
412,5
357,5
300
1560
x − x 2
12,5 − 26 2=182,25
72,25
12,25
2,25
42,25
132,25
EJEMPLO 02
EJERCICIOS 02
Obtenemos una muestra de peso en kilo gramo de 40 personas
a) Los datos aparecen en la siguiente tabla a continuación:
b) Determine la media, la varianza, desviación estándar,
coeficiente de variación y el rango.
PESO 
Li - Ls
Frecuencia 
fi
[33 - 36) 4
[36 – 39) 9
[39 - 42) 11
[42 - 45) 7
[45 - 48) 4
[48 - 51) 3
[51 - 54] 2
sumatoria 40
PESO 
Li - Ls
Frecuencia 
fi
Marca de C
x
(x*fi) 𝐱 − 𝐱 2 𝐱 − 𝐱 2 ∗ 𝐟𝐢
[33 - 36) 4 34,5 138 𝟑𝟒, 𝟓 − 𝟒𝟐 2=56,25 56,25*4=225
[36 – 39) 9 37,5 337,5 𝟑𝟕, 𝟓 − 𝟒𝟐 2=20,25 20,25*9=182,25
[39 - 42) 11 40,5 445,5 𝟒𝟎, 𝟓 − 𝟒𝟐 2=2,25 2,25*11=24,75
[42 - 45) 7 43,5 304,5 𝟒𝟑, 𝟓 − 𝟒𝟐 2=2,25 2,25*7=15,75
[45 - 48) 4 46,5 186 𝟒𝟔, 𝟓 − 𝟒𝟐 2=20,25 20,25*4=81
[48 - 51) 3 49,5 148,5 𝟒𝟗, 𝟓 − 𝟒𝟐 2=56,25 56,25*3=168,75
[51 - 54] 2 52,5 105 𝟓𝟐, 𝟓 − 𝟒𝟐 2=110,25 110,25*2=220,5
sumatoria 40 918
Media (𝐱 )=
∑ 𝒙 ∗ 𝒇𝒊
𝒏
𝟏𝟔𝟔𝟓
𝟒𝟎
= 42
Varianza S²ʹ=
∑ 𝐱− 𝐱 2∗𝐟𝐢
𝐧−𝟏
𝟗𝟏𝟖
𝟑𝟗
= 24
Desviación estándar S= S² 24 = 5
Coeficiente de variación Cv=
S
𝐱
*100
𝟓
𝟒𝟐
*100 = 12%
Rango R= vmax-vmin 52,5-34,4= 18,1
Conceptos básicos 
VARIABLE: Es lo que se va a medir y representa una
característica de la UNIDAD DE ANÁLISIS.
¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u
objetos o Unidades de Análisis de una Población o una
Muestra.
Muestra: 60 trabajadores de empresas de comunicación
Unidad de análisis: Trabajadores de empresa de comunicación
Variables: genero, edad, salario, Nº de horas de trabajo, etc. 
Población: 
“Las personas que trabajan
en una empresa de 
comunicación” 
Muestra
11
TIPOS DE VARIABLES
Variables Cuantitativas
DISCRETA
Variables Cualitativas
CONTINUA
Toma valores enteros 
Ejemplos: Número de Hijos, Número de 
empleados de una empresa, Número de 
asignaturas aprobadas en un semestre, etc.
Toma cualquier valor dentro de un intervalo 
Ejemplos: Peso; Estatura; Temperatura, etc.
ORDINALNOMINAL
Característica o cualidad 
cuyas categorías no tienen 
un orden preestablecido. 
Ejemplos: Genero, Deporte 
Favorito, etc.
Característica o cualidad cuyas 
categorías tienen un orden 
preestablecido. 
Ejemplos: Calificación (E, MB, B, 
A, I); Grado de Interés por un 
tema, etc.
Se apoya en las siguientes herramientas medidas de tendencias
central y medidas de dispersión.
Los datos referentes al peso de un grupo de 40 personas, tal
como aparecen a continuación, no revelan fácilmente ninguna
característica del grupo:
58, 52, 58, 50, 54, 54, 52, 58, 52, 54, 58, 54, 52, 58, 52, 50, 54,
58, 54, 56, 54, 56, 58, 52, 58, 54, 60, 54, 52, 56, 54, 60, 56, 50,
58, 52, 54, 58, 50 , 54
En cambio, los mismos datos ya elaborados, presentados en la
forma que sigue, permite formarse juicio bastante exacto, sobre
el conjunto de personas estudiadas:
EJEMPLO
Distribución de Datos en la tabla de frecuencias
58, 52, 58, 50, 54, 54, 52, 58, 52, 54, 58, 54, 52, 58, 52, 50, 54, 58, 54, 56,
54, 56, 58, 52, 58, 54, 60, 54, 52, 56, 54, 60, 56, 50, 58, 52, 54, 58, 50 , 54
Al resumir los datos en tal forma, algunos detalles sobre las variaciones
individuales se han perdido, pero las características generales del grupo se
han conservado y son mas aparentes.
Peso en kg
(x)
Nº de personas
(fi )
50 4
52 8
54 12
56 4
58 10
60 2
Sumatoria (n) 40
Medidas de tendencias central
La medida de centralización es un número situado
hacia en el centro de la distribución de los valores
de una serie de observaciones. El propósito de
esta medida consiste en señalar el centro de un
conjunto de valores mediante la moda, mediana,
media aritmética.
Aplicación en datos no agrupados
MODA (Mo): es el valor de la variable con mayor frecuencia
absoluta. Se puede calcular para cualquier tipo de variable.
Para calcularla basta con observar la columna de
frecuencias absolutas (fi).
Medidas de tendencias central
Medidas de tendencias central
Aplicación en datos no agrupados
MEDIANA: es el valor de la serie de datos que se sitúa justamente
en el centro de la muestra.
Cálculo de la mediana: Se busca en la columna de la frecuencia
absoluta acumulada el primer valor que supere la mitad de los datos
(n/2) si es par, o si es un numero impar se calcula de la siguiente
manera (n+1)/2 , la mediana será el valor que se corresponda con
esta frecuencia absoluta acumulada, si no se encuentra
exactamente ese valor, entonces el primer valor que supera al
resultado de la n/2 o n+1/2
Media aritmética (x)̄: también llamada promedio o
media, es la medida de centralización más conocida,
pero no se puede calcular para variables cualitativas.
Formula x̄ = ∑ (x*fi)
n
Medidas de tendencias central
Aplicación en datos no agrupados
EJEMPLO
Los datos referentes al peso de una muestra de 40 personas, tal comoaparecen a
continuación.
58, 52, 58, 50, 54, 54, 52, 58, 52, 54, 58, 54, 52, 58, 52, 50, 54, 58, 54, 56, 54, 56,
58, 52, 58, 54, 60, 54, 52, 56, 54, 60, 56, 50, 58, 52, 54, 58, 50 , 54.
Realizar los cálculos aplicando la formulas de las medidas de tendencias central
Peso en kg
(x)
Nº de 
personas
(fi )
F. 
Acumulada 
(Fi)
(x*fi)
50 4 4 200
52 8 12 416
54 12 24 648
56 4 28 224
58 10 38 580
60 2 40 120
Sumatoria 
(n) 
40 2188
Media
( x )=
∑ 𝑥∗𝑓𝑖
𝑛
 x =
2188
40
= 55kg
Moda
(Mo) 54 kg
Mediana Me=
𝑛
2
Me=
40
2
=
20 Me= 54 Kg
Moda: Es el valor que representa la mayor frecuencia absoluta. En tablas de
frecuencias con datos agrupados, hablaremos de intervalo modal.
La moda se representa por Mo.
Todos los intervalos tienen la misma amplitud
• Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia 
absoluta).
• fi Frecuencia absoluta del intervalo modal.
• fi-1 Frecuencia absoluta del intervalo anterior al modal.
• fi+1 Frecuencia absoluta del intervalo posterior al modal.
• ti Amplitud de los intervalos.
Medidas de tendencia central
Aplicación en datos agrupados
𝑀𝑜 = 𝐿𝑖 +
(𝑓𝑖−𝑓𝑖−1)
𝑓𝑖−𝑓𝑖−1 +(𝑓𝑖−𝑓𝑖+1)
*ti
Medidas de tendencia central
Aplicación en datos agrupados
EDAD
Frecuencia 
fi
[0-10) 3
[10-20) 6
[20-30) 6
[30-40) 12
[40-50] 4
sumatoria 31
𝑀𝑜 = 𝐿𝑖 +
(𝑓𝑖−𝑓𝑖−1)
𝑓𝑖−𝑓𝑖−1 +(𝑓𝑖−𝑓𝑖+1)
*ti
𝑀𝑜 = 30 +
(12−6)
12−6 +(12−4)
*10 𝑀𝑜 = 30 +
6
6+8
*10 =34
Mediana: Es el valor que ocupa el lugar central de todos los datos
cuando éstos están ordenados de menor a mayor. La mediana se
representa por Me. La mediana se puede hallar sólo para variables
cuantitativas.
Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las frecuencias
absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre si N
es par N / 2, si n es impar N+1/2
Medidas de tendencia central
Aplicación en datos agrupados
𝑀𝑒 = 𝐿𝑖 +
(
𝑛
2
−𝐹𝑖−1)
𝑓𝑖
*ti
N / 2
N +1/ 2 = 31+1 / 2 ⇒ 16
Observación:
Li-1 es el límite inferior de la clase donde se encuentra la mediana.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
fi es la frecuencia absoluta del intervalo mediano.
ti es la amplitud de los intervalos.
EDAD
Frecuencia 
fi
F. Acumulada 
Fi
[0-10) 3 3
[10-20) 6 9
[20-30) 6 15
[30-40) 12 27
[40-50] 4 31
sumatoria 31
𝑀𝑒 = 𝐿𝑖 +
(
𝑛+1
2
− 𝐹𝑖−1 )
𝑓𝑖
*ti
𝑀𝑒 = 30 +
(16−15)
12
*10
𝑀𝑒 = 30 +
1
12
*10= 31
PROMEDIO O MEDIA ARIMETICA: Se calcula
sumando todos los productos de marca de clase con
la frecuencia absoluta respectiva y su resultado
dividirlo por el número total de datos, es decir:
MARCA DE CLASE(x): Corresponde al promedio de
los extremos de los intervalos
Media (𝐱 )=
∑ 𝒙∗𝒇𝒊
𝒏
Medidas de tendencia central
Aplicación en datos agrupados
Medidas de tendencia central
Aplicación en datos agrupados
Media (𝐱 )= 
∑ 𝒙∗𝒇𝒊
𝒏
EDAD
Frecuencias 
fi
F. Acumulada 
Fi
Marca de 
clase (x)
Producto
(x*fi)
[0-10) 3 3 5 15
[10-20) 6 9 15 90
[20-30) 6 15 25 150
[30-40) 12 27 35 420
[40-50) 4 31 45 180
sumatoria
31 855
Media (𝐱 )= 
𝟖𝟓𝟓
𝟑𝟏
= 𝟐𝟖 Marca de C (𝐱 )= 
𝑳𝑺+𝑳𝑰
𝟐
Google realiza una prueba de mercado de su sitio web y le interesa saber
con qué facilidad se navega en su diseño de página web. Selecciona al
azar 200 usuarios frecuentes de internet y les pide que lleven a cabo una
búsqueda en la página web. A cada uno de ellos le solicita que califique la
relativa facilidad para navegar como mala, buena, excelente, regular. Los
resultados aparecen en la siguiente tabla:
a) ¿Qué tipo de escala de medición se emplea para facilitar la navegación?
b) Elabore una gráfica de barras con los resultados de la encuesta.
c) Construya una gráfica de pastel con los resultados de la encuesta.
Excelente 102
Buena 58
Regular 30
Mala 10
Total 200
EJERCICIOS Nº 02

Continuar navegando