Logo Studenta

EG_2021_I_Semana 04_Medidas de Variabilidad (1)

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA 
Dpto. de Estadística e Informática 
Semana 4. Medidas de variabilidad 
Inicio 
• Motivación 
• Logros 
• Saberes previos 
Desarrollo 
• Medidas de variabilidad 
• Propiedades de transformación de variables 
• Ejercicios resueltos 
Cierre 
• Ejercicios propuestos 
• Autoevaluación (Moodle) 
2 
3 
Los productores de leche del valle de Cajamarca: 
 ¿Su producción diaria de leche (litros) por productor, es muy 
similar? 
 ¿La producción diaria de leche (litros), con la raza Hoistein es 
más variable que con la raza Jersey? 
 
 
4 
¿Qué se entiende por variabilidad en un conjunto de 
datos? 
¿Porqué es importante medir la variabilidad? 
¿Para qué sirven las medidas de variabilidad? 
Al término de la sesión, el estudiante estará en capacidad de: 
 
Calcular e interpretar medidas de variabilidad. 
Comparar la variabilidad de varios conjunto de datos. 
Aplicar las propiedades de transformación de variables. 
Resolver ejercicios propuestos. 
Autoevaluación (Aula virtual) 
Ejemplos, ejercicios resueltos y propuestos 
Transformación de variables 
Coeficiente de variabilidad 
Variancia y desviación estándar 
Rango y Rango intercuatil 
5 
Son medidas de variabilidad permiten conocer el grado de 
dispersión o variabilidad dentro de un conjunto de datos. 
Se usan para comparar la variabilidad entre dos o más 
conjuntos de datos. Cuando los datos presentan baja 
variabilidad, se dice que son homogéneos y cuando 
presentan alta variabilidad se dice que son heterogéneos. 
Las principales medidas de variabilidad son las siguientes: 
 
•La amplitud o rango 
•El rango intercuartílico 
•La variancia y la desviación estándar 
•El coeficiente de variabilidad 
 
6 
Ejemplo 1. 
Considerar los siguientes datos como las notas de la 
primera práctica de una muestra de alumnos cada una de 
las tres secciones de una asignatura: 
Grupo Notas Media 
A 14 14 14 14 14 14 14 14 14 14 14 
B 14 13 15 14 12 15 16 13 12 16 14 
C 19 8 19 11 16 18 6 13 10 20 14 
Los grupos A, B y C tienen la misma media pero 
diferente dispersión en torno a la media. 
• Respecto a la variabilidad o dispersión: A < B < C 
• Respecto a la homogeneidad : A > B > C 
• Respecto a la confiabilidad de la media: A > B > C 
7 
El rango o amplitud de un conjunto de observaciones es 
igual a la diferencia entre el valor máximo y el valor 
mínimo. 
 R = Xmax – Xmin 
 
Ejemplo 2. 
Notas de PC1: 14,13,15,14,12,15,16,13,12,16,18,14,16 
Hallar e interpretar el rango. 
 
R = 18 – 12 = 6 puntos. 
 
Interpretación. La amplitud de la nota de la primera 
práctica fue de 6 puntos. 
Desventajas: 
• Esta afectada por valores extremos 
• No mide la variabilidad de los datos intermedios 
 
8 
El rango intercuartílico, se calcula como la diferencia entre el 
percentil 75 (P75 = Q3) y el percentil 25 (P25 = Q1). 
 
 RI = P75 - P25 
 
El RI corresponde al rango del 50% central de los datos. 
Ejemplo 3. 
Notas de PC1: 12,12,13,13,14,14,14,15,15,16,16,16,18 
Hallar e interpretar el rango intercuartílico. 
 
Pos=25(14/100)=3.5, P25=13+0.5x(13-13)=13 
Pos=75(14/100)=10.5, P75=16+0.5x(16-16)=16 
 RI = 16 – 13 = 3 puntos. 
 
Interpretación. La amplitud del 50% central de las 
notas de la primera práctica fue de 3 puntos. 
9 
La variancia es el promedio de la suma de cuadrados de 
las desviaciones respecto a la media. 
 
Poblacional: 
 
 
Muestral: 
 
 
Desviación estándar muestral: 
 
Para una tabla de frecuencias: 
 
 
 
donde k número de categorías 
 
2
2 2 2
1 1
1 1N N
j j
j j
X X N
N N
  
 
 
    
 
 
 
2 2
2 2
1 1
1 1
1 1
n n
j j
j j
S X X X n X
n n 
 
    
   
 
2SS 
2
2 2 2
1 1
1 1
( ) ( )
1 1
k k
i i i i
i i
S f X X f X nX
n n 
   
 
 
10 
Ejemplo 4. 
Halle la variancia y desviación estándar muestral de las 
notas de la primera práctica para los 3 grupos. 
 
 
Grupo Notas Media 
A 14 14 14 14 14 14 14 14 14 14 14 1960 
B 14 13 15 14 12 15 16 13 12 16 14 1980 
C 19 8 19 11 16 18 6 13 10 20 14 2192 
x
  0014101960
110
1
1
1 22
10
1
22 









 

A
i
iA Syxxnx
n
S
  49.122.222.214101980
110
1
1
1 22
10
1
22 









 

B
i
iB Syxxnx
n
S
  08.578.2578.2514102192
110
1
1
1 22
10
1
22 









 

C
i
iC Syxxnx
n
S
Las notas del grupo C son más variables que las del grupo B. Las 
notas del grupo A es cero, son una constante. 11 
El coeficiente de variabilidad es una medida de dispersión 
relativa (no tiene unidades) y se define como la razón 
entre la desviación estándar y la media aritmética de un 
conjunto de observaciones. 
Poblacional: 100


CV Muestral: 100
x
s
cv
Ejemplo 5. 
Halle el coeficiente de variabilidad de las notas de la 
primera práctica para el grupo B. 
%6.10100
14
49.1
100  xx
x
S
cv
B
B
B
Interpretación. La variabilidad de la primera práctica 
del grupo B es 10.6%. 
12 
Ejemplo 6. 
Los siguientes datos corresponden al tiempo (en minutos), 
al cabo del cual se duermen las ratas después de haber 
recibido un tipo de tranquilizante (A o B). 
 Tipo A Tipo B 
n 18 ratas 20 ratas 
x 9.94 min 15.2 min 
s 2.81 min 2.84 min 
 
¿Con qué tranquilizante el tiempo es más homogéneo? 
2.81
100% 28.27 %
9.94
Acv   
2.84
100% 18.68 %
15.2
Bcv   
Por lo tanto, el tranquilizante B tiene tiempos más 
homogéneas que el A. 
13 
Ejercicio 1. 
Los siguientes datos 
corresponden a las mediciones 
de la emisión diaria (en 
toneladas) de óxido de azufre 
de una planta industrial. 
Calcule e interprete las medidas de variabilidad (Rango, Rango 
intercuartílico, Varianza, Desviación estándar y Coeficiente de 
variación). 
15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4 
22.7 18.5 15.2 11.0 7.7 20.0 16.2 
14 
Solución. 
Los siguientes datos corresponden a las mediciones de la 
emisión diaria (en toneladas) de óxido de azufre de una 
planta industrial. 
X=Mediciones diarias de óxido de azufre, n=15 mediciones 
 
 Rango: r = Max-Min=26.4-7.7=18.7 
Interpretación. La amplitud de la emisión de óxido de 
azufre fue 18.7 Tn. 
 Rango intercuartil: RI=P75–P25 = 22.7–11.2 = 11.5 
 P25: Pos=25x(15+1/100)=4, P25=11.2 
 P75: Pos=75x(15+1/100)=12, P75=22.7 
Interpretación. La amplitud del 50% central de la 
emisión de óxido de azufre fue 11.5 Tn. 
15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4 
22.7 18.5 15.2 11.0 7.7 20.0 16.2 
15 
Solución. 
Variancia: 
 
 ΣXi=15.8+26.4+…+16.2 = 253.7, 
 ΣX2i=15.8
2+26.42+…+16.22 = 4755.67 
 
 S2 = (4755.67-15x16.912)/14 = 33.19 
 
Interpretación. La variancia de la emisión de óxido de azufre fue 
33.19 Tn2. 
 
Desviación estándar: 
 
Interpretación. La desviación estándar de la emisión de óxido 
de azufre fue 5.76 Tn. 
 
Coeficiente de variación. 
 
 
 
Interpretación. La variación de la emisión de óxido de azufre es 
34.1% 
𝐜𝐯 =
𝐒
𝐗 
𝐱𝟏𝟎𝟎 =
𝟓.𝟕𝟔
𝟏𝟔.𝟗𝟏
𝐱𝟏𝟎𝟎 = 𝟑𝟒.𝟏% 
𝐒 = 𝐒𝟐 = 𝟑𝟑.𝟏𝟗 = 𝟓.𝟕𝟔 
X = 16.91 
S2 =
 Xi
2 − nxX 2
n− 1
 
16 
Comparación de la variabilidad 
 
Para comparar la variabilidad entre dos o más conjuntos 
de datos, se debe considerar: 
Unidades de 
medidas 
diferentes 
Unidades de medidas iguales 
Medias 
similares 
Medias 
diferentes 
cv1 con cv2 S1 con S2 cv1 con cv2 
Propiedades de transformación de datos 
Sea la variable Y, entonces para 
17 
Medida 
2
X
X
S
S
2
Y
Y
S
S


Y a bX 
2 2
X
X
b S
bS
Y bX Y a X 
2 2
X
X
b S
bS
Ejemplo 7. 
Se presentan las medidas estadísticas de las ventas 
(soles) y tiempo extra (horas) de los vendedores de dos 
zonas (A y B). 
 Promedio 
Desviación 
estándar 
Coeficiente de 
variabilidad 
Zona Ventas Tiempo Ventas Tiempo Ventas Tiempo 
A 236.3 3.5 82.6 1.5 35.0 42.9 
B 450.5 3.6 98.5 2.8 21.9 77.7 
a. ¿Las ventas de la zona A son menos variables que las de la zona B?. 
 Falso, cvA = 35.0% > cvB= 21.9% (Promedio diferentes) 
 
b. El tiempo extra de la zona B muestra más variabilidad que la zona A. 
 Verdadero, SB = 2.8 > SA = 1.5 (Promedio similares) 
 
c. Para la zona A, las ventas son menos variables que el tiempo extra. 
 Verdadero, cvVentas = 35.0% < cvTiempo = 42.9% (Variables diferentes) 
18 
Ejercicio 2 
Los sueldos de 100 trabajadores de 
una empresa de servicios de 
limpieza tienen una media de $300 
y una desviación estándar de $50. 
Se proponen dos alternativas de 
aumento: 
Alternativa A: Aumentarles $75 a 
cada uno; 
Alternativa B: Aumentarles el 15% 
del sueldo más $20 a cada uno. 
¿Cuál de las alternativas será la 
más conveniente para los siguientes 
casos:?. Justifique su respuesta. 
 
 
 
a. Si la empresa dispone sólo de $37000 para pagar el aumento 
de sueldos. 
b. Si la empresa quiere tener los aumentos de sueldos más 
homogéneos. 
 
 
19 
Solución: 
𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐀: 𝐘𝐀 = 𝐗+ 𝟕𝟓⟹ 𝐘 𝐀 = 𝟑𝟎𝟎+ 𝟕𝟓 = 𝟑𝟕𝟓⟹ 𝐓𝐨𝐭𝐚𝐥 = 𝐘𝐢 = 𝟏𝟎𝟎𝐱𝟑𝟕𝟓 = 𝟑𝟕𝟓𝟎𝟎 
a. Calculando el monto total requerido: 
Entonces, puesto que solo se tienen $37000 disponibles, se 
escoge la alternativa B que sólo se necesita $36500. 
b. Calculando los coeficientes de variación 
Entonces, se escoge la alternativa A, puesto que tienen menos 
variabilidad 
𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐀: 𝐘𝐀 = 𝐗+ 𝟕𝟓⟹ 𝐒𝐘 = 𝐒𝐗 = 𝟓𝟎 ⟹ 𝐜𝐯𝐘 =
𝟓𝟎
𝟑𝟕𝟓
𝐱𝟏𝟎𝟎 = 𝟏𝟑.𝟑% 
𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐁: 𝐘𝐁 = 𝟏.𝟏𝟓𝐗+ 𝟐𝟎 ⟹ 𝐒𝐘 = 𝟏.𝟏𝟓𝐒𝐗 = 𝟓𝟕.𝟓 ⟹ 𝐜𝐯𝐘 =
𝟓𝟕.𝟓
𝟑𝟔𝟓
𝐱𝟏𝟎𝟎 = 𝟏𝟓.𝟖% 
20 
X
X Total X n X
n
     
𝐧 = 𝟏𝟎𝟎, 𝐗 = 𝟑𝟎𝟎, 𝐒 = 𝟓𝟎 
𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐁: 𝐘𝐁 = 𝟏.𝟏𝟓𝐗+𝟐𝟎⟹ 𝐘 𝐁 = 𝟏.𝟏𝟓𝐱𝟑𝟎𝟎 + 𝟐𝟎 = 𝟑𝟔𝟓 ⟹ 𝐓𝐨𝐭𝐚𝐥 = 𝐘𝐢 = 𝟏𝟎𝟎𝐱𝟑𝟔𝟓 = 𝟑𝟔𝟓𝟎𝟎 
Ejercicio 3. 
En la siguiente tabla se presenta la distribución de número de parcelas 
que poseen cada agricultor en una muestra al azar de 50 de la sierra 
central. 
Halle e interprete él coeficiente de variación. 
Número de parcelas 
Xi 
Número de agricultores 
fi 
1 5 
2 15 
4 12 
5 10 
6 8 
Total 50 
21 
2
2
2
1
i if X nX
S
n




Σ fiXi =5x1+15x2+12x4+10x5+8x6 = 181 
Σ fiX
2
i =5x1
2+15x22+12x42+10x52+8x62 = 795 
 
 S2 = (795 - 50x3.622)/49 = 2.85, S=1.69 
 cv = (1.69/3.62)x100 = 46.7% 
𝐗 = 𝟑.𝟔𝟐 
Ejercicios propuestos. 
1. En un supermercado se determinó que el tiempo que demora 
una cajera en atender a los clientes tiene un Coeficiente de 
Variación de 0.4, la empresa decide cambiar el tipo de 
máquinas registradoras con lo cual los tiempos de atención al 
cliente disminuyen en 2 minutos y el coeficiente de variación 
es ahora de 60%. Determinar el tiempo promedio y la 
desviación estándar de los tiempos de atención, antes y 
después del cambio de máquinas registradoras. 
 
22 
2. Para evaluar la efectividad de sus empleados, una empresa 
dedicada a la venta de teléfonos celulares ha recopilado la 
siguiente información sobre el número de teléfonos vendidos 
en la última semana por sus 64 empleados: 
 
 
 
 
 
Número de empleados 13 15 16 8 5 4 3 
Número de ventas 5 6 7 8 9 10 11 
a. Calcule e intérprete las medidas de variabilidad. 
b. La empresa le paga a sus empleados 100 soles semanales más 
una comisión de 40 soles por celular vendido y sobre estos 
ingresos los empleados deben aportar el 15% a su AFP. Calcule 
el promedio y la desviación estándar para el ingreso neto 
promedio semanal por empleado. 
 
23 
Referencias bibliográficas 
 Anderson D., Sweendy D., Williams T. (2016) Estadística para 
Administración y Economía. 12ª. Edición. México. Cengage 
Learning Editores. Capítulo 3. 
 Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadística para 
Administración y Economía (6ta. ed.) Madrid: Pearson 
Education. Prentice Hall 
24

Continuar navegando

Materiales relacionados

34 pag.
Medidas de Dispersión (5)

UNIP

User badge image

GONZALES SAENZ FIORELLA MARIEL

114 pag.
DO-UC-EG-MT-A0175-20162

SIN SIGLA

User badge image

Mucha Aprendizaje

38 pag.
Semana1_Estadistica_Descriptiva_Patricia_Guevara

Escola Santa Afra

User badge image

Edgar Gallegos