Logo Studenta

EG_2021_I_Semana 03_Medidas Tendencia Central

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA 
Dpto. de Estadística e Informática 
Semana 3. Medidas de tendencia central 
Inicio 
• Motivación 
• Logros 
• Saberes previos 
Desarrollo 
• Medidas de tendencia central 
• Propiedades de transformación de variables 
• Percentiles 
• Ejercicios resueltos 
Cierre 
• Ejercicios propuestos 
• Autoevaluación (Moodle) 
2 
3 
¿Qué medidas estadísticas permite? 
 ¿Resumir el número de contagios de todas las regiones? 
 ¿Determinar el número de pruebas rápidas realizadas con mayor 
frecuencia? 
 ¿Identificar las regiones que están dentro del 25% de menores de 
personas fallecidas? 
 
 
https://covid19.minsa.gob.pe/sala_situacional.asp 
https://covid19.minsa.gob.pe/sala_situacional.asp
4 
 ¿Qué es una medida estadística? 
 ¿Para qué sirven las medidas estadísticas? 
 ¿Para qué sirven las medidas de posición? 
Al término de la sesión, el estudiante estará en capacidad de: 
 
Calcular e interpretar medidas de tendencia central. 
Calcular e interpretar medidas de posición de percentiles. 
Aplicar las propiedades de transformación de variables. 
Resolver ejercicios propuestos. 
5 
Medidas de 
variabilidad 
Medidas de 
asimetría 
Medidas de 
tendencia 
central 
Media o promedio 
Media ponderada 
Mediana 
Moda 
Percentiles 
Rango 
Rango intercuartil 
Variancia 
Desviación estándar 
Coeficiente de variabilidad 
Coeficiente de asimetría de 
Pearson 
Diagrama de 
cajas 
6 
Autoevaluación (Aula virtual) 
Ejemplos, ejercicios resueltos y propuestos 
Percentiles 
Propiedades de transformación 
La moda 
La mediana 
La media o promedio y la media ponderada 
Las medidas estadísticas son calculadas con los datos de 
las variables (cuantitativas y cualitativas) que pueden 
provenir de una población (N: Tamaño de la población) o 
muestra (n: Tamaño de la muestra), con la finalidad de 
resumir y representar el conjunto de datos. 
7 
Observaciones: 
1. Las medidas estadísticas asumen las mismas unidades 
de medida de la variable en estudio. 
2. Para las variables cuantitativas, se pueden calcular 
todas las medidas estadísticas. 
3. En el caso de las variables cualitativas, sólo es posible 
calcular como medidas la moda y la proporción. 
Son medidas estadísticas que se localizan en la parte 
central de la distribución del conjunto de los datos. 
Permiten resumir y representar en un sólo valor el 
conjunto de datos. Las principales medidas de tendencia 
central son: 
 
•La media o promedio 
•La media ponderada 
•La mediana 
•La moda 
•Percentil 
Medidas de Tendencia Central 
8 
9 
Ejemplo 1. Suponga que se tiene los datos de las ventas 
semanales (en dólares) de una muestra de 8 vendedores. Calcule 
la venta promedio semanal. 
1
1 N
j
j
X
N


 Media Poblacional: 
1
1 n
j
j
X X
n 
 Media Muestral: 
La media o promedio de un conjunto de observaciones es 
igual a la suma de sus valores dividido entre el número 
de observaciones 
150 120 300 280 350 250 160 280 
3.236
8
890,1
8
280160250350280300120150
8
1 8
1


 
i
ixX
Interpretación. La venta promedio semanal por vendedor fue de $ 236.3 
10 
1. La media está afectada por valores extremos (altos o 
pequeños). 
2. Localiza la parte central de un conjunto de 
observaciones. 
3. Para un conjunto de observaciones la media es única. 
4. La suma de las desviaciones de las observaciones con 
respecto al promedio es igual a cero. 
 
 
 
5. La suma de los cuadrados de las desviaciones de las 
observaciones con respecto a la media es mínima. 
 
 
 
 
1 1
0
n n
j j
j j
X X X n X n X n X
 
      
   
2 2
1 1
,
n n
j j
j j
X X X c donde c R
 
    
1 1 1 2 2
1 2
1
...
...
k
j j
j k k
p k
k
j
j
w x
w x w x w x
x
w w w
w


  
 
  


La media ponderada se usa cuando se quiere que los 
valores de la variable tengan un peso (wi). 
11 
Ejemplo 2. Hallar el promedio ponderado semestral de un 
estudiante con notas en los siguientes cursos: 
Curso Créditos 
(wi) 
Nota 
(Xi) 
Matemática 4 14 
Redacción 3 12 
Estadística 4 16 
14 12 16
14
3
4*14 3*12 4*16
14.2
4 3 4
p
x
x
 
 
 
 
 
Caso 1. Cuando los datos se 
encuentran en una tabla de 
frecuencias correspondiente a una 
variable cuantitativa discreta. La 
media se calcula por: 
n
xf
f
xf
x
k
j
jj
k
j
j
k
j
jj
p







1
1
1
Caso 2. Si son las 
medias de k grupos y cada grupo 
tiene un tamaño 
respectivamente, entonces la 
media de todos los datos 
 se calcula por: 
 
1 2, ,..., kx x x
1 2, ,..., kn n n
1 2 ... kn n n n   





k
j
j
k
j
jj
p
n
xn
x
1
1
12 
Ejemplo 3. 
En la siguiente tabla se presenta el número de cursos 
matriculados en el presente semestre para una muestra de 300 
alumnos. Hallar el número promedio de cursos matriculados por 
alumno. 
Interpretación. El número promedio de cursos 
matriculados por alumno en este semestre es de 4.4 
4.4
300
66058041003402201





n
xf
x
k
j
jj
p
Número de cursos 
Xi 
Número de alumnos 
fi 
2 20 
3 40 
4 100 
5 80 
6 60 
Total 300 
 
13 
La mediana es el valor que ocupa la posición central de 
un conjunto de datos, previamente ordenados. La 
mediana se calcula: 
Ejemplo 4. Los siguientes datos corresponden a los pesos (en 
Kg.) de 10 personas: 50, 77, 53, 76, 63, 64, 75, 54, 52, 80. 
Calcule la mediana 
Datos ordenados: 50, 52, 53, 54, 63, 64, 75, 76, 77, 80 
𝑺𝒊,𝒏 𝒆𝒔 𝒊𝒎𝒑𝒂𝒓: 𝒎𝒆 = 𝑿 𝒏+𝟏
𝟐
 
 𝑺𝒊,𝒏 𝒆𝒔 𝒑𝒂𝒓: 𝒎𝒆 =
𝑿
 
𝒏
𝟐
 
+ 𝑿
 
𝒏
𝟐
+𝟏 
𝟐
 
Interpretación. Un 50% de personas pesan menos de 63.5 Kg. 
y el otro 50% pesa más de 63.5 Kg. 
14 
   
10 10
1
5 62 2 63 64
10 , 63.5
2 2 2
X X
X X
n par me
   
   
   

 
    
1. La mediana divide a las n observaciones previamente 
ordenadas, en dos partes iguales. El 50% con valores 
menores a la mediana y el otro 50% con valores 
mayores a la mediana. 
2. La suma de las desviaciones absolutas de las 
observaciones con respecto a la mediana es un valor 
mínimo. 
 
 
3. La mediana no está afectada por valores extremos. 
 
1 1
,
n n
j j
j j
X me X c donde c R
 
    
15 
La moda de un conjunto de datos es el valor o 
atributo que ocurre con mayor frecuencia. 
 
mo = Valor más frecuente 
Propiedades: 
1. Puede no existir o puede haber más de una moda 
en un conjunto de datos. 
2. No es afectada por valores extremos. 
3. Se aplica tanto para información cualitativa como 
cuantitativa. 
16 
Ejemplo 5. 
Se tiene longitudes (en cm.) de una raza de peces de rio para 
muestras en tres zonas (A, B y C). Calcule e interprete la moda 
para cada muestra. 
Muestra de la zona A Muestra de la zona B Muestra de la zona C 
4.0 4.3 4.6 4.0 4.1 4.4 4.0 4.1 4.3 
4.1 4.4 4.7 4.1 4.2 4.5 4.1 4.2 4.3 
4.2 4.5 4.8 4.1 4.3 4.6 4.1 4.3 4.5 
No hay moda mo= 4.1 mo1 = 4.1 
mo2 = 4.3 
Interpretación. 
Zona A. No hay moda 
Zona B. La longitud más frecuente de las truchas es 4.1 cm. 
Zona C. Existen dos modas: 4.1 y 4.3 
17 
Ejercicio 1. 
En un estudio del medio 
ambiente para evaluar la 
calidad de aire, se registró 
la cantidad de microgramos 
de partículas en suspensión 
por mt2 de aire para 
muestras evaluadas en dos 
zonas. 
Halle e interprete las medidas de tendencia central 
Zona A 48 26 28 28 32 34 34 36 36 36 46 48 24 
Zona B 25 25 25 32 36 38 40 35 35 45 48 52 
18 
Zona B. 
El promedio: 
 
La mediana: 
 
 
La moda: 
 
 
Solución: 
 Zona A. 
El promedio: 
 
 
 
 n = 13 impar, me = X n+1
2
 
= X7 = 34 
n = 12 par, me =
X
 
n
2
 
+ X
 1+
n
2
 
2
=
X6 + X7
2
=
35 + 36
2
= 35.5 
La cantidad microgramos de partículas más frecuente fue 36.0 en la zona 
A. 
 
 
Datos ordenados: 24,26,28,28,32,34,34,36,36,36,46,48,48 
Datos ordenados: 25,25,25,32,35,35,36,38,40,45,48,52 
19 
0 36m 
La mediana: 
 
 
 
La cantidadpromedio de microgramos de partículas por mt2 fue 35.1 en 
la zona A. 
La moda: 
 
 
 
El 50% de las muestras la cantidad de microgramos de partículas es 
menor a 34 y el otro 50% mayor a 34 en la zona A. 
 
0 25m 
48 26 ... 24 456
35.1
13 13
X
  
  
32 32 ... 52 436
36.3
12 12
X
  
  
Ejercicio 2. 
Los tiempos promedios de tardanza (minutos) de muestras de 
40, 25 y 15 trabajadores de los turnos de día, tarde y noche 
fueron 8.5, 12.0 y 15.5 respectivamente. Hallar el tiempo 
promedio de tardanza de los trabajadores para los tres turnos. 
Solución: 
Calculando la media ponderada: 
 
 
Interpretación. El tiempo promedio de tardanza de los 
trabajadores en los tres turnos fue de 10.9 minutos. 
 
20 
𝐧𝟏 = 𝟒𝟎,𝐗 𝟏 = 𝟖.𝟓; 𝐧𝟐 = 𝟐𝟓,𝐗 𝟐 = 𝟏𝟐.𝟎; 𝐧𝟑 = 𝟏𝟓,𝐗 𝟑 = 𝟏𝟓.𝟓 
𝐗 𝐩 =
𝟒𝟎 × 𝟖.𝟓 + 𝟐𝟓 × 𝟏𝟐.𝟎 + 𝟏𝟓 × 𝟏𝟓.𝟓
𝟒𝟎 + 𝟐𝟓 + 𝟏𝟓
= 𝟏𝟎.𝟗 
Para una nueva variable transformada: Y = a ± bX, 
donde a y b son constantes reales. Entonces, sus 
medidas estadísticas son calculadas: 
Medida estadística 
Media o promedio 
Mediana 
Moda 
 
ii bXaY 
XbaY 
XY bmeame 
XY bmoamo 
21 
Ejemplo 6. 
Un ganadero, estima que la producción promedio de leche de sus 
150 vacas de la raza Holstein es 22.5 y las 220 vacas de la raza 
Cebú es 20.8 litros por día. Si usando un nuevo nutriente, espera 
que la producción de leche aumente en un 12% en la raza 
Holstein pero un disminución del 5% en la raza Cebú. 
a. Halle la producción promedia de leche para cada raza con el 
nuevo nutriente. 
b. Halle y compare la producción promedia de leche que tendrá 
el ganadero sin y con el nuevo nutriente para las dos razas. 
𝐑𝐚𝐳𝐚 𝐇𝐨𝐥𝐬𝐭𝐞𝐢𝐧:𝐧𝟏 = 𝟏𝟓𝟎,𝐗 𝟏 = 𝟐𝟐.𝟓 ⟹ 𝐘𝟏 = 𝟏.𝟏𝟐𝐱𝐗𝟏 ⟹ 𝐘 𝟏 = 𝟏.𝟏𝟐𝐱𝐗 𝟏 = 𝟏.𝟏𝟐𝐱𝟐𝟐.𝟓 = 𝟐𝟓.𝟐 
22 
𝐑𝐚𝐳𝐚 𝐂𝐞𝐛ú:𝐧𝟐 = 𝟐𝟐𝟎,𝐗 𝟐 = 𝟐𝟎.𝟖 ⟹ 𝐘𝟐 = 𝟎.𝟗𝟓𝐱𝐗𝟐 ⟹ 𝐘 𝟐 = 𝟎.𝟗𝟓𝐱𝐗 𝟐 = 𝟎.𝟗𝟓𝐱𝟐𝟎.𝟖 = 𝟏𝟗.𝟖 
𝐒𝐢𝐧 𝐧𝐮𝐭𝐫𝐢𝐞𝐧𝐭𝐞:𝐗 =
𝟏𝟓𝟎𝐱𝟐𝟐.𝟓 + 𝟐𝟐𝟎𝐱𝟐𝟎.𝟖
𝟏𝟓𝟎 + 𝟐𝟐𝟎
= 𝟐𝟏.𝟓 
𝐍𝐮𝐞𝐯𝐨 𝐧𝐮𝐭𝐫𝐢𝐞𝐧𝐭𝐞:𝐘 =
𝟏𝟓𝟎𝐱𝟐𝟓.𝟐 + 𝟐𝟐𝟎𝐱𝟏𝟗.𝟖
𝟏𝟓𝟎 + 𝟐𝟐𝟎
= 𝟐𝟐.𝟎 
El percentil Pq divide a un conjunto de datos previamente 
ordenado en un q% menores que Pq y un (100 – q)% 
mayores que Pq. 
Para calcular el percentil Pq, se determina en primer lugar 
la posición (Pos). 
 










 

 )()1()(
)(
.0)(.
)(
100
1
EEEq
Eq
xxdxPDecimaldE
xPEnteroEn
qxPos
Cuartiles. Divide el conjunto de datos en cuatro partes iguales 
(25% cada parte). 
• Primer cuartil. Percentil 25: Q1 = P25 
• Segundo cuartil. Percentil 50: Q2 = P50 = me 
• Tercer cuartil. Percentil 75: Q3 =P75 
23 
Ejemplo 7. 
Se cuenta con los datos de los tiempos (en minutos) de tardanza 
de los trabajadores de una compañía de seguro. Halle e 
interprete el percentil 45. 
15 12 18 22 24 10 9 13 25 18 6 14 
Datos ordenados: 6, 9, 10, 12, 13, 14, 15, 18, 18, 22, 24, 25 
         utosxxxPPosición min85.13131485.01385.085.545
100
112
56545 




 

Interpretación: El 45% de los trabajadores tienen un tiempo de 
tardanza menor 13.85 minutos y el otro 55% más de 13.85 
minutos 
24 
1 12 1
45 12, 45 5.85
100 100
n
q y n Pos qx x
    
       
   
Ejercicio 3. 
Los siguientes datos corresponden a los pesos, en Kg. de 10 
personas: 
50, 52, 53, 54, 63, 64, 75, 76, 77, 80 
        25 2 3 2
10 1
25 10 25 2.75
100
0.75 52 0.75 53 52 52.75
q y n Pos x
P x x x Kg
 
     
 
        
a. Calcule el peso máximo para que una persona sea considerada 
dentro del 25% de menores pesos. 
El peso máximo debe ser igual a 52.75 Kgs. Para considera a una 
persona dentro del 25% de menores pesos 
b. Calcule el peso mínimo para que una persona sea 
considerada dentro del 25% de mayores pesos. 
El peso mínimo debe ser igual a 76.25 Kgs. 25 
        75 8 9 8
10 1
75 10 75 8.25
100
0.25 76 0.25 77 76 76.25
q y n Pos x
P x x x Kg
 
     
 
        
Ejercicio 4. 
En la siguiente tabla se presenta la distribución de número de parcelas 
que poseen cada agricultor en una muestra al azar de 50 de la sierra 
central. 
Halle e interprete las medidas de tendencia central y el percentil 42.5. 
Número de parcelas 
Xi 
Número de agricultores 
fi 
1 15 
2 8 
4 12 
5 10 
6 5 
Total 50 
26 
 
25 26
82.5 82.5
1 15 2 8 4 12 5 10 6 5
Pr : 3.18
50
4 4
: 4
2 2
: 4
50 1
82.5 42.075 5 0.075 5 5 5
100
omedio X
X X
Mediana me
Moda mo
P Pos x P
         
 
 
  

 
         
 
Ejercicios propuestos. 
1. Los siguientes datos corresponden al número árboles 
infectados con el nemátodo del pino (Bursaphelebchus 
Xylophilus) para una muestra de 40 parcelas de 64 mt2 cada 
una. 
a. Halle e interprete el percentil 35 
b. ¿Cuál debe ser el valor mínimo del número de árboles 
infectados para que una parcela sea considerada dentro del 
16% de las de mayor número? 
c. ¿Cuál debe ser el valor máximo del número de árboles 
infectados para que una parcela sea considerada dentro del 28 
de las de menor número? 
d. ¿Para qué valores del número de árboles infectados se tendrá 
el 80% central de parcelas? 
 
 
 
0 2 3 5 6 6 8 9 12 12 14 18 
0 2 4 5 6 6 8 10 12 14 16 18 
1 2 4 5 6 6 8 10 12 14 16 18 
27 
2. Los siguientes datos corresponden a una muestra de 12 
apicultores sobre su producción de miel anual (en kgrs) por 
colmena. 
 
 
250.5 320.0 345.5 260.4 358.2 268.5 380.1 410.2 430.4 480.3 410.3 420.1 
 
a. Calcular e interpretar las medidas de tendencia central 
b. Si se espera un incremento del 15.5% en la producción de miel 
en los meses de verano y una disminución del 4.5% en 
invierno. Halle la producción promedia de miel para dad 
estación y para las dos estaciones juntas. 
 
 
28 
3. La gerencia de marketing de una empresa ha decidido 
aumentar 10% los precios de los ternos en la sucursal Sur 
pero restando 90 nuevos soles, mientras que en la sucursal 
Norte disminuir en 4.5% los precios de los ternos y en la 
sucursal Centro aumentar 125 nuevos soles cada terno. A 
continuación se presenta las medidas estadísticas de los 
precios de las sucursales. 
 N para 
Variable N N* Media Mínimo Mediana Máximo Moda moda 
Sucursal Sur 15 0 450,5 345,0 450,0 650,0 450 3 
Sucursal Norte 15 0 582,3 320,0 580,0 910,0 600 2 
Sucursal Centro15 0 500,3 310,0 550,0 810,0 550 3 
Halle las medidas estadísticas (media, mediana y moda) de los 
nuevos precios de los ternos para la sucursal Sur, Norte y Centro. 
29 
Referencias bibliográficas 
 Anderson D., Sweendy D., Williams T. (2016) Estadística para 
Administración y Economía. 12ª. Edición. México. Cengage 
Learning Editores. Capítulo 3 
 Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadística para 
Administración y Economía (6ta. ed.) Madrid: Pearson 
Education. Prentice Hall 
30

Continuar navegando

Materiales relacionados

462 pag.
114 pag.
DO-UC-EG-MT-A0175-20162

SIN SIGLA

User badge image

Mucha Aprendizaje

16 pag.
Estadistica - Rodrigo Beltran

User badge image

Desafio PASSEI DIRETO

253 pag.
Guía de Estadística General - UNALM

SIN SIGLA

User badge image

José Rojas Espinoza