Logo Studenta

SESIÓN 6

¡Este material tiene más páginas!

Vista previa del material en texto

Estadística Descriptiva y Probabilidades
SESIÓN 6
TEMARIO
1. Medidas de dispersión para datos no agrupados.
2. Medidas de dispersión para datos agrupados.
LOGRO DE LA SESIÓN
Al finalizar la sesión de clase, el estudiante calcula e
interpreta las medidas de dispersión para analizar la
variabilidad en datos no agrupados y agrupados .
Medidas de dispersión
Son cantidades que miden el grado en que los datos numéricos tienden a extenderse
alrededor de un valor medio.
Medidas de dispersión
La importancia que tienen es porque proporcionan más información que permite juzgar la
confiabilidad de las medidas de tendencia central. Si los datos están muy dispersos, las
medidas de tendencia central son menos representativas de los datos que cuando están más
agrupadas alrededor de la media.
PRINCIPALES MEDIDAS 
DE DISPERSIÓN
Rango o recorrido de la 
variable
Varianza
Desviación estándar
Coeficiente de variación
Definiciones de Estadígrafos
Varianza: (S2)
Es el promedio aritmético de las desviaciones estándar respecto a su media elevadas al
cuadrado.
Desviación estándar: (S)
Representa el grado de dispersión de los valores de una variable, con respecto a su media.
Coeficiente de variación: (CV)
Indica el porcentaje de variabilidad de los datos respecto a la media:
CV Dispersión
0 ≤ CV < 20% BAJA
20% ≤ CV < 50% MEDIA
50% ≤ CV < 100% ALTA
Medidas de dispersión
Medidas de dispersión
Rango o recorrido de la variable: Es la diferencia entre el valor máximo y el valor mínimo de
la variable para un conjunto de datos.
Sea la variable representada por X:
Donde:
Xmax: valor máximo de la variable
Xmin: valor mínimo de la variable
Rango (R) = X max – X min
Medidas de dispersión
Varianza: Se define como la media aritmética del cuadrado de las desviaciones de las
observaciones con respecto a su media.
Para datos no agrupados: Para datos agrupados:
Medidas de dispersión
Desviación estándar: Se define como la raíz cuadrada de la varianza.
Desviación estándar poblacional:
Desviación estándar muestral:
Medidas de dispersión
Coeficiente de variación: Se define como el cociente entre la desviación estándar y la
media. Permite comparar dos a más conjuntos de datos.
Coeficiente de variación poblacional:
Coeficiente de variación muestral:
En general consideraremos lo siguiente:
CV < 10% -> Implica DATOS HOMOGÉNEOS
10% ≤ CV ≤ 30% -> Implica DATOS VARIABLES
CV > 30% -> Implica DATOS HETEROGÉNEOS
Medidas de dispersión
PROPIEDAD 1
Si todos los valores observados son iguales a b (donde b es una constante)
entonces
PROPIEDAD 2
Si a cada valor de las observaciones se le suma (o resta) una constante, la
varianza del nuevo conjunto transformado e será la misma que la varianza de las
observaciones iniciales, es decir:
PROPIEDAD 3
Si a cada valor de las observaciones se le multiplica por una constante
diferente de cero, la varianza del nuevo conjunto transformado es la varianza del
conjunto original multiplicado por la constante elevado al cuadrado.
Un estudiante de la carrera de Ingeniería de Software revisó durante 11 días el ranking de una
revista científica que publica artículos sobre la industria de software a través de Internet. A
continuación se presenta el listado que elaboró de acuerdo al número de visitas por día a la
página web www.scopus2018.com
Además, la cantidad de visitas a la página web www.sciencie2018.com se presenta a
continuación:
N° de visitas por día
a la página web
www.scopus2018.pe
4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200
N° de visitas por día
a la página web
www.sciencie2018.com
3200 4300 4700 4400 4200 4200 4200 4100 4100 4300
Calcule el valor de la desviación estándar de ambas páginas web. 
EJERCICIO 1
4,000 700 490,000
3,200 -100 10,000
3,600 300 90,000
3,500 200 40,000
3,000 -300 90,000
3,250 -50 2,500
2,900 -400 160,000
3,400 100 10,000
3,450 150 22,500
2,800 -500 250,000
3,200 -100 10,000
Σ= 36,300 1,175,000
n= 11
3,300
117,500
 𝑋=
𝑆2 =
𝑥𝑖 − 𝑋 𝑥𝑖 − 𝑋
2𝑥𝑖
3,200 -970 940,900
4,300 130 16,900
4,700 530 280,900
4,400 230 52,900
4,200 30 900
4,200 30 900
4,200 30 900
4,100 -70 4,900
4,100 -70 4,900
4,300 130 16,900
41,700 1,321,000
10
4,170
146,778
𝑥𝑖 − 𝑋 𝑥𝑖 − 𝑋
2𝑥𝑖
Σ=
 𝑋 =
𝑆2 =
n =
www.scopus2018.com www.science2018.com
¿Cuál tiene mayor varianza? ¿Qué significa eso?
A mayor varianza mayor variabilidad o dispersión.
EJERCICIO 1
Solución:
Se define como la raíz cuadrada de la varianza.
Para el ejercicio:
Desviación Estándar Poblacional
𝜎 = 𝜎2
Desviación Estándar Muestral
s = 𝑠2
Variable ¿Estimador o 
parámetro?
Varianza Desviación estándar
Visitas diarias a: 
www.scopus2018.com
Muestral (Est) 𝑆2 =117 500 S= 117 500 = 342. 78
Visitas diarias a : 
www.science2018.com
Muestral (Est) 𝑆2 = 146 778 S= 146 778 = 383. 11
Número de hijos en la 
comunidad andina 
Poblacional 
(Parámetro)
𝜎2 =4.71 𝜎 = 4.71 = 2. 71
DESVIACIÓN ESTÁNDAR
http://www.netjoven.pe/
http://www.mujeractiva.com/
Solo nos 
interesa 
una parte 
de la tabla. 
La media es
4.3
xi fi Xi - µ (Xi - µ)2 fi x (Xi - µ)2
0 2 -4.3 18.49 36.98
2 3 -2.3 5.29 15.87
4 7 -0.3 0.09 0.63
6 4 1.7 2.89 11.56
7 4 2.7 7.29 29.16
Total 20 94.2
Número de 
hijos fi Fi hi Hi
Xi
0 2 2 10% 10%
2 3 5 15% 25%
4 7 12 35% 60%
6 4 16 20% 80%
7 4 20 20% 100%
Total 20 100%
𝜇 = 𝑥𝑖 ∙ ℎ𝑖 = 4.3
¿Esta varianza poblacional tiene algún significado por si misma?
No porque la varianza es útil para comparar variabilidad.
EJERCICIO 1
Solución:
A las familias de una comunidad alto andina se le preguntó por el número de hijos, obteniéndose
los siguientes resultados (considere datos poblacionales).
Como se puede observar, la mayor dispersión se dio en el curso de
matemática (CV = 12.5%).
Ejercicio explicativo: Coeficiente de variación
EJERCICIO 2
Se tomaron dos exámenes a estudiantes del primer ciclo en los cursos de matemática
y química general, las notas están sobre 100 puntos. En el curso de matemática la
media fue de 72 puntos y una desviación estándar de 9 puntos; en el curso de química
general se obtuvo una media de 80 puntos y desviación estándar 6 ¿En cuál de los
cursos hay mayor dispersión? (considere datos poblacionales)
En matemática:
𝜇 = 72
σ = 9
CV = 9 / 72 = 0.125
En química general:
𝜇 = 80
σ = 6
CV = 6 / 80 = 0.075
Solución:
Ejercicio explicativo: Coeficiente de variación
EJERCICIO 3
Un estadístico ha llegado a la conclusión que el grado de dispersión relativa porcentual para los
datos presentados en la tabla no supera el 10%, por ende cataloga a los datos como
homogéneos. Posteriormente el estadístico valida la información brindada por su asistente
mediante un software estadístico, por lo que el asistente le brinda la siguiente tabla de
frecuencias del peso de 62 alumnos.
Peso (kg) N° de alumnos (fi) Fi
[40; 42> 12 12
[42; 44> 10 22
[44; 46 > 14 36
[ 46; 48> 8 44
[48; 50> 7 51
[50; 52> 6 57
[52; 54> 5 62
Total 62
¿El estadístico tiene razón al decir que el grado de dispersión relativa por porcentual no supera el 10%?
Considere una media de 45.8387.
EJERCICIO 3
Solución:
El grado de dispersión relativa porcentual hace referencia al coeficiente de variación.
 𝐶𝑉 =
S
 X
. 100%
Media (promedio) 𝑿 = 45.8387 (dato)
Cálculo de la desviación estándar: S
Peso (kg)
N° de alumnos
(fi)
Xi
[40; 42> 12 41
[42; 44> 10 43
[44; 46 > 14 45
[ 46; 48> 8 47
[48; 50> 7 49
[50; 52> 6 51
[52; 54> 5 53
Total 62
𝐟𝐢 𝐱 𝐗𝐢 − 𝐗
𝟐 Completa la tabla y demuestra
que el valor de la desviación
estándar S es igual a 3.7730
EJERCICIO 3
Solución:
El grado de dispersión relativa porcentual hace referencia al coeficiente de variación.
 𝐶𝑉 =
𝑆
 𝑋
. 100%
Media (promedio) 𝑿 = 45.8387 (dato)
Desviación Estándar  𝑺 = 3.7730
Reemplazando:
 𝐶𝑉 =
3.7730
45.8387
. 100% = 8.23%
Conclusión: El grado de dispersión relativa porcentual o también conocido como el coeficiente de
variación es de 8.23%, el cual es bajo y significa que los datos tienen baja dispersiónrespecto a la
media y se pueden catalogar como homogéneos. En consecuencia, tiene razón el estadístico.
TRABAJO GRUPAL
ES FUNDAMENTAL QUE TODOS
PARTICIPEN EN LAS
DELIBERACIONES, EXPONIENDO SUS
PUNTOS DEL VISTA. EVITANDO QUE
ALGUIEN SE ADJUDIQUE UN
PROTAGONISMO DESMEDIDO, O TOME
UNILATERALMENTE DECISIONES QUE
AFECTAN A TODOS.
SE FORMARAN GRUPOS DE CUATRO ALUMNOS
Ejercicio 1
A continuación se presenta la información de 20
ingenieros donde se contabilizó el número de ingresos
a la mina Antacasi en un mes. Calcular la varianza
poblacional.
Xi 5 10 15 20 25
fi 3 7 5 3 2
Ejercicio 2
Una empresa de fabricación de productos cerámicos dispone de tres centros de producción. En el
centro A, el más grande y moderno, se hace un estudio de los m² de azulejo producidos al mes
durante el año pasado, obteniéndose una media de producción mensual m2, con una
desviación típica SA = 15 m². Se sabe que el centro B, por tener maquinaria más anticuada que A,
produce cada mes un tercio de la producción de A, y que el centro C, por tener un horno menos
que B, produce cada mes 25 m² menos que B ¿Cuál es la varianza de la producción mensual de C?
250Ax
Ejercicio 3
Tenemos dos variables X e Y con el mismo recorrido y media, siendo sus varianzas 4 y 9
respectivamente. ¿Para cuál de las dos variables el valor de la media es más representativo?
Ejercicio 4
LONGITUD CANTIDAD
[ 67.5 – 72.5 > 5
[ 72.5 – 77.5 > 95
[ 77.5 – 82.5 > 790
[ 82.5 – 87.5 > 100
[ 87.5 – 92.5 > 10
En una empresa maderera se han seleccionado un grupo
de 1000 piezas de madera de las mismas características
de acuerdo a su longitud en metros, los resultados se
muestran en la siguiente tabla:
a) Calcular la varianza.
b) Analizar la homogeneidad de la muestra.
¿Qué hemos aprendido?
CIERRE
1. ¿Para qué sirven las medidas de
dispersión?
2. ¿Cuál es la relación entre el coeficiente de
variación y la homogeneidad de un conjunto
de datos.
CIERRE

Continuar navegando