Logo Studenta

03 - Ayuda 03 Estadística descriptiva

¡Este material tiene más páginas!

Vista previa del material en texto

¡La Universidad para todos!
Escuela Profesional
Tema: ESTADÍSTICA DESCRIPTIVA
Docente: Mag. Ing. Gustavo Manuel Yáñez Wendorff
Periodo académico: 2019-1B 
Semestre I
Unidad: 2
:
INGENIERÍA INDUSTRIAL
¡La universidad para todos!
ESTADÍSTICA DESCRIPTIVA
• Es una herramienta matemática que permite recopilar,
organizar, presentar y analizar datos obtenidos de un
estudio estadístico.
• Es una ciencia que analiza series de datos (por ejemplo,
edad de una población, altura de los estudiantes de una
escuela, temperatura en los meses de verano, etc) y
trata de extraer conclusiones sobre el comportamiento
de estas variables.
2
http://www.youtube.com/watch?v=OPkGxnEXLsI
¡La universidad para todos!
VARIABLES
• Las variables pueden ser de dos tipos:
• Variables cualitativas o atributos:
• No se pueden medir numéricamente (Ejemplo:
nacionalidad, color de la piel, sexo).
• Variables cuantitativas:
• Tienen valor numérico (Ejemplo: edad, precio de un
producto, ingresos anuales).
¡La universidad para todos!
VARIABLES
• Las variables también se pueden clasificar en:
• Variables unidimensionales: 
• Sólo recogen información sobre una característica 
(Ejemplo: edad de los alumnos de una clase).
• Variables bidimensionales: 
• Recogen información sobre dos características de la 
población (Ejemplo: edad y altura de los alumnos de una 
clase).
• Variables pluridimensionales: 
• Recogen información sobre tres o más características 
(Ejemplo: edad, altura y peso de los alumnos de una 
clase).
4
¡La universidad para todos!
VARIABLES
• Por su parte, las variables cuantitativas se pueden
clasificar en discretas y continuas:
• Discretas: sólo pueden tomar valores enteros (1, 2, 8,
-4, etc.). (Ejemplo: número de hermanos puede ser 1,
2, 3....,etc, pero nunca podrá ser 3,45).
• Continuas: pueden tomar cualquier valor real dentro
de un intervalo. (Ejemplo, la velocidad de un vehículo
puede ser 80,3 km/h, 94,57 km/h...etc.)
¡La universidad para todos!
VARIABLES
¡La universidad para todos!
COMPORTAMIENTO DE UNA VARIABLE
• Cuando se estudia el comportamiento de una variable
hay que distinguir los siguientes conceptos:
• Individuo
• Población
• Muestra
¡La universidad para todos!
COMPORTAMIENTO DE UNA VARIABLE
• Individuo:
• Cualquier elemento que porte información sobre el
fenómeno que se estudia. (Ejemplo: si estudiamos la
altura de los niños de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada
vivienda es un individuo.
¡La universidad para todos!
COMPORTAMIENTO DE UNA VARIABLE
• Población:
• Conjunto de todos los individuos (personas, objetos,
animales, etc.) que porten información sobre el
fenómeno que se estudia.
• Ejemplo
• Si estudiamos el precio de la vivienda en una
ciudad, la población será el total de las viviendas de
dicha ciudad
• Si estudiamos las intención de voto en una elección
en el Perú, la población será: por país, región,
departamento, provincia o distrito.
¡La universidad para todos!
COMPORTAMIENTO DE UNA VARIABLE
• Muestra:
• Subconjunto de la población.
• Así, si se estudia el precio de la vivienda de una ciudad,
lo normal será no recoger información sobre todas las
viviendas de la ciudad (sería una labor muy compleja),
sino que se suele seleccionar un subgrupo (muestra)
que se entienda que es suficientemente representativo.
• Ejemplo:
Simulacro de Votación en el Distrito de Chilca
http://www.datum.com.pe/pdf/CH.pdf
¡La universidad para todos!
COMPORTAMIENTO DE UNA VARIABLE
• Muestreo estratificado
• Es una forma de representación estadística que muestra
como se comporta una característica o variable en una
población a través de hacer evidente el cambio de dicha
variable en sub-poblaciones o estratos.
• Consiste en la división previa de la población de estudio en
grupos o clases que se suponen homogéneos respecto a
característica a estudiar y que no se solapen.
• Según la cantidad de elementos de la muestra que se han
de elegir de cada uno de los estratos, existen dos técnicas
de muestreo estratificado:
http://www.datum.com.pe/metodologias.php
¡La universidad para todos!
COMPORTAMIENTO DE UNA VARIABLE
• Muestreo estratificado
1. Asignación proporcional: el tamaño de cada estrato en la muestra
es proporcional a su tamaño en la población.
2. Asignación óptima: la muestra recogerá más individuos de
aquellos estratos que tengan más variabilidad. Para ello es
necesario un conocimiento previo de la población.
• Ejemplo
• Para un estudio de opinión, puede resultar interesante estudiar
por separado las opiniones de hombres y mujeres pues se estima
que, dentro de cada uno de estos grupos, puede haber cierta
homogeneidad.
• Así, si la población está compuesta de un 55% de mujeres y un
45% de hombres, se tomaría una muestra que contenga también
esa misma proporción.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Ordenamiento de datos cuando en un estudio estadístico se
recopila una gran cantidad de ellos.
• El número de veces que aparece repetido cada dato es la
frecuencia de dicho valor.
• Es la representación estructurada, en forma de tabla, de toda la
información que se ha recogido sobre la variable que se estudia.
• Agrupamiento de datos en categorías mutuamente excluyentes,
que indican el número de observaciones en cada categoría.
• Es una ordenación en forma de tabla de los datos estadísticos,
asignando a cada dato su frecuencia correspondiente.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Frecuencia absoluta
• Es el número de veces que aparece un determinado valor
en un estudio estadístico.
• Se representa por fi.
• La suma de las frecuencias absolutas es igual al número
total de datos, que se representa por N.
• Para indicar resumidamente estas sumas se utiliza la
letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria.
i = n
f1 + f2 + f3 + f4 + ……. fn = N Σ fi = N
i = 1
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Frecuencia relativa
• Es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
• Se puede expresar en tantos por ciento y se representa
por ni
• La suma de las frecuencias relativas es igual a 1.
ni = fi
N
• Rango: Es la diferencia entre el dato mayor y el menor.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Frecuencia acumulada
• Es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado.
• Se representa por Fi.
• Frecuencia relativa acumulada
• Es el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos.
• Se puede expresar en tantos por ciento.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Existen dos tipos de distribución de frecuencias:
• Distribución en datos no agrupados
• Distribución con datos agrupados
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Distribución en datos no agrupados
• Se utiliza preferentemente cuando las opciones de la
variable son pocas.
• Ejemplo:
Al lanzar un dado 10 veces, se obtuvo la siguiente
información:
1 – 6 – 4 – 3 – 1 – 2 – 6 – 5 – 1 – 3
Rango: 6 – 1 = 5.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Distribución en datos no agrupados
1 – 6 – 4 – 3 – 1 – 2 – 6 – 5 – 1 – 3
Al sumar la columna frecuencia, se obtiene el total de
datos (n).
Total datos: 10.
Número Frecuencia
1 3
2 1
3 2
4 1
5 1
6 2
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Distribución en datos agrupados
• Se utiliza cuando la variable ofrece una gran gama de
posibilidades, si escuantitativa continua, debemos
agrupar los datos en intervalos semiabiertos, excepto
el último, que es cerrado.
• Al agrupar los datos en intervalos, se debe calcular la
“marca de clase”.
• Marca de clase
• Corresponde al promedio entre los extremos del
intervalo
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Ejemplo
• Durante el mes de enero, en una ciudad de la costa
peruana se registraron las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28,
29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31,
30, 31, 34, 33, 33, 29, 29.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• En la primera columna de la tabla colocamos la variable
ordenada de menor a mayor, en la segunda hacemos el
recuento y en la tercera anotamos la frecuencia absoluta
• Este tipo de tablas de frecuencias se utiliza con variables
discretas.
xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 III 3 27 0.097 0.871
33 III 3 30 0.097 0.968
34 I 1 31 0.032 1.000
31 1.000
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• La distribución de frecuencias agrupadas o tabla con datos
agrupados se emplea si las variables toman un número
grande de valores o la variable es continua.
• Se agrupan los valores en intervalos que tengan la misma
amplitud denominados clases. A cada clase se le asigna su
frecuencia correspondiente.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Límites de la clase
• Cada clase está delimitada por el límite inferior de la clase
y el límite superior de la clase.
• Amplitud de la clase
• Es la diferencia entre el límite superior e inferior de la clase.
• Marca de clase
• Es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el cálculo de algunos
parámetros.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Distribución en datos agrupados
• Ejemplo:
Peso (Kg.) Frecuencia Marca de clase
[55,59[ 2 57
[59,63[ 5 61
[63,67[ 3 65
[67,71[ 7 69
[71,75] 4 73
R
NC
A =
A = Amplitud = Longitud del Intervalo
R = Rango
NC = Número de Clases
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Construcción de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29,
25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22,
27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1. Se localizan los valores menor y mayor de la distribución.
En este caso son 3 y 48.
2. Se restan y se busca un número entero un poco mayor que
la diferencia y que sea divisible por el número de intervalos
de queramos poner.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Construcción de una tabla de datos agrupados
• Es conveniente que el número de intervalos oscile entre
6 y 15.
• En este caso, 48 - 3 = 45, incrementamos el número
hasta 50 : 5 = 10 intervalos.
• Se forman los intervalos teniendo presente que el límite
inferior de una clase pertenece al intervalo, pero el límite
superior no pertenece intervalo, se cuenta en el
siguiente intervalo.
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
3 7 11 13 13 15 15 17 20 22 24 25 26
27 28 28 29 31 32 32 33 34 34 34 35 35
36 36 37 38 38 38 39 39 41 42 43 44 47 48
[0, 5) 3 1 25 35
[5, 10) 7 1 26 35
11 27 36
13 28 36
13 28 37
15 29 38
15 31 38
17 32 38
20 32 39
22 33 39
24 34 41
34 42
34 43
44
47
48
3
3
3
6
7
10
[25, 30)
[20, 25)
[15, 20)
[10, 15)
4
2[45, 50)
[40, 45)
[35, 40)
[30, 35)
• Construcción de una tabla de datos agrupados
¡La universidad para todos!
DISTRIBUCIÓN DE FRECUENCIAS
• Construcción de una tabla de datos agrupados
ci fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.275
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 42.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1.000
40 1.000
https://www.youtube.com/watch?v=ByMIPmfIMTU
¡La universidad para todos!
HISTOGRAMAS
• Es un resumen gráfico de un conjunto de datos.
• Objetivo 
• Estudiar la capacidad de los procesos y mantenerlos
bajo control.
• Permite ver esquemas y comportamientos que son
difíciles de captar en una tabla numérica.
• Su éxito radica en que conjuga dos tipos de técnicas:
• La estadística: Permite sacar conclusiones del conjunto
de los datos.
• Los gráficos: Permite representar los datos y hace
sencilla su interpretación.
¡La universidad para todos!
HISTOGRAMA
• Para que se usan los Histogramas
• Son una herramienta útil cuando hay que analizar una
gran cantidad de datos.
• Para mostrar en forma de gráficos de barras las
características de un producto o servicio
• Tipos de defectos, problemas, riesgos de seguridad,
etc.
• Un histograma toma datos de mediciones de
• Temperatura, presiones, alturas, pesos, etc.
• Muestra su distribución.
• Un histograma revela la cantidad de variación propia
de un proceso.
¡La universidad para todos!
HISTOGRAMA
• Metodología de elaboración
• Se recogen los datos que se necesitan por el método
más adecuado.
• Los datos son fundamentales para toda acción de
mejora.
• Tener en cuenta que datos no es igual que
información.
• Se clasifican los datos en una serie de grupos
representativos.
• Una misma característica (ejemplo: altura)
• Agrupada por intervalos (ejemplo: entre 5 y 10 cm.)
¡La universidad para todos!
HISTOGRAMA
• Con los datos que se presentan a continuación de la
presencia de hierro en la redes de agua potable de la
ciudad ABCD.
• Elabore la hoja de verificación y calcule valores
máximo, mínimo y promedio
• Elabore el histograma
¡La universidad para todos!
HISTOGRAMA
0,045 0,060 0,154 0,076 0,040 0,232 0,050 0,044
0,034 0,048 0,075 0,043 0,090 0,074 0,075 0,064
0,056 0,066 0,122 0,079 0,065 0,087 0,137 0,092
0,017 0,105 0,081 0,069 0,033 0,235 0,082 0,054
0,028 0,050 0,065 0,044 0,049 0,053 0,058 0,070
0,024 0,219 0,039 0,022 0,027 0,018 0,012 0,115
0,089 0,053 0,120 0,112 0,036 0,133 0,073 0,040
0,089 0,080 0,103 0,057 0,089 0,053 0,120 0,112
0,090 0,299 0,060 0,269 0,058 0,041 0,047 0,232
0,058 0,041 0,047 0,032 0,065 0,287 0,137 0,092
0,053 0,033 0,042 0,110 0,045 0,060 0,154 0,076
0,139 0,028 0,035 0,068 0,090 0,074 0,075 0,064
0,065 0,048 0,067 0,099 0,056 0,066 0,122 0,079
0,025 0,002 0,042 0,045 0,224 0,019 0,039 0,022
0,056 0,047 0,033 0,031 0,089 0,053 0,120 0,112
(*) =0,300
Máximo 0.299
Mínimo 0.002
Promedio 0.078
¡La universidad para todos!
HISTOGRAMA
Clase Frecuencia % acumulado
0.002 1 0.83%
0.0317 12 10.83%
0.0614 45 48.33%
0.0911 33 75.83%
0.1208 13 86.67%
0.1505 6 91.67%
0.1802 2 93.33%
0.2099 0 93.33%
0.2396 5 97.50%
0.2693 1 98.33%
y mayor... 2 100.00%
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
0
5
10
15
20
25
30
35
40
45
50
0
.0
0
2
0
.0
3
1
7
0
.0
6
1
4
0
.0
9
1
1
0
.1
2
0
8
0
.1
5
0
5
0
.1
8
0
2
0
.2
0
9
9
0
.2
3
9
6
0
.2
6
9
3
y
 m
a
y
o
r.
..
F
re
c
u
e
n
c
ia
Clase
Histograma
Frecuencia % acumulado
¡La universidad para todos!
HISTOGRAMA
Clase Frecuencia % acumulado Clase Frecuencia % acumulado
0.002 1 0.83% 0.0614 45 37.50%
0.0317 12 10.83% 0.0911 33 65.00%
0.0614 45 48.33% 0.1208 13 75.83%
0.0911 33 75.83% 0.0317 12 85.83%
0.120813 86.67% 0.1505 6 90.83%
0.1505 6 91.67% 0.2396 5 95.00%
0.1802 2 93.33% 0.1802 2 96.67%
0.2099 0 93.33% y mayor... 2 98.33%
0.2396 5 97.50% 0.002 1 99.17%
0.2693 1 98.33% 0.2693 1 100.00%
y mayor... 2 100.00% 0.2099 0 100.00%
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
0
5
10
15
20
25
30
35
40
45
50
0
.0
6
1
4
0
.0
9
1
1
0
.1
2
0
8
0
.0
3
1
7
0
.1
5
0
5
0
.2
3
9
6
0
.1
8
0
2
y
 m
a
y
o
r.
..
0
.0
0
2
0
.2
6
9
3
0
.2
0
9
9
F
re
c
u
e
n
c
ia
Clase
Histograma
Frecuencia % acumulado
¡La universidad para todos!
HISTOGRAMA
¡La universidad para todos!
HISTOGRAMA
¡La universidad para todos!
HISTOGRAMA
¡La universidad para todos!
HISTOGRAMA
¡La universidad para todos!
HISTOGRAMA
¡La universidad para todos!
GRAFICOS DE SECUENCIA
• Típicamente se examina la descripción de un caso de uso
para determinar qué objetos son necesarios para la
implementación del escenario.
• Si se dispone de la descripción de cada caso de uso
como una secuencia de varios pasos, entonces se puede
"caminar sobre" esos pasos para descubrir qué objetos
son necesarios para que se puedan seguir los pasos.
• Un diagrama de secuencia muestra los objetos que
intervienen en el escenario con líneas discontinuas
verticales, y los mensajes pasados entre los objetos como
flechas horizontales.
¡La universidad para todos!
GRAFICOS DE SECUENCIA
¡La universidad para todos!
GRAFICOS DE SECUENCIA
¡La universidad para todos!
GRAFICOS DE SECUENCIA
¡La universidad para todos!
DIAGRAMA DE FLUJO
• Es la representación gráfica del algoritmo o proceso. 
• Se utiliza en disciplinas como programación, economía, 
procesos industriales y psicología cognitiva.
¡La universidad para todos!
DIAGRAMA DE FLUJO 
PARA INGRESAR EL CORREO OUTLOOK
¡La universidad para todos!
• Son medidas estadísticas que se usan para describir como
se puede resumir la localización de los datos.
• Ubican e identifican el punto alrededor del cual se centran
los datos.
• Las medidas de tendencia central nos indican hacia donde
se inclinan o se agrupan más los datos.
• Las más utilizadas son: la media, la mediana y la moda.
MEDIDAS DE TENDENCIA CENTRAL
¡La universidad para todos!
• La media o media aritmética o media muestral,
usualmente se le llama promedio.
• Se obtiene sumando todos los valores de los datos y
dividiendo el resultado entre la cantidad de datos.
• Si los datos proceden de una muestra, el promedio se
representa con X.
• Si los datos proceden de la población, se utiliza la letra
griega µ.
LA MEDIA
¡La universidad para todos!
• La fórmula matemática para calcular la media o
promedio es la siguiente:
= promedio
= signo de sumatoria
N = numero de datos
Media poblacional =
La media muestral x¯ es un estimador puntual de la media
poblacional μ.
N
x
x

=
X

LA MEDIA
¡La universidad para todos!
A continuación se presenta una muestra de las
puntuaciones en un examen de un curso de estadística:
70 90 95 74
58 70 98 72
75 85 95 74
80 85 90 65
90 75 90 69
Podemos calcular el promedio de las puntuaciones para
conocer cuántos estudiantes obtuvieron puntuaciones por
encima y por debajo del promedio . Veamos
LA MEDIA
¡La universidad para todos!
• Primero, sumamos todos los valores de los datos y el
resultado lo divide entre el total de datos o tamaño de
la muestra.
• Al sumar todas las puntuaciones en el ejemplo anterior
obtendrás un total de 1600, que dividido por 20(total
de datos), es igual a 80.
• Si empleamos la fórmula obtenemos:
N
x
x

= 8020
1600
==x
LA MEDIA
¡La universidad para todos!
• Sueldos mensuales iniciales en una muestra de 12 recién
egresados de la carrera de Ingeniería Industrial:
LA MEDIA
Egresado Sueldo S/.
1 1,950 
2 2,050 
3 2,150 
4 1,980 
5 1,855 
6 1,810 
7 1,990 
8 2,230 
9 2,040 
10 2,425 
11 2,020 
12 1,980 
= 1,950 + 2,050 + ….. + 1980
12
2,040
¡La universidad para todos!
• La segunda medida de tendencia central que analizaremos
es la mediana, en ocasiones se le llama media posicional,
porque queda exactamente en la mitad de un grupo de
datos, luego de que los datos se han colocado de forma
ordenada.
• En este caso la mitad (50%) de los datos estará por
encima de la mediana y la otra mitad (50%) estará por
debajo de ella.
• La mediana es el valor intermedio cuando los valores de
los datos se han ordenado.
LA MEDIANA
¡La universidad para todos!
• La mediana es la medida de localización más empleada
cuando se trata de ingresos anuales y valores de
propiedades, debido a que la media puede inflarse por
unos cuantos ingresos o valores de propiedades muy
altos.
• En tales casos, la mediana es la medida de localización
central preferida.
LA MEDIANA
¡La universidad para todos!
• Existen dos formas para obtener la mediana.
• Primero, si la cantidad de los datos es impar, la mediana
es el valor que se encuentra en la posición (n+1)÷2
donde, n es el número de datos.
• Por ejemplo, se tiene una muestra de tamaño 5 con los
siguientes valores: 46, 54, 42, 48 y 32. Veamos como se
determina la mediana.
LA MEDIANA
¡La universidad para todos!
• Primer paso, ordenar los datos:
32 42 46 48 54
• Como la cantidad de datos es impar
(5 datos), la mediana es el valor del dato que se
encuentra ubicado en la posición (5+1)÷2=3, la
mediana es 46.
• Segundo, si la cantidad de datos es par, la mediana es
el valor promedio de los datos que se encuentran en
las posiciones (n÷2) y (n÷2) + 1.
LA MEDIANA
¡La universidad para todos!
• Se ha obtenido una muestra con los valores de datos: 27,
25, 27, 30, 20 y 26. ¿cómo se determina la mediana en
este caso?.
• Primer paso, ordenar los datos de forma ascendente:
20 25 26 27 27 30
Como el número de datos es par (6), la mediana es el
promedio de los datos que se encuentran en las
posiciones (6÷2) = 3 y (6÷2) +1 = 4. por lo tanto la
mediana es:
= 26.5
2
2726+
LA MEDIANA
¡La universidad para todos!
• Sueldos mensuales iniciales en una muestra de 12 recién
egresados de la carrera de Ingeniería Industrial:
LA MEDIANA
1,810 1,855 1,950 1,980 1,980 1,990 2,020 2,040 2,050 2,150 2,230 2,425 
Egresado Sueldo S/.
1 1,950 6 1,810 
2 2,050 5 1,855 
3 2,150 1 1,950 
4 1,980 4 1,980 
5 1,855 12 1,980 
6 1,810 7 1,990 
7 1,990 11 2,020 
8 2,230 9 2,040 
9 2,040 2 2,050 
10 2,425 3 2,150 
11 2,020 8 2,230 
12 1,980 10 2,425 
1,990 + 2,020 = 2,005
2
¡La universidad para todos!
• La moda es el dato que más se repite o el dato que
ocurre con mayor frecuencia.
• En el ejemplo anterior la moda es el 27 .
• Un grupo de datos puede tener más de una moda.
• Veamos el siguiente ejemplo: se tiene una muestra con
valores 20, 23, 20, 24, 25, 25, 26 y 30. El 20 y 25 son la
moda entonces, se dice que es bimodal.
LA MODA
¡La universidad para todos!
• El único salario mensual inicial que se presenta más de
una vez
• 1,980 como este valor tiene la
frecuencia mayor, es la moda.
LA MODA
1,810 1,855 1,950 1,980 1,980 1,990 2,020 2,040 2,050 2,150 2,230 2,425 
Egresado Sueldo S/.
1 1,950 6 1,810 
2 2,050 5 1,855 
3 2,150 1 1,950 
4 1,980 4 1,980 
5 1,855 12 1,980 
6 1,810 7 1,990 
7 1,990 11 2,020 
8 2,230 9 2,040 
9 2,0402 2,050 
10 2,425 3 2,150 
11 2,020 8 2,230 
12 1,980 10 2,425 
¡La universidad para todos!
• Ejemplo de distribución de frecuencias, media, mediana
y moda
EJEMPLO
https://www.youtube.com/watch?v=m98364i9yRo
¡La universidad para todos!
• Un percentil nos provee información de como se
distribuyen los valores de los datos desde el menor
hasta el mayor.
• El percentil divide los datos en dos partes, más o
menos el (p) por ciento de los datos tienen valores
menores que el percentil y aproximadamente (100-p)
por ciento de los datos tienen valores mayores que el
percentil.
PERCENTILES
¡La universidad para todos!
• Para calcular el percentil debe seguir los siguientes pasos:
Paso 1. Ordene los datos de manera ascendente.
Paso 2. Calcule un índice (i)
en donde:
(p) es el percentil de interés
(n) es el número de datos u observaciones.
n
P
i 






100
PERCENTILES
¡La universidad para todos!
Paso 3.
a) Si (i) no es entero, utilizando las reglas de redondeo, se
lleva al próximo numero entero.
El valor entero inmediato mayor que (i) indica la posición
donde se encuentra el percentil.
Esto significa que si (i) = 3.5, el percentil se encuentra
en la posición 4 de los datos.
b) Si (i) es entero, el percentil es el promedio de los valores
de los datos ubicados en los lugares i e (i + 1).
PERCENTILES
¡La universidad para todos!
• Como ejemplo de este procedimiento, determina el percentil
75 de los datos sobre las edades del siguiente un grupo de
ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30, 28, 27.
• Paso 1.
Ordene los datos en orden ascendente:
19 20 21 22 23 25 26 27 28 30
• Paso 2.
Calcule el índice (i):
PERCENTILES
n
P
i 






100
5.710
100
75






i
¡La universidad para todos!
• Paso 3.
Como (i) no es entero, redondeamos al próximo entero mayor
que 7.5, o sea, el lugar 8.
Al referirnos a los datos del ejemplo, vemos que el percentil 75
es el valor del dato ubicado en la posición número 8, que en
este caso es 27.
19 20 21 22 23 25 26 27 28 30
• Nota.
Recuerda que (i) nos indica el lugar del dato donde se
encuentra el percentil que estamos buscando.
• Interpretación
Significa que el 75% de las edades son menores de 27 años y el
25% restante (100-p) es mayor de 27 años.
PERCENTILES
¡La universidad para todos!
• Los cuartiles dividen los datos en cuatro partes.
• Cada una de las partes representa una cuarta parte, o el
25% de las observaciones.
• Los cuartiles son percentiles específicos; por
consiguiente, los pasos para calcular los percentiles los
podemos emplear para calcular los cuartiles.
CUARTILES
¡La universidad para todos!
• Los cuartiles se definen de la siguiente manera
• Q1 = primer cuartil, o percentil 25
• Q2 = segundo cuartil, o percentil 50
(también la mediana)
• Q3 = tercer cuartil, o percentil 75
CUARTILES
¡La universidad para todos!
• A continuación se presenta un conjunto de datos con los
siguientes valores; 10, 5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.
• ¿ Cómo identificamos los cuartiles en este ejemplo?
• Utilizarás los mismos pasos para identificar los
percentiles:
• Primero, ordenamos los datos
5 8 11 12 14 15 18 20 25 30
• Segundo, determinamos (i) para cada cuartil:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50, (también la mediana)
Q3 = tercer cuartil, o percentil 75
•
CUARTILES
¡La universidad para todos!
• Cuartiles:
Q1 = primer cuartil, o percentil 25
= 2.5
• Como (i) no es un número entero, se redondea al
próximo entero mayor que 2.5, o sea 3.
• Al referirnos a los datos vemos que el primer cuartil está
ubicado en la posición 3 de los datos que este caso es
11.
• El primer cuartil en los datos se divide de la siguiente
forma:
5 8 11 12 14 15 18 20 25 30
Q1=11
10
100
25






i
CUARTILES
¡La universidad para todos!
• Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (también la mediana)
= 5
• Como (i) es un número entero, el segundo cuartil es el
promedio de los valores de los datos que están en las
posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
entonces, el segundo cuartil en los datos se divide así:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5
10
100
50






i
CUARTILES
¡La universidad para todos!
• Tercer cuartil:
Q3 = tercer cuartil, o percentil 75
= 7.5
• Como (i) no es un número entero, se redondea al próximo entero
mayor que 7.5, o sea 8. Al referirnos a los datos , vemos que el
tercer cuartil está ubicado en posición 8 de los datos que en este
caso es el 20. Finalmente, los cuartiles en este caso se presentan
de la siguiente forma:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5 Q3=20
10
100
75






i
CUARTILES
https://www.youtube.com/watch?v=s0DYmg45ywQ
¡La universidad para todos!
MEDIDAS DE DISPERSIÓN
• Existe otro tipo de medidas que indican la tendencia de
los datos a dispersarse respecto al valor central
• Rango, amplitud o recorrido (R)
• Desviación media (DM).
• Varianza (s² , σ ² )
• Desviación estándar (s,muestral y σ, poblacional ).
• Coeficiente de Variación (C. V.)
¡La universidad para todos!
RANGO
• Rango
Es la diferencia entre el dato mayor y el dato menor.
R= Xmáx. - Xmín.
¡La universidad para todos!
DESVIACIÓN MEDIA
Se conoce también como promedio de
desviación.
Para una serie de N valores se puede
calcular a través de la siguiente expresión:
Valor absoluto de las desviaciones de los x
valores, respecto de la media.
Y para datos agrupados se tiene:
¡La universidad para todos!
DESVIACIÓN MEDIA
• EJEMPLO: 
Hallar la desviación media de: 4,6,12,16,22. 
_ 
x = 4 + 6+12+16+22 = 12 
5 
4-12 = 8 
6-12 = 6 
12-12 = 0
16-12 = 4 
22-12= 10 
= 28
D.M. = 28/ 5 = 5.6
¡La universidad para todos!
VARIANZA
• Es la suma de las desviaciones medias al cuadrado.
EJEMPLO:
Hallar la desviación estándar y la varianza de la siguiente 
serie de datos.
10, 18, 15, 12, 3,6,5,7
Para datos no agrupados
Para datos agrupados
¡La universidad para todos!
VARIANZA
EJEMPLO:
Hallar la desviación estándar y la varianza de la siguiente 
serie de datos.
10, 18, 15, 12, 3,6,5,7 
10, 18, 15, 12, 3,6,5,7 ➔
8
¡La universidad para todos!
VARIANZA
(x – x) (x – x)
2
(10-9.5) 0.5 0.25
(18-9.5) 8.5 72.25
(15-9.5) 5.5 30.25
(12-9.5) 2.5 6.25
(3-9.5) -6.5 42.25
(6-9.5) -3.5 12.25
(5-9.5) -4.5 20.25
(7-9.5) -2.5 6.25
190.00 
¡La universidad para todos!
VARIANZA
¡La universidad para todos!
DESVIACIÓN ESTÁNDAR
• Es la raíz cuadrada de la varianza.
• La desviación estándar o desviación tipo se define como 
la raíz cuadrada de los cuadrados de las desviaciones de
los valores de la variable respecto a su media. 
¡La universidad para todos!
COEFICIENTE DE VARIACIÓN
• Es la relación que existe entre la Desviación Estándar (S)
y la Media Aritmética (X), expresada en términos de
porcentaje y se expresa:
C.V. = S (100) 
X 
• Ejemplo
• Hallar el coeficiente de variación de una serie de datos 
cuya S= 2 y X = 16. 
: C.V. = 2 * (100)= 12.5% 
16 
¡La universidad para todos!
DESVIACIÓN ESTÁNDAR
• Es la raíz cuadrada de la varianza.
• La desviación estándar o desviación tipo se define como 
la raíz cuadrada de los cuadrados de las desviaciones de
los valores de la variable respecto a su media. 
¡La universidad para todos!
DESVIACIÓN ESTÁNDAR
¡La universidad para todos!
¡Gracias!

Otros materiales