Logo Studenta

UNIDAD N2

¡Este material tiene más páginas!

Vista previa del material en texto

2
1
Unidad N°2
La Descripción de Datos es el estudio de varias medidas numéricas que 
proporcionan opciones para resumir datos. Por un lado, medidas numéricas para 
conjuntos de datos que constan de una sola variable. Si el conjunto de datos consta 
de más de una variable, se emplearán estas mismas medidas numéricas para cada 
una de las variables por separado. Sin embargo, en el caso de dos variables, se 
estudiará también medidas de la relación entre dos variables.
MEDIA: 40 días
MEDIANA: 35 días
MODA: 31 días
2
3
Unidad N°2
Los datos cualitativos o cuantitativos se resumen mediante una tabla de 
Distribución de Frecuencia: Una distribución de frecuencia es un resumen 
tabular de datos que muestra el número (frecuencia) de elementos en cada una 
de las diferentes clases.
4
Unidad N°2
Cinco refrescos muy conocidos son Coca cola clásica 
(Coke Classic), Coca cola de dieta (Diet Coke), Dr. Pepper, 
Pepsi y Sprite. Suponga que los datos de la tabla 
muestran los refrescos que fueron comprados en una 
muestra de 50 ventas de refresco.
Para elaborar una distribución de frecuencia con estos datos, se 
cuenta el número de veces que aparece cada refresco en la tabla. 
La Coca cola clásica (Coke Classic) aparece 19 veces, la Coca cola de 
dieta (Diet Coke) 8 veces, Dr. Pepper 5 veces, Pepsi 13 veces y 
Sprite 5 veces. Esto queda resumido en la distribución de 
frecuencia de la tabla superior.
5
Unidad N°2
Proporción o porcentaje de elementos en cada clase:
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 =
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝑛
n: número de observaciones
Frecuencia relativa multiplicada por 100
Unidad N°2
En esta tabla se observa que la frecuencia relativa de la Coca cola clásica es 19/50 = 0.38, la de la Coca cola de dieta es 8/50 = 0.16, etc. 
En la distribución de frecuencia porcentual, se muestra que 38% de las ventas fueron de Coca cola clásica, 16% de Coca cola de dieta, 
etc. También resulta que 38% + 26% + 16% = 80% de las ventas fueron de los tres refrescos que más se venden.
6
7
La suma de las frecuencias en una distribución de frecuencia es siempre
igual al número de observaciones, n. La suma de las frecuencias relativas
en una distribución de frecuencia relativa es siempre igual a 1.00, y la
suma de los porcentajes en una distribución de frecuencia porcentual es
siempre igual a 100.
Unidad N°2
8
Unidad N°2
Los datos cualitativos o cuantitativos se resumen mediante una tabla de 
Distribución de Frecuencia: Una distribución de frecuencia es un resumen 
tabular de datos que muestra el número (frecuencia) de elementos en cada una 
de las diferentes clases.
Cuando se trata de datos cuantitativos se debe tener más cuidado al definir las 
clases disyuntas que se van a usar en la distribución de frecuencia.
9
Unidad N°2
En esta tabla se presenta la duración en días de una 
muestra de auditorías de fin de año de 20 clientes de una 
empresa pequeña de contadores públicos. Los tres pasos 
necesarios para definir las clases de una distribución de 
frecuencia con datos cuantitativos son:
1. Determinar el número de clases disyuntas.
2. Determinar el ancho de cada clase
3. Determinar los límites de clase.
10
Unidad N°2
Cuando la variable es continua o cuando es discreta pero con elevado número de 
valores, se agrupan dichos valores en intervalos o clases. 
Las clases se forman especificando los intervalos que se usarán para agrupar los 
datos. Se recomienda emplear entre 5 y 20 clases. Cuando los datos son pocos, 
cinco o seis clases bastan para resumirlos. Si son muchos, se suele requerir más 
clases.
11
Unidad N°2
Como regla general es recomendable que el ancho sea el mismo para todas las clases. Así, el ancho y el 
número de clases no son decisiones independientes. Entre mayor sea el número de clases menor es el 
ancho de las clases y viceversa. Para determinar el ancho de clase apropiada se empieza por identificar el 
mayor y el menor de los valores de los datos. Después, usando el número de clases deseado, se emplea la 
expresión siguiente para determinar el ancho aproximada de clase.
𝐴𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 (𝑎𝑐) =
𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 𝑒𝑛 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 𝑒𝑛 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
El ancho aproximado de clase que se obtiene con la ecuación se redondea a un valor más adecuado
12
Unidad N°2
Los límites de clase deben elegirse de manera que cada dato pertenezca a una y sólo una 
de las clases. El límite de clase inferior indica el menor valor de los datos a que pertenece 
esa clase. El límite de clase superior indica el mayor valor de los datos a que pertenece 
esa clase.
13
Unidad N°2
En algunas aplicaciones se desea conocer el punto medio de las clases o marca de clase 
(mc) de una distribución de frecuencia de datos cuantitativos. El punto medio de clase es el 
valor que queda a la mitad entre el límite inferior y el límite superior de la clase.
14
Unidad N°2
Proporción o porcentaje de elementos en cada clase:
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 =
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝑛
n: número de observaciones
Frecuencia relativa multiplicada por 100
15
Unidad N°2
En lugar de mostrar la frecuencia de cada clase, la distribución de frecuencia acumulada 
muestra la cantidad de datos que tienen un valor menor o igual al límite superior de cada 
clase.
También es de utilidad calcular la Frecuencia acumulada relativa y la Frecuencia 
acumulada relativa porcentual.
16
En una distribución de frecuencia acumulada, la última frecuencia
siempre es igual al número total de observaciones, n. En una distribución
de frecuencia relativa acumulada la última frecuencia siempre es igual a
1.00 y en una distribución de frecuencia porcentual acumulada la última
frecuencia es siempre 100
Unidad N°2
01
02
03
17
Unidad N°2
Media, Mediana, Moda. 
Cuartiles para distribución discreta y 
continua
Varianza, rango o amplitud, desvío 
estándar, coeficiente de variabilidad
18
Unidad N°2
La medida de tendencia central más importante es la media, o valor promedio, de 
una variable. La media proporciona una medida de localización central de los 
datos. Si los datos son datos de una muestra, la media se denota ҧ𝑥; si los datos 
son datos de una población, la media se denota con la letra griega μ.
19
Unidad N°2
ҧ𝑥 =
σ𝑥𝑖
𝑛
𝑥𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑛 = 𝑁° 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
ҧ𝑥 =
σ𝑥𝑖 ∙ 𝑓𝑖
𝑛
𝑓𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑜𝑏𝑠𝑜𝑙𝑢𝑡𝑎
ҧ𝑥 =
σ𝑚𝑐 ∙ 𝑓𝑖
𝑛
𝑚𝑐 = 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
20
Unidad N°2
La mediana es otra medida de localización central. Es el valor de en medio en los 
datos ordenados de menor a mayor (en forma ascendente).
• Si el número de observaciones es impar, la mediana es el valor de en medio.
• Si el número de observaciones es par, la mediana es el promedio de las dos 
observaciones de en medio.
21
Unidad N°2
𝐸𝑗: 32 46 48 52 60
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑀𝑒 =
𝑛 + 1
2
= 3
𝑀𝑒 = 48
𝐸𝑗: 32 46 48 52 60 63
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑀𝑒 =
𝑛 + 1
2
= 3.5
𝑀𝑒 =
48 + 52
2
= 50
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑀𝑒 =
𝑛 + 1
2
Se ubica la posición en la 
columna de frecuencia 
acumulada, Fa. El valor de la 
observación en esa posición es 
el valor de la mediana
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑑𝑒 𝑙𝑎 𝑀𝑒 =
𝑛
2
𝑀𝑒 = 𝐿𝑖 +
ൗ𝑛 2 − 𝐹𝑖−1
𝑓𝑖
∙ 𝑎𝑖
22
Unidad N°2
𝑀𝑒 = 𝐿𝑖 +
ൗ𝑛 2− 𝐹𝑖−1
𝑓𝑖
∙ 𝑎𝑖
𝐷𝑜𝑛𝑑𝑒:
𝐿𝑖: 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑀𝑒
𝐹𝑖−1: 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑀𝑒
𝑓𝑖: 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑀𝑒
𝑎𝑖: 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑜 𝑎𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
23
Unidad N°2
La moda es el valor que se presenta con mayor frecuencia. 
Hay situaciones en que la frecuencia mayor se presenta con dos o más valores 
distintos. Cuando esto ocurre hay más de una moda. Si los datos contienen más 
de una moda se dice que los datos son bimodales. Si contienen más de dos 
modas, son multimodales. 
En otros casos, la moda puede no existir.
24
Unidad N°2
Corresponde al valor de la clase que 
posea mayor frecuencia absoluta (fi)
𝑀𝑜 = 𝐿𝑖 +
𝑓𝑖 − 𝑓𝑖−1
(𝑓𝑖−𝑓𝑖−1) + (𝑓𝑖−𝑓𝑖+1)
∙ 𝑎𝑖
𝐷𝑜𝑛𝑑𝑒:
𝐿𝑖: 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒
𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑀𝑜
𝑓𝑖: 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑀𝑜
𝑓𝑖−1: 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒
𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑀𝑜
𝑓𝑖+1: 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒
𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑀𝑜
𝑎𝑖: 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑜 𝑎𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
25
Unidad N°2
El percentil es un valor tal que por lo menos p por ciento de las observaciones son 
menores o iguales que este valor y por lo menos (100 - p) por ciento de las 
observaciones son mayores o iguales que este valor.
Por ejemplo, suponga que un estudiante obtiene 54 puntos en un examen. Esto no 
dice mucho acerca de este estudiante en relación con los demás estudiantes que 
realizaron el examen. Sin embargo, si esta puntuación corresponde al percentil 70, 
entonces 70% de los estudiantes obtuvieron una puntuación menor a la de dicho 
estudiante y 30% de los estudiantes obtuvieron una puntuación mayor.
26
Unidad N°2
Paso 1. Ordenar los datos de menor a mayor (colocar los datos en orden ascendente).
Paso 2. Calcular el índice i (posición del dato)
𝑖 =
𝑝
100
𝑛
donde p es el percentil deseado y n es el número de observaciones.
Paso 3. (a) Si i no es un número entero, debe redondearlo. El primer entero mayor que
i denota la posición del percentil p.
(b) Si i es un número entero, el percentil p es el promedio de los valores en las
posiciones i e i + 1.
27
Unidad N°2
Determine el percentil 85 en los sueldos mensuales
Paso 1. Ordenar los datos de menor a mayor (colocar los datos en orden ascendente).
133100 133550 134500 134800 134800 134900 135200 135400 135500 136500 137300 139250
Paso 2. Calcular el índice i (posición del dato)
𝑖 =
85
100
12 = 10.2 ≅ 11
Paso 3. Como i no es un número entero, se redondea al primer entero mayor. 
Entonces el percentil 85 es el dato en la posición 11, o sea 137300.
28
Unidad N°2
Con frecuencia es conveniente dividir los datos en cuatro partes; así, cada parte contiene una cuarta parte o 
25% de las observaciones. A los puntos de división se les conoce como cuartiles
29
Unidad N°2
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
𝑃1 =
25
100
12 = 3 ∴ 𝑄1 =
3450+3480
2
= 3465 𝑃2 =
50
100
12 = 6 ∴ 𝑄2 =
3490+3520
2
= 3505 𝑃3 =
75
100
12 = 9…
Se calculan P1, P2 y P3, se ubican dichas posiciones en la columna de frecuencia acumulada (F). Los valores de la 
observación en esas posiciones son los valores de los cuartiles 
Se calculan P1, P2 y P3, se ubican dichas posiciones en la columna de frecuencia acumulada (F). Se ubican los intervalos de 
clase correspondientes a cada cuartil y se calculan como sigue:
𝑄𝑖 = 𝐿𝑖 +
𝑃𝑖−𝐹𝑖−1
𝑓𝑖
∙ 𝑎𝑖 𝑃𝑖 → 𝑃1 =
25
100
𝑛; 𝑃2 =
50
100
𝑛; 𝑃3 =
75
100
𝑛
30
Unidad N°2
El Segundo cuartil es igual a la mediana:
𝑸𝟐 = 𝑴𝒆
𝑄𝑖 = 𝐿𝑖 +
𝑃𝑖−𝐹𝑖−1
𝑓𝑖
∙ 𝑎𝑖 𝑄2 → 𝑃2 =
50
100
𝑛 =
1
2
𝑛
𝑄2 = 𝐿𝑖 +
𝑛
2
−𝐹𝑖−1
𝑓𝑖
∙ 𝑎𝑖
31
Además de las medidas de localización, suele ser útil considerar las medidas de 
variabilidad o de dispersión.
Suponga que usted es el encargado de compras de una empresa grande y que con regularidad envía 
órdenes de compra a dos proveedores. Después de algunos meses de operación, se percata de que el 
número promedio de días que ambos proveedores requieren para entregar una orden es 10 días. Se 
presentan los gráficos que muestran el número de días que cada uno de los proveedores necesita para 
entregar una orden. Aunque en ambos casos este número promedio de días es 10 días, ¿muestran los 
dos proveedores el mismo grado de confiabilidad en términos de tiempos para surtir los productos? 
Observe la dispersión, o variabilidad, de estos tiempos en ambos gráficos. ¿Qué proveedor preferiría 
usted?
Unidad N°2
32
Unidad N°2
33
Unidad N°2
Medida de variabilidad más sencilla de calcular. Ej: 
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
𝑅𝑎𝑛𝑔𝑜 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 = 3925 − 3310 = 615
33
Unidad N°2
La varianza está basada en la diferencia entre el valor de cada observación (xi) y 
la media
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙, 𝜎2 =
σ(𝑥𝑖 − 𝜇)
2
𝑁
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙, 𝑠2 =
σ(𝑥𝑖 − ҧ𝑥)
2
𝑛 − 1
34
Unidad N°2
𝑠2 =
σ𝑓𝑖(𝑥𝑖 − ҧ𝑥)
2
𝑛 − 1
𝑠2 =
σ𝑓𝑖(𝑚𝑐 − ҧ𝑥)
2
𝑛 − 1
𝐷𝑜𝑛𝑑𝑒:
𝑓𝑖: 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝑚𝑐:𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑛:𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
33
Unidad N°2
La desviación estándar se define como la raíz cuadrada positiva de la varianza.
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙, 𝜎 = 𝜎2
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙, 𝑠 = 𝑠2
33
Unidad N°2
Es una medida relativa de la variabilidad; mide la desviación estándar en relación 
con la media.
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 =
𝑠
ҧ𝑥
∙ 100,%

Continuar navegando