Logo Studenta

Introducción Datos Agrupados

¡Este material tiene más páginas!

Vista previa del material en texto

Carlos Vargas Pimentel
Estadística General
(EST-111)
Tema II:
Organización y 
presentación de datos 
agrupados
II. Organización y presentación de 
datos agrupados
 Distribución de frecuencia 
Una distribución de frecuencias es una tabla utilizada para organizar
datos. La columna de la izquierda (llamada clases o grupos) contiene
todas las respuestas posibles sobre una variable estudiada. La columna de
la derecha es una lista de las frecuencias o número de observaciones
correspondientes a cada clase.
Para decidir los intervalos de una distribución de frecuencias de datos
numéricos es necesario responder a ciertas preguntas: ¿cuántos
intervalos deben utilizarse? ¿De qué amplitud debe ser cada intervalo?
II. Organización y presentación de 
datos
 Reglas para la construcción de una distribución de
frecuencias
1. Número de intervalos
El número de intervalos (clases) utilizados en una distribución de
frecuencias se decide de una manera algo arbitraria.
La práctica y la experiencia son la mejor guía. Los conjuntos de datos
mayores requieren más intervalos; los conjuntos de datos menores
requieren menos intervalos. Si seleccionamos excesivamente pocas
clases, las pautas y algunas características de los datos pueden quedar
ocultas. Si seleccionamos demasiadas clases, descubriremos que algunos
intervalos no contienen ninguna observación o tienen una frecuencia
muy pequeña.
II. Organización y presentación de 
datos
 Reglas para la construcción de una distribución de
frecuencias
1. Número de intervalos
Guía rápida para decidir un número aproximado de 
intervalos de una distribución de frecuencias
Tamaño de la muestra Número de intervalos
Menos de 50 5-7
De 50 a 100 7-8
De 101 a 500 8-10
De 501 a 1.000 10-11
De 1.001 a 5.000 11-14
Más de 5.000 14-20
Otras formas de construir intervalos
II. Organización y presentación de 
datos
 Reglas para la construcción de una distribución de
frecuencias
2. Amplitud de los intervalos
Después de elegir el número de intervalos, el paso siguiente es elegir la 
amplitud de los intervalos:
𝑤 = 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑙𝑜𝑠 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 =
𝑁ú𝑚𝑒𝑟𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑁ú𝑚𝑒𝑟𝑜 𝑚𝑒𝑛𝑜𝑟
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
La amplitud de los intervalos a menudo se redondea a un número entero 
para facilitar la interpretación.
II. Organización y presentación de 
datos
 Reglas para la construcción de una distribución de
frecuencias
3. Intervalos inclusivos y que no se solapen
Los intervalos deben ser inclusivos y no solaparse, cada observación
debe pertenecer a uno y sólo un intervalo. Los límites o extremos de
cada clase deben estar claramente definidos.
Dos distribuciones de frecuencias especiales son la distribución de
frecuencias acumuladas y la distribución de frecuencias relativas
acumuladas.
II. Organización y presentación de 
datos
 Distribuciones de frecuencias relativas, acumuladas y
relativas acumuladas
Se obtiene una distribución de frecuencias relativas dividiendo cada
frecuencia por el número de observaciones y multiplicando la
proporción resultante por 100 por ciento. Una distribución de
frecuencias acumuladas contiene el número total de observaciones
cuyos valores son menores que el límite superior de cada intervalo. Se
construye sumando las frecuencias de todos los intervalos de la
distribución de frecuencias e incluyendo el presente intervalo. En una
distribución de frecuencias relativas acumuladas, las frecuencias
acumuladas pueden expresarse en proporciones o porcentajes
acumulados.
II. Organización y presentación de 
datos
 Representación gráfica de la distribución de frecuencia
a. Histograma
Un histograma es un gráfico formado por barras verticales construidas
sobre una línea recta horizontal delimitada por los intervalos de la
variable mostrada. Los intervalos corresponden a los de una tabla de
distribución de frecuencias. La altura de cada barra es proporcional al
número de observaciones que hay en ese intervalo. El número de
observaciones puede indicarse encima de las barras.
b. Ojiva
Una ojiva, llamada a veces gráfico de frecuencias acumuladas, es una
línea que conecta puntos que son el porcentaje acumulado de
observaciones situadas por debajo del límite superior de cada intervalo
en una distribución de frecuencias acumuladas.
II. Organización y presentación de 
datos
0
5
10
15
20
25
30
35
230 240 250 260 270 280 290 300
F
re
c
u
e
n
c
ia
Minutos consumidos
Uso del celular (histograma)
0%
20%
40%
60%
80%
100%
230 240 250 260 270 280 290 300
F
re
c
u
e
n
c
ia
Minutos consumidos
Uso del celular (ojiva)
II. Organización y presentación de 
datos
Considere los datos siguientes:
22 67 69 60 60
33 56 69 68 68
64 18 61 51 51
17 59 64 54 54
19 61 66 56 52
12 54 59 25 25
II. Organización y presentación de 
datos
1. Construya una distribución de frecuencias.
2. Construya una distribución de frecuencias relativas.
3. Construya una distribución de frecuencias acumuladas.
4. Construya una distribución de frecuencias relativas acumuladas.
5. Represente gráficamente los resultados con un histograma y un
grafico de ojiva.

Continuar navegando