Logo Studenta

2021_GP_Graficos estadisticos_VF (1)

¡Este material tiene más páginas!

Vista previa del material en texto

08
2021
Apropiación social del conocimiento
Generación de contenidos impresos
N.° 8, septiembre de 2021
doi: https://doi.org/10.16925/gcgp.32
GRÁFICOS 
ESTADÍSTICOS: 
GUÍA PRÁCTICA 
PARA ESTADÍSTICA 
DESCRIPTIVA
Jorge Alejandro Obando-Bastidas
Universidad Cooperativa de Colombia
Sede Villavicencio
María Teresa Castellanos Sánchez
Universidad de los Llanos
https://doi.org/10.16925/gcgp.32
Acerca de los autores
Jorge Alejandro Obando-Bastidas, doctor en Docencia e 
Investigación, profesor tiempo completo de Contaduría 
Pública, Universidad Cooperativa de Colombia, sede Vi-
llavicencio. 
Correo electrónico: jorge.obandob@campusucc.edu.co 
Cvlac:https://scienti.minciencias.gov.co/cvlac/visualiza-
dor/generarCurriculoCv.do?cod_rh=0001281569
Gruplac: https://scienti.minciencias.gov.co/gruplac/jsp/
visualiza/visualizagr.jsp?nro=00000000009298
orcid: https://orcid.org/0000-0002-4283-2871 
Google Scholar: https://scholar.google.es/cita-
tions?hl=es&user=WHrpjDwAAAAJ 
María Teresa Castellanos Sánchez, doctora en Educa-
tion Mathematica, profesora titular de Licenciatura en 
matemáticas, Universidad de los Llanos. 
Correo electrónico: mcastellanos@unillanos.edu.co
Cvlac:http://scienti.colciencias.gov.co:8081/cvlac/visua-
lizador/generarCurriculoCv.do?cod_rh=0000609455
Gruplac: https://scienti.minciencias.gov.co/gruplac/jsp/
visualiza/visualizagr.jsp?nro=00000000007746
orcid: https://orcid.org/0000-0001-7850-3183
Google Scholar: https://scholar.google.es/citations?u-
ser=yn9pkUYAAAAJ&hl=es&oi=ao
Cómo citar este documento
Obando Bastidas, J. A. y Castellanos Sánchez, M. T. (2021). 
Gráficos estadísticos: guía práctica para estadística descripti-
va (Generación de contenidos impresos N° 08). Ediciones 
Universidad Cooperativa de Colombia. doi: https://doi.
org/10.16925/gcgp.32
NOTA LEGAL
El presente documento de trabajo ha sido incluido dentro de nuestro repositorio institucional como Apropiación social de conocimiento por solicitud del autor, 
con fines informativos, educativos o académicos. Asimismo, los argumentos, datos y análisis incluidos en el texto son responsabilidad absoluta del autor y no 
representan la opinión del Fondo Editorial o de la Universidad.
DISCLAIMER
This coursework paper has been uploaded to our institutional repository as Social Appropriation of Knowledge due to the request of the author. This document 
should be used for informational, educational or academic purposes only. Arguments, data and analysis included in this document represent authors’ opinion 
not the Press or the University.
Este documento puede ser consultado, descargado o reproducido desde nuestro repositorio institucional (http://repository.
ucc.edu.co/handle/20.500.12494/7369) para uso de sus contenidos, bajo la licencia de Creative Commons Reconocimien-
to-NoComercial-SinObraDerivada 4.0 Internacional. http://creativecommons.org/licenses/by-nc-nd/4.0/ 
mailto:Jorge.obandob@campusucc.edu.co
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001281569
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001281569
https://scienti.minciencias.gov.co/gruplac/jsp/visualiza/visualizagr.jsp?nro=00000000009298
https://scienti.minciencias.gov.co/gruplac/jsp/visualiza/visualizagr.jsp?nro=00000000009298
https://orcid.org/0000-0002-4283-2871
https://scholar.google.es/citations?hl=es&user=WHrpjDwAAAAJ
https://scholar.google.es/citations?hl=es&user=WHrpjDwAAAAJ
mailto:mcastellanos@unillanos.edu.co
http://scienti.colciencias.gov.co:8081/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000609455
http://scienti.colciencias.gov.co:8081/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000609455
https://scienti.minciencias.gov.co/gruplac/jsp/visualiza/visualizagr.jsp?nro=00000000007746
https://scienti.minciencias.gov.co/gruplac/jsp/visualiza/visualizagr.jsp?nro=00000000007746
https://orcid.org/0000-0001-7850-3183
https://scholar.google.es/citations?user=yn9pkUYAAAAJ&hl=es&oi=ao
https://scholar.google.es/citations?user=yn9pkUYAAAAJ&hl=es&oi=ao
https://doi.org/10.16925/gcgp.32
https://doi.org/10.16925/gcgp.32
http://repository.ucc.edu.co/handle/20.500.12494/7369
http://repository.ucc.edu.co/handle/20.500.12494/7369
TABLA DE CONTENIDO
Resumen 7
Introducción 8
Propósito 8
Unidad de competencias 8
Elemento de competencia del saber 8
Marcos teóricos 8
Campo de acción 9
División 9
Población 9
Muestra 10
Variables 10
Variables enteras o discretas 10
Variables reales o continuas 10
Variables cualitativas 10
Clasificación de las variables según su naturaleza 10
Tablas de frecuencia 11
Gráficos estadísticos 12
Gráficos para datos categóricos 12
Gráfico de barras 13
Gráfico de sectores 13
Gráfico de arañas 15
Gráfico de anillos o sectores 15
Gráficos para datos numéricos enteros 15
Diagrama de barras para variables numéricas enteras 17
Gráfico de diagramas integrales 18
Tabla de frecuencias para datos continuos a través de intervalos 19
Ejemplo de aplicación 19
Gráficos para datos continuos organizados en intervalos de clase 20
Histograma 21
Diagrama de Tortas 21
Ojivas 22
Polígonos de frecuencia 23
Otras graficas 23
Boxplot 23
Diagrama de Pareto 25
Ejercicios de aplicación 27
Referentes 32
ÍNDICE DE TABLAS Y FIGURAS
Tabla 1. Clasificación y tipos de variables 11
Tabla 2. Estructura de una tabla de frecuencias 12
Tabla 3. Tabla de frecuencias para la variable motivos de visita 
al departamento del Meta 13
Tabla 4. Tabla de frecuencias del número de fallecidos por la 
covid-19 en Colombia discriminado por estratos sociales 17
Tabla 5. Edades de cien personas que se recuperan de la covid-19 20
Tabla 6. Tabla de frecuencias de personas con la covid-19 que se 
recuperan en el hospital 20
Tabla 7. Tabla de frecuencias de personas con la covid-19 que se 
recuperan en el hospital 21
Tabla 8. Tabla de Pareto de personas con la covid-19 que se 
recuperan en el hospital 25
Figura 1. Asesinatos de líderes sociales (2016-2019). 9
Figura 2. Gráfico de barras para la variable motivos para visitar 
los Llanos orientales (1) 14
Figura 3. Gráfico de barras para la variable motivos para visitar 
los Llanos orientales (2) 14
Figura 4. Gráfico de torta para la variable motivos para visitar 
los Llanos orientales 15
Figura 5. Gráfico de araña o radar para la variable motivos para 
visitar los Llanos orientales 16
Figura 6. Gráfico anillos para la variable motivos para visitar los 
Llanos orientales 16
Figura 7. Porcentaje de muertes por la covid-19 en Colombia por 
estratos sociales 17
Figura 8. Número de muertes por covid-19 en Colombia por 
estratos sociales 18
Figura 9. Diagrama integral para el número de muertes 
por covid-19 18
Figura 10. Histograma de personas con la covid-19 que se han 
hospitalizado. 21
Figura 11. Diagrama de tortas de personas con la covid-19 que 
se han hospitalizado 22
Figura 12. Ojiva de personas con covid-19 que se han 
hospitalizado 22
Figura 13. Polígono de frecuencias de personas con covid-19 
que se han hospitalizado 23
Figura 14. Boxplot por género de personas con la covid-19 que 
se han hospitalizado 24
Figura 15. Pirámide poblacional por género de personas con la 
covid-19 en Colombia 25
Figura 16. Diagrama de Pareto de personas con la covid-19 que 
se recuperan en el hospital 26
Figura 17. Radiografía de la deforestación en el Amazonas 
brasileño (junio del 2019). 29 
Figura 18. Emisiones gei de Colombia en el 2012 30 
Resumen
Los gráficos estadísticos son objetos de la estadís-
tica con los que se pretende establecer un grado 
de comunicación, breve, sencillo y didáctico. El 
propósito general que motiva el desarrollo de este 
documento es la apropiación de las características 
de los gráficos construidos en las tablas de frecuen-
cias y en los datos no agrupados que provienen de 
bases de datos reales. La importancia de adquirir 
la habilidad de diseñar un gráfico radica principal-
mente en la necesidad de comunicar datos de una 
manera visual,de manera que sea comprendido 
ampliamente por muchos grupos. Generalmente, 
los gráficos están en todos los medios de comu-
nicación visuales y transmiten la realidad de los 
acontecimientos; el presente documento contiene, 
desde la definición de variables hasta la construc-
ción de gráficos, estableciendo diferencias entre las 
variables de tipo numérico y las variables de tipo 
categórico. Los gráficos que aquí se muestran par-
ten de la construcción de una tabla de frecuencias 
y son datos agrupados; sin embargo, gráficos como 
los Boxplot, no necesitan agrupación de los datos, 
puesto que, por su característica, estos gráficos sa-
len de las bases de datos y proponen una informa-
ción más precisa, ya que provienen de la fuente tal 
y como se conciben. Finalmente, en el trabajo se 
proponen algunos ejercicios de bases de datos rea-
les y como propósito de evaluación se entrega un 
cuestionario de diez preguntas, diseñado con base 
en los lineamientos y los requerimientos de la ta-
xonomía solo.
Palabras clave: datos agrupados, datos no agrupados, 
frecuencias, variables categóricas, variables numéricas.
GRÁFICOS ESTADÍSTICOS:
GUÍA PRÁCTICA PARA 
ESTADÍSTICA DESCRIPTIVA
Jorge Alejandro Obando-Bastidas
María Teresa Castellanos Sánchez
08
8 · Generación de contenidos impresos
Unidad de competencias
Construir información para que apoye la toma 
de decisiones en el entorno organizacional me-
diante organización, sistematización y lectura 
de datos.
Elemento de competencia 
del saber
Clasificar las herramientas estadísticas para la 
sistematización de la información.
Marcos teóricos
La abundancia de datos y fuentes de informa-
ción en la era de internet y de las redes sociales 
genera complejidad en los procesos de comuni-
cación, lo cual también genera dificultad para 
aquellas personas y entidades que toman de-
cisiones a partir de ellos. Desde esta posición, 
Ross (2018) propone que la estadística es un 
arte que propicia el aprendizaje usando datos 
como insumo de la información, ya que ayuda 
en su descripción, organización y análisis, lo 
que lleva a tomar conclusiones y decisiones. 
Por otro lado, la estadística no solo evidencia 
un proceso para organizar los datos y tomar 
decisiones a partir de ellos, también permite 
evidenciar la realidad, contemplar el contex-
to a partir de una problemática real y una po-
sición visual (Castellanos y Obando, 2013). Por 
ejemplo, en forma gráfica, la figura 1 informa 
sobre el fenómeno social de los asesinatos de 
líderes en Colombia, cruda realidad que se 
puede abordar en el estudio de la estadística. 
Con el análisis de la realidad se trata de fo-
mentar el razonamiento estadístico, más que 
el aprendizaje rutinario y descontextualiza-
do de conceptos y propiedades, puesto que la 
tecnología, hoy en día, permite aplicar la es-
tadística con gran facilidad, por consiguiente, 
cobran mayor importancia las actividades in-
terpretativas que el cálculo rutinario (Batane-
ro y Díaz, 2011).
INTRODUCCIÓN
Los gráficos estadísticos se visualizan en dife-
rentes contextos, por ejemplo, en periódicos, 
revistas, libros, textos, entre otros. Su presen-
cia masiva en todos los espacios y el poder de 
comunicación de ellos proponen un grado de 
importancia. Teniendo en cuenta la presen-
cia de los gráficos estadísticos en las estructu-
ras curriculares, esta guía se diseña teniendo 
en cuenta dos circunstancias: por un lado, se 
busca que los estudiantes que cursan progra-
mas relacionados con las Ciencias Económi-
cas, Administrativas y Contables desarrollen 
competencias en la lectura de gráficos y, por 
ende, alcanzar una mejor comprensión de este 
tipo de representación de los datos estadísti-
cos; por otro lado, se pretende que esta guía se 
convierta en un material de apoyo para aque-
llos estudiantes que ingresan a la universidad 
con escasa formación en estadística y que, por 
lo tanto, requieren un proceso de fortaleci-
miento que estructure en ellos el aprendiza-
je inicial de esta ciencia. El desarrollo de esta 
guía parte de una definición de estadística, su 
campo de acción, el reconocimiento de con-
ceptos relacionados, con la muestra, pobla-
ción, tipo de variables, construcción de tablas 
de frecuencia y sus respectivos gráficos. Se 
hace una distinción entre gráficos para datos 
discretos y datos continuos, además en la guía 
se analizan otro tipo de gráficos como el del 
Boxplot, las pirámides poblaciones, la impor-
tancia de la regla de Pareto. Todos los ejercicios 
relacionados con la presente guía se desarro-
llarán completamente en Excel. 
Propósito
Establecer diferencias entre los diferentes 
tipos de gráficos construidos a partir de tablas 
de frecuencias en datos agrupados y desde la 
propuesta de los datos dispuestos en bases de 
datos reales, como los bases del coronavirus 
y las bases de datos de las pruebas saber en 
Colombia.
Gráficos estadísticos: guía práctica para estadística descriptiva· 9
• Estadística descriptiva: se encarga de la 
recolección, la clasificación y la descrip-
ción de datos muéstrales o poblacionales, 
para su interpretación y análisis.
• Estadística inferencial: desarrolla modelos 
teóricos que se ajusten a una determinada 
realidad con cierto grado de confianza.
Población 
Se define como un conjunto de individuos o de 
objetos que poseen una o varias característi-
cas comunes. El total de las unidades posibles 
de observar hace referencia también a una de-
finición de población. La población no hace re-
ferencia únicamente a los seres vivos; una po-
blación puede estar constituida por los peces 
de un estanque, por animales de una determi-
nada raza. 
Poblaciones finitas
En este tipo de población, el número de uni-
dades observables es contable, es decir, un 
número conocido de elementos del conjunto 
llamado población. De la misma manera, se 
considera finita a una población, si se conoce 
Campo de acción
La aplicación de la estadística en la dirección 
de procesos enfatiza la toma de decisiones. La 
necesidad de resolver problemas pone de ma-
nifiesto la aplicabilidad de la estadística. La 
aplicabilidad se extiende a todo el universo 
social, biológico, físico, ingeniería, educacional, 
médico, de negocios y leyes, en fin, a casi todas 
las fases de la vida.
El campo de la estadística es una disciplina 
dirigida a lograr un mejor entendimiento del 
mundo que nos rodea, con el objetivo final que 
todos tengamos una vida más completa y con 
un mayor entendimiento de esta. No hay parte 
de nuestro ambiente que no sea una fuente de 
datos (nosotros mismos, otros individuos, la 
familia, sociedades, culturas, ciudades, países, 
planetas, escuelas, colegios religiones, etcéte-
ra), en pocas palabras cada aspecto de nuestra 
existencia, incluso el comportamiento de la 
covid-19 en Colombia y en el mundo.
División
La estadística se divide en dos grandes ramas 
de estudio: 
120
100
80
60
40
20
0
1e
ro
 d
e 
en
e 
- 2
01
6
6 
de
 a
go
 - 
20
16
7 
de
 a
go
 - 
20
16
9 
de
 ju
l -
 2
01
7
10
 d
e 
ju
l -
 2
01
7
6 
de
 a
go
 - 
20
17
10
 d
e 
ju
l -
 2
01
8
6 
de
 a
go
 - 
20
18
7 
de
 a
go
 - 
20
17
9 
de
 ju
l -
 2
01
8
7 
de
 a
go
 - 
20
18
9 
de
 ju
l -
 2
01
9
32
69
5
105
10
68
FIGURA 1. Asesinatos de líderes sociales (2016-2019). Tomado de la Consejería Presidencial de los Derechos Humanos (2019).
10 · Generación de contenidos impresos
ejemplo, tamaño, edad, precios, rendimiento 
académico o indicadores económicos.
VARIABLES ENTERAS O DISCRETAS
En este conjunto de variables, los valores que 
se representan se visualizan como número 
entero. Por ejemplo, número de estudiantes 
en la universidad, número de personas diarios 
que se contagian con el virus sars-CoV-2.
VARIABLES REALES O CONTINUAS 
Es aquella que teóricamente puede tomar 
cualquier valor dentro de un intervalo de 
valores, ella se mide uniformemente. Dentro 
de la escala de los conjuntos numéricos, re-
presentan a los números reales. Por ejemplo, 
estatura delos estudiantes de una universi-
dad, salarios devengados por los docentes de 
un núcleo educativo, temperaturas a ciertas 
horas del día, edad de una persona.
VARIABLES CUALITATIVAS 
Representan características propias de las 
cualidades de los objetos que conforman la 
muestra o la población. Por ejemplo, sexo, 
origen o color de piel. 
Las variables cualitativas se dejan expresar en 
niveles de categoría. Por ejemplo, sexo: mascu-
lino o femenino; origen: colombiano, venezola-
no o panameño; color de piel: blanco, negro o 
amarillo.
CLASIFICACIÓN DE LAS VARIABLES SEGÚN 
SU NATURALEZA
Las variables sean enteras o continuas por su 
naturaleza se las puede clasificar como cate-
góricas y numéricas; a la vez, esta clasificación 
responde a ciertos criterios de diferenciación.
Variables categóricas: establecen categorías 
de los datos. Producen muchas informaciones. 
la fuente de donde provienen los datos. Por 
ejemplo, la población de estudiantes de una 
universidad es finita, ya que se sabe que en los 
programas existe una base de datos en los que 
están inscritos todos los estudiantes de dicha 
universidad.
Poblaciones infinitas
En este tipo de población, el conteo de uni-
dades observables se hace un poco difícil. El 
término de infinito en estadística no se ajusta 
a una definición semántica, puede hacer rela-
ción a un grupo de objetos, personas, cosas, en 
las que se desconoce la fuente de donde pro-
vienen. Ejemplo: como el número de vendedo-
res informales, que dado la crisis de la pande-
mia de covid-19, se ha incrementado en todas 
las ciudades de Colombia y estos no se regis-
tran en una base de datos, se puede considerar 
una población infinita.
Muestra
Se define como la mejor representación de la 
población. La muestra es un subconjunto de 
la población a la cual se le efectúa la medi-
ción con el fin de estudiar las propiedades del 
conjunto del cual es obtenida. El tamaño de la 
muestra, la disponibilidad de recursos, la ho-
mogeneidad de los elementos y de los datos 
que la conforman le da la importancia su-
ficiente al uso adecuado de la muestra; un 
buen conocimiento de la población permite 
encontrar una buena muestra representativa. 
Existen muestras tomadas al azar y sin seguir 
ningún modelo de muestreo que llevan a con-
clusiones inadecuadas y, por lo tanto, a tomar 
decisiones que no corresponden a la solución 
de un problema planteado dentro de conjunto.
Variables 
Es el conjunto de características de las entida-
des que se interesan en una investigación; por 
Gráficos estadísticos: guía práctica para estadística descriptiva· 11
de las de intervalo y tienen un origen. Por 
ejemplo, el peso de una persona.
En la tabla 1 se resume la clasificación de estas 
variables.
Tablas de frecuencia
Muchas veces se presenta una muestra con 
muchos datos, por lo que se hace necesario 
organizarlos en una tabla de frecuencias o en 
una distribución de frecuencias. Este tipo de 
tabla está formada por las distintas catego-
rías (valores o intervalos) del carácter X y por 
las frecuencias absolutas, relativas, absolutas 
acumuladas y relativas acumuladas.
A manera de definición, se puede decir que 
una tabla de frecuencias es un método para 
presentar la información en forma resumida, 
muestra los datos tal como aparecen en la dis-
tribución, organizados en diferentes formas de 
conteo de los elementos de una variable, a lo 
que se denomina “frecuencia”. A continuación, 
se muestran los tipos de frecuencias que se 
presentan para organizar los datos. 
Frecuencias absolutas (f) 
Se llama frecuencia absoluta (f) de la variable o 
categoría al número de datos que se presen-
tan en el conteo directo de los datos que se 
repiten en una distribución. La suma de todas 
las frecuencias absolutas es el tamaño de la 
muestra, como se aprecia en la ecuación 1.
Por ejemplo: las categorías de bajos, medios, 
altos superiores es una escala categórica de 
estudiantes evaluados en una universidad.
Nominal: no establecen ningún orden. Corres-
ponde a variables categóricas; por ejemplo, 
estado civil, soltero, casado, viudo, unión libre.
Ordinales: indican un orden. Por ejemplo, 
grado académico (primaria, bachillerato, uni-
versidad, especialización y maestría).
Variables numéricas: a diferencia de las an-
teriores, producen más información y mejores 
procedimientos estadísticos. A toda variable 
numérica se la puede categorizar, pero pierde 
información y detalles de esta. Por ejemplo, las 
edades, siendo numérica producen informa-
ción relacionada con medias, medianas, modas, 
entre otras. Se pueden categorizar como: niños, 
jóvenes, adultos y tercera edad; en estas cate-
gorías ya no se puede obtener la información 
que se obtuvo en el caso numérico.
Para tal efecto, las variables pueden ser:
Intervalo: se pueden asociar en intervalos 
de clase y corresponden a variables de tipo 
continuo. Preservan de las variables ordina-
les el orden y se acomodan las distancias. Por 
ejemplo, salarios, edades, notas estudiantiles. 
Razón: son variables que conservan más infor-
mación y detalles de las demás variables. Con-
servan el orden de las ordinales, la distancia 
TABLA 1
Clasificación y tipos de variables
Tipo de variable Se dividen en Pueden ser Ejemplos
Numéricas
Continuas
Intervalos Temperatura
Razón Salarios, notas obtenidas en un curso, estatura de una persona
Enteras Número de estudiantes en un salón, números de personas recuperadas de la covid-19.
Categóricas
Nominales Género, estado civil de una persona.
Ordinales Grados militares, formación académica.
Nota. Elaboración propia.
12 · Generación de contenidos impresos
Finalmente, una tabla de frecuencias propone 
una estructura determinada, la cual se muestra 
en la tabla 2.
TABLA 2
Estructura de una tabla de frecuencias
Variable f h F H
X1 f1 h1 F1 H1
X2 f2 h2 F2 H2
X3 f3 h3 F3 H3
. . . . .
. . . . .
Xn fn hn n 1
Total n 1
Nota. Elaboración propia.
Gráficos estadísticos
Los gráficos estadísticos son recursos visuales 
que permiten comunicar la información, se 
constituye en un instrumento estadístico para 
analizar los datos en forma eficiente y desde 
diferentes niveles de lectura (Castellanos y 
Obando, 2013). Existen gráficos para los datos 
numéricos y para los datos categóricos.
Gráficos para datos 
categóricos
De acuerdo con el tipo de frecuencias, se pueden 
encontrar gráficos, tipo barra, torta, arañas, 
barras acumuladas, pictogramas, anillos, entre 
otros. A continuación, se propone una situa-
ción problemas y se construye en Excel la tabla 
de frecuencias con sus respectivos gráficos. Por 
ejemplo, en un estudio realizado en el Meta y 
que está relacionado con el turismo, una de las 
preguntas de la encuesta aplicada tenía el si-
guiente contenido: ¿cuál es el principal motivo 
por el que usted visita al departamento del 
Meta? Señale solo una opción: 
 ∑ fi = n
 f = f1 + f2 + f3 + ... + fn = n (1)
En la ecuación 1, n es el tamaño de la muestra.
Frecuencia absoluta relativa (h)
Se llama frecuencia relativa de la variable X al 
cociente entre la frecuencia absoluta de cada 
dato y el total de elementos que conforman la 
muestra, como se aprecia en la ecuación 2.
 hi = (2)
La suma de todas las frecuencias relativas re-
presenta al 100 % de la población y equivale a 
1 (uno), como se aprecia en la ecuación 3.
 (3)
Frecuencias acumuladas (F)
Esta frecuencia se obtiene de la acumula-
ción sucesiva de las frecuencias absolutas. El 
último dato acumulado es el tamaño de la 
muestra, como se aprecia en la ecuación 4.
 (4)
Frecuencias relativas 
acumuladas (H) 
Estas se obtienen de la acumulación sucesi-
va de las frecuencias relativas. El último dato 
acumulado es el 100 % de la muestra, como se 
aprecia en la ecuación 5.
 (5)
f
n
f1
n
H
F1 = f1 + f2 + f3 + ... . fn = fi
f2
n
F2
n
F1
n
f3
n
F3
n
n
n
n
i=1
i=1
i=1
fn
n
fn
n
hi
n
Fi
n
∑
∑
∑
+
+
+
+
+ ... +
+ ... +
===
= 100%
= 100%
Gráficos estadísticos: guía práctica para estadística descriptiva· 13
TABLA 3
Tabla de frecuencias para la variable motivos de visita al 
departamento del Meta
Motivos f h F H
Paisaje 15 0,15 15 0,15
Gastronomía 15 0,15 30 0,3
Diversión 25 0,25 55 0,55
Calor Humano 19 0,19 74 0,74
Clima 14 0,14 88 0,88
Descanso 12 0,12 100 1
Total 100 1    
Nota. Elaboración propia, haciendo uso del Excel.
Gráfico de barras
Es una figura que permite representar los 
elementos de la variable de estudio con los 
valores obtenidos en la frecuencia absoluta o 
también se pueden representar los valores de 
la frecuencia relativa. En el ordenado siempre 
estarán los elementos que constituyen la va-
riable y en el eje de las abscisas el valor de las 
frecuencias. La figura 2 se elaboró en Excel. 
Obsérvese que, en la figura 2, se describen ex-
clusivamente los valores de la frecuencia ab-
soluta; cada barra evidencia el valor de la fre-
cuencia absoluta, propuesto en la tabla 3.
En Excel se pueden generar diferentes formas 
para representar esta información; en la figura 
3, se observa la misma gráfica, con la informa-
ción sobre las barras y con una tabla de deno-
minación de las unidades de variables. Queda 
a gusto del diseñador la forma como represen-
ta la información.
Gráfico de sectores
Denominado también “tartas” (pie), consiste 
en un círculo dividido en tantas partes o por-
ciones como valores de frecuencia relativa 
existan, a cada valor de frecuencias relativa le 
corresponde en forma proporcional un arco de 
círculo (figura 4). 
1. Paisaje.
2. Gastronomía.
3. Diversión.
4. Calor humano.
5. Clima.
6. Descanso.
Se realizó la pregunta a 100 turistas y se obtu-
vieron los siguientes resultados:
1 4 4 2 5 3 3
2 4 5 1 6 2 3
2 6 1 1 6 3 4
2 6 2 1 6 3 2
3 6 2 1 3 4 1
3 6 2 1 3 6 2
3 6 3 4 3 6 3
5 3 3 4 5 6 3
5 3 3 4 5 5 3
5 3 4 4 5 5 6
1 3 4 4 4 4
1 3 1 4 4 4
1 2 1 5 4 3
1 2 1 5 3 2
4 2 5 5 3 2
Siguiendo un proceso de organización en 
columna de los datos y en orden ascendente, 
Excel es una de las mejores herramientas para 
construir una tabla de frecuencias, ya que fa-
cilita su conteo y su proceso de construcción, 
puesto que el uso de las fórmulas creadas en 
este permite con rapidez replicarla en otras 
celdas y obtener los demás resultados de una 
manera rápida y sencilla. La tabla de frecuen-
cias construida a partir de los datos anteriores 
se puede observar en la tabla 3. 
14 · Generación de contenidos impresos
Figura 2. Gráfico de barras para la variable motivos para visitar los Llanos orientales (1). Elaboración propia 
haciendo uso de Excel como herramienta.
Figura 3. Gráfico de barras para la variable motivos para visitar los Llanos orientales (2). Elaboración 
propia haciendo uso de Excel como herramienta.
24
22
20
18
16
14
12
10
8
6
4
2
0
Paisaje Gastronomía Diversión Calor
Humano
Clima Descanso
15 15
25
19
14
12
Paisaje Gastronomía Diversión Calor
Humano
Clima Descanso
Gráficos estadísticos: guía práctica para estadística descriptiva· 15
constituyen los anillos o los sectores. Son pe-
queños sectores en forma de un aro o anillo, 
divido en forma proporcional de acuerdo con el 
valor de dicha frecuencia (figura 6).
Los diagramas para las frecuencias absolutas 
acumuladas, denominados “diagramas integra-
les”, no tienen sentido en el contexto de las va-
riables categóricas, se observarán en el contexto 
de las variables numéricas, enteras y continuas.
Gráficos para datos 
numéricos enteros
Algunos de los gráficos para datos enteros son 
los mismos que para los datos categóricos, sin 
embargo, en los datos numéricos enteros ya 
se pueden realizar gráficos para las frecuen-
cias acumuladas. Para revisar el tipo de gráfi-
cos, se propone una situación real que ocurre 
en Colombia en el margen de la aparición de 
la pandemia de covid-19. Se propone entonces 
la siguiente situación: en marzo del 2020, se 
registraron los primeros casos del virus, hasta 
el 3 de enero del 2021. El total de decesos por 
covid-19 era de 51 397. El Departamento Ad-
ministrativo Nacional de Estadística (dane), 
con respecto al número de muertos por la 
covid-19, emitió la siguiente información que 
se resume en la figura 7.
La lectura de estos gráficos es directa, se lo hace 
teniendo en cuenta el valor del porcentaje pro-
puesto en cada unidad de variable. Por ejemplo, 
el 25 % de los turistas visitan el Meta, porque 
aquí encuentran diversión. Una interpretación 
más general estará amarrada al objetivo de la 
investigación que generó la pregunta.
Gráfico de arañas
Una gráfica de radar, también conocida como 
un “diagrama de araña”, es una herramienta 
muy útil para mostrar visualmente los valores 
de una frecuencia relativa o absoluta. Su 
nombre se hereda porque propone la visuali-
zación en la forma de una tela de araña. Pro-
porciona la misma información de un diagra-
ma de barras o de una torta (ver figura 5).
El gráfico de la figura 5 puede ser una exce-
lente alternativa para representar la informa-
ción de los datos propuestos en las frecuencias 
relativas, brinda la misma información, pero 
desde otra visualización. 
Gráfico de anillos o sectores
Otra de las formas de representar las fre-
cuencias relativas en variables categorías lo 
Paisaje
15%
Calor Humano
19%
Gastronomía
15%
Descanso
12%
Clima
14%
Diversión
25%
Figura 4. Gráfico de torta para la variable motivos para visitar los Llanos orientales. Elaboración propia 
haciendo uso de Excel como herramienta.
16 · Generación de contenidos impresos
Figura 5. Gráfico de araña o radar para la variable motivos para visitar los Llanos orientales. Elabora-
ción propia haciendo uso de Excel como herramienta.
Paisaje
15%
15%
19%
Calor Humano
GastronomíaDescanso
12%
Clima
14%
Diversión
25%
Figura 6. Gráfico anillos para la variable motivos para visitar los Llanos orientales. Elaboración 
propia haciendo uso de Excel como herramienta.
Paisaje
15%
15%
Calor Humano
19%
Gastronomía
Descanso
12%
Clima
14%
Diversión
25%
Gráficos estadísticos: guía práctica para estadística descriptiva· 17
por covid-19 en Colombia por estratos socia-
les. Por ejemplo, en el estrato 1, a la fecha en 
las que se tomaron los datos de las bases de 
datos del ministerio de salud pública de Co-
lombia, se observaban 16 910 personas en el 
estrato 1. La figura 8 permite comparar resul-
tados; se observa, por ejemplo, que en los es-
tratos 1, 2, y 3 es donde más se han presenta-
do casos de mortalidad por la covid-19. Estos 
gráficos sencillos son ligeros de interpretación, 
son muy utilizados, ya que proponen la infor-
mación de manera directa.
TABLA 4
Tabla de frecuencias del número de fallecidos por la COVID-19 
en Colombia discriminado por estratos sociales
Estratos f h F H
Estrato 1 16 910 32,9 % 16 910 32,9 %
Estrato 2 18 863 36,7 % 35 773 69,6 %
Estrato 3 12 078 24 % 47 851 93,1 %
Estrato 4 2364 4,6 % 50 215 97,7 %
Estrato 5 771 1,5 % 50 986 99,2 %
Estrato 6 411 0,80 % 51 397 100,0 %
Total 51 397 100,0 %    
Nota. Información suministrada por el dane (16 de octubre 
de 2020).
La triste realidad reflejada en la figura 7 (que 
corresponde a una torta con frecuencias rela-
tivas) evidencia que la mayoría de las muertes 
en Colombia son de personas que carecen de 
recursos económicos. Corresponde aquí rea-
lizar otro tipo de gráficos que permitan evi-
denciar la información desde otro punto de 
vista. Para ello, lo recomendable es reconstruir 
la tabla de frecuencias y proceder a la cons-
trucción de otras representaciones; de esta 
manera, se presenta la tabla 4, correspondien-
te a la tabla de frecuencias para la variable 
que relaciona el número de personas falleci-
das en Colombia y discriminadas por estrato 
social (ver tabla 4).
Diagrama de barras para 
variables numéricas enteras
Un gráfico de barras o gráfico de columnas es 
una forma de representar gráficamente un 
conjunto de datos o valores mediante barras 
rectangulares de longitud proporcionala los 
valores representados; los valores represen-
tados pueden ser frecuencias relativas o fre-
cuencia absolutas. Su lectura es directa. En la 
figura 8, se evidencia el número de fallecidos 
Figura 7. Porcentaje de muertes por la covid-19 en Colombia por estratos sociales. Tomada de dane 
(16 de octubre de 2020).
Estrato 4: 4,6%
Estrato 5: 1,5%
Estrato 6: 0,80%
Estrato 1: 32,9%
Estrato 2: 36,7%
Estrato 3: 24%
18 · Generación de contenidos impresos
Figura 8. Número de muertes por covid-19 en Colombia por estratos sociales. Tomado de dane (16 de octubre 
de 2020).
Figura 9. Diagrama integral para el número de muertes por covid-19. Tomado de dane (16 de octubre de 
2020).
16910
18863
12078
2364
771 411
Estrato 1
Estrato 2
Estrato 3
Estrato 4
Estrato 5
Estrato 6
16910
35773
47851
50215 50986
51397
Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6
Gráfico de diagramas 
integrales
Se realizan con las frecuencias acumuladas y 
solo para variables numéricas, ya sean de tipo 
entero o de tipo continuo. Siguiendo el ejemplo 
anterior en la figura 9, se representa el diagra-
ma integral para muertes por la covid-19 en 
Colombia determinado por estratos sociales.
Las frecuencias acumuladas indican el número 
de muertes que se suman por estratos, por 
ejemplo, la lectura de estas figuras propone 
que el número de muertes acumulado hasta 
el estrato 3 que es de 47 851. En el proceso de 
registros de casos de contagio en Colombia, es 
este tipo de gráficos los que expresan la canti-
dad de contagios que se registran en un periodo 
determinado.
Gráficos estadísticos: guía práctica para estadística descriptiva· 19
tener a C constante a lo largo de toda la distri-
bución de frecuencias, se calcula mediante la 
fórmula.
 C = (10)
Si esta división es exacta, se procede, con la 
construcción de los intervalos y la tabla de 
frecuencias, en caso contrario se rediseña un 
nuevo rango; para ello, es necesario examinar 
si el producto de C*m excede al rango original 
y en cuánto excede. Esta diferencia propone la 
construcción del nuevo rango. El procedimiento 
es el siguiente y se muestra en la ecuación 11.
1. Si RNuevo = C*m > Rango
2. Se realiza la diferencia D = RNuevo – Rango
3. Ahora se construyen los límites del nuevo 
 rango
 Xmin = Min – 1/D
 Xmax = Max + 1/D (11)
Intervalos aparentemente 
nominales 
Son los intervalos utilizados en la clase que 
utilizamos, tal como resulta en el cálculo de 
la amplitud C.
Ejemplo de aplicación
En el informe diario de contagios por covid-
19 en Colombia, se registran a los pacientes 
que se recuperan en casa, en el hospital, en 
la uci o que fallecieron. A continuación, se 
propone la tabla 5 la cual contiene los datos 
con las edades de cien personas que se recu-
peran de la enfermedad en los diferentes hos-
pitales de Colombia.
Tabla de frecuencias para 
datos continuos a través de 
intervalos
Para determinar las frecuencias en datos con-
tinuos, se deben seguir los siguientes pasos 
que involucran cálculos matemáticos y la uti-
lización de algunas fórmulas de aproximación, 
como la del rango, número de intervalos me-
diante la fórmula de Sturges y la amplitud de 
intervalo.
Rango 
Es el dato calculado mediante la diferen-
cia entre el dato máximo y mínimo, como se 
muestra en la ecuación 6.
 R = Xmax – Xmin (6)
Número de intervalos
Representado por la letra m y se define me-
diante la fórmula denominada formula de 
Sturges, como se muestra en la ecuación 7.
 m = 1 + 3,3*log(n) (7)
Donde n es el tamaño de la muestra. El número 
de intervalos no puede ser inferior a 5 ni supe-
rior a 16, como se muestra en la ecuación 8.
 5 ≤ m ≤ 16 (8)
Algunos, sin embargo, utilizan la ecuación 9.
 m = (9)
La aproximación de m se puede hacer por 
defecto o por exceso.
Amplitud del intervalo
La amplitud del intervalo determina la distan-
cia que existe entre un dato y otro, se simboli-
za por C; depende del criterio establecido para 
presentar la información, puede variar la am-
plitud en cada intervalo, pero se recomienda 
√n
Rango
m
20 · Generación de contenidos impresos
D = 70 – 68 = 2; esta diferencia propone la exis-
tencia de un nuevo rango que tendrá como 
límites (ver ecuación 15).
R- Nuevo
Mínimo = Min – 1 = 24 – 1 = 23
Máximo = Max + 1 = 92 + 1 = 93
 (15)
El valor de la unidad que se ha restado al 
mínimo y sumado en el máximo está determi-
nado por la diferencia de 2, el cual se reparte 
en forma equitativa sobre estos valores ex-
tremos. Estos resultados indican que el nuevo 
rango empieza en 23 y termina en 93. De esta 
manera, se construirá la tabla de frecuencias 
con 7 intervalos, una longitud de 10 inicia en 23 
y termina en 93 años. La tabla 6 de frecuencia, 
realizada en Excel, tiene el siguiente aspecto.
TABLA 6
Tabla de frecuencias de personas con la covid-19 que se 
recuperan en el hospital
Edades f h F H
23-33 13 13 % 13 13 %
33-43 10 10 % 23 23 %
43-53 11 11 % 34 34 %
53-63 25 25 % 59 59 %
63-73 13 13 % 72 72 %
73-83 21 21 % 93 93 %
83-93 7 7 % 100 100 %
  100 1    
Nota. Datos tomados del Ministerio de Salud de Colombia (2020).
Gráficos para datos continuos 
organizados en intervalos de 
clase
La tabla 7 corresponde a los cien pacientes con 
la covid-19 que se recuperan en algún hospi-
tal de Colombia. A esta tabla se le ha agrega-
do una nueva columna que corresponde a la 
TABLA 5
Edades de cien personas que se recuperan de la COVID-19
80 27 29 74 80 65 37 42 66 60
54 45 75 58 85 90 60 68 86 49
79 59 57 79 68 79 41 26 42 75
77 60 56 82 57 72 80 51 29 72
60 90 51 80 38 34 67 76 62 58
87 55 37 62 76 46 54 31 28 63
32 80 58 85 57 92 32 31 44 61
27 77 65 60 48 46 44 35 75 55
79 67 55 49 77 34 71 24 68 59
38 64 28 29 78 49 56 58 74 69
Nota. Elaboración propia.
Se pide construir una tabla de frecuencia para 
estos datos, organizando intervalos. Para ello, 
el procedimiento es el siguiente:
1. Se calcula el rango, como se muestra en la 
ecuación 12.
Rango = Xmax – Xmin = 92 – 24 = 68 (12)
El rango indica que una persona de 92 años es 
la de mayor edad que se encuentra hospita-
lizada y que la persona de menor edad en el 
hospital tiene 24 años.
2. Número de intervalos (ver ecuación 13)
m = 1 + 3,3 * log(100) = 7,6 (13)
Aquí, se pueden escoger 7 intervalos que co-
rresponde a un redondeo por defecto o 8, 
si el redondeo es por exceso. Sin ajustarse a 
ninguna regla se escogerá el redondeo por 
defecto, entonces se tienen 7 intervalos.
3. Longitud del intervalo (ver ecuación 14)
C = = = 9,71 ≈ 10 (14)
En este caso, la aproximación se recomienda por 
exceso, por ejemplo, se la puede aproximar a 10.
El producto C*m = 10 * 7 = 70 excede al Rango = 68
R 68
m 7
Gráficos estadísticos: guía práctica para estadística descriptiva· 21
Histograma
El histograma es una figura propia de las va-
riables continuas, cuya tabla se ha organizado 
en intervalos de clase. Sobre el eje horizontal 
se observan los intervalos de clase y sobre el 
eje vertical el valor de las frecuencias absolu-
tas (figura 10).
La lectura sobre el histograma es directa, cada 
caja representa el valor absoluto de las fre-
cuencias, por ejemplo, para este caso 13 per-
sonas entre 23 y 33 años, se encuentran re-
cuperándose de la covid-19 en el hospital. El 
histograma es exclusivo de los datos numéri-
cos continuos.
Diagrama de tortas
El diagrama de tortas es una de las gráficas 
que se usa para representar las frecuencias re-
lativas, es común a todo tipo de variables, ya 
sean numéricas o categóricas. Al igual que en 
los datos enteros o categóricos, expresan el 
valor de la frecuencia relativa para cada uno 
de los elementos de la variable de estudio, en 
marca de clase de los intervalos. El concep-
to de marca de clase correspondea la ubica-
ción del centro de cada uno de los intervalos 
de clase.
TABLA 7
Tabla de frecuencias de personas con la COVID-19 que se 
recuperan en el hospital
Edades f h F H Xi
23-33 13 13 % 13 13 % 28
33-43 10 10 % 23 23 % 38
43-53 11 11 % 34 34 % 48
53-63 25 25 % 59 59 % 58
63-73 13 13 % 72 72 % 68
73-83 21 21 % 93 93 % 78
83-93 7 7 % 100 100 % 88
  100 1    
Nota. Datos tomados del Ministerio de Salud de Colombia (2020).
Teniendo en cuenta la información registrada 
en la tabla 7, se construyen los siguientes tipos 
de graficas: histogramas, tortas, ojivas, y polí-
gonos de frecuencias.
13
23___33 33___43 43___53 53___63 63___73 73___83 83___93
10
11
25
13
21
7
Figura 10. Histograma de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio 
de Salud de Colombia (2020).
22 · Generación de contenidos impresos
Figura 11. Diagrama de tortas de personas con la covid-19 que se han hospitalizado. Datos 
tomados del Ministerio de Salud de Colombia (2020).
83 ___ 93
7%
73 ___ 83
21%
23 ___ 33
13%
33 ___ 43
10%
43 ___ 53
11%
53 ___ 63
25%
63 ___ 73
13%
Figura 12. Ojiva de personas con covid-19 que se han hospitalizado. Datos tomados del Ministerio de 
Salud de Colombia (2020).
este caso representa las categorías o los inter-
valos de clase, formadas con la variable edad, 
de las personas que se han hospitalizado a 
causa del contagio por covid-19 en Colombia 
(ver figura 11).
Ojivas 
Las ojivas son gráficos exclusivos de los datos 
numéricos continuos que permiten visualizar 
el valor de las frecuencias acumuladas tanto 
absolutas como acumuladas. Para este gráfico, 
en el eje horizontal, se ubican los intervalos de 
clase; en el eje vertical, se leen las frecuencias 
absolutas acumuladas (figura 12).
Como el salto de intervalo implica continuidad 
en sus valores, su lectura se hace con base en 
el valor acumulado de la frecuencia tomando 
como final el extremo superior del interva-
lo. Por ejemplo, existen 34 personas con la 
covid19 que están recuperándose en el hospi-
tal por debajo de los 53 años. 
13
23___33 33___43 43___53 53___63 63___73 73___83 83___93
23
34
59
72
93
100
Gráficos estadísticos: guía práctica para estadística descriptiva· 23
ellos podemos nombrar a los boxplot, las pirá-
mides poblacionales, los diagramas de Pareto y 
otros que no se abordarán en este documento.
BOXPLOT
Para Walker et al. (2018), el diagrama de caja 
es una herramienta eficaz de visualización de 
datos y útil en diversas aplicaciones y disci-
plinas. Aunque existen métodos gráficos más 
sofisticados, el diagrama de caja sigue siendo 
relevante debido a su simplicidad, interpreta-
bilidad y utilidad, incluso en la era del big data. 
Los boxplot se constituyen en gráficos para 
datos numéricos, generalmente, si agrupan 
tablas de frecuencias. 
Uno de los aspectos importantes que es posible 
visualizar en los boxplots son los datos atípicos 
(puntos outlaiers), los cuales suponen una es-
pecial atención en el análisis de datos, ya que 
suponen limitaciones inherentes al tratar con 
datos de distribuciones sesgadas. Por ejemplo, 
en la figura 14, para el grupo de mujeres existen 
cuatro puntos outlaiers, que llaman la atención 
ya que corresponden a edades de niños que se 
encuentran hospitalizados por la covid-19 
Polígonos de frecuencia
El polígono de frecuencia es el gráfico estadísti-
co creado partir de un histograma de frecuen-
cia y las marcas de clase. Estos histogramas 
emplean columnas verticales para reflejar fre-
cuencias: el polígono de frecuencia es realiza-
do uniendo los puntos que reflejan las marcas 
de clase del intervalo y la frecuencia absoluta 
(ver figura 13). 
Visualmente, este gráfico identifica los puntos 
más altos y bajos de la distribución. Por ejemplo, 
en la figura 13, se puede evidenciar que las per-
sonas entre 53 y 63 años representan el mayor 
número de hospitalizados por la covid-19. Asi-
mismo, se puede determinar cómo el número 
de personas que tienen edades ente 83 y 93 es 
el grupo más pequeño en condiciones de hos-
pitalización.
Otras gráficas
Existen otro tipo de gráficas que tienen que ver 
con los datos categóricos o con datos numéri-
cos y que proponen mucha información, entre 
Figura 13. Polígono de frecuencias de personas con la covid-19 que se han hospitalizado. Datos tomados del 
Ministerio de Salud de Colombia (2020).
13
23___33 33___43 43___53 53___63 63___73 73___83 83___93
10
11
25
13
21
7
24 · Generación de contenidos impresos
PIRÁMIDES POBLACIONALES
Las pirámides poblacionales han venido siendo 
usadas para representar la distribución de la 
población en diferentes eventos. En tiempos 
de la covid-19 se han vuelto muy comunes y 
han sido usadas para representar y comparar 
el número de contagios por sexo y por grupos 
etarios. Pacheco y Rosselli (2018) proponen el 
uso de estas figuras para hacer proyecciones 
demográficas, por ejemplo, la transición de-
mográfica, y comparar la composición de la 
población en una región determinada.
La figura 15 se refiere a la pirámide población 
por grupo etario y género de los contagios por 
la covid-19 en Colombia. Lo que propone la pi-
rámide es una comparación de la forma como 
se contagian hombres y mujeres; en la mayoría 
de los intervalos de clase etaria, el problema 
del contagio es similar, en otros se observa un 
aumento ligero en los hombres, en síntesis, 
permite observar el equilibrio o desequilibrio 
que existe en la población femenina y masculi-
na que se ha contagiado con la covid-19. 
Otros de los aspectos que permite visualizar 
los boxplots es la comparación de grupos; por 
ejemplo, en la figura 14 se observa cómo están 
los grupos por género de aquellas personas 
que se han contagiado por la covid-19 y que 
se encuentran hospitalizados. Por la construc-
ción de las cajas, el grupo de hombres es más 
grande que el de mujeres; asimismo, se ob-
servan que en el grupo de hombres existe un 
nutrido grupo de personas jóvenes que están 
en situación de hospitalización. Todas estas 
observaciones y otras son posibles a la luz de 
la construcción de estas figuras.
Finalmente, estos gráficos permiten obser-
var el valor de las medidas de tendencia 
central, de posición, de dispersión e, incluso, 
es posible analizar la asimetría y la normali-
dad de los datos, asimismo, observar, valores 
mínimos máximos, rangos, entre otros. Todos 
estos elementos de información que propo-
nen los boxplots suponen importancia esta-
dística para el análisis de datos números o de 
pequeños grupos.
Figura 14. Boxplot por género de personas con la covid-19 que se han hospitalizado. Datos 
tomados del Ministerio de Salud de Colombia (2020).
101
81
61
41
21
1
Mujeres
Hombres
Gráficos estadísticos: guía práctica para estadística descriptiva· 25
TABLA 8
Tabla de Pareto de personas con la COVID-19 que se recuperan 
en el hospital
Edades f h F H
53-63 25 25 % 59 25 %
73-83 21 21 % 93 46 %
23-33 13 13 % 13 59 %
63-73 13 13 % 72 72 %
43-53 11 11 % 34 83 %
33-43 10 10 % 23 93 %
83-93 7 7 % 100 100 %
  100 1    
Nota. Datos tomados del Ministerio de Salud de Colombia.
En la tabla 7, se han preparado los datos para 
la realización de la gráfica de Pareto. Los inter-
valos están dispuestos de acuerdo con el orden 
descendente de las frecuencias absolutas. La 
preparación de los datos supone la división de 
los grupos determinados en grupos críticos y 
poco críticos, lo cual se observa en la figura 16.
Si da clic en el enlace, puede encontrar un 
video titulado “Pirámide poblacional en Excel 
| Tips y trucos en Excel”, que le servirá de guía 
para la construcción de una pirámide pobla-
cional en Excel.
DIAGRAMA DE PARETO
Un diagrama de Pareto es una técnica gráfica 
simple para ordenar elementos, desde el más 
frecuente hasta el menos frecuente (en forma 
descendente), basándose en el principio de 
Pareto. En el caso que aquí se expone (ver 
tabla 8), se trata de observar el grupo etario 
de mayorescasos de contagio por edades, a los 
que se los puede dividir en dos grupos: críti-
cos y poco críticos. La proporción de los grupos 
críticos para Pareto resulta ser de aproxima-
damente un 20 % para los “pocos críticos” de 
un 80 %. Este 20 % serán los grupos etarios res-
ponsables de la mayor parte del efecto que 
se produce en casos de hospitalización por la 
covid-19 en Colombia.
Figura 15. Pirámide poblacional por género de personas con la COVID-19 en Colombia. Adaptado del Boletín 
Epidemiológico COVID-19, por la Subred Integrada de Servicios de Salud. (2020).
> 90
80 __ 89
70 __ 79
60 __ 69
50 __ 59
40 __ 49
30 __ 39
20 __ 29
10 __ 19
0 __ 9
6546
32713
69566
7049
30379
64592
134421 124829
211638 196535
249174 231393
341887 317490
322530 299514
103220 95355
49408 45882
400000 4000000300000 300000200000 200000100000 100000
Hombres
Mujeres
https://www.youtube.com/watch?v=5plXrUsvJwA
https://www.youtube.com/watch?v=5plXrUsvJwA
26 · Generación de contenidos impresos
lleguen al hospital producto del contagio por 
la covid-19. 
Una lectura de la figura nos propone que el 
72 % está generado por cuatro causas princi-
pales, determinados por los grupos etarios de 
53-63; 73-83; 23-83; 63-73. Una recomendación 
a la luz de estos resultados propondría hacer 
una revisión sobre estos grupos etarios, ya que 
aquí se concentra la mayoría de las personas 
con la covid-19 en el hospital. 
Si da clic en el siguiente enlace, podrá encontrar 
un video titulado “¿Cómo hacer un diagrama 
de Pareto en Excel 2016?”, que le servirá de guía 
para la construcción de los diagramas de Pareto.
Para obtener la figura 16, los datos tienen que 
estar ordenados de mayor a menor. Las causas 
en el eje x, sobre el eje y izquierdo, se dispo-
nen los valores de la frecuencia absoluta acu-
mulada; sobre el lado derecho, se observan los 
valores de la frecuencia relativa acumulada.
De acuerdo con lo dispuesto por Pareto, el 80 % 
de las consecuencias es producto del 20 % de 
las causas. El grafico identifica el 80 %; como 
este valor se observa sobre las frecuencias 
acumuladas, para el caso que se observa el 
valor cercano corresponde al 72 %, en el cual 
se concentrará el esfuerzo de grupo etario 
por disminuir el número de personas que 
Figura 16. Diagrama de Pareto de personas con la covid-19 que se recuperan en el hospital. Datos tomados 
del Ministerio de Salud de Colombia.
100
90
80
70
60
50
40
30
20
10
0
Pe
rs
on
as
 c
on
 C
OV
ID
-1
9 
qu
e 
se
 re
cu
pe
ra
n 
en
 e
l h
os
pi
ta
l
Rango de edades de personas con COVID-19 que se recuperan en el hospital
53 __63 73 __83 23 __33 63 __73 43 __53 33 __43 83 __93
Po
rc
en
ta
je
 A
cu
m
ul
ad
o
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
25%
46%
59%
72%
83%
93%
100%
25 21
13 13 11 10 7
https://www.youtube.com/watch?v=X13qrE8AoaQ&t=460s
https://www.youtube.com/watch?v=X13qrE8AoaQ&t=460s
Gráficos estadísticos: guía práctica para estadística descriptiva· 27
Aquí: 
1. Primaria
2. Secundaria
3. Técnica
4. Universidad
5. Posgrado
Elabore para datos categóricos, la tabla de fre-
cuencias y los respectivos gráficos, acordes 
con este tipo de variables. Haga uso de Excel 
para la construcción de las tablas y de sus res-
pectivos gráficos.
Ejercicio n.° 2
Cuestionario, por niveles taxonómicos de solo, 
con lectura de gráficos estadísticos.
Con el propósito de fortalecer la lectura y la 
comprensión de los gráficos estadísticos se 
hace uso de la taxonomía solo en sus cuatro 
niveles. Con respecto a esta taxonomía Biggs 
y Collis (1982) observaron que, “en la progre-
sión desde la incompetencia hasta la maes-
tría, los estudiantes muestran una secuencia 
consistente, o ciclo de aprendizaje, que es ge-
neralizable a una gran variedad de tareas y 
en particular a las tareas escolares”. Esta se-
cuencia se refiere a un progreso jerárquico en 
la complejidad estructural de sus respuestas, 
cualquiera que sea el modo de funcionar o 
modo de representación, en el que se exprese 
el aprendizaje. Lo anterior supone que el 
proceso de indagar partirá de posiciones sen-
cillas para llegar a propuestas complejas en 
las que se evidencia el grado de aprendizaje 
en los estudiantes (Biggs y Collis, 1991). En las 
siguientes preguntas.
Según la figura 1 que muestra los asesinatos 
ocurridos a líderes sociales, responda:
EJERCICIOS DE APLICACIÓN
Ejercicio n.° 1
En una encuesta aplicada a microempresarios 
de la ciudad de Villavicencio se desea indagar 
sobre su formación. Se realizó la encuesta con 
150 microempresarios. Los resultados fueron 
los siguientes: 
4 3 2 4 4
2 2 4 2 4
4 4 3 2 4
3 2 4 3 4
2 3 4 4 4
2 1 3 3 3
2 4 2 3 4
3 4 3 4 4
2 4 4 4 4
4 3 3 3 4
3 3 3 4 4
4 4 2 3 3
4 3 3 3 4
3 5 4 4 4
4 2 3 4 4
4 3 3 3 3
2 2 3 4 4
4 3 4 2 4
1 3 3 4 3
4 5 4 3 4
4 4 4 4 3
4 3 3 4 4
4 3 3 3 4
4 4 4 2 3
4 5 2 4 4
3 4 3 4 4
4 3 2 3 2
4 4 2 4 4
4 4 4 4 2
4 3 4 3 3
28 · Generación de contenidos impresos
desconfianza de pueblo en torno al se-
guimiento y la aplicación de la justicia. 
C. La excesiva manifestaciòn de asesina-
tos ocurridos a lo largo de un año (2017 
y 2018) implica que hubo un mayor de-
sarrollo de estrategias en contra la de-
lincuencia, lo que provoca disminución 
de los casos refejados en año siguiente 
(2018-2019).
D. El registro y analisis de asesinatos en un 
periodo de un año y el aumento de los pro-
blemas de la delincuencia dilatan la apli-
cación de estrategias para su prevención.
De acuerdo con la información evidenciada en 
la figura 17, responda las siguientes preguntas:
De acuerdo con la gráfica del comparativo del 
mes de junio, responda:
5. La deforestación por km2 para el 2017 es
A. 600.
B. 1000.
C. 200.
D. 6000.
6. Para el 2016 y 2019 la deforestación por 
km2 está entre
A. 200 y 400.
B. 200 y 1000.
C. 800 y 1000.
D. 400 y 600.
7. Al analizar la deforestación comparati-
va por años de agosto a junio por km2 se 
puede afirmar que 
A. Durante el gobierno de Bolsonaro hubo 
más de 3000 km2 reportados en defores-
tación y degradación. 
1. Entre el 7 de agosto del 2016 y el 9 de julio 
del 2017 ocurrieron: 
A. 69 asesinatos.
B. 80 asesinatos. 
C. 105 asesinatos.
D. 10 asesinatos. 
2. Fueron asesinados 105 lideres sociales entre
A. El de 10 de julio del 2017 y el 6 de agosto 
del 2017.
B. El 7 de agosto del 2017 y el 9 de julio del 
2018.
C. El 10 de julio del 2018 y el 6 de agosto del 
2018.
D. El 1 de agosto del 2016 y el 9 de julio del 
2019.
3. El mayor aumento de asesinatos es
A. 37 correspondiente a la diferencia de ase-
sinatos ocurridos entre el 7 de agosto del 
2016 y el 9 de julio del 2018.
B. 1 representa el aumento de asesinatos 
entre el 7 de agosto del 2016 y el 9 de julio 
del 2019.
C. 5 son los asesinatos ocurridos entre el 10 
de julio del 2018 y el 6 de agosto del 2018.
D. 100 corresponde a los asesinatos entre el 6 
de agosto del 2017 al 9 de agosto del 2018.
4. Según los asesinatos ocurridos a líderes so-
ciales ocurridos entre enero del 2016 y julio 
del 2019 se infiere que: 
A. La disminución de los asesinatos durante 
julio y agosto del 2017 obedece al aumento 
de los casos ocurridos en el año imediata-
mente anterior.
B. El aumento de asesinatos ocurridos entre 
agosto del 2017 y julio del 2018 provocan 
Gráficos estadísticos: guía práctica para estadística descriptiva· 29
Figura 17. Radiografía de la deforestación en el Amazonas brasileño (junio del 2019). Tomado de Pasquali (2020), a partir 
de efe, cifras de deter e inpe y adaptación infográfica etc.
Deforestación
Comparativo mes de junio
REPUNTA LA DEFORESTACIÓN Comparativo por años
(agosto a junio. Km2)
Gobierno
Bolsonaro
3.000 km2
4.638,7
4.181,5 3.975,5
4.574,9
446,56
193,28
153,55
1.025,58
577,25
228,44
Deforestación y degradación
Top 3 por estados Top 3 por estados
Pará
Amazonas
Mato grosso
km2
1.000
800
600
400
200
0
2016 2017 2018 2019 2016 2017 2018 2019
Matogrosso
Pará
Amazonas
920,21 km2 2.072 km2
B. Para el 2019 la deforestación disminuyó 
notablemente.
C. Para el 2019 se presentó la cifra más alta 
en deforestación y degradación.
D. Año tras años la cifra de deforestación 
y degradación disminuye gradualmente.
8. La deforestación y la degradación de la 
amazonia brasilera determina: 
A. Una alta deforestación en los años 2016 
y 2019 producto de la falta de compro-
miso del Gobierno con el medio ambien-
te, falta de control de los incendios arti-
ficiales y la consistente demanda de las 
empresas productoras de madera.
B. Un decrecimiento mínimo en la defores-
tación para el 2019 con respecto al 2016 
lo que sugiere una falta de compromi-
so del Gobierno actual por controlar las 
causas de este.
C. La deforestación para el 2018 representa 
la más baja deforestación lo cual implica 
que hubo un mayor control en las políti-
cas de reserva ambiental.
D. Los altibajos en deforestación por kiló-
metro cuadrado en comparación con 
junio, en el cual el 2016 y 2019 ocupan el 
primer lugar y el 2017 y 2018 el segundo 
con más bajos índices de deforestación.
En el 2012, las emisiones totales de Colom-
bia ascienden a 178 000 Gg CO², la distribución 
sectorial de emisiones de Gases Efecto de In-
vernadero se representa en la figura 18.
30 · Generación de contenidos impresos
C. i y iv solamente.
D. y iii solamente.
10. Sabiendo que la producción total de emisión 
de gei en Colombia ascienden a 178 000 Gg 
CO², cuantos miles de Gg CO² debe dismi-
nuir el sector agricultura, silvicultura y 
otros usos de la tierra (afolu) para que su 
porcentaje descienda a un 40 %:
A. 14 000,24 Gg CO²
B. 71 000,2 Gg CO²
C. 76 000,54 Gg CO²
D. 5000,34 mil Gg CO²
Teniendo en cuenta la información dada en la 
figura 18, ¿cuál de las siguientes afirmaciones 
son verdaderas?
A. El sector que genera mayor contamina-
ción es el sector energético. 
B. El sector agricultura, silvicultura y otros 
usos de la tierra (afolu) generan más del 
50 % de las emisiones de gei del país.
C. Los sectores energía y procesos indus-
triales y uso de productos generan más 
del 50 % de las emisiones de gei del país.
9. Los sectores energía y residuos generan más 
del 50 % de las emisiones de gei del país:
A. solamente.
B. solamente.
Figura 18. Emisiones GEI de Colombia en el 2012. Tomado de Inventario Nacional de Gases de Efecto Invernadero (2012).
Residuos
8%
44%43%
5%
Energía
Agricultura,
silvicultura y otros
usos de la tierra
(AFOLU)
Procesos industriales
y usos de productos
Gráficos estadísticos: guía práctica para estadística descriptiva· 31
In
te
rv
al
os
L-
Cr
iti
ca
M
at
em
át
ic
as
C-
Na
tu
ra
le
s
C-
Ci
ud
ad
an
as
26-34,5        
34,5-43        
43-51,5        
51,5-60        
60-68,5        
68,5-77        
Total        
Ejercicio n.° 4
Para los datos no organizados de la prueba 
saber, construya los Boxplot y establezca com-
paraciones entre las asignaturas que se pre-
sentan en la tabla.
Ejercicio n.° 5
Para los valores obtenidos en las asignaturas 
de L-Critica y Matemáticas, elabore una pirá-
mide de resultados y establezca algunas com-
paraciones.
Ejercicio n.° 6
Al parecer, los resultados de la prueba de 
lectura crítica están relacionados con la canti-
dad de libros leídos por un estudiante. A partir 
de los datos obtenidos en la siguiente tabla, 
dibuje un diagrama de Pareto. Concluya con 
respecto a las variables de lectura.
Variables de lectura Intervalos Promedios 
No leen 0 50
Leen poco 0-10 51
Lectura mediana 11-25 56
Bastante lectura 26-100 56,2
Mucha lectura >10 58
Ejercicio n.° 3
A continuación, se proponen algunos datos 
obtenidos en las pruebas saber-2019. 
L-Critica Matemáticas C-Naturales C-Ciudadanas
47 48 37 30
60 65 54 59
66 57 41 74
62 54 61 73
63 57 55 57
49 29 41 41
76 70 70 68
57 65 63 66
62 62 66 39
68 66 63 77
42 40 28 39
38 31 41 26
64 56 59 60
52 66 54 52
54 49 40 33
52 55 61 50
63 68 54 69
48 54 58 50
52 55 49 32
61 38 44 45
55 64 57 57
57 51 45 38
58 57 49 42
34 39 38 28
48 71 61 55
75 73 59 75
53 56 54 55
53 48 43 46
40 43 39 39
69 57 63 61
49 55 31 31
59 51 51 45
65 64 54 62
55 55 50 45
56 51 49 51
Para los datos propuestos, obtenga el valor 
de las frecuencias absolutas, relativas y acu-
muladas, propuestas desde la siguiente tabla. 
Elabore histogramas para matemáticas y 
L-Crítica, Ojivas para C-naturales y diagramas 
circulares para C-ciudadanas. Realice lecturas 
para algunas graficas.
32 · Generación de contenidos impresos
REFERENCIAS
Batanero, C. y Díaz, C. (2011). Estadística con proyectos. Universidad de Granada.
Castellanos. M. T. y Obando J. (2013). Análisis y sistemas de datos poderoso escenario de aprendizaje cultural. 
Revista Científica, 2(54), 504-508.
Contreras, A., Cárdenas, C., González, J., Toloza, S., Zambrano, L. y Pulido-Rojan, A. (2019). Herramientas estadísti-
cas para la mejora del control de inventarios: un caso de estudio. Investigación y Desarrollo en tic, 10(1), 13-24.
Consejería Presidencial de los Derechos Humanos. (2019). Informe sobre el balance de las acciones y estrategias ade-
lantadas en el marco de la protección de los líderes, lideresas sociales y defensores de derechos humanos. Consejería 
Presidencial de los Derechos Humanos. http://www.derechoshumanos.gov.co/Prensa/2019/Documents/
INFORME%20LDDH%20ACTUALIZADO%2017%20DE%20JULIO_V2.pdf
Departamento Administrativo Nacional de Estadística. (dane). (2020). Boletín técnico. Estadísticas vitales – eevv. 
Defunciones por covid-19. 2 de marzo al 4 de octubre de 2020pr. dane. https://www.dane.gov.co/files/investiga-
ciones/poblacion/defunciones-covid19/boletin-defunciones-covid-2020-02mar-04oct.pdf 
Ingeniería Industrial Easy. (2017, 11 de marzo). Cómo hacer un diagrama de Pareto en Excel 2016. [Video de You-
Tube]. https://bit.ly/38TKbou
Instituto Nacional de Salud. (ins). (2020). covid-19 en Colombia. Instituto Nacional de Salud. https://www.ins.
gov.co/Noticias/Paginas/coronavirus-casos.aspx 
Inventario Nacional de Gases de Efecto Invernadero. (gei). (2012). Tercera Comunicación Nacional de Cambio Cli-
mático. Programa de las Naciones Unidas para el Desarrollo (pnud). http://documentacion.ideam.gov.co/
openbiblio/bvirtual/023421/cartilla_INGEI.pdf 
Microsoft Excel a Todo Nivel. (2016, 1 de agosto). Pirámide poblacional en Excel | Tips y trucos en Excel. [Video de 
YouTube]. https://bit.ly/3nf0Nzh 
Pasquali, M. (2020). La deforestación en la Amazonia brasileña alcanza su nivel más alto en una década. Sta-
tista. https://es.statista.com/grafico/16328/deforestacion-estimada-en-la-amazonia-brasilena/
Polanía, M. J., Pacheco, B. y Rosselli, D. (2018). El uso de pirámides poblacionales como representación gráfica 
del sistema de salud colombiano. Archivos de Medicina (Manizales), 18(1), 127-133.
Ross, S. M. (2018). Introducción a la estadística. Reverté.
Subred Integrada de Servicios de Salud. (2020, 26 de agosto). Boletín Epidemiológico covid-19. Datos Abiertos Bogo-
tá. https://datosabiertos.bogota.gov.co/dataset/9de30caa-a772-4fc9-9d8c-6baf0cd5078f/resource/cdecb5cf-
6f63-46b1-bc4a-70d95b6394b4/download/boletin-epidemiologico.pdf
Walker, M. L., Dovoedo, Y. H., Chakraborti, S. y Hilton, C. W. (2018). Un diagrama de caja mejorado para datos 
univariados. The American Statistician, 72(4), 348-353.
http://www.derechoshumanos.gov.co/Prensa/2019/Documents/INFORME LDDH ACTUALIZADO 17 DE JULIO_V2.pdf
http://www.derechoshumanos.gov.co/Prensa/2019/Documents/INFORME LDDH ACTUALIZADO 17 DE JULIO_V2.pdf
https://www.dane.gov.co/files/investigaciones/poblacion/defunciones-covid19/boletin-defunciones-covid-2020-02mar-04oct.pdf
https://www.dane.gov.co/files/investigaciones/poblacion/defunciones-covid19/boletin-defunciones-covid-2020-02mar-04oct.pdf
https://www.youtube.com/channel/UCsisI-iyyCmaPlKxC41j4-w
https://bit.ly/38TKbou
https://www.ins.gov.co/Noticias/Paginas/coronavirus-casos.aspx
https://www.ins.gov.co/Noticias/Paginas/coronavirus-casos.aspxhttp://documentacion.ideam.gov.co/openbiblio/bvirtual/023421/cartilla_INGEI.pdf
http://documentacion.ideam.gov.co/openbiblio/bvirtual/023421/cartilla_INGEI.pdf
https://es.statista.com/grafico/16328/deforestacion-estimada-en-la-amazonia-brasilena/
https://datosabiertos.bogota.gov.co/dataset/9de30caa-a772-4fc9-9d8c-6baf0cd5078f/resource/cdecb5cf-6f63-46b1-bc4a-70d95b6394b4/download/boletin-epidemiologico.pdf
https://datosabiertos.bogota.gov.co/dataset/9de30caa-a772-4fc9-9d8c-6baf0cd5078f/resource/cdecb5cf-6f63-46b1-bc4a-70d95b6394b4/download/boletin-epidemiologico.pdf