Vista previa del material en texto
08 2021 Apropiación social del conocimiento Generación de contenidos impresos N.° 8, septiembre de 2021 doi: https://doi.org/10.16925/gcgp.32 GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA DESCRIPTIVA Jorge Alejandro Obando-Bastidas Universidad Cooperativa de Colombia Sede Villavicencio María Teresa Castellanos Sánchez Universidad de los Llanos https://doi.org/10.16925/gcgp.32 Acerca de los autores Jorge Alejandro Obando-Bastidas, doctor en Docencia e Investigación, profesor tiempo completo de Contaduría Pública, Universidad Cooperativa de Colombia, sede Vi- llavicencio. Correo electrónico: jorge.obandob@campusucc.edu.co Cvlac:https://scienti.minciencias.gov.co/cvlac/visualiza- dor/generarCurriculoCv.do?cod_rh=0001281569 Gruplac: https://scienti.minciencias.gov.co/gruplac/jsp/ visualiza/visualizagr.jsp?nro=00000000009298 orcid: https://orcid.org/0000-0002-4283-2871 Google Scholar: https://scholar.google.es/cita- tions?hl=es&user=WHrpjDwAAAAJ María Teresa Castellanos Sánchez, doctora en Educa- tion Mathematica, profesora titular de Licenciatura en matemáticas, Universidad de los Llanos. Correo electrónico: mcastellanos@unillanos.edu.co Cvlac:http://scienti.colciencias.gov.co:8081/cvlac/visua- lizador/generarCurriculoCv.do?cod_rh=0000609455 Gruplac: https://scienti.minciencias.gov.co/gruplac/jsp/ visualiza/visualizagr.jsp?nro=00000000007746 orcid: https://orcid.org/0000-0001-7850-3183 Google Scholar: https://scholar.google.es/citations?u- ser=yn9pkUYAAAAJ&hl=es&oi=ao Cómo citar este documento Obando Bastidas, J. A. y Castellanos Sánchez, M. T. (2021). Gráficos estadísticos: guía práctica para estadística descripti- va (Generación de contenidos impresos N° 08). Ediciones Universidad Cooperativa de Colombia. doi: https://doi. org/10.16925/gcgp.32 NOTA LEGAL El presente documento de trabajo ha sido incluido dentro de nuestro repositorio institucional como Apropiación social de conocimiento por solicitud del autor, con fines informativos, educativos o académicos. Asimismo, los argumentos, datos y análisis incluidos en el texto son responsabilidad absoluta del autor y no representan la opinión del Fondo Editorial o de la Universidad. DISCLAIMER This coursework paper has been uploaded to our institutional repository as Social Appropriation of Knowledge due to the request of the author. This document should be used for informational, educational or academic purposes only. Arguments, data and analysis included in this document represent authors’ opinion not the Press or the University. Este documento puede ser consultado, descargado o reproducido desde nuestro repositorio institucional (http://repository. ucc.edu.co/handle/20.500.12494/7369) para uso de sus contenidos, bajo la licencia de Creative Commons Reconocimien- to-NoComercial-SinObraDerivada 4.0 Internacional. http://creativecommons.org/licenses/by-nc-nd/4.0/ mailto:Jorge.obandob@campusucc.edu.co https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001281569 https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001281569 https://scienti.minciencias.gov.co/gruplac/jsp/visualiza/visualizagr.jsp?nro=00000000009298 https://scienti.minciencias.gov.co/gruplac/jsp/visualiza/visualizagr.jsp?nro=00000000009298 https://orcid.org/0000-0002-4283-2871 https://scholar.google.es/citations?hl=es&user=WHrpjDwAAAAJ https://scholar.google.es/citations?hl=es&user=WHrpjDwAAAAJ mailto:mcastellanos@unillanos.edu.co http://scienti.colciencias.gov.co:8081/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000609455 http://scienti.colciencias.gov.co:8081/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000609455 https://scienti.minciencias.gov.co/gruplac/jsp/visualiza/visualizagr.jsp?nro=00000000007746 https://scienti.minciencias.gov.co/gruplac/jsp/visualiza/visualizagr.jsp?nro=00000000007746 https://orcid.org/0000-0001-7850-3183 https://scholar.google.es/citations?user=yn9pkUYAAAAJ&hl=es&oi=ao https://scholar.google.es/citations?user=yn9pkUYAAAAJ&hl=es&oi=ao https://doi.org/10.16925/gcgp.32 https://doi.org/10.16925/gcgp.32 http://repository.ucc.edu.co/handle/20.500.12494/7369 http://repository.ucc.edu.co/handle/20.500.12494/7369 TABLA DE CONTENIDO Resumen 7 Introducción 8 Propósito 8 Unidad de competencias 8 Elemento de competencia del saber 8 Marcos teóricos 8 Campo de acción 9 División 9 Población 9 Muestra 10 Variables 10 Variables enteras o discretas 10 Variables reales o continuas 10 Variables cualitativas 10 Clasificación de las variables según su naturaleza 10 Tablas de frecuencia 11 Gráficos estadísticos 12 Gráficos para datos categóricos 12 Gráfico de barras 13 Gráfico de sectores 13 Gráfico de arañas 15 Gráfico de anillos o sectores 15 Gráficos para datos numéricos enteros 15 Diagrama de barras para variables numéricas enteras 17 Gráfico de diagramas integrales 18 Tabla de frecuencias para datos continuos a través de intervalos 19 Ejemplo de aplicación 19 Gráficos para datos continuos organizados en intervalos de clase 20 Histograma 21 Diagrama de Tortas 21 Ojivas 22 Polígonos de frecuencia 23 Otras graficas 23 Boxplot 23 Diagrama de Pareto 25 Ejercicios de aplicación 27 Referentes 32 ÍNDICE DE TABLAS Y FIGURAS Tabla 1. Clasificación y tipos de variables 11 Tabla 2. Estructura de una tabla de frecuencias 12 Tabla 3. Tabla de frecuencias para la variable motivos de visita al departamento del Meta 13 Tabla 4. Tabla de frecuencias del número de fallecidos por la covid-19 en Colombia discriminado por estratos sociales 17 Tabla 5. Edades de cien personas que se recuperan de la covid-19 20 Tabla 6. Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital 20 Tabla 7. Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital 21 Tabla 8. Tabla de Pareto de personas con la covid-19 que se recuperan en el hospital 25 Figura 1. Asesinatos de líderes sociales (2016-2019). 9 Figura 2. Gráfico de barras para la variable motivos para visitar los Llanos orientales (1) 14 Figura 3. Gráfico de barras para la variable motivos para visitar los Llanos orientales (2) 14 Figura 4. Gráfico de torta para la variable motivos para visitar los Llanos orientales 15 Figura 5. Gráfico de araña o radar para la variable motivos para visitar los Llanos orientales 16 Figura 6. Gráfico anillos para la variable motivos para visitar los Llanos orientales 16 Figura 7. Porcentaje de muertes por la covid-19 en Colombia por estratos sociales 17 Figura 8. Número de muertes por covid-19 en Colombia por estratos sociales 18 Figura 9. Diagrama integral para el número de muertes por covid-19 18 Figura 10. Histograma de personas con la covid-19 que se han hospitalizado. 21 Figura 11. Diagrama de tortas de personas con la covid-19 que se han hospitalizado 22 Figura 12. Ojiva de personas con covid-19 que se han hospitalizado 22 Figura 13. Polígono de frecuencias de personas con covid-19 que se han hospitalizado 23 Figura 14. Boxplot por género de personas con la covid-19 que se han hospitalizado 24 Figura 15. Pirámide poblacional por género de personas con la covid-19 en Colombia 25 Figura 16. Diagrama de Pareto de personas con la covid-19 que se recuperan en el hospital 26 Figura 17. Radiografía de la deforestación en el Amazonas brasileño (junio del 2019). 29 Figura 18. Emisiones gei de Colombia en el 2012 30 Resumen Los gráficos estadísticos son objetos de la estadís- tica con los que se pretende establecer un grado de comunicación, breve, sencillo y didáctico. El propósito general que motiva el desarrollo de este documento es la apropiación de las características de los gráficos construidos en las tablas de frecuen- cias y en los datos no agrupados que provienen de bases de datos reales. La importancia de adquirir la habilidad de diseñar un gráfico radica principal- mente en la necesidad de comunicar datos de una manera visual,de manera que sea comprendido ampliamente por muchos grupos. Generalmente, los gráficos están en todos los medios de comu- nicación visuales y transmiten la realidad de los acontecimientos; el presente documento contiene, desde la definición de variables hasta la construc- ción de gráficos, estableciendo diferencias entre las variables de tipo numérico y las variables de tipo categórico. Los gráficos que aquí se muestran par- ten de la construcción de una tabla de frecuencias y son datos agrupados; sin embargo, gráficos como los Boxplot, no necesitan agrupación de los datos, puesto que, por su característica, estos gráficos sa- len de las bases de datos y proponen una informa- ción más precisa, ya que provienen de la fuente tal y como se conciben. Finalmente, en el trabajo se proponen algunos ejercicios de bases de datos rea- les y como propósito de evaluación se entrega un cuestionario de diez preguntas, diseñado con base en los lineamientos y los requerimientos de la ta- xonomía solo. Palabras clave: datos agrupados, datos no agrupados, frecuencias, variables categóricas, variables numéricas. GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA DESCRIPTIVA Jorge Alejandro Obando-Bastidas María Teresa Castellanos Sánchez 08 8 · Generación de contenidos impresos Unidad de competencias Construir información para que apoye la toma de decisiones en el entorno organizacional me- diante organización, sistematización y lectura de datos. Elemento de competencia del saber Clasificar las herramientas estadísticas para la sistematización de la información. Marcos teóricos La abundancia de datos y fuentes de informa- ción en la era de internet y de las redes sociales genera complejidad en los procesos de comuni- cación, lo cual también genera dificultad para aquellas personas y entidades que toman de- cisiones a partir de ellos. Desde esta posición, Ross (2018) propone que la estadística es un arte que propicia el aprendizaje usando datos como insumo de la información, ya que ayuda en su descripción, organización y análisis, lo que lleva a tomar conclusiones y decisiones. Por otro lado, la estadística no solo evidencia un proceso para organizar los datos y tomar decisiones a partir de ellos, también permite evidenciar la realidad, contemplar el contex- to a partir de una problemática real y una po- sición visual (Castellanos y Obando, 2013). Por ejemplo, en forma gráfica, la figura 1 informa sobre el fenómeno social de los asesinatos de líderes en Colombia, cruda realidad que se puede abordar en el estudio de la estadística. Con el análisis de la realidad se trata de fo- mentar el razonamiento estadístico, más que el aprendizaje rutinario y descontextualiza- do de conceptos y propiedades, puesto que la tecnología, hoy en día, permite aplicar la es- tadística con gran facilidad, por consiguiente, cobran mayor importancia las actividades in- terpretativas que el cálculo rutinario (Batane- ro y Díaz, 2011). INTRODUCCIÓN Los gráficos estadísticos se visualizan en dife- rentes contextos, por ejemplo, en periódicos, revistas, libros, textos, entre otros. Su presen- cia masiva en todos los espacios y el poder de comunicación de ellos proponen un grado de importancia. Teniendo en cuenta la presen- cia de los gráficos estadísticos en las estructu- ras curriculares, esta guía se diseña teniendo en cuenta dos circunstancias: por un lado, se busca que los estudiantes que cursan progra- mas relacionados con las Ciencias Económi- cas, Administrativas y Contables desarrollen competencias en la lectura de gráficos y, por ende, alcanzar una mejor comprensión de este tipo de representación de los datos estadísti- cos; por otro lado, se pretende que esta guía se convierta en un material de apoyo para aque- llos estudiantes que ingresan a la universidad con escasa formación en estadística y que, por lo tanto, requieren un proceso de fortaleci- miento que estructure en ellos el aprendiza- je inicial de esta ciencia. El desarrollo de esta guía parte de una definición de estadística, su campo de acción, el reconocimiento de con- ceptos relacionados, con la muestra, pobla- ción, tipo de variables, construcción de tablas de frecuencia y sus respectivos gráficos. Se hace una distinción entre gráficos para datos discretos y datos continuos, además en la guía se analizan otro tipo de gráficos como el del Boxplot, las pirámides poblaciones, la impor- tancia de la regla de Pareto. Todos los ejercicios relacionados con la presente guía se desarro- llarán completamente en Excel. Propósito Establecer diferencias entre los diferentes tipos de gráficos construidos a partir de tablas de frecuencias en datos agrupados y desde la propuesta de los datos dispuestos en bases de datos reales, como los bases del coronavirus y las bases de datos de las pruebas saber en Colombia. Gráficos estadísticos: guía práctica para estadística descriptiva· 9 • Estadística descriptiva: se encarga de la recolección, la clasificación y la descrip- ción de datos muéstrales o poblacionales, para su interpretación y análisis. • Estadística inferencial: desarrolla modelos teóricos que se ajusten a una determinada realidad con cierto grado de confianza. Población Se define como un conjunto de individuos o de objetos que poseen una o varias característi- cas comunes. El total de las unidades posibles de observar hace referencia también a una de- finición de población. La población no hace re- ferencia únicamente a los seres vivos; una po- blación puede estar constituida por los peces de un estanque, por animales de una determi- nada raza. Poblaciones finitas En este tipo de población, el número de uni- dades observables es contable, es decir, un número conocido de elementos del conjunto llamado población. De la misma manera, se considera finita a una población, si se conoce Campo de acción La aplicación de la estadística en la dirección de procesos enfatiza la toma de decisiones. La necesidad de resolver problemas pone de ma- nifiesto la aplicabilidad de la estadística. La aplicabilidad se extiende a todo el universo social, biológico, físico, ingeniería, educacional, médico, de negocios y leyes, en fin, a casi todas las fases de la vida. El campo de la estadística es una disciplina dirigida a lograr un mejor entendimiento del mundo que nos rodea, con el objetivo final que todos tengamos una vida más completa y con un mayor entendimiento de esta. No hay parte de nuestro ambiente que no sea una fuente de datos (nosotros mismos, otros individuos, la familia, sociedades, culturas, ciudades, países, planetas, escuelas, colegios religiones, etcéte- ra), en pocas palabras cada aspecto de nuestra existencia, incluso el comportamiento de la covid-19 en Colombia y en el mundo. División La estadística se divide en dos grandes ramas de estudio: 120 100 80 60 40 20 0 1e ro d e en e - 2 01 6 6 de a go - 20 16 7 de a go - 20 16 9 de ju l - 2 01 7 10 d e ju l - 2 01 7 6 de a go - 20 17 10 d e ju l - 2 01 8 6 de a go - 20 18 7 de a go - 20 17 9 de ju l - 2 01 8 7 de a go - 20 18 9 de ju l - 2 01 9 32 69 5 105 10 68 FIGURA 1. Asesinatos de líderes sociales (2016-2019). Tomado de la Consejería Presidencial de los Derechos Humanos (2019). 10 · Generación de contenidos impresos ejemplo, tamaño, edad, precios, rendimiento académico o indicadores económicos. VARIABLES ENTERAS O DISCRETAS En este conjunto de variables, los valores que se representan se visualizan como número entero. Por ejemplo, número de estudiantes en la universidad, número de personas diarios que se contagian con el virus sars-CoV-2. VARIABLES REALES O CONTINUAS Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo de valores, ella se mide uniformemente. Dentro de la escala de los conjuntos numéricos, re- presentan a los números reales. Por ejemplo, estatura delos estudiantes de una universi- dad, salarios devengados por los docentes de un núcleo educativo, temperaturas a ciertas horas del día, edad de una persona. VARIABLES CUALITATIVAS Representan características propias de las cualidades de los objetos que conforman la muestra o la población. Por ejemplo, sexo, origen o color de piel. Las variables cualitativas se dejan expresar en niveles de categoría. Por ejemplo, sexo: mascu- lino o femenino; origen: colombiano, venezola- no o panameño; color de piel: blanco, negro o amarillo. CLASIFICACIÓN DE LAS VARIABLES SEGÚN SU NATURALEZA Las variables sean enteras o continuas por su naturaleza se las puede clasificar como cate- góricas y numéricas; a la vez, esta clasificación responde a ciertos criterios de diferenciación. Variables categóricas: establecen categorías de los datos. Producen muchas informaciones. la fuente de donde provienen los datos. Por ejemplo, la población de estudiantes de una universidad es finita, ya que se sabe que en los programas existe una base de datos en los que están inscritos todos los estudiantes de dicha universidad. Poblaciones infinitas En este tipo de población, el conteo de uni- dades observables se hace un poco difícil. El término de infinito en estadística no se ajusta a una definición semántica, puede hacer rela- ción a un grupo de objetos, personas, cosas, en las que se desconoce la fuente de donde pro- vienen. Ejemplo: como el número de vendedo- res informales, que dado la crisis de la pande- mia de covid-19, se ha incrementado en todas las ciudades de Colombia y estos no se regis- tran en una base de datos, se puede considerar una población infinita. Muestra Se define como la mejor representación de la población. La muestra es un subconjunto de la población a la cual se le efectúa la medi- ción con el fin de estudiar las propiedades del conjunto del cual es obtenida. El tamaño de la muestra, la disponibilidad de recursos, la ho- mogeneidad de los elementos y de los datos que la conforman le da la importancia su- ficiente al uso adecuado de la muestra; un buen conocimiento de la población permite encontrar una buena muestra representativa. Existen muestras tomadas al azar y sin seguir ningún modelo de muestreo que llevan a con- clusiones inadecuadas y, por lo tanto, a tomar decisiones que no corresponden a la solución de un problema planteado dentro de conjunto. Variables Es el conjunto de características de las entida- des que se interesan en una investigación; por Gráficos estadísticos: guía práctica para estadística descriptiva· 11 de las de intervalo y tienen un origen. Por ejemplo, el peso de una persona. En la tabla 1 se resume la clasificación de estas variables. Tablas de frecuencia Muchas veces se presenta una muestra con muchos datos, por lo que se hace necesario organizarlos en una tabla de frecuencias o en una distribución de frecuencias. Este tipo de tabla está formada por las distintas catego- rías (valores o intervalos) del carácter X y por las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas. A manera de definición, se puede decir que una tabla de frecuencias es un método para presentar la información en forma resumida, muestra los datos tal como aparecen en la dis- tribución, organizados en diferentes formas de conteo de los elementos de una variable, a lo que se denomina “frecuencia”. A continuación, se muestran los tipos de frecuencias que se presentan para organizar los datos. Frecuencias absolutas (f) Se llama frecuencia absoluta (f) de la variable o categoría al número de datos que se presen- tan en el conteo directo de los datos que se repiten en una distribución. La suma de todas las frecuencias absolutas es el tamaño de la muestra, como se aprecia en la ecuación 1. Por ejemplo: las categorías de bajos, medios, altos superiores es una escala categórica de estudiantes evaluados en una universidad. Nominal: no establecen ningún orden. Corres- ponde a variables categóricas; por ejemplo, estado civil, soltero, casado, viudo, unión libre. Ordinales: indican un orden. Por ejemplo, grado académico (primaria, bachillerato, uni- versidad, especialización y maestría). Variables numéricas: a diferencia de las an- teriores, producen más información y mejores procedimientos estadísticos. A toda variable numérica se la puede categorizar, pero pierde información y detalles de esta. Por ejemplo, las edades, siendo numérica producen informa- ción relacionada con medias, medianas, modas, entre otras. Se pueden categorizar como: niños, jóvenes, adultos y tercera edad; en estas cate- gorías ya no se puede obtener la información que se obtuvo en el caso numérico. Para tal efecto, las variables pueden ser: Intervalo: se pueden asociar en intervalos de clase y corresponden a variables de tipo continuo. Preservan de las variables ordina- les el orden y se acomodan las distancias. Por ejemplo, salarios, edades, notas estudiantiles. Razón: son variables que conservan más infor- mación y detalles de las demás variables. Con- servan el orden de las ordinales, la distancia TABLA 1 Clasificación y tipos de variables Tipo de variable Se dividen en Pueden ser Ejemplos Numéricas Continuas Intervalos Temperatura Razón Salarios, notas obtenidas en un curso, estatura de una persona Enteras Número de estudiantes en un salón, números de personas recuperadas de la covid-19. Categóricas Nominales Género, estado civil de una persona. Ordinales Grados militares, formación académica. Nota. Elaboración propia. 12 · Generación de contenidos impresos Finalmente, una tabla de frecuencias propone una estructura determinada, la cual se muestra en la tabla 2. TABLA 2 Estructura de una tabla de frecuencias Variable f h F H X1 f1 h1 F1 H1 X2 f2 h2 F2 H2 X3 f3 h3 F3 H3 . . . . . . . . . . Xn fn hn n 1 Total n 1 Nota. Elaboración propia. Gráficos estadísticos Los gráficos estadísticos son recursos visuales que permiten comunicar la información, se constituye en un instrumento estadístico para analizar los datos en forma eficiente y desde diferentes niveles de lectura (Castellanos y Obando, 2013). Existen gráficos para los datos numéricos y para los datos categóricos. Gráficos para datos categóricos De acuerdo con el tipo de frecuencias, se pueden encontrar gráficos, tipo barra, torta, arañas, barras acumuladas, pictogramas, anillos, entre otros. A continuación, se propone una situa- ción problemas y se construye en Excel la tabla de frecuencias con sus respectivos gráficos. Por ejemplo, en un estudio realizado en el Meta y que está relacionado con el turismo, una de las preguntas de la encuesta aplicada tenía el si- guiente contenido: ¿cuál es el principal motivo por el que usted visita al departamento del Meta? Señale solo una opción: ∑ fi = n f = f1 + f2 + f3 + ... + fn = n (1) En la ecuación 1, n es el tamaño de la muestra. Frecuencia absoluta relativa (h) Se llama frecuencia relativa de la variable X al cociente entre la frecuencia absoluta de cada dato y el total de elementos que conforman la muestra, como se aprecia en la ecuación 2. hi = (2) La suma de todas las frecuencias relativas re- presenta al 100 % de la población y equivale a 1 (uno), como se aprecia en la ecuación 3. (3) Frecuencias acumuladas (F) Esta frecuencia se obtiene de la acumula- ción sucesiva de las frecuencias absolutas. El último dato acumulado es el tamaño de la muestra, como se aprecia en la ecuación 4. (4) Frecuencias relativas acumuladas (H) Estas se obtienen de la acumulación sucesi- va de las frecuencias relativas. El último dato acumulado es el 100 % de la muestra, como se aprecia en la ecuación 5. (5) f n f1 n H F1 = f1 + f2 + f3 + ... . fn = fi f2 n F2 n F1 n f3 n F3 n n n n i=1 i=1 i=1 fn n fn n hi n Fi n ∑ ∑ ∑ + + + + + ... + + ... + === = 100% = 100% Gráficos estadísticos: guía práctica para estadística descriptiva· 13 TABLA 3 Tabla de frecuencias para la variable motivos de visita al departamento del Meta Motivos f h F H Paisaje 15 0,15 15 0,15 Gastronomía 15 0,15 30 0,3 Diversión 25 0,25 55 0,55 Calor Humano 19 0,19 74 0,74 Clima 14 0,14 88 0,88 Descanso 12 0,12 100 1 Total 100 1 Nota. Elaboración propia, haciendo uso del Excel. Gráfico de barras Es una figura que permite representar los elementos de la variable de estudio con los valores obtenidos en la frecuencia absoluta o también se pueden representar los valores de la frecuencia relativa. En el ordenado siempre estarán los elementos que constituyen la va- riable y en el eje de las abscisas el valor de las frecuencias. La figura 2 se elaboró en Excel. Obsérvese que, en la figura 2, se describen ex- clusivamente los valores de la frecuencia ab- soluta; cada barra evidencia el valor de la fre- cuencia absoluta, propuesto en la tabla 3. En Excel se pueden generar diferentes formas para representar esta información; en la figura 3, se observa la misma gráfica, con la informa- ción sobre las barras y con una tabla de deno- minación de las unidades de variables. Queda a gusto del diseñador la forma como represen- ta la información. Gráfico de sectores Denominado también “tartas” (pie), consiste en un círculo dividido en tantas partes o por- ciones como valores de frecuencia relativa existan, a cada valor de frecuencias relativa le corresponde en forma proporcional un arco de círculo (figura 4). 1. Paisaje. 2. Gastronomía. 3. Diversión. 4. Calor humano. 5. Clima. 6. Descanso. Se realizó la pregunta a 100 turistas y se obtu- vieron los siguientes resultados: 1 4 4 2 5 3 3 2 4 5 1 6 2 3 2 6 1 1 6 3 4 2 6 2 1 6 3 2 3 6 2 1 3 4 1 3 6 2 1 3 6 2 3 6 3 4 3 6 3 5 3 3 4 5 6 3 5 3 3 4 5 5 3 5 3 4 4 5 5 6 1 3 4 4 4 4 1 3 1 4 4 4 1 2 1 5 4 3 1 2 1 5 3 2 4 2 5 5 3 2 Siguiendo un proceso de organización en columna de los datos y en orden ascendente, Excel es una de las mejores herramientas para construir una tabla de frecuencias, ya que fa- cilita su conteo y su proceso de construcción, puesto que el uso de las fórmulas creadas en este permite con rapidez replicarla en otras celdas y obtener los demás resultados de una manera rápida y sencilla. La tabla de frecuen- cias construida a partir de los datos anteriores se puede observar en la tabla 3. 14 · Generación de contenidos impresos Figura 2. Gráfico de barras para la variable motivos para visitar los Llanos orientales (1). Elaboración propia haciendo uso de Excel como herramienta. Figura 3. Gráfico de barras para la variable motivos para visitar los Llanos orientales (2). Elaboración propia haciendo uso de Excel como herramienta. 24 22 20 18 16 14 12 10 8 6 4 2 0 Paisaje Gastronomía Diversión Calor Humano Clima Descanso 15 15 25 19 14 12 Paisaje Gastronomía Diversión Calor Humano Clima Descanso Gráficos estadísticos: guía práctica para estadística descriptiva· 15 constituyen los anillos o los sectores. Son pe- queños sectores en forma de un aro o anillo, divido en forma proporcional de acuerdo con el valor de dicha frecuencia (figura 6). Los diagramas para las frecuencias absolutas acumuladas, denominados “diagramas integra- les”, no tienen sentido en el contexto de las va- riables categóricas, se observarán en el contexto de las variables numéricas, enteras y continuas. Gráficos para datos numéricos enteros Algunos de los gráficos para datos enteros son los mismos que para los datos categóricos, sin embargo, en los datos numéricos enteros ya se pueden realizar gráficos para las frecuen- cias acumuladas. Para revisar el tipo de gráfi- cos, se propone una situación real que ocurre en Colombia en el margen de la aparición de la pandemia de covid-19. Se propone entonces la siguiente situación: en marzo del 2020, se registraron los primeros casos del virus, hasta el 3 de enero del 2021. El total de decesos por covid-19 era de 51 397. El Departamento Ad- ministrativo Nacional de Estadística (dane), con respecto al número de muertos por la covid-19, emitió la siguiente información que se resume en la figura 7. La lectura de estos gráficos es directa, se lo hace teniendo en cuenta el valor del porcentaje pro- puesto en cada unidad de variable. Por ejemplo, el 25 % de los turistas visitan el Meta, porque aquí encuentran diversión. Una interpretación más general estará amarrada al objetivo de la investigación que generó la pregunta. Gráfico de arañas Una gráfica de radar, también conocida como un “diagrama de araña”, es una herramienta muy útil para mostrar visualmente los valores de una frecuencia relativa o absoluta. Su nombre se hereda porque propone la visuali- zación en la forma de una tela de araña. Pro- porciona la misma información de un diagra- ma de barras o de una torta (ver figura 5). El gráfico de la figura 5 puede ser una exce- lente alternativa para representar la informa- ción de los datos propuestos en las frecuencias relativas, brinda la misma información, pero desde otra visualización. Gráfico de anillos o sectores Otra de las formas de representar las fre- cuencias relativas en variables categorías lo Paisaje 15% Calor Humano 19% Gastronomía 15% Descanso 12% Clima 14% Diversión 25% Figura 4. Gráfico de torta para la variable motivos para visitar los Llanos orientales. Elaboración propia haciendo uso de Excel como herramienta. 16 · Generación de contenidos impresos Figura 5. Gráfico de araña o radar para la variable motivos para visitar los Llanos orientales. Elabora- ción propia haciendo uso de Excel como herramienta. Paisaje 15% 15% 19% Calor Humano GastronomíaDescanso 12% Clima 14% Diversión 25% Figura 6. Gráfico anillos para la variable motivos para visitar los Llanos orientales. Elaboración propia haciendo uso de Excel como herramienta. Paisaje 15% 15% Calor Humano 19% Gastronomía Descanso 12% Clima 14% Diversión 25% Gráficos estadísticos: guía práctica para estadística descriptiva· 17 por covid-19 en Colombia por estratos socia- les. Por ejemplo, en el estrato 1, a la fecha en las que se tomaron los datos de las bases de datos del ministerio de salud pública de Co- lombia, se observaban 16 910 personas en el estrato 1. La figura 8 permite comparar resul- tados; se observa, por ejemplo, que en los es- tratos 1, 2, y 3 es donde más se han presenta- do casos de mortalidad por la covid-19. Estos gráficos sencillos son ligeros de interpretación, son muy utilizados, ya que proponen la infor- mación de manera directa. TABLA 4 Tabla de frecuencias del número de fallecidos por la COVID-19 en Colombia discriminado por estratos sociales Estratos f h F H Estrato 1 16 910 32,9 % 16 910 32,9 % Estrato 2 18 863 36,7 % 35 773 69,6 % Estrato 3 12 078 24 % 47 851 93,1 % Estrato 4 2364 4,6 % 50 215 97,7 % Estrato 5 771 1,5 % 50 986 99,2 % Estrato 6 411 0,80 % 51 397 100,0 % Total 51 397 100,0 % Nota. Información suministrada por el dane (16 de octubre de 2020). La triste realidad reflejada en la figura 7 (que corresponde a una torta con frecuencias rela- tivas) evidencia que la mayoría de las muertes en Colombia son de personas que carecen de recursos económicos. Corresponde aquí rea- lizar otro tipo de gráficos que permitan evi- denciar la información desde otro punto de vista. Para ello, lo recomendable es reconstruir la tabla de frecuencias y proceder a la cons- trucción de otras representaciones; de esta manera, se presenta la tabla 4, correspondien- te a la tabla de frecuencias para la variable que relaciona el número de personas falleci- das en Colombia y discriminadas por estrato social (ver tabla 4). Diagrama de barras para variables numéricas enteras Un gráfico de barras o gráfico de columnas es una forma de representar gráficamente un conjunto de datos o valores mediante barras rectangulares de longitud proporcionala los valores representados; los valores represen- tados pueden ser frecuencias relativas o fre- cuencia absolutas. Su lectura es directa. En la figura 8, se evidencia el número de fallecidos Figura 7. Porcentaje de muertes por la covid-19 en Colombia por estratos sociales. Tomada de dane (16 de octubre de 2020). Estrato 4: 4,6% Estrato 5: 1,5% Estrato 6: 0,80% Estrato 1: 32,9% Estrato 2: 36,7% Estrato 3: 24% 18 · Generación de contenidos impresos Figura 8. Número de muertes por covid-19 en Colombia por estratos sociales. Tomado de dane (16 de octubre de 2020). Figura 9. Diagrama integral para el número de muertes por covid-19. Tomado de dane (16 de octubre de 2020). 16910 18863 12078 2364 771 411 Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6 16910 35773 47851 50215 50986 51397 Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6 Gráfico de diagramas integrales Se realizan con las frecuencias acumuladas y solo para variables numéricas, ya sean de tipo entero o de tipo continuo. Siguiendo el ejemplo anterior en la figura 9, se representa el diagra- ma integral para muertes por la covid-19 en Colombia determinado por estratos sociales. Las frecuencias acumuladas indican el número de muertes que se suman por estratos, por ejemplo, la lectura de estas figuras propone que el número de muertes acumulado hasta el estrato 3 que es de 47 851. En el proceso de registros de casos de contagio en Colombia, es este tipo de gráficos los que expresan la canti- dad de contagios que se registran en un periodo determinado. Gráficos estadísticos: guía práctica para estadística descriptiva· 19 tener a C constante a lo largo de toda la distri- bución de frecuencias, se calcula mediante la fórmula. C = (10) Si esta división es exacta, se procede, con la construcción de los intervalos y la tabla de frecuencias, en caso contrario se rediseña un nuevo rango; para ello, es necesario examinar si el producto de C*m excede al rango original y en cuánto excede. Esta diferencia propone la construcción del nuevo rango. El procedimiento es el siguiente y se muestra en la ecuación 11. 1. Si RNuevo = C*m > Rango 2. Se realiza la diferencia D = RNuevo – Rango 3. Ahora se construyen los límites del nuevo rango Xmin = Min – 1/D Xmax = Max + 1/D (11) Intervalos aparentemente nominales Son los intervalos utilizados en la clase que utilizamos, tal como resulta en el cálculo de la amplitud C. Ejemplo de aplicación En el informe diario de contagios por covid- 19 en Colombia, se registran a los pacientes que se recuperan en casa, en el hospital, en la uci o que fallecieron. A continuación, se propone la tabla 5 la cual contiene los datos con las edades de cien personas que se recu- peran de la enfermedad en los diferentes hos- pitales de Colombia. Tabla de frecuencias para datos continuos a través de intervalos Para determinar las frecuencias en datos con- tinuos, se deben seguir los siguientes pasos que involucran cálculos matemáticos y la uti- lización de algunas fórmulas de aproximación, como la del rango, número de intervalos me- diante la fórmula de Sturges y la amplitud de intervalo. Rango Es el dato calculado mediante la diferen- cia entre el dato máximo y mínimo, como se muestra en la ecuación 6. R = Xmax – Xmin (6) Número de intervalos Representado por la letra m y se define me- diante la fórmula denominada formula de Sturges, como se muestra en la ecuación 7. m = 1 + 3,3*log(n) (7) Donde n es el tamaño de la muestra. El número de intervalos no puede ser inferior a 5 ni supe- rior a 16, como se muestra en la ecuación 8. 5 ≤ m ≤ 16 (8) Algunos, sin embargo, utilizan la ecuación 9. m = (9) La aproximación de m se puede hacer por defecto o por exceso. Amplitud del intervalo La amplitud del intervalo determina la distan- cia que existe entre un dato y otro, se simboli- za por C; depende del criterio establecido para presentar la información, puede variar la am- plitud en cada intervalo, pero se recomienda √n Rango m 20 · Generación de contenidos impresos D = 70 – 68 = 2; esta diferencia propone la exis- tencia de un nuevo rango que tendrá como límites (ver ecuación 15). R- Nuevo Mínimo = Min – 1 = 24 – 1 = 23 Máximo = Max + 1 = 92 + 1 = 93 (15) El valor de la unidad que se ha restado al mínimo y sumado en el máximo está determi- nado por la diferencia de 2, el cual se reparte en forma equitativa sobre estos valores ex- tremos. Estos resultados indican que el nuevo rango empieza en 23 y termina en 93. De esta manera, se construirá la tabla de frecuencias con 7 intervalos, una longitud de 10 inicia en 23 y termina en 93 años. La tabla 6 de frecuencia, realizada en Excel, tiene el siguiente aspecto. TABLA 6 Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital Edades f h F H 23-33 13 13 % 13 13 % 33-43 10 10 % 23 23 % 43-53 11 11 % 34 34 % 53-63 25 25 % 59 59 % 63-73 13 13 % 72 72 % 73-83 21 21 % 93 93 % 83-93 7 7 % 100 100 % 100 1 Nota. Datos tomados del Ministerio de Salud de Colombia (2020). Gráficos para datos continuos organizados en intervalos de clase La tabla 7 corresponde a los cien pacientes con la covid-19 que se recuperan en algún hospi- tal de Colombia. A esta tabla se le ha agrega- do una nueva columna que corresponde a la TABLA 5 Edades de cien personas que se recuperan de la COVID-19 80 27 29 74 80 65 37 42 66 60 54 45 75 58 85 90 60 68 86 49 79 59 57 79 68 79 41 26 42 75 77 60 56 82 57 72 80 51 29 72 60 90 51 80 38 34 67 76 62 58 87 55 37 62 76 46 54 31 28 63 32 80 58 85 57 92 32 31 44 61 27 77 65 60 48 46 44 35 75 55 79 67 55 49 77 34 71 24 68 59 38 64 28 29 78 49 56 58 74 69 Nota. Elaboración propia. Se pide construir una tabla de frecuencia para estos datos, organizando intervalos. Para ello, el procedimiento es el siguiente: 1. Se calcula el rango, como se muestra en la ecuación 12. Rango = Xmax – Xmin = 92 – 24 = 68 (12) El rango indica que una persona de 92 años es la de mayor edad que se encuentra hospita- lizada y que la persona de menor edad en el hospital tiene 24 años. 2. Número de intervalos (ver ecuación 13) m = 1 + 3,3 * log(100) = 7,6 (13) Aquí, se pueden escoger 7 intervalos que co- rresponde a un redondeo por defecto o 8, si el redondeo es por exceso. Sin ajustarse a ninguna regla se escogerá el redondeo por defecto, entonces se tienen 7 intervalos. 3. Longitud del intervalo (ver ecuación 14) C = = = 9,71 ≈ 10 (14) En este caso, la aproximación se recomienda por exceso, por ejemplo, se la puede aproximar a 10. El producto C*m = 10 * 7 = 70 excede al Rango = 68 R 68 m 7 Gráficos estadísticos: guía práctica para estadística descriptiva· 21 Histograma El histograma es una figura propia de las va- riables continuas, cuya tabla se ha organizado en intervalos de clase. Sobre el eje horizontal se observan los intervalos de clase y sobre el eje vertical el valor de las frecuencias absolu- tas (figura 10). La lectura sobre el histograma es directa, cada caja representa el valor absoluto de las fre- cuencias, por ejemplo, para este caso 13 per- sonas entre 23 y 33 años, se encuentran re- cuperándose de la covid-19 en el hospital. El histograma es exclusivo de los datos numéri- cos continuos. Diagrama de tortas El diagrama de tortas es una de las gráficas que se usa para representar las frecuencias re- lativas, es común a todo tipo de variables, ya sean numéricas o categóricas. Al igual que en los datos enteros o categóricos, expresan el valor de la frecuencia relativa para cada uno de los elementos de la variable de estudio, en marca de clase de los intervalos. El concep- to de marca de clase correspondea la ubica- ción del centro de cada uno de los intervalos de clase. TABLA 7 Tabla de frecuencias de personas con la COVID-19 que se recuperan en el hospital Edades f h F H Xi 23-33 13 13 % 13 13 % 28 33-43 10 10 % 23 23 % 38 43-53 11 11 % 34 34 % 48 53-63 25 25 % 59 59 % 58 63-73 13 13 % 72 72 % 68 73-83 21 21 % 93 93 % 78 83-93 7 7 % 100 100 % 88 100 1 Nota. Datos tomados del Ministerio de Salud de Colombia (2020). Teniendo en cuenta la información registrada en la tabla 7, se construyen los siguientes tipos de graficas: histogramas, tortas, ojivas, y polí- gonos de frecuencias. 13 23___33 33___43 43___53 53___63 63___73 73___83 83___93 10 11 25 13 21 7 Figura 10. Histograma de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020). 22 · Generación de contenidos impresos Figura 11. Diagrama de tortas de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020). 83 ___ 93 7% 73 ___ 83 21% 23 ___ 33 13% 33 ___ 43 10% 43 ___ 53 11% 53 ___ 63 25% 63 ___ 73 13% Figura 12. Ojiva de personas con covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020). este caso representa las categorías o los inter- valos de clase, formadas con la variable edad, de las personas que se han hospitalizado a causa del contagio por covid-19 en Colombia (ver figura 11). Ojivas Las ojivas son gráficos exclusivos de los datos numéricos continuos que permiten visualizar el valor de las frecuencias acumuladas tanto absolutas como acumuladas. Para este gráfico, en el eje horizontal, se ubican los intervalos de clase; en el eje vertical, se leen las frecuencias absolutas acumuladas (figura 12). Como el salto de intervalo implica continuidad en sus valores, su lectura se hace con base en el valor acumulado de la frecuencia tomando como final el extremo superior del interva- lo. Por ejemplo, existen 34 personas con la covid19 que están recuperándose en el hospi- tal por debajo de los 53 años. 13 23___33 33___43 43___53 53___63 63___73 73___83 83___93 23 34 59 72 93 100 Gráficos estadísticos: guía práctica para estadística descriptiva· 23 ellos podemos nombrar a los boxplot, las pirá- mides poblacionales, los diagramas de Pareto y otros que no se abordarán en este documento. BOXPLOT Para Walker et al. (2018), el diagrama de caja es una herramienta eficaz de visualización de datos y útil en diversas aplicaciones y disci- plinas. Aunque existen métodos gráficos más sofisticados, el diagrama de caja sigue siendo relevante debido a su simplicidad, interpreta- bilidad y utilidad, incluso en la era del big data. Los boxplot se constituyen en gráficos para datos numéricos, generalmente, si agrupan tablas de frecuencias. Uno de los aspectos importantes que es posible visualizar en los boxplots son los datos atípicos (puntos outlaiers), los cuales suponen una es- pecial atención en el análisis de datos, ya que suponen limitaciones inherentes al tratar con datos de distribuciones sesgadas. Por ejemplo, en la figura 14, para el grupo de mujeres existen cuatro puntos outlaiers, que llaman la atención ya que corresponden a edades de niños que se encuentran hospitalizados por la covid-19 Polígonos de frecuencia El polígono de frecuencia es el gráfico estadísti- co creado partir de un histograma de frecuen- cia y las marcas de clase. Estos histogramas emplean columnas verticales para reflejar fre- cuencias: el polígono de frecuencia es realiza- do uniendo los puntos que reflejan las marcas de clase del intervalo y la frecuencia absoluta (ver figura 13). Visualmente, este gráfico identifica los puntos más altos y bajos de la distribución. Por ejemplo, en la figura 13, se puede evidenciar que las per- sonas entre 53 y 63 años representan el mayor número de hospitalizados por la covid-19. Asi- mismo, se puede determinar cómo el número de personas que tienen edades ente 83 y 93 es el grupo más pequeño en condiciones de hos- pitalización. Otras gráficas Existen otro tipo de gráficas que tienen que ver con los datos categóricos o con datos numéri- cos y que proponen mucha información, entre Figura 13. Polígono de frecuencias de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020). 13 23___33 33___43 43___53 53___63 63___73 73___83 83___93 10 11 25 13 21 7 24 · Generación de contenidos impresos PIRÁMIDES POBLACIONALES Las pirámides poblacionales han venido siendo usadas para representar la distribución de la población en diferentes eventos. En tiempos de la covid-19 se han vuelto muy comunes y han sido usadas para representar y comparar el número de contagios por sexo y por grupos etarios. Pacheco y Rosselli (2018) proponen el uso de estas figuras para hacer proyecciones demográficas, por ejemplo, la transición de- mográfica, y comparar la composición de la población en una región determinada. La figura 15 se refiere a la pirámide población por grupo etario y género de los contagios por la covid-19 en Colombia. Lo que propone la pi- rámide es una comparación de la forma como se contagian hombres y mujeres; en la mayoría de los intervalos de clase etaria, el problema del contagio es similar, en otros se observa un aumento ligero en los hombres, en síntesis, permite observar el equilibrio o desequilibrio que existe en la población femenina y masculi- na que se ha contagiado con la covid-19. Otros de los aspectos que permite visualizar los boxplots es la comparación de grupos; por ejemplo, en la figura 14 se observa cómo están los grupos por género de aquellas personas que se han contagiado por la covid-19 y que se encuentran hospitalizados. Por la construc- ción de las cajas, el grupo de hombres es más grande que el de mujeres; asimismo, se ob- servan que en el grupo de hombres existe un nutrido grupo de personas jóvenes que están en situación de hospitalización. Todas estas observaciones y otras son posibles a la luz de la construcción de estas figuras. Finalmente, estos gráficos permiten obser- var el valor de las medidas de tendencia central, de posición, de dispersión e, incluso, es posible analizar la asimetría y la normali- dad de los datos, asimismo, observar, valores mínimos máximos, rangos, entre otros. Todos estos elementos de información que propo- nen los boxplots suponen importancia esta- dística para el análisis de datos números o de pequeños grupos. Figura 14. Boxplot por género de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020). 101 81 61 41 21 1 Mujeres Hombres Gráficos estadísticos: guía práctica para estadística descriptiva· 25 TABLA 8 Tabla de Pareto de personas con la COVID-19 que se recuperan en el hospital Edades f h F H 53-63 25 25 % 59 25 % 73-83 21 21 % 93 46 % 23-33 13 13 % 13 59 % 63-73 13 13 % 72 72 % 43-53 11 11 % 34 83 % 33-43 10 10 % 23 93 % 83-93 7 7 % 100 100 % 100 1 Nota. Datos tomados del Ministerio de Salud de Colombia. En la tabla 7, se han preparado los datos para la realización de la gráfica de Pareto. Los inter- valos están dispuestos de acuerdo con el orden descendente de las frecuencias absolutas. La preparación de los datos supone la división de los grupos determinados en grupos críticos y poco críticos, lo cual se observa en la figura 16. Si da clic en el enlace, puede encontrar un video titulado “Pirámide poblacional en Excel | Tips y trucos en Excel”, que le servirá de guía para la construcción de una pirámide pobla- cional en Excel. DIAGRAMA DE PARETO Un diagrama de Pareto es una técnica gráfica simple para ordenar elementos, desde el más frecuente hasta el menos frecuente (en forma descendente), basándose en el principio de Pareto. En el caso que aquí se expone (ver tabla 8), se trata de observar el grupo etario de mayorescasos de contagio por edades, a los que se los puede dividir en dos grupos: críti- cos y poco críticos. La proporción de los grupos críticos para Pareto resulta ser de aproxima- damente un 20 % para los “pocos críticos” de un 80 %. Este 20 % serán los grupos etarios res- ponsables de la mayor parte del efecto que se produce en casos de hospitalización por la covid-19 en Colombia. Figura 15. Pirámide poblacional por género de personas con la COVID-19 en Colombia. Adaptado del Boletín Epidemiológico COVID-19, por la Subred Integrada de Servicios de Salud. (2020). > 90 80 __ 89 70 __ 79 60 __ 69 50 __ 59 40 __ 49 30 __ 39 20 __ 29 10 __ 19 0 __ 9 6546 32713 69566 7049 30379 64592 134421 124829 211638 196535 249174 231393 341887 317490 322530 299514 103220 95355 49408 45882 400000 4000000300000 300000200000 200000100000 100000 Hombres Mujeres https://www.youtube.com/watch?v=5plXrUsvJwA https://www.youtube.com/watch?v=5plXrUsvJwA 26 · Generación de contenidos impresos lleguen al hospital producto del contagio por la covid-19. Una lectura de la figura nos propone que el 72 % está generado por cuatro causas princi- pales, determinados por los grupos etarios de 53-63; 73-83; 23-83; 63-73. Una recomendación a la luz de estos resultados propondría hacer una revisión sobre estos grupos etarios, ya que aquí se concentra la mayoría de las personas con la covid-19 en el hospital. Si da clic en el siguiente enlace, podrá encontrar un video titulado “¿Cómo hacer un diagrama de Pareto en Excel 2016?”, que le servirá de guía para la construcción de los diagramas de Pareto. Para obtener la figura 16, los datos tienen que estar ordenados de mayor a menor. Las causas en el eje x, sobre el eje y izquierdo, se dispo- nen los valores de la frecuencia absoluta acu- mulada; sobre el lado derecho, se observan los valores de la frecuencia relativa acumulada. De acuerdo con lo dispuesto por Pareto, el 80 % de las consecuencias es producto del 20 % de las causas. El grafico identifica el 80 %; como este valor se observa sobre las frecuencias acumuladas, para el caso que se observa el valor cercano corresponde al 72 %, en el cual se concentrará el esfuerzo de grupo etario por disminuir el número de personas que Figura 16. Diagrama de Pareto de personas con la covid-19 que se recuperan en el hospital. Datos tomados del Ministerio de Salud de Colombia. 100 90 80 70 60 50 40 30 20 10 0 Pe rs on as c on C OV ID -1 9 qu e se re cu pe ra n en e l h os pi ta l Rango de edades de personas con COVID-19 que se recuperan en el hospital 53 __63 73 __83 23 __33 63 __73 43 __53 33 __43 83 __93 Po rc en ta je A cu m ul ad o 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 25% 46% 59% 72% 83% 93% 100% 25 21 13 13 11 10 7 https://www.youtube.com/watch?v=X13qrE8AoaQ&t=460s https://www.youtube.com/watch?v=X13qrE8AoaQ&t=460s Gráficos estadísticos: guía práctica para estadística descriptiva· 27 Aquí: 1. Primaria 2. Secundaria 3. Técnica 4. Universidad 5. Posgrado Elabore para datos categóricos, la tabla de fre- cuencias y los respectivos gráficos, acordes con este tipo de variables. Haga uso de Excel para la construcción de las tablas y de sus res- pectivos gráficos. Ejercicio n.° 2 Cuestionario, por niveles taxonómicos de solo, con lectura de gráficos estadísticos. Con el propósito de fortalecer la lectura y la comprensión de los gráficos estadísticos se hace uso de la taxonomía solo en sus cuatro niveles. Con respecto a esta taxonomía Biggs y Collis (1982) observaron que, “en la progre- sión desde la incompetencia hasta la maes- tría, los estudiantes muestran una secuencia consistente, o ciclo de aprendizaje, que es ge- neralizable a una gran variedad de tareas y en particular a las tareas escolares”. Esta se- cuencia se refiere a un progreso jerárquico en la complejidad estructural de sus respuestas, cualquiera que sea el modo de funcionar o modo de representación, en el que se exprese el aprendizaje. Lo anterior supone que el proceso de indagar partirá de posiciones sen- cillas para llegar a propuestas complejas en las que se evidencia el grado de aprendizaje en los estudiantes (Biggs y Collis, 1991). En las siguientes preguntas. Según la figura 1 que muestra los asesinatos ocurridos a líderes sociales, responda: EJERCICIOS DE APLICACIÓN Ejercicio n.° 1 En una encuesta aplicada a microempresarios de la ciudad de Villavicencio se desea indagar sobre su formación. Se realizó la encuesta con 150 microempresarios. Los resultados fueron los siguientes: 4 3 2 4 4 2 2 4 2 4 4 4 3 2 4 3 2 4 3 4 2 3 4 4 4 2 1 3 3 3 2 4 2 3 4 3 4 3 4 4 2 4 4 4 4 4 3 3 3 4 3 3 3 4 4 4 4 2 3 3 4 3 3 3 4 3 5 4 4 4 4 2 3 4 4 4 3 3 3 3 2 2 3 4 4 4 3 4 2 4 1 3 3 4 3 4 5 4 3 4 4 4 4 4 3 4 3 3 4 4 4 3 3 3 4 4 4 4 2 3 4 5 2 4 4 3 4 3 4 4 4 3 2 3 2 4 4 2 4 4 4 4 4 4 2 4 3 4 3 3 28 · Generación de contenidos impresos desconfianza de pueblo en torno al se- guimiento y la aplicación de la justicia. C. La excesiva manifestaciòn de asesina- tos ocurridos a lo largo de un año (2017 y 2018) implica que hubo un mayor de- sarrollo de estrategias en contra la de- lincuencia, lo que provoca disminución de los casos refejados en año siguiente (2018-2019). D. El registro y analisis de asesinatos en un periodo de un año y el aumento de los pro- blemas de la delincuencia dilatan la apli- cación de estrategias para su prevención. De acuerdo con la información evidenciada en la figura 17, responda las siguientes preguntas: De acuerdo con la gráfica del comparativo del mes de junio, responda: 5. La deforestación por km2 para el 2017 es A. 600. B. 1000. C. 200. D. 6000. 6. Para el 2016 y 2019 la deforestación por km2 está entre A. 200 y 400. B. 200 y 1000. C. 800 y 1000. D. 400 y 600. 7. Al analizar la deforestación comparati- va por años de agosto a junio por km2 se puede afirmar que A. Durante el gobierno de Bolsonaro hubo más de 3000 km2 reportados en defores- tación y degradación. 1. Entre el 7 de agosto del 2016 y el 9 de julio del 2017 ocurrieron: A. 69 asesinatos. B. 80 asesinatos. C. 105 asesinatos. D. 10 asesinatos. 2. Fueron asesinados 105 lideres sociales entre A. El de 10 de julio del 2017 y el 6 de agosto del 2017. B. El 7 de agosto del 2017 y el 9 de julio del 2018. C. El 10 de julio del 2018 y el 6 de agosto del 2018. D. El 1 de agosto del 2016 y el 9 de julio del 2019. 3. El mayor aumento de asesinatos es A. 37 correspondiente a la diferencia de ase- sinatos ocurridos entre el 7 de agosto del 2016 y el 9 de julio del 2018. B. 1 representa el aumento de asesinatos entre el 7 de agosto del 2016 y el 9 de julio del 2019. C. 5 son los asesinatos ocurridos entre el 10 de julio del 2018 y el 6 de agosto del 2018. D. 100 corresponde a los asesinatos entre el 6 de agosto del 2017 al 9 de agosto del 2018. 4. Según los asesinatos ocurridos a líderes so- ciales ocurridos entre enero del 2016 y julio del 2019 se infiere que: A. La disminución de los asesinatos durante julio y agosto del 2017 obedece al aumento de los casos ocurridos en el año imediata- mente anterior. B. El aumento de asesinatos ocurridos entre agosto del 2017 y julio del 2018 provocan Gráficos estadísticos: guía práctica para estadística descriptiva· 29 Figura 17. Radiografía de la deforestación en el Amazonas brasileño (junio del 2019). Tomado de Pasquali (2020), a partir de efe, cifras de deter e inpe y adaptación infográfica etc. Deforestación Comparativo mes de junio REPUNTA LA DEFORESTACIÓN Comparativo por años (agosto a junio. Km2) Gobierno Bolsonaro 3.000 km2 4.638,7 4.181,5 3.975,5 4.574,9 446,56 193,28 153,55 1.025,58 577,25 228,44 Deforestación y degradación Top 3 por estados Top 3 por estados Pará Amazonas Mato grosso km2 1.000 800 600 400 200 0 2016 2017 2018 2019 2016 2017 2018 2019 Matogrosso Pará Amazonas 920,21 km2 2.072 km2 B. Para el 2019 la deforestación disminuyó notablemente. C. Para el 2019 se presentó la cifra más alta en deforestación y degradación. D. Año tras años la cifra de deforestación y degradación disminuye gradualmente. 8. La deforestación y la degradación de la amazonia brasilera determina: A. Una alta deforestación en los años 2016 y 2019 producto de la falta de compro- miso del Gobierno con el medio ambien- te, falta de control de los incendios arti- ficiales y la consistente demanda de las empresas productoras de madera. B. Un decrecimiento mínimo en la defores- tación para el 2019 con respecto al 2016 lo que sugiere una falta de compromi- so del Gobierno actual por controlar las causas de este. C. La deforestación para el 2018 representa la más baja deforestación lo cual implica que hubo un mayor control en las políti- cas de reserva ambiental. D. Los altibajos en deforestación por kiló- metro cuadrado en comparación con junio, en el cual el 2016 y 2019 ocupan el primer lugar y el 2017 y 2018 el segundo con más bajos índices de deforestación. En el 2012, las emisiones totales de Colom- bia ascienden a 178 000 Gg CO², la distribución sectorial de emisiones de Gases Efecto de In- vernadero se representa en la figura 18. 30 · Generación de contenidos impresos C. i y iv solamente. D. y iii solamente. 10. Sabiendo que la producción total de emisión de gei en Colombia ascienden a 178 000 Gg CO², cuantos miles de Gg CO² debe dismi- nuir el sector agricultura, silvicultura y otros usos de la tierra (afolu) para que su porcentaje descienda a un 40 %: A. 14 000,24 Gg CO² B. 71 000,2 Gg CO² C. 76 000,54 Gg CO² D. 5000,34 mil Gg CO² Teniendo en cuenta la información dada en la figura 18, ¿cuál de las siguientes afirmaciones son verdaderas? A. El sector que genera mayor contamina- ción es el sector energético. B. El sector agricultura, silvicultura y otros usos de la tierra (afolu) generan más del 50 % de las emisiones de gei del país. C. Los sectores energía y procesos indus- triales y uso de productos generan más del 50 % de las emisiones de gei del país. 9. Los sectores energía y residuos generan más del 50 % de las emisiones de gei del país: A. solamente. B. solamente. Figura 18. Emisiones GEI de Colombia en el 2012. Tomado de Inventario Nacional de Gases de Efecto Invernadero (2012). Residuos 8% 44%43% 5% Energía Agricultura, silvicultura y otros usos de la tierra (AFOLU) Procesos industriales y usos de productos Gráficos estadísticos: guía práctica para estadística descriptiva· 31 In te rv al os L- Cr iti ca M at em át ic as C- Na tu ra le s C- Ci ud ad an as 26-34,5 34,5-43 43-51,5 51,5-60 60-68,5 68,5-77 Total Ejercicio n.° 4 Para los datos no organizados de la prueba saber, construya los Boxplot y establezca com- paraciones entre las asignaturas que se pre- sentan en la tabla. Ejercicio n.° 5 Para los valores obtenidos en las asignaturas de L-Critica y Matemáticas, elabore una pirá- mide de resultados y establezca algunas com- paraciones. Ejercicio n.° 6 Al parecer, los resultados de la prueba de lectura crítica están relacionados con la canti- dad de libros leídos por un estudiante. A partir de los datos obtenidos en la siguiente tabla, dibuje un diagrama de Pareto. Concluya con respecto a las variables de lectura. Variables de lectura Intervalos Promedios No leen 0 50 Leen poco 0-10 51 Lectura mediana 11-25 56 Bastante lectura 26-100 56,2 Mucha lectura >10 58 Ejercicio n.° 3 A continuación, se proponen algunos datos obtenidos en las pruebas saber-2019. L-Critica Matemáticas C-Naturales C-Ciudadanas 47 48 37 30 60 65 54 59 66 57 41 74 62 54 61 73 63 57 55 57 49 29 41 41 76 70 70 68 57 65 63 66 62 62 66 39 68 66 63 77 42 40 28 39 38 31 41 26 64 56 59 60 52 66 54 52 54 49 40 33 52 55 61 50 63 68 54 69 48 54 58 50 52 55 49 32 61 38 44 45 55 64 57 57 57 51 45 38 58 57 49 42 34 39 38 28 48 71 61 55 75 73 59 75 53 56 54 55 53 48 43 46 40 43 39 39 69 57 63 61 49 55 31 31 59 51 51 45 65 64 54 62 55 55 50 45 56 51 49 51 Para los datos propuestos, obtenga el valor de las frecuencias absolutas, relativas y acu- muladas, propuestas desde la siguiente tabla. Elabore histogramas para matemáticas y L-Crítica, Ojivas para C-naturales y diagramas circulares para C-ciudadanas. Realice lecturas para algunas graficas. 32 · Generación de contenidos impresos REFERENCIAS Batanero, C. y Díaz, C. (2011). Estadística con proyectos. Universidad de Granada. Castellanos. M. T. y Obando J. (2013). Análisis y sistemas de datos poderoso escenario de aprendizaje cultural. Revista Científica, 2(54), 504-508. Contreras, A., Cárdenas, C., González, J., Toloza, S., Zambrano, L. y Pulido-Rojan, A. (2019). Herramientas estadísti- cas para la mejora del control de inventarios: un caso de estudio. Investigación y Desarrollo en tic, 10(1), 13-24. Consejería Presidencial de los Derechos Humanos. (2019). Informe sobre el balance de las acciones y estrategias ade- lantadas en el marco de la protección de los líderes, lideresas sociales y defensores de derechos humanos. Consejería Presidencial de los Derechos Humanos. http://www.derechoshumanos.gov.co/Prensa/2019/Documents/ INFORME%20LDDH%20ACTUALIZADO%2017%20DE%20JULIO_V2.pdf Departamento Administrativo Nacional de Estadística. (dane). (2020). Boletín técnico. Estadísticas vitales – eevv. Defunciones por covid-19. 2 de marzo al 4 de octubre de 2020pr. dane. https://www.dane.gov.co/files/investiga- ciones/poblacion/defunciones-covid19/boletin-defunciones-covid-2020-02mar-04oct.pdf Ingeniería Industrial Easy. (2017, 11 de marzo). Cómo hacer un diagrama de Pareto en Excel 2016. [Video de You- Tube]. https://bit.ly/38TKbou Instituto Nacional de Salud. (ins). (2020). covid-19 en Colombia. Instituto Nacional de Salud. https://www.ins. gov.co/Noticias/Paginas/coronavirus-casos.aspx Inventario Nacional de Gases de Efecto Invernadero. (gei). (2012). Tercera Comunicación Nacional de Cambio Cli- mático. Programa de las Naciones Unidas para el Desarrollo (pnud). http://documentacion.ideam.gov.co/ openbiblio/bvirtual/023421/cartilla_INGEI.pdf Microsoft Excel a Todo Nivel. (2016, 1 de agosto). Pirámide poblacional en Excel | Tips y trucos en Excel. [Video de YouTube]. https://bit.ly/3nf0Nzh Pasquali, M. (2020). La deforestación en la Amazonia brasileña alcanza su nivel más alto en una década. Sta- tista. https://es.statista.com/grafico/16328/deforestacion-estimada-en-la-amazonia-brasilena/ Polanía, M. J., Pacheco, B. y Rosselli, D. (2018). El uso de pirámides poblacionales como representación gráfica del sistema de salud colombiano. Archivos de Medicina (Manizales), 18(1), 127-133. Ross, S. M. (2018). Introducción a la estadística. Reverté. Subred Integrada de Servicios de Salud. (2020, 26 de agosto). Boletín Epidemiológico covid-19. Datos Abiertos Bogo- tá. https://datosabiertos.bogota.gov.co/dataset/9de30caa-a772-4fc9-9d8c-6baf0cd5078f/resource/cdecb5cf- 6f63-46b1-bc4a-70d95b6394b4/download/boletin-epidemiologico.pdf Walker, M. L., Dovoedo, Y. H., Chakraborti, S. y Hilton, C. W. (2018). Un diagrama de caja mejorado para datos univariados. The American Statistician, 72(4), 348-353. http://www.derechoshumanos.gov.co/Prensa/2019/Documents/INFORME LDDH ACTUALIZADO 17 DE JULIO_V2.pdf http://www.derechoshumanos.gov.co/Prensa/2019/Documents/INFORME LDDH ACTUALIZADO 17 DE JULIO_V2.pdf https://www.dane.gov.co/files/investigaciones/poblacion/defunciones-covid19/boletin-defunciones-covid-2020-02mar-04oct.pdf https://www.dane.gov.co/files/investigaciones/poblacion/defunciones-covid19/boletin-defunciones-covid-2020-02mar-04oct.pdf https://www.youtube.com/channel/UCsisI-iyyCmaPlKxC41j4-w https://bit.ly/38TKbou https://www.ins.gov.co/Noticias/Paginas/coronavirus-casos.aspx https://www.ins.gov.co/Noticias/Paginas/coronavirus-casos.aspxhttp://documentacion.ideam.gov.co/openbiblio/bvirtual/023421/cartilla_INGEI.pdf http://documentacion.ideam.gov.co/openbiblio/bvirtual/023421/cartilla_INGEI.pdf https://es.statista.com/grafico/16328/deforestacion-estimada-en-la-amazonia-brasilena/ https://datosabiertos.bogota.gov.co/dataset/9de30caa-a772-4fc9-9d8c-6baf0cd5078f/resource/cdecb5cf-6f63-46b1-bc4a-70d95b6394b4/download/boletin-epidemiologico.pdf https://datosabiertos.bogota.gov.co/dataset/9de30caa-a772-4fc9-9d8c-6baf0cd5078f/resource/cdecb5cf-6f63-46b1-bc4a-70d95b6394b4/download/boletin-epidemiologico.pdf