Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Universidad Abierta y a Distancia de México Carrera: Lic. Nutrición Aplicada Asignatura: Estadística Básica Grupo: NA-NEBA-1902-B1-007 Unidad: 3 Actividad: Evidencia de aprendizaje. Reporte estadístico. Docente: Sergio Elías Castañón Navarro Alumno: Andrés Pérez Licona Matricula: ES1921015525 Fecha de Entrega: 01 / Septiembre / 2019 Índice Índice 2 Introducción 3 Desarrollo 4 Conclusiones 13 Fuentes 14 Introducción Las Tablas de Frecuencias son herramientas de Estadística donde se colocan los datos en columnas representando los distintos valores recogidos en la muestra y las frecuencias (las veces) en que ocurren. Un Histograma es la representación gráfica de una tabla de frecuencias. El histograma puede ser: de frecuencias absolutas, de frecuencias relativas, de frecuencias absolutas acumuladas y de frecuencias relativas acumuladas. Más profundamente, el histograma de frecuencias es una representación visual de los datos en donde se evidencian fundamentalmente tres características: forma, acumulación o tendencia posicional y dispersión o variabilidad. Un Polígono de Frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de frecuencia. Los histogramas emplean columnas verticales para reflejar las frecuencias, los polígonos de frecuencia se forman uniendo los puntos más altos de cada una de las columnas del Histograma. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. La dispersión es importante porque: Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas. Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes. Desarrollo 1. Desarrollar un modelo propuesto por el alumno en Nutrición aplicada. La siguiente tabla corresponde a una base de datos de INEGI en la cual se establece la tasa de mortalidad por diabetes mellitus por Entidad Federativa en el año 2013. Base de Datos: Entidad Porcentaje Entidad Porcentaje Entidad Porcentaje Entidad Porcentaje Aguascalientes 57 CDMX 85 Morelos 83 Sinaloa 49 Baja California 54 Durango 58 Nayarit 46 Sonora 59 B. C. sur 43 Guanajuato 81 Nuevo León 58 Tabasco 82 Campeche 62 Guerrero 63 Oaxaca 67 Tamaulipas 69 Coahuila 49 Hidalgo 63 Puebla 86 Tlaxcala 90 Colima 59 Jalisco 69 Querétaro 57 Veracruz 91 Chiapas 75 Estado de México 73 Quintana Roo 44 Yucatán 60 Chihuahua 78 Michoacán 82 San Luis Potosí 65 Zacatecas 65 Fuente: INEGI/SS Estadísticas vitales. Defunciones generales 2000 y 2013. CONAPO Proyecciones de población 1990-2030 Población: Se realizó un estudio a hombres y mujeres por Entidad Federativa que murieron por la Diabetes Mellitus en el año del 2013 Tabla de Frecuencias: Datos obtenidos de la variable Frecuencia Frecuencia acumulada Frecuencia relativa Frecuencia relativa acumulada Distribución de porcentajes Distribución de porcentajes acumulados 43-52 5 5 0.15625 0.15625 15.63% 15.63% 53-62 9 14 0.28125 0.4375 28.13% 43.75% 63-72 7 21 0.21875 0.65625 21.88% 65.63% 73-82 6 27 0.1875 0.84375 18.75% 84.38% 83-92 5 32 0.15625 1 15.63% 100% 32 1 100% Solución: Para poder hacer la tabla de frecuencias, para empezar realicé la actividad en Excel, ordené de menor a mayor todos los números, con la fórmula de “Frecuencia”, se seleccionaron los datos que serían desde el número 43 hasta el 91, para que posteriormente se seleccionara el grupo (que sería del 43 al 92) pero solamente se tomo la primera, esto quiere decir que no se repitió el numero, con los datos obtenidos de la Frecuencia, se sumaron, esto con el fin de que cada clase correspondiera al dato, ya que la primera clase fue de 43-52 y posteriormente fue aumentando de 9 en 9 para llegar al resultado deseado. Sucesivamente, con los demás datos de la tabla de la Frecuencias acumulada, Frecuencia relativa, Frecuencia relativa acumulada con las formulas de Excel se obtuvieron los datos correspondientes a cada fila y así hasta llegar al fin con los porcentajes de la Distribución de porcentajes y la Distribución de porcentajes acumulados. Gráfica de Histograma de Frecuencias y Polígono de Datos: Proceso de Construcción: Es similar al de la construcción del histograma hasta el número 3 agregando los siguientes pasos: - Marcar los puntos de intersección de cada punto medio de clase con su frecuencia respectiva - Unir con segmentos, en forma consecutiva, los puntos de intersección incluyendo el punto medio de la clase anterior a la primera y el punto medio de la clase posterior a la última. Para poder realizar la gráfica de Histograma y Polígono de Frecuencia, tomé los datos de la tabla de frecuencias, que es el porcentaje de mortalidad por diabetes mellitus por estado en toda la República Mexicana, para empezar ordené los datos agrupados de la variable, empecé por organizarlos de menor a mayor, tomando como primer intervalo fue de 43-52 y fue subiendo de 9 en 9 hasta poder llegar al 83-92, ya que los datos que venían en la tabla no rebasaban del numero 91. Como podemos observar en la gráfica de la clase 43-52 se obtuvo una Frecuencia absoluta de 5, para la clase de 53-62 ascendió notablemente con una Frecuencia de 9, para el siguiente intervalo de 63-72 podemos observar que hubo un descenso en la Frecuencia, ya que se obtuvo un total de 7, posteriormente en la clase 73-82 igualmente observamos un pequeño descenso, ya que bajo a una Frecuencia de 6, finalmente observamos que para la clase 83-92 la Frecuencia bajó nuevamente, ya que en total se obtuvo una Frecuencia de 5. Podemos decir que en total fueron 32 datos obtenidos de la tabla de frecuencias. Medidas de Tensión y Dispersión: Personas (muertas por Diabetes) Frecuencia Absoluta (fi) MC (xi) fi * MC fa (xi - ẋ) (xi - ẋ)2 (xi - ẋ)2 . fi 43-52 5 47.50 237.50 5 -19.062 363.3789063 1816.894532 53-62 9 57.50 517.50 14 -9.062 82.12890625 739.1601563 63-72 7 67.50 472.50 21 0.937 0.87890625 6.15234375 73-82 6 77.50 465.00 27 10.937 119.6289063 717.7734378 83-92 5 87.50 437.50 32 20.937 438.3789063 2191.894532 Totales 32 2130 5471.875 a) ¿Cuál es el promedio de las personas con mortalidad en diabetes mellitus en toda la República Mexicana? Fórmula para sacar el Promedio: Respuesta: El promedio es 66.562. b) ¿Cuál es la Moda? Fórmula Moda: Respuesta: La Moda es 59.000. c) ¿Cuál es la Mediana? Fórmula Mediana: Respuesta: La Mediana es 65.571. d) ¿Cuál es la Varianza poblacional y muestral? Promedio: 66.5625 Personas (muertas por Diabetes) Frecuencia Absoluta (fi) MC (xi) fi * MC fa (xi - ẋ) (xi - ẋ)2 (xi - ẋ)2 . fi 43-52 5 47.50 237.50 5 -19.062 363.3789063 1816.894532 53-62 9 57.50 517.50 14 -9.062 82.12890625 739.1601563 63-72 7 67.50 472.50 21 0.937 0.87890625 6.15234375 73-82 6 77.50 465.00 27 10.937 119.6289063717.7734378 83-92 5 87.50 437.50 32 20.937 438.3789063 2191.894532 Totales 32 2130 5471.875 Fórmula Varianza Poblacional: Fórmula Varianza Muestral: Respuesta: El resultado para la Variación Poblacional es 170.9962. El resultado para la Variación Muestral es 176.5122. e) ¿Cuál es la desviación poblacional y muestral? Fórmula Desviación Poblacional: Fórmula Desviación Poblacional: Respuesta: El resultado de Desviación Poblacional es 13.076. El resultado de Desviación Muestral es 13.285. Justifique su planteamiento y finalidad de estudio. Quisiera dar a conocer el porcentaje de las muertes que ocurrieron en el año 2013 debido a la enfermedad llamada Diabetes Mellitus, posteriormente plantear medidas que puedan ayudar a disminuir el índice de mortalidad en la población, enfocado principalmente desde el punto de vista de la Nutrición Aplicada. Lamentablemente a lo largo de los años transcurridos desde el año 2013 ha ido en aumento las muertes por este tipo de enfermedad, esto se debe a la escasa información que tiene la población e igualmente los malos hábitos alimenticios con grandes porcentajes de azucares y no tienen una dieta adecuada para cada tipo de persona. La finalidad del estudio es dar a conocer las muertes que se dieron en el año 2013 en la República Mexicana y para que en los años posteriores al año actual que es 2019 se tengan otras estrategias para disminuir el índice de muertes en las personas tanto como hombres y mujeres. Conclusiones La Tabla de Frecuencias agrupadas se emplea generalmente si las variables toman un número grande de valores o la variable es continua. En este caso se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento de la muestra debe pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase. El Histograma representa la frecuencia relativa mediante la superficie de las barras. Aunque esto sea cierto en todos los histogramas, cuando se agrupan los datos en intervalos desiguales hay que atender a la superficie de las barras, que no se corresponderá con la altura. Para su elaboración debe introducirse el concepto de altura de histograma, que es un concepto equivalente al de densidad de probabilidad, y que se calcula dividiendo la frecuencia relativa de ese intervalo (o sea la superficie que queremos darle) entre la anchura del intervalo (la base del rectángulo). Ahora las barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas esas superficies (de todas las barras) será 1, o sea el 100%. Se conoce como Polígonos de Frecuencia para datos agrupados a aquellos que se desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las distintas columnas del histograma. En el momento de la representación de todas las frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladas que posibilita la diagramación del polígono correspondiente. Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación nos indican si esos datos están próximos entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de dispersión nos permiten apreciar la distancia que existe entre los datos a un cierto valor central e identificar la concentración de los mismos en un cierto sector de la distribución, es decir, permiten estimar cuán dispersas están dos o más distribuciones de datos. Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo la media aritmética el dato central más utilizado. Cuando existe una dispersión pequeña se dice que los datos están dispersos o acumulados cercanamente respecto a un valor central, en este caso el dato central es un valor muy representativo. En el caso que la dispersión sea grande el valor central no es muy confiable. Fuentes Subsecretaría de Integración y Desarrollo del Sector Salud Dirección General de Evaluación del Desempeño. (2015). Informe sobre la salud de los mexicanos. 31 de Agosto del 2019, de Subsecretaría de Integración y Desarrollo del Sector Salud Dirección General de Evaluación del Desempeño Sitio web: https://www.gob.mx/cms/uploads/attachment/file/64176/INFORME_LA_SALUD_DE_LOS_MEXICANOS_2015_S.pdf Aldanalisis. (2014). Histogramas, Polígonos de Frecuencia y Ojivas. 31 de Agosto del 2019, de Aldanalisis Sitio web: http://aldanalisis.blogspot.com/2014/04/histogramas-poligonos-de-frecuencia-y.html Colaboradores de Wikipedia. (2019). Histograma. 31 de Agosto del 2019, de Wikipedia, La enciclopedia libre Sitio web: https://es.wikipedia.org/wiki/Histograma Julián Pérez Porto y María Merino. (2009). Definición de polígono de frecuencia. 31 de Agosto del 2019, de Definicion.de Sitio web: https://definicion.de/poligono-de-frecuencia/ Universo Formulas. (s.f.). Tabla de Frecuencias. 31 de Agosto del 2019, de Universo Formulas Sitio web: https://www.universoformulas.com/estadistica/descriptiva/tabla-frecuencias/ Juan Christian Mercado Alvarado. (2011). MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION. 01 de Septiembre del 2019, de Eduteka Sitio web: http://eduteka.icesi.edu.co/proyectos.php/1/3053 Sites.google.com. (s.f.). Unidad 3: Medidas de Tendencia Central y de Dispersión. 01 de Septiembre del 2019, de Sites.google.com Sitio web: https://sites.google.com/site/estadisticalfrecuencia/e/fgdfgdf Alex. (2017). Varianza, Desviación Estándar y Coeficiente de Variación | Datos agrupados en intervalos. 01 de Septiembre del 2019, de Youtube.com Sitio web: https://www.youtube.com/watch?v=1myBo87lYyU Alex. (2017). Media, mediana y moda | Datos agrupados en intervalos Ejemplo 1. 01 de Septiembre del 2019, de Youtube.com Sitio web: https://www.youtube.com/watch?v=5bZXpfxwHqk Histograma de Frecuencias 43-52 53-62 63-72 73-82 83-92 5 9 7 6 5 Poligono de Frecuencia 5 9 7 6 5 14
Compartir