Logo Studenta

EBA_EA_U3_ANPL - Andrés Licona

¡Este material tiene más páginas!

Vista previa del material en texto

Universidad Abierta y a Distancia de México
Carrera: Lic. Nutrición Aplicada
Asignatura: Estadística Básica
Grupo: NA-NEBA-1902-B1-007
Unidad: 3
Actividad: Evidencia de aprendizaje. Reporte estadístico.
Docente: Sergio Elías Castañón Navarro
Alumno: Andrés Pérez Licona
Matricula: ES1921015525
 
Fecha de Entrega: 01 / Septiembre / 2019
 
Índice
Índice	2
Introducción	3
Desarrollo	4
Conclusiones	13
Fuentes	14
 
Introducción
Las Tablas de Frecuencias son herramientas de Estadística donde se colocan los datos en columnas representando los distintos valores recogidos en la muestra y las frecuencias (las veces) en que ocurren.
Un Histograma es la representación gráfica de una tabla de frecuencias. 
El histograma puede ser: de frecuencias absolutas, de frecuencias relativas, de frecuencias absolutas acumuladas y de frecuencias relativas acumuladas.
Más profundamente, el histograma de frecuencias es una representación visual de los datos en donde se evidencian fundamentalmente tres características: forma, acumulación o tendencia posicional y dispersión o variabilidad.
Un Polígono de Frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de frecuencia. Los histogramas emplean columnas verticales para reflejar las frecuencias, los polígonos de frecuencia se forman uniendo los puntos más altos de cada una de las columnas del Histograma.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.
Desarrollo
1. Desarrollar un modelo propuesto por el alumno en Nutrición aplicada.
La siguiente tabla corresponde a una base de datos de INEGI en la cual se establece la tasa de mortalidad por diabetes mellitus por Entidad Federativa en el año 2013.
Base de Datos:
	Entidad
	Porcentaje
	Entidad
	Porcentaje
	Entidad
	Porcentaje
	Entidad
	Porcentaje
	Aguascalientes
	57
	CDMX
	85
	Morelos
	83
	Sinaloa
	49
	Baja California
	54
	Durango
	58
	Nayarit
	46
	Sonora
	59
	B. C. sur
	43
	Guanajuato
	81
	Nuevo León
	58
	Tabasco
	82
	Campeche
	62
	Guerrero
	63
	Oaxaca
	67
	Tamaulipas
	69
	Coahuila
	49
	Hidalgo
	63
	Puebla
	86
	Tlaxcala
	90
	Colima
	59
	Jalisco
	69
	Querétaro
	57
	Veracruz
	91
	Chiapas
	75
	Estado de México
	73
	Quintana Roo
	44
	Yucatán
	60
	 Chihuahua
	78
	Michoacán
	82
	San Luis Potosí
	65
	Zacatecas
	65
Fuente: INEGI/SS Estadísticas vitales. Defunciones generales 2000 y 2013. CONAPO Proyecciones de población 1990-2030
Población: Se realizó un estudio a hombres y mujeres por Entidad Federativa que murieron por la Diabetes Mellitus en el año del 2013
Tabla de Frecuencias:
	Datos obtenidos de la variable
	Frecuencia 
	Frecuencia acumulada
	Frecuencia relativa
	Frecuencia relativa acumulada 
	Distribución de porcentajes 
	Distribución de porcentajes acumulados
	43-52
	5
	5
	0.15625
	0.15625
	15.63%
	15.63%
	53-62
	9
	14
	0.28125
	0.4375
	28.13%
	43.75%
	63-72
	7
	21
	0.21875
	0.65625
	21.88%
	65.63%
	73-82
	6
	27
	0.1875
	0.84375
	18.75%
	84.38%
	83-92
	5
	32
	0.15625
	1
	15.63%
	100%
	
	32
	
	1
	
	100%
	
Solución:
Para poder hacer la tabla de frecuencias, para empezar realicé la actividad en Excel, ordené de menor a mayor todos los números, con la fórmula de “Frecuencia”, se seleccionaron los datos que serían desde el número 43 hasta el 91, para que posteriormente se seleccionara el grupo (que sería del 43 al 92) pero solamente se tomo la primera, esto quiere decir que no se repitió el numero, con los datos obtenidos de la Frecuencia, se sumaron, esto con el fin de que cada clase correspondiera al dato, ya que la primera clase fue de 43-52 y posteriormente fue aumentando de 9 en 9 para llegar al resultado deseado. 
Sucesivamente, con los demás datos de la tabla de la Frecuencias acumulada, Frecuencia relativa, Frecuencia relativa acumulada con las formulas de Excel se obtuvieron los datos correspondientes a cada fila y así hasta llegar al fin con los porcentajes de la Distribución de porcentajes y la Distribución de porcentajes acumulados.
Gráfica de Histograma de Frecuencias y Polígono de Datos:
Proceso de Construcción:
Es similar al de la construcción del histograma hasta el número 3 agregando los siguientes pasos:
- Marcar los puntos de intersección de cada punto medio de clase con su frecuencia respectiva
- Unir con segmentos, en forma consecutiva, los puntos de intersección incluyendo el punto medio de la clase anterior a la primera y el punto medio de la clase posterior a la última.
Para poder realizar la gráfica de Histograma y Polígono de Frecuencia, tomé los datos de la tabla de frecuencias, que es el porcentaje de mortalidad por diabetes mellitus por estado en toda la República Mexicana, para empezar ordené los datos agrupados de la variable, empecé por organizarlos de menor a mayor, tomando como primer intervalo fue de 43-52 y fue subiendo de 9 en 9 hasta poder llegar al 83-92, ya que los datos que venían en la tabla no rebasaban del numero 91.
Como podemos observar en la gráfica de la clase 43-52 se obtuvo una Frecuencia absoluta de 5, para la clase de 53-62 ascendió notablemente con una Frecuencia de 9, para el siguiente intervalo de 63-72 podemos observar que hubo un descenso en la Frecuencia, ya que se obtuvo un total de 7, posteriormente en la clase 73-82 igualmente observamos un pequeño descenso, ya que bajo a una Frecuencia de 6, finalmente observamos que para la clase 83-92 la Frecuencia bajó nuevamente, ya que en total se obtuvo una Frecuencia de 5. 
Podemos decir que en total fueron 32 datos obtenidos de la tabla de frecuencias.
Medidas de Tensión y Dispersión:
	Personas (muertas por Diabetes)
	Frecuencia Absoluta (fi)
	MC (xi)
	fi * MC
	fa
	(xi - ẋ)
	(xi - ẋ)2
	(xi - ẋ)2 . fi
	43-52
	5
	47.50
	237.50
	5
	-19.062
	363.3789063
	1816.894532
	53-62
	9
	57.50
	517.50
	14
	-9.062
	82.12890625
	739.1601563
	63-72
	7
	67.50
	472.50
	21
	0.937
	0.87890625
	6.15234375
	73-82
	6
	77.50
	465.00
	27
	10.937
	119.6289063
	717.7734378
	83-92
	5
	87.50
	437.50
	32
	20.937
	438.3789063
	2191.894532
	Totales
	32
	
	2130
	
	
	
	5471.875
a) ¿Cuál es el promedio de las personas con mortalidad en diabetes mellitus en toda la República Mexicana?
Fórmula para sacar el Promedio:
Respuesta: El promedio es 66.562.
b) ¿Cuál es la Moda?
Fórmula Moda: 
Respuesta: La Moda es 59.000.
c) ¿Cuál es la Mediana?
Fórmula Mediana: 
Respuesta: La Mediana es 65.571.
d) ¿Cuál es la Varianza poblacional y muestral?
Promedio: 66.5625
	Personas (muertas por Diabetes)
	Frecuencia Absoluta (fi)
	MC (xi)
	fi * MC
	fa
	(xi - ẋ)
	(xi - ẋ)2
	(xi - ẋ)2 . fi
	43-52
	5
	47.50
	237.50
	5
	-19.062
	363.3789063
	1816.894532
	53-62
	9
	57.50
	517.50
	14
	-9.062
	82.12890625
	739.1601563
	63-72
	7
	67.50
	472.50
	21
	0.937
	0.87890625
	6.15234375
	73-82
	6
	77.50
	465.00
	27
	10.937
	119.6289063717.7734378
	83-92
	5
	87.50
	437.50
	32
	20.937
	438.3789063
	2191.894532
	Totales
	32
	
	2130
	
	
	
	5471.875
Fórmula Varianza Poblacional: 
Fórmula Varianza Muestral: 
Respuesta: 
El resultado para la Variación Poblacional es 170.9962.
El resultado para la Variación Muestral es 176.5122.
e) ¿Cuál es la desviación poblacional y muestral? 
Fórmula Desviación Poblacional: 
Fórmula Desviación Poblacional: 
Respuesta:
El resultado de Desviación Poblacional es 13.076.
El resultado de Desviación Muestral es 13.285. 
Justifique su planteamiento y finalidad de estudio.
Quisiera dar a conocer el porcentaje de las muertes que ocurrieron en el año 2013 debido a la enfermedad llamada Diabetes Mellitus, posteriormente plantear medidas que puedan ayudar a disminuir el índice de mortalidad en la población, enfocado principalmente desde el punto de vista de la Nutrición Aplicada.
Lamentablemente a lo largo de los años transcurridos desde el año 2013 ha ido en aumento las muertes por este tipo de enfermedad, esto se debe a la escasa información que tiene la población e igualmente los malos hábitos alimenticios con grandes porcentajes de azucares y no tienen una dieta adecuada para cada tipo de persona.
La finalidad del estudio es dar a conocer las muertes que se dieron en el año 2013 en la República Mexicana y para que en los años posteriores al año actual que es 2019 se tengan otras estrategias para disminuir el índice de muertes en las personas tanto como hombres y mujeres.
Conclusiones
La Tabla de Frecuencias agrupadas se emplea generalmente si las variables toman un número grande de valores o la variable es continua.	
En este caso se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento de la muestra debe pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase.
El Histograma representa la frecuencia relativa mediante la superficie de las barras. Aunque esto sea cierto en todos los histogramas, cuando se agrupan los datos en intervalos desiguales hay que atender a la superficie de las barras, que no se corresponderá con la altura. Para su elaboración debe introducirse el concepto de altura de histograma, que es un concepto equivalente al de densidad de probabilidad, y que se calcula dividiendo la frecuencia relativa de ese intervalo (o sea la superficie que queremos darle) entre la anchura del intervalo (la base del rectángulo). Ahora las barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas esas superficies (de todas las barras) será 1, o sea el 100%.
Se conoce como Polígonos de Frecuencia para datos agrupados a aquellos que se desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las distintas columnas del histograma. En el momento de la representación de todas las frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladas que posibilita la diagramación del polígono correspondiente.
Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación nos indican si esos datos están próximos entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de dispersión nos permiten apreciar la distancia que existe entre los datos a un cierto valor central e identificar la concentración de los mismos en un cierto sector de la distribución, es decir, permiten estimar cuán dispersas están dos o más distribuciones de datos. Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo la media aritmética el dato central más utilizado. Cuando existe una dispersión pequeña se dice que los datos están dispersos o acumulados cercanamente respecto a un valor central, en este caso el dato central es un valor muy representativo. En el caso que la dispersión sea grande el valor central no es muy confiable. 
Fuentes
Subsecretaría de Integración y Desarrollo del Sector Salud Dirección General de Evaluación del Desempeño. (2015). Informe sobre la salud de los mexicanos. 31 de Agosto del 2019, de Subsecretaría de Integración y Desarrollo del Sector Salud Dirección General de Evaluación del Desempeño Sitio web: https://www.gob.mx/cms/uploads/attachment/file/64176/INFORME_LA_SALUD_DE_LOS_MEXICANOS_2015_S.pdf
Aldanalisis. (2014). Histogramas, Polígonos de Frecuencia y Ojivas. 31 de Agosto del 2019, de Aldanalisis Sitio web: http://aldanalisis.blogspot.com/2014/04/histogramas-poligonos-de-frecuencia-y.html 
Colaboradores de Wikipedia. (2019). Histograma. 31 de Agosto del 2019, de Wikipedia, La enciclopedia libre Sitio web: https://es.wikipedia.org/wiki/Histograma
Julián Pérez Porto y María Merino. (2009). Definición de polígono de frecuencia. 31 de Agosto del 2019, de Definicion.de Sitio web: https://definicion.de/poligono-de-frecuencia/
Universo Formulas. (s.f.). Tabla de Frecuencias. 31 de Agosto del 2019, de Universo Formulas Sitio web: https://www.universoformulas.com/estadistica/descriptiva/tabla-frecuencias/
Juan Christian Mercado Alvarado. (2011). MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION. 01 de Septiembre del 2019, de Eduteka Sitio web: http://eduteka.icesi.edu.co/proyectos.php/1/3053
Sites.google.com. (s.f.). Unidad 3: Medidas de Tendencia Central y de Dispersión. 01 de Septiembre del 2019, de Sites.google.com Sitio web: https://sites.google.com/site/estadisticalfrecuencia/e/fgdfgdf
Alex. (2017). Varianza, Desviación Estándar y Coeficiente de Variación | Datos agrupados en intervalos. 01 de Septiembre del 2019, de Youtube.com Sitio web: https://www.youtube.com/watch?v=1myBo87lYyU
Alex. (2017). Media, mediana y moda | Datos agrupados en intervalos Ejemplo 1. 01 de Septiembre del 2019, de Youtube.com Sitio web: https://www.youtube.com/watch?v=5bZXpfxwHqk
Histograma de Frecuencias	43-52	53-62	63-72	73-82	83-92	5	9	7	6	5	Poligono de Frecuencia	5	9	7	6	5	14

Otros materiales