Logo Studenta

Introducción a la Estadística

¡Este material tiene más páginas!

Vista previa del material en texto

República Bolivariana de Venezuela. 
Ministerio del Poder Popular para la Educación.
Universidad Politécnica Territorial del Edo. Trujillo
“Mario Briceño Iragorry”
El Dividive, Municipio Miranda, Estado Trujillo.
Introducción a la Estadística.
 Participante:
Nombres: Katherin Alejandra
Apellidos: Carrillo Díaz 
C.I: 31.040.100
Sección: U 
Asignatura: Matemática
Índice: 
Introducción.................................................................................................pág.3
Definición de estadística.............................................................................pág.4
Historia de la estadística.............................................................................pág.5 
Tipos de estadística................................................................................pág.6-11
Distribución de frecuencias para datos agrupados y no agrupados..............................................................................................pág.12-13
Medidas de tendencia central.............................................................pág.14-15
Medidas de dispersión para datos agrupados y no agrupados..............................................................................................pág.16-19
Representación gráfica de frecuencia acumulada y relativa...........pág.20-22
Conclusión..................................................................................................pág.23
Introducción.
 El siguiente trabajo está basado en la estadística donde se plantean los siguientes puntos: Definición de estadística, historia de la estadística, tipos de estadística, distribuciones de frecuencias para datos agrupados y no agrupados, medidas de tendencia central, medidas de dispersión para datos agrupados y no agrupados y la representación gráfica de frecuencia acumulada y relativa. 
 Además, cada tema cuenta con un modelo de ejercicio, con el propósito de ayudar a utilizar los nuevos conocimientos que ayudarán a manejar las nuevas destrezas y habilidades del estudiante en el campo de la matemática. 
 Sin embargo, dichos temas servirán para organizar y resolver, desde algunos puntos de vista, problemas en la vida cotidiana.
Definición de Estadística.
 La estadística es una ciencia y una rama de las matemáticas a través de la cual se recolecta, analiza, describe y estudia una serie de datos a fin de establecer comparaciones o variabilidades que permitan comprender un fenómeno en particular. Además, se trata de una ciencia que puede ser aplicada más allá de las ciencias, ya que la estadística también es aplicada en diversos estudios en las áreas de las ciencias sociales, ciencias de la salud, economía, negocios y en diversos estudios de tipo gubernamental, así mismo, la estadística se emplea para estudiar una población o muestra sobre el que se pretende obtener una información en particular, de esta manera se puede ofrecer una solución a un problema o ver cómo ha variado una situación en específico. Por otra parte, su objetivo es ofrecer un resultado numérico como exponer de qué forma se está desarrollando una situación, tras un análisis estadístico se pueda comprender un hecho, tomar decisiones, estudiar problemas sociales, ofrecer datos y soluciones en determinados casos, deducir datos en relación a una población, entre otros.
Historia de la Estadística.
 En el siglo XIV el término "estadística" designaba la colección sistemática de datos demográficos y económicos por los estados. A principios del siglo XIX, el significado de "estadística" fue ampliado para incluir la disciplina ocupada de recolectar, resumir y analizar los datos. Hoy en día la estadística es ampliamente usada en el gobierno, los negocios y todas las ciencias. Por otra parte, Las computadoras electrónicas han acelerado la estadística computacional y ha permitido a los estadísticos el desarrollo de métodos que usan recursos informáticos intensivamente. Además, la estadística matemática designa las teorías matemáticas de la probabilidad e inferencia estadística, las cuales son usadas en la estadística aplicada. La relación entre estadística y probabilidades se fue desarrollando con el tiempo, durante el siglo XIX, usaron las estadísticas de forma gradual en la teoría de probabilidades, cuyos resultados iniciales fueron encontrados en los siglos XVII y XXI, particularmente en el análisis de los juegos de azar. Para el año 1600, la astronomía usaba modelos probabilísticos y teorías estadísticas, particularmente el método de los mínimos cuadrados, el cual fue inventado por Legendre y Gauss. Sin embargo, La incipiente teoría de las probabilidades y estadísticas fue sistematizada y extendida por Laplace; después de este, las probabilidades y estadísticas han experimentado un continuo desarrollo. Por otro lado, en el siglo XIX, el razonamiento estadístico y los modelos probabilísticos fueron usados por las ciencias sociales para el avance las nuevas ciencias de psicología experimental y sociología, y por las ciencias físicas en termodinámica y mecánica estadística. El desarrollo del razonamiento estadístico estuvo fuertemente relacionado con el desarrollo de la lógica inductiva y el método científico.
Tipos de Estadística.
Estadística descriptiva: La estadística descriptiva o deductiva permite presentar de manera resumida y organizada los datos numéricos obtenidos tras un estudio o análisis en particular. Su objetivo es describir las características principales de los datos reunidos y evitar generalizaciones.
Modelo de ejercicio: 
Un país ficticio está compuesto por tres autonomías. La primera (Tacanyuna) tiene dos habitantes cuyas rentas personales son 30 y 25 M (miles de euros). La segunda autonomía (Felicia) tiene tres habitantes con rentas de 45, 62 y 15. La tercera (Andamaria) tiene cinco habitantes con rentas de 38, 86, 43, 65 y 24.
a. Calcular la renta per cápita de cada autonomía.
b. Calcular la renta per cápita “promedio” de las autonomías (use la media aritmética simple).
c. Repetir el apartado anterior usando la media ponderada (piense cuáles son los pesos).
d. Calcular la renta per cápita de país y compararla con los resultados de b) y c). Comentar.
a. Calcularemos el promedio. El promedio de un conjunto de observaciones es la suma de los valores del conjunto dividida por el número de observaciones. 
En cada 
En cada caso tendremos: 
b. Si calculamos el promedio de las tres rentas tendremos: 
c. Tenemos que sumar las rentas de todos los habitantes del país (las tres
Autonomías) y dividir por el total de habitantes.
 
Vemos que la renta per cápita no coincide con el promedio de las rentas per cápita de cada una de las autonomías. Esto se debe a que para calcular la renta per cápita del país a partir de las rentas per cápita de las autonomías estas se tendrían que ponderar por el número de habitantes. 
Estadística inferencial: La estadística inferencial o inductiva es el estudio que utiliza técnicas a partir de las cuales se obtienen generalizaciones o se toman decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas. Además, su objetivo es extraer conclusiones de utilidad sobre el total de las observaciones posibles basándose en la información obtenida.
Modelo de ejercicio: 
Para estimar la proporción de habitantes de una ciudad que poseen ordenador personal se toma una muestra de tamaño n. Calcula el valor mínimo de n para garantizar, con un nivel de confianza del 95 %, que el error de estimación no supera el 2 %. (Como se desconoce la proporción, se hará a partir del caso más desfavorable, que será 0,5).
Un intervalo de confianza del 95% 
Por tanto al buscar dentro de la tabla de la distribución normal 0,975 se obtiene 1,96.
El error máximo admisible para estimar la proporción E viene de dado por: 
De esta expresión deducimos: 
El tamaño debe ser de 2401 habitantes. 
Estadística aplicada: La estadística aplicada hace uso de los métodos expuestos anteriormente, y permiterealizar inferencias a partir de una o varias muestras de una determinada población como objeto de estudio. De esta manera se pueden ofrecer resultados tanto específicos como generalizados. Además, se utiliza en diversas ciencias, como la historia, la economía, la educación o la sociología para realizar estudios y análisis estadísticos.
Modelo de ejercicio: 
Los miembros de una cooperativa de viviendas tienen las siguientes edades:
 
42 60 60 38 60 63 21 66 56 57 51 57 44 45 35
30 35 47 53 49 50 49 38 45 28 41 47 42 53 32
54 38 40 63 48 33 35 61 47 41 55 53 27 20 21
42 21 39 39 34 45 39 28 54 33 35 43 48 48 27
53 30 29 53 38 52 54 27 27 43 28 63 41 23 58
56 59 60 40 24
 
Elabore una tabla de frecuencias.
Calcule la media y la desviación típica.
 
SOLUCIÓN:
 
Para elaborar una tabla de frecuencias es condición imprescindible establecer una serie de clases o categorías (intervalos) a las que vamos a adjudicar a cada uno de los ochenta miembros de la cooperativa. El investigador puede seguir diferentes criterios en función del objetivo del estudio. Una tabla de frecuencias elaborada a partir de estos datos podría ser la siguiente:
 
Edad               n                    
20-29              14
30-39              17
40-49                            22
50-59                            18
60-69                                9
Total               80       
 
Cálculo de la media:
 
Puede calcularse directamente sumando las edades de todos los miembros de la cooperativa y dividiendo por el total que en este caso es ochenta, el resultado es una media de 43,29. También:
 
	Edad
	xi
	ni
	xini
 
	20-29
	25
	14
	350
	30-39
	35
	17
	595
	40-49
	45
	22
	990
	50-59
	55
	18
	990
	60-69
	65
	9
	585
	Total
	 
	80
	3510
 	
Por tanto, podemos decir que la media es de casi 44 años.
Cálculo de la desviación típica:
	Edad
	xi
	ni
	
	  
	
	20-29
	25
	14
	-18,875
	356,2656
	4987,71875
	30-39
	35
	17
	-8,875
	78,7656
	1339,01563
	40-49
	45
	22
	1,125
	1,2656
	27,84375
	50-59
	55
	18
	11,125
	123,7656
	2227,78125
	60-69
	65
	9
	21,125
	446,2656
	4016,39063
	Total
	 
	80
	 
	 
	12598,75
 
 
Sx =
La desviación típica es de 12,5 años
 
Distribuciones de frecuencias para datos agrupados y no agrupados.
 
Datos agrupados: Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y en la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. 
Datos no agrupados: Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menos de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias. 
Nota: No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados, sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior a 20, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva. La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad. 
Modelo de ejercicio: 
Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes resultados:
	negro
	azul
	amarillo
	rojo
	azul
	azul
	rojo
	negro
	amarillo
	rojo
	rojo
	amarillo
	amarillo
	azul
	rojo
	negro
	azul
	rojo
	negro
	amarillo
Con los resultados obtenidos, elaborar una tabla de frecuencias.
Solución:
 En la primera columna, colocamos los valores de nuestra variable, en la segunda la frecuencia absoluta, luego la frecuencia acumulada, seguida por la frecuencia relativa, y finalmente la frecuencia relativa acumulada. Por ser el primer problema, no haremos uso de las frecuencias porcentuales.
	Color
	Frecuencia absoluta
	Frecuencia acumulada
	Frecuencia relativa
	Frecuencia relativa acumulada
	Negro
	4
	4
	0,20
	0,20
	Azul
	5
	9
	0,25
	0,45
	Amarillo
	5
	14
	0,25
	0,70
	Rojo
	6
	20
	0,30
	1
	Total
	20
	 
	1
	 
Medidas de tendencias central
 Las medidas de tendencia central, como la media, mediana y moda, son medidas que tratan de ubicar la parte central de un conjunto de datos.
La media: La media es el valor que se obtiene al sumar todos los datos y dividir el resultado entre la cantidad de datos.
Su fórmula es la siguiente:
Ejemplo 1
Ejemplo: 
Calcular la media de los siguientes datos: 11, 6, 7, 7, 4.
La mediana: Es el valor que ocupa la posición central cuando todos los datos están ordenados en orden creciente o decreciente.
La mediana se representa con las letras: 
Ejemplo: 
Calcular la mediana de los siguientes datos: 11, 6, 7, 7, 4.
Solución:
Ordenamos los datos de menor a mayor: 4, 6, 7, 7, 11.
Ahora tomamos el dato que se encuentra al centro: 4, 6, 7, 7, 11.
El valor de la mediana es: = 7.
¿Y si la cantidad de datos es un número par?
En ese caso, la mediana es la media entre los dos valores centrales.
La moda: Es el valor que más se repite. También podemos decir que la moda es el valor con mayor frecuencia absoluta o el valor que ocurre con más frecuencia.
La moda se representa con las letras: 
Ejemplo:
Calcular la moda de los siguientes datos: 11, 6, 7, 7, 4.
Podemos ver que el valor que más se repite es el 7, ya que tiene una frecuencia absoluta de 2, por lo tanto, = 7.
Medidas de dispersión para datos agrupados y no agrupados.
Medidas de dispersión para datos agrupados:
Rango: El rango de un grupo de números es la diferencia entre el número mayor y el menor del grupo.
Varianza: De una distribución de frecuencia la varianza puede ser obtenida de la fórmula.
Desviación Estándar: La desviación estándar se define como:
Coeficiente de variación: La variación real o dispersión determinada a partir de la desviación estándar u otra medida de dispersión, es llamada la dispersión absoluta. Además, si la dispersión absoluta es la desviación estándar S y el promedio, la dispersión relativa se llama coeficiente de variación o coeficiente de dispersión.
Medidas de dispersión para datos no agrupados.
 Los estudios estadísticos permiten hacer inferencias de una característica de una población a partir de la información contenida en una muestra. Los métodos numéricos que describen a los conjuntos de observaciones tienen como objetivo dar una imagen mental de la distribución de frecuencias. Además, una vez localizado el centro de la distribución de un conjunto de datos, lo que procede es buscar una medida de dispersión de los datos. Por otra parte, la dispersión o variación es una característica importante de un conjunto de datos porque intenta dar una idea de cuán esparcidos se encuentran éstos.
Existen diversas medidas de dispersión, algunas de ellas son:
Rango: El rango de un conjunto de números es la diferencia entre el mayor y el menor de todos ellos. Hay 2 maneras de expresar ésta medida:
· La diferencia entre los valores mayores y menor. 
· Los valores mayor y menor del grupo.
Desviación estándar: La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
 
Varianza:La varianza es la mayor parte de los textos científicos en castellano se refieren a la media aritmética de los cuadrados de las desviaciones de cada valor respecto de la media aritmética de los datos (por lo que a veces también se denomina desviación cuadrática media). La desviación estándar es la raíz cuadrada de la varianza. En algunos textos en castellano se ve variancia en vez de varianza, pero esta grafía se usa muy poco, pese a ser la recomendada por la Real Academia. Por otra parte, la varianza es la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética, es decir, es el promedio de las desviaciones de la media elevadas al cuadrado.
Representación gráfica de frecuencia acumulada y relativa.
 Después de construir la tabla de frecuencias correspondiente es conveniente la representación gráfica de la distribución de los datos en un diagrama. Estas representaciones gráficas permiten una visualización rápida de la información recogida. Veamos los diferentes tipos de diagramas.
Representaciones gráficas para datos agrupados:
 La representación gráfica más usada para datos agrupados es el histograma de frecuencias absolutas o relativas. Un histograma es un conjunto de rectángulos adyacentes, cada uno de los cuales representa un intervalo de clase. Las bases de cada rectángulo es proporcional a la amplitud del intervalo. Es decir, el centro de la base de cada rectángulo ha de corresponder a una marca de clase. La altura se suele determinar para que el área de cada rectángulo sea igual a la frecuencia de la marca de clase correspondiente. Por tanto, la altura de cada rectángulo se puede calcular como el cociente entre la frecuencia (absoluta o relativa) y la amplitud del intervalo. En el caso de que la amplitud de los intervalos sea constante, la representación es equivalente a usar como altura la frecuencia de cada marca de clase, siendo este método más sencillo para dibujar rápidamente un histograma.
Representación gráfica para datos no agrupados:
 El diagrama principal para representar datos de variables discretas no agrupadas es el diagrama de barras. En este se representan en el eje de abscisas los distintos valores de la variable y sobre cada uno de ellos se levanta una barra de longitud igual a la frecuencia correspondiente. Pueden representarse tanto las frecuencias absolutas fifi como las relativas hihi. En la práctica se puede graduar simultáneamente el eje de ordenadas tanto en frecuencias absolutas como en relativas en tantos por ciento. Además, El mismo gráfico se puede realizar con las frecuencias relativas, es decir, wes posible representar los porcentajes. Por otra parte, un diagrama similar es el polígono de frecuencias. Este se obtiene uniendo con rectas los extremos superiores de las barras del diagrama anterior. De la misma forma, pueden representarse frecuencias absolutas, Para representar las frecuencias, tanto absolutas como relativas, acumuladas se usa el diagrama de frecuencias acumuladas. Un gráfico, en forma de escalera, se construye representando en abscisas los distintos valores de la variable y levantando sobre cada xixi una perpendicular cuya longitud será la frecuencia acumulada (HiHi o FiFi) de ese valor. Los puntos se unen con tramos horizontales y verticales como se muestra en la figura. Evidentemente la escalera resultante ha de ser siempre ascendente.
Representaciones gráficas para variables cualitativas:
 Existe una gran variedad de representaciones para variables cualitativas, de las cuales vamos a describir únicamente las dos más usadas. El diagrama de rectángulos es similar al diagrama de barras y el histograma para las variables cuantitativas. Consiste en representar en el eje de abscisas los diferentes caracteres cualitativos y levantar sobre cada uno de ellos un rectángulo (de forma no solapada) cuya altura sea la frecuencia (absoluta o relativa) de dicho carácter. Además, un diagrama muy usado es el diagrama de sectores (también llamado diagrama de tarta). En él se representa el valor de cada carácter cualitativo como un sector de un circulo completo, siendo el área de cada sector, o, lo que es lo mismo, el arco subtendido, proporcional a la frecuencia del carácter en cuestión. De forma práctica, cada arco se calcula como 360º multiplicado por la frecuencia relativa. Es una costumbre escribir dentro, o a un lado, de cada sector la frecuencia correspondiente. Este tipo de diagrama proporciona una idea visual muy clara de cuáles son los caracteres que más se repiten.
Modelo de ejercicio. 
Se registran los tiempos de las llamadas recibidas en un call center, y se obtiene la siguiente tabla de frecuencias con datos agrupados. Construir un histograma de frecuencias. 
Solución:
Conclusión:
 La estadística es una ciencia y una rama de las matemáticas donde se recolecta analiza, describe y estudia una serie de datos a fin de establecer comparaciones o variabilidades que permitan comprender un fenómeno en particular. Además, el origen de la estadística se remonta a principios del siglo XIX, y que hoy en día, la estadística es usada por el gobierno, los negocios y todas las ciencias. Por otra parte, existen diferentes tipos de estadística: La estadística descriptiva; es la que representa de manera resumida y organizada los datos numéricos obtenidos tras un estudio o análisis en particular, la estadística inferencial; es la que utiliza técnicas a partir de las cuales se obtienen generalizaciones o se toman decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas y la estadística aplicada; es la cual hace uso de los métodos expuestos anteriormente, y permite realizar inferencias a partir de una o varias muestras de una determinada población como objeto de estudio. Por otro lado, las distribuciones de frecuencias para datos agrupados y no agrupados; Datos agrupados: Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y en la frecuencia de cada clase. Datos no agrupados: Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menos de ellos hasta el mayor de ese conjunto. Las medidas de tendencia central, como la media, mediana y moda, son medidas que tratan de ubicar la parte central de un conjunto de datos. Sin embargo, las medidas de dispersión en datos agrupados y no agrupados son los estudios estadísticos que permiten hacer inferencias de una característica de una población a partir de la información contenida en una muestra. Y por último, la representación gráfica de frecuencia acumulada y relativa es la que permite una visualización rápida de la información recogida.
image23.PNG
image3.PNG
image30.PNG
image4.PNG
image40.PNG
image5.PNG
image50.PNG
image6.PNG
image60.PNG
image7.PNG
image70.PNG
image8.gif
image9.gif
image10.gif
image11.gif
image12.gif
image13.gif
image14.PNG
image15.PNG
image16.png
image17.png
image18.png
image19.png
image20.png
image21.png
image22.png
image24.png
image25.png
image1.PNG
image10.PNG
image2.PNG

Continuar navegando