abrahan medina- bloque 3 analisis estadistico

Análisis Estadístico

•

SIN SIGLA

abraham medina lopez

15/7/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Análisis Estadístico

10.084 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

República Bolivariana de Venezuela
Ministerio del poder popular para la educación universitaria
Universidad Deportiva Del Sur
Estadística Descriptiva
(Bloque 3)
Estudiante:
Abrahan Alfonso medina Lopez
C.I: 27.774.736

¿Que es la estadística descriptiva e inferencial?
La estadística descriptiva es una rama de la estadística que se encarga de describir y resumir datos utilizando medidas como la media, la mediana, la moda, la desviación estándar, entre otras. Su objetivo es organizar, resumir y presentar los datos de manera comprensible.
Ejemplo de estadística descriptiva:
- Calcular el promedio de las calificaciones obtenidas por los estudiantes en un examen.
- Determinar la mediana de los salarios de los empleados en una empresa.
- Identificar la moda de los colores preferidos por los participantes de una encuesta.
Por otro lado, la estadística inferencial es una rama de la estadística que utiliza muestras de datos para hacer inferencias o generalizaciones sobre una población más amplia. Se basa en el uso de técnicas de estimación y pruebas de hipótesis para tomar decisiones o sacar conclusiones sobre características o relaciones en la población.
Ejemplo de estadística inferencial:
- Realizar una prueba de hipótesis para determinar si hay una diferencia significativa en el rendimiento académico entre dos grupos de estudiantes.
- Estimar el porcentaje de votantes que apoyan a un determinado candidato político mediante una encuesta a una muestra representativa de la población.
- Determinar si existe una relación significativa entre el consumo de cierto alimento y el riesgo de desarrollar cierta enfermedad mediante un estudio observacional.
¿Cuáles son las Medidas de tendencia central?
Las medidas de tendencia central son una forma de resumir y representar un conjunto de datos mediante un valor que se considera "representativo" del conjunto. Estas medidas son la medida aritmética, la moda y la mediana.
- La medida aritmética es el promedio de un conjunto de datos. Se calcula sumando todos los valores y dividiendo entre el número total de datos. Es la medida más comúnmente utilizada y se utiliza para obtener una idea general de la "tendencia" de los datos.
- La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Es útil cuando se quiere identificar el valor más común o dominante en un conjunto de datos. Puede haber una moda única o múltiples modas en un conjunto de datos.
- La mediana es el valor que se encuentra en la posición central de un conjunto de datos ordenados de menor a mayor. Es útil cuando se quiere identificar el valor medio o central en un conjunto de datos. La mediana divide el conjunto de datos en dos partes iguales: la mitad de los datos están por encima y la otra mitad están por debajo de la mediana.
Estas medidas son útiles para resumir y analizar conjuntos de datos, ya que proporcionan una idea general de la "tendencia" o "centralidad" de los datos. Sin embargo, es importante tener en cuenta que estas medidas pueden verse afectadas por valores atípicos o extremos en el conjunto de datos, por lo que es importante considerar también otras medidas estadísticas y realizar un análisis más completo.
Las medidas de tendencia central son la medida aritmética, la moda y la mediana.
La medida aritmética es el promedio de un conjunto de datos. Por ejemplo, si se tienen las siguientes calificaciones en un examen: 8, 7, 9, 6, 8, la medida aritmética sería (8+7+9+6+8)/5 = 7.6.
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Por ejemplo, si se tienen los siguientes colores preferidos por los participantes de una encuesta: rojo, azul, verde, azul, amarillo, azul, la moda sería el color azul, ya que es el que aparece con mayor frecuencia.
La mediana es el valor que se encuentra en la posición central de un conjunto de datos ordenados de menor a mayor. Por ejemplo, si se tienen los siguientes salarios de los empleados en una empresa: $1000, $2000, $2500, $3000, $3500, la mediana sería $2500, ya que se encuentra en la posición central.
¿Cuáles son las Medidas de Posición: Cuartiles, deciles y percentiles?
Las medidas de posición, como los cuartiles, deciles y percentiles, son valores que dividen un conjunto de datos en partes iguales o proporcionales. Estas medidas son utilizadas en el análisis estadístico para comprender la distribución de los datos y determinar qué porcentaje se encuentra por encima o por debajo de ciertos valores.
- Los cuartiles son tres valores que dividen un conjunto de datos ordenados en cuatro partes iguales. El primer cuartil (Q1) deja al 25% de los datos por debajo y al 75% por encima. El segundo cuartil (Q2) es la mediana, que deja al 50% de los datos por debajo y al 50% por encima. El tercer cuartil (Q3) deja al 75% de los datos por debajo y al 25% por encima.
- Los deciles son nueve valores que dividen un conjunto de datos ordenados en diez partes iguales. El primer decil (D1) deja al 10% de los datos por debajo y al 90% por encima. El segundo decil (D2) deja al 20% de los datos por debajo y al 80% por encima, y así sucesivamente hasta el noveno decil (D9).
- Los percentiles son 99 valores que dividen un conjunto de datos ordenados en cien partes iguales. El primer percentil (P1) deja al 1% de los datos por debajo y al 99% por encima. El segundo percentil (P2) deja al 2% de los datos por debajo y al 98% por encima, y así sucesivamente hasta el percentil 99 (P99).
Estas medidas de posición permiten tener una visión más completa de la distribución de los datos y son útiles para realizar comparaciones entre diferentes conjuntos de datos o para identificar valores atípicos.
Las medidas de posición, como los cuartiles, deciles y percentiles, son valores que dividen un conjunto de datos en partes iguales o proporcionales.
- Los cuartiles son tres valores que dividen un conjunto de datos ordenados en cuatro partes iguales. El primer cuartil (Q1) es el valor que deja al 25% de los datos por debajo y al 75% por encima. El segundo cuartil (Q2) es la mediana, que deja al 50% de los datos por debajo y al 50% por encima. El tercer cuartil (Q3) deja al 75% de los datos por debajo y al 25% por encima.
- Los deciles son nueve valores que dividen un conjunto de datos ordenados en diez partes iguales. El primer decil (D1) deja al 10% de los datos por debajo y al 90% por encima. El segundo decil (D2) deja al 20% de los datos por debajo y al 80% por encima, y así sucesivamente hasta el noveno decil (D9).
- Los percentiles son 99 valores que dividen un conjunto de datos ordenados en cien partes iguales. El primer percentil (P1) deja al 1% de los datos por debajo y al 99% por encima. El segundo percentil (P2) deja al 2% de los datos por debajo y al 98% por encima, y así sucesivamente hasta el percentil 99 (P99).
Por ejemplo, si tenemos el siguiente conjunto de datos: 5, 8, 10, 12, 15, 18, 20, 22, 25, 30.
- Los cuartiles serían: Q1 = 10, Q2 = 15 (mediana), Q3 = 22.
- Los deciles serían: D1 = 8, D2 = 10, D3 = 12, D4 = 15, D5 = 18, D6 = 20, D7 = 22, D8 = 25, D9 = 30.
- Los percentiles serían: P1 = 5, P2 = 5.95, P3 = 6.9, P4 = 7.85, P5 = 8.8, P6 = 9.75, P7 = 10.7, P8 = 11.65, P9 = 12.6, ..., P99 = 29.35.
Estas medidas de posición son útiles para entender cómo se distribuyen los datos y qué porcentaje de los mismos se encuentra por debajo o por encima de ciertos valores.
¿Cuáles son las Medidas de Dispersión: Rango, desviación estándar, varianza, coeficiente de variación?
Las medidas de dispersión son herramientas estadísticas utilizadas para medir la variabilidad o dispersión de un conjunto de datos. Las principales medidas de dispersión son el rango, la desviación estándar, la varianza y el coeficiente de variación.
- Rango: Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos. Es una medida sencilla pero no muy precisa, ya que solo considera dos valores extremos.
- Desviación estándar: Es una medida más precisa de la dispersión de los datos. Se calcula comola raíz cuadrada de la varianza. La varianza es la media de los cuadrados de las diferencias entre cada dato y la media del conjunto.
- Varianza: Es la media de los cuadrados de las diferencias entre cada dato y la media del conjunto. Es utilizada para medir la variabilidad promedio de los datos con respecto a su media.
- Coeficiente de variación: Es una medida relativa de la dispersión que compara la desviación estándar con la media del conjunto. Se calcula dividiendo la desviación estándar entre la media y multiplicando por 100 para obtener un porcentaje. Permite comparar la variabilidad entre diferentes conjuntos de datos.
Estas medidas de dispersión son útiles para comprender cómo se distribuyen los datos en relación a su valor central, identificar valores atípicos y comparar la variabilidad entre diferentes conjuntos de datos.
- El rango es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos. Es una medida sencilla pero no muy precisa, ya que solo considera dos valores extremos. Ejemplo: Si tenemos el conjunto de datos {10, 15, 20, 25, 30}, el rango sería 30 - 10 = 20.
- La desviación estándar es una medida más precisa de la dispersión de los datos. Se calcula como la raíz cuadrada de la varianza. La varianza es la media de los cuadrados de las diferencias entre cada dato y la media del conjunto. Ejemplo: Si tenemos el conjunto de datos {10, 15, 20, 25, 30}, la desviación estándar sería aproximadamente 7.07.
- El coeficiente de variación es una medida relativa de la dispersión, que compara la desviación estándar con la media del conjunto. Se calcula dividiendo la desviación estándar entre la media y multiplicando por 100 para obtener un porcentaje. Ejemplo: Si tenemos el conjunto de datos {10, 15, 20, 25, 30} con una media de 20 y una desviación estándar de aproximadamente 7.07, el coeficiente de variación sería (7.07/20) * 100 = 35.35%.
¿Cuáles son las medidas Medidas de forma: Curtosis y Asimetría?
Las medidas de forma son herramientas estadísticas utilizadas para describir la forma de una distribución de datos. Las dos principales medidas de forma son la curtosis y la asimetría.
La curtosis es una medida que indica qué tan puntiaguda o achatada es la distribución de los datos en comparación con una distribución normal. Una curtosis positiva indica que la distribución tiene una mayor concentración de datos en torno a su valor central y colas más pesadas, lo que significa que hay una mayor probabilidad de valores extremos. Por otro lado, una curtosis negativa indica que la distribución tiene una menor concentración de datos en torno a su valor central y colas más ligeras, lo que significa que hay una menor probabilidad de valores extremos.
La asimetría, por otro lado, es una medida que indica si la distribución de los datos está sesgada hacia un lado o hacia el otro. Una asimetría positiva indica que la cola derecha de la distribución es más larga y hay una mayor concentración de datos en el lado izquierdo. Por otro lado, una asimetría negativa indica que la cola izquierda de la distribución es más larga y hay una mayor concentración de datos en el lado derecho.
Ambas medidas de forma son útiles para comprender cómo se distribuyen los datos en relación a su valor central y pueden proporcionar información adicional sobre la naturaleza de los datos. Por ejemplo, una distribución con una alta curtosis positiva y una asimetría positiva puede indicar la presencia de valores atípicos o una distribución no normal. Por otro lado, una distribución con una baja curtosis y una asimetría cercana a cero puede indicar una distribución más simétrica y cercana a una distribución normal. Estas medidas de forma son especialmente útiles en el análisis de datos y en la toma de decisiones basada en datos.
Un ejemplo de una distribución con alta curtosis positiva y asimetría positiva podría ser la distribución de salarios en una empresa. Si la mayoría de los empleados tienen salarios cercanos al valor promedio, pero hay algunos empleados con salarios extremadamente altos, esto daría lugar a una distribución puntiaguda con colas pesadas hacia la derecha.
Por otro lado, un ejemplo de una distribución con baja curtosis y asimetría cercana a cero podría ser la distribución de alturas de una población. Si la mayoría de las personas tienen alturas cercanas a la media y no hay una concentración significativa de personas muy altas o muy bajas, esto daría lugar a una distribución más simétrica y cercana a una distribución normal.