Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Examen Parcial 1 Estadística 1. ¿Qué es la varianza y cómo se calcula? La varianza es una medida de dispersión que indica cuánto se alejan los datos de la media. Se calcula sumando los cuadrados de las desviaciones de cada dato respecto a la media, dividiendo esta suma entre el número total de datos y se le llama varianza muestral. Si se desea obtener la varianza poblacional, se divide entre el número total de datos menos uno. 2. ¿Qué es la desviación estándar y cómo se calcula? La desviación estándar es otra medida de dispersión que indica cuánto se alejan los datos de la media. Se calcula tomando la raíz cuadrada de la varianza. Al igual que la varianza, existen dos tipos de desviación estándar: la muestral y la poblacional. 3. ¿Cómo se interpretan la varianza y la desviación estándar? La varianza y la desviación estándar se interpretan como la dispersión de los datos respecto a la media. Una varianza alta indica que los datos están muy alejados de la media, mientras que una varianza baja indica que los datos están cercanos a la media. Lo mismo sucede con la desviación estándar. 4. ¿Qué es la regla empírica? La regla empírica es una regla general que indica que en una distribución normal, aproximadamente el 68% de los datos están dentro de una desviación estándar de la media, el 95% de los datos están dentro de dos desviaciones estándar de la media y el 99.7% de los datos están dentro de tres desviaciones estándar de la media. 5. ¿Qué es la distribución normal y por qué es importante en estadística? La distribución normal es una distribución de probabilidad continua que se utiliza para modelar muchos fenómenos naturales y sociales. Es importante en estadística porque muchas de las técnicas estadísticas se basan en la suposición de que los datos siguen una distribución normal. 6. ¿Qué es la asimetría y cómo se calcula? La asimetría es una medida de la simetría de una distribución. Se calcula restando la media de la moda y dividiendo esta diferencia entre la desviación estándar. 7. ¿Qué es la curtosis y cómo se calcula? La curtosis es una medida de la forma de una distribución. Se calcula a partir de la media y la desviación estándar de la distribución. Una distribución con una curtosis alta es más puntiaguda que una distribución normal, mientras que una distribución con una curtosis baja es más aplanada que una distribución normal. 8. ¿Qué es la hipótesis nula y la alternativa? La hipótesis nula es una afirmación que se quiere comprobar. La hipótesis alternativa es la afirmación contraria a la hipótesis nula que se quiere contrastar. 9. ¿Qué es el error estándar y cómo se calcula? El error estándar es una medida de la precisión de una estimación estadística. Se calcula dividiendo la desviación estándar 9. (Continuación) Se calcula dividiendo la desviación estándar de la muestra entre la raíz cuadrada del tamaño de la muestra. 10. ¿Qué es el intervalo de confianza y cómo se interpreta? El intervalo de confianza es un rango de valores que contiene la verdadera media poblacional con un cierto nivel de confianza. Por ejemplo, si se tiene un intervalo de confianza del 95% para la media poblacional, esto significa que si se repitiera el experimento muchas veces, el 95% de los intervalos de confianza calculados contendrían la verdadera media poblacional. 11. ¿Qué es el coeficiente de variación y cómo se interpreta? El coeficiente de variación es una medida de la variabilidad relativa de los datos respecto a su media. Se calcula dividiendo la desviación estándar entre la media y se expresa en porcentaje. Un coeficiente de variación bajo indica que los datos son homogéneos, mientras que un coeficiente de variación alto indica que los datos son heterogéneos. 12. ¿Qué es la correlación y cómo se interpreta? La correlación es una medida de la relación entre dos variables. Puede variar de - 1 a 1, donde -1 indica una correlación negativa perfecta, 0 indica ausencia de correlación y 1 indica una correlación positiva perfecta. Una correlación negativa indica que cuando una variable aumenta, la otra disminuye y viceversa, mientras que una correlación positiva indica que cuando una variable aumenta, la otra también aumenta y viceversa. 13. ¿Qué es la regresión lineal y cómo se utiliza? La regresión lineal es una técnica estadística que se utiliza para modelar la relación entre dos variables. Se utiliza para predecir el valor de una variable a partir del valor de otra variable. Se ajusta una línea recta a los datos que mejor se ajuste a ellos y se utiliza esta línea para hacer las predicciones. 14. ¿Qué son los residuos y cómo se interpretan en regresión lineal? Los residuos son la diferencia entre los valores observados y los valores predichos por la regresión lineal. Se interpretan como la cantidad de error que tiene el modelo en hacer la predicción. Si los residuos son pequeños y están aleatorizados, esto indica que el modelo es adecuado para los datos. 15. ¿Qué es el coeficiente de determinación y cómo se interpreta? El coeficiente de determinación es una medida de la proporción de la variabilidad de la variable dependiente que es explicada por la variable independiente. Puede variar de 0 a 1, donde 0 indica que la variable independiente no explica nada de la variabilidad de la variable dependiente y 1 indica que la variable independiente explica toda la variabilidad de la variable dependiente. 16. ¿Qué es la prueba t y cómo se utiliza? La prueba t es una técnica estadística que se utiliza para comparar las medias de dos muestras independientes. Se utiliza para determinar si la diferencia entre las medias es significativa o se debe al azar. Se calcula a partir de la diferencia entre las medias, la desviación estándar de las muestras y el tamaño de las muestras. 17. ¿Qué es la prueba F y cómo se utiliza? La prueba F es una técnica estadística que se utiliza para (Continuación) comparar las varianzas de dos o más muestras. Se utiliza para determinar si la diferencia en las varianzas es significativa o se debe al azar. Se calcula a partir de la relación entre las varianzas de las muestras. 18. ¿Qué es la prueba chi-cuadrado y cómo se utiliza? La prueba chi-cuadrado es una técnica estadística que se utiliza para determinar si hay una asociación entre dos variables categóricas. Se utiliza para comparar la frecuencia observada de cada categoría con la frecuencia esperada, que se calcula a partir de una hipótesis nula de independencia entre las variables. Si la diferencia entre la frecuencia observada y la frecuencia esperada es grande, se rechaza la hipótesis nula y se concluye que hay una asociación entre las variables. 19. ¿Qué es el análisis de varianza (ANOVA) y cómo se utiliza? El análisis de varianza es una técnica estadística que se utiliza para comparar las medias de dos o más muestras independientes. Se utiliza para determinar si hay una diferencia significativa entre las medias de las muestras. El ANOVA calcula la varianza entre las muestras y la varianza dentro de las muestras, y compara estas dos varianzas para determinar si la diferencia entre las medias es significativa o se debe al azar. 20. ¿Qué es la distribución normal y por qué es importante en estadística? La distribución normal es una distribución de probabilidad continua que tiene una forma de campana simétrica. Es importante en estadística porque muchos fenómenos naturales y sociales siguen esta distribución, lo que permite a los estadísticos hacer inferencias sobre la población a partir de la muestra. Además, muchas técnicas estadísticas se basan en supuestos de normalidad, por lo que la distribución normal es fundamental en la estadística.
Compartir