Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
TEMA 1: Estadística Descriptiva PROBLEMAS PROPUESTOS 1. Un medio de comunicación realiza un estudio en el que se concluye que, en las próximas navidades, los españoles se gastarán una media de 400 euros per cápita en regalos. Por otra parte, los economistas nos dicen que la distribución del gasto per cápita de cualquier bien sigue una distribución unimodal asimétrica positiva. ¿Qué pensará entonces la mayoría de españoles ante la información del gasto medio en regalos que dice el medio de comunicación? Les parecerá que exageran o les parecerá que se han quedado cortos en su apreciación del gasto? 2. ¿Cuál de las siguientes afirmaciones es más correcta? a. Si un conjunto de datos tiene coeficiente de asimetría 𝐶𝐴 > 0, su histograma mostrará una asimetra positiva. b. Si un histograma muestra una asimetra positiva, se tendrá que 𝐶𝐴 > 0 3. Justifica si las siguientes afirmaciones son verdaderas o falsas sobre un conjunto cualquiera de datos. a. Es posible que la mayora de los datos estén por debajo de la media. b. Es imposible que la mayora de los datos estén por encima de la media. c. Cuando una distribución unimodal tene asimetría positiva la mayoría de los datos estarán por debajo de la mediana. d. Moviendo un solo dato podemos aumentar la varianza todo lo que queramos. e. Moviendo un solo dato podemos aumentar El rango todo lo que queramos. f. Moviendo un solo dato podemos aumentar percentil 10 todo lo que queramos. g. Si en un conjunto de datos aumentase la varianza, aumentará también el rango. h. El rango es insensible a valores atípicos. 4. ¿Cuáles de las siguientes afirmaciones sobre el box-plot de la figura son ciertas y cuáles son falsas? Justifica la respuesta. (Nota: el símbolo + en el interior de la caja es la media muestral). a. Los datos sugieren tener asimetría negativa. b. Hay más datos a la derecha de la mediana que a la izquierda. c. Hay claramente datos atípicos. d. Como la media no es igual a la mediana, la distribución tendrá kurtosis elevada. e. El box-plot está mal calculado. 5. ¿Cuáles de las siguientes afirmaciones sobre el box-plot de la figura son ciertas y cuáles son falsas? Justifica la respuesta. (Nota: el símbolo + en el interior de la caja es la media muestral). a. La mediana es 43. b. El máximo dato es 10 unidades mayor que el mínimo. c. El rango intercuartílico es 5. d. Sólo el 25% de los datos es mayor que 44. e. El Coeficiente de Asimetría de Pearson es 0. 6. Un analista propone la siguiente medida de dispersión para un conjunto de datos 𝑥1, . . . , 𝑥𝑛: 𝐷 = ∑𝑛𝑖=1 (𝑥𝑖 − �̅�) 𝑛 Demuestra que 𝐷 = 0 para cualquier conjunto de datos y por tanto no sirve para medir nada. 7. Una máquina ha producido 1.837.554 piezas iguales. El 80% de dichas piezas no tenían ningún defecto, el 10 % de las piezas tena un defecto, el 7% de las piezas tena 2 defectos, y el restante 3% tena 3 defectos. ¿Cuantos defectos por artículo ha producido esta máquina por término medio? SOLUCIÓN: �̅� = 0.33 defectos/artículo 8. Cuando en los datos hay valores muy extremos, ¿cuál de los siguientes pares de medidas descriptivas de localización y dispersión, respectivamente, no se verán afectadas? Justifica la respuesta. a. La media y la desviación típica. b. La mediana y el rango intercuartílico. c. Moda y CV. 9. Justifica brevemente si son ciertas o falsas cada una de las siguientes cuestiones: Si a un conjunto de datos le quitamos los datos correspondientes al máximo y al mínimo… a. La media no cambia. b. La mediana no cambia. c. El rango no cambia. d. El rango intercuartílico disminuye. 10. A partir de los siguientes resultados proporcionados por Minitab, haz un resumen estadístico de la variable VAR destacando los aspectos más importantes. 1210864 40 30 20 10 0 VAR F re c u e n c ia Histograma de VAR SOLUCIÓN: El histograma muestra una distribución unimodal, con moda en torno a 10, con valores entre, aproximadamente, 7 y 12.7, bastante simétrica y con un valor atípico en 4.1. Este valor es claramente atípico, al alejarse del patrón que forma el resto de los datos. Este dato está muy distante por lo que va a distorsionar el valor de muchas medidas características que aparecen en el enunciado. Por ejemplo, el coeficiente de asimetría resulta ser -0.71, lo que sugeriría asimetría negativa. Esta concusión sería errónea, pues los datos son claramente simétricos alrededor del 10. Los valores de media, varianza y kurtosis tampoco son fiables. Habría que eliminar ese dato y recalcular las medidas características. 11. La siguiente figura se ha construido con las calificaciones de un examen para dos grupos de alumnos diferentes. ¿En qué grupo te gustaría haber realizado el examen? Justifica tu respuesta. 181614121086 100 80 60 40 20 0 Calificaciones P o rc e n ta je a cu m u la d o A B Grupo Calificaciones examen 12. Demuestra que si 𝑦 = 𝑎 + 𝑏𝑥, con 𝑎, 𝑏 ∈ ℝ, entonces �̅� = 𝑎 + 𝑏�̅�. 13. Demuestra que la varianza también puede calcularse mediante ∑ ∑ (𝑥𝑖 − 𝑥𝑗) 2𝑛 𝑗=1 𝑛 𝑖=1 2𝑛2 14. Encuentre el valor 𝑎 que minimiza ∑ (𝑥𝑖 − 𝑎) 2𝑛 𝑖=1 𝑛 15. Demuestre que la media aritmética de los datos de la variable 𝑧 obtenida sumando los datos de otras dos variables, 𝑥 e 𝑦, es la suma de las medias aritméticas �̅� e �̅�. 16. Demostrar que si se multiplican todos los datos que se tienen de una variable por 𝑘 > 0, la media y la desviación típica también quedan multiplicados por 𝑘. 17. Se tienen 𝑛 artículos manufacturados, de los cuales 𝑑 son defectuosos y 𝑛 − 𝑑 son aceptables. Asignamos a cada artículo una variable 𝑥 que toma valor 1 si el artículo es aceptable y 0 si es defectuoso. Demuestra que �̅� es la proporción de artículos aceptables.
Compartir