Logo Studenta

TEMA_1__DescriptivaUnivariante_Problemas_EDB_2017_I

¡Estudia con miles de materiales!

Vista previa del material en texto

TEMA 1: Estadística Descriptiva 
PROBLEMAS PROPUESTOS 
 
 
 
1. Un medio de comunicación realiza un estudio en el que se concluye que, en las próximas 
navidades, los españoles se gastarán una media de 400 euros per cápita en regalos. Por otra 
parte, los economistas nos dicen que la distribución del gasto per cápita de cualquier bien sigue 
una distribución unimodal asimétrica positiva. ¿Qué pensará entonces la mayoría de españoles 
ante la información del gasto medio en regalos que dice el medio de comunicación? Les 
parecerá que exageran o les parecerá que se han quedado cortos en su apreciación del gasto? 
 
 
2. ¿Cuál de las siguientes afirmaciones es más correcta? 
a. Si un conjunto de datos tiene coeficiente de asimetría 𝐶𝐴 > 0, su histograma mostrará 
una asimetra positiva. 
b. Si un histograma muestra una asimetra positiva, se tendrá que 𝐶𝐴 > 0 
 
 
3. Justifica si las siguientes afirmaciones son verdaderas o falsas sobre un conjunto cualquiera de 
datos. 
a. Es posible que la mayora de los datos estén por debajo de la media. 
b. Es imposible que la mayora de los datos estén por encima de la media. 
c. Cuando una distribución unimodal tene asimetría positiva la mayoría de los datos 
estarán por debajo de la mediana. 
d. Moviendo un solo dato podemos aumentar la varianza todo lo que queramos. 
e. Moviendo un solo dato podemos aumentar El rango todo lo que queramos. 
f. Moviendo un solo dato podemos aumentar percentil 10 todo lo que queramos. 
g. Si en un conjunto de datos aumentase la varianza, aumentará también el rango. 
h. El rango es insensible a valores atípicos. 
 
 
4. ¿Cuáles de las siguientes afirmaciones sobre el box-plot de la figura son ciertas y cuáles son 
falsas? Justifica la respuesta. (Nota: el símbolo + en el interior de la caja es la media muestral). 
 
a. Los datos sugieren tener asimetría negativa. 
b. Hay más datos a la derecha de la mediana que a la izquierda. 
c. Hay claramente datos atípicos. 
d. Como la media no es igual a la mediana, la distribución tendrá kurtosis elevada. 
e. El box-plot está mal calculado. 
 
 
 
 
 
5. ¿Cuáles de las siguientes afirmaciones sobre el box-plot de la figura son ciertas y cuáles son 
falsas? Justifica la respuesta. (Nota: el símbolo + en el interior de la caja es la media muestral). 
 
 
a. La mediana es 43. 
b. El máximo dato es 10 unidades mayor que el mínimo. 
c. El rango intercuartílico es 5. 
d. Sólo el 25% de los datos es mayor que 44. 
e. El Coeficiente de Asimetría de Pearson es 0. 
 
 
6. Un analista propone la siguiente medida de dispersión para un conjunto de datos 𝑥1, . . . , 𝑥𝑛: 
 
𝐷 =
∑𝑛𝑖=1 (𝑥𝑖 − �̅�)
𝑛
 
 
Demuestra que 𝐷 = 0 para cualquier conjunto de datos y por tanto no sirve para medir nada. 
 
 
7. Una máquina ha producido 1.837.554 piezas iguales. El 80% de dichas piezas no tenían ningún 
defecto, el 10 % de las piezas tena un defecto, el 7% de las piezas tena 2 defectos, y el restante 
3% tena 3 defectos. ¿Cuantos defectos por artículo ha producido esta máquina por término 
medio? 
 
SOLUCIÓN: 
�̅� = 0.33 defectos/artículo 
 
8. Cuando en los datos hay valores muy extremos, ¿cuál de los siguientes pares de medidas 
descriptivas de localización y dispersión, respectivamente, no se verán afectadas? Justifica la 
respuesta. 
a. La media y la desviación típica. 
b. La mediana y el rango intercuartílico. 
c. Moda y CV. 
 
9. Justifica brevemente si son ciertas o falsas cada una de las siguientes cuestiones: Si a un 
conjunto de datos le quitamos los datos correspondientes al máximo y al mínimo… 
a. La media no cambia. 
b. La mediana no cambia. 
c. El rango no cambia. 
d. El rango intercuartílico disminuye. 
 
 
10. A partir de los siguientes resultados proporcionados por Minitab, haz un resumen estadístico 
de la variable VAR destacando los aspectos más importantes. 
 
 
1210864
40
30
20
10
0
VAR
F
re
c
u
e
n
c
ia
Histograma de VAR
 
SOLUCIÓN: 
El histograma muestra una distribución unimodal, con moda en torno a 10, con valores entre, 
aproximadamente, 7 y 12.7, bastante simétrica y con un valor atípico en 4.1. Este valor es 
claramente atípico, al alejarse del patrón que forma el resto de los datos. Este dato está muy 
distante por lo que va a distorsionar el valor de muchas medidas características que aparecen 
en el enunciado. Por ejemplo, el coeficiente de asimetría resulta ser -0.71, lo que sugeriría 
asimetría negativa. Esta concusión sería errónea, pues los datos son claramente simétricos 
alrededor del 10. Los valores de media, varianza y kurtosis tampoco son fiables. Habría que 
eliminar ese dato y recalcular las medidas características. 
 
 
11. La siguiente figura se ha construido con las calificaciones de un examen para dos grupos de 
alumnos diferentes. ¿En qué grupo te gustaría haber realizado el examen? Justifica tu 
respuesta. 
 
181614121086
100
80
60
40
20
0
Calificaciones
P
o
rc
e
n
ta
je
 a
cu
m
u
la
d
o
A
B
Grupo
Calificaciones examen
 
 
 
12. Demuestra que si 𝑦 = 𝑎 + 𝑏𝑥, con 𝑎, 𝑏 ∈ ℝ, entonces �̅� = 𝑎 + 𝑏�̅�. 
 
13. Demuestra que la varianza también puede calcularse mediante 
∑ ∑ (𝑥𝑖 − 𝑥𝑗)
2𝑛
𝑗=1
𝑛
𝑖=1
2𝑛2
 
 
14. Encuentre el valor 𝑎 que minimiza 
∑ (𝑥𝑖 − 𝑎)
2𝑛
𝑖=1
𝑛
 
 
15. Demuestre que la media aritmética de los datos de la variable 𝑧 obtenida sumando los datos 
de otras dos variables, 𝑥 e 𝑦, es la suma de las medias aritméticas �̅� e �̅�. 
 
16. Demostrar que si se multiplican todos los datos que se tienen de una variable por 𝑘 > 0, la 
media y la desviación típica también quedan multiplicados por 𝑘. 
 
17. Se tienen 𝑛 artículos manufacturados, de los cuales 𝑑 son defectuosos y 𝑛 − 𝑑 son 
aceptables. Asignamos a cada artículo una variable 𝑥 que toma valor 1 si el artículo es 
aceptable y 0 si es defectuoso. Demuestra que �̅� es la proporción de artículos aceptables.

Continuar navegando