Logo Studenta

UNIDAD 02-Guía de Resolución

¡Estudia con miles de materiales!

Vista previa del material en texto

1 
 
 
 
 UNIDAD 02: GUÍA DE RESOLUCIÓN 
 
Ejercicio N°1.-¿Cuál de las siguientes afirmaciones es INCORRECTA?. Justificar la 
respuesta. 
 La MAD es una medida de dispersión más robusta que el rango. 
 El rango se puede calcular con cualquier tipo de variables. (X) 
 La media sólo se calcula en variables cuantitativas. 
 La moda es la observación que se presenta con mayor frecuencia. 
 La mediana es un índice adecuado cuando se encuentran valores extremos en una 
distribución. 
 
Ejercicio N°2.-En una empresa ,se pagó salarios anuales de la siguiente manera: $82000 a 
cada uno de los 5 administrativos, $142.000 a cada uno de los dos abogados y tres 
contadores y $385.000 al gerente .En base a ello, responde: 
a)¿Cuál fue el salario promedio?. �̅� = 136.818,20 
b)¿Cuántos de los empleados ganaron menos que la media?. (5) cinco 
c)¿Cuál es la mediana del salario?.¿Qué significa en función de la variable? 𝑥 = 142.000 
Significa que el 50% inferior, de la cantidad de empleados, gana a lo sumo $ 142.000 
anuales. 
d)Si el año pasado, la empresa no modificó los salarios, a excepción del gerente que 
percibió $432.000 , ¿cuál es el nuevo valor de la media? �̅� = 141.090,90 
¿cómo se ve afectada respecto a la situación anterior? Se ve afectada por el nuevo valor 
extremo. 
¿dicho cambio afecta a la mediana?.Justifica. No afecta a la mediana, porque ésta no 
es afectada por los valores extremos, como le ocurre a la media. 
 
Ejercicio N°3.- Con relación a los datos del Ej. 14 del Trabajo Práctico N°1: 
a)Calcule la moda de la distribución. 𝑥 = 7500 
2 
 
 
b)Determine la razón entre quienes ganan más y los que ganan menos. 
𝟏
𝟐
 
c)Si hubiese 1000 empleados en lugar de 70 : 
 ¿Cuántos de ellos ganarían entre $7000 y $8000?. = , entonces x≅ 243 
 ¿Cuántos ganarían mas de $9000?. = , entonces x≅ 300 
 
 
Ejercicio N°4.- Para la distribución de frecuencias dada por la tabla: 
 X 1 2 3 4 5 
 fr 5 1 2 4 6 
 Colocar V o F según corresponda, dando razones de cada respuesta. 
A)La media es aproximadamente 3 V C)La moda es 5 V (es el que más se repite) 
B)El rango es 1 F(R=5-1) 
D)La mediana es 4 V (es el valor que se encuentra entre el 9° y 10° lugar) 
 
Ejercicio N°5.- Responde a las siguientes cuestiones: 
1° -¿Cuál es la opción correcta?: La opción C 
 A El recorrido sólo toma en cuenta los 
valores centrales de la distribución. 
 C La media es un punto de equilibrio de 
una distribución de puntajes. 
 B La mediana está afectada por los 
valores extremos de una distribución 
de puntajes. 
 D La media es la medida de tendencia 
central más robusta y representativa. 
 C La MAD es el promedio de desvíos 
respecto a la media. 
 E La moda es la medida de dispersión 
más representativa de una muestra . 
2°.- 
a)Qué significa que el valor de la desviación estándar, para un conjunto de observaciones 
esté muy próxima a cero?.Los valores de la distribución están muy próximos entre sí y 
respecto de la media. 
3 
 
 
b)¿Qué decisión se debiera tomar para poder explicar el comportamiento de una muestra, 
de manera fiable, si el CV de la distribución correspondiente es igual al 69%?. 
Si CV=69% > 20%, significa que hay mucha heterogeneidad entre los datos. En 
consecuencia podría establecerse que la media no es representativa de los datos que 
conforman dicha muestra. 
c)Un grupo de 20 estudiantes tienen una altura promedio de 1,79 m. Si se incorpora otro 
estudiante que mide 1,50m, ¿cuál es el promedio de los 21 estudiantes?. 
�̅� =
∑ 𝑥
20
→
∑ 𝑥
20
= 1,79 → 𝑥 = 20 . 1,79 → 𝑥 = 𝟑𝟓, 𝟖 
Si ahora se incorpora, el dato número 21, cuyo valor es 1,50 tenemos que : 
∑ 𝑥
21
=
∑ 𝑥 + 1,5
21
=
35,8 + 1,5
21
≅ 𝟏, 𝟕𝟕𝟔 𝒎 
Ejercicio N°6.-En base a las afirmaciones: 
A)Después de agrupar un conjunto de datos en cierto número de intervalos, la mediana se 
encuentra necesariamente en el intervalo que tiene mayor número de observaciones. 
B)La varianza es la raíz cuadrada de la desviación estándar correspondiente. 
¿Cuál es la correcta de las siguientes?. Justifique su elección 
 A es verdadera y B es falsa. 
 B es verdadera y A es falsa. 
 A y B son falsas. (X) 
 A y B son verdaderos. 
 
Ejercicio N°7.-El siguiente cuadro muestra las estaturas de 24 personas : 
1,62 1,75 1,60 1,41 1,93 2,00 1,71 1,68 1,60 1,85 1,83 1,57 1,54 1,62 1,93 
1,84 2,01 1,70 1,85 2,05 1,66 1,90 1,65 1,67 
Calcula la media aritmética, la mediana, la moda ,la MAD ,el coeficiente de variación y el 
Rango Intercuartílico (R.I). Interpreta los resultados obtenidos. 
Media: �̅� = 1,749, 
Desviación estándar: 𝑠 ≅ 0,1676 
4 
 
 
Mediana: Ordenando los datos de menor a mayor, se encuentra que, los valores mas 
centrales son: 1,70 y 1,71. Por lo tanto, la mediana es 1,705 
Moda: Es bimodal ya que hay dos valores que más se repiten, ellos son : 1,62 y 1,70. 
MAD: 0,13 
Coeficiente de variación: CV=
,
,
. 100 →CV=0,0958 . 100→CV≅ 9,58% 
Rango Intercuartílico: R.I=Q3-Q1=0,23 
Conclusiones: 
 Como el C.V es menor que el 20%, significa que hay homogeneidad entre los datos. 
Por lo tanto, la media es representativa de los mismos. 
 Como media, mediana y moda están, algo próximas entre sí, habría cierta simetría 
en la distribución de los datos. 
 El R.I . no está influenciado por los valores extremos, ya que es la diferencia entre 
el tercer y primer Cuartil. Este valor indica que el 50% central de los datos tiene una 
dispersión igual a 0,238 (algo mayor que la desviación típica obtenida). 
Ejercicio N°8.-Con relación a los datos del Ej .7 del Trabajo Práctico N°1, responde: 
a)¿Cuántas hectáreas cultivadas, en promedio, fueron afectadas por los incendios en ese 
período de tiempo?. 13.812,43 
b)¿Cuál es la variabilidad absoluta del número de hectáreas afectadas por los incendios en 
relación a la media?. S= 6.007,27 ó v=36.087,29 
c)Calcule la mediana y la variabilidad respecto de ésta. 15.648,5 y 4,430 respectivamente 
d)Calcule la variación relativa en el conjunto total de hectáreas afectadas.CV=43,5% 
e)¿Es representativa la media del conjunto de datos?, ¿por qué?.Hay escasa 
representatividad ya que CV>20% ( algo mayor que el 20%). 
 
Ejercicio N°9.-En un estudio de datos de los archivos personales de los empleados de una 
Universidad, el coeficiente de asimetría para la edad de los empleados es -2,25. Interprete 
este resultado en función a las edades de los empleados. 
El grupo de empleados presenta una asimetría negativa. Hay entonces una concentración de 
los puntajes hacia la derecha de la distribución. Ello significa que hay más empleados de 
mayor edad. 
5 
 
 
Ejercicio N°10.-Marque con verdadero o falso según corresponda, dando razones de cada 
respuesta. 
 Una distribución leptocúrtica es más aplanada que una mesocúrtica ya que el 
Cu < 2,7. (F) 
 En una distribución asimétrica negativa la acumulación de puntajes está a izquierda. 
(F) 
 Todo alumno que tenga un promedio general de 7 ha promocionado todas las 
materias que ha rendido. (F) 
 El coeficiente de variación es alto si excede el20% y ,por lo tanto, la media es 
representativa de los datos. (F) 
 La media no siempre es la medida de resumen más representativa de una 
distribución. (V) 
 
Ejercicio N°11.- Conrelación a los datos del Ej.6 del Trabajo Práctico N°1: 
a)Determine la edad promedio que poseen de los sujetos de la muestra. �̅� = 55,425 
b)¿Cuál es la brecha entre el sujeto que más edad tiene y el que menos edad tiene?. 𝑅 = 66 
c)¿Cuál es la variabilidad respecto a la media en el conjunto total de sujetos?. 𝑠 = 55,4𝟐 
d) Calcule mediana y moda de la distribución.58 y 61 respectivamente 
e)Teniendo en cuenta los valores de media, mediana y moda ,¿qué puede decir acerca de la 
simetría o asimetría de los datos?. Teniendo en cuenta que �̅� < 𝑥 < 𝑥, se concluye que es 
una distribución asimétrica negativa. 
Ejercicio N°12.-En base a los resultados obtenidos en el Ejemplo dado en Teoría Unidad 1, 
respecto a la pérdida de cierto cultivo (en toneladas por hectárea), a raíz de distintos focos 
de incendio registrados, durante un año, en 42 regiones de una zona del país. 
17,2 13,5 17,7 20,1 13,7 16,6 18,0 18,9 14,4 13,5 19,3 15,4 17,6 21,6 
17,8 18,8 10,2 12,1 18,6 16,0 15,7 17,2 9,9 17,9 19,7 15,5 12,8 19,0 
20,0 14,8 18,8 13,9 19,3 22,8 13,9 15,7 14,2 18,4 17,1 9,9 13,9 14,2 
Se pide calcular e interpretar, en cada caso, en el contexto de la situación planteada: 
a)Media , mediana y moda. 
Media : 16,32, lo que significa que, la pérdida en promedio por ha es 16,32 tn 
6 
 
 
Mediana: 16,85, lo que significa que, el 50% de las regiones tiene pérdidas de 16,85 tn por 
ha o menos. 
Moda: 13,9 , lo que significa que, la pérdida con mayor frecuencia es de 13,9 tn por ha. 
b)Desviación estándar , coeficiente de variación y MAD.. 
Desviación estándar: 3,059 
MAD: 2,30 
CV: 18,74% 
Dado que CV < 20%, el promedio es representativo de las pérdidas registradas en las 42 
regiones 
c)Coeficientes de asimetría y curtosis. 
Para obtener estos coeficientes, conviene encolumnar los datos y efectuar los cálculos 
correspondientes, como se indica a continuación, con algunos valores de la distribución 
dada. 
tn/ha xi - 𝒙 (xi -𝒙 )
3 (xi - 𝒙 )
4 
17,2 0,88 0,681472 0,599695 
13,5 -2,82 -22,42576 63,24066 
17,7 1,38 2,628072 3,626739 
20,1 3,78 54,0100152 204,158375 
13,7 -2,62 -17,984728 47,119987 
16,6 0,28 0,021952 0,006147 
……….. …….. ………… ………….. 
………… …….. …………. …………. 
 
Totales -293,068736 9068,738159 
Entonces: m3=-6,977827 , m4=215,922337 
Por lo tanto , coef de asimetría AS= - 0,2438 y coef . de curtosis: CU =2,4659 
7 
 
 
Dado que AS se encuentra en el intervalo (-0,3 , 0,3) , ello significa , que hay bastante 
simetría en la distribución de los datos respecto de la media. 
Dado que CU < 2,7 , ello significa , que la distribución es platicúrtica (los datos están muy 
dispersos alrededor de la media) 
d)Los valores de P10 y P90. 
Posición del percentil 10 :
 .
+ 0,5=4,7( se encuentra entre el 4° y 5° lugar) 
→P10=12,45. Eso significa que el 10% inferior tiene a lo sumo 12,45 tn/ha de pérdidas. De 
otra manera, el 90% superior tiene pérdidas de al menos 12,45 tn/ha. 
Posición del percentil 90 :
 .
+ 0,5=38,3( se encuentra entre el 38° y 39° lugar) 
→P90=19,85. Eso significa que el 10% superior tiene como mínimo 19,85 tn/ha de 
pérdidas. De otra manera, el 90% inferior tiene pérdidas de a lo sumo 19,85 tn/ha. 
 
Ejercicio N°13.- Con relación a los datos del Ej .7 del Trabajo Práctico N°1: 
a)¿Cuál es la razón de hectáreas afectadas en el año 2003 por cada hectárea afectada en el 
año 2010?. 45/100 aproximadamente. 
b)¿Cuál es la razón entre las hectáreas afectadas en el año 2010 y las afectadas en el año 
2013?. 21/100 aproximadamente . 
c)Si en ese período hubiesen sido afectadas 100000 has, ¿cuántas deberían corresponder al 
año 2013?. 8566,65 tn/ha aproximadamente. 
 
Ejercicio N°14.-Los siguientes datos corresponden al tiempo (en minutos) que tardan en 
viajar, un grupo de estudiantes desde su casa hasta la universidad. 
 28 19 62 35 21 26 43 54 23 41 42 32 25 
 31 31 33 16 37 64 53 36 38 25 32 29 33 
 Los que tardan hasta media hora en llegar ,¿cuánto tardan en promedio? , ¿y los que 
tardan más de media hora?. ¿Cuál de los dos grupos es más heterogéneo y por qué?. 
Grupo 1: media= 23,56 y desvío estándar=4,24, cv≅0,18 
Grupo 2: media= 41 y desvío estándar=10,79, cv≅0,26 
En el grupo 2 hay más heterogeneidad por tener mayo cv. 
 
8 
 
 
 ¿Cuánto minutos tarda como mínimo en llegar el 50% más rápido del grupo?.¿Qué 
representa ese valor? 
Ordenando los valores se obtiene que la mediana es 32,5. 
Entonces, como mínimo tardan 32,5 minutos el grupo más rápido. 
 
Ejercicio N°15.-Con relación al Ej. 5 del P.1,determine: 
a) La razón entre las personas que tienen Grupo Sanguíneo A, por cada uno que tiene 
Grupo Sanguíneo B. 42/12 
b)La razón entre la cantidad de las personas que tienen Grupo Sanguíneo AB y los que 
tienen Grupo Sanguíneo O. 5/41 
c)La moda . A 
d)Si ,en ese grupo de personas, ingresaran dos más ,¿cuántas se espera que tengan Grupo 
Sanguíneo 0?. 
𝟒𝟏
𝟏𝟎𝟎
=
𝑿
𝟏𝟎𝟐
→ 𝑿 ≅ 𝟒𝟐 
 
Ejercicio N° 16.-Respecto de los datos proporcionados en el Ej.14 del P:1, se pide: 
a)Determine las medidas de centralización y de dispersión más adecuadas e interprete los 
resultados obtenidos en función de la variable medida. 
�̅� = 11,14 s≅ 1,8 cv≅ 16% 
Como cv < 20%, la media es representativa de los datos. En promedio el consumo del 
combustible es de 11,14 l/ 100 km. 
b)Calcule P10 y P25 e interprete los resultados obtenidos. 
Posición del percentil 10 :
 .
+ 0,5= 3,5 ( se encuentra entre el 3° y 4° lugar) →P10=9,7. 
Eso significa que el 10% inferior de esos automóviles consume a lo sumo 9,7 litros/100 
km . De otra manera, el 90% superior consume por lo menos 9,7 litros/100 km. 
Posición del percentil 25 :
.
+ 0,5=8 ( se encuentra en el 8° lugar) →P25=10,1. Eso 
significa que el 25% inferior consume a lo sumo 10,1 litros / 100km. 
c)Calcule los coeficientes de asimetría y curtosis e interprete , de acuerdo a la variable, los 
resultados obtenidos. 
Para obtener estos coeficientes, conviene encolumnar los datos y efectuar los cálculos 
correspondientes, como se propuso en el Ejercicio N° 12. 
9 
 
 
Litros/100 km (xi) xi - 𝒙 (xi - 𝒙 )
3 (xi - 𝒙 )
4 
 12,3 12,3-11,14 (12,3-11,14)3=1,561 (12,3-11,14)4=1,811 
 9,1 9,1- 11,14 (9,1- 11,14)3=8,489 (9,1- 11,14)4=17,329 
 ………… …………………. ………………………. ………………………. 
Finalizando los cálculos se concluye que : 
 m3= 1,863 y m4=119,3 aproximadamente 
Por lo tanto, coef de asimetría AS=-0,32 y coef . de curtosis: CU =11,36 
Dado que AS > 0,3, ello significa, que hay una moderada asimetría positiva alrededor de 
la media. 
Dado que CU > 2,7, ello significa que, la distribución es leptocúrtica (los datos presentan un 
gran abultamiento alrededor de la media)

Continuar navegando