Logo Studenta

Guía_Práctica_3_Variables_Cuantitativas

¡Estudia con miles de materiales!

Vista previa del material en texto

Guía práctica 3-Variables Cuantitativas 
Bioestadística UNM 2020 
 
 
Problema 1 
Observe los siguientes histogramas y responda: 
 
a) ¿En cuáles de ellos espera que el coeficiente de asimetría sea mayor que cero? 
b) ¿En cuáles de ellos espera que el coeficiente de asimetría sea menor que cero? 
c) ¿En cuáles de ellos espera que el coeficiente de asimetría sea aprox. igual a cero? 
d) ¿En cuáles de ellos espera que la media sea mayor que la mediana? 
e) ¿En cuáles de ellos espera que la media sea menor que la mediana? 
f) ¿En cuáles de ellos espera que la media sea aproximadamente igual que la mediana? 
g) ¿En cuáles de ellos espera que la media, la mediana y la moda coincidan? 
h) ¿Hay alguna distribución aproximadamente simétrica pero donde no se cumpla que 
media=mediana=moda? 
I) ¿En cuál de éstas distribuciones podría aplicar el teorema de Chebyshev? 
J) Marque en cada gráfico la o las “clases modales” 
 
 
 
 
 
 
 
 
 
Problema 2 
Responda observando los siguientes boxplots: 
 
a) ¿En qué casos los valores con los que se construyó el boxplot coincide con los “5 números 
resumen”? 
b) En aquellos casos en los que no coincidan, indicar cómo se calcula cada parte del boxplot. 
c) ¿Qué gráficos muestran datos atípicos? ¿En qué caso estos datos atípicos son mayores que el 
resto de los datos, y en qué caso son menores que el resto de los datos? 
d) ¿Qué distribuciones espera que tengan coeficiente de asimetría cercano a cero? 
e) ¿Qué distribuciones espera que tengan coeficiente de asimetría mayor a cero? 
f) ¿Qué distribuciones espera que tengan coeficiente de asimetría menor a cero? 
g) ¿En qué gráficos la media es mayor que la mediana? 
h) ¿En qué gráficos la media es menor que la mediana? 
 
Problema 3 
Dado el siguiente conjunto de datos de cantidad de unidades formadoras de colonias de bacteria 
Echerichia coli cepa DH5-alfa en placas de crecimiento de bacterias: 
6 7 16 14 1 26 74 8 10 25 4 67 39 38 49 77 65 76 51 75 28 22 11 64 89 
a) ¿Cuál es la variable? 
b) ¿De qué tipo es? 
c) Arme una tabla de distribución de frecuencias agrupadas (que contenga todos los elementos: 
marca de clase, frecuencias absolutas y relativas) 
d) Grafique el histograma de frecuencias absolutas. No olvide agregar ningún elemento al gráfico! 
e) Grafique el polígono de frecuencias relativas. No olvide agregar ningún elemento al gráfico! 
f) Calcule la media y la mediana 
g) ¿Tiene moda ese conjunto de datos? Si es así, diga cuál/es es/son 
h) ¿Cuál es la clase modal? 
i) ¿Calcule todos los desvios, y corrobore que se cumpla que la suma de todos los desvios da 0. 
j) ¿Cuál es el rango? 
k) Calcule varianza. No olvide de expresar las unidades! 
l) ¿Cuál es el desvio estándar? 
M) Si el coeficiente de variación del número de unidades formadoras de colonias de bacteria E. coli 
cepa O:147 en placas de crecimiento de bacterias es 0,55. ¿Quién tiene mayor dispersión, DH5-alfa 
u O:147? 
n) ¿Cómo espera que sea el coeficiente de asimetría: mayor, menor o aproximadamente igual a 
cero? 
 
Problema 4 
 
En cada caso, responda: 
a) Tomemos la variable “Cantidad de papers publicados por los investigadores de CONICET”. Si 
tenemos que el percentil 66 es 10 papers, interprete qué nos dice ese valor en términos de la 
variable estudiada. 
b) Tomemos la variable “Número de pétalos que tiene una flor cualquiera”. Si tenemos que el 
cuantil 0,88 es 5, interprete ese valor en términos de la variable estudiada. 
c) Tomemos la variable “cantidad de genes en genomas bacterianos”. Si resulta que el primer 
cuartil es 5650 genes, interprete qué nos dice ese valor en términos de la variable estudiada. 
d) Tomemos la variable “volumen de agua que entra dentro de cualquier autoclave”. Si la mediana 
es 4 litros, interprete qué nos dice ese valor en términos de la variable estudiada. 
e) Retomemos el experimento presentado la clase pasada: “Para determinar la tasa de crecimiento 
de los árboles por año (altura, en metros/año), se midieron los mismos 30 eucaliptos de un jardín 
botánico en noviembre de 2016, 2017, 2018, 2019”. Si el primer cuartil es 2,5 metros y el tercer 
cuartil es 4,2 metros, interprete qué nos dicen esos valores teniendo en cuenta el problema. 
f) Retomemos el experimento presentado la clase pasada: “Para determinar si hay dengue en el 
municipio de Moreno, se realizó una inspección en algunas casas próximas a la UNM, buscando 
mosquitos Aedes aegypty. Se registró el número de mosquitos encontrados en cada casa”. Si el 
cuantil 0,22 es 1 mosquito, indique qué nos dice ese valor en términos del problema. 
 
 
 
 
 
 
 
Problema 5 
Responda 
 
a) Si los 5 números resumen para determinado conjunto de datos son: 
mínimo observado: 6 
Q1: 31 
Mediana: 56 
Q3: 78 
máximo observado: 155 
a1) ¿Hay datos atípicos en este conjunto de datos? 
a2) Si grafica un boxplot, ¿los 5 números con los que dibuja la caja y los bigotes coincidirán con 
estos 5 números resumen? En caso de que no coincidan, diga cuáles son los valores con los que 
construiría el boxplot. 
a3) ¿Si tuviera que elegir una medida de centralización para describir alrededor de qué valor se 
centran estos datos: elegiría media, mediana o le da lo mismo elegir cualquiera? ¿Por qué? 
 
b) Si los 5 números resumen para determinado conjunto de datos son: 
mínimo observado: 1 
Q1: 2 
Mediana: 3 
Q3: 5 
máximo observado: 10 
b1) ¿Hay datos atípicos en este conjunto de datos? 
b2) Si grafica un boxplot, ¿los 5 números con los que dibuja la caja y los bigotes coincidirán con 
estos 5 números resumen? En caso de que no coincidan, diga cuáles son los valores con los que 
construiría el boxplot. 
b3) ¿Espera que el coeficiente de asimetría para estos datos sea mayor, menor o igual a cero? 
b4) ¿Espera que la media de estos datos sea mayor, menor o igual a la mediana? 
 
c) Si los 5 números resumen para determinado conjunto de datos son: 
mínimo observado: 4352 
Q1: 6422 
Mediana: 7083 
Q3: 7693 
máximo observado: 9663 
c1) ¿Hay datos atípicos en este conjunto de datos? 
c2) Si grafica un boxplot, ¿los 5 números con los que dibuja la caja y los bigotes coincidirán con 
estos 5 números resumen? En caso de que no coincidan, diga cuáles son los valores con los que 
construiría el boxplot. 
 
 
Problema 6 
 
Responda 
a) Si para un conjunto de datos resulta que media=mediana=moda=13, ¿qué nos puede decir 
acerca de la forma en la que se distribuyen dichos datos? 
b) Si para un conjunto de datos moda=10, mediana=11 y media=13, ¿qué nos puede decir acerca 
de la forma en la que se distribuyen dichos datos? 
c) Si para un conjunto de datos moda1=10, moda2=12, mediana=11 y media=11, ¿qué nos puede 
decir acerca de la forma en la que se distribuyen dichos datos? 
d) Si para un conjunto de datos media=mediana=20 y no hay moda. ¿Qué nos puede decir acerca 
de la forma en la que se distribuyen dichos datos? 
e) Si para un conjunto de datos media=mediana=moda=34 y varianza (s2)=16; y para otro conjunto 
de datos media=mediana=moda=34 y desvío estándar (s)=4; ¿qué nos puede decir acerca de 
dichos conjuntos de datos? 
f) ¿En cuáles de estas opciones podría aplicar el teorema de Chebyshev? 
 
Problema 7 
 
En las siguientes afirmaciones responda Verdadero o Falso, en caso de ser Falso justifique. 
 
1. El rango casi no se ve afectado por la presencia de datos extremos (es decir, notablemente 
más grande que el resto de los datos, o notablemente más pequeños). 
2. Si tengo la variable: largo de aleta dorsal en orcas (Orcinus orca) macho. Y resulta que el 
percentil 55 es 1,80 metros. Esto quiere decir que el 55% de las aletas dorsales de orca macho 
mide 1,80 metros o más. 
3. El coeficiente de variación tiene las mismas unidades que la media. 
4. Si en un conjunto de datos hay datos atípicos, es mejor usar la media que la mediana como 
medida de centralización. 
5. Si media = mediana,la forma de la distribución de los datos es simétrica. 
6. Puede haber datos sin media. 
7. Si el coeficiente de curtosis es menor que cero, los datos están muy próximos a la media. 
8. Si tengo la variable: largo de aleta dorsal en orcas (Orcinus orca) macho. Y resulta que Q1 es 
1,10 metros y Q3 es 2,20 metros. Esto quiere decir que el 50% de las aletas dorsales de orca macho 
miden entre 1,10 m y 2,20 m. 
9. La media es siempre un valor de la variable 
10. Es posible encontrar un conjunto de datos sin mediana. 
11. El rango intercuartílico se ve menos afectado que el rango (amplitud absoluta) por la 
presencia de datos extremos (es decir, notablemente más grande que el resto de los datos, o 
notablemente más pequeños). 
12. La varianza tiene las mismas unidades que la media. 
13. Cuando el coeficiente de asimetría es > 0, se cumple que la mediana es mayor que la media. 
14. Los boxplots se construyen siempre usando los “5 números resumen”. 
15. En una tabla de frecuencias agrupadas, cada intervalo (clase) puede tener más de una marca 
de clase. 
16. Es imposible encontrar un conjunto de datos sin moda. 
17. La suma de todas las frecuencias relativas (proporciones) es un número positivo entre 0 y 1. 
18. Si media = mediana, la forma de la distribución de los datos es simétrica y con forma de 
campana siempre. 
19. La media (𝑥 ̅) nos da una idea de dónde se centran los datos, pero también de cómo se 
distribuyen/dispersan. 
20. La suma de todos los desvíos respecto de la media (𝑥𝑖 − 𝑥 ̅) da siempre un valor positivo. 
21. La mediana es el valor del dato del medio, sin importar si los datos están ordenados o no

Continuar navegando

Materiales relacionados

462 pag.
64 pag.
modulo-descriptiva

User badge image

Tus Materiales

4 pag.
TEMA_1__DescriptivaUnivariante_Problemas_EDB_2017_I

SIN SIGLA

User badge image

Sebastian Sanchez Guerrero