Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Guía práctica 3-Variables Cuantitativas Bioestadística UNM 2020 Problema 1 Observe los siguientes histogramas y responda: a) ¿En cuáles de ellos espera que el coeficiente de asimetría sea mayor que cero? b) ¿En cuáles de ellos espera que el coeficiente de asimetría sea menor que cero? c) ¿En cuáles de ellos espera que el coeficiente de asimetría sea aprox. igual a cero? d) ¿En cuáles de ellos espera que la media sea mayor que la mediana? e) ¿En cuáles de ellos espera que la media sea menor que la mediana? f) ¿En cuáles de ellos espera que la media sea aproximadamente igual que la mediana? g) ¿En cuáles de ellos espera que la media, la mediana y la moda coincidan? h) ¿Hay alguna distribución aproximadamente simétrica pero donde no se cumpla que media=mediana=moda? I) ¿En cuál de éstas distribuciones podría aplicar el teorema de Chebyshev? J) Marque en cada gráfico la o las “clases modales” Problema 2 Responda observando los siguientes boxplots: a) ¿En qué casos los valores con los que se construyó el boxplot coincide con los “5 números resumen”? b) En aquellos casos en los que no coincidan, indicar cómo se calcula cada parte del boxplot. c) ¿Qué gráficos muestran datos atípicos? ¿En qué caso estos datos atípicos son mayores que el resto de los datos, y en qué caso son menores que el resto de los datos? d) ¿Qué distribuciones espera que tengan coeficiente de asimetría cercano a cero? e) ¿Qué distribuciones espera que tengan coeficiente de asimetría mayor a cero? f) ¿Qué distribuciones espera que tengan coeficiente de asimetría menor a cero? g) ¿En qué gráficos la media es mayor que la mediana? h) ¿En qué gráficos la media es menor que la mediana? Problema 3 Dado el siguiente conjunto de datos de cantidad de unidades formadoras de colonias de bacteria Echerichia coli cepa DH5-alfa en placas de crecimiento de bacterias: 6 7 16 14 1 26 74 8 10 25 4 67 39 38 49 77 65 76 51 75 28 22 11 64 89 a) ¿Cuál es la variable? b) ¿De qué tipo es? c) Arme una tabla de distribución de frecuencias agrupadas (que contenga todos los elementos: marca de clase, frecuencias absolutas y relativas) d) Grafique el histograma de frecuencias absolutas. No olvide agregar ningún elemento al gráfico! e) Grafique el polígono de frecuencias relativas. No olvide agregar ningún elemento al gráfico! f) Calcule la media y la mediana g) ¿Tiene moda ese conjunto de datos? Si es así, diga cuál/es es/son h) ¿Cuál es la clase modal? i) ¿Calcule todos los desvios, y corrobore que se cumpla que la suma de todos los desvios da 0. j) ¿Cuál es el rango? k) Calcule varianza. No olvide de expresar las unidades! l) ¿Cuál es el desvio estándar? M) Si el coeficiente de variación del número de unidades formadoras de colonias de bacteria E. coli cepa O:147 en placas de crecimiento de bacterias es 0,55. ¿Quién tiene mayor dispersión, DH5-alfa u O:147? n) ¿Cómo espera que sea el coeficiente de asimetría: mayor, menor o aproximadamente igual a cero? Problema 4 En cada caso, responda: a) Tomemos la variable “Cantidad de papers publicados por los investigadores de CONICET”. Si tenemos que el percentil 66 es 10 papers, interprete qué nos dice ese valor en términos de la variable estudiada. b) Tomemos la variable “Número de pétalos que tiene una flor cualquiera”. Si tenemos que el cuantil 0,88 es 5, interprete ese valor en términos de la variable estudiada. c) Tomemos la variable “cantidad de genes en genomas bacterianos”. Si resulta que el primer cuartil es 5650 genes, interprete qué nos dice ese valor en términos de la variable estudiada. d) Tomemos la variable “volumen de agua que entra dentro de cualquier autoclave”. Si la mediana es 4 litros, interprete qué nos dice ese valor en términos de la variable estudiada. e) Retomemos el experimento presentado la clase pasada: “Para determinar la tasa de crecimiento de los árboles por año (altura, en metros/año), se midieron los mismos 30 eucaliptos de un jardín botánico en noviembre de 2016, 2017, 2018, 2019”. Si el primer cuartil es 2,5 metros y el tercer cuartil es 4,2 metros, interprete qué nos dicen esos valores teniendo en cuenta el problema. f) Retomemos el experimento presentado la clase pasada: “Para determinar si hay dengue en el municipio de Moreno, se realizó una inspección en algunas casas próximas a la UNM, buscando mosquitos Aedes aegypty. Se registró el número de mosquitos encontrados en cada casa”. Si el cuantil 0,22 es 1 mosquito, indique qué nos dice ese valor en términos del problema. Problema 5 Responda a) Si los 5 números resumen para determinado conjunto de datos son: mínimo observado: 6 Q1: 31 Mediana: 56 Q3: 78 máximo observado: 155 a1) ¿Hay datos atípicos en este conjunto de datos? a2) Si grafica un boxplot, ¿los 5 números con los que dibuja la caja y los bigotes coincidirán con estos 5 números resumen? En caso de que no coincidan, diga cuáles son los valores con los que construiría el boxplot. a3) ¿Si tuviera que elegir una medida de centralización para describir alrededor de qué valor se centran estos datos: elegiría media, mediana o le da lo mismo elegir cualquiera? ¿Por qué? b) Si los 5 números resumen para determinado conjunto de datos son: mínimo observado: 1 Q1: 2 Mediana: 3 Q3: 5 máximo observado: 10 b1) ¿Hay datos atípicos en este conjunto de datos? b2) Si grafica un boxplot, ¿los 5 números con los que dibuja la caja y los bigotes coincidirán con estos 5 números resumen? En caso de que no coincidan, diga cuáles son los valores con los que construiría el boxplot. b3) ¿Espera que el coeficiente de asimetría para estos datos sea mayor, menor o igual a cero? b4) ¿Espera que la media de estos datos sea mayor, menor o igual a la mediana? c) Si los 5 números resumen para determinado conjunto de datos son: mínimo observado: 4352 Q1: 6422 Mediana: 7083 Q3: 7693 máximo observado: 9663 c1) ¿Hay datos atípicos en este conjunto de datos? c2) Si grafica un boxplot, ¿los 5 números con los que dibuja la caja y los bigotes coincidirán con estos 5 números resumen? En caso de que no coincidan, diga cuáles son los valores con los que construiría el boxplot. Problema 6 Responda a) Si para un conjunto de datos resulta que media=mediana=moda=13, ¿qué nos puede decir acerca de la forma en la que se distribuyen dichos datos? b) Si para un conjunto de datos moda=10, mediana=11 y media=13, ¿qué nos puede decir acerca de la forma en la que se distribuyen dichos datos? c) Si para un conjunto de datos moda1=10, moda2=12, mediana=11 y media=11, ¿qué nos puede decir acerca de la forma en la que se distribuyen dichos datos? d) Si para un conjunto de datos media=mediana=20 y no hay moda. ¿Qué nos puede decir acerca de la forma en la que se distribuyen dichos datos? e) Si para un conjunto de datos media=mediana=moda=34 y varianza (s2)=16; y para otro conjunto de datos media=mediana=moda=34 y desvío estándar (s)=4; ¿qué nos puede decir acerca de dichos conjuntos de datos? f) ¿En cuáles de estas opciones podría aplicar el teorema de Chebyshev? Problema 7 En las siguientes afirmaciones responda Verdadero o Falso, en caso de ser Falso justifique. 1. El rango casi no se ve afectado por la presencia de datos extremos (es decir, notablemente más grande que el resto de los datos, o notablemente más pequeños). 2. Si tengo la variable: largo de aleta dorsal en orcas (Orcinus orca) macho. Y resulta que el percentil 55 es 1,80 metros. Esto quiere decir que el 55% de las aletas dorsales de orca macho mide 1,80 metros o más. 3. El coeficiente de variación tiene las mismas unidades que la media. 4. Si en un conjunto de datos hay datos atípicos, es mejor usar la media que la mediana como medida de centralización. 5. Si media = mediana,la forma de la distribución de los datos es simétrica. 6. Puede haber datos sin media. 7. Si el coeficiente de curtosis es menor que cero, los datos están muy próximos a la media. 8. Si tengo la variable: largo de aleta dorsal en orcas (Orcinus orca) macho. Y resulta que Q1 es 1,10 metros y Q3 es 2,20 metros. Esto quiere decir que el 50% de las aletas dorsales de orca macho miden entre 1,10 m y 2,20 m. 9. La media es siempre un valor de la variable 10. Es posible encontrar un conjunto de datos sin mediana. 11. El rango intercuartílico se ve menos afectado que el rango (amplitud absoluta) por la presencia de datos extremos (es decir, notablemente más grande que el resto de los datos, o notablemente más pequeños). 12. La varianza tiene las mismas unidades que la media. 13. Cuando el coeficiente de asimetría es > 0, se cumple que la mediana es mayor que la media. 14. Los boxplots se construyen siempre usando los “5 números resumen”. 15. En una tabla de frecuencias agrupadas, cada intervalo (clase) puede tener más de una marca de clase. 16. Es imposible encontrar un conjunto de datos sin moda. 17. La suma de todas las frecuencias relativas (proporciones) es un número positivo entre 0 y 1. 18. Si media = mediana, la forma de la distribución de los datos es simétrica y con forma de campana siempre. 19. La media (𝑥 ̅) nos da una idea de dónde se centran los datos, pero también de cómo se distribuyen/dispersan. 20. La suma de todos los desvíos respecto de la media (𝑥𝑖 − 𝑥 ̅) da siempre un valor positivo. 21. La mediana es el valor del dato del medio, sin importar si los datos están ordenados o no
Compartir