Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Guía práctica 6 - Prueba de hipótesis Bioestadística 2020 Problema 1 Los isópodos (Isopoda), son el orden más diverso de crustáceos, de amplia distribución en toda clase de medios, especialmente en los marinos, aunque existen especies terrestres y dulceacuícolas. Asumamos que estamos estudiando una especie isópodos que se saben tienen de 20 a 55 espinas en su antena izquierda. Deseamos saber si el número medio de espinas en la antena izquierda es diferente entre machos y hembras de esta especie. Para esto, tomamos una muestra aleatoria de 150 individuos de esta especie (70 machos y 80 hembras) del mar argentino frente a la provincia de Santa Cruz y contabilizamos el número de espinas en la antena izquierda. Responda: a) ¿Cuál es la población de estudio? b) ¿Cuál es la muestra? c) ¿Cuál es/son la/s variable/s en estudio? d) ¿De qué tipo es/son? e) Defina el concepto de “unidad muestral”. Indique cuál sería la unidad muestral en este estudio. f) ¿Qué tipo de gráfico, de los incorporados en “estadística descriptiva” haría para representar los datos obtenidos de este estudio? g) ¿Este es un estudio observacional o experimental? ¿Cómo se da cuenta? h) ¿Cuál es el parámetro de interés en este estudio? i) Plantee, en palabras, las hipótesis estadísticas nula y alternativa. j) Plantee, en notación, las hipótesis estadísticas nula y alternativa. k) Defina con sus palabras qué es el p-valor. l) Si el p-valor para esta prueba es 0,005 y estábamos trabajando con el nivel de significancia aceptado por convención, ¿qué puede concluir de esta prueba estadística? m) En base a la conclusión extraída en el punto k, ¿qué tipo de error podría estar cometiendo? Defina con sus palabras ese tipo de error. n) Cuantifique el error que podría estar cometiendo. o) Si resulta que los machos tienen un promedio de 45 espinas en la antena izquierda, y las hembras un promedio de 28 espinas en la antena izquierda, elabore una conclusión completa de este estudio (como si fuera para publicar) Problema 2 Tomemos el estudio de Messerli (2012), el cual buscaba estudiar si existía una correlación entre ingesta de chocolate por país (en kg/persona) y el número de premios Nobel ganados por ciudadanos del país. Supongamos que alguien hizo un estudio similar, pero para ver si existe una correlación entre la ingesta de chocolate por país (en kg/persona) y la cantidad de medallas de oro Olímpicas ganadas por ciudadanos de dichos países. Se tomaron datos de 32 países. Responda: a) ¿Cuál es la población de estudio? b) ¿Cuál es la muestra? c) Defina el concepto de “variable” con sus palabras. ¿Cuál es/son la/s variable/s en estudio? d) ¿De qué tipo es/son? e) Indique cuál sería la unidad muestral en este estudio. f) ¿Este es un estudio observacional o experimental? ¿Cómo se da cuenta? g) ¿Cuál es el parámetro de interés en este estudio? h) Plantee las hipótesis estadísticas nula y alternativa (en palabras). i) Plantee las hipótesis estadísticas nula y alternativa (en notación). j) Defina con sus palabras qué es el nivel de significancia. k) Si el p-valor para esta prueba es 0,09 y estábamos trabajando con el nivel de significancia aceptado por convención, ¿qué podría concluir de esta prueba estadística? l) En base a la conclusión extraída en el punto j, ¿qué tipo de error podría estar cometiendo? Defina con sus palabras ese tipo de error. m) Sabiendo que la potencia de la prueba es de 0,55. Cuantifique el error que podría estar cometiendo. n) Interprete cómo se entiende probabilísticamente ese error. ¿Qué podría hacer si quisiera bajar esa tasa de error? Problema 3 Estamos interesados en evaluar qué color de flor prefieren las abejas. Para esto sembramos dos lotes: uno con flores violetas, otro con flores rojas. Tenemos dos posibles diseños para colectar estos datos: Diseño 1: Tenemos un conjunto de 100 abejas seleccionadas aleatoriamente. Las llevamos a un punto que está equidistante de los dos lotes sembrados con flores de distintos colores. Soltamos las abejas de a una y vemos a qué lote se dirige (es decir, qué color de flor prefiere). Una vez que se posa en una flor de algún color, la re- capturamos y liberamos la siguiente abeja. Diseño 2: Ponemos una colmena en un punto equidistante de los dos lotes sembrados con flores de colores. Contabilizamos a dónde van las primeras 100 abejas (es decir, a flores de qué color van a visitar). Responda: a) ¿Defina el concepto de población de estudio, con sus palabras. ¿Cuál es la población de estudio en cada diseño? b) ¿De qué tipo es cada diseño? ¿Experimental? ¿Observacional? ¿Cómo se da cuenta? c) ¿Podría haber alguna variable de confusión que esté afectando la “decisión” de color de flores en alguno de los diseños? ¿Qué se le ocurre que podría pasar? d) ¿Cuál es la variable de interés? e) ¿De qué tipo es? En caso de ser categórica, indique cuáles serían las categorías f) ¿Cuál es la unidad muestral en este estudio? g) Si el parámetro de interés es la proporción de abejas que visita cada color: Plantee las hipótesis estadísticas nula y alternativa (en palabras) h) Plantee las hipótesis estadísticas nula y alternativa (en notación) i) Si el p-valor para esta prueba es 0,045 y estábamos trabajando con el nivel de significancia aceptado por convención, ¿qué podría concluir de esta prueba estadística? j) En base a la conclusión extraída en el punto j, ¿qué tipo de error podría estar cometiendo? k) Cuantifique el error que podría estar cometiendo. l) Interprete cómo se entiende probabilísticamente ese error. m) Si observamos que 55 abejas visitaron primero flores violetas y 45 flores rojas. Escriba esos valores en proporciones (use la notación correcta, dependiendo de si esas proporciones son muestrales o poblacionales) y escriba una conclusión completa de este estudio (como si fuera para publicar). Problema 4 Indique, para cada conjunto de hipótesis, si es válido para una prueba estadística. Aquellos que no sean válidos, indique por qué a) Hipótesis nula: = 15, Hipótesis alternativa: 15 b) Hipótesis nula: s = 0,33, Hipótesis alternativa: s 0,33 c) Hipótesis nula: p = 1,5, Hipótesis alternativa: p < 1,5 d) Hipótesis nula: p1< p2, Hipótesis alternativa: p1> p2 e) Hipótesis nula: = 1, Hipótesis alternativa: 1 f) Hipótesis nula: > 0, Hipótesis alternativa: = 0 g) Hipótesis nula: �̅ = 2,3, Hipótesis alternativa: : � �< 2,3 h) Hipótesis nula: = 0, Hipótesis alternativa: : < 1 i) Hipótesis nula: r = 0, Hipótesis alternativa: r > 0 Problema 5 Responda verdadero o falso. Justifique los falsos a) El nivel de significancia representa la máxima probabilidad que estamos dispuestos a aceptar de cometer error de tipo I en nuestro experimento. b) Tener un =0,05 implica que, si realizamos el mismo experimento 40 veces (es decir, si sobre una población tomamos 40 muestras, hacemos el experimento de interés y calculamos el estadístico muestral), por simple azar 2 de veces la muestra nos dará evidencia para rechazar la hipótesis nula, aunque esta sea verdadera (falso positivo). c) Queremos evaluar si la temperatura ambiente impacta en la determinación del sexo de las tortugas marinas. Postulamos que a menor temperatura, nace una mayor proporción de machos que de hembras. El parámetro de interés el proporción (�̂) d) Queremos evaluar si la temperatura ambiente impacta en la determinación del sexo de las tortugas marinas. Postulamos que a menor temperatura, nace una mayor proporción de machos que de hembras, y planteamos las hipótesis estadísticas. Nuestra hipótesis nula plantea que, independientemente de la temperatura, no hay diferencias en la proporción de machos y hembras nacidos. Nuestra alternativa plantea que la proporción de machos es distinta que la de hembras al variar la temperatura. e) Para aumentar la potencia de una prueba estadística, podemos aumentar el tamaño del efectodel tratamiento. f) Para aumentar la potencia de una prueba estadística, podemos disminuir el nivel de significancia () g) Las pruebas de hipótesis se hacen intentando controlar el error de tipo II h) Decir que una prueba tiene una potencia de 0,70 implica decir que, aun que haya efecto, por azar no voy a poder detectarlo el 30% de las veces (falso negativo). i) Queremos evaluar si la temperatura ambiente impacta en la determinación del sexo de las tortugas marinas. Postulamos que a menor temperatura, nace una mayor proporción de machos que de hembras. Nuestra hipótesis nula plantea que, independientemente de la temperatura, no hay diferencias en la proporción de machos y hembras nacidos. El resultado de nuestra prueba de hipótesis arroja p-valor=0,063. Estamos trabajando con el valor de significancia aceptado por convención (=0,05). Dado que p-valor>0,05, decimos que nuestros datos nos permiten demostrar la veracidad de la hipótesis nula. Es decir, que independientemente de la temperatura, no hay diferencias en la proporción de machos y hembras nacidos j) El tamaño muestral no tiene impacto en las probabilidades de cometer error en nuestra prueba de hipótesis. k) Estamos estudiando el efecto de una mutación en el promotor de un gen. Suponemos que tener esa mutación aumenta la actividad del gen de interés. Para probar esto, medimos el nivel de expresión (medido como conteo de ARN) de ese gen en ratones comunes (RC, ratones comunes) y en ratones que portan la mutación (RM, ratones mutantes). El parámetro de interés es (conteo medio de ARN de ese gen). Las hipótesis estadística nula, en notación, es RC<RM. La hipótesis estadística alternativa, en notación, es RC =RM. EAM ≠ EAH
Compartir