Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadís'ca descrip'va para combinaciones de variables Problemas guía 4 Bioestadís3ca - UNM Problema 1 Observe los siguientes diagramas de dispersión y responda: a) Cuáles muestran correlaciones posi'vas entre las variables X e Y? b) De los gráficos que muestran correlación posi'va, en cuál las variables están más fuertemente asociadas? c) Cuáles muestran correlaciones nega'vas entre las variables X e Y? d) De los gráficos que muestran correlación nega'va, en cuál las variables están más fuertemente asociadas? e) Cuales muestran ausencia de correlación entre las variables X e Y f) Sabiendo que -1 ≤ r ≤ 1, ordene los gráficos por valor de r aproximado de menor a mayor Problema 2 Sabiendo que las variables x10 y y11 presentan una asociación causal, se quiere desarrollar un modelo que permita predecir cuánto valdrá y11 a par'r de algunos valores conocidos de x10. Los inves'gadores creen que el modelo lineal sería un buen modelo. Para probar esto, graficaron datos conocidos de estas variables x10 y x11 generando el siguiente diagrama de dispersión. a) Observando la figura, qué 'po de relación (creciente, decreciente) 'enen las variables x10 e y11? b) Observando la figura, Ud cree que la regresión lineal seria un buen modelo para predecir valores de y11 a par'r de x10? Por qué? c) A con'nuación presentamos algunos datos usados para construir la recta de regresión: Sabiendo que la ecuación de la recta de regresión que mejor ajusta a los datos es: Y = 0,921x -23,022 d) Calcule los residuos para estos 4 datos. e) Puede usar la ecuación de la recta para predecir qué valor tomaría y11 cuando x10 vale 100,5? Si puede, calcule dicho valor. Si no puede, explique por qué. f) Puede usar la ecuación de la recta para predecir qué valor tomaría y11 cuando x10 vale 97,4? Si puede, calcule dicho valor. Si no puede, explique por qué. g) Puede usar la ecuación de la recta para predecir qué valor tomaría y11 cuando x10 vale 94,7? Si puede, calcule dicho valor. Si no puede, explique por qué Problema 3 El boro es un micronutriente esencial en el crecimiento de las plantas. Sin embargo, se ha observado que altos niveles de boro afecta el crecimiento en algunas plantas. Se hizo un estudio para determinar si el crecimiento del girasol (medido como largo de tallo) se ve afectado por la presencia de boro. Para esto, se sembraron 30 semillas del cul'var ACA885 de girasol en macetas conteniendo concentraciones variables de boro (desde 0,5 mg/l hasta 16 mg/l de boro). A los 20 días post emergencia (germinación) se midió el tallo de cada planta. X10 Y11 102,5 73,5 99,9 69,2 101,6 72,8 99,3 69,3 a) Cuál es es el universo? b) Cuál es la población de estudio? c) Cuál es la muestra? d) Cuál es/son la/s variables? e) De qué 'po es/son las variables? f) Se presenta un gráfico de dispersión para las variables del problema. Qué estamos graficando en el eje X y qué estamos graficando en el eje Y? (Es decir, diga en base al problema cuál es a qué variable corresponde X12 y a qué variable corresponde Y13) g) La asociación entre estas dos variables es fuerte o débil? h) La asociación entre estas dos variables es posi'va o nega'va? Qué significa, teniendo en cuenta este problema, que la asociación sea de ese 'po? i) Sabiendo que la ecuación de la recta de regresión que mejor ajusta a estos datos es: Y = -0,84x + 14,98 Interprete qué nos dice la pendiente y la ordenada al origen, en términos del problema (es decir, relacionándolo con las variables en estudio). j) Esa pendiente es muestral (b) o poblacional (β)? k) Sabiendo que para x=5,3 el residuo es 0,2. Interprete qué nos quiere decir ese residuo. l) Puede usar la ecuación de la recta para predecir cuánto medirá una planta de girasol que recibió 5,6 mg/l de boro? Si puede, calcule dicho valor. Si no puede, explique por qué m) Puede usar la ecuación de la recta para predecir cuánto medirá una planta de girasol que recibió 17,6 mg/l de boro? Si puede, calcule dicho valor. Si no puede, explique por qué Problema 4 Observe los siguientes gráficos de cajas y bigotes: a) Describa los tres boxplots de la gráfica de la izquierda, teniendo en cuenta: i. cómo espera que sea el coeficiente de asimetría de cada boxplot (es decir, mayor, menor o aprox. igual a cero)? ii. Qué gráfico presenta mayor dispersión, medida como rango? iii. Qué gráfico presenta mayor dispersión, medida como RIC? iv. Qué gráfico presenta menor dispersión, medida como rango? v. Qué gráfico presenta menor dispersión, medida como RIC? vi. Hay datos aepicos? vii. Cuál de los tres gráficos espero que tenga coeficiente de curtosis con valor más elevado? viii. Cuál 'ene mayor mediana? ix. En cuál de estos gráficos la media es mayor que la mediana? x. En cuál de estos gráficos la media es menor que la mediana? b) Describa los tres boxplots de la gráfica de la derecha, teniendo en cuenta: xi. cómo espera que sea el coeficiente de asimetría de cada boxplot (es decir, mayor, menor o aprox. igual a cero)? xii. Qué gráfico presenta mayor dispersión, medida como rango? xiii. Qué gráfico presenta mayor dispersión, medida como RIC? xiv. Qué gráfico presenta menor dispersión, medida como rango? xv. Qué gráfico presenta menor dispersión, medida como RIC? xvi. Hay datos aepicos? xvii. Cuál de los tres gráficos espero que tenga coeficiente de curtosis con valor más elevado? xviii. Cuál 'ene mayor mediana? xix. En cuál de estos gráficos la media es mayor que la mediana? xx. En cuál de estos gráficos la media es menor que la mediana? Problema 5 Buscando cuan'ficar la presencia de cloro en agua, se tomaron muestras de agua de algunas casas de tres ciudades del conurbano bonaerense y se determinó la can'dad de cloro (en partes por millón, ppm) de cada una de ellas. Con esos datos se construyeron los gráficos (histograma y boxplots) que se muestran al final del enunciado. a) Cuál es/son la/s variable/s y de qué 'po es/son? b) Son auto-explica'vos estos gráficos? Si no es así, indique qué les falta. c) Observando el histograma que plasma la totalidad de los datos registrados de contenido de cloro (en ppm), sin discriminar por localidad, observa algún 'po de patrón en cómo se distribuyen los datos? Cómo relacionaría esto con el enunciado? d) Observe el gráfico de la derecha (boxplots). En qué caso/s los 5 valores con los que se genera el boxplot no coincide con los 5 números resumen? Cómo calcula, en ese caso, los descriptores del boxplot? e) Si el primer boxplot (el de la izquierda) con'ene los datos (ppp de cloro) para la ciudad 1, el segundo boxplot (el del centro) con'ene los datos (ppp de cloro) para la ciudad 2, y el tercer boxplot (de la derecha) con'ene los datos (ppp de cloro) para la ciudad 3; relacione esos datos con el histograma (básicamente, indique aproximadamente qué porción del histograma con'ene los datos de ppm de cloro registrados en ciudad 1, en ciudad 2 y en ciudad 3). f) Hay clase modal en ese histograma? Si la respuesta es afirma'va, señale cuál/es es/son. Problema 6 Indique si las siguientes afirmaciones son verdaderas o falsas. Jus'fique las falsas. a) Un estudio de correlación entre las variables cuan'ta'vas A y B arrojó que r = 0,99. Esto quiere decir que puedo usar a una de ellas para predecir el valor de la otra mediante regresión lineal. b) Los residuos son siempre valores posi'vos. c) Un estudio de correlación entre las variables cuan'ta'vas A y B arrojó que r ~ 0, lo cual indica que no hay asociación entre estas variables. d) Un estudio de correlación entre las variables cuan'ta'vas A y B arrojó que r = -0.95. Dado -0,95 está muy cerca de -1, sabemos que la asociación entre estas variables es muy débil. e) Un estudio de correlación entre peso y altura en niños arrojó que estas variables están asociadas posi'vamente, dado que r = 0,67 kilos/cm. f) Tanto el coeficiente de Correlación como la regresión línealson simétricos. g) Los residuos son errores en la predicción. h) Si yo quiero saber si hay algún 'po de asociación entre el número de ramas que 'enen los árboles de mi jardín y la altura de los mismos, y mido a todos mis árboles y les cuento sus ramas, obtengo un coeficiente de correlación muestral.
Compartir