Logo Studenta

Guia_práctica_4_Descr_combinaciones_Variables

¡Estudia con miles de materiales!

Vista previa del material en texto

Estadís'ca descrip'va para combinaciones de variables 
Problemas guía 4 
Bioestadís3ca - UNM 
Problema 1 
Observe los siguientes diagramas de dispersión y responda: 
a) Cuáles muestran correlaciones posi'vas entre las variables X e Y? 
b) De los gráficos que muestran correlación posi'va, en cuál las variables están 
más fuertemente asociadas? 
c) Cuáles muestran correlaciones nega'vas entre las variables X e Y? 
d) De los gráficos que muestran correlación nega'va, en cuál las variables están 
más fuertemente asociadas? 
e) Cuales muestran ausencia de correlación entre las variables X e Y 
f) Sabiendo que -1 ≤ r ≤ 1, ordene los gráficos por valor de r aproximado de menor 
a mayor 
 
Problema 2 
Sabiendo que las variables x10 y y11 presentan una asociación causal, se quiere 
desarrollar un modelo que permita predecir cuánto valdrá y11 a par'r de algunos 
valores conocidos de x10. 
Los inves'gadores creen que el modelo lineal sería un buen modelo. Para probar esto, 
graficaron datos conocidos de estas variables x10 y x11 generando el siguiente 
diagrama de dispersión. 
a) Observando la figura, qué 'po de relación (creciente, decreciente) 'enen las 
variables x10 e y11? 
b) Observando la figura, Ud cree que la regresión lineal seria un buen modelo 
para predecir valores de y11 a par'r de x10? Por qué? 
c) A con'nuación presentamos algunos datos usados para construir la recta de 
regresión: 
Sabiendo que la ecuación de la recta de regresión que mejor ajusta a los datos es: 
Y = 0,921x -23,022 
d) Calcule los residuos para estos 4 datos. 
e) Puede usar la ecuación de la recta para predecir qué valor tomaría y11 cuando 
x10 vale 100,5? Si puede, calcule dicho valor. Si no puede, explique por qué. 
f) Puede usar la ecuación de la recta para predecir qué valor tomaría y11 cuando 
x10 vale 97,4? Si puede, calcule dicho valor. Si no puede, explique por qué. 
g) Puede usar la ecuación de la recta para predecir qué valor tomaría y11 cuando 
x10 vale 94,7? Si puede, calcule dicho valor. Si no puede, explique por qué 
 
Problema 3 
El boro es un micronutriente esencial en el crecimiento de las plantas. Sin embargo, se 
ha observado que altos niveles de boro afecta el crecimiento en algunas plantas. 
Se hizo un estudio para determinar si el crecimiento del girasol (medido como largo de 
tallo) se ve afectado por la presencia de boro. Para esto, se sembraron 30 semillas del 
cul'var ACA885 de girasol en macetas conteniendo concentraciones variables de boro 
(desde 0,5 mg/l hasta 16 mg/l de boro). A los 20 días post emergencia (germinación) se 
midió el tallo de cada planta. 
X10 Y11
102,5 73,5
99,9 69,2
101,6 72,8
99,3 69,3
a) Cuál es es el universo? 
b) Cuál es la población de estudio? 
c) Cuál es la muestra? 
d) Cuál es/son la/s variables? 
e) De qué 'po es/son las variables? 
f) Se presenta un gráfico de dispersión para las variables del problema. Qué 
estamos graficando en el eje X y qué estamos graficando en el eje Y? (Es decir, 
diga en base al problema cuál es a qué variable corresponde X12 y a qué 
variable corresponde Y13) 
 
g) La asociación entre estas dos variables es fuerte o débil? 
h) La asociación entre estas dos variables es posi'va o nega'va? Qué significa, 
teniendo en cuenta este problema, que la asociación sea de ese 'po? 
i) Sabiendo que la ecuación de la recta de regresión que mejor ajusta a estos 
datos es: 
Y = -0,84x + 14,98 
Interprete qué nos dice la pendiente y la ordenada al origen, en términos del 
problema (es decir, relacionándolo con las variables en estudio). 
j) Esa pendiente es muestral (b) o poblacional (β)? 
k) Sabiendo que para x=5,3 el residuo es 0,2. Interprete qué nos quiere decir ese 
residuo. 
l) Puede usar la ecuación de la recta para predecir cuánto medirá una planta de 
girasol que recibió 5,6 mg/l de boro? Si puede, calcule dicho valor. Si no puede, 
explique por qué 
m) Puede usar la ecuación de la recta para predecir cuánto medirá una planta de 
girasol que recibió 17,6 mg/l de boro? Si puede, calcule dicho valor. Si no 
puede, explique por qué 
Problema 4 
Observe los siguientes gráficos de cajas y bigotes: 
a) Describa los tres boxplots de la gráfica de la izquierda, teniendo en cuenta: 
i. cómo espera que sea el coeficiente de asimetría de cada boxplot (es 
decir, mayor, menor o aprox. igual a cero)? 
ii. Qué gráfico presenta mayor dispersión, medida como rango? 
iii. Qué gráfico presenta mayor dispersión, medida como RIC? 
iv. Qué gráfico presenta menor dispersión, medida como rango? 
v. Qué gráfico presenta menor dispersión, medida como RIC? 
vi. Hay datos aepicos? 
vii. Cuál de los tres gráficos espero que tenga coeficiente de curtosis con 
valor más elevado? 
viii. Cuál 'ene mayor mediana? 
ix. En cuál de estos gráficos la media es mayor que la mediana? 
x. En cuál de estos gráficos la media es menor que la mediana? 
b) Describa los tres boxplots de la gráfica de la derecha, teniendo en cuenta: 
xi. cómo espera que sea el coeficiente de asimetría de cada boxplot (es 
decir, mayor, menor o aprox. igual a cero)? 
xii. Qué gráfico presenta mayor dispersión, medida como rango? 
xiii. Qué gráfico presenta mayor dispersión, medida como RIC? 
xiv. Qué gráfico presenta menor dispersión, medida como rango? 
xv. Qué gráfico presenta menor dispersión, medida como RIC? 
xvi. Hay datos aepicos? 
xvii. Cuál de los tres gráficos espero que tenga coeficiente de curtosis con 
valor más elevado? 
xviii. Cuál 'ene mayor mediana? 
xix. En cuál de estos gráficos la media es mayor que la mediana? 
xx. En cuál de estos gráficos la media es menor que la mediana? 
Problema 5 
Buscando cuan'ficar la presencia de cloro en agua, se tomaron muestras de agua de 
algunas casas de tres ciudades del conurbano bonaerense y se determinó la can'dad 
de cloro (en partes por millón, ppm) de cada una de ellas. 
Con esos datos se construyeron los gráficos (histograma y boxplots) que se muestran al 
final del enunciado. 
a) Cuál es/son la/s variable/s y de qué 'po es/son? 
b) Son auto-explica'vos estos gráficos? Si no es así, indique qué les falta. 
c) Observando el histograma que plasma la totalidad de los datos registrados de 
contenido de cloro (en ppm), sin discriminar por localidad, observa algún 'po 
de patrón en cómo se distribuyen los datos? Cómo relacionaría esto con el 
enunciado? 
d) Observe el gráfico de la derecha (boxplots). En qué caso/s los 5 valores con los 
que se genera el boxplot no coincide con los 5 números resumen? Cómo 
calcula, en ese caso, los descriptores del boxplot? 
e) Si el primer boxplot (el de la izquierda) con'ene los datos (ppp de cloro) para la 
ciudad 1, el segundo boxplot (el del centro) con'ene los datos (ppp de cloro) 
para la ciudad 2, y el tercer boxplot (de la derecha) con'ene los datos (ppp de 
cloro) para la ciudad 3; relacione esos datos con el histograma (básicamente, 
indique aproximadamente qué porción del histograma con'ene los datos de 
ppm de cloro registrados en ciudad 1, en ciudad 2 y en ciudad 3). 
f) Hay clase modal en ese histograma? Si la respuesta es afirma'va, señale cuál/es 
es/son. 
 
Problema 6 
Indique si las siguientes afirmaciones son verdaderas o falsas. Jus'fique las falsas. 
a) Un estudio de correlación entre las variables cuan'ta'vas A y B arrojó que r = 
0,99. Esto quiere decir que puedo usar a una de ellas para predecir el valor de 
la otra mediante regresión lineal. 
b) Los residuos son siempre valores posi'vos. 
c) Un estudio de correlación entre las variables cuan'ta'vas A y B arrojó que r ~ 0, 
lo cual indica que no hay asociación entre estas variables. 
d) Un estudio de correlación entre las variables cuan'ta'vas A y B arrojó que r = 
-0.95. Dado -0,95 está muy cerca de -1, sabemos que la asociación entre estas 
variables es muy débil. 
e) Un estudio de correlación entre peso y altura en niños arrojó que estas 
variables están asociadas posi'vamente, dado que r = 0,67 kilos/cm. 
f) Tanto el coeficiente de Correlación como la regresión línealson simétricos. 
g) Los residuos son errores en la predicción. 
h) Si yo quiero saber si hay algún 'po de asociación entre el número de ramas que 
'enen los árboles de mi jardín y la altura de los mismos, y mido a todos mis 
árboles y les cuento sus ramas, obtengo un coeficiente de correlación muestral.

Continuar navegando

Contenido elegido para ti