Logo Studenta

Guía_práctica_11_Regresión y correlación

¡Estudia con miles de materiales!

Vista previa del material en texto

Guía práctica clase 11 
Bioestadística UNM 
Problema 1 
En 1936, Ronald Fisher publicó un artículo en el cual se estudiaron 150 individuos de 
Iris. A cada individuo se le midieron cuatro rasgos: el largo y ancho del sépalo y el largo 
y ancho del pétalo, en centímetros. 
Los valores correlación obtenidos (todos altamente significativos) fueron: 
a) r(largo del sépalo, ancho del sépalo) = -0,12 
b) r(largo del sépalo, largo del pétalo) = 0,87 
c) r(largo del sépalo, ancho del pétalo) = 0,82 
d) r(ancho del sépalo, largo del pétalo) = -0,43 
e) r(ancho del sépalo, ancho del pétalo) = -0,37 
f) r(largo del pétalo, ancho del pétalo) = 0,96 
 
1. Ordene los valores de correlación observados de menos fuerte a más fuerte. 
2. Describa cómo son las relaciones entre estas variables (es decir, cuáles están 
negativamente correlacionadas y cuáles positivamente correlacionadas, y como 
se interpretan esos valores de correlación en términos del problema) 
3. Asumiendo que consideramos muy fuertes todas esas correlaciones mayores a 
0,90, solo observamos un caso que cumple esto (caso f). Podemos usar el 
ancho del pétalo para predecir el largo del pétalo? Explique. 
Problema 2 
Con el fin de estudiar cuál es la relación existente entre el peso de las branquias del 
cangrejo ermitaño común (Bernhardus Pagurus) que habita en el noroeste de Europa 
continental y el peso de su cuerpo, se extrajo una muestra aleatoria de 5 animales. 
Para cada ejemplar se obtuvo el peso de las branquias (X) y el peso total del cuerpo (Y) 
con los siguientes resultados: 
 
 
X (mg) 210 320 220 80 320 
Y (g) 9,52 17,25 15,39 4,19 15,81 
a) Indique cual es el universo, la población de estudio y la muestra. 
b) ¿Es este un estudio observacional o experimental? ¿Cómo se da cuenta? 
c) Indique cuál/es es/son la/s variable/s y de qué tipo es/son. 
d) Formule las hipótesis estadísticas en palabras. 
e) Formule las hipótesis estadísticas en notación. 
f) ¿Cuál es el parámetro que se pone a prueba? De una respuesta completa. 
g) ¿Cuánto vale el estimador muestral del parámetro? ¿Qué tipo de relación 
habría entre estas variables? 
h) Calcule el estadístico de prueba. 
i) ¿Con cuántos grados de libertad estamos trabajando? 
j) Concluya (de una conclusión completa, en términos del problema), asumiendo 
que estamos usando el nivel de significancia aceptado por convención. 
k) ¿Qué tipo de error podría estar cometiendo? 
 
 
Problema 3 
Un técnico desea poner a punto un método fluorimétrico para cuantificar la 
concentración de ADN. Para ello, diseña una curva de calibración con cantidades 
conocidas de ADN: 0 ng/ul, 250 ng/ul, 500 ng/ul, 750 ng/ul y 1000 ng/ul (cada punto se 
cuantificó por duplicado, es decir, dos veces). Los datos de concentración de ADN 
(ng/ul) y absorbancia se presentan en el siguiente gráfico: 
 
 
a) ¿Este es un estudio observacional o experimental? 
b) Indique cuál/es es/son la/s variable/s y de qué tipo es/son. Si corresponde, 
clasifíquelas en “variable explicativa” y “variable respuesta” 
c) Complete el gráfico con toda la información que le falta. ¿Qué se grafica en 
cada eje? 
d) Formule las hipótesis estadísticas en palabras. 
e) Formule las hipótesis estadísticas en notación. 
f) ¿Cuál es el parámetro que se pone a prueba? De una respuesta completa 
g) Si la ecuación de la recta de regresión es y = 0,948 x + 66,5, interprete qué nos 
indica la pendiente de la recta (en términos del problema) y la ordenada al 
origen. 
h) Si el valor de absorbancia obtenido para un ADN de concentración 280 ng/ul es 
250. Estime el valor del residuo para esta concentración de ADN. 
i) Complete la siguiente tabla con la información faltante y calcule el estadístico 
de prueba. 
 
 
SC GL Varianza F p-valor 
Explicada por el modelo 
 
1147205 
 
No explicada por el modelo (residuo) 
 
Total 1165110 
 
 
y = 0,948x + 66,5
R² = 0,9819
0
200
400
600
800
1000
1200
0 200 400 600 800 1000 1200
j) ¿Qué supuestos deben cumplirse para poder confiar en las conclusiones 
obtenidas? Haga los gráficos esquemáticos que esperaría obtener si los 
supuestos se cumplen, y descríbalos. Qué se grafica en cada eje de cada uno de 
ellos? Cuantos puntos tiene cada gráfica? 
k) Use la ecuación de la recta para predecir el valor de absorbancia de muestras 
de ADN con concentración 280, 1050 y 788 ng/ul. En caso de que no pueda 
hacerlo, explique por qué. 
l) Concluya (de una conclusión completa, en términos del problema), asumiendo 
que estamos usando el nivel de significancia aceptado por convención 
m) Qué tipo de error podría estar cometiendo? 
 
n) Calcule el coeficiente de determinación (R2), e interprete qué nos dice ese valor 
en términos del problema. 
Problema 4 
Se desea analizar la relación entre la temperatura del agua y el ritmo cardíaco de la 
rana común (Rana pipiens). Para esto se eligen 9 ejemplares al azar y a cada uno de 
ellos se le registra el ritmo cardíaco después de exponerlo a distintas temperaturas del 
agua. Los resultadosde temperatura (ºC) y frecuencia cardíaca (Latidos/minuto) se 
plasmaron en la siguiente tabla. Se presentan además algunos cálculos 
complementarios: 
Temp
ºC 
Frec.car
díaca 
y

 yy

 ( yy

 )2 y

 - y ( y

- y ) 2 yy  ( yy  ) 2 
2 5 7,85 -2,85 8,11 -13,26 175,92 -16,11 259,56 
4 11 
6 14 14,48 -0,48 0,23 -6,63 43,94 -7,11 50,57 
8 22 17,80 4,20 17,64 -3,31 10,97 0,89 0,79 
10 22 21,12 0,88 0,78 0,01 0,00 0,89 0,79 
12 23 24,43 -1,43 2,06 3,32 11,04 1,89 3,57 
14 32 27,75 4,25 18,05 6,64 44,10 10,89 118,57 
16 29 31,07 -2,07 4,28 9,96 99,17 7,89 62,24 
18 32 34,39 -2,39 5,70 13,28 176,24 10,89 118,57 
SC 
 
a) Indique cual es el universo, la población de estudio y la muestra. 
b) Es este un estudio observacional o experimental? Cómo se da cuenta? 
c) Indique cuál/es es/son la/s variable/s y de qué tipo es/son. 
d) Formule las hipótesis estadísticas en palabras 
e) Formule las hipótesis estadísticas en notación 
f) Cuál es el parámetro que se pone a prueba? De una respuesta completa 
g) Complete los campos faltantes en la tabla previa, sabiendo que la ecuación de 
la recta de regresión es: y = 4,53 + 1,66X. 
h) Cuál es la interpretación biológica de la pendiente de la recta de regresión? 
i) Con esos datos, complete la tabla a continuación, calcule el estadístico de 
prueba y el p-valor 
 SC GL Varianza F p-valor 
Explicada por el modelo 
No explicada por el modelo (residuo) 
Total 
 
j) Calcule el residuo para la observación obtenida al someter a un individuo a 
14ºC. Cómo interpreta ese residuo? 
k) Qué supuestos deben cumplirse para poder confiar en las conclusiones 
obtenidas? Haga los gráficos esquemáticos que esperaría obtener, para este 
problema, si los supuestos se cumplen, y descríbalos. Qué se grafica en cada 
eje de cada uno de ellos? Cuántos puntos tendría que tener cada gráfica 
l) Use la ecuación de la recta para predecir la frecuencia cardíaca en individuos 
sometidos a 11 y 21ºC. En caso de que no pueda hacerlo, explique por qué. 
m) Concluya (de una conclusión completa, en términos del problema), asumiendo 
que estamos usando el nivel de significancia aceptado por convención 
n) Qué tipo de error podría estar cometiendo? 
o) Calcule el coeficiente de determinación (R2), e interprete qué nos dice ese valor 
en términos del problema. 
p) Podemos decir que hay una asociación causal entre la temperatura y la 
frecuencia cardíaca en estas ranas? Justifique su respuesta. 
Problema 5 
Tras encontrar mercurio en la carne de ciertos peces, pescados en lagos de la región de 
Florida (EEUU), se hizo un estudio para determinar si existe una asociación entre el pH 
del agua de dichos lagos y el contenido promedio de mercurio en carne en peces que 
habitan de ellos. Se obtuvieron datos de 57 lagos de Florida. Los datos se presentan en 
la siguiente gráfica: 
 
a)Es este un estudio experimental u observacional? 
b) Indique cuál/es es/son la/s variable/s y de qué tipo es/son. 
c) Formule las hipótesis estadísticas en palabras 
d) Formule las hipótesis estadísticas en notación 
e) Cuál es el parámetro que se pone a prueba? De una respuesta completa 
f) Sabiendo que el estimador muestral del parámetro vale: -0,575. Indique cómo 
se corresponde este valor con lo que observa en el gráfico de dispersión, en 
términos de la fuerza y la asociación entre estas variables. Esperaba un valor 
similar? 
g) Con cuántos grados de libertad estamos trabajando? 
h) Calcule el estadístico de prueba y el p-valor. 
i) Concluya (de una conclusión completa, en términos del problema), asumiendo 
que estamos usando el nivel de significancia aceptado por convención 
j) Qué tipo de error podría estar cometiendo? 
k) Podemos decir que hay una asociación causal entre pH del agua y contenido de 
mercurio en carne? Justifique su respuesta.

Continuar navegando