Logo Studenta

A10 epidemiología y bioestadística - Diana Becerril (3)

Vista previa del material en texto

Actividad 10. Solución de problemas 
Ejercicio 1 
Un investigador está interesado en tratar de explicar la variación en las presiones 
arteriales que ocurren entre los hombres adultos. Con este fin, el investigador reúne 
datos sobre: 
 El ejercicio diario promedio, medido en horas (×1) 
 La edad (×2) 
 El peso, medido en libras (×3) para 74 sujetos. 
La variable resultante (y) es la presión arterial sistólica. El modelo (ficticio) producido 
por estos datos tiene una R2 de .2106 y es como sigue: 
 
Y = 33.5522 + .1710×1 + .1033×2 + .4471×3 
a) ¿Cuál sería la presión arterial sistólica para un hombre de 21 años que 
se ejercita en promedio una hora diaria y pesa 165 libras? 
𝑦 = 33.5522 + ((0.1710)(1)) + ((0.1033)(21)) + ((0.4471)(165)) 
𝑦 = 109.664 mmHg 
b) ¿Cuál será el valor previsto para un hombre de la misma edad que 
también se ejercita en promedio una hora diaria pero que pesa 185 
libras? 
𝑦 = 33.5522 + ((0.1710)(1)) + ((0.1033)(21)) + ((0.4471)(185)) 
𝑦 = 118.606 mmHg 
 
c) ¿Qué significa el valor b3 = .4471? 
Al hacer referencia al peso de los sujetos, quiere decir que la presión arterial 
puede aumentar o disminuir 0.4471. 
 
d) Pruebe la significancia del modelo 
De acuerdo a los datos proporcionados, el valor de R2 es de 0.2106, esto quiere 
decir que el 21.06% de los datos se están relacionando, al ser un valor 
relativamente bajo, quiere decir que el modelo no está presentando una 
tendencia lineal, lo que de cierta forma no ayudaría a explicar la variación 
presentada de la variable Y, es decir, una o varias variables no se correlacionan. 
e) Interpreta los resultados de esta prueba 
De acuerdo lo planteado, gracias a la ecuación de Y dada podemos determinar 
la presión arterial en función de las horas de ejercicio diaria, la edad y el peso; 
sin embargo, al tener una R2 de 0.2106 y que esta sea tan lejana a 1, no 
podemos determinar que existe una buena relación entre los datos presentados. 
 
Ejercicio 2 
Un investigador interesado en la relación entre el índice de masa corporal (IMC) y 
el colesterol sérico desea ajustar un modelo de RLS (regresión lineal simple) en el 
que el colesterol sérico total puede predecirse a partir del IMC con los siguientes 
datos (utilízalos para responder los planteamientos o incisos que se solicitan): 
 
Colesterol 
total 
IMC 
 
165 25.9 
155 20.1 
141 22.2 
228 30.7 
190 28.0 
155 29.4 
132 20.2 
170 20.7 
188 26.3 
150 18.2 
 
a) Construye un modelo de RLS 
 
b) Encuentra los residuales para los primeros 3 sujetos 
Sujeto 1. 
Datos: 
𝑌𝑖: 165 
𝑎: 58.27 
𝑏: 4.5151 
𝑥𝑖: 25.9 
𝑌𝑖 − (𝑎 + 𝑏𝑥𝑖) 
165 − (58.27 + ((4.5151)(25.9))) = −10.21 
 
Sujeto 2. 
Datos: 
𝑌𝑖: 155 
165
155
141
228
190
155
132
170
188
150
y = 4.5151x + 58.27
R² = 0.4999
0
50
100
150
200
250
0 5 10 15 20 25 30 35
C
o
le
st
er
o
l t
o
ta
l
IMC
Colesterol
𝑎: 58.27 
𝑏: 4.5151 
𝑥𝑖: 20.1 
𝑌𝑖 − (𝑎 + 𝑏𝑥𝑖) 
155 − (58.27 + ((4.5151)(20.1))) = 5.97 
 
Sujeto 3. 
Datos: 
𝑌𝑖: 141 
𝑎: 58.27 
𝑏: 4.5151 
𝑥𝑖: 22.2 
𝑌𝑖 − (𝑎 + 𝑏𝑥𝑖) 
141 − (58.27 + ((4.5151)(22.2))) = −17.50 
 
c) Encuentra los coeficientes de determinación y no determinación 
Coeficiente de determinación: 
R2= 0.4999  49.99% 
Coeficiente de no determinación: 
1 − 𝑅2 
1 − 0.4999 = 0.5001  50.01% 
d) Prueba la hipótesis H0 : R2 = 0 
Datos: 
𝑟: 0.707 
𝑅2: 0.499 
𝑛: 10 
 
𝑡𝑐 =
𝑟
√1 − 𝑅
2
𝑛 − 2
 
𝑡𝑐 =
0.707
√1 − 0.499
10 − 2
 
𝑡𝑐 = 2.82 
De acuerdo a los resultados obtenidos, en donde tc=2.82, podemos entonces 
determinar que la hipótesis nula es rechazada, esto debido a que el valor obtenido 
es diferente a cero, además, comparando con las tablas de distribución, el valor 
obtenido se encuentra lejano a los valores de acuerdo al nivel de significación 
(+1.860,-1.850). 
 
e) Prueba la hipótesis H0 : β = 0 
A continuación se presentan los resultados obtenidos con IBM SPSS 
Stastistics, en donde para poder probar la hipótesis se utilizarán algunos 
datos. 
 
 
 
Utilizando el valor del residuo de la suma de cuadrados podemos obtener lo 
siguiente: 
Datos: 
Σ(𝑌𝑖 − �̂�𝑖)2: 3590.820 
𝑛: 10 
𝑆 = √
3590.820
10 − 2
 
𝑆 = 21.186 
*Se observa que este valor coincide con lo presentado en las tablas* 
 
 
 
Posteriormente, se realiza lo siguiente para obtener la tc: 
Datos: 
𝛽:̆ 4.515 
𝑆: 21.186 
𝑆2𝑥: 176.081 
 
𝑡𝑐 = 
�̂�
𝑠
√𝑆2𝑥
 
 
𝑡𝑐 = 
4.5
21.186
√176.081
 
𝑡𝑐 = 2.818 
Finalmente, como se puede observar, se obtuvo un resultado de 2.818 (lo 
cual coincide con lo reportado en las tablas); por lo tanto, al ser un valor 
diferente a 0, la hipótesis nula se rechaza. 
 
f) Construye un intervalo de confianza bilateral del 95% para el cálculo de 
β. ¿Este intervalo de confianza concuerda con el resultado de sus 
pruebas de hipótesis? Explícalo 
 
Como podemos observar en la tabla, los valores para un intervalo de confianza del 
95% para B son, en el límite inferior, 0.833, mientras que en el límite superior 8.197; 
de esta forma, la tc obtenida anteriormente (2.818) se encuentra dentro de estos 
límites, siendo mayor que el límite inferior y menor que el límite superior 
(0.833>2.818<2.197), por lo tanto, se comprueba que el valor obtenido de tc se 
encuentra con una certeza del 95% dentro de los límites presentados; finalmente, 
este resultado obtenido no concuerda con los de las hipótesis presentadas 
anteriormente. 
 
Conclusión 
Finalmente, tener el conocimiento de como solucionar este tipo de problemas con 
ayuda de softwares estadísticos y el saber interpretar los resultados es de suma 
importancia debido a que como profesionales de la salud en formación, podemos 
explicar como es que se relacionan las variables en un determinado caso.

Otros materiales