Logo Studenta

Ejercicios resueltos de problemas, en el contexto del área de la salud

¡Este material tiene más páginas!

Vista previa del material en texto

REGRECIÓN LINEAL SIMPLE 
Trabajo de estadística 
Estadística descriptiva 
Administración en salud 
Integrantes 
Jhon Mario Borja Bravo 
Rosalee Hernandez Miranda 
Ana Sofia Alean Salgado 
Adriana Isabel Zapata Estrada 
REGRESIÓN LINEAL SIMPLE 
Para cada uno de los ejercicios planteados: 
➢ Defina la variable dependiente (Y) y la variable independiente (X). 
➢ Grafique un diagrama de Dispersión, interprete. 
➢ Calcular la covarianza, interprete. 
➢ Coeficiente de correlación de Pearson, interprete. 
➢ Modelo de regresión lineal simple, interprete cada uno de los coeficientes. 
➢ Estimación de la respuesta media, para un determinado valor de la variable 
independiente (elija un valor). 
➢ Coeficiente de determinación (R2), interprete. 
Ejercicio 1: Se desea saber si existe alguna relación entre la ingestión y la absorción de 
grasas en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción 
cuyos resultados se muestran en la tabla que sigue. 
 
SOLUCION: 
a) Definición de variables: 
a. X=INGESTION (Variable independiente) 
b. Y= ABSORCION( Variable dependiente) 
b) Diagrama de dispersión: 
 
Del diagrama de dispersión se puede observar un comportamiento lineal de la variable 
Absorción en función de la variable Ingestión, indicando una posible asociación lineal entre 
tales variables. En donde dicha relación es positiva o directa, es decir, a medida que aumenta 
la Ingestión, la Absorción también aumenta. 
 
 
 
Tabla expandida y cálculos: 
Nº X Y X2 Y2 XY 
1 1,4 0,7 1,96 0,49 0,98 
2 1,6 1,2 2,56 1,44 1,92 
3 2,1 1,6 4,41 2,56 3,36 
4 1,7 1,1 2,89 1,21 1,87 
5 1,8 1,3 3,24 1,69 2,34 
6 2,6 2 6,76 4 5,2 
7 1,5 1,2 2,25 1,44 1,8 
8 2,5 1,5 6,25 2,25 3,75 
9 2,7 2,4 7,29 5,76 6,48 
10 1,8 1,5 3,24 2,25 2,7 
11 2 1,4 4 1,96 2,8 
12 1,4 1,1 1,96 1,21 1,54 
13 1,9 1,5 3,61 2,25 2,85 
14 1,8 1,3 3,24 1,69 2,34 
15 1,9 1,5 3,61 2,25 2,85 
16 1,6 1,4 2,56 1,96 2,24 
0
0,5
1
1,5
2
2,5
3
0 0,5 1 1,5 2 2,5 3
A
b
so
rc
ió
n
Ingestion
17 1,9 1,7 3,61 2,89 3,23 
18 2,1 1,7 4,41 2,89 3,57 
19 1,6 1,3 2,56 1,69 2,08 
20 1,6 1,1 2,56 1,21 1,76 
 37,5 28,5 72,97 43,09 55,66 
 
�̅� =
∑ 𝑥𝑖
𝑛
=
37.5
20
= 1.875 𝑉(𝑥) =
∑ 𝑥𝑖
2−𝑛�̅�2
𝑛−1
=
(72.97)−20∗(1.875)2
20−1
= 0.14 
�̅� =
∑ 𝑦𝑖
𝑛
=
28.5
20
= 1.425 𝑉(𝑦) =
∑ 𝑦𝑖
2−𝑛�̅�2
𝑛−1
=
(43.09)−20∗(1.425)2
20−1
= 0.13 
 
c) Cálculo de la covarianza: 
Formula: 
 𝐶𝑜𝑣(𝑥. 𝑦) =
∑ 𝑥𝑖𝑦𝑖
𝑛
𝑖=1 −𝑛�̅��̅�
𝑛−1
=
(55.66)−20∗(1.875)(1.425)
20−1
= 0.117 
La covarianza en este caso es positiva, lo que indica que efectivamente existe una relación 
positiva directa entre las variables, es decir, que a medida que aumenta una, lo hace la otra. 
 
 
d) Calculo coeficiente de correlación de Pearson: 
𝐶𝑜𝑟(𝑥. 𝑦) = 𝜌𝑥𝑦 =
𝐶𝑜𝑣(𝑥. 𝑦)
√𝑉(𝑥)√𝑉(𝑦)
=
0.117
√0.14 ∗ √0.13
= 0.866 
Encontramos un valor positivo del coeficiente de correlación de Pearson, por lo que las 
variables se relación de manera lineal y directa, siendo esta asociación bastante fuerte al 
encontrarse cerca al valor de 1. 
 
e) Modelo de regresión lineal simple: 
Estimación de los coeficientes del modelo: 
Para la pendiente: 
�̂�1 =
𝑐𝑜𝑣(𝑥, 𝑦)
𝑉(𝑥)
=
0.117
0.14
= 0.836 
Para el intercepto: 
�̂�0 = �̅� − �̂�1�̅� = 1.425 − 0.836 ∗ (1.875) = −0.143 
Modelo ajustado: 
�̂� = 0.836𝑥 − 0.143 
Interpretaciones del modelo: 
�̂�1 = 0.836: se estima que por cada unidad de grasa que se ingiera en lactantes desnutridos, 
estos absorban 0.836 de esta. 
�̂�0 = −0.143 : se estima que, si no hay ingesta de grasas, se dé un déficit de esta en -0.143. 
 
f) Estimación de la respuesta media: 
Si la ingesta de grasas es de 2.5 se estima que la absorción de la misma será de: 
�̂� = 0.836 ∗ (2.5) − 0.143 = 1.947 
La absorción estimada de grasas en el lactante desnutrido seria de 1.947 unidades. 
 
g) Coeficiente de determinación (R2): 
𝑅2 = 𝜌𝑥𝑦
2 = (0.866)2 = 0.75 
Es decir que el modelo ajustado explica un 75% de la variabilidad total. 
Ejercicio 2: En un estudio llevado a cabo en Italia, 10 pacientes con Hipertrigliceridemia se 
sometieron a una dieta baja en grasas y alta en carbohidratos para investigar si había alguna 
relación entre estas variables. La tabla muestra los valores antes de comenzar la dieta. 
 
SOLUCION: 
a) Definición de variables: 
a. X=Nivel de Colesterol (Variable independiente) 
b. Y= Nivel de Triglicéridos (Variable dependiente) 
c. 
b) Diagrama de dispersión: 
 
Del diagrama de dispersión se puede observar un comportamiento poco lineal de la variable 
Nivel de Triglicéridos en función de la variable Nivel de Colesterol, indicando que no es 
posible una asociación lineal entre tales variables. En tanto, se observa una relación positiva 
o directa, es decir, existe una posible tendencia a que, si aumenta el nivel de colesterol, el 
nivel de triglicéridos también aumente. 
Tabla expandida y cálculos: 
Nº X Y X2 Y2 XY 
1 5,12 2,3 26,2144 5,29 11,776 
2 6,18 2,54 38,1924 6,4516 15,6972 
3 6,77 2,95 45,8329 8,7025 19,9715 
4 6,65 3,77 44,2225 14,2129 25,0705 
5 6,36 4,18 40,4496 17,4724 26,5848 
6 5,9 5,31 34,81 28,1961 31,329 
7 5,48 5,53 30,0304 30,5809 30,3044 
8 6,02 8,83 36,2404 77,9689 53,1566 
9 10,34 9,48 106,9156 89,8704 98,0232 
10 8,51 14,2 72,4201 201,64 120,842 
suma 67,33 59,09 475,33 480,39 432,76 
 
�̅� =
∑ 𝑥𝑖
𝑛
=
67.33
10
= 6.733 𝑉(𝑥) =
∑ 𝑥𝑖
2−𝑛�̅�2
𝑛−1
=
(475.33)−10∗(6.733)2
10−1
= 2.44 
�̅� =
∑ 𝑦𝑖
𝑛
=
59.09
10
= 5.909 𝑉(𝑦) =
∑ 𝑦𝑖
2−𝑛�̅�2
𝑛−1
=
(480.39)−10∗(5.909)2
10−1
= 14.58 
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0 1 2 3 4 5 6 7 8 9 10 11
N
iv
e
l d
e
 T
ri
gl
ic
e
ri
d
o
s 
(m
m
o
l/
l)
Nivel de Colesterol (mmol/l)
 
c) Cálculo de la covarianza: 
Formula: 
 𝐶𝑜𝑣(𝑥. 𝑦) =
∑ 𝑥𝑖𝑦𝑖
𝑛
𝑖=1 −𝑛�̅��̅�
𝑛−1
=
(432.76)−10∗(6.733)(5.909)
10−1
= 3.88 
La covarianza en este caso es positiva, lo que indica que efectivamente existe una relación 
positiva directa entre las variables, es decir, que a medida que aumenta una, lo hace la otra. 
 
d) Calculo coeficiente de correlación de Pearson: 
𝐶𝑜𝑟(𝑥. 𝑦) = 𝜌𝑥𝑦 =
𝐶𝑜𝑣(𝑥. 𝑦)
√𝑉(𝑥)√𝑉(𝑦)
=
3.88
√2.44 ∗ √14.58
= 0.65 
Encontramos un valor positivo del coeficiente de correlación de Pearson, por lo que las 
variables se relación de manera lineal y directa, siendo esta una asociación medianamente 
fuerte al no encontrarse muy cerca al valor de 1. 
 
 
e) Modelo de regresión lineal simple: 
Estimación de los coeficientes del modelo: 
Para la pendiente: 
�̂�1 =
𝑐𝑜𝑣(𝑥, 𝑦)
𝑉(𝑥)
=
3.88
2.44
= 1.59 
Para el intercepto: 
�̂�0 = �̅� − �̂�1�̅� = 5.909 − 1.59 ∗ (6.733) = −4.8 
Modelo ajustado: 
�̂� = 1.59𝑥 − 4.8 
Interpretaciones del modelo: 
�̂�1 = 1.59: se estima que por cada unidad del nivel de colesterol que se aumente, los 
pacientes aumenten también en 1.59 unidades el nivel de triglicéridos. 
�̂�0 = −4.8 : se estima que, si no aumentan de los niveles de colesterol, se dé un déficit de 
los niveles de triglicéridos en 4.8. 
 
f) Estimación de la respuesta media: 
Si el nivel de colesterol es de 10 mmol/l, se estima que el nivel de triglicéridos será de: 
�̂� = 1.59 ∗ (10) − 4.8 = 11.1 
El nivel de triglicéridos estimado seria de 11.1 mmol/l. 
 
g) Coeficiente de determinación (R2): 
𝑅2 = 𝜌𝑥𝑦
2 = (0.65)2 = 0.4225 
Es decir que el modelo ajustado explica un 42.25% de la variabilidad total. 
 
 
 
 
 
 
Ejercicio 3: Los siguientes datos representan la estatura (X) y la circunferencia (Y ) de la 
cabeza de 10 bebes al momento de nacer en centímetros. 
 
SOLUCION: 
a) Definición de variables: 
a. X=Estatura o talla del bebe (Variable independiente) 
b. Y= Circunferencia de la cabeza del bebe (Variable dependiente) 
 
b) Diagrama de dispersión: 
 
Del diagrama de dispersión se puede observar un comportamientopoco lineal de la variable 
circunferencia en función de la variable estatura, lo que indica que no es posible una 
asociación lineal entre tales variables. En tanto, se observa una relación positiva o directa, es 
decir, que existe una posible tendencia a que, si es grande la estatura o talla del bebe, la 
circunferencia de la cabeza del mismo sea grande también. 
Tabla expandida y cálculos: 
Nº X Y X2 Y2 XY 
1 47 35 2209 1225 1645 
2 48 34 2304 1156 1632 
3 50 33 2500 1089 1650 
4 50 35 2500 1225 1750 
5 51 34 2601 1156 1734 
6 52 36 2704 1296 1872 
7 52 36 2704 1296 1872 
8 52 37 2704 1369 1924 
9 54 38 2916 1444 2052 
10 50 35 2500 1225 1750 
suma 506 353 25642 12481 17881 
 
�̅� =
∑ 𝑥𝑖
𝑛
=
506
10
= 5.06 𝑉(𝑥) =
∑ 𝑥𝑖
2−𝑛�̅�2
𝑛−1
=
(25642)−10∗(5.06)2
10−1
= 4.27 
�̅� =
∑ 𝑦𝑖
𝑛
=
353
10
= 3.53 𝑉(𝑦) =
∑ 𝑦𝑖
2−𝑛�̅�2
𝑛−1
=
(12481)−10∗(3.53)2
10−1
= 2.23 
 
c) Cálculo de la covarianza: 
32
33
34
35
36
37
38
39
46 47 48 49 50 51 52 53 54 55
C
ir
cu
n
fe
re
n
ci
a
Estatura
Formula: 
 𝐶𝑜𝑣(𝑥. 𝑦) =
∑ 𝑥𝑖𝑦𝑖
𝑛
𝑖=1 −𝑛�̅��̅�
𝑛−1
=
(17881)−10∗(5.06)(3.53)
10−1
= 2.13 
La covarianza en este caso es positiva, lo que indica que efectivamente existe una relación 
positiva dierecta entre las variables, es decir, que a medida que aumenta una, lo hace la otra. 
 
d) Calculo coeficiente de correlación de Pearson: 
𝐶𝑜𝑟(𝑥. 𝑦) = 𝜌𝑥𝑦 =
𝐶𝑜𝑣(𝑥. 𝑦)
√𝑉(𝑥)√𝑉(𝑦)
=
2.13
√4.27 ∗ √2.23
= 0.69 
Encontramos un valor positivo del coeficiente de correlación de Pearson, por lo que las 
variables tratadas se relación de manera lineal y directa, siendo en este caso, una asociación 
medianamente fuerte al no encontrarse muy cerca al valor de 1. 
 
e) Modelo de regresión lineal simple: 
Estimación de los coeficientes del modelo: 
Para la pendiente: 
�̂�1 =
𝑐𝑜𝑣(𝑥, 𝑦)
𝑉(𝑥)
=
2.13
4.27
= 0.50 
Para el intercepto: 
�̂�0 = �̅� − �̂�1�̅� = 3.53 − 0.50 ∗ (5.06) = 1 
 
Modelo ajustado: 
�̂� = 0.50𝑥 + 1 
Interpretaciones del modelo: 
�̂�1 = 0.50: se estima que por cada centímetro de estatura que se aumente, los bebes 
aumentan también su circunferencia craneal en 0.50 centímetros. 
�̂�0 = +1 : se estima que, si no aumenta la estatura de los bebes, se dé una diferencia de 1 
cm en la circunferencia de la cabeza del bebe. 
 
f) Estimación de la respuesta media: 
Si la talla del bebe es de 60 cm, se estima que la circunferencia de la cabeza será de: 
�̂� = 0.50 ∗ (60) + 1 = 31 𝑐𝑚 
La circunferencia estimada de la cabeza del bebe seria de 31 cm. 
 
g) Coeficiente de determinación (R2): 
𝑅2 = 𝜌𝑥𝑦
2 = (0.69)2 = 0.4761 
Es decir que el modelo ajustado explica un 47.61% de la variabilidad total de los datos.

Continuar navegando