Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
REGRECIÓN LINEAL SIMPLE Trabajo de estadística Estadística descriptiva Administración en salud Integrantes Jhon Mario Borja Bravo Rosalee Hernandez Miranda Ana Sofia Alean Salgado Adriana Isabel Zapata Estrada REGRESIÓN LINEAL SIMPLE Para cada uno de los ejercicios planteados: ➢ Defina la variable dependiente (Y) y la variable independiente (X). ➢ Grafique un diagrama de Dispersión, interprete. ➢ Calcular la covarianza, interprete. ➢ Coeficiente de correlación de Pearson, interprete. ➢ Modelo de regresión lineal simple, interprete cada uno de los coeficientes. ➢ Estimación de la respuesta media, para un determinado valor de la variable independiente (elija un valor). ➢ Coeficiente de determinación (R2), interprete. Ejercicio 1: Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción cuyos resultados se muestran en la tabla que sigue. SOLUCION: a) Definición de variables: a. X=INGESTION (Variable independiente) b. Y= ABSORCION( Variable dependiente) b) Diagrama de dispersión: Del diagrama de dispersión se puede observar un comportamiento lineal de la variable Absorción en función de la variable Ingestión, indicando una posible asociación lineal entre tales variables. En donde dicha relación es positiva o directa, es decir, a medida que aumenta la Ingestión, la Absorción también aumenta. Tabla expandida y cálculos: Nº X Y X2 Y2 XY 1 1,4 0,7 1,96 0,49 0,98 2 1,6 1,2 2,56 1,44 1,92 3 2,1 1,6 4,41 2,56 3,36 4 1,7 1,1 2,89 1,21 1,87 5 1,8 1,3 3,24 1,69 2,34 6 2,6 2 6,76 4 5,2 7 1,5 1,2 2,25 1,44 1,8 8 2,5 1,5 6,25 2,25 3,75 9 2,7 2,4 7,29 5,76 6,48 10 1,8 1,5 3,24 2,25 2,7 11 2 1,4 4 1,96 2,8 12 1,4 1,1 1,96 1,21 1,54 13 1,9 1,5 3,61 2,25 2,85 14 1,8 1,3 3,24 1,69 2,34 15 1,9 1,5 3,61 2,25 2,85 16 1,6 1,4 2,56 1,96 2,24 0 0,5 1 1,5 2 2,5 3 0 0,5 1 1,5 2 2,5 3 A b so rc ió n Ingestion 17 1,9 1,7 3,61 2,89 3,23 18 2,1 1,7 4,41 2,89 3,57 19 1,6 1,3 2,56 1,69 2,08 20 1,6 1,1 2,56 1,21 1,76 37,5 28,5 72,97 43,09 55,66 �̅� = ∑ 𝑥𝑖 𝑛 = 37.5 20 = 1.875 𝑉(𝑥) = ∑ 𝑥𝑖 2−𝑛�̅�2 𝑛−1 = (72.97)−20∗(1.875)2 20−1 = 0.14 �̅� = ∑ 𝑦𝑖 𝑛 = 28.5 20 = 1.425 𝑉(𝑦) = ∑ 𝑦𝑖 2−𝑛�̅�2 𝑛−1 = (43.09)−20∗(1.425)2 20−1 = 0.13 c) Cálculo de la covarianza: Formula: 𝐶𝑜𝑣(𝑥. 𝑦) = ∑ 𝑥𝑖𝑦𝑖 𝑛 𝑖=1 −𝑛�̅��̅� 𝑛−1 = (55.66)−20∗(1.875)(1.425) 20−1 = 0.117 La covarianza en este caso es positiva, lo que indica que efectivamente existe una relación positiva directa entre las variables, es decir, que a medida que aumenta una, lo hace la otra. d) Calculo coeficiente de correlación de Pearson: 𝐶𝑜𝑟(𝑥. 𝑦) = 𝜌𝑥𝑦 = 𝐶𝑜𝑣(𝑥. 𝑦) √𝑉(𝑥)√𝑉(𝑦) = 0.117 √0.14 ∗ √0.13 = 0.866 Encontramos un valor positivo del coeficiente de correlación de Pearson, por lo que las variables se relación de manera lineal y directa, siendo esta asociación bastante fuerte al encontrarse cerca al valor de 1. e) Modelo de regresión lineal simple: Estimación de los coeficientes del modelo: Para la pendiente: �̂�1 = 𝑐𝑜𝑣(𝑥, 𝑦) 𝑉(𝑥) = 0.117 0.14 = 0.836 Para el intercepto: �̂�0 = �̅� − �̂�1�̅� = 1.425 − 0.836 ∗ (1.875) = −0.143 Modelo ajustado: �̂� = 0.836𝑥 − 0.143 Interpretaciones del modelo: �̂�1 = 0.836: se estima que por cada unidad de grasa que se ingiera en lactantes desnutridos, estos absorban 0.836 de esta. �̂�0 = −0.143 : se estima que, si no hay ingesta de grasas, se dé un déficit de esta en -0.143. f) Estimación de la respuesta media: Si la ingesta de grasas es de 2.5 se estima que la absorción de la misma será de: �̂� = 0.836 ∗ (2.5) − 0.143 = 1.947 La absorción estimada de grasas en el lactante desnutrido seria de 1.947 unidades. g) Coeficiente de determinación (R2): 𝑅2 = 𝜌𝑥𝑦 2 = (0.866)2 = 0.75 Es decir que el modelo ajustado explica un 75% de la variabilidad total. Ejercicio 2: En un estudio llevado a cabo en Italia, 10 pacientes con Hipertrigliceridemia se sometieron a una dieta baja en grasas y alta en carbohidratos para investigar si había alguna relación entre estas variables. La tabla muestra los valores antes de comenzar la dieta. SOLUCION: a) Definición de variables: a. X=Nivel de Colesterol (Variable independiente) b. Y= Nivel de Triglicéridos (Variable dependiente) c. b) Diagrama de dispersión: Del diagrama de dispersión se puede observar un comportamiento poco lineal de la variable Nivel de Triglicéridos en función de la variable Nivel de Colesterol, indicando que no es posible una asociación lineal entre tales variables. En tanto, se observa una relación positiva o directa, es decir, existe una posible tendencia a que, si aumenta el nivel de colesterol, el nivel de triglicéridos también aumente. Tabla expandida y cálculos: Nº X Y X2 Y2 XY 1 5,12 2,3 26,2144 5,29 11,776 2 6,18 2,54 38,1924 6,4516 15,6972 3 6,77 2,95 45,8329 8,7025 19,9715 4 6,65 3,77 44,2225 14,2129 25,0705 5 6,36 4,18 40,4496 17,4724 26,5848 6 5,9 5,31 34,81 28,1961 31,329 7 5,48 5,53 30,0304 30,5809 30,3044 8 6,02 8,83 36,2404 77,9689 53,1566 9 10,34 9,48 106,9156 89,8704 98,0232 10 8,51 14,2 72,4201 201,64 120,842 suma 67,33 59,09 475,33 480,39 432,76 �̅� = ∑ 𝑥𝑖 𝑛 = 67.33 10 = 6.733 𝑉(𝑥) = ∑ 𝑥𝑖 2−𝑛�̅�2 𝑛−1 = (475.33)−10∗(6.733)2 10−1 = 2.44 �̅� = ∑ 𝑦𝑖 𝑛 = 59.09 10 = 5.909 𝑉(𝑦) = ∑ 𝑦𝑖 2−𝑛�̅�2 𝑛−1 = (480.39)−10∗(5.909)2 10−1 = 14.58 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0 1 2 3 4 5 6 7 8 9 10 11 N iv e l d e T ri gl ic e ri d o s (m m o l/ l) Nivel de Colesterol (mmol/l) c) Cálculo de la covarianza: Formula: 𝐶𝑜𝑣(𝑥. 𝑦) = ∑ 𝑥𝑖𝑦𝑖 𝑛 𝑖=1 −𝑛�̅��̅� 𝑛−1 = (432.76)−10∗(6.733)(5.909) 10−1 = 3.88 La covarianza en este caso es positiva, lo que indica que efectivamente existe una relación positiva directa entre las variables, es decir, que a medida que aumenta una, lo hace la otra. d) Calculo coeficiente de correlación de Pearson: 𝐶𝑜𝑟(𝑥. 𝑦) = 𝜌𝑥𝑦 = 𝐶𝑜𝑣(𝑥. 𝑦) √𝑉(𝑥)√𝑉(𝑦) = 3.88 √2.44 ∗ √14.58 = 0.65 Encontramos un valor positivo del coeficiente de correlación de Pearson, por lo que las variables se relación de manera lineal y directa, siendo esta una asociación medianamente fuerte al no encontrarse muy cerca al valor de 1. e) Modelo de regresión lineal simple: Estimación de los coeficientes del modelo: Para la pendiente: �̂�1 = 𝑐𝑜𝑣(𝑥, 𝑦) 𝑉(𝑥) = 3.88 2.44 = 1.59 Para el intercepto: �̂�0 = �̅� − �̂�1�̅� = 5.909 − 1.59 ∗ (6.733) = −4.8 Modelo ajustado: �̂� = 1.59𝑥 − 4.8 Interpretaciones del modelo: �̂�1 = 1.59: se estima que por cada unidad del nivel de colesterol que se aumente, los pacientes aumenten también en 1.59 unidades el nivel de triglicéridos. �̂�0 = −4.8 : se estima que, si no aumentan de los niveles de colesterol, se dé un déficit de los niveles de triglicéridos en 4.8. f) Estimación de la respuesta media: Si el nivel de colesterol es de 10 mmol/l, se estima que el nivel de triglicéridos será de: �̂� = 1.59 ∗ (10) − 4.8 = 11.1 El nivel de triglicéridos estimado seria de 11.1 mmol/l. g) Coeficiente de determinación (R2): 𝑅2 = 𝜌𝑥𝑦 2 = (0.65)2 = 0.4225 Es decir que el modelo ajustado explica un 42.25% de la variabilidad total. Ejercicio 3: Los siguientes datos representan la estatura (X) y la circunferencia (Y ) de la cabeza de 10 bebes al momento de nacer en centímetros. SOLUCION: a) Definición de variables: a. X=Estatura o talla del bebe (Variable independiente) b. Y= Circunferencia de la cabeza del bebe (Variable dependiente) b) Diagrama de dispersión: Del diagrama de dispersión se puede observar un comportamientopoco lineal de la variable circunferencia en función de la variable estatura, lo que indica que no es posible una asociación lineal entre tales variables. En tanto, se observa una relación positiva o directa, es decir, que existe una posible tendencia a que, si es grande la estatura o talla del bebe, la circunferencia de la cabeza del mismo sea grande también. Tabla expandida y cálculos: Nº X Y X2 Y2 XY 1 47 35 2209 1225 1645 2 48 34 2304 1156 1632 3 50 33 2500 1089 1650 4 50 35 2500 1225 1750 5 51 34 2601 1156 1734 6 52 36 2704 1296 1872 7 52 36 2704 1296 1872 8 52 37 2704 1369 1924 9 54 38 2916 1444 2052 10 50 35 2500 1225 1750 suma 506 353 25642 12481 17881 �̅� = ∑ 𝑥𝑖 𝑛 = 506 10 = 5.06 𝑉(𝑥) = ∑ 𝑥𝑖 2−𝑛�̅�2 𝑛−1 = (25642)−10∗(5.06)2 10−1 = 4.27 �̅� = ∑ 𝑦𝑖 𝑛 = 353 10 = 3.53 𝑉(𝑦) = ∑ 𝑦𝑖 2−𝑛�̅�2 𝑛−1 = (12481)−10∗(3.53)2 10−1 = 2.23 c) Cálculo de la covarianza: 32 33 34 35 36 37 38 39 46 47 48 49 50 51 52 53 54 55 C ir cu n fe re n ci a Estatura Formula: 𝐶𝑜𝑣(𝑥. 𝑦) = ∑ 𝑥𝑖𝑦𝑖 𝑛 𝑖=1 −𝑛�̅��̅� 𝑛−1 = (17881)−10∗(5.06)(3.53) 10−1 = 2.13 La covarianza en este caso es positiva, lo que indica que efectivamente existe una relación positiva dierecta entre las variables, es decir, que a medida que aumenta una, lo hace la otra. d) Calculo coeficiente de correlación de Pearson: 𝐶𝑜𝑟(𝑥. 𝑦) = 𝜌𝑥𝑦 = 𝐶𝑜𝑣(𝑥. 𝑦) √𝑉(𝑥)√𝑉(𝑦) = 2.13 √4.27 ∗ √2.23 = 0.69 Encontramos un valor positivo del coeficiente de correlación de Pearson, por lo que las variables tratadas se relación de manera lineal y directa, siendo en este caso, una asociación medianamente fuerte al no encontrarse muy cerca al valor de 1. e) Modelo de regresión lineal simple: Estimación de los coeficientes del modelo: Para la pendiente: �̂�1 = 𝑐𝑜𝑣(𝑥, 𝑦) 𝑉(𝑥) = 2.13 4.27 = 0.50 Para el intercepto: �̂�0 = �̅� − �̂�1�̅� = 3.53 − 0.50 ∗ (5.06) = 1 Modelo ajustado: �̂� = 0.50𝑥 + 1 Interpretaciones del modelo: �̂�1 = 0.50: se estima que por cada centímetro de estatura que se aumente, los bebes aumentan también su circunferencia craneal en 0.50 centímetros. �̂�0 = +1 : se estima que, si no aumenta la estatura de los bebes, se dé una diferencia de 1 cm en la circunferencia de la cabeza del bebe. f) Estimación de la respuesta media: Si la talla del bebe es de 60 cm, se estima que la circunferencia de la cabeza será de: �̂� = 0.50 ∗ (60) + 1 = 31 𝑐𝑚 La circunferencia estimada de la cabeza del bebe seria de 31 cm. g) Coeficiente de determinación (R2): 𝑅2 = 𝜌𝑥𝑦 2 = (0.69)2 = 0.4761 Es decir que el modelo ajustado explica un 47.61% de la variabilidad total de los datos.
Compartir