Logo Studenta

ANALISIS DE REGRESION

¡Estudia con miles de materiales!

Vista previa del material en texto

TALLER COLABORATIVO No.17
1.- El departamento de Talento Humano en un Centro Académico de la localidad, necesita determinar si las notas promediales de los alumnos, puede explicar el número de plazas laborales que ellos reciben después de graduarse.
Los datos corresponden a los 15 titulados.
	Alumno
	Puntuación
	Ofertas
	1
	2.25
	3
	2
	3.70
	7
	3
	2.80
	3
	4
	1.75
	0
	5
	1.88
	1
	6
	3.09
	5
	7
	3.20
	4
	8
	3.59
	6
	9
	2.89
	4
	10
	1.99
	1
	11
	2.85
	2
	12
	3.70
	8
	13
	3.25
	5
	14
	2.70
	3
	15
	1.15
	0
Se requiere:
1. Realizar un Diagrama de DispersiónGrafico de Dispersión
9
8
7
6
5
4
3
2
1
0
0
0,5
1
1,5
2
2,5
3
3,5
4
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
1. Calcule e interprete el modelo de regresión. ¿Qué opinión le merece sobre la relación entre la puntuación y las ofertas de trabajo?.
	Puntuación
	Ofertas
	
	X
	Y
	X - X Barra
	Y - Y barra
	(X - X Barra)(Y - Y barra)
	2,25
	3
	-
0,46933333
	
-0,466666667
	
0,219022222
	3,7
	7
	0,98066667
	3,533333333
	3,465022222
	2,8
	3
	0,08066667
	-0,466666667
	-0,037644444
	1,75
	0
	-
0,96933333
	
-3,466666667
	
3,360355556
	1,88
	1
	-
0,83933333
	
-2,466666667
	
2,070355556
	3,09
	5
	0,37066667
	1,533333333
	0,568355556
	3,2
	4
	0,48066667
	0,533333333
	0,256355556
	3,59
	6
	0,87066667
	2,533333333
	2,205688889
	2,89
	4
	0,17
	0,533333333
	0,091022222
	1,99
	1
	-0,73
	-2,466666667
	1,799022222
	2,85
	2
	0,13
	-1,466666667
	-0,191644444
	3,70
	8
	0,98
	4,533333333
	4,445688889
	3,25
	5
	0,53
	1,533333333
	0,813688889
	2,70
	3
	-0,02
	-0,466666667
	0,009022222
	1,15
	0
	-1,57
	-3,466666667
	5,440355556
	
	24,51466667
	n =
	15
	x barra =
	2,719333333
	y barra =
	3,466666667
	S x -
	0,767356005
	S y =
	2,445598573
	Estadísticas de la regresión
	
	Coeficiente de correlación
	0,93307357
	Observaciones
	15
El coeficiente de correlación de 0.93307357 sugiere que hay una relación positiva y fuerte entre la puntuación promedia de los alumnos y el número de ofertas de trabajo que reciben.
1. Que opinión tiene acerca de la dispersión en la puntuación y ofertas de trabajo con respecto a la media.
Opino que la dispersión en las puntuaciones y ofertas de trabajo muestra que hay variabilidad entre los resultados obtenidos por los alumnos después de graduarse. Algunos estudiantes obtuvieron puntuaciones altas y recibieron un mayor número de ofertas de trabajo, mientras que otros obtuvieron puntuaciones más bajas y no recibieron ofertas o recibieron un número limitado.
1. Conclusiones generales acerca de este modelo de pronóstico.
En conclusión, este modelo de pronóstico proporciona una idea inicial de cómo se relacionan las puntuaciones promedio y las ofertas de trabajo, pero se necesitarían más datos y un análisis más exhaustivo para comprender completamente los factores que influyen en las oportunidades laborales de los graduados en este Centro Académico.
2.- El INEC de Ecuador se encuentra generando un estudio acerca de las modalidades de conducta del consumidor guayaquileño. El departamento estadístico levantó datos que aparecen en miles de dólares para registrar si existe una relación entre el ingreso del consumidor y los niveles de consumo en Guayaquil. Detecte cuáles son las variables en estudio.
	Consumidor
	Ingreso
	Consumo
	1
	30.8
	25.2
	2
	25.2
	22.1
	3
	12.5
	11.5
	4
	28.9
	27.9
	5
	30.0
	15.6
	6
	22.7
	15.6
	7
	10.0
	7.6
	8
	9.9
	8.6
	9
	16.7
	15.9
	10
	14.9
	15.3
	11
	25.2
	26.1
	12
	28.9
	27.6
	13
	24.3
	23.1
	14
	17.9
	10.1
	15
	33.7
	33.5
· Realizar un Diagrama de Dispersión
1. Calcule e interprete el modelo de regresión. ¿Qué opinión le merece sobre la relación entre la puntuación y las ofertas de trabajo?
Para realizar el análisis de regresión, ajustaremos una línea de regresión lineal simple para predecir el "Consumo" en función del "Ingreso".
Consumo = 0.689 * Ingreso + 3.679
Opinión:
El coeficiente de "Ingreso" (0.689) es positivo, lo que indica que hay una relación positiva entre el ingreso y el consumo. A medida que el ingreso aumenta, también lo hace el consumo, lo cual tiene sentido desde una perspectiva económica. El término independiente (3.679) representa el valor esperado del consumo cuando el ingreso es igual a cero. Sin embargo, en este caso, interpretar este valor no tendría un significado práctico, ya que un ingreso de cero no es realista.
2. Coeficiente de determinación y explique
SST = Σ(Consumo - Media del Consumo)^2 
SSE = Σ(Predicción del Consumo - Media del Consumo)^2 
R^2 = 1 - (SSE / SST)
Media del Consumo = (25.2 + 22.1 + 11.5 + 27.9 + 15.6 + 15.6 + 7.6 + 8.6 + 15.9 + 15.3 + 26.1 + 27.6 + 23.1 + 10.1 + 33.5) / 15 = 18.34	
SST = (25.2 - 18.34)^2 + (22.1 - 18.34)^2 + (11.5 - 18.34)^2 + ... + (33.5 - 18.34)^2 = 151.364
Predicción del Consumo (usando el modelo): 
Consumo_predicho = 0.689 * Ingreso + 3.679
SSE = (25.2 - (0.689 * 30.8 + 3.679))^2 + (22.1 - (0.689 * 25.2 + 3.679))^2 + ... + (33.5 - (0.689 * 33.7 + 3.679))^2 = 72.577
R^2 = 1 - (72.577 / 151.364) = 0.519 (aproximadamente)
El coeficiente de determinación (R^2) es aproximadamente 0.519. Esto significa que aproximadamente el 51.9% de la variabilidad en el consumo puede explicarse por la variabilidad en el ingreso en este modelo de regresión. Un R^2 de 0.519 indica que el modelo de regresión tiene un ajuste moderado para predecir el consumo basado en el ingreso.
3. Error de determinación y explique.
SEE = √(SSE / (n - 2))
SEE = √(72.577 / (15 - 2)) = √(72.577 / 13) = 2.635 (aproximadamente)
El error de estimación (SEE) es aproximadamente 2.635. Esto indica que los puntos de datos tienden a dispersarse alrededor de la línea de regresión ajustada con una desviación estándar de aproximadamente 2.635 unidades.
4. Qué opinión tiene acerca de la dispersión en la puntuación y ofertas de trabajo con respecto a la media.
En el ejercicio dado, no se mencionan "puntuación" ni "ofertas de trabajo", lo que dificulta dar una opinión sobre la dispersión en relación con la media.
5. Conclusiones generales acerca de este modelo de pronóstico. 
En este análisis de regresión, hemos observado que hay una relación positiva entre el ingreso y el consumo en el grupo de consumidores guayaquileños. El coeficiente de determinación (R^2) de aproximadamente 0.519 indica que alrededor del 51.9% de la variabilidad en el consumo puede explicarse por la variabilidad en el ingreso. Esto sugiere que el modelo de regresión tiene un ajuste moderado para predecir el consumo basado en el ingreso.
Además, el error de estimación (SEE) de aproximadamente 2.635 indica que los puntos de datos están relativamente cerca de la línea de regresión ajustada, lo que sugiere que el modelo puede hacer buenas predicciones.
 3.- Una casa familiar dedicada a los alquileres turísticos en el corte de Guayaquil recibe unos ingresos por el alquiler de su casa y el restaurant de comidas típicas del cantón. En el mismo sentido los dueños tienen mucho interés en identificar la relación entre el número de cuartos ocupados en la noche y el ingreso por alquiler de su restaurante. 
Se realizo una tabla donde se expone una muestra de 20 días (de lunes a jueves) del año pasado que indica el ingreso del restaurante y el número de habitaciones ocupadas.
	Dia
	Ingreso por alquiler $
	Cuartos Llenos
	1
	1.462
	22
	2
	1.365
	15
	3
	1.560
	21
	4
	1.598
	36
	5
	1.478
	35
	6
	1.369
	29
	7
	1.587
	45
	8
	1.487
	43
	9
	1.440
	41
	10
	1.389
	34
	11
	1.387
	39
	12
	1.999
	38
	13
	1.213
	29
	14
	1.358
	27
	15
	1.478
	27
	16
	1.365
	32
	17
	1.254
	26
	18
	1.899
	48
	19
	1.478
	34
	20
	1.368
	33
Requerimientos:
1. ¿Parece que aumenta el ingreso por desayunos a medida que aumenta el número de habitaciones ocupadas? Trace un diagrama de dispersión para apoyar su conclusión.60
50
40
30
20
10
0
0
500
1.000
1.500
2.000
2.500
Ingresos por alquiler
Cuartos llenos
	
	
	
	
	
	
	
	y = 0,
	0217x+ 0,6289
R² = 0,2389
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
Decimos que SÍ aumentan, como se puede ver en la gráfica como la línea de dispersión va subiendo.
1. Determine el coeficiente de correlación entre las dos variables. Interprete el valor.
	X
	Y
	X - X Barra
	Y - Y barra
	(X - X Barra)(Y - Y barra)
	1.462
	22
	-15
	-11
	157,29
	1.365
	15
	-112
	-18
	1977,09
	1.560
	21
	83
	-12
	-974,61
	1.598
	36
	121
	3
	400,29
	1.478
	35
	1
	2
	2,99
	1.369
	29
	-108
	-4
	398,49
	1.587
	45
	110
	12
	1356,69
	1.487
	43
	10
	10
	106,09
	1.440
	41
	-37
	8
	-304,61
	1.389
	34
	-88
	1
	-114,01
	1.387
	39
	-90
	6
	-565,11
	1.999
	38
	522
	5
	2768,19
	1.213
	29
	-264
	-4
	975,69
	1.358
	27
	-119
	-6
	676,59
	1.478
	27
	1
	-6
	-7,41
	1.365
	32
	-112
	-1
	78,19
	1.254
	26
	-223
	-7
	1492,09
	1.899
	48
	422
	15
	6461,19
	1.478
	34
	1
	1
	1,69
	1.368
	33
	-109
	0
	-32,61
	SUMATORIA
	14854,2
n = 25
Xbarra = 1.477
Ybarra = 32,7
Sx = 189,7305846
Sy = 8,429896672
Dando como resultado:
R = 0,386971008//
1. Coeficiente de determinación y explique
El coeficiente de determinación será el coeficiente de correlación elevado al cuadrado:
R^2 = 0,149746561 //
1. Error de determinación y explique.
Para calcular el error de determinación restamos la unidad con el coeficiente de determinación, es decir:
(1 – 0,149746561) = 0,850253439 o 85,02%//
1. ¿Es razonable concluir que hay una relación positiva entre ingreso y habitaciones ocupadas?
Si es razonable, decimos que sí es positivo, es decir, sí existe una relación directa entre el número de cuartos ocupados y el ingreso por alquiler, pero es una relación débil al estar muy alejada de 1.
1. Conclusiones generales acerca de este modelo de pronóstico.
El modelo de regresión lineal proporciona una herramienta inicial para entender la relación entre la ocupación de habitaciones y los ingresos del restaurante. Sin embargo, es fundamental considerar otras variables y técnicas más avanzadas si se desea mejorar la precisión del pronóstico y tener en cuenta posibles factores adicionales que puedan influir en los ingresos. También es relevante realizar un seguimiento y revisión periódica del modelo para asegurarse de que siga siendo adecuado para la situación y, si es necesario, ajustarlo en función de nuevos datos o cambios en el contexto.

Continuar navegando