Logo Studenta

f7098176

¡Estudia con miles de materiales!

Vista previa del material en texto

Lic. Mgr. Manuel Tuesta Moreno
1
Facultad de Ingeniería
de Sistemas e Informática
Lic. Manuel Tuesta Moreno Mgr.
Docente FISI - UNAP
1
y = 2.0969x ‐ 0.7145
R² = 0.9801
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7
2
REGRSIÓN LINEAL SIMPLE
Se trata con muestras bivariantes
cuantitativas, es decir con muestras
donde en cada unidad estadística se
observa dos característica cuantitativas
medibles e , por ejemplo, ingresos y
gastos mensuales.
En este caso se presenta el problema de
determinar la existencia de algún tipo de
relacionamiento o asociación entre las
variables. El análisis de la asociación
presenta dos aspectos:
1° El problema de correlación.
2° El problema de regresión.
3
REGRSIÓN LINEAL SIMPLE
1. Diagrama de dispersión. (Definición).
Se denomina diagrama de dispersión o
nube de puntos, a la gráfica de los
valores ; de las variables e en el
sistema cartesiano.
4
REGRSIÓN LINEAL SIMPLE
2. Covarianza.
Es una estadística que mide el grado de
dispersión o variabilidad conjunta de dos
variables e con respecto a sus
medias respectivas , .
Definición. La covarianza de valores
, , , , … , de una variable
bidimensional , es el número ,
o que se define igual a la media
aritmética de los productos de las
desviaciones de los datos con respecto
a sus correspondientes medias , .
5
REGRSIÓN LINEAL SIMPLE
2. Covarianza.
∑
O
∑
.
La covarianza a diferencia de la
varianza, puede ser negativa.
REGRSIÓN LINEAL SIMPLE
3. Coeficiente o índice de correlación
Definición. El coeficiente de correlación
lineal de Pearson de pares de valores
, , , , … , de una variable
aleatoria bidimensional , es el
número abstracto que se calcula por:
Donde:
es la covarianza de e .
es la desviación estándar de .
es la desviación estándar de .
6
Lic. Mgr. Manuel Tuesta Moreno
2
7
REGRSIÓN LINEAL SIMPLE
3. Coeficiente o índice de correlación
es un número comprendido de a .
Interpretación:
 Si , se dice que hay una
correlación perfecta negativa.
 Si , se dice que hay una
correlación perfecta positiva.
 Si , se dice que no hay correlación
entre las dos variables.
8
REGRSIÓN LINEAL SIMPLE
4. Regresión lineal simple.
Dados pares de valores
, , , , … , de una variable
aleatoria bidimensional , . La
regresión lineal simple de con
respecto a , consiste en determinar la
ecuación de la recta:
Que mejor se ajuste a los valores de la
muestra, con el fin de predecir o estimar
(variable dependiente) a partir de
(variable independiente). El proceso de
predecir o estimar a partir de la
variable , es la regresión.
9
REGRSIÓN LINEAL SIMPLE
4. Regresión lineal simple.
Notación: representa un valor de
calculado de la ecuación
cuando es igual a . Esto es
se denomina valor estimado o
predecido o ajustado de cuando
Definición. Se denomina error o residuo
a cada diferencia, del valor
observado y el valor pronosticado .
10
REGRSIÓN LINEAL SIMPLE
4. Regresión lineal simple.
11
REGRSIÓN LINEAL SIMPLE
5. Recta de regresión de mínimos
cuadrados de en . Es aquella que
hace mínima la suma de los cuadrados
de errores (SCE) cuya expresión es:
12
REGRSIÓN LINEAL SIMPLE
5. Recta de regresión de mínimos
cuadrados de en .
Ecuaciones normales (Gauss – Markow)
Lic. Mgr. Manuel Tuesta Moreno
3
13
REGRSIÓN LINEAL SIMPLE
5. Recta de regresión de mínimos
cuadrados de en .
Las ecuaciones normales se obtiene de
igualar a cero las derivadas de SCE con
respecto a y con respecto a
respectivamente. Resolviendo se tiene:
∑ ∑ ∑
∑ ∑
			 			
De la primera ecuación normal:
14
REGRSIÓN LINEAL SIMPLE
5. Recta de regresión de mínimos
cuadrados de en .
NOTA:
Sustituyendo en ,
resulta:
15
REGRSIÓN LINEAL SIMPLE
Interpretación del coeficiente de
regresión .
 El coeficiente es la pendiente o el
coeficiente de la regresión lineal. La
constante es la ordenada en el
origen.
 Si , entonces, la tendencia lineal
es creciente, es decir, a mayores
valores de corresponden mayores
valores de . También, a menores
valores de corresponden menores
valores de .
16
REGRSIÓN LINEAL SIMPLE
Interpretación del coeficiente de
regresión .
 Si , entonces, la tendencia lineal
es decreciente, es decir, a mayores
valores de corresponden menores
valores de . También, a menores
valores de corresponden mayores
valores de .
 Si , entonces, . Luego,
permanece estacionario para
cualquier valor de . En este caso se
dice que, no hay regresión.
17
REGRSIÓN LINEAL SIMPLE
Interpretación del coeficiente de
regresión .
 es el cambio promedio en
cuando cambia una unidad. Esto es,
si se incrementa , entonces se
incrementa en promedio .
 En general, si se incrementa ,
entonces se incrementa en
promedio .
18
EJERCICIOS
E-1) En un estudio de la relación entre la
publicidad por radio y las ventas de un
producto, durante 10 semanas se han
recopilado los tiempos de duración en
minutos de la publicidad por semana ,
y el número de artículos vendidos ,
resultando:
Semana 1 2 3 4 5
Publicidad 20 30 30 40 50
Ventas 50 73 69 87 108
Lic. Mgr. Manuel Tuesta Moreno
4
19
Semana 6 7 8 9 10
Publicidad 60 60 60 70 80
Ventas 128 135 132 148 170
a) Trazar el diagrama de dispersión e
indicar la tendencia
b) Calcular la recta de regresión de
mínimos cuadrados con el fin de predecir
las ventas.
c) Estimar la venta si en una semana se
hace 100 minutos de propaganda.
d) Calcular el coeficiente de correlación.
e) Si en la novena semana se incrementa la
publicidad en 5 minutos, ¿en cuánto se
estima se incrementen las ventas?
20
E-2) Los ingresos y los gastos
mensuales en dólares en una muestra de
100 familias han dado los siguientes
resultados:
, , . ,	
. , .
Determinar la recta de regresión de
mínimos cuadrados de en y estime el
gasto de una familia que tiene $250
dólares de ingreso.
21
REGRSIÓN LINEAL SIMPLE
Notas:
1) De y , se obtiene la
relación entre los coeficientes de
correlación , y el de regresión, .
.
Entre otras cosas, y tienen el mismo
signo.
22
REGRSIÓN LINEAL SIMPLE
Notas:
2) La recta de regresión de en , es
decir, variable dependiente de está
dada por:
Donde: y
Esta de recta de regresión de en se
puede escribir también como:
			ó			
Observar que también pasa por , .
23
REGRSIÓN LINEAL SIMPLE
Notas:
3) Los coeficientes de regresión y
verifican:
. . .
El número es denominado Coeficiente
de determinación.
24
REGRSIÓN LINEAL SIMPLE
Notas:
4) Comparando las rectas de regresión
: 			 	 	 	
: 			 	 	 	
Resulta que, son coincidentes
	 	ó	 	
Lic. Mgr. Manuel Tuesta Moreno
5
25
REGRSIÓN LINEAL SIMPLE
Notas:
4) Comparando las rectas de regresión
significa que 	ó	 es paralela al
eje X, 	ó	 es paralela al eje Y y
perpendiculares entre si en el punto
común , .
En consecuencia, si tiende a cero, las
rectas y tienden a ser
perpendiculares y si tiende a o a ,
las rectas y tienden a ser
coincidentes.
26
REGRSIÓN LINEAL SIMPLE
Partición de la varianza de Y,
Sea , un valor observado de la
variable , e el valor en la ecuación
de regresión cuando . La
varianza de es el número: ∑
Se tiene:
27
REGRSIÓN LINEAL SIMPLE
Partición de la varianza de Y,
	
	 	
	 	 	 	 ó
Se verifica la siguiente partición de
sumas de cuadrados:
28
REGRSIÓN LINEAL SIMPLE
Partición de la varianza de Y,
: Suma de cuadrados total.
: Suma de cuadrados de los errores.
: Suma de cuadrados debido a la
regresión.
29
REGRSIÓN LINEAL SIMPLE
Partición de la varianza de Y,
Si se divide por , (el tamaño de la
muestra), entonces, se dice que la
“varianza de las es igual a la varianza
no explicada o residual más la varianza
explicada por la recta de regresión”.
E-3) En una muestra de 5 obreros de una
fábrica se han observado sus años de
experiencia y el tiempo que tardan
en realizar una determinada tarea .
Los datos se muestran en la tabla que
sigue:
Verificar que la variación total es igual a
la variación no explicada más la
variación explicada por la regresión de
en
1 2 3 4 5
8 9 4 3 3
30
Lic. Mgr. Manuel Tuesta Moreno
6
31
REGRSIÓN LINEAL SIMPLE
Coeficiente de determinación
El coeficiente de determinación se
define como el cociente (de la
regresión de en).
∑
∑
32
REGRSIÓN LINEAL SIMPLE
Coeficiente de determinación
De la partición de la suma de cuadrados:
Resulta:
						 ∗
por lo tanto, para interpretar la partición
de la varianzas relativas bastará con
calcular , luego y establecer:
			ó
% % %
33
E-4) Del ejemplo (2), . ; 	 . ,
entonces, se tiene
			→ 			 . .
Ó con aproximación a dos decimales
. .
Es decir, el % de la variabilidad en los
gastos mensuales se explica por la
asociación con los ingresos mensuales.
Queda % de variabilidad en los gastos
que no se explica por la regresión.
34
REGRSIÓN LINEAL SIMPLE
Coeficiente de determinación
Consecuencias:
1) De la igualdad ∗ (diapositiva 32) se
concluye que . Entonces, .
Si , se dice que existe una correlación
directa positiva, ambas variables aumentan
(o disminuyen) simultáneamente.
Si , se dice que existe una correlación
inversa negativa, mientras los valores de una
variable aumenta, los de la otra disminuyen y
viceversa.
Si , se dice que no hay correlación entre
e . Por lo tanto no hay regresión de en .
35
REGRSIÓN LINEAL SIMPLE
Coeficiente de determinación
Consecuencias:
2) , sólo si, , o sólo si, ,
para los datos de la muestra. Esto
significa que todos los están en la
recta de regresión. En este caso se dice
que hay correlación perfecta entre e .
 Si , se dice que hay una
correlación perfecta positiva.
 Si , se dice que hay una
correlación perfecta negativa.
36
REGRSIÓN LINEAL SIMPLE
Coeficiente de determinación
Consecuencias:
3) , sólo si, , ó sólo si,
para los datos de la muestra. Es decir
no cambia cuando cambia , o todas
las predicciones son iguales a una
misma constante. En este caso no hay
correlación ni regresión.
Lic. Mgr. Manuel Tuesta Moreno
7
37
REGRSIÓN LINEAL SIMPLE
Coeficiente de determinación
Consecuencias:
4) El coeficiente de determinación , es
pues una medida de la proximidad del
ajuste de la recta de regresión. Cuando
mayor sea el valor de , mejor será el
ajuste y más útil la recta de regresión
como instrumento de predicción.
38
REGRSIÓN LINEAL SIMPLE
Coeficiente de determinación
Consecuencias:
Advertencia: El haber supuesto una
función lineal entre dos variables y
haber encontrado un alto coeficiente de
correlación, no necesariamente significa
que una variable dependa de la otra,
pues, esta correlación puede no ser
causal, sino casual. Para que exista
correlación debe haber causa y efecto.
39
E-5) El ingreso anual disponible y los
gastos de consumo (en dólares) de una
muestra de 10 familias de un barrio
residencial de Tumbes fueron tabulados
en el cuadro que sigue.
Hallar la recta de regresión del consumo
con respecto al ingreso , utilizando la
transformación ´ y ´ .
Ingreso 20000 14000 35000 23000 12000
Consumo 18000 15000 30000 16000 9000
Ingreso 5000 7000 14000 30000 25000
Consumo 7000 7000 15000 26000 23000
40
E-6) Al estudiar la relación entre costos
y ventas en dólares de ciertos
productos a partir de una muestra se
obtuvo la siguiente información.
; 	 ; 	 ; 	 ; .
Si los costos se incrementan en $ y las
ventas correspondientes se incrementan
en $ .
a) ¿Cómo cambia la ecuación de
regresión?
b) ¿Qué porcentaje de la varianza de las
ventas es explicada por la regresión
de ventas sobre costos?
41
E-7) Cuando una de las variables es el tiempo (en
días, meses o años), la regresión se denomina
serie de tiempo. Supongamos que la producción
(en millones) de un determinado artículo fabricado
por una compañía durante los años 1980 – 1989 es
como sigue
a) Trazar un gráfico de líneas y describir la
tendencia.
b) Hallar la recta de regresión (serie de tiempo) de
la producción en función del tiempo.
c) Estimar la producción de artículos para 1990 y
establecer si es significativa tal predicción.
Años 1980 1981 1982 1983 1984
Producción 92.2 92.3 80.0 89.1 83.5
Años 1985 1986 1987 1988 1989
Producción 68.9 69.2 67.1 58.3 61.2
42
NOCIONES DE REGRSIÓN NO LINEAL
Ecuación no
lineal
Transformación
lineal
Exponencial
.
.
Potencia
.
.
Hiperbólica ´
Siendo: ´
Lic. Mgr. Manuel Tuesta Moreno
8
43
E-8) Ajustar por el método de mínimos
cuadrados una curva de la forma
.
a los siguientes pares de datos
1.5 2 3 3.5 4 5
2.6 2.4 1.2 1.8 1.6 1.4
E-9) Para los siguientes datos
experimentales
Se plantean los modelos
. 			 			
para relacionar con , ¿cuál de los dos
modelos se ajusta mejor a los datos?
44
1 2 3 4 5 6
10 40 120 300 800 1500
45
E-10) Si
verificar que:
a) ∑ b) ∑ .
c) ∑ . d) ∑
46
E-11) Verificar que:
E-12) Verificar que, si
.
,
entonces,
∑
∑
47
E-13) El coeficiente de correlación entre
dos variables e es . . Si
. , . , , . Hallar la recta
de regresión:
a) De en .
. .
b) De en .
. . 			ó			 . .
48
E-14) Al estimar las ventas de un
artículo en función de los precios
se usó una recta de mínimos
cuadrados basados en una muestra de
4 datos. Si las ventas observadas
fueron 10, 8, 6, 14 y si las ventas
estimadas respectivas son 10.8, 8.2,
5.6, 13.4, ¿qué porcentaje de la
varianza de las ventas es explicada
por la recta de regresión?
. . %

Continuar navegando