Logo Studenta

asociacion_entre_variables

¡Este material tiene más páginas!

Vista previa del material en texto

VARIABLE
X VARIABLE
Y
 
Estimación por asociaciónEstimación por asociación
Predecir valores de una variable como 
función de otra u otras variables
Y = f (X)
 
Asociación entre variables cuantitativasAsociación entre variables cuantitativas
Variable X 
¿independiente?
Variable Y 
¿dependiente?
SE ASOCIAN
¿Tienen 
relación?
¿Qué clase de 
relación tienen?
Diagrama de 
dispersión
¿Qué grado de 
relación tienen?
ANALISIS DE CORRELACIÓN
ANÁLISIS DE 
REGRESIÓN
Predicción: ¿cuánto 
vale Y si X vale....?
 
DOSDOS ASPECTOS:ASPECTOS:
ANÁLISIS DE CORRELACIÓN
Grado de relación
ANÁLISIS DE REGRESIÓN
Naturaleza de la relación
 
CLASES DE ASOCIACIÓNCLASES DE ASOCIACIÓN
S i m p l e
( 2 v a r i a b l e s )
M ú l t i p l e
( M á s d e 2 v a r i a b l e s )
S E G Ú N C A N T I D A D
D E V A R I A B L E S
L I N E A L N O L I N E A L
S E G Ú N N A T U R A L E Z A
D E L A R E L A C I Ó N
A S O C I A C I Ó N
 
ANÁLISIS DE CORRELACIÓNANÁLISIS DE CORRELACIÓN
BIVARIABLE LINEALBIVARIABLE LINEAL
MUESTRA DE n INDIVIDUOS
Individuo xi yi Pares ordenados
1 x1 y1 (x1 , y1 )
 2 x2 y2 (x2 , y2 )
 3 x3 y3 (x3 , y3 )
 ... ... ... ......
 n xn yn (xn , yn )
 
11er. er. Paso: ver si existe correlación Paso: ver si existe correlación 
lineal entre X e Ylineal entre X e Y
DIAGRAMA DE DISPERSIÓN
( Nube de puntos )
 
Ejemplo de aplicaciónEjemplo de aplicación
Datos
Alumno: 1 2 3 4 5 6 7 8 9 10
Matemát. 8 4 7 8 10 3 9 2 6 5
Física 7 2 6 6 9 2 7 1 5 4
Variables: X  Calificaciones en Matemática
 Y  Calificaciones en Física
 
Diagrama de DispersiónDiagrama de Dispersión
0 2 4 6 8 10 M
 F
 10
 8
 6
 4
 2
 
Supuestos básicos del análisis de correlación Supuestos básicos del análisis de correlación 
bivariable linealbivariable lineal
• X e Y son variables aleatorias
• La población bivariable es normal
X ~ normal con E(X) = x y V(X) =
2
x
Y ~ normal con E(Y) = y y V(Y) =
2
y
• La relación entre X e Y es lineal
 
2do. Paso: Cálculo del 2do. Paso: Cálculo del 
Coeficiente de correlación linealCoeficiente de correlación lineal
 
Cov (Y,X)
Y X
 
E [ ( Y – Y ) ( X - X ) ]
 E ( Y – Y )2  E ( X - X )2 
El coeficiente de correlación lineal mide el grado de 
intensidad de la posible relación entre las variables. 
 
Fórmula de trabajo del Fórmula de trabajo del 
Coeficiente de correlación linealCoeficiente de correlación lineal
i yixi - (iyi)(ixi)/n 
r = 
  [iyi2 - (iyi)2/n ] [ixi2 - (ixi)2/n]
i = 1, 2, 3, . . . , n
 
- no mide la magnitud de la pendiente 
("fuerza de la asociación")
 
- tampoco mide lo apropiado del modelo lineal 
 
33er.er. Paso: Interpretación de r Paso: Interpretación de r
 r  1  Correlación lineal positiva alta
 r  0  No existe correlación lineal
 r  0,5  Correlación lineal positiva 
moderada
 r  -1  Correlación lineal negativa 
alta
 r  -0,5  Correlación lineal negativa
moderada
 
Ejemplo de aplicaciónEjemplo de aplicación
Datos
Alumno: 1 2 3 4 5 6 7 8 9 10
Matemát. 8 4 7 8 10 3 9 2 6 5
Física 7 2 6 6 9 2 7 1 5 4
Variables: X  Calificaciones en Matemática
 Y  Calificaciones en Física
 
Diagrama de DispersiónDiagrama de Dispersión
0 2 4 6 8 10 M
 F
 10
 8
 6
 4
 2
 
Tabla de resultadosTabla de resultados
Variable X
i yixi = 365
ixi = 62
ixi2 =448
Media = 6,2
 = 2,658
Variable Y
iyi = 49
iyi2 = 301
Media = 4,9
 = 2,601
n = 10
 
Calculo de r y rCalculo de r y r22
r =
365 – [(62) . (49)] / 10
  [468 – (62)2/10].[301 – (49)2/10 ]
r = 0.98  Correlación lineal positiva alta
r2 = 0.96  Alto grado de linealidad en 
los puntos del 
diagrama
 
Prueba de la existencia de correlación lineal Prueba de la existencia de correlación lineal 
bivariable estadísticamente significativabivariable estadísticamente significativa
 Hipótesis: H0:  = 0 (No existe correlación lineal 
estadísticamente significativa entre las variables)
H1:  ≠ 0 (Existe correlación lineal estadísticamente 
significativa entre las variables)
 Nivel de significación: P(eI) = 
 Estadística de prueba:
 tc = r √ (n-2) / √1 - r2 ~ t de Student con =n-2 bajo el 
supuesto de que H0 es verdadera.
 
 Criterio de decisión: rechazar H0 si, solo si,
 tc < -t, ó tc > t, (prueba bilateral)
 Cálculos: se realizan todos los cálculos 
necesarios para determinar tc 
 Decisión: si tc ε a la región crítica, se rechaza 
la hipótesis nula.
 si tc no ε a la región crítica, se dice que no 
existen evidencias suficientes para rechazar la 
hipótesis nula.
 Conclusión: se interpreta la decisión.
 
ANÁLISIS DE REGRESIÓNANÁLISIS DE REGRESIÓN
BIVARIABLE LINEALBIVARIABLE LINEAL
FUNCIÓN MATEMÁTICA
PREDICCIÓN
 
Diagrama de DispersiónDiagrama de Dispersión
0 2 4 6 8 10 M
 F
 10
 8
 6
 4
 2
 
Modelo de regresión bivariable linealModelo de regresión bivariable lineal
yi = xi + i
Y : variable dependiente o “explicada”
X : variable independiente o “explicativa”
Parámetros de regresión 
llamados coeficientes de 
regresión de población
Residual
 
La relación de dependencia lineal La relación de dependencia lineal 
consta de dos partesconsta de dos partes
Parte sistemática: xi
Parte estocástica: i
Modelo probabilista
 
Supuestos básicos del A.R.B.L.Supuestos básicos del A.R.B.L.
 La variable independiente X toma valores 
fijados o predeterminados por el investigador, 
y existe una subpoblación de Y para cada X.
 El residuo, i , asociado con cada xi, es una 
variable aleatoria con distribución normal, con 
E(i) = 0 y  E(y / x ) = xi se llama 
ecuación de regresión de población.
 La variancia de la regresión es constante. 
V(yi) = = 
 i es estadísticamente independiente de xi .
 
2
 
Estimación de los parámetros de regresiónEstimación de los parámetros de regresión
Ecuación de regresión lineal de Y sobre X
Poblacional Muestral
yi = xi Yi = a + b xi
a: estimador puntual de 
b: estimador puntual de 
 
Estimación de los parámetrosEstimación de los parámetros
Método de Mínimos Cuadrados
i ( yi - Yi )2 = i ( yi – a – b xi )2
i = 1, 2, 3, . . . , n
ES UN MÍNIMO
 
ECUACIÓN DE LA RECTA DE ECUACIÓN DE LA RECTA DE 
REGRESIÓN DE Y SOBRE XREGRESIÓN DE Y SOBRE X
Yi = a + b xi , i = 1, 2, 3, . . . n
a = y – b x
i yixi - (iyi)(ixi)/n 
 
 b = 
 ixi2 - (ixi)2/n
 
Si X se transforma tal queSi X se transforma tal que
ixi = 0
a = y
i yixi 
 
 b = 
 ixi2
 
Ejemplo de aplicaciónEjemplo de aplicación
Datos
Días 1 2 3 4 5 6 7 8 9 10
Anuncios 4 2 5 6 3 1 7 8 9 10
Ventas 15 8 21 24 17 4 25 23 30 32
Variables: X  N° de anuncios publicitarios
 Y  Ventas
 
Anuncios
121086420
V
e
n
ta
s
40
30
20
10
0
Diagrama de DispersiónDiagrama de Dispersión
r = 0.956  Correlación lineal positiva alta
r2 = 0.914  Alto grado de linealidad 
 
Análisis de regresión bivariable linealAnálisis de regresión bivariable lineal 
Tabla de resultadosTabla de resultados
Variable X
i yixi = 1329
ixi = 55
ixi2 = 385
Media = 5,5
 = 3,027
Variable Y
iyi = 199
iyi2 = 4689
Media = 19,9
 = 8,999
n = 10
 
Yi = a + b xi , i = 1, 2, 3, . . . n
Ecuación de la recta de regresión de Y sobre XEcuación de la recta de regresión de Y sobre X
b = 1329 - (55).(199) / 10 = 2,842 
 
 385 – (55)2 /10
a = 19,9 – 2,842 (5,5) = 4,267 
Los días que no se hagan anuncios se harían, 
en promedio, entrecuatro y cinco ventas. 
Por cada anuncio que se aumenta, las ventas 
aumentan en 2,842.
 
Variancia de la regresión en la muestra
La ecuación de regresión es tanto mejor 
como ecuación predictiva cuanto menor sea 
la variancia de la regresión en la muestra
S2 = i (yi – Yi)2 / (n-2) = i (yi – a – bxi)2 / (n-2) 
Fórmula de cálculo: 
S2 = (i yi2 – a i yi – b  yi xi) / (n-2) 
 
Prueba de la existencia de regresión lineal de Y Prueba de la existencia de regresión lineal de Y 
sobre X estadísticamente significativasobre X estadísticamente significativa
 Hipótesis: H0:  = 0 (No existe regresión 
 lineal de Y sobre X)
 H1:  ≠ 0 (Existe regresión lineal de Y sobre X)
 Nivel de significación: P(eI) = 
 Estadística de prueba:
 tc = b / Sb ~ t de Student con =n-2 bajo el 
supuesto de que H0 es verdadera.
Siendo Sb = S /  i(xi – x )2
 
 Criterio de decisión: rechazar H0 si, solo si,
 tc < -t, ó tc > t, (prueba bilateral)
 Cálculos: se realizan todos los cálculos necesarios 
para determinar tc 
 Decisión: si tc ε a la región crítica, se rechaza la 
hipótesis nula.  La regresión de Y sobre X es 
estadísticamente significativa, por lo tanto la ecuación 
de regresión es confiable como ecuación predictiva.
 si tc no ε a la región crítica, se dice que no existen 
evidencias suficientes para rechazar la hipótesis nula.
 Conclusión: se interpreta la decisión.
 
Para realizar prediccionesPara realizar predicciones
• En Yi = a + b xi , i = 1, 2, 3, . . . n
• Se reemplaza xi por un valor de X para el 
cual se desea estimar Yi 
• Se realizan los cálculos.
• Por ejemplo: cuando se hagan 3 anuncios
• Yi = 4,267 + 2,842 (3) = 12,793
• Se realizarán, en promedio, entre 12 y 13 
ventas.
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 28
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34
	Slide 35
	Slide 36
	Slide 37
	Slide 38

Más contenidos de este tema