Logo Studenta

PROBABILIDAD Y ESTADISTICA BASICA PARA INGENIEROS-14

¡Estudia con miles de materiales!

Vista previa del material en texto

38 
 
 
2.12.3 SIGNOS DE LA COVARIANZA MUESTRAL 
 
La covarianza es una medida del nivel de correlación entre las variables muestrales X, Y. 
La covarianza tiene significado si la relación entre las variables es lineal. 
 
 
Si valores grandes de X están asociados con valores grandes de Y, y si valores pequeños de X 
están asociados con valores pequeños de Y entonces la covarianza tiene signo positivo. En 
este caso los datos tienen una tendencia lineal con pendiente positiva. 
 
Si valores grandes de X están asociados con valores pequeños de Y, y si valores pequeños de 
X están asociados con valores grandes de Y entonces la covarianza tiene signo negativo. En 
este caso los datos tienen una tendencia lineal con pendiente negativa 
 
Para entender este comportamiento debemos referirnos a la definición de covarianza: 
n
XY i i
i 1
1S (x x)(y y)
n 1 =
= − −
− ∑ 
Si en las parejas xi, yi ambos valores son mayores que su media o ambos valores son menores 
que su media respectiva, entonces el producto de las diferencias i i(x x)(y y)− − tendrá signo 
positivo, y la suma tendrá signo positivo. Pero si en las parejas xi, yi, un valor es mayor que su 
media y el otro valor es menor que su media, entonces el producto de las diferencias 
i i(x x)(y y)− − tendrá signo negativo y por lo tanto la suma tendrá signo negativo. 
 
 
Es importante que se mida la correlación entre variables cuya asociación tenga algún significado 
de interés. Asimismo, si las variables no están correlacionadas linealmente, pudiera ser que 
tengan algún otro tipo de correlación, pero no lineal 
 
Es necesario distinguir entre correlación y causalidad. Si dos variables están correlacionadas, 
esto no implica necesariamente que una sea causa de la otra pues ambas pueden depender de 
una tercera variable. Aún en el caso de que la correlación represente una causalidad, la 
estadística solamente permite detectarla y medirla, pero no demostrarla pues esto cae en el 
ámbito de la ciencia en la que se aplica la estadística 
 
 
2.12.4 COEFICIENTE DE CORRELACION LINEAL MUESTRAL 
Es una definición para cuantificar el grado de correlación lineal entre dos variables en forma 
adimensional y normalizada. 
 
Definición: Coeficiente de Correlación Lineal 
 
 XY
X Y
Sr
S S
= , -1 ≤ r ≤ 1 
 
Valores referenciales 
 
Valor de r X y Y 
Cercano a 1 Tienen correlación lineal positiva fuerte 
Cercano a -1 Tienen correlación lineal negativa fuerte 
Cercano a 0 Tienen correlación lineal muy débil o no están correlacionadas linealmente. 
 
El valor que puede tomar r, matemáticamente representa la pendiente de la tendencia de los 
puntos en el Diagrama de Dispersión. 
 
Consideremos el caso en el que X, Y son variables con componentes idénticos, tales que: X = Y 
39 
 
 
 ⇒ 
n n
2 2
XY i i i XX X
i 1 i 1
1 1S (x x)(y y) (x x) S S
n 1 n 1= =
= − − = − = =
− −∑ ∑ 
 ⇒ 
2
XY XX X
2
X Y X X X
S S Sr 1
S S S S S
= = = = 
 
 
2.12.5 MATRIZ DE VARIANZAS Y COVARIANZAS 
Es una matriz simétrica con la que se pueden representar ordenadamente las varianzas y las 
covarianzas entre las variables. 
 
Para definirla se puede usar la notación: 
 
11 X XX X, S S= = 
 
22 X YX Y, S S= = 
Definición: Matriz de Varianzas y Covarianzas 
 
 1 1 2
i j
2 1 2
2
X X X
X X 2
X X X
S S
S
S S
 
   =    
 
 
 
2.12.6 MATRIZ DE CORRELACION 
Es una representación ordenada de los coeficientes de correlación de cada variable con la otra 
variable y consigo misma. 
 
Para definirla se puede usar la notación: 
 
11 X XX X, S S= = 
 
22 X YX Y, S S= = 
Coeficiente de Correlación lineal entre Xi y Xj 
 i j
i j
X X
ij
X X
S
r
S S
= 
Definición: Matriz de Correlación 
 
 1,1 1,2ij
2,1 2,2
r r
r r r
 
  =   
 
 
 
 
Es una matriz simétrica. Los valores en la diagonal principal son iguales a 1 
 
Las definiciones establecidas para la Matriz de Varianzas-Covarianzas y Matriz de Correlación 
con dos variables, pueden extenderse directamente a más variables 
40 
 
 
 
 
Ejemplo 2.2 
Se tiene una muestra con las calificaciones de 10 estudiantes del primer parcial y del segundo 
parcial. 
 
Primer 
Parcial 60 74 66 34 60 66 57 71 39 57 
Segundo 
Parcial 72 82 75 46 73 74 70 82 60 61 
 
Encuentre el Coeficiente de Correlación Lineal e interprete el resultado 
 
Solución 
 
Sean: X: Calificación del primer parcial 
 Y: Calificación del segundo parcial 
 
 
n
i
i 1
1 1x x (60 74 66 34 60 66 57 71 39 57) 58.4
n 10=
= = + + + + + + + + + =∑ 
 
n
2 2 2 2 2
X i
i 1
1 1s (x x) [(60 58.4) (74 58.4) ... (57 58.4) ] 166.4889
n 1 9=
= − = − + − + + − =
− ∑ 
 2x Xs s 166.4889 12.9031= = = 
 
n
i
i 1
1 1y y (72 82 75 46 73 74 70 82 60 61) 69.5
n 10=
= = + + + + + + + + + =∑ 
 
n
2 2 2 2 2
Y i
i 1
1 1s (y y) [(72 69.5) (82 69.5) ... (61 69.5) ] 121.8333
n 1 9=
= − = − + − + + − =
− ∑ 
 2Y Ys s 121.8333 11.0378= = = 
 
 
n
XY i i
i 1
1S (x x)(y y)
n 1
1 [(60 58.4)(72 69.5) (74 58.4)(82 69.5) ...
9
 (57 58.4)(61 69.5)] 134.1111
=
= − −
−
= − − + − − +
+ − − =
∑
 
 
Coeficiente de Correlación 
 
 XY
X Y
S 134.1111r 0.9416
S S (12.9031)(11.0378)
= = = 
 
El resultado indica que la correlación es fuertemente positiva 
 
	2 ESTADÍSTICA DESCRIPTIVA
	2.12 MUESTRAS BIVARIADAS
	2.12.3 SIGNOS DE LA COVARIANZA MUESTRAL
	2.12.4 COEFICIENTE DE CORRELACION LINEAL MUESTRAL
	2.12.5 MATRIZ DE VARIANZAS Y COVARIANZAS
	2.12.6 MATRIZ DE CORRELACION

Continuar navegando