Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
38 2.12.3 SIGNOS DE LA COVARIANZA MUESTRAL La covarianza es una medida del nivel de correlación entre las variables muestrales X, Y. La covarianza tiene significado si la relación entre las variables es lineal. Si valores grandes de X están asociados con valores grandes de Y, y si valores pequeños de X están asociados con valores pequeños de Y entonces la covarianza tiene signo positivo. En este caso los datos tienen una tendencia lineal con pendiente positiva. Si valores grandes de X están asociados con valores pequeños de Y, y si valores pequeños de X están asociados con valores grandes de Y entonces la covarianza tiene signo negativo. En este caso los datos tienen una tendencia lineal con pendiente negativa Para entender este comportamiento debemos referirnos a la definición de covarianza: n XY i i i 1 1S (x x)(y y) n 1 = = − − − ∑ Si en las parejas xi, yi ambos valores son mayores que su media o ambos valores son menores que su media respectiva, entonces el producto de las diferencias i i(x x)(y y)− − tendrá signo positivo, y la suma tendrá signo positivo. Pero si en las parejas xi, yi, un valor es mayor que su media y el otro valor es menor que su media, entonces el producto de las diferencias i i(x x)(y y)− − tendrá signo negativo y por lo tanto la suma tendrá signo negativo. Es importante que se mida la correlación entre variables cuya asociación tenga algún significado de interés. Asimismo, si las variables no están correlacionadas linealmente, pudiera ser que tengan algún otro tipo de correlación, pero no lineal Es necesario distinguir entre correlación y causalidad. Si dos variables están correlacionadas, esto no implica necesariamente que una sea causa de la otra pues ambas pueden depender de una tercera variable. Aún en el caso de que la correlación represente una causalidad, la estadística solamente permite detectarla y medirla, pero no demostrarla pues esto cae en el ámbito de la ciencia en la que se aplica la estadística 2.12.4 COEFICIENTE DE CORRELACION LINEAL MUESTRAL Es una definición para cuantificar el grado de correlación lineal entre dos variables en forma adimensional y normalizada. Definición: Coeficiente de Correlación Lineal XY X Y Sr S S = , -1 ≤ r ≤ 1 Valores referenciales Valor de r X y Y Cercano a 1 Tienen correlación lineal positiva fuerte Cercano a -1 Tienen correlación lineal negativa fuerte Cercano a 0 Tienen correlación lineal muy débil o no están correlacionadas linealmente. El valor que puede tomar r, matemáticamente representa la pendiente de la tendencia de los puntos en el Diagrama de Dispersión. Consideremos el caso en el que X, Y son variables con componentes idénticos, tales que: X = Y 39 ⇒ n n 2 2 XY i i i XX X i 1 i 1 1 1S (x x)(y y) (x x) S S n 1 n 1= = = − − = − = = − −∑ ∑ ⇒ 2 XY XX X 2 X Y X X X S S Sr 1 S S S S S = = = = 2.12.5 MATRIZ DE VARIANZAS Y COVARIANZAS Es una matriz simétrica con la que se pueden representar ordenadamente las varianzas y las covarianzas entre las variables. Para definirla se puede usar la notación: 11 X XX X, S S= = 22 X YX Y, S S= = Definición: Matriz de Varianzas y Covarianzas 1 1 2 i j 2 1 2 2 X X X X X 2 X X X S S S S S = 2.12.6 MATRIZ DE CORRELACION Es una representación ordenada de los coeficientes de correlación de cada variable con la otra variable y consigo misma. Para definirla se puede usar la notación: 11 X XX X, S S= = 22 X YX Y, S S= = Coeficiente de Correlación lineal entre Xi y Xj i j i j X X ij X X S r S S = Definición: Matriz de Correlación 1,1 1,2ij 2,1 2,2 r r r r r = Es una matriz simétrica. Los valores en la diagonal principal son iguales a 1 Las definiciones establecidas para la Matriz de Varianzas-Covarianzas y Matriz de Correlación con dos variables, pueden extenderse directamente a más variables 40 Ejemplo 2.2 Se tiene una muestra con las calificaciones de 10 estudiantes del primer parcial y del segundo parcial. Primer Parcial 60 74 66 34 60 66 57 71 39 57 Segundo Parcial 72 82 75 46 73 74 70 82 60 61 Encuentre el Coeficiente de Correlación Lineal e interprete el resultado Solución Sean: X: Calificación del primer parcial Y: Calificación del segundo parcial n i i 1 1 1x x (60 74 66 34 60 66 57 71 39 57) 58.4 n 10= = = + + + + + + + + + =∑ n 2 2 2 2 2 X i i 1 1 1s (x x) [(60 58.4) (74 58.4) ... (57 58.4) ] 166.4889 n 1 9= = − = − + − + + − = − ∑ 2x Xs s 166.4889 12.9031= = = n i i 1 1 1y y (72 82 75 46 73 74 70 82 60 61) 69.5 n 10= = = + + + + + + + + + =∑ n 2 2 2 2 2 Y i i 1 1 1s (y y) [(72 69.5) (82 69.5) ... (61 69.5) ] 121.8333 n 1 9= = − = − + − + + − = − ∑ 2Y Ys s 121.8333 11.0378= = = n XY i i i 1 1S (x x)(y y) n 1 1 [(60 58.4)(72 69.5) (74 58.4)(82 69.5) ... 9 (57 58.4)(61 69.5)] 134.1111 = = − − − = − − + − − + + − − = ∑ Coeficiente de Correlación XY X Y S 134.1111r 0.9416 S S (12.9031)(11.0378) = = = El resultado indica que la correlación es fuertemente positiva 2 ESTADÍSTICA DESCRIPTIVA 2.12 MUESTRAS BIVARIADAS 2.12.3 SIGNOS DE LA COVARIANZA MUESTRAL 2.12.4 COEFICIENTE DE CORRELACION LINEAL MUESTRAL 2.12.5 MATRIZ DE VARIANZAS Y COVARIANZAS 2.12.6 MATRIZ DE CORRELACION
Compartir