Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Análisis de Correlación En ocasiones se necesita estimar un valor de concentración de una sustancia a partir de medidas de refracción o absorción de luz, o bien calcular una propiedad física o química a partir de la medición de otra propiedad física. A esto se le llama correlacionar dos variables cuantitativas. Consiste en medir cuantitativamente dos variables de una población de sujetos u objetos y ver el comportamiento conjunto o co-variación. Si al cambiar el valor de una variable cambia el valor en la otra en la misma dirección o en dirección opuesta entonces se dice que las variables están correlacionadas. Posteriormente a este estudio, si existe correlación, se puede expresar el valor de una de las variables como función de la otra variable: Y = f(X). En caso contrario las variables serán independientes una de la otra. Es posible el análisis aún cuando las dos variables en cuestión (X,Y) no sean medidas con la misma escala o unidades, lo que se requiere es calcular un valor de variación común o covarianza. Esto implica que si una de las variables tiene poca variación (varianza pequeña) entonces no puede haber co-variación. Por lo tanto se requiere hacer uso del parámetro de varianza para cada variable. Se hace uso de la definición de varianza para cada una con N observaciones (sujetos u objetos): 2x = (xi-)2 / N; 2y = (yi – )2 / N; Las que representan la variación para cada una de ellas. Si revisamos la igualdad algebraica para la varianza podemos generar el concepto algebraico de covarianza: {(xi-)2 / N} = (xi-)(xi-)} / N: sustituyendo el Segundo factor por el correspondiente para la variable Y quedaría: xy = (xi-)(yi-)} / N. Por lo tanto la covarianza de X con Y significa que si para una observación cualquiera (i) su valor medido en X se aleja de la media de X y su valor medido en Y también se aleja de la media en Y habrá una variación común para las 2 variables, pero si la diferencia en X con la media es grande pero la diferencia en Y con su media es pequeña, entonces no habrá covariación. Al promediar el producto de todas las diferencias entonces se tendrá el valor de covariación para todo el universo expresado como xy. Este parámetro no representa un valor elevado al cuadrado como la varianza, sino la media del producto de las variaciones individuales, con dos características importantes: primero puede resultar en valores negativos cuando (xi-) = valor positivo con (yi-) = valor negativo; segundo la unidades de la covarianza es igual al producto de las unidades de x por las unidades de y. Esta última propiedad hace difícil la interpretación de la covarianza. Sin embargo se puede simplificar el parámetro al expresarlo como proporción del producto de las desviaciones estándar de X (x) y de Y (y). A este coeficiente se le conoce como coeficiente de correlación: Coeficiente de correlación = = xy / (x y). Representado por la letra griega ro. Este coeficiente puede tomar valores entre -1 y +1 y no tiene unidades: -1 < < +1 La interpretación es que a valores negativos cercanos a -1 significa que conforme los valores en X aumentan los valores en Y disminuyen y por lo contrario cuando valores positivos se acercan a +1 significan que conforme los valores en X aumentan también lo hacen los valores en Y. Cuando la correlación es 0 (cero) o cercana a 0 los valores en Y son independientes de los valores en X. La aplicación práctica es que cuando se conocen los valores en X o se pueden medir, entonces se pueden predecir los valores en Y. Representación gráfica de la correlación entre dos variables. En el siguiente ejemplo se cuenta con datos de 20 sujetos adultos del sureste con sobrepeso, a los que se les tomó la edad (años), se midió su estatura (m) y se midió su peso (kg). Se elaboraron gráficas de dispersión entre edad y estatura y entre peso y estatura con los siguientes resultados. Edad (años) Estatura (m) Peso (Kg) 18 1.560 68 21 1.592 66.3 25 1.610 82.4 25 1.580 99.2 27 1.545 65.2 27 1.470 49 27 1.575 58.7 28 1.61 71.6 29 1.54 75.6 31 1.650 79.9 32 1.590 85.4 33 1.500 74.9 36 1.510 70.9 37 1.465 49 37 1.700 79.8 38 1.540 62 40 1.530 70.9 41 1.620 84.4 43 1.66 83.1 50 1.620 66.8 Como se puede observar hay valores en edad (ejemplo 30) que corresponden a diferentes valores en estatura y por lo tanto no aparecen estar correlacionados. En cambio como se puede observar los valores en peso tienden a aumentar conforme aumenta la estatura y por lo tanto parecen estar correlacionados. A continuación se muestran las estadísticas descriptivas. Edad (años) Estatura (m) Peso (Kg) Media 32.25 1.57 72.155 Desviación Estándar 7.97 0.06 12.371 Las correspondientes covarianzas se calcularon: Edad (años) Peso (Kg) Estatura (m) 0.082 0.438 Las covarianzas resultantes son para estatura y edad 0.82 M x Kg, mientras que para peso y estatura 0.438 M x Kg. A partir de estos valores calcule las correlaciones correspondientes y haga la interpretación de las mismas. Gráfica de dispersión de Edad (años) y Estatura (m) Estatura (m) 28 31 43 37 18 25 27 27 33 25 40 36 38 32 50 21 27 37 41 29 1.61 1.6500000000000001 1.6600000000000001 1.4649999999999999 1.56 1.61 1.5449999999999997 1.47 1.5 1.58 1.53 1.51 1.54 1.59 1.62 1.5920000000000001 1.575 1.7 1.62 1.54 Años Metros Gráfica de dispersión de Peso (kg) y Estatura (m) Estatura (m) 71.599999999999994 79.900000000000006 83.1 49 68 82.4 65.2 49 74.900000000000006 99.2 70.900000000000006 70.900000000000006 62 85.4 66.8 66.3 58.7 79.8 84.4 75.599999999999994 1.61 1.6500000000000001 1.6600000000000001 1.4649999999999999 1.56 1.61 1.5449999999999997 1.47 1.5 1.58 1.53 1.51 1.54 1.59 1.62 1.5920000000000001 1.575 1.7 1.62 1.54 Kilogramos Metros
Compartir