Logo Studenta

Análisis de Correlación

¡Estudia con miles de materiales!

Vista previa del material en texto

Análisis de Correlación
En ocasiones se necesita estimar un valor de concentración de una sustancia a partir de medidas de refracción o absorción de luz, o bien calcular una propiedad física o química a partir de la medición de otra propiedad física. A esto se le llama correlacionar dos variables cuantitativas.
Consiste en medir cuantitativamente dos variables de una población de sujetos u objetos y ver el comportamiento conjunto o co-variación. Si al cambiar el valor de una variable cambia el valor en la otra en la misma dirección o en dirección opuesta entonces se dice que las variables están correlacionadas. Posteriormente a este estudio, si existe correlación, se puede expresar el valor de una de las variables como función de la otra variable: Y = f(X). En caso contrario las variables serán independientes una de la otra.
Es posible el análisis aún cuando las dos variables en cuestión (X,Y) no sean medidas con la misma escala o unidades, lo que se requiere es calcular un valor de variación común o covarianza. Esto implica que si una de las variables tiene poca variación (varianza pequeña) entonces no puede haber co-variación. Por lo tanto se requiere hacer uso del parámetro de varianza para cada variable. 
Se hace uso de la definición de varianza para cada una con N observaciones (sujetos u objetos):
2x = (xi-)2 / N;
2y = (yi – )2 / N;
Las que representan la variación para cada una de ellas. Si revisamos la igualdad algebraica para la varianza podemos generar el concepto algebraico de covarianza:
{(xi-)2 / N} = (xi-)(xi-)} / N: sustituyendo el Segundo factor por el correspondiente para la variable Y quedaría: xy = (xi-)(yi-)} / N.
Por lo tanto la covarianza de X con Y significa que si para una observación cualquiera (i) su valor medido en X se aleja de la media de X y su valor medido en Y también se aleja de la media en Y habrá una variación común para las 2 variables, pero si la diferencia en X con la media es grande pero la diferencia en Y con su media es pequeña, entonces no habrá covariación. Al promediar el producto de todas las diferencias entonces se tendrá el valor de covariación para todo el universo expresado como xy.
Este parámetro no representa un valor elevado al cuadrado como la varianza, sino la media del producto de las variaciones individuales, con dos características importantes: primero puede resultar en valores negativos cuando (xi-) = valor positivo con (yi-) = valor negativo; segundo la unidades de la covarianza es igual al producto de las unidades de x por las unidades de y.
Esta última propiedad hace difícil la interpretación de la covarianza. Sin embargo se puede simplificar el parámetro al expresarlo como proporción del producto de las desviaciones estándar de X (x) y de Y (y). A este coeficiente se le conoce como coeficiente de correlación:
 Coeficiente de correlación =  = xy / (x y). Representado por la letra griega ro.
Este coeficiente puede tomar valores entre -1 y +1 y no tiene unidades:
-1 <  < +1
La interpretación es que a valores negativos cercanos a -1 significa que conforme los valores en X aumentan los valores en Y disminuyen y por lo contrario cuando valores positivos se acercan a +1 significan que conforme los valores en X aumentan también lo hacen los valores en Y.
Cuando la correlación es 0 (cero) o cercana a 0 los valores en Y son independientes de los valores en X.
La aplicación práctica es que cuando se conocen los valores en X o se pueden medir, entonces se pueden predecir los valores en Y.
Representación gráfica de la correlación entre dos variables.
En el siguiente ejemplo se cuenta con datos de 20 sujetos adultos del sureste con sobrepeso, a los que se les tomó la edad (años), se midió su estatura (m) y se midió su peso (kg). Se elaboraron gráficas de dispersión entre edad y estatura y entre peso y estatura con los siguientes resultados.
	Edad (años)
	Estatura (m)
	Peso (Kg)
	18
	1.560
	68
	21
	1.592
	66.3
	25
	1.610
	82.4
	25
	1.580
	99.2
	27
	1.545
	65.2
	27
	1.470
	49
	27
	1.575
	58.7
	28
	1.61
	71.6
	29
	1.54
	75.6
	31
	1.650
	79.9
	32
	1.590
	85.4
	33
	1.500
	74.9
	36
	1.510
	70.9
	37
	1.465
	49
	37
	1.700
	79.8
	38
	1.540
	62
	40
	1.530
	70.9
	41
	1.620
	84.4
	43
	1.66
	83.1
	50
	1.620
	66.8
 
Como se puede observar hay valores en edad (ejemplo 30) que corresponden a diferentes valores en estatura y por lo tanto no aparecen estar correlacionados.
En cambio como se puede observar los valores en peso tienden a aumentar conforme aumenta la estatura y por lo tanto parecen estar correlacionados.
A continuación se muestran las estadísticas descriptivas.
	 
	Edad (años)
	Estatura (m)
	Peso (Kg)
	Media
	32.25
	1.57
	72.155
	Desviación Estándar
	7.97
	0.06
	12.371
Las correspondientes covarianzas se calcularon:
	 
	Edad (años)
	Peso (Kg)
	Estatura (m)
	0.082
	0.438
Las covarianzas resultantes son para estatura y edad 0.82 M x Kg, mientras que para peso y estatura 0.438 M x Kg. 
A partir de estos valores calcule las correlaciones correspondientes y haga la interpretación de las mismas.
Gráfica de dispersión de Edad (años) y Estatura (m)
Estatura (m)	28	31	43	37	18	25	27	27	33	25	40	36	38	32	50	21	27	37	41	29	1.61	1.6500000000000001	1.6600000000000001	1.4649999999999999	1.56	1.61	1.5449999999999997	1.47	1.5	1.58	1.53	1.51	1.54	1.59	1.62	1.5920000000000001	1.575	1.7	1.62	1.54	Años
Metros
Gráfica de dispersión de Peso (kg) y Estatura (m)
Estatura (m)	71.599999999999994	79.900000000000006	83.1	49	68	82.4	65.2	49	74.900000000000006	99.2	70.900000000000006	70.900000000000006	62	85.4	66.8	66.3	58.7	79.8	84.4	75.599999999999994	1.61	1.6500000000000001	1.6600000000000001	1.4649999999999999	1.56	1.61	1.5449999999999997	1.47	1.5	1.58	1.53	1.51	1.54	1.59	1.62	1.5920000000000001	1.575	1.7	1.62	1.54	Kilogramos
Metros

Continuar navegando