Logo Studenta

presentación-correlación - Daniel Sandoval Murillo

¡Este material tiene más páginas!

Vista previa del material en texto

Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Lámina 1 de 16
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
Coeficientes de correlación de 
Pearson y Sperman
Temas
1. Coeficientes de correlación de Pearson y de Sperman (definición)
2. Como determinar el uso de los coeficientes de correlación de Pearson
y de Sperman (interpretación)
3. Ventajas y desventajas de los coeficientes de correlación de Pearson y 
de Sperman.
4. Aplicación de enfoques Pearson y enfoque Sperman en problemas 
estadísticos.
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Lámina 2 de 16
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(Definición)
Es una medida de la relación lineal entre dos variables
aleatorias cuantitativas. También se define el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación
de dos variables siempre y cuando ambas sean cuantitativas. A diferencia de
la covarianza, la correlación de Pearson es independiente de la escala de
medida de las variables.
Los coeficientes de correlación son medidas que indican la situación
relativa de los mismos sucesos respecto a las dos variables, es decir, son la
expresión numérica que nos indica el grado de relación existente entre las 2
variables y en qué medida se relacionan
Coeficientes de correlación de Pearson
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(interpretación)
El valor del índice de correlación varía en el intervalo [-1,1]:
1. Si r = 1, existe una correlación positiva perfecta. El índice indica una
dependencia total entre las dos variables denominada relación directa:
cuando una de ellas aumenta, la otra también lo hace en proporción
constante.
2. Si 0 < r < 1, existe una correlación positiva.
3. Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que
las variables son independientes: pueden existir todavía relaciones no
lineales entre las dos variables.
4. Si -1 < r < 0, existe una correlación negativa
Coeficientes de correlación de Pearson
Lámina 3 de 16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(interpretación)
5. Si r = -1, existe una correlación negativa perfecta. El índice indica una
dependencia total entre las dos variables llamada relación inversa: cuando
una de ellas aumenta, la otra disminuye en proporción constante
La interpretación del coeficiente de correlación en términos de
proporción de variabilidad compartida o explicada se refiere al coeficiente de
determinación. Dicho coeficiente se define como el cuadrado del coeficiente de
correlación; esto es, dada dos variable X e Y, hace referencia a , y se
entiende como una proporción de variabilidades.
Por ejemplo, si la correlación entre inteligencia y rendimiento
académico es de 0.8, significa que 0.82 = 0.64 es la proporción de varianza
compartida entre ambas variables
Coeficientes de correlación de Pearson
Lámina 4 de 16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(interpretación)
Puede interpretarse como que un 64% del rendimiento académico es
debido a la inteligencia, o bien, y esto es más exacto si hemos de ser estrictos,
que inteligencia y rendimiento académico comparten un 64% de elementos, o
lo que es lo mismo, tanto la inteligencia como el rendimiento ponen en juego un
64% de habilidades comunes.
En estas circunstancias, si tomamos como variable dependiente o a
explicar el rendimiento académico y elegimos la inteligencia como variable
predictiva o explicativa, tendremos que tal variable da cuenta de un 64% de la
variabilidad en rendimiento. Queda, por ello, 1-0.64=0.36, un 36% del
rendimiento que queda sin explicar. A este valor (0.36) se le denomina
coeficiente de no determinación o coeficiente de alienación, y se define como
1−
Coeficientes de correlación de Pearson
Lámina 5 de 16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
Coeficientes de correlación de Pearson
(Ventajas)
1. El valor del coeficiente de correlación es independiente de cualquier unidad 
usada para medir variables
2. Mientras mas grande sea la muestra mas exacta será la estimación. 
3. Una ventaja de este coeficiente consiste en la posibilidad de calcular su 
distribución muestral y así poder determinar su error típico de estimación
(Desventajas)
1. Requiere supuestos acerca de la naturaleza o formas de las poblaciones 
afectadas. 
2. Requiere que las dos variables hayan ido medidas hasta un nivel 
cuantitativo continuo y que la distribución de ambas sea semejante a la de 
la curva normal.
3. Permite predecir el valor de una variable dado un valor determinado de la 
otra variable. 
Lámina 6 de 16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(Desventajas)
3. Permite predecir el valor de una variable dado un valor determinado de la 
otra variable.
4. Se trata de valorar la asociación entre dos variables cuantitativas 
estudiando el método conocido como correlación. 
. 
Coeficientes de correlación de Pearson
Lámina 7 de 16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(Usos de enfoque en problemas estadísticos)
El coeficiente de correlación de Pearson (r) se mide en una escala de
0 a 1, tanto en dirección positiva como negativa. Un valor de “0” indica que no
hay relación lineal entre las variables. Un valor de “1” o “–1” indica,
respectivamente, una correlación positiva perfecta o negativa perfecta entre
dos variables. Normalmente, el valor de se ubicará en alguna parte entre 0 y 1
o entre 0 y –1.
En las ciencias sociales en general y en educación en particular,
donde la mayoría de las variables son simultáneamente afectadas por una gran
multitud factores, una correlación positiva de 0,7 o una correlación negativa de
–0,7 se considera muy fuerte. (Por último, tenga en mente el coeficiente de
Pearson mide sólo relaciones lineales entre variables, y no es útil para medir
relaciones que no son lineales.)
Coeficientes de correlación de Pearson
Lámina 8 de 16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(Usos de enfoque en problemas estadísticos)
Nótese que una correlación negativa no es menos fuerte que una
correlación positiva. Así, por ejemplo, un de 0,5 es tan ‘grande’ o fuerte como
un de –0,5. Los signos positivos y negativos sólo indican si el valor de una
variable aumenta o disminuye, respectivamente, con el aumento en el valor de
la otra variable.
Coeficientes de correlación de Pearson
Lámina 9 de 16
(Usos de enfoque en problemas estadísticos)
Como usted sabe, cuando los aumentos (disminuciones) de una
variable producen aumentos (disminuciones) en la otra, la relación es positiva.
Es negativa cuando los aumentos (disminuciones) de una variable producen
disminuciones (aumentos) en la otra.
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
Coeficientes de correlación de Pearson
Lámina10 de 
16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(Definición)
Este coeficiente se emplea cuando una o ambas escalas de medidas
de las variables son ordinales, es decir, cuando una o ambas escalas de
medida son posiciones. Ejemplo: Orden de llegada en una carrera y peso de
los atletas. Se calcula aplicando la siguiente ecuación:
Donde:
Coeficiente de correlación por rangos
d = diferencia entre los rangos
n = numero de datos
Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Coeficientes de correlación de Sperman
Lámina 11 de 
16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(interpretación)
La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos
asociaciones negativas o positivas respectivamente, 0 cero, significa no
correlación pero no independencia. La tau de Kendall es un coeficiente de
correlación por rangos, inversiones entre dos ordenaciones de una distribución
normal bi-variante.
Una generalización del coeficiente de Spearman es útil en la situación
en la cual hay tres o más condiciones, varios individuos son observados en
cada una de ellas, y predecimos que las observaciones tendrán un orden en
particular
Coeficientes de correlación de Sperman
Lámina 12 de 
16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(interpretación)
Por ejemplo, un conjunto de individuos pueden tener tres
oportunidades para intentar cierta tarea, y predecimos que su habilidad
mejorará de intento en intento. Un test de la significación de la tendencia entre
las condiciones en esta situación fue desarrollado por E. B. Page y
normalmente suele conocerse como Page's trend test para alternativas
ordenadas.
(Ventajas)
1. No está afectada por los cambios en las unidades de medida.
2. Al ser una técnica no parámetra, es libre de distribución probabilística.
3. El coeficiente de Spearman es útil en la situación en la cual hay tres o más
condiciones
Coeficientes de correlación de Sperman
Lámina 13 de 
16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
Coeficientes de correlación de Sperman
(Desventajas)
1. Es recomendable usarlo cuando los datos presentan valores extremos, ya 
que dichos valores afectan mucho el coeficiente de correlación de Pearson, 
o ante distribuciones no normales. 
2. no debe ser utilizado para decir algo sobre la relación entre causa y efecto.
3. Para aplicar el coeficiente de correlación de Spearman se requiere que las 
variables estén medidas al menos en escala ordinal, es decir; de forma que 
las puntuaciones que la representan puedan ser colocadas en dos series 
ordenadas. 
4. A veces, este coeficiente es denominado por la letra griega ρs (rho), 
aunque cuando nos situamos en el contexto de la Estadística Descriptiva se 
emplea la notación rs. Usos del Coeficiente de correlación de Spearman
Lámina 14 de 
16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
Coeficientes de correlación de Sperman
(Usos de enfoque en problemas estadísticos)
La aproximación moderna al problema de averiguar si un valor
observado de ρ es significativamente diferente de cero (siempre tendremos -
1 ≤ ρ ≤ 1) a traves del coeficientes de correlación de Sperman es calcular la
probabilidad de que sea mayor o igual que el ρ esperado, dada la hipótesis
nula, utilizando un test de permutación. Esta aproximación es casi siempre
superior a los métodos tradicionales, a no ser que el conjunto de datos sea tan
grande que la potencia informática no sea suficiente para generar
permutaciones (poco probable con la informática moderna), o a no ser que sea
difícil crear un algoritmo para crear permutaciones que sean lógicas bajo la
hipótesis nula en el caso particular de que se trate (aunque normalmente estos
algoritmos no ofrecen dificultad).
Lámina 15 de 
16
Instituto Universitario Politécnico Santiago 
Mariño
ingeniería en Mtto. Mecánico
Asignación: Estadística
Elaborado por: Michelle 
Ramírez
C.I 25.272.215
Fecha: 27/07/2016
(Usos de enfoque en problemas estadísticos)
Aunque el test de permutación es a menudo trivial para cualquiera
con recursos informáticos y experiencia en programación, todavía se usan
ampliamente los métodos tradicionales para obtener significación. La
aproximación más básica es comparar el ρ observado con tablas publicadas
para varios niveles de significación. Es una solución simple si la significación
sólo necesita saberse dentro de cierto rango, o ser menor de un determinado
valor, mientras haya tablas disponibles que especifiquen los rangos adecuados.
Más abajo hay una referencia a una tabla semejante. Sin embargo, generar
estas tablas es computacionalmente intensivo y a lo largo de los años se han
usado complicados trucos matemáticos para generar tablas para tamaños de
muestra cada vez mayores, de modo que no es práctico para la mayoría
extender las tablas existentes.
Coeficientes de correlación de Sperman
Lámina 16 de 
16

Continuar navegando