Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Lámina 1 de 16 Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 Coeficientes de correlación de Pearson y Sperman Temas 1. Coeficientes de correlación de Pearson y de Sperman (definición) 2. Como determinar el uso de los coeficientes de correlación de Pearson y de Sperman (interpretación) 3. Ventajas y desventajas de los coeficientes de correlación de Pearson y de Sperman. 4. Aplicación de enfoques Pearson y enfoque Sperman en problemas estadísticos. Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Lámina 2 de 16 Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (Definición) Es una medida de la relación lineal entre dos variables aleatorias cuantitativas. También se define el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación existente entre las 2 variables y en qué medida se relacionan Coeficientes de correlación de Pearson Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (interpretación) El valor del índice de correlación varía en el intervalo [-1,1]: 1. Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante. 2. Si 0 < r < 1, existe una correlación positiva. 3. Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables. 4. Si -1 < r < 0, existe una correlación negativa Coeficientes de correlación de Pearson Lámina 3 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (interpretación) 5. Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante La interpretación del coeficiente de correlación en términos de proporción de variabilidad compartida o explicada se refiere al coeficiente de determinación. Dicho coeficiente se define como el cuadrado del coeficiente de correlación; esto es, dada dos variable X e Y, hace referencia a , y se entiende como una proporción de variabilidades. Por ejemplo, si la correlación entre inteligencia y rendimiento académico es de 0.8, significa que 0.82 = 0.64 es la proporción de varianza compartida entre ambas variables Coeficientes de correlación de Pearson Lámina 4 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (interpretación) Puede interpretarse como que un 64% del rendimiento académico es debido a la inteligencia, o bien, y esto es más exacto si hemos de ser estrictos, que inteligencia y rendimiento académico comparten un 64% de elementos, o lo que es lo mismo, tanto la inteligencia como el rendimiento ponen en juego un 64% de habilidades comunes. En estas circunstancias, si tomamos como variable dependiente o a explicar el rendimiento académico y elegimos la inteligencia como variable predictiva o explicativa, tendremos que tal variable da cuenta de un 64% de la variabilidad en rendimiento. Queda, por ello, 1-0.64=0.36, un 36% del rendimiento que queda sin explicar. A este valor (0.36) se le denomina coeficiente de no determinación o coeficiente de alienación, y se define como 1− Coeficientes de correlación de Pearson Lámina 5 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 Coeficientes de correlación de Pearson (Ventajas) 1. El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables 2. Mientras mas grande sea la muestra mas exacta será la estimación. 3. Una ventaja de este coeficiente consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de estimación (Desventajas) 1. Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas. 2. Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal. 3. Permite predecir el valor de una variable dado un valor determinado de la otra variable. Lámina 6 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (Desventajas) 3. Permite predecir el valor de una variable dado un valor determinado de la otra variable. 4. Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como correlación. . Coeficientes de correlación de Pearson Lámina 7 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (Usos de enfoque en problemas estadísticos) El coeficiente de correlación de Pearson (r) se mide en una escala de 0 a 1, tanto en dirección positiva como negativa. Un valor de “0” indica que no hay relación lineal entre las variables. Un valor de “1” o “–1” indica, respectivamente, una correlación positiva perfecta o negativa perfecta entre dos variables. Normalmente, el valor de se ubicará en alguna parte entre 0 y 1 o entre 0 y –1. En las ciencias sociales en general y en educación en particular, donde la mayoría de las variables son simultáneamente afectadas por una gran multitud factores, una correlación positiva de 0,7 o una correlación negativa de –0,7 se considera muy fuerte. (Por último, tenga en mente el coeficiente de Pearson mide sólo relaciones lineales entre variables, y no es útil para medir relaciones que no son lineales.) Coeficientes de correlación de Pearson Lámina 8 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (Usos de enfoque en problemas estadísticos) Nótese que una correlación negativa no es menos fuerte que una correlación positiva. Así, por ejemplo, un de 0,5 es tan ‘grande’ o fuerte como un de –0,5. Los signos positivos y negativos sólo indican si el valor de una variable aumenta o disminuye, respectivamente, con el aumento en el valor de la otra variable. Coeficientes de correlación de Pearson Lámina 9 de 16 (Usos de enfoque en problemas estadísticos) Como usted sabe, cuando los aumentos (disminuciones) de una variable producen aumentos (disminuciones) en la otra, la relación es positiva. Es negativa cuando los aumentos (disminuciones) de una variable producen disminuciones (aumentos) en la otra. Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 Coeficientes de correlación de Pearson Lámina10 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (Definición) Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es decir, cuando una o ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera y peso de los atletas. Se calcula aplicando la siguiente ecuación: Donde: Coeficiente de correlación por rangos d = diferencia entre los rangos n = numero de datos Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia Coeficientes de correlación de Sperman Lámina 11 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (interpretación) La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bi-variante. Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular Coeficientes de correlación de Sperman Lámina 12 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (interpretación) Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de intento en intento. Un test de la significación de la tendencia entre las condiciones en esta situación fue desarrollado por E. B. Page y normalmente suele conocerse como Page's trend test para alternativas ordenadas. (Ventajas) 1. No está afectada por los cambios en las unidades de medida. 2. Al ser una técnica no parámetra, es libre de distribución probabilística. 3. El coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones Coeficientes de correlación de Sperman Lámina 13 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 Coeficientes de correlación de Sperman (Desventajas) 1. Es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales. 2. no debe ser utilizado para decir algo sobre la relación entre causa y efecto. 3. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir; de forma que las puntuaciones que la representan puedan ser colocadas en dos series ordenadas. 4. A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs. Usos del Coeficiente de correlación de Spearman Lámina 14 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 Coeficientes de correlación de Sperman (Usos de enfoque en problemas estadísticos) La aproximación moderna al problema de averiguar si un valor observado de ρ es significativamente diferente de cero (siempre tendremos - 1 ≤ ρ ≤ 1) a traves del coeficientes de correlación de Sperman es calcular la probabilidad de que sea mayor o igual que el ρ esperado, dada la hipótesis nula, utilizando un test de permutación. Esta aproximación es casi siempre superior a los métodos tradicionales, a no ser que el conjunto de datos sea tan grande que la potencia informática no sea suficiente para generar permutaciones (poco probable con la informática moderna), o a no ser que sea difícil crear un algoritmo para crear permutaciones que sean lógicas bajo la hipótesis nula en el caso particular de que se trate (aunque normalmente estos algoritmos no ofrecen dificultad). Lámina 15 de 16 Instituto Universitario Politécnico Santiago Mariño ingeniería en Mtto. Mecánico Asignación: Estadística Elaborado por: Michelle Ramírez C.I 25.272.215 Fecha: 27/07/2016 (Usos de enfoque en problemas estadísticos) Aunque el test de permutación es a menudo trivial para cualquiera con recursos informáticos y experiencia en programación, todavía se usan ampliamente los métodos tradicionales para obtener significación. La aproximación más básica es comparar el ρ observado con tablas publicadas para varios niveles de significación. Es una solución simple si la significación sólo necesita saberse dentro de cierto rango, o ser menor de un determinado valor, mientras haya tablas disponibles que especifiquen los rangos adecuados. Más abajo hay una referencia a una tabla semejante. Sin embargo, generar estas tablas es computacionalmente intensivo y a lo largo de los años se han usado complicados trucos matemáticos para generar tablas para tamaños de muestra cada vez mayores, de modo que no es práctico para la mayoría extender las tablas existentes. Coeficientes de correlación de Sperman Lámina 16 de 16
Compartir