Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN I Profesores del curso UNIVERSIDAD NACIONAL AGRARIA LA MOLINA Facultad de Economía y Planificación Departamento de Estadística e Informática Análisis de correlación Semana XII 2020-II 0.10 0.08 0.06 0.04 0.02 0.00 Chi Critico0 OBJETIVOS Conocer las condiciones para usar el coeficiente de correlación. Calcular el coeficiente de correlación de Pearson y Spearman. Interpretar y analizar el coeficiente de correlación de Pearson y Spearman. Métodos Estadísticos para la Investigación I 2020-II Sabías que… Un zootecnista está interesado en evaluar 12 ejemplares de trucha en un estudio de índole acuícola, con la finalidad de relacionar la longitud del cuerpo y su ancho. Longitud 66 63 64 76 76 60 73 69 67 65 70 72 Ancho 6 7 6 7 4 3 4 5 4 5 9 7 Se comprobó que las variables no cumplen con el supuesto de normalidad. Correlación: Longitud; Ancho Correlación de Pearson de Longitud y Ancho = 0.175 Valor p = 0.587 Rho de Spearman: Longitud; Ancho Rho de Spearman para Longitud y Ancho = 0.128 Valor p = 0.691 a. Indique el coeficiente correlación adecuado entre longitud y ancho del cuerpo de la trucha. Interprete. b. Pruebe de hipótesis para la existencia de correlación entre longitud y ancho del cuerpo de la trucha. Usar = 0.05 Métodos Estadísticos para la Investigación I 2020-II Logro de la sesión: Al final de la sesión el estudiante analiza, resuelve y demuestra problemas de correlación en situaciones reales aplicadas a su especialidad, hacienda uso de la correlación y prueba de hipótesis. Contenido: Correlación de variables cuantitativas Coeficiente de correlación de Pearson Interpretación del coeficiente de correlación de Pearson Prueba de hipótesis para el coeficiente de correlación de Pearson Ejemplo Coeficiente de correlación de Spearman Prueba de hipótesis del coeficiente de correlación de Spearman Ejemplo Aplicación Fórmulas Referencias CORRELACIÓN DE VARIABLES CUANTITATIVAS Coeficiente de Correlación de Pearson El coeficiente de correlación de Pearson es una medida de la asociación existente entre dos variables cuantitativas. Este coeficiente toma valores desde -1 hasta 1. Para interpretar un coeficiente de correlación tenga en cuenta lo siguiente: a) El valor de r es independiente de las unidades en que se midan x e y b) r =1: significa una perfecta correlación positiva, es decir, todos los puntos caen sobre una línea con pendiente positiva. c) r = 0: significa no hay correlación. Es decir, las variables son independientes d) r = -1: significa una perfecta correlación negativa, es decir, todos los puntos caen sobre una línea con pendiente negativa. e) r mide la fuerza de una relación lineal f) Se usa cuando los datos están medidos en una escala de intervalo o de razón. Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS Si r = 0 nula Si -0.10 < r < 0.10 Casi nula Si -0.20 < r ≤ -0.10 0.10 ≤ r < 0.20 Muy baja Si -0.40 < r ≤ -0.20 0.20 ≤ r < 0.40 Baja Si -0.60 < r ≤ -0.40 0.40 ≤ r < 0.60 Media Si -0.80 < r ≤ -0.60 0.60 ≤ r < 0.80 Alta Si r ≤ -0.80 r > 0.80 Muy alta Si r = ± 1 Perfecta Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS El coeficiente de correlación está dada por: Siendo: SPXY: suma de productos corregidos de X e Y. SCX : suma de cuadrados corregidos de X. SCY : suma de cuadrados corregidos de Y. Métodos Estadísticos para la Investigación I 2020-II Prueba de hipótesis para el coeficiente de correlación de Pearson - procedimiento P1) H0: ρ = 0 (No existe correlación entre X e Y) H1: ρ ≠ 0 (Si existe correlación entre X e Y) P2) Nivel de significancia: P3) Estadístico de prueba: P4) Cálculos: Rechazar Ho si: Graficar: * Usando p-valor: Si p-valor ≤ , entonces se Rechaza H0. Decisión: Rechazar H0 o no rechazar H0. P5) Conclusión: T < 𝑡(𝛼/2,𝑛−2) 𝑜 𝑇 > 𝑡(1−𝛼/2,𝑛−2) 𝑇 = 𝑟 (1 − 𝑟2)/(𝑛 − 2) Ejemplo de aplicación 1 Un ingeniero pesquero está interesado en evaluar 12 ejemplares de trucha en un estudio de índole acuícola, con la finalidad de verificar si existe una correlación entre la longitud del cuerpo y su ancho. Asumiendo de que las variables cumplen el supuesto de normalidad, responda las siguientes preguntas: CORRELACIÓN DE VARIABLES CUANTITATIVAS Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS a. Estime e interprete el coeficiente de correlación de Pearson para la longitud y el ancho de las truchas. Cálculos previos: X: Longitud Y: Ancho Existe una muy baja correlación positiva entre la longitud y el ancho de las truchas. Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS b. Realice la prueba estadística más adecuada para verificar si existe correlación entre la longitud y el ancho de las truchas. Use α=0.05 P1) Planteamiento de hipótesis H0: ρ = 0 (No existe correlación entre X e Y) H1: ρ ≠ 0 (Si existe correlación entre X e Y) P2) Nivel de significación: α=0.05 P3) Estadístico de prueba y desarrollo Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS P3) Estadístico de prueba y desarrollo: P4) Criterios de decisión Como t(0.025,10)<tc<t(0.975,10)=2.228 entonces no se rechaza Ho. Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS P5) Conclusión A un nivel de significación del 5% no se rechaza Ho. Luego no se puede afirmar que exista correlación entre la longitud y el ancho de las truchas. Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS Coeficiente de Correlación de Spearman El coeficiente de correlación de Spearman (1904) es una prueba no paramétrica cuando se quiere medir la relación entre dos variables y no cumplen el supuesto de normalidad en la distribución de tales valores, o cuando una o ambas variables estudiadas son de tipo ordinal. Toma valores entre -1 y 1, y se interpreta exatamente igual que el coeficiente de correlación de Pearson. Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS Coeficiente de Correlación de Spearman Suponga que se toma una muestra aleatoria (x1, Y1), ... , (xn' Yn) de n pares de observaciones. Si las Xi y las Yi se ordenan en sentido ascendente y se calcula la correlación muestral de estos puestos, el coeficiente resultante se llama coeficiente de correlación de orden de Spearman. Si no hay empates, una formula equivalente para calcular este coeficiente es: 2 1 2 6 1 1 n i i s d r n n Métodos Estadísticos para la Investigación I 2020-II di: son las diferencias entre los puestos de los miembros de los distintos pares n: nº de datos. Prueba de hipótesis del coeficiente de Correlación de Spearman - procedimiento P1) H0: ρ = 0 (No existe correlación entre X e Y) H1: ρ ≠ 0 (Si existe correlación entre X e Y) P2) Nivel de significancia: P3) Estadístico de prueba: P4) Cálculos: Rechazar Ho si: rs < - r/2, n, o rs > r/2, n Nota: Si n > 30, se puede calcular y utilizar la tabla de la distribución normal Decisión: Rechazar H0 o no rechazar H0. P5) Conclusión 2 1 2 6 1 1 n i i s d r n n CORRELACIÓN DE VARIABLES CUANTITATIVAS Ejemplo 2: Se sospecha que la abundancia de la especie de gramínea Poa bulbosa en los pastizales depende en gran medida de la humedad que hay en el suelo. Para comprobar esta hipótesis se realizó un muestreo con una cuadrícula de 20 cm de lado obteniéndose una muestra al azar de 12 cuadriculas de pasto. En cada cuadrícula se midió la cobertura de la especie y la humedad del suelo mediante un TDR. Ambas son variables cuantitativas y no se ajustaron una distribuciónnormal. Realice la prueba estadística más adecuada utilizando un α=0.05 Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS Pasos para hallar rs: 1. Clasificar por jerarquìa los valores de X desde 1 hasta n (el número de parejas de valores de X e Y en la muestra). 2. Clasificar por jerarquía los valores de Y desde 1 hasta n. 3. Calcular di, para cada pareja de observaciones, restando la jerarquía de Yi de la jerarquía de Xi. 4. Elevar al cuadrado cada di y calcular, la suma de los valores elevados al cuadrado. 5. Calcula rs Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS Obs Cobertura(X) Humedad(Y) Rango (X) Rango (Y) di di 2 1 82 42 2 3 -1 1 2 98 46 6 4 2 4 3 87 39 5 2 3 9 4 40 37 1 1 0 0 5 116 65 10 8 2 4 6 113 88 9 11 -2 4 7 111 86 8 10 -2 4 8 83 56 3 6 -3 9 9 85 62 4 7 -3 9 10 126 92 12 12 0 0 11 106 54 7 5 2 4 12 117 81 11 9 2 4 Suma 52 Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS Calculo de rs 2 6 52 1 0,818 12 12 1 s x r x rs,/2= 0,5804 ( 2 colas) si n= 12 y para α=0.05, la tabla de Spearman arroja el valor de rs,α/2=0.5804 P1) Planteamiento de hipótesis H0: No existe correlación entre la cobertura de la especie y la humedad del suelo H1: Existe correlación entre la cobertura de la especie y la humedad del suelo P2) Nivel de significación: α=0.05 P3) Estadístico de prueba y desarrollo Métodos Estadísticos para la Investigación I 2020-II CORRELACIÓN DE VARIABLES CUANTITATIVAS Como rs =0.818 es mayor a rs,α/2= 0.5804 , entonces se rechaza Ho. 0.025 de área 0.025 de área -0.5804 -0.5804 P5) Conclusión A un nivel de significación del 5% se rechaza Ho. Por lo tanto hay correlación entre la cobertura de Poa bulbosa y la humedad del suelo. Métodos Estadísticos para la Investigación I 2020-II Aplicación Un zootecnista está interesado en evaluar 12 ejemplares de trucha en un estudio de índole acuícola, con la finalidad de relacionar la longitud del cuerpo y su ancho. Longitud 66 63 64 76 76 60 73 69 67 65 70 72 Ancho 6 7 6 7 4 3 4 5 4 5 9 7 Se comprobó que las variables no cumplen con el supuesto de normalidad. Correlación: Longitud; Ancho Correlación de Pearson de Longitud y Ancho = 0.175 Valor p = 0.587 Rho de Spearman: Longitud; Ancho Rho de Spearman para Longitud y Ancho = 0.128 Valor p = 0.691 a.Indique el coeficiente correlación adecuado entre longitud y ancho del cuerpo de la trucha. Interprete. b.Pruebe de hipótesis para la existencia de correlación entre longitud y ancho del cuerpo de la trucha. Usar = 0.05 Métodos Estadísticos para la Investigación I 2020-II Fórmulas Métodos Estadísticos para la Investigación I 2020-II Referencias R.G.D. Steel, & Torrie, J.H.(1985). Bioestadística Principios y Procedimientos. McGraw Hill, ed Bogotá, Colombia. Montgomery, D. C. (2005). Diseño y análisis de experimentos (2nd. Ed). México: Limusa Wiey. Kuehl, R. O., (2001). Diseño de experimentos: principios estadísticos para el diseño y análisis de investigaciones. (2nd Ed). International Thomson Editores, S.A. de C.V., Mexico, DF. Ramsey, F. L., & Schafer, D. W. (2002).The statistical sleuth: A course in methods of data analysis. Australia: Duxbury/Thomson Learning. Métodos Estadísticos para la Investigación I 2020-II
Compartir