Vista previa del material en texto
VARIABLE X VARIABLE Y Estimación por asociaciónEstimación por asociación Predecir valores de una variable como función de otra u otras variables Y = f (X) Asociación entre variables cuantitativasAsociación entre variables cuantitativas Variable X ¿independiente? Variable Y ¿dependiente? SE ASOCIAN ¿Tienen relación? ¿Qué clase de relación tienen? Diagrama de dispersión ¿Qué grado de relación tienen? ANALISIS DE CORRELACIÓN ANÁLISIS DE REGRESIÓN Predicción: ¿cuánto vale Y si X vale....? DOSDOS ASPECTOS:ASPECTOS: ANÁLISIS DE CORRELACIÓN Grado de relación ANÁLISIS DE REGRESIÓN Naturaleza de la relación CLASES DE ASOCIACIÓNCLASES DE ASOCIACIÓN S i m p l e ( 2 v a r i a b l e s ) M ú l t i p l e ( M á s d e 2 v a r i a b l e s ) S E G Ú N C A N T I D A D D E V A R I A B L E S L I N E A L N O L I N E A L S E G Ú N N A T U R A L E Z A D E L A R E L A C I Ó N A S O C I A C I Ó N ANÁLISIS DE CORRELACIÓNANÁLISIS DE CORRELACIÓN BIVARIABLE LINEALBIVARIABLE LINEAL MUESTRA DE n INDIVIDUOS Individuo xi yi Pares ordenados 1 x1 y1 (x1 , y1 ) 2 x2 y2 (x2 , y2 ) 3 x3 y3 (x3 , y3 ) ... ... ... ...... n xn yn (xn , yn ) 11er. er. Paso: ver si existe correlación Paso: ver si existe correlación lineal entre X e Ylineal entre X e Y DIAGRAMA DE DISPERSIÓN ( Nube de puntos ) Ejemplo de aplicaciónEjemplo de aplicación Datos Alumno: 1 2 3 4 5 6 7 8 9 10 Matemát. 8 4 7 8 10 3 9 2 6 5 Física 7 2 6 6 9 2 7 1 5 4 Variables: X Calificaciones en Matemática Y Calificaciones en Física Diagrama de DispersiónDiagrama de Dispersión 0 2 4 6 8 10 M F 10 8 6 4 2 Supuestos básicos del análisis de correlación Supuestos básicos del análisis de correlación bivariable linealbivariable lineal • X e Y son variables aleatorias • La población bivariable es normal X ~ normal con E(X) = x y V(X) = 2 x Y ~ normal con E(Y) = y y V(Y) = 2 y • La relación entre X e Y es lineal 2do. Paso: Cálculo del 2do. Paso: Cálculo del Coeficiente de correlación linealCoeficiente de correlación lineal Cov (Y,X) Y X E [ ( Y – Y ) ( X - X ) ] E ( Y – Y )2 E ( X - X )2 El coeficiente de correlación lineal mide el grado de intensidad de la posible relación entre las variables. Fórmula de trabajo del Fórmula de trabajo del Coeficiente de correlación linealCoeficiente de correlación lineal i yixi - (iyi)(ixi)/n r = [iyi2 - (iyi)2/n ] [ixi2 - (ixi)2/n] i = 1, 2, 3, . . . , n - no mide la magnitud de la pendiente ("fuerza de la asociación") - tampoco mide lo apropiado del modelo lineal 33er.er. Paso: Interpretación de r Paso: Interpretación de r r 1 Correlación lineal positiva alta r 0 No existe correlación lineal r 0,5 Correlación lineal positiva moderada r -1 Correlación lineal negativa alta r -0,5 Correlación lineal negativa moderada Ejemplo de aplicaciónEjemplo de aplicación Datos Alumno: 1 2 3 4 5 6 7 8 9 10 Matemát. 8 4 7 8 10 3 9 2 6 5 Física 7 2 6 6 9 2 7 1 5 4 Variables: X Calificaciones en Matemática Y Calificaciones en Física Diagrama de DispersiónDiagrama de Dispersión 0 2 4 6 8 10 M F 10 8 6 4 2 Tabla de resultadosTabla de resultados Variable X i yixi = 365 ixi = 62 ixi2 =448 Media = 6,2 = 2,658 Variable Y iyi = 49 iyi2 = 301 Media = 4,9 = 2,601 n = 10 Calculo de r y rCalculo de r y r22 r = 365 – [(62) . (49)] / 10 [468 – (62)2/10].[301 – (49)2/10 ] r = 0.98 Correlación lineal positiva alta r2 = 0.96 Alto grado de linealidad en los puntos del diagrama Prueba de la existencia de correlación lineal Prueba de la existencia de correlación lineal bivariable estadísticamente significativabivariable estadísticamente significativa Hipótesis: H0: = 0 (No existe correlación lineal estadísticamente significativa entre las variables) H1: ≠ 0 (Existe correlación lineal estadísticamente significativa entre las variables) Nivel de significación: P(eI) = Estadística de prueba: tc = r √ (n-2) / √1 - r2 ~ t de Student con =n-2 bajo el supuesto de que H0 es verdadera. Criterio de decisión: rechazar H0 si, solo si, tc < -t, ó tc > t, (prueba bilateral) Cálculos: se realizan todos los cálculos necesarios para determinar tc Decisión: si tc ε a la región crítica, se rechaza la hipótesis nula. si tc no ε a la región crítica, se dice que no existen evidencias suficientes para rechazar la hipótesis nula. Conclusión: se interpreta la decisión. ANÁLISIS DE REGRESIÓNANÁLISIS DE REGRESIÓN BIVARIABLE LINEALBIVARIABLE LINEAL FUNCIÓN MATEMÁTICA PREDICCIÓN Diagrama de DispersiónDiagrama de Dispersión 0 2 4 6 8 10 M F 10 8 6 4 2 Modelo de regresión bivariable linealModelo de regresión bivariable lineal yi = xi + i Y : variable dependiente o “explicada” X : variable independiente o “explicativa” Parámetros de regresión llamados coeficientes de regresión de población Residual La relación de dependencia lineal La relación de dependencia lineal consta de dos partesconsta de dos partes Parte sistemática: xi Parte estocástica: i Modelo probabilista Supuestos básicos del A.R.B.L.Supuestos básicos del A.R.B.L. La variable independiente X toma valores fijados o predeterminados por el investigador, y existe una subpoblación de Y para cada X. El residuo, i , asociado con cada xi, es una variable aleatoria con distribución normal, con E(i) = 0 y E(y / x ) = xi se llama ecuación de regresión de población. La variancia de la regresión es constante. V(yi) = = i es estadísticamente independiente de xi . 2 Estimación de los parámetros de regresiónEstimación de los parámetros de regresión Ecuación de regresión lineal de Y sobre X Poblacional Muestral yi = xi Yi = a + b xi a: estimador puntual de b: estimador puntual de Estimación de los parámetrosEstimación de los parámetros Método de Mínimos Cuadrados i ( yi - Yi )2 = i ( yi – a – b xi )2 i = 1, 2, 3, . . . , n ES UN MÍNIMO ECUACIÓN DE LA RECTA DE ECUACIÓN DE LA RECTA DE REGRESIÓN DE Y SOBRE XREGRESIÓN DE Y SOBRE X Yi = a + b xi , i = 1, 2, 3, . . . n a = y – b x i yixi - (iyi)(ixi)/n b = ixi2 - (ixi)2/n Si X se transforma tal queSi X se transforma tal que ixi = 0 a = y i yixi b = ixi2 Ejemplo de aplicaciónEjemplo de aplicación Datos Días 1 2 3 4 5 6 7 8 9 10 Anuncios 4 2 5 6 3 1 7 8 9 10 Ventas 15 8 21 24 17 4 25 23 30 32 Variables: X N° de anuncios publicitarios Y Ventas Anuncios 121086420 V e n ta s 40 30 20 10 0 Diagrama de DispersiónDiagrama de Dispersión r = 0.956 Correlación lineal positiva alta r2 = 0.914 Alto grado de linealidad Análisis de regresión bivariable linealAnálisis de regresión bivariable lineal Tabla de resultadosTabla de resultados Variable X i yixi = 1329 ixi = 55 ixi2 = 385 Media = 5,5 = 3,027 Variable Y iyi = 199 iyi2 = 4689 Media = 19,9 = 8,999 n = 10 Yi = a + b xi , i = 1, 2, 3, . . . n Ecuación de la recta de regresión de Y sobre XEcuación de la recta de regresión de Y sobre X b = 1329 - (55).(199) / 10 = 2,842 385 – (55)2 /10 a = 19,9 – 2,842 (5,5) = 4,267 Los días que no se hagan anuncios se harían, en promedio, entrecuatro y cinco ventas. Por cada anuncio que se aumenta, las ventas aumentan en 2,842. Variancia de la regresión en la muestra La ecuación de regresión es tanto mejor como ecuación predictiva cuanto menor sea la variancia de la regresión en la muestra S2 = i (yi – Yi)2 / (n-2) = i (yi – a – bxi)2 / (n-2) Fórmula de cálculo: S2 = (i yi2 – a i yi – b yi xi) / (n-2) Prueba de la existencia de regresión lineal de Y Prueba de la existencia de regresión lineal de Y sobre X estadísticamente significativasobre X estadísticamente significativa Hipótesis: H0: = 0 (No existe regresión lineal de Y sobre X) H1: ≠ 0 (Existe regresión lineal de Y sobre X) Nivel de significación: P(eI) = Estadística de prueba: tc = b / Sb ~ t de Student con =n-2 bajo el supuesto de que H0 es verdadera. Siendo Sb = S / i(xi – x )2 Criterio de decisión: rechazar H0 si, solo si, tc < -t, ó tc > t, (prueba bilateral) Cálculos: se realizan todos los cálculos necesarios para determinar tc Decisión: si tc ε a la región crítica, se rechaza la hipótesis nula. La regresión de Y sobre X es estadísticamente significativa, por lo tanto la ecuación de regresión es confiable como ecuación predictiva. si tc no ε a la región crítica, se dice que no existen evidencias suficientes para rechazar la hipótesis nula. Conclusión: se interpreta la decisión. Para realizar prediccionesPara realizar predicciones • En Yi = a + b xi , i = 1, 2, 3, . . . n • Se reemplaza xi por un valor de X para el cual se desea estimar Yi • Se realizan los cálculos. • Por ejemplo: cuando se hagan 3 anuncios • Yi = 4,267 + 2,842 (3) = 12,793 • Se realizarán, en promedio, entre 12 y 13 ventas. Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36 Slide 37 Slide 38