Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Lic. Mgr. Manuel Tuesta Moreno 1 Facultad de Ingeniería de Sistemas e Informática Lic. Manuel Tuesta Moreno Mgr. Docente FISI - UNAP 1 y = 2.0969x ‐ 0.7145 R² = 0.9801 0 2 4 6 8 10 12 14 0 1 2 3 4 5 6 7 2 REGRSIÓN LINEAL SIMPLE Se trata con muestras bivariantes cuantitativas, es decir con muestras donde en cada unidad estadística se observa dos característica cuantitativas medibles e , por ejemplo, ingresos y gastos mensuales. En este caso se presenta el problema de determinar la existencia de algún tipo de relacionamiento o asociación entre las variables. El análisis de la asociación presenta dos aspectos: 1° El problema de correlación. 2° El problema de regresión. 3 REGRSIÓN LINEAL SIMPLE 1. Diagrama de dispersión. (Definición). Se denomina diagrama de dispersión o nube de puntos, a la gráfica de los valores ; de las variables e en el sistema cartesiano. 4 REGRSIÓN LINEAL SIMPLE 2. Covarianza. Es una estadística que mide el grado de dispersión o variabilidad conjunta de dos variables e con respecto a sus medias respectivas , . Definición. La covarianza de valores , , , , … , de una variable bidimensional , es el número , o que se define igual a la media aritmética de los productos de las desviaciones de los datos con respecto a sus correspondientes medias , . 5 REGRSIÓN LINEAL SIMPLE 2. Covarianza. ∑ O ∑ . La covarianza a diferencia de la varianza, puede ser negativa. REGRSIÓN LINEAL SIMPLE 3. Coeficiente o índice de correlación Definición. El coeficiente de correlación lineal de Pearson de pares de valores , , , , … , de una variable aleatoria bidimensional , es el número abstracto que se calcula por: Donde: es la covarianza de e . es la desviación estándar de . es la desviación estándar de . 6 Lic. Mgr. Manuel Tuesta Moreno 2 7 REGRSIÓN LINEAL SIMPLE 3. Coeficiente o índice de correlación es un número comprendido de a . Interpretación: Si , se dice que hay una correlación perfecta negativa. Si , se dice que hay una correlación perfecta positiva. Si , se dice que no hay correlación entre las dos variables. 8 REGRSIÓN LINEAL SIMPLE 4. Regresión lineal simple. Dados pares de valores , , , , … , de una variable aleatoria bidimensional , . La regresión lineal simple de con respecto a , consiste en determinar la ecuación de la recta: Que mejor se ajuste a los valores de la muestra, con el fin de predecir o estimar (variable dependiente) a partir de (variable independiente). El proceso de predecir o estimar a partir de la variable , es la regresión. 9 REGRSIÓN LINEAL SIMPLE 4. Regresión lineal simple. Notación: representa un valor de calculado de la ecuación cuando es igual a . Esto es se denomina valor estimado o predecido o ajustado de cuando Definición. Se denomina error o residuo a cada diferencia, del valor observado y el valor pronosticado . 10 REGRSIÓN LINEAL SIMPLE 4. Regresión lineal simple. 11 REGRSIÓN LINEAL SIMPLE 5. Recta de regresión de mínimos cuadrados de en . Es aquella que hace mínima la suma de los cuadrados de errores (SCE) cuya expresión es: 12 REGRSIÓN LINEAL SIMPLE 5. Recta de regresión de mínimos cuadrados de en . Ecuaciones normales (Gauss – Markow) Lic. Mgr. Manuel Tuesta Moreno 3 13 REGRSIÓN LINEAL SIMPLE 5. Recta de regresión de mínimos cuadrados de en . Las ecuaciones normales se obtiene de igualar a cero las derivadas de SCE con respecto a y con respecto a respectivamente. Resolviendo se tiene: ∑ ∑ ∑ ∑ ∑ De la primera ecuación normal: 14 REGRSIÓN LINEAL SIMPLE 5. Recta de regresión de mínimos cuadrados de en . NOTA: Sustituyendo en , resulta: 15 REGRSIÓN LINEAL SIMPLE Interpretación del coeficiente de regresión . El coeficiente es la pendiente o el coeficiente de la regresión lineal. La constante es la ordenada en el origen. Si , entonces, la tendencia lineal es creciente, es decir, a mayores valores de corresponden mayores valores de . También, a menores valores de corresponden menores valores de . 16 REGRSIÓN LINEAL SIMPLE Interpretación del coeficiente de regresión . Si , entonces, la tendencia lineal es decreciente, es decir, a mayores valores de corresponden menores valores de . También, a menores valores de corresponden mayores valores de . Si , entonces, . Luego, permanece estacionario para cualquier valor de . En este caso se dice que, no hay regresión. 17 REGRSIÓN LINEAL SIMPLE Interpretación del coeficiente de regresión . es el cambio promedio en cuando cambia una unidad. Esto es, si se incrementa , entonces se incrementa en promedio . En general, si se incrementa , entonces se incrementa en promedio . 18 EJERCICIOS E-1) En un estudio de la relación entre la publicidad por radio y las ventas de un producto, durante 10 semanas se han recopilado los tiempos de duración en minutos de la publicidad por semana , y el número de artículos vendidos , resultando: Semana 1 2 3 4 5 Publicidad 20 30 30 40 50 Ventas 50 73 69 87 108 Lic. Mgr. Manuel Tuesta Moreno 4 19 Semana 6 7 8 9 10 Publicidad 60 60 60 70 80 Ventas 128 135 132 148 170 a) Trazar el diagrama de dispersión e indicar la tendencia b) Calcular la recta de regresión de mínimos cuadrados con el fin de predecir las ventas. c) Estimar la venta si en una semana se hace 100 minutos de propaganda. d) Calcular el coeficiente de correlación. e) Si en la novena semana se incrementa la publicidad en 5 minutos, ¿en cuánto se estima se incrementen las ventas? 20 E-2) Los ingresos y los gastos mensuales en dólares en una muestra de 100 familias han dado los siguientes resultados: , , . , . , . Determinar la recta de regresión de mínimos cuadrados de en y estime el gasto de una familia que tiene $250 dólares de ingreso. 21 REGRSIÓN LINEAL SIMPLE Notas: 1) De y , se obtiene la relación entre los coeficientes de correlación , y el de regresión, . . Entre otras cosas, y tienen el mismo signo. 22 REGRSIÓN LINEAL SIMPLE Notas: 2) La recta de regresión de en , es decir, variable dependiente de está dada por: Donde: y Esta de recta de regresión de en se puede escribir también como: ó Observar que también pasa por , . 23 REGRSIÓN LINEAL SIMPLE Notas: 3) Los coeficientes de regresión y verifican: . . . El número es denominado Coeficiente de determinación. 24 REGRSIÓN LINEAL SIMPLE Notas: 4) Comparando las rectas de regresión : : Resulta que, son coincidentes ó Lic. Mgr. Manuel Tuesta Moreno 5 25 REGRSIÓN LINEAL SIMPLE Notas: 4) Comparando las rectas de regresión significa que ó es paralela al eje X, ó es paralela al eje Y y perpendiculares entre si en el punto común , . En consecuencia, si tiende a cero, las rectas y tienden a ser perpendiculares y si tiende a o a , las rectas y tienden a ser coincidentes. 26 REGRSIÓN LINEAL SIMPLE Partición de la varianza de Y, Sea , un valor observado de la variable , e el valor en la ecuación de regresión cuando . La varianza de es el número: ∑ Se tiene: 27 REGRSIÓN LINEAL SIMPLE Partición de la varianza de Y, ó Se verifica la siguiente partición de sumas de cuadrados: 28 REGRSIÓN LINEAL SIMPLE Partición de la varianza de Y, : Suma de cuadrados total. : Suma de cuadrados de los errores. : Suma de cuadrados debido a la regresión. 29 REGRSIÓN LINEAL SIMPLE Partición de la varianza de Y, Si se divide por , (el tamaño de la muestra), entonces, se dice que la “varianza de las es igual a la varianza no explicada o residual más la varianza explicada por la recta de regresión”. E-3) En una muestra de 5 obreros de una fábrica se han observado sus años de experiencia y el tiempo que tardan en realizar una determinada tarea . Los datos se muestran en la tabla que sigue: Verificar que la variación total es igual a la variación no explicada más la variación explicada por la regresión de en 1 2 3 4 5 8 9 4 3 3 30 Lic. Mgr. Manuel Tuesta Moreno 6 31 REGRSIÓN LINEAL SIMPLE Coeficiente de determinación El coeficiente de determinación se define como el cociente (de la regresión de en). ∑ ∑ 32 REGRSIÓN LINEAL SIMPLE Coeficiente de determinación De la partición de la suma de cuadrados: Resulta: ∗ por lo tanto, para interpretar la partición de la varianzas relativas bastará con calcular , luego y establecer: ó % % % 33 E-4) Del ejemplo (2), . ; . , entonces, se tiene → . . Ó con aproximación a dos decimales . . Es decir, el % de la variabilidad en los gastos mensuales se explica por la asociación con los ingresos mensuales. Queda % de variabilidad en los gastos que no se explica por la regresión. 34 REGRSIÓN LINEAL SIMPLE Coeficiente de determinación Consecuencias: 1) De la igualdad ∗ (diapositiva 32) se concluye que . Entonces, . Si , se dice que existe una correlación directa positiva, ambas variables aumentan (o disminuyen) simultáneamente. Si , se dice que existe una correlación inversa negativa, mientras los valores de una variable aumenta, los de la otra disminuyen y viceversa. Si , se dice que no hay correlación entre e . Por lo tanto no hay regresión de en . 35 REGRSIÓN LINEAL SIMPLE Coeficiente de determinación Consecuencias: 2) , sólo si, , o sólo si, , para los datos de la muestra. Esto significa que todos los están en la recta de regresión. En este caso se dice que hay correlación perfecta entre e . Si , se dice que hay una correlación perfecta positiva. Si , se dice que hay una correlación perfecta negativa. 36 REGRSIÓN LINEAL SIMPLE Coeficiente de determinación Consecuencias: 3) , sólo si, , ó sólo si, para los datos de la muestra. Es decir no cambia cuando cambia , o todas las predicciones son iguales a una misma constante. En este caso no hay correlación ni regresión. Lic. Mgr. Manuel Tuesta Moreno 7 37 REGRSIÓN LINEAL SIMPLE Coeficiente de determinación Consecuencias: 4) El coeficiente de determinación , es pues una medida de la proximidad del ajuste de la recta de regresión. Cuando mayor sea el valor de , mejor será el ajuste y más útil la recta de regresión como instrumento de predicción. 38 REGRSIÓN LINEAL SIMPLE Coeficiente de determinación Consecuencias: Advertencia: El haber supuesto una función lineal entre dos variables y haber encontrado un alto coeficiente de correlación, no necesariamente significa que una variable dependa de la otra, pues, esta correlación puede no ser causal, sino casual. Para que exista correlación debe haber causa y efecto. 39 E-5) El ingreso anual disponible y los gastos de consumo (en dólares) de una muestra de 10 familias de un barrio residencial de Tumbes fueron tabulados en el cuadro que sigue. Hallar la recta de regresión del consumo con respecto al ingreso , utilizando la transformación ´ y ´ . Ingreso 20000 14000 35000 23000 12000 Consumo 18000 15000 30000 16000 9000 Ingreso 5000 7000 14000 30000 25000 Consumo 7000 7000 15000 26000 23000 40 E-6) Al estudiar la relación entre costos y ventas en dólares de ciertos productos a partir de una muestra se obtuvo la siguiente información. ; ; ; ; . Si los costos se incrementan en $ y las ventas correspondientes se incrementan en $ . a) ¿Cómo cambia la ecuación de regresión? b) ¿Qué porcentaje de la varianza de las ventas es explicada por la regresión de ventas sobre costos? 41 E-7) Cuando una de las variables es el tiempo (en días, meses o años), la regresión se denomina serie de tiempo. Supongamos que la producción (en millones) de un determinado artículo fabricado por una compañía durante los años 1980 – 1989 es como sigue a) Trazar un gráfico de líneas y describir la tendencia. b) Hallar la recta de regresión (serie de tiempo) de la producción en función del tiempo. c) Estimar la producción de artículos para 1990 y establecer si es significativa tal predicción. Años 1980 1981 1982 1983 1984 Producción 92.2 92.3 80.0 89.1 83.5 Años 1985 1986 1987 1988 1989 Producción 68.9 69.2 67.1 58.3 61.2 42 NOCIONES DE REGRSIÓN NO LINEAL Ecuación no lineal Transformación lineal Exponencial . . Potencia . . Hiperbólica ´ Siendo: ´ Lic. Mgr. Manuel Tuesta Moreno 8 43 E-8) Ajustar por el método de mínimos cuadrados una curva de la forma . a los siguientes pares de datos 1.5 2 3 3.5 4 5 2.6 2.4 1.2 1.8 1.6 1.4 E-9) Para los siguientes datos experimentales Se plantean los modelos . para relacionar con , ¿cuál de los dos modelos se ajusta mejor a los datos? 44 1 2 3 4 5 6 10 40 120 300 800 1500 45 E-10) Si verificar que: a) ∑ b) ∑ . c) ∑ . d) ∑ 46 E-11) Verificar que: E-12) Verificar que, si . , entonces, ∑ ∑ 47 E-13) El coeficiente de correlación entre dos variables e es . . Si . , . , , . Hallar la recta de regresión: a) De en . . . b) De en . . . ó . . 48 E-14) Al estimar las ventas de un artículo en función de los precios se usó una recta de mínimos cuadrados basados en una muestra de 4 datos. Si las ventas observadas fueron 10, 8, 6, 14 y si las ventas estimadas respectivas son 10.8, 8.2, 5.6, 13.4, ¿qué porcentaje de la varianza de las ventas es explicada por la recta de regresión? . . %
Compartir