Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ESTADÍSTICA APLICADA PARA LOS NEGOCIOS Semana 15 Sesión 01 LOGRO DE LA SESIÓN Al finalizar la sesión el estudiante conoce y aplica los conceptos de regresión lineal en diferentes contextos de la vida real. Sirve para determinar la relación entre dos variables, por ejemplo, seguramente hay una relación entre el consumo y el ingreso que percibe una persona. UTILIDAD ANÁLISIS DE REGRESIÓN Existen dos métodos distintos pero relacionadas para determinar si existe algún tipo de relación entre dos variables. El primer método consiste en determinar una relación funcional de la variable dependiente Y con respecto a una variable independiente X con el n de predecir valores de Y . Este método, es el análisis de regresión. El segundo método consiste en determinar el grado o nivel de asociación entre las variables que se estudian. Este método se denomina análisis de correlación. Los métodos de regresión y correlación entre variables se clasifican de acuerdo al número de variables independientes, se denomina simple si hay una sola variable independiente y se denomina múltiple si hay dos o más variables independientes. En esta clase veremos qué es y para qué sirve la Regresión Lineal. REGRESIÓN LINEAL DIAGRAMA DE DISPERSIÓN Sean 𝑥1, 𝑦1 , 𝑥2, 𝑦2 , ⋯ , (𝑥𝑛, 𝑦𝑛) n valores de la variable bidimensional (𝑋, 𝑌 ), observados en una muestra, donde los 𝑥𝑖 son los valores de la variable 𝑋 y los 𝑦𝑖 son los valores de la variable 𝑌. Se denomina diagrama de dispersión o nube de puntos, a la representación grafica de los distintos valores (𝑥𝑖 , 𝑦𝑖) de las variables 𝑋 e 𝑌 en el mismo sistema cartesiano. REGRESIÓN LINEAL ESTIMACIÓN DEL MODELO DE REGRESIÓN LINEAL Dado 𝑥1, 𝑦1 , 𝑥2, 𝑦2 , ⋯ , (𝑥𝑛 𝑦𝑛) una muestra de tamaño 𝑛 de una variable bidimensional (𝑋, 𝑌), el modelo de regresión lineal simple de 𝑌 (variable dependiente) con respecto de 𝑋 (variable independiente), consiste en determinar la ecuación de la recta: 𝑌 = 𝑎 + 𝑏𝑋 que mejor se ajuste a los datos de la muestra, con el fin de predecir o estimar 𝑌 a partir de 𝑋. El valor 𝑦 denominado valor estimado o predecido, representa un valor de 𝑌 calculado de la ecuación 𝑌 = 𝑎 + 𝑏𝑋 cuando 𝑋 = 𝑥𝑖. Para determinar dicha ecuación de regresión utilizaremos el método de mínimos cuadrados. REGRESIÓN LINEAL MÉTODO DE MÍNIMOS CUADRADOS Cuando se considera la ecuación de regresión lineal muestral, cada dato (𝑥𝑖 , 𝑦𝑖) de la muestra, satisface la ecuación: 𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 + 𝑒𝑖 en donde 𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖 se denomina error o residuo y describe el error en el ajuste del modelo de regresión muestral en el punto 𝑖 de los datos. Consideremos la suma de cuadrados de errores: Determinar una recta de regresión de mínimos cuadrados consiste en hallar los valores de 𝑎 y 𝑏 de tal manera que 𝑆𝐶𝐸 sea mínimo. Derivando 𝑆𝐶𝐸 con respecto a 𝑎 y con respecto a 𝑏 y luego igualando a cero se obtiene las siguientes ecuaciones: REGRESIÓN LINEAL MÉTODO DE MÍNIMOS CUADRADOS Resolviendo el sistema de ecuaciones se obtiene: es equivalente a: Interpretación: Si 𝑏 > 0, entonces, la tendencia lineal es creciente, es decir, a mayores valores de 𝑋 se tiene mayores valores de 𝑌. Si 𝑏 < 0, entonces, la tendencia lineal es decreciente, es decir, a mayores valores de 𝑋 se tiene menores valores de 𝑌. Si 𝑏 = 0, se dice que no hay regresión. EJERCICIO EXPLICATIVO La propina que se le otorga a un mozo en un restaurante depende de muchos factores, por ejemplo, la cordialidad del personal, tipo de ambiente, satisfacción por el servicio, etc. En el siguiente cuadro se tiene la cantidad de propina (𝑆/. ) que los clientes de un restaurante dan a los mozos en función al tiempo en que se demora en servir una orden (minutos). Propina (S/.) 1 3 3 2 6 0 2 3 4 Tiempo de atención (minutos) 3 2 2 4 1 5 3 2 2 a) Identifique las variables de interés y clasifique cada uno de ellos. b) Realice el diagrama de dispersión, e indicar la tendencia de los datos. c) Calcular el modelo de regresión lineal e interprete la pendiente de la regresión. d) Estime la propina que recibirá un mozo que se ha demorado en atender 3.5 minutos. EJERCICIO EXPLICATIVO La propina que se le otorga a un mozo en un restaurante depende de muchos factores, por ejemplo, la cordialidad del personal, tipo de ambiente, satisfacción por el servicio, etc. En el siguiente cuadro se tiene la cantidad de propina (𝑆/. ) que los clientes de un restaurante dan a los mozos en función al tiempo en que se demora en servir una orden (minutos). a) Identifique las variables de interés y clasifique cada uno de ellos. Variable independiente X: Tiempo que demora un mozo en servir una orden (minutos). Variable dependiente Y: Monto que recibe de propina un mozo (soles). b) Realice el diagrama de dispersión, e indicar la tendencia de los datos. Nº 𝑋: Tiempo de atención (minutos) 𝑌: Propina (S/.) 1 3 1 2 2 3 3 2 3 4 4 2 5 1 6 6 5 0 7 3 2 8 2 3 9 2 4 Total 24 24 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 M o n to q u e r e c ib e d e p ro p in a u n m o z o ( s o le s ). Tiempo que demora un mozo en servir una orden (minutos). Monto de propina en función del tiempo Se tiene una tendencia de datos lineal negativa EJERCICIO EXPLICATIVO La propina que se le otorga a un mozo en un restaurante depende de muchos factores, por ejemplo, la cordialidad del personal, tipo de ambiente, satisfacción por el servicio, etc. En el siguiente cuadro se tiene la cantidad de propina (𝑆/. ) que los clientes de un restaurante dan a los mozos en función al tiempo en que se demora en servir una orden (minutos). c) Calcular el modelo de regresión lineal e interprete la pendiente de la regresión. 𝑏 = 9 × 49 − 24 × 24 9 × 76 − 242 = −1.25 𝑥 = 24 9 = 2.6667 𝑦 = 24 9 = 2.6667 𝑎 = 2.6667 − −1.25 × 2.6667 = 6 Nº 𝑋: Tiempo de atención (minutos) 𝑌: Propina (S/.) 𝑋2 𝑌2 𝑋𝑌 1 3 1 9 1 3 2 2 3 4 9 6 3 2 3 4 9 6 4 4 2 16 4 8 5 1 6 1 36 6 6 5 0 25 0 0 7 3 2 9 4 6 8 2 3 4 9 6 9 2 4 4 16 8 Total ∑𝑋 = 24 ∑𝑌 = 24 ∑𝑋2 = 76 ∑𝑌2 = 88 ∑𝑋𝑌 = 49 𝑌 = 6 − 1.25𝑋 La tendencia es lineal negativa, si se demora mayor tiempo en servir la orden, menor será la propina. EJERCICIO EXPLICATIVO La propina que se le otorga a un mozo en un restaurante depende de muchos factores, por ejemplo, la cordialidad del personal, tipo de ambiente, satisfacción por el servicio, etc. En el siguiente cuadro se tiene la cantidad de propina (𝑆/. ) que los clientes de un restaurante dan a los mozos en función al tiempo en que se demora en servir una orden (minutos). d) Estime la propina que recibirá un mozo que se ha demorado en atender 3.5 minutos. Si 𝑋 = 3.5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠, entonces 𝑌 = 6 − 1.25 × 3.5 = 1.625 𝑠𝑜𝑙𝑒𝑠 𝑌 = 6 − 1.25𝑋 EJERCICIO EXPLICATIVO Un comerciante mayorista encargo un estudio para determinar la relación entre los gastos de publicidad semanal por radio y las ventas de sus productos. En el estudio se obtuvieron los siguientes resultados: Gastos de publicidad ($) 30 20 40 50 70 60 80 70 80 Ventas ($) 300 250 400 550 750 630 930 700 840 a) Identifique la variable independiente y la variable dependiente. b) Realice el diagrama de dispersión, e indicar la tendencia de los datos. c) Calcular la recta de regresión con el fin de predecir las ventas e interprete la pendiente de la regresión. d) Estime la venta si en una semana el gasto de publicidad es de $90. e) Si la venta es de $800, ¿cuánto es el gasto de publicidad? EJERCICIO EXPLICATIVO Un comerciante mayorista encargo un estudio para determinar la relación entre los gastos de publicidad semanal por radio y las ventas de sus productos. En el estudio se obtuvieron los siguientes resultados: Gastos de publicidad ($) 30 20 40 50 70 60 80 70 80 Ventas ($) 300 250 400 550 750 630 930 700 840 a) Identifique la variable independiente y la variable dependiente. Variable independiente X: Gasto en publicidad semanal por radio.Variable dependiente Y: Ventas del producto. 0 100 200 300 400 500 600 700 800 900 1000 0 20 40 60 80 100 V e n ta s d e l p ro d u c to . ($ ) Gasto en publicidad semanal por radio. ($) Ventas según el gasto en publicidad b) Realice el diagrama de dispersión, e indicar la tendencia de los datos. Se tiene una tendencia de datos lineal negativa Gasto en publicidad semanal por radio. ($) Ventas del producto. ($) 30 300 20 250 40 400 50 550 70 750 60 630 80 930 70 700 80 840 EJERCICIO EXPLICATIVO Un comerciante mayorista encargo un estudio para determinar la relación entre los gastos de publicidad semanal por radio y las ventas de sus productos. En el estudio se obtuvieron los siguientes resultados: Gastos de publicidad ($) 30 20 40 50 70 60 80 70 80 Ventas ($) 300 250 400 550 750 630 930 700 840 c) Calcular la recta de regresión con el fin de predecir las ventas e interprete la pendiente de la regresión. 𝑏 > 0, a mayor gasto en publicidad se pronostica mayores ventas. d) Estime la venta si en una semana el gasto de publicidad es de $90. Si 𝑋 = 90, entonces se espera una venta de 965.5272 dólares. e) Si la venta es de $800, ¿cuánto es el gasto de publicidad? Si 𝑌 = 800, entonces el gasto en publicidad fue de aproximadamente 74.6354 dólares. 𝑌 = −4.0698 + 10.7733𝑋 EJERCICIO RETO 1 a. Realice el diagrama de dispersión, e indicar la tendencia de los datos. c. Estime la nota en matemática si en química obtiene 85 puntos. d. Si en matemática obtuvo 60 puntos, ¿cuántos puntos cree que haya obtenido en química? b. Calcular la recta de regresión con el fin de predecir la nota en matemática e interprete la pendiente de la regresión. La tabla siguiente presenta las notas de aprobación en matemática y química de 10 estudiantes elegidos al azar entre un grupo muy numeroso de un colegio determinado, el objetivo es determinar si las notas de matemática dependen de los resultados obtenidos en química. Matemática: 75 80 93 65 87 71 98 68 84 77 Química: 80 87 95 73 91 80 95 75 90 81 EJERCICIO RETO 2 En la siguiente tabla se muestra la calificación obtenida (Y) por 10 personas en una prueba de admisión a una determinada universidad, el año pasado, y el tiempo en horas (X) que durmió la noche previa al examen. Suponiendo que se cumplen las hipótesis de regresión. (a) Encuentre la ecuación de regresión lineal para la calificación de un estudiante como función del número de horas que durmió la noche previa al examen. (b) ¿Aproximadamente, cuál es la nota de un estudiante que no durmió en la noche previa al examen? Tiempo que durmió 2 3 4.5 5 5 5.5 6 6 7 8 Nota obtenida 50 55 65 60 67 70 75 69 76 85 EJERCICIO RETO 3 Un individuo mantiene que el consumo de gasolina de un automóvil no depende de la velocidad del vehículo. Para contrastar la veracidad de esta hipótesis, se probó el automóvil circulando a diferentes velocidades entre 45 y 75 km/h. A continuación se muestran los kilómetros por galón que se consiguieron con las velocidades citadas: a) Escriba la ecuación de regresión lineal. Interprete el parámetro de la pendiente. b) Pronostique el consumo en km por galón si el automóvil se desplaza a una velocidad de 100 km/h. Velocidad 45 50 55 60 65 70 75 Km por galón 24.2 25.0 23.3 22.0 21.5 20.6 19.8 EJERCICIO RETO 4 La siguiente tabla muestra el presupuesto en soles que se destinaron en el año 2016 a 14 distritos de Arequipa y la población por cada distrito: a) Encuentre la ecuación de regresión. Interprete el valor de la pendiente. b) Aproximadamente cuál sería el presupuesto que recibió el distrito de Yarabamba, el cual en el año 2016 contaba con una población de 1100 personas. N° Distrito Presupuesto (en millones de soles) Población estimada (en miles de personas) 1 Alto Selva Alegre 47,9 83,3 2 Cayma 50,5 92,8 3 Cerro Colorado 86,1 149,8 4 Characato 5,4 9,4 5 Chiguata 2,2 3 6 Jacobo Hunter 21,2 48,9 7 La Joya 29,8 30,6 8 Mariano Melgar 20,6 53,2 9 Miraflores 17,5 49,2 10 Mollebaya 1,8 1,9 11 Paucarpata 43,6 126,1 12 Pocsi 0,7 0,6 13 Polobaya 1,6 1,5 14 Quequeña 1,2 1,4 ¿QUE HEMOS APRENDIDO? Regresión Lineal TAREA DOMICILIARIA Resuelva los ejercicios de la tarea domiciliaria del archivo S15.s1 – Teoría y ejercicios y realice el envío mediante la tarea S15.s1 – Resolver ejercicios.
Compartir