Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Práctica Nº 1 DISTRIBUCIONES MUESTRALES 1. En una determinada ciudad turística el alquiler por día de departamentos de dos dormitorios tiene una distribución Normal con una media de $2200 y una desviación estándar de $250. a) Si se selecciona un departamento de dos dormitorios al azar, calcula la probabilidad de que el alquiler sea de por lo menos $1950 por día. b) Si se selecciona una muestra aleatoria de 50 departamentos de dos dormitorios, ¿cuál es la probabilidad de que el alquiler promedio sea por menos $1950 por día? c) Si se supone que los 50 departamentos se seleccionan de un conjunto de 250 departamentos, calcula la probabilidad del punto anterior. 2. Una Industria produce autos de control remoto que funcionan con baterías AA. La vida media de las baterías para este producto es de 35 horas. La distribución de la vida de las baterías es aproximadamente Normal con una desviación estándar de 5,5 horas. Como parte de una investigación se analizan muestras aleatorias de 25 baterías. a) ¿Qué proporción de las muestras tendrá una vida útil promedio de más de 36 horas? b) ¿Qué proporción de las muestras tendrá una vida útil promedio de menos de 34,5 horas? c) ¿Qué proporción de las muestras tendrá una vida útil promedio entre 34,5 y 36 horas? 3. De acuerdo con un estudio, los contribuyentes tardan 330 minutos en promedio en realizar un trámite fiscal por un medio electrónico. El tiempo tiene distribución Normal con un desvío estándar de 80 minutos. Un organismo de control selecciona una muestra aleatoria de 40 contribuyentes. a) ¿Cuál es la probabilidad de que la media de la muestra sea mayor que 320 minutos? b) ¿Cuál es la probabilidad de que la media de la muestra se encuentre entre 320 y 350 minutos? c) ¿Cuál es el tiempo promedio máximo del 20% de los tiempos promedios más chicos? d) ¿Cuál es el tiempo promedio mínimo del 10% de los tiempos promedios más grandes? 4. El tiempo que un cajero humano emplea con cada cliente tiene una media poblacional igual a 3,10 minutos y una desviación estándar igual a 0,40 minutos. Si se selecciona una muestra aleatoria de 16 clientes: a) ¿Cuál es la probabilidad de que el tiempo promedio que el cajero emplea con cada cliente sea de al menos 3 minutos? b) ¿Cuál es el tiempo promedio mínimo del 85% de los tiempos promedios más grandes? c) ¿Qué supuesto debe hacerse en los puntos anteriores? d) Si se obtiene una muestra aleatoria de 64 clientes, ¿cuál es el tiempo promedio máximo del 20% de los tiempos promedios más chicos? e) ¿Qué supuesto debe hacerse en el punto d)? 5. En un importante supermercado el importe medio por bultos cerrados que compra cada cliente es $164,5 con una desviación estándar de $35. Se supone que el importe abonado tiene distribución Normal. En el caso de una muestra de 50 clientes: a) ¿Cuál es la probabilidad de que la media muestral sea a lo sumo $175? b) ¿Dentro de qué límites se presentará el 90% de las medias muestrales alrededor de la media poblacional? Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario 6. El tiempo que se usa por sesión de correo electrónico tiene distribución Normal con media igual a 8 minutos y desviación estándar de 2 minutos. a) Si se selecciona una muestra aleatoria de 25 sesiones, ¿qué proporción de medias muestrales estará entre 7,8 y 8,2 minutos? b) Si se seleccionan muestras aleatorias de 100 sesiones, ¿qué proporción de las medias muestrales estará entre 7,8 y 8,2 minutos? c) Explica la diferencia entre los resultados de a) y b). d) ¿Qué es más probable que ocurra, una sesión de más de 11 minutos, una media muestral mayor que 9 minutos en una muestra de 25 sesiones o una media muestral mayor que 8,6 minutos en una muestra de 100 sesiones? Justifica. 7. Los paquetes entregados por una fábrica tienen un peso medio de 30 kg. Se supone que el peso tiene distribución Normal con un desvío estándar de 5 kg. Si se selecciona una muestra aleatoria de 25 paquetes: a) ¿Cuál es la probabilidad de que el peso promedio supere los 31,5 kg? b) ¿Cuál es la probabilidad de que el peso total de los 25 paquetes no supere los 700 kg? 8. El contenido medio de latas de pintura de una cierta marca es de un litro con una desviación estándar de 0,02 litros. a) Si se selecciona una muestra aleatoria de 50 latas, ¿cuál es la probabilidad de que el contenido promedio sea inferior a 0,995 litros? b) Si se selecciona una muestra aleatoria de 40 latas, ¿cuál es la probabilidad de que el contenido total de las latas sea inferior a 39 litros? c) ¿Qué supuesto debe hacerse en los puntos anteriores? 9. En una fábrica donde se procesan alimentos se llenan cajas de cereal. El peso de las cajas tiene distribución Normal con media igual a 368 gramos y una desviación estándar de 15 gr. a) Si se elige al azar una muestra de 25 cajas, ¿cuál es la probabilidad de que el peso promedio sea menor de 360 gramos? b) ¿Cuál es la probabilidad de que el peso total de las 25 cajas supere los 9200 gramos? 10. Un proceso industrial genera una proporción de 0,08 unidades defectuosas. Si se selecciona una muestra aleatoria de 100 unidades: a) ¿Cuál es la probabilidad de que la proporción muestral sea a lo sumo 0,10? b) ¿Cuál es la probabilidad de que la proporción muestral sea mayor a 0,10? 11. Un fabricante adquiere componentes para sus teléfonos celulares en lotes de 200 de un determinado proveedor. El componente tiene una tasa de defectuosos del 10%. Una política establecida por el fabricante indica que si el siguiente envío tiene: más del 12% de defectuosos, buscará un nuevo proveedor. entre 10 y 12% de defectuosos, considerará la posibilidad de un nuevo proveedor. entre 5 y 10% de defectuosos, no buscará otro proveedor. menos del 5%, incrementará sus pedidos. ¿Qué decisión es más probable que tome el fabricante? 12. El 75% de los clientes de una importante pizzería comen en el local. En una muestra aleatoria de 100 clientes, ¿cuál es la probabilidad de que menos del 20% lleven su comida al domicilio? Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario 13. Una tienda ha determinado que el 17% de todas las compras hechas durante la época de navidad son devueltas. Si se considera una muestra aleatoria de 150 compras, ¿cuál es la probabilidad de que a lo sumo el 20% sea devuelto? 14. Aplicaciones en Sala de Computación Respuestas de ejercicios (no incluyen gráficos ni interpretaciones) 1. a) 0,8413 b) ≈1 c) ≈1 2. a) 0,1814 b) 0,3264 c) 0,4922 3. a) 0,7852 b) 0,7281 c) 319,37 min. d) 346,19 min. 4. a) 0,8413 b) 2,996 min c) 𝑋~𝑁(𝜇, 𝜎) d) 3,058 min e) �̅�~𝑁 (𝜇, 𝜎 𝑛 ) (teorema central del límite) 5. a) 0,9830 b) $156,38 y $172,62 6. a) 0,383 b) 0,6826 d) es más probable una sesión de más de 11 minutos 7. a) 0,0668 b) 0,0228 8. a) 0,0475 b) ≈ 0 c) a. �̅�~𝑁 (𝜇, 𝜎 𝑛 ) y b. 𝑊~𝑁(𝑛𝜇, √𝑛𝜎) (teorema central del límite) 9. a) 0,0038 b) 0,5 10. a) 0,7704 b) 0,2296 11. 0,1711 0,3289 0,4913 0,0087 No buscará otro proveedor. 12. 0,1056 13. 0,8413 Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Práctica N o 2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA 1. La Dirección de una Empresa desea estimar el ingreso medio trimestral de los gerentes de las distintas sucursales que posee en el país. Se sabe que el ingreso tiene una distribución Normal, conuna desviación estándar de $ 1.100. Una muestra aleatoria de 60 gerentes arrojó un ingreso promedio trimestral de $ 120.000, para el primer trimestre de 2017. a) Indica cuál es la variable aleatoria. b) Indica cuál es el parámetro de interés, su estimador y la estimación puntual. c) Construye un intervalo de confianza del 95% para el parámetro. Interpreta. d) Interpreta el coeficiente de confianza del 95%. e) Construye un intervalo de confianza del 90%. Compara con lo obtenido en el punto c). f) Para un coeficiente de confianza del 95%, ¿cuál debería ser el tamaño de la muestra si se deseara reducir el error de muestreo en un 20%? ¿Y para un coeficiente del 90%? 2. Una Consultora llevó a cabo una encuesta a 49 fumadores de una cierta localidad, con el objeto de estimar el gasto medio semanal en cigarrillos en que incurren los fumadores. Se sabe que la distribución de los importes gastados es Normal, con una desviación estándar de $15. Para la muestra de 49 fumadores se obtuvo un gasto semanal promedio de $130. a) Indica cuál es el parámetro y su estimación puntual. b) Construye un intervalo de confianza del 99% para el parámetro. Interpreta. c) Supóngase que la muestra hubiera sido de 64 fumadores y que se obtuvo el mismo promedio de $130. Construye el intervalo de confianza del 99% y compara con el anterior, indicando cuál es el más preciso. d) Indica cómo puede aumentarse la precisión del intervalo de confianza. 3. El dueño de una librería desea estimar la vida media útil de unas biromes económicas que vende a los clientes. Una muestra de 20 biromes dio por resultado los siguientes valores (en horas): 48,0 42,0 46,5 51,5 23,5 41,5 54,5 37,5 52,5 48,5 50,5 46,0 61,0 49,5 61,5 51,0 52,5 58,0 43,5 30,5 Suponiendo que la vida útil tienen distribución Normal: a) Estima puntualmente la vida media útil. b) Construye un intervalo de confianza del 90% para el parámetro. c) ¿Concluirías que la vida media útil es de 50 horas? ¿Y de 60 horas? 4. En una semana determinada se seleccionaron al azar 50 piezas que habían sido retrabajadas por presentar defectos. Se halló que el tiempo promedio que insumió el retrabajo de las 50 piezas fue de 18 minutos por pieza, con una desviación estándar de 1,4 minutos. a) Construye un intervalo de confianza del 95% para el tiempo medio de retrabajo por pieza. Interpreta el intervalo obtenido. b) Construye un intervalo del 99% y compara con el anterior. ¿Cuál es más preciso? 5. El Jefe de policía de una localidad de la provincia de Santa Fe extrajo una muestra de 18 de las infracciones de tránsito que se habían cometido en la localidad en el último trimestre, hallando que el importe promedio pagado por dichas multas fue de $275, con una desviación estándar de $80. Construye un intervalo de confianza del 99% para el importe medio pagado por multa en dicha localidad. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario 6. Una Empresa desea ofrecer servicio de guardería a los niños de sus empleados. Como parte del estudio de viabilidad del proyecto, desean estimar el costo medio diario por el cuidado de los niños. Una muestra de 10 empleados que recurren al servicio de guardería dio por resultado los siguientes importes ( en pesos): 207 192 197 195 205 201 191 199 195 204 Construye el intervalo de confianza del 95% para el parámetro. Interpreta el resultado. 7. Una muestra de 80 suscriptores de una revista indicó que el tiempo promedio invertido por ellos en el uso de internet, era de 13,4 horas por semana, con un desvío estándar de 6,8 horas. Construye el intervalo de confianza del 90% para el tiempo medio de uso semanal de internet. 8. Para un determinado artículo, el importe promedio de ventas por comercio durante el último mes fue de $3425, con un desvío estándar de $ 200, en diez comercios entrevistados. Estima el desvío estándar del importe de las ventas de ese artículo en todos los comercios para el mes anterior, mediante un intervalo de confianza del 90%, bajo el supuesto de que los importes tienen distribución Normal. Interpreta. 9. El departamento de Aseguramiento de calidad de una envasadora de lubricantes desea estimar el desvío estándar del contenido de latas de 4 lts. Para ello toma una muestra aleatoria de 27 latas, obteniendo una varianza muestral de 450 lts2. Construye un intervalo de confianza del 99% para la variancia y para el desvío estándar del contenido de las latas, bajo el supuesto de distribución normal de la variable. 10. Una ciudadana que desea postularse como candidata a Concejal de un municipio, decide realizar una encuesta previamente a la presentación de su postulación, entre 400 electores del municipio. De ellos, 300 dijeron que la apoyarían en las próximas elecciones. a) Indica cuál es el parámetro de interés en este caso, su estimador y la estimación puntual. b) Construye el intervalo de confianza del 95% para el parámetro. Interpreta el resultado. 11. La red Fox TV desea reemplazar uno de sus programas de investigación de crímenes que se transmite durante las horas de mayor audiencia, por una nueva comedia. Antes de tomar una decisión, los ejecutivos analizan una muestra de 500 espectadores. Después de ver la comedia, 220 de ellos afirmaron que la verían y sugirieron reemplazar el programa de investigación de crímenes. Construye el intervalo de confianza del 90% para el parámetro de interés. Interpreta el resultado. 12. Una Consultora desea llevar a cabo una encuesta para estimar la proporción de trabajadores que poseen dos o más trabajos en una cierta localidad. Decide hacerlo con una confianza del 99% estableciendo un margen de error del 2%. Una encuesta piloto reveló que 5 de los 50 entrevistados tenían dos o más trabajos. ¿A cuántos trabajadores deberá entrevistar para satisfacer los requisitos impuestos?. 13. Se desea estimar la proporción de Contadores Públicos que cambiaron de empresa en los últimos 5 años, con un margen de error del 3% y una confianza del 90%. Un estudio realizado hace varios años reveló que el porcentaje de contadores que había cambiado de compañía en los cinco años anteriores había sido del 21%. a) Para actualizar el estudio, ¿cuál es el número de contadores públicos que deberían contactarse? Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario b) ¿Con cuántos contadores sería necesario contactarse si no se dispusiera de esa estimación previa del 21%? 14. Una persona que tiene un microemprendimiento compra tazas de loza para imprimir en ellas logotipos de actos deportivos, graduaciones, cumpleaños u otras ocasiones importantes. Esta mañana recibió un lote grande de tazas, seleccionó 300 de ellas y halló que 15 contenían imperfecciones. a) Estima puntualmente la proporción de tazas defectuosas del lote. b) Estima la proporción de tazas defectuosas mediante un intervalo de confianza del 95%. c) Si esta persona había acordado con su proveedor que le devolvería lotes con un 10% o más de tazas defectuosas, ¿qué decisión adoptará en este caso? Justifica. 15. Encuestas realizadas revelaron que el 30% de los asistentes al Casino de Rosario habían apostado más de $1.000. La gerencia desea actualizar ese porcentaje, con una confianza del 95% y un margen de error del 1%. a) ¿Cuál deberá ser el tamaño de la muestra? b) Si la gerencia estima que ese tamaño de muestra es demasiado grande, ¿qué se puede hacer para reducir el tamaño de la muestra? Presenta diferentes alternativas, indicando en cada caso el tamaño de muestra necesario. 16. Un fabricante de computadoras ofrece una línea de ayuda para sus compradores, quienes pueden llamar las 24 hs de cualquier día de la semana. Responder a estas llamadas de ayuda es importantepara la imagen de la compañía. Se sabe que la desviación estándar de los tiempos de reparación que insume un problema de software, es de 4,2 minutos y la que corresponde a un problema de hardware es de 3,9 minutos. Una muestra de 35 llamadas con problemas de software, arrojó un tiempo promedio para solucionarlo de 18 minutos y otra muestra de 45 llamadas con problemas de hardware, arrojó un tiempo promedio de 15,5 minutos. El fabricante desea evaluar si la diferencia entre los tiempos medios de reparación es estadísticamente significativa. a) Indica cuál es el parámetro de interés, su estimador y la estimación puntual. b) Construye un intervalo de confianza del 95% para el parámetro. Interpreta dicho intervalo. ¿Puede concluirse que la diferencia en los tiempos medios es estadísticamente significativa?. 17. El Depto. de Ingeniería de una empresa desarrolló dos soluciones químicas para aumentar la vida útil de los discos de computadora. Para una muestra de discos tratados con la primera solución se obtuvieron las siguientes duraciones (en horas): 86 78 66 83 84 81 84 89 65 82 Los discos tratados con la segunda solución duraron (en horas): 91 71 75 76 87 79 73 76 79 78 87 90 76 72 Suponiendo que las variancias en ambas poblaciones pueden considerarse iguales (ver salida STATGRAPHICS), construye un intervalo de confianza del 95% para la diferencia en las duraciones medias de ambas soluciones. Interpreta dicho intervalo. 18. El Director de Recursos Humanos de una empresa desea comparar las distancias medias que deben recorrer hasta el trabajo los empleados de dos oficinas, una ubicada en la Zona Sur y otra en la Zona Oeste de la ciudad. Una muestra de 30 empleados de la Zona Sur arrojó un promedio de 370 kms al mes. Otra muestra de 40 empleados de la Zona Oeste arrojó un promedio de 392 kms al mes. Se sabe que la desviación estándar de la distancia a recorrer por los empleados es de 30 kms para los empleados de la Zona Sur y Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario de 26 kms para la Zona Oeste. Construye un intervalo de confianza del 90% para la diferencia en las distancias medias recorridas. Interpreta el coeficiente de confianza del 90%. 19. Una muestra de calificaciones obtenidas en el Examen de Estadística I de Licenciado en Economía durante el año 2016 arrojó los siguientes resultados: Varones 72 69 98 66 85 76 79 80 77 Mujeres 81 67 90 78 81 80 76 Suponiendo que para ambos sexos puede considerarse que las variancias de las calificaciones son iguales, construye un intervalo de confianza del 90% para la diferencia en las calificaciones medias. Interpreta el intervalo. 20. El Depto. de Investigación de una empresa de Seguros realiza estudios en forma continua sobre las causas de los accidentes automovilísticos, las características de los conductores, etc.. Una muestra aleatoria de 400 pólizas de mujeres reveló que 120 habían tenido al menos un accidente en el período anterior de tres años. De forma similar, una muestra de 600 pólizas de varones reveló que 150 habían estado involucrados en al menos un accidente. Construye un intervalo de confianza del 90% para la diferencia entre las proporciones de mujeres y de hombres que habían tenido al menos un accidente en los últimos 3 años. Interpreta el intervalo. 21. A una muestra de afiliados a dos partidos políticos A y B se les preguntó, entre otros temas, si estaban de acuerdo con la implementación de cierta norma que podría eventualmente traer consecuencias ambientales. Los resultados fueron: Partido A Partido B Afiliados consultados 1000 800 Afiliados a favor 200 184 Construye un intervalo de confianza del 99% para la diferencia en las proporciones de afiliados de ambos partidos que estarían a favor de la norma. Interpreta el resultado. (Ver salida STATGRAPHICS). 22. A fin de evaluar la opinión de los padres respecto a cambios en el plan de estudios, un supervisor escolar entrevista a 100 padres de familia cuyos hijos asisten al turno mañana y a otros 100 del turno tarde. Para el turno mañana, 70 padres señalaron estar de acuerdo con los cambios; para el turno tarde, lo hicieron 50. ¿Puede considerarse que existe diferencia estadísticamente significativa entre las proporciones de padres de familia de ambos turnos que estarían de acuerdo con los cambios, con una confianza del 95%? 23. Un grupo de planificación urbana desea estimar la diferencia entre las medias de los ingresos familiares en dos zonas del área metropolitana. Muestras aleatorias independientes de familias residentes en las dos zonas, produjo los siguientes resultados: Zona 𝑛 �̅� 𝑆 1 13 $14500 $850 2 8 $15700 $700 a) Construye un intervalo de confianza del 95% para el cociente de las variancias de ambas zonas. Interpreta. b) Proporciona una estimación puntual de la diferencia entre los ingresos medios de ambas zonas. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario c) Construye un intervalo de confianza del 95% para la diferencia entre los ingresos medios. Interpreta. 24. La Cámara de la Construcción suministró datos sobre costos de remodelación de baños y cocinas de departamentos de la ciudad de Rosario, al mes de abril del 2015. Las cifras están dadas en miles de pesos. Baño 18 22,9 26,4 24,8 26,9 17,8 24,6 21 Cocina 25,2 17,4 22,8 21,9 19,7 23 19,7 16,9 21,8 23,6 a) Construye un intervalo de confianza del 90% para el cociente de las variancias de ambas zonas. Interpreta. b) Construye un intervalo de confianza del 90% para la diferencias entre los costos medios de remodelación. Interpreta. 25. Aplicaciones en Sala de Computación con datos de la EPH y ENGHO. Respuestas de ejercicios (no incluyen gráficos ni interpretaciones) 1. c) LI= 119.721,66 LS= 120.278,34 e) LI= 119.767,11 LS= 120.232,89 f) n=94 2. b) LI= 124,49 LS= 135,51 c) LI= 125,18 LS= 134,82 3. a) 47,5 b) LI= 43,87 LS= 51,13 4. a) LI= 17,61 LS= 18,39 b) LI= 17,49 LS= 18,51 5. LI= 220,36 LS= 329,64 6. LI= 194,64 LS= 202,56 7. LI= 12,15 LS= 14,65 8. LI= 145,87 LS= 329,04 9. Variancia: LI= 242,29 LS= 1048,39 Desvío estándar LI= 15,57 LS= 32,38 10. b) LI= 0,7076 LS= 0,7924 11. LI= 0,4036 LS= 0,4764 12. n= 1486 13. a) n= 496 b) n= 747 14. a) 0,05 b) LI= 0,0253 LS= 0,0747 15. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario a) n=8067 16. b) LI= 0,70 LS= 4,30 17. b) LI= -5,76 LS= 6,78 18. LI= -33,23 LS= -10,77 19. LI= -8,517 LS= 6,517 20. LI= 0,0024 LS= 0,0976 21. LI= -0,080 LS= 0,020 (ver salida STATGRAPHICS) 22. LI= 0,067 LS= 0,333 23. a) LI= 0,3157 LS= 5,323 c) LI= - 1949,95 LS= - 450,06 24. a) LI= 0,525 LS= 6,362 b) LI=- 0,81 LS= 4,01 Salida STATGRAPHICS (Ej. 17) Comparación de Dos Muestras - Sol 1 & Sol 2 Muestra 1: Sol 1 Muestra 2: Sol 2 Muestra 1: 10 valores en el rango de 65,0 a 89,0 Muestra 2: 14 valores en el rango de 71,0 a 91,0 El StatAdvisor Este procedimiento está diseñado para comprar dos muestras de datos. Calculará varias estadísticas y gráficas para cada muestra, y ejecutará varias pruebas para determinar si hay diferencias estadísticamente significativas entre las dos muestras. Resumen Estadístico Sol 1 Sol 2 Recuento 10 14 Promedio 79,8 79,2857 Desviación Estándar 8,08015 6,70738 Coeficiente de Variación 10,1255% 8,45976% Mínimo 65,0 71,0 Máximo 89,0 91,0 Rango 24,0 20,0 Sesgo Estandarizado -1,58569 1,07411 Curtosis Estandarizada 0,294204 -0,676607 El StatAdvisor Esta tabla contiene el resumenestadístico para las dos muestras de datos. Pueden utilizarse otras opciones tabulares, dentro de este análisis, para evaluar si las diferencias entre los estadísticos de las dos muestras son estadísticamente significativas. De particular interés son el sesgo estandarizado y la curtosis estandarizada que pueden usarse para comparar si las muestras provienen de distribuciones normales. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar las pruebas que comparan las desviaciones estándar. En este caso, ambos valores de sesgo estandarizado se encuentran dentro del rango esperado. Ambas curtosis estandarizadas se encuentran dentro del rango esperado. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Comparación de Medias Intervalo de confianza del 95,0% para la media de Sol 1: 79,8 +/- 5,78021 [74,0198, 85,5802] Intervalo de confianza del 95,0% para la media de Sol 2: 79,2857 +/- 3,87274 [75,413, 83,1585] Intervalo de confianza del 95,0 para la diferencia de medias suponiendo varianzas iguales: 0,514286 +/- 6,26847 [-5,75419, 6,78276] Prueba t para comparar medias Hipótesis nula: media1 = media2 Hipótesis Alt.: media1 <> media2 suponiendo varianzas iguales: t = 0,170148 valor-P = 0,866449 No se rechaza la hipótesis nula para alfa = 0,05. El StatAdvisor Esta opción ejecuta una prueba-t para comparar las medias de las dos muestras. También construye los intervalos, ó cotas, de confianza para cada media y para la diferencia entre las medias. De interés particular es el intervalo de confianza para la diferencia entre las medias, el cual se extiende desde - 5,75419 hasta 6,78276. Puesto que el intervalo contiene el valor de 0, no hay diferencia significativa entre las medias de las dos muestras de datos, con un nivel de confianza del 95,0%. También puede usarse una prueba-t para evaluar hipótesis específicas acerca de la diferencia entre las medias de las poblaciones de las cuales provienen las dos muestras. En este caso, la prueba se ha construido para determinar si la diferencia entre las dos medias es igual a 0,0 versus la hipótesis alterna de que la diferencia no es igual a 0,0. Puesto que el valor-P calculado no es menor que 0,05, no se puede rechazar la hipótesis nula. NOTA: estos resultados asumen que las varianzas de las dos muestras son iguales. En este caso, esa suposición parece razonable, con base en los resultados de la prueba-F para comparar las desviaciones estándar (debería decir variancias). Pueden verse los resultados de esta prueba seleccionando Comparación de Desviaciones Estándar (debería decir variancias) del menú de Opciones Tabulares. Comparación de Desviaciones Estándar (debería decir Comparación de variancias) Sol 1 Sol 2 Desviación Estándar 8,08015 6,70738 Varianza 65,2889 44,989 Gl 9 13 Razón de Varianzas= 1,45122 Intervalos de confianza del 95,0% para: Desviación Estándar de Sol 1: [5,55781, 14,7512] Grá fico C a ja y Bigote s 6 5 7 0 7 5 8 0 8 5 9 0 9 5 Sol 1 Sol 2 Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Desviación Estándar de Sol 2: [4,86254, 10,8059] Razón de Varianzas: [0,438166, 5,55903] Prueba-F para comparar Desviaciones Estándar (debería decir Comparar variancias) Hipótesis Nula: sigma1 = sigma2 (debería decir sigma 2 1=sigma 2 2) Hipótesis Alt.: sigma1 <> sigma2 (debería decir sigma 2 1 <> sigma 2 2) F = 1,45122 valor-P = 0,524715 No se rechaza la hipótesis nula para alfa = 0,05. El StatAdvisor Esta opción ejecuta una prueba-F para comparar las varianzas de las dos muestras. También construye intervalos ó cotas de confianza para cada desviación estándar y para la razón de varianzas. De particular interés es el intervalo de confianza para la razón de varianzas, el cual se extiende desde 0,438166 hasta 5,55903. Puesto que el intervalo contiene el valor de 1, no hay diferencia estadísticamente significativa entre las desviaciones estándar (debería decir variancias) de las dos muestras con un nivel de confianza del 95,0% . También puede ejecutarse una prueba-F para evaluar una hipótesis específica acerca de las desviaciones estándar (debería decir variancias) de las poblaciones de las cuales provienen las dos muestras. En este caso, la prueba se ha construido para determinar si el cociente de las desviaciones estándar (debería decir variancias) es igual a 1,0 versus la hipótesis alternativa de que el cociente no es igual a 1,0. Puesto que el valor-P calculado no es menor que 0,05, no se puede rechazar la hipótesis nula. NOTA IMPORTANTE: las pruebas-F y los intervalos de confianza mostrados aquí dependen de que las muestras hayan provenido de distribuciones normales. Para probar esta suposición, seleccione Resumen Estadístico de la lista de Opciones Tabulares y verifique los valores de sesgo estandarizado y de curtosis estandarizada. Salida STATGRAPHICS (Ej. 21) Intervalo de Confianza y Test de Hipótesis para la diferencia de proporciones Proporciones muestrales = 0,20 y 0,23 Tamaños de muestra = 1000 y 800 Intervalo aproximado de confianza del 99,0% para la diferencia entre proporciones: [-0,080303,0,020303] Hipótesis Nula: diferencia entre proporciones = 0,0 Alternativa: no igual Estadístico z calculado = -1,54385 Valor-P = 0,122624 No rechazar la hipótesis nula para alfa = 0,01. El StatAdvisor Este análisis muestra los resultados de realizar una prueba de hipótesis relativa a la diferencia de dos proporciones (teta1-teta2) de muestras provenientes de distribuciones binomiales. Las dos hipótesis a ser evaluadas aquí son: Hipótesis nula: teta1-teta2 = 0,0 Hipótesis alterna: teta1-teta2 <> 0,0 En la primera muestra de 1000 observaciones, la proporción muestral es igual a 0,2. En la segunda muestra de 800 observaciones, la proporción muestral es igual a 0,23. Puesto que el valor-P para la prueba es mayor o igual que 0,01, no puede rechazarse la hipótesis nula con un 99,0% de nivel de confianza. El intervalo de confianza muestra que los valores de teta1-teta2 soportados por los datos caen entre -0,080303 y 0,020303. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Práctica Nº 3 PRUEBAS DE HIPÓTESIS 1. Una cadena de restaurantes afirma que el tiempo medio de espera de los clientes es de 3 minutos. Se sabe por experiencia que el tiempo de espera tiene distribución Normal con una desviación estándar poblacional de 1 minuto. El departamento de control de calidad halló en una muestra aleatoria de 50 clientes que el tiempo promedio de espera era de 2,75 minutos. a) Con un nivel de significación del 5%, ¿puede concluir que el tiempo medio de espera sea menor de 3 minutos? b) Calcula el valor p e interpreta. 2. En la sección empaquetado de una fábrica se rellenan cajas de cereal con un contenido medio de 368 gr. Por experiencia anterior se sabe que el contenido de las cajas tiene distribución Normal con una desviación estándar igual a 15 gr.. El gerente de producción está preocupado por evaluar si el proceso está funcionando correctamente. Decide seleccionar una muestra aleatoria de 25 cajas del proceso de empaque y examinar su peso, obteniendo un promedio de 372,5 gr. a) Con un nivel de significación del 5% ¿se puede afirmar que el proceso de llenado de las cajas está bajo control? b) Calculael p valor e interpreta su significado. c) Construye un intervalo de confianza del 95% y toma una decisión respecto a las hipótesis planteadas en el punto anterior. d) d) Interpreta en términos del problema los errores de tipo I y II. 3. El gerente de una gran empresa de juguetes desea determinar si debe venderse un cierto juguete y está considerando la posibilidad de llevar a cabo una encuesta. Por experiencias anteriores, el gerente ha decidido que el juguete debe venderse si el ingreso mensual medio por la venta es mayor a $10000. Basado en su experiencia anterior, se sabe que el ingreso mensual tiene distribución Normal con desviación estándar igual a $1000. Se seleccionó una muestra aleatoria de 25 sucursales y durante el período de un mes se obtuvo un ingreso promedio de $10420. a) Utilizando un nivel de significación del 5%, determina si existe evidencia de que el ingreso mensual medio por la venta del juguete es mayor a $10000. (Utiliza el enfoque del valor p). b) Basado en los resultados del punto anterior, ¿qué decisión debería tomar el gerente?. c) Interpreta en términos del problema los errores de tipo I y II. 4. El gerente de una sucursal de un banco local afirma que el monto medio de las cuentas de cajas de ahorro es de $5000. Se seleccionó una muestra aleatoria de 20 clientes y los resultados indicaron un promedio de $4750 y una desviación estándar de $1200. ¿Existe evidencia de que el monto medio en las cuentas de cajas de ahorro sea diferente a $5000? (Utiliza un nivel de significación del 5% , suponiendo distribución Normal). 5. El gerente del departamento de servicios al cliente de la compañía de gas local afirma que el tiempo medio que transcurre entre la solicitud de servicio y su conexión es de 90 días. De los registros disponibles del año anterior se seleccionó una muestra aleatoria de 15 casas. Los resultados obtenidos en días fueron los siguientes: 114 78 96 137 78 103 117 126 86 99 114 72 104 73 86 Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario a) Con un nivel de significación del 1%, ¿existe evidencia de que el tiempo medio de espera entre la entrada de la solicitud de servicio y la conexión del mismo sea mayor que 90 días? b) ¿Qué supuestos se hacen con el propósito de efectuar esta prueba? 6. Un proceso químico produce en promedio 800 toneladas de químico por día. Las producciones diarias de la semana fueron las siguientes: 785 805 790 793 802 a) Con un nivel de significación del 1%, ¿existe evidencia de que la producción media es menor de 800 toneladas y que por lo tanto existe algún problema en el proceso? b) ¿Qué supuestos son necesarios establecer para que sea válida esta prueba? 7. El director de admisiones de una universidad informa a los ingresantes sobre el costo de los libros de texto en un semestre representativo. Una muestra de 100 estudiantes inscriptos indica un costo promedio de 315,40 dólares con una desviación estándar de 43,20 dólares. a) Utiliza un nivel de significación del 10% para analizar si existe evidencia de que el costo medio es mayor de 300 dólares. b) ¿Cuál es tu respuesta en el punto anterior si la desviación estándar es 75 dólares y el nivel de significación del 5%?. 8. Se asigna a un auditor la tarea de evaluar los reembolsos de las consultas médicas pagadas por una institución de medicina prepaga, durante un mes dado. Se obtiene una muestra aleatoria de 75 reembolsos obteniéndose un promedio de $655,90 y una desviación estándar $241,85. a) Con un nivel de significación del 5%, ¿existe evidencia de que el reembolso medio es menor que $700? b) Indica los supuestos de la prueba utilizada en el punto anterior. 9. Un fabricante de autos pretende lanzar al mercado un modelo cuyo consumo cada 100 km tiene distribución Normal con una desviación estándar de 0,25 litros. Selecciona una muestra aleatoria de 10 vehículos del nuevo modelo, cada uno de los cuales realiza un recorrido de 100 km y obtiene un desvío estándar igual a 0,32 litros. Con un nivel de significación del 5% se puede concluir que la variabilidad del consumo es distinta a la pretendida por el fabricante? 10. En un aeropuerto el retraso en la salida de los vuelos tiene una distribución Normal. Los responsables del aeropuerto declaran que el retraso medio es de 30 minutos con una desviación estándar de 5 minutos. Sin embargo una organización de consumidores manifiesta que el retraso medio es de 30 minutos pero con una desviación estándar es 15 minutos. De una muestra aleatoria de 15 vuelos se obtuvo un promedio igual a 38,04 minutos y una desviación estándar igual a 5,50 minutos. Con un nivel de significación del 5%, ¿se puede concluir que la desviación estándar es mayor que 5 minutos?. 11. Un estudio llevado a cabo indicó que una proporción de 0,64 de los compradores en supermercados creen que las marcas propias son tan buenas como las marcas con reconocimiento nacional respecto a la calidad del producto. Para investigar si se aplica este resultado a su propio producto, el fabricante de una salsa de tomate de marca reconocida preguntó a 100 compradores en supermercados si creían que la salsa de tomate propia del supermercado era tan buena como la marca reconocida. De la muestra aleatoria, 52 de los compradores indicaron que la marca propia era tan buena como la marca reconocida Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario a) A un nivel de significación del 5%, ¿puede afirmarse que menos de 0,64 de los compradores en supermercados consideran que las marcas propias son tan buenas como las marcas con reconocimiento nacional? b) ¿Cuál es el valor p? Interpreta. 12. Una revista afirma que el 25% de sus lectores son estudiantes universitarios. De una muestra aleatoria de 200 lectores, 42 son estudiantes de este nivel. a) Con un nivel de significación del 10%, ¿existe evidencia de que el porcentaje de estudiantes universitarios no es del 25%? b) ¿Cuál es el valor p? Interpreta. c) Interpreta en términos del problema los errores de tipo I y II. 13. Un restaurante de comida rápida planea una oferta especial que permita a los clientes comprar vasos con diseño especial. Si más del 15% de los clientes compran esos vasos, se implementará la promoción. En una prueba preliminar en varios locales, 88 de 500 clientes los compraron. ¿Se debe implementar la promoción especial? Lleva a cabo una prueba de hipótesis que apoye tu decisión. Usa un nivel de significación del 1%. 14. Un informe reciente sobre compañías de seguros indicó que el 40% de las personas implicadas en accidentes de tránsito menores había tenido por lo menos un accidente los pasados cinco años. Un grupo decidió investigar dicha afirmación, pues creía que ese porcentaje era muy grande. Una muestra de 200 accidentes de tránsito mostró que 74 personas también estuvieron involucradas en otro accidente los pasados cinco años. a) ¿A qué conclusión se llega utilizando un nivel de significación del 1%? b) Determina e interpreta el valor p. 15. El gerente de una empresa observó una diferencia en el monto de ventas diarias de los hombres y mujeres que trabajan como agentes de ventas. Una muestra de 40 días reveló que los hombres venden en promedio 1400 dólares diarios. En una muestra de 50 días, las mujeres vendieron en promedio 1500 dólares diarios. Se supone distribución Normal de las variables y que la desviación estándar para los hombres es 200 dólares y para las mujeres 250 dólares. Con un nivel de significación del 5%, ¿puede el gerente concluir que el monto medio de ventas diarias es mayor para las mujeres?. 16. Los clientes de una línea de supermercados pueden pagar sus compras en una caja registradoraoperada por un cajero o emplear un nuevo procedimiento U-Scan diseñado para reducir el tiempo que un cliente pasa en la fila de la caja. El gerente desea saber si el tiempo medio de pago con el nuevo método es menor que con el método tradicional. Para ello reunió la siguiente información: Método Media muestral Desvío estándar poblacional Tamaño de la muestra Tradicional 5,5 min 0,40 min 50 U-Scan 5,3 min 0,30 min 100 a) Calcula el valor p y toma una decisión utilizando un nivel de significación del 1%. b) ¿Qué supuestos son necesarios establecer para que sea válida esta prueba? 17. Una empresa ofrece el servicio de traslado a un aeropuerto metropolitano, por dos rutas, A o B. Se desea estudiar el tiempo que tardaría por cada ruta y luego comparar los resultados. Se analizó una muestra aleatoria de 7 viajes por la ruta A obteniéndose un promedio de 58,29 minutos con una desviación estándar de 8,99 minutos y para otra muestra aleatoria de 8 viajes por la ruta B se obtuvo un promedio de 59 minutos con una desviación estándar de 4,37 minutos. Se supone distribución Normal de las variables. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario a) Con un nivel de significación del 10%, ¿hay alguna diferencia en la variabilidad de los tiempos de manejo por las dos rutas? b) ¿Cuál sería tu conclusión si se sospecha que la variancia de los tiempos por la ruta A es mayor que la variancia de los tiempos por la ruta B? 18. Se realiza un estudio sobre los hábitos que tienen hombres y mujeres de escuchar un programa. En una muestra aleatoria de 10 hombres se obtuvo un tiempo promedio de 35 minutos por día con un desvío estándar igual a 10 minutos por día. El tiempo de escucha medio de 13 mujeres estudiadas fue de 35 minutos con un desvío estándar de 12 minutos. Con un nivel de significación del 10%, ¿se puede concluir que hay una diferencia significativa en la variación de los tiempos de escucha para los hombres y las mujeres?. 19. Utiliza la información del ejercicio 17 de la Práctica Nº 2, suponiendo distribución Normal de las variables y que no se conoce que las variancias poblacionales son iguales. a) Con un nivel de significación del 5%, ¿se puede concluir que existe diferencia en las duraciones medias de ambas soluciones? b) Compara esta decisión con la obtenida utilizando un intervalo de confianza del 95%. (Analiza la salida de STATGRAPHICS). 20. Utiliza la información del ejercicio 19 de la Práctica Nº 2, suponiendo distribución Normal de las variables y que no se conoce que las variancias poblacionales son iguales. Con un nivel de significación del 10%, ¿se puede concluir que la calificación media de los varones es mayor que la de las mujeres? 21. Una empresa estudia los tiempos de entrega de dos proveedores de materia prima. En general, está satisfecho con el proveedor A y lo conservará si el tiempo medio de entrega es igual o menor que la del proveedor B. En caso contrario comenzará a comprar al proveedor B. En un estudio sobre el tiempo de entrega se obtuvieron los siguientes resultados: Proveedor 𝑛 �̅� 𝑆 A 30 14 días 3 días B 18 12,5 días 2 días a) Con un nivel de significación del 5%, ¿se puede concluir que el tiempo medio de entrega del proveedor A es mayor que el del proveedor B? (Analiza la salida de STATGRAPHICS). b) Resuelve el ejercicio considerando: 𝑆1 = 4 días y 𝑆2 = 2 días. . 22. De 150 adultos que probaron una nueva bebida saborizada, 87 la calificaron como excelente. De 200 niños muestreados, 123 la calificaron como excelente. Con un nivel de significación del 10%, ¿se puede concluir que existe una diferencia significativa en la proporción de adultos y de niños que calificaron al nuevo sabor como excelente? 23. Una compañía de seguros realiza investigaciones continuas sobre las causas de accidentes automovilísticos, las características de los conductores, etc. Una muestra aleatoria de 400 pólizas de personas solteras reveló que 120 habían tenido al menos un accidente en el período anterior de tres años. De forma similar una muestra de 600 pólizas de personas casadas reveló que 150 habían estado involucradas en al menos un accidente. Con un nivel de significación del 5%, ¿se puede concluir que la proporción de personas solteras involucradas en un accidente durante un período de tres años es menor que la proporción de personas casadas? Determina el valor p. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario 24. Las cadenas de hoteles controlan los niveles de servicio de cada lugar y analizan los resultados de las encuestas de satisfacción que contestan los huéspedes cuando salen del hotel. Una cadena de hoteles realizó una encuesta en los hoteles ubicados en dos islas con el fin de analizar si elegirían ese hotel otra vez. En una de ellas la cadena tiene dos hoteles y en la otra tres. En el hotel Beachcomber de 227 huéspedes 163 contestaron que sí y en el Windsurfer 154 de 262 respondieron que sí. Con un nivel de significación del 5%, ¿existen diferencias significativas en la satisfacción del cliente entre los dos hoteles? 25. Un profesor de Contabilidad estudiaba la comprensión de los informes anuales de dos compañías importantes A y B. Seleccionó una muestra aleatoria de 100 Contadores Públicos y de ellos 50 se asignaron al azar para que leyeran el informe de la compañía A y los restantes debían leer el informe de la compañía B. Comprensión Compañía Total A B Si 17 23 40 No 33 27 60 Total 50 50 100 Con un nivel del 10% ¿existen indicios de una diferencia significativa entre las dos compañías en cuanto a la proporción de contadores que piensan que los informes son comprensibles? 26. Considera un estudio similar al del ejercicio 24 realizado en otra isla donde la cadena tiene tres hoteles. La tabla siguiente presenta las respuestas a la pregunta de si el huésped regresaría a cada uno de los tres hoteles. Regresaría Hotel Total Golden Palm Palm Royale Palm Princess Sí 128 199 186 513 No 88 33 66 187 Total 216 232 252 700 Con un nivel de significación del 5 %, ¿existe suficiente evidencia para concluir que los hoteles son diferentes respecto a la proporción de huéspedes que regresarían? 27. Una cadena de comida rápida desea determinar si existe diferencia entre tres medios (revistas, televisión, radio) en términos de que el consumidor recuerde el anuncio. Los resultados de un estudio de publicidad son los siguientes: Recuerdan Medio Total Revista TV Radio Sí 25 10 7 42 No 73 93 108 274 Total 98 103 115 316 Con un nivel de significación del 5% determina si existen indicios de un efecto significativo del medio en cuanto a la proporción de individuos que pueden recordar el anuncio. 28. En la encuesta sobre la satisfacción de los huéspedes del hotel del ejercicio 26 se les pregunta a todas las personas que indicaron que no regresarían, la causa principal de su respuesta. A continuación se presenta la tabla de contingencia 4 x 3 de las frecuencias observadas: Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Razones Hotel Total Golden Palm Palm Royale Palm Princess Precio 23 7 37 67 Localización 39 13 8 60 Condición de la habitación 13 5 13 31 Otros 13 8 8 29 Total 88 33 66 187 Con un nivel de significación del 5% ¿existen evidencias de una relación entre la razón principal para no regresar y el hotel? 29. Una empresa grande está interesada en determinar si existe una asociación entre el tiempo de traslado de sus empleados y el nivel de problemas relacionados con estrés que se observa en el trabajo. Un estudiode 116 trabajadores de la línea de ensamble revela lo siguiente: Tiempo de traslado Estrés Total Elevado Moderado Bajo Menos de 15 min 9 5 18 32 De 15 a 45 min 17 8 28 53 Más de 45 min 18 6 7 31 Total 44 19 53 116 Con un nivel de significación del 1% ¿existen evidencias de una relación entre el tiempo de traslado y el nivel de estrés? 30. Aplicaciones en Sala de Computación con datos de la EPH y ENGHO Respuestas de ejercicios (no incluyen gráficos ni interpretaciones) 1. a) zobs = -1,78 < -1,64, se rechaza H0 b) valor p = 0,0375, se rechaza H0 2. a) zobs = 1,5; -1,96 < 1,5 < 1,96, no se rechaza H0 b) valor p = 0,1336, no se rechaza H0 c) IC95%,µ= (366,62 ; 378,38), no se rechaza H0 3. a) zobs = 2,1, p valor = 0,0179, se rechaza H0 b) el gerente decidirá vender el juguete 4. tobs= -0,93; -2,093 < -0,93 < 2,093, no se rechaza H0 5. a) tobs= 1,71 < 2,624, no se rechaza H0 b) 𝑋~N(𝜇, 𝜎𝑑) 6. a) tobs= -1,34 > -3,747, no se rechaza H0 b) 𝑋~N(𝜇, 𝜎𝑑) 7. a) tobs= 3,56 > 1,28, se rechaza H0 b) tobs= 2,05 > 1,64 , se rechaza H0 8. a) tobs= -1,58 > -1,64, no se rechaza H0 b) 𝑋~N(𝜇, 𝜎𝑑) 9. Uobs= 14,74; 2,7 < 14,74 < 19,023, no se rechaza H0 10. Uobs= 16,94 < 23,685, no se rechaza H0 Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario 11. Zobs= -2,5 < -1,64 , se rechaza H0 12. a) Zobs= -1,33; -1,64 < -1,33 < 1,64, no se rechaza H0 b) valor p = 0,1836, no se rechaza H0 13. Zobs= 1,88 < 2,33, no se rechaza H0 14. a) Zobs= -0,86 > -2,33, no se rechaza H0 b) valor p = 0,1949, no se rechaza H0 15. Zobs= 2,11 > 1,64, se rechaza H0 16. a) valor p = 0,0009, se rechaza H0 b) 𝑋𝑇~𝑁(𝜇𝑇 , 𝜎𝑇 = 0,4) ; 𝑋𝑈~𝑁(𝜇𝑈, 𝜎𝑈 = 0,3) 17. a) Fobs= 4,23 > 3,87, se rechaza H0. b) Fobs= 4,23 > 2,83, se rechaza H0 18. Fobs= 1,44 < 3,07, no se rechaza H0 19. a) Variancias: Fobs= 1,45 < 3,31, no se rechaza H0 Medias: tobs= 0,17; -2,074 < 0,17 < 2,074, no se rechaza H0 b) 1 2μ μ ;90% IC - = (-5,76 ; 6,78) ,no se rechaza H0 20. Variancias: Fobs= 1,90 < 4,15, no se rechaza H0 Medias: tobs= - 0,48 < 1,345, no se rechaza H0 21. a) Variancias: Fobs= 2,25 < 2,5, no se rechaza H0 Medias: tobs= 1,875; se rechaza H0 b) Variancias: Fobs= 4 > 2,5 se rechaza H0 22. Zobs= - 0,66; -1,64 < - 0,66 < 1,64, no se rechaza H0 23. Zobs= 2,22 ; valor p = 0,9868, no se rechaza H0 24. Uobs= 9,048 > 3,841 , se rechaza H0 25. Uobs= 1,50 < 2,706, no se rechaza H0 26. Uobs= 40,236 > 5,991, se rechaza H0 27. Uosb= 19,034 > 5,991, se rechaza Ho 28. Uobs= 27,402 > 12,592, se rechaza H0 29. Uobs= 9,83 < 13,277, no se rechaza H0 Salida STATGRAPHICS (Ej. 21) a.1) Test de homogeneidad de variancias Desviaciones estándar muestrales = 3,0 y 2,0 Tamaños de muestra = 30 y 18 Intervalos de confianza del 95,0% para el cociente de varianzas: [0,896369, 5,11474] Hipótesis Nula: cociente de varianzas = 1,0 Alternativa: no igual Estadistico F calculado = 2,25 Valor-P = 0,0826158 No rechazar la hipótesis nula para alfa = 0,05. El StatAdvisor Este análisis muestra los resultados de realizar una prueba de hipótesis relativa del cociente de dos desviaciones estándar (debería decir variancias) (sigma1/sigma2) (debería decir sigma 2 1/sigma 2 2) de muestras provenientes de distribuciones normales. Las dos hipótesis a ser evaluadas aquí son: Hipótesis nula: sigma1/sigma2 = 1,0 (debería decir sigma 2 1/ sigma 2 2) Hipótesis alterna: sigma1/sigma2 <> 1,0 (debería decir sigma 2 1/sigma 2 2) Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Dada una muestra de 30 observaciones con una desviación estándar de 3,0 y una segunda muestra de 18 observaciones con una desviación estándar de 2,0, el estadístico F calculado es igual a 2,25. Puesto que el valor-P para la prueba es mayor o igual que 0,05, no puede rechazarse la hipótesis nula con un 95,0% de nivel de confianza. El intervalo de confianza muestra que los valores de var1/var2 soportados por los datos caen entre 0,896369 y 5,11474. a.2) Test de igualdad de medias Medias muestrales = 14,0 y 12,5 Desviaciones estándar muestrales = 3,0 y 2,0 Tamaños de muestra = 30 y 18 Hipótesis Nula: diferencia entre medias = 0,0 Alternativa: mayor que Estadístico t calculado = 1,88126 Valor-P = 0,0331372 Rechazar la hipótesis nula para alfa = 0,05. (Asumiendo varianzas iguales). El StatAdvisor Este análisis muestra los resultados de realizar una prueba de hipótesis relativa a la diferencia entre dos medias (mu1-mu2) de muestras provenientes de distribuciones normales. Las dos hipótesis a ser evaluadas aquí son: Hipótesis nula: mu1-mu2 = 0,0 Hipótesis alterna: mu1-mu2 > 0,0 Dada una muestra de 30 observaciones con una media de 14,0 y una desviación estándar de 3,0 y una segunda muestra de 18 observaciones con una media de 12,5 y una desviación estándar de 2,0, el estadístico t calculado es igual a 1,88126. Puesto que el valor-P para la prueba es menor que 0,05, puede rechazarse la hipótesis nula con un 95,0% de nivel de confianza. NOTA: al realizar esta prueba, se ha asumido que las desviaciones estándar (debería decir variancias) de las dos muestras son iguales. Se puede relajar esta suposición pulsando el botón secundario del ratón y eligiendo Opciones de Análisis. b) Test de homogeneidad de variancias Desviaciones estándar muestrales = 4,0 y 2,0 Tamaños de muestra = 30 y 18 Intervalos de confianza del 95,0% para el cociente de varianzas: [1,59354, 9,09288] Hipótesis Nula: cociente de varianzas = 1,0 Alternativa: no igual Estadistico F calculado = 4,0 Valor-P = 0,00410311 Rechazar la hipótesis nula para alfa = 0,05. El StatAdvisor Este análisis muestra los resultados de realizar una prueba de hipótesis relativa del cociente de dos desviaciones estándar (debería decir variancias) (sigma1/sigma2) (debería decir sigma 2 1/sigma 2 2) de muestras provenientes de distribuciones normales. Las dos hipótesis a ser evaluadas aquí son: Hipótesis nula: sigma1/sigma2 = 1,0 (debería decir sigma 2 1/sigma 2 2) Hipótesis alterna: sigma1/sigma2 <> 1,0 (debería decir sigma 2 1/sigma 2 2) Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Dada una muestra de 30 observaciones con una desviación estándar de 4,0 y una segunda muestra de 18 observaciones con una desviación estándar de 2,0, el estadístico F calculado es igual a 4,0. Puesto que el valor-P para la prueba es menor que 0,05, puede rechazarse la hipótesis nula con un 95,0% de nivel de confianza. El intervalo de confianza muestra que los valores de var1/var2 soportados por los datos caen entre 1,59354 y 9,09288. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Práctica N o 4 REGRESIÓN Y CORRELACIÓN LINEAL 1. Los siguientes datos corresponden a alturas(cm.) y pesos (kg.) de los alumnos de Licenciado en Economía que cursaron Estadística II en el año 2009, diferenciados por sexo: Altura varones Peso varones Altura mujeres Peso mujeres 182 68 155 45 175 65 157 49 176 73 165 49 171 67 162 77 180 65 152 42 178 85 168 60 175 73 150 62 188 79 175 62 178 84 167 70 176 65 150 51 179 80 158 58 175 67 168 58 195 73 167 74 185 65 172 57 170 60 164 56 174 69 167 49 170 67 164 54 178 65 194 88 17874 180 70 181 75 Se desea predecir el peso en función de la altura para los varones (n=23): a) Construye un diagrama de dispersión con los datos de la tabla. b) Determina la recta de regresión e interpreta el significado de la ordenada al origen y de la pendiente para estos datos. c) Estima el peso promedio de un varón cuya altura es de 183 cms.. d) ¿Presentan los datos evidencia suficiente de que la altura y el peso están linealmente relacionados, para un = 0,05?. e) Construye un intervalo de confianza del 95% para la pendiente de la recta. Interpreta. f) Construye un intervalo de confianza del 95% para el peso esperado, si la altura del alumno es de 183 cms.. Interpreta. g) Determina el intervalo de predicción del 95% para el peso, si la altura del alumno es de 183 cms.. Interpreta. h) Calcula el coeficiente de correlación y el de determinación e interpreta. i) Analiza la salida que proporciona el STATGRAPHICS para estos datos y relaciona con lo calculado en forma manual.(Se encuentra al final de esta práctica). j) Analiza la salida Excel para estos datos. (Se encuentra al final de esta práctica). k) Realiza el test de hipótesis para el coeficiente de correlación. 2. Para la altura y peso de las mujeres (n=16), analiza la salida del programa y determina la adecuación del modelo lineal para representar estos datos. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario 3. El Gerente de Comercialización de una cadena de supermercados desea predecir las ventas semanales de comida para mascotas, en función del espacio destinado en las góndolas para la venta de dicho producto. Selecciona una muestra aleatoria de 12 supermercados y obtiene la siguiente información: Supermercado Espacio (mts 2 ) Ventas semanales (miles de pesos) 1 0,5 1,6 2 0,5 2,2 3 0,5 1,4 4 1 1,9 5 1 2,4 6 1 2,6 7 1,5 2,3 8 1,5 2,7 9 1,5 2,8 10 2 2,6 11 2 2,9 12 2 3,1 a) Encuentra la ecuación de la recta de regresión que relaciona ambas variables. Grafica. b) ¿Presentan los datos evidencia suficiente de que las variables están linealmente relacionadas, con = 0,05? c) Estima la venta semanal promedio para un espacio en góndola de 0,8 mts 2 . d) ¿Consideras apropiado estimar las ventas para una superficie en góndola de 3,5 mts 2 ? e) Calcula e interpreta los coeficientes de correlación y de determinación. 4. El dueño de una agencia de remises desea predecir el tiempo (en min.) que le insume a los coches, realizar un viaje desde el lugar solicitado, al aeropuerto metropolitano en horas no pico, en función de la distancia a recorrer (en kms.). Selecciona una muestra aleatoria de 15 viajes, obteniendo los siguientes resultados: Viaje Distancia (kms) Tiempo (min) 1 10,3 20 2 11,6 18 3 12,1 22 4 14,3 24 5 15,7 27 6 16,1 23 7 18,4 29 8 20,2 37 9 21,8 37 10 24,3 37 11 25,4 41 12 26,7 41 13 27,0 38 14 28,3 37 15 29,0 39 a) Calcula la recta de regresión mínimo cuadrática. b) Interpreta la pendiente. ¿Tiene algún significado la ordenada al origen? c) Construye un intervalo de confianza del 99% para el tiempo esperado de traslado, cuando la distancia es de 20 kms.. Interpreta. d) Construye el intervalo de predicción del 99% para el tiempo de traslado, cuando la distancia es de 20 kms.. Interpreta. e) ¿Consideras adecuado el ajuste lineal? ¿Por qué? Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario 5. Una Consultora encaró un estudio referido al número de comercios (x) ubicados en determinada área y el número de sucursales bancarias en la misma área (y). La información obtenida para un total de 12 áreas fue analizada con Excel, obteniéndose la siguiente salida: Estadísticas de la regresión Coeficiente de correlación 0,97223253 Coeficiente de determinación R^2 0,94523609 R^2 ajustado 0,9397597 Error típico 0,55829913 Observaciones 12 Coeficientes Error típico Estadística t Probabilidad Inf. 95% Sup 95%. Intercepción 1,76684 0,32117 5,50119 0,00026 1,05 2,48 Variable X1 0,01110 0,00084 13,13780 1,2409E-07 0,009 0,013 a) Escribe la ecuación de regresión e interpreta los coeficientes en términos del problema. b) ¿Presentan los datos evidencia suficiente de que ambas variables están linealmente relacionadas, con = 0,05? Justifica tu respuesta. c) Proporciona una estimación del coeficiente de regresión, con una confianza del 95%. Interpreta. d) Interpreta el coeficiente de determinación. 6. El Gerente de un Banco desea encontrar un modelo para predecir el tiempo (hs.) que le insumiría procesar las facturas de una Sección de la institución, basándose en la información obtenida en la siguiente muestra de 20 días: Día Nº. de facturas Tiempo (hs) Día Nº. de facturas Tiempo (hs) 1 149 2,1 11 110 1,5 2 60 1,8 12 83 1,2 3 188 2,3 13 60 0,8 4 19 0,3 14 25 0,4 5 201 2,7 15 173 2,0 6 58 1,0 16 169 2,5 7 77 1,7 17 190 2,9 8 222 3,1 18 233 3,4 9 181 2,8 19 289 4,1 10 30 1,0 20 45 1,2 a) Construye un diagrama de dispersión con estos datos. b) Escribe la ecuación de regresión lineal e interpreta los coeficientes. c) Mediante un intervalo de confianza del 90% estima el tiempo medio que insumiría procesar 150 facturas. d) Construye un intervalo de predicción del 90% para el tiempo que insumiría procesar 150 facturas. Aplicación en Series de Tiempo 7. La siguiente tabla presenta las ventas anuales (en millones de unidades) a nivel mundial de automóviles, camiones y autobuses fabricados por la empresa General Motors, en el período 1985/1992: Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Año Ventas (millones de unidades) 1985 9,3 1986 8,6 1987 7,8 1988 8,1 1989 7,9 1990 7,5 1991 7,0 1992 7,2 a) Grafica la serie de tiempo. Observa si hay una tendencia lineal. b) Determina la ecuación de tendencia lineal de esta serie. c) ¿Cuál es la variación anual promedio producida en las ventas durante este período? 8. Los siguientes datos representan los ingresos anuales (en millones de pesos) de una compañía tabacalera, durante el período 2001/2012: Año Ingreso (millones de $) 2001 1,5 2002 2,1 2003 3,0 2004 4,3 2005 6,6 2006 9,6 2007 11,6 2008 13,8 2009 25,9 2010 31,7 2011 44,8 2012 56,5 a) Grafica estos datos en un diagrama. b) Ajusta una ecuación de tendencia exponencial a los datos y grafica la curva en el diagrama del punto a). c) Predice el ingreso para los años 2014 y 2015. 9. Los siguientes datos representan las ventas (en cientos de miles de pesos) realizadas mensualmente durante el año 2016, de una empresa del gran Rosario : Mes Ventas (cientos de miles de pesos) Ene 0,3 Feb 0,3 Mar 0,6 Abr 0,7 May 1,0 Jun 1,2 Jul 1,4 Ago 1,8 Sep 2,3 Oct 3,8 Nov 5,9 Dic 9,3 a) Representa estos datos en un diagrama y ajusta mediante una ecuación de tendencia que te parezca apropiada. b) Predice las ventas para los meses de marzo y mayo del 2017. 10. Aplicaciones en Sala de Computación con datos de la EPH y ENGHO. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Respuestas de ejercicios (no incluyen gráficos ni interpretaciones) 1. a) – b) ˆ 50,37 0,68y x c) ˆ 74,07y kgs d) – e) LI= 0,246 LS= 1,114 f) LI= 70,86 kgs LS= 78,16 kgs g) LI= 59,45 kgs LS= 89,57 kgs h) r= 0,58 r 2= 33,64% i) – j) – k) Rechazo H0 2. 3. a) ˆ 1,45 0,74y x b) – c) ˆ 2,042 y miles de pesos d) – e) r= 0,827 r 2 =68,39% 4. a) ˆ 7,26 1,198y x b) – c) LI= 28,96 min LS= 33,51 min d) LI= 22,14 min LS= 40,33 min e) – 5. a) ˆ 1,77 0,011y x b) – c) LI= 0,009 LS= 0,013 d) – 6. a) – b) ˆ 0,366 0,012y x c) LI= 2,08 horas LS= 2,33 horas d) LI= 1,66 horas LS= 2,75 horas 7. a) – b) ˆ 9,2 0,283y x c) – 8. a) – b) 𝑙𝑜𝑔�̂� = 0,0533 + 0,14478𝑥 o �̂� = 1,13 ∗ 1,396𝑥 c) Año 2014: ŷ =120,63 millones de pesos Año 2015: ŷ =168,41 millones de pesos 9. a) – Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario b) Marzo 2017: ŷ =17,65 cientos de miles de pesos Mayo 2017: ŷ =32,06 cientos de miles de pesos Salida STATGRAPHICS (Ej. 1) Regresión Simple - peso var vs. alt var Variable dependiente: peso var Variable independiente: alt var Lineal: Y = a + b*X Coeficientes Parámetro Mínimos Cuadrados Estimado Estándar Error Estadístico T Valor-P Intercepto -47,9158 35,9246 -1,33379 0,1966 Pendiente 0,666276 0,201272 3,31032 0,0033 Análisis de Varianza Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Modelo 510,164 1 510,164 10,96 0,0033 Residuo 977,662 21 46,5553 Total (Corr.) 1487,83 22 Coeficiente de Correlación = 0,58557 R-cuadrada = 34,2893 porciento R-cuadrado (ajustado para g.l.) = 31,1602 porciento Error estándar del est. = 6,82315 Error absoluto medio = 5,37624 Estadístico Durbin-Watson = 1,87104 (P=0,3651) Autocorrelación de residuos en retraso 1 = 0,0471102 El StatAdvisor La salida muestra los resultados de ajustar un modelo lineal para describir la relación entre peso var y alt var. La ecuación del modelo ajustado es peso var = -47,9158 + 0,666276*alt var Puesto que el valor-P en la tabla ANOVA es menor que 0,05, existe una relación estadísticamente significativa entre peso var y alt var con un nivel de confianza del 95,0%. El estadístico R-Cuadrada indica que el modelo ajustado explica 34,2893% de la variabilidad en peso var. El coeficiente de correlación es igual a 0,58557, indicando una relación moderadamente fuerte entre las variables. El error estándar del estimador indica que la desviación estándar de los residuos es 6,82315. Este valor puede usarse para construir límites de predicción para nuevas observaciones, seleccionando la opción de Pronósticos del menú de texto. El error absoluto medio (MAE) de 5,37624 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW) examina los residuos para determinar si hay alguna correlación significativa basada en el orden en el que se presentan en el archivo de datos. Puesto que el valor-P es mayor que 0,05, no hay indicación de una autocorrelación serial en los residuos con un nivel de confianza del 95,0%. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Valores Predichos 95,00% 95,00% Predicciones Límite Predicción Límite Confianza X Y Inferior Superior Inferior Superior 183,0 74,0127 59,3877 88,6376 70,4707 77,5547 El StatAdvisor Esta tabla muestra los valores predichos para peso var usando el modelo ajustado. Además de las mejores predicciones, la tabla muestra: (1) intervalos de predicción del 95,0% para las nuevas observaciones (2) intervalos de confianza del 95,0% para la media de varias observaciones Grá fico de l M ode lo A justa do pe so var = -4 7,9 15 8 + 0 ,66 62 76 *alt var 1 60 1 70 1 80 1 90 2 00 a lt va r 5 4 6 4 7 4 8 4 9 4 p e s o v a r Grá fico de R esiduos pe so var = -4 7,9 15 8 + 0 ,66 62 76 *alt var 1 60 1 70 1 80 1 90 2 00 a lt va r -1 5 -1 0 -5 0 5 1 0 1 5 re si d uo Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Comparación de Modelos Alternos Modelo Correlación R-Cuadrada Doble Inverso 0,6242 38,96% Inversa-Y Log-X -0,6155 37,88% Curva S -0,6120 37,45% Inversa-Y Raíz Cuadrada-X -0,6110 37,33% Inversa de Y -0,6065 36,78% Raíz Cuadrada-Y Inversa de X -0,6051 36,61% Multiplicativa 0,6047 36,57% Logarítmico-Y Raíz Cuadrada- X 0,6010 36,12% Raíz Cuadrada-Y Log-X 0,5985 35,82% Inversa de X -0,5977 35,72% Inversa-Y Cuadrado-X -0,5973 35,67% Exponencial 0,5971 35,66% Raíz Cuadrada Doble 0,5951 35,41% Logaritmo de X 0,5918 35,02% Raíz Cuadrada de Y 0,5916 35,00% Log-Y Cuadrado-X 0,5893 34,73% Raíz Cuadrada deX 0,5887 34,66% Lineal 0,5856 34,29% Raíz Cuadrada-X Cuadrado-X 0,5844 34,15% Cuadrado-Y Inversa de X -0,5822 33,89% Cuadrado de X 0,5791 33,53% Cuadrado-Y Log-X 0,5776 33,36% Cuadrado-Y Raíz Cuadrada-X 0,5752 33,08% Cuadrado de Y 0,5727 32,79% Cuadrado Doble 0,5674 32,19% Logístico <sin ajuste> Log probit <sin ajuste> El StatAdvisor Esta tabla muestra los resultados de ajustar varios modelos curvilíneos a los datos. De los modelos ajustados, el modelo doble inverso es el que arroja el valor más alto de R-Cuadrada con 38,9616%. Este es 4,67232% mayor que el modelo lineal seleccionado. Para cambiar los modelos, seleccione el cuadro de diálogo de las Opciones de Análisis. Salida EXCEL (Ej. 1) Resumen Estadísticas de la regresión Coeficiente de correlación múltiple 0,585570247 Coeficiente de determinación R^2 0,342892514 R^2 ajustado 0,311601681 Error típico 6,823145693 Observaciones 23 ANÁLISIS DE VARIANZA Gr lib Suma de cuadrados Prom. de los cuadrados F Valor crítico de F Regresión 1 510,1644268 510,1644268 10,9582419 0,0033286 Residuos 21 977,6616601 46,55531715 Total 22 1487,826087 Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Coeficientes Error típico Estadístico t Probabilidad Infr 95% Sup 95% Intercepción -47,91578 35,92462233 -1,333786712 0,196560262 -122,625125 26,7935578 Altura 0,6662757 0,201272087 3,310323533 0,0033286 0,247707509 1,08484394 Análisis de los residuales Resultados de datos de probabilidad Observación Pronóstico Peso Residuos Percentil Peso 1 73,346398 -5,346398305 2,173913043 54 2 68,682468 -3,68246822 6,52173913 60 3 69,348744 3,651256053 10,86956522 65 4 66,017365 0,982634685 15,2173913 65 5 72,013847 -7,013846852 19,56521739 65 6 70,681295 14,3187046 23,91304348 65 7 68,682468 4,31753178 28,26086957 65 8 77,344053 1,655947337 32,60869565 67 9 70,681295 13,3187046 36,95652174 67 10 69,348744 -4,348743947 41,30434783 67 11 71,347571 8,652428874 45,65217391 68 12 68,682468 -1,68246822 50 69 13 82,007983 -9,007982748 54,34782609 70 14 75,345225 -10,34522548 58,69565217 73 15 65,35109 -5,351089588 63,04347826 73 16 68,016192 0,983807506 67,39130435 73 17 65,35109 1,648910412 71,73913043 74 18 61,353435 -7,35343523 76,08695652 75 19 70,681295 -5,6812954 80,43478261 79 20 81,341707 6,658292978 84,7826087 80 21 70,681295 3,3187046 89,13043478 84 22 72,013847 -2,013846852 93,47826087 85 23 72,680123 2,319877421 97,82608696 88 Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía UniversidadNacional de Rosario Salida STATGRAPHICS (Ej. 2) Regresión Simple - peso muj vs. alt muj Variable dependiente: peso muj Variable independiente: alt muj Lineal: Y = a + b*X Coeficientes Parámetro Mínimos Cuadrados Estimado Estándar Error Estadístico T Valor-P Intercepto -23,7356 51,784 -0,458357 0,6537 Pendiente 0,500104 0,318697 1,56921 0,1389 Análisis de Varianza Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Modelo 226,453 1 226,453 2,46 0,1389 Residuo 1287,48 14 91,9632 Total (Corr.) 1513,94 15 Coeficiente de Correlación = 0,386754 R-cuadrada = 14,9579 porciento R-cuadrado (ajustado para g.l.) = 8,88346 porciento Error estándar del est. = 9,58974 Error absoluto medio = 7,19932 Estadístico Durbin-Watson = 2,48124 (P=0,8511) Autocorrelación de residuos en retraso 1 = -0,315705 El StatAdvisor La salida muestra los resultados de ajustar un modelo lineal para describir la relación entre peso muj y alt muj. La ecuación del modelo ajustado es peso muj = -23,7356 + 0,500104*alt muj Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario El estadístico R-Cuadrada indica que el modelo ajustado explica 14,9579% de la variabilidad en peso muj. El coeficiente de correlación es igual a 0,386754, indicando una relación relativamente débil entre las variables. El error estándar del estimador indica que la desviación estándar de los residuos es 9,58974. Este valor puede usarse para construir límites de predicción para nuevas observaciones, seleccionando la opción de Pronósticos del menú de texto. El error absoluto medio (MAE) de 7,19932 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW) examina los residuos para determinar si hay alguna correlación significativa basada en el orden en el que se presentan en el archivo de datos. Puesto que el valor-P es mayor que 0,05, no hay indicación de una autocorrelación serial en los residuos con un nivel de confianza del 95,0%. Comparación de Modelos Alternos Modelo Correlación R-Cuadrada Doble Inverso 0,4396 19,32% Inversa-Y Log-X -0,4392 19,29% Inversa-Y Raíz Cuadrada-X -0,4389 19,27% Inversa de Y -0,4385 19,23% Inversa-Y Cuadrado-X -0,4375 19,14% Curva S -0,4164 17,34% Multiplicativa 0,4155 17,27% Logarítmico-Y Raíz Cuadrada- X 0,4150 17,22% Exponencial 0,4144 17,17% Log-Y Cuadrado-X 0,4129 17,05% Raíz Cuadrada-Y Inversa de X -0,4034 16,28% Raíz Cuadrada-Y Log-X 0,4023 16,19% Raíz Cuadrada Doble 0,4017 16,13% Raíz Cuadrada de Y 0,4009 16,07% Raíz Cuadrada-X Cuadrado-X 0,3992 15,93% Inversa de X -0,3898 15,20% Logaritmo de X 0,3885 15,09% Raíz Cuadrada deX 0,3876 15,03% Lineal 0,3868 14,96% Cuadrado de X 0,3847 14,80% Cuadrado-Y Inversa de X -0,3612 13,05% Cuadrado-Y Log-X 0,3593 12,91% Cuadrado-Y Raíz Cuadrada-X 0,3582 12,83% Grá fico de l M ode lo A justa do pe so muj = -2 3,7 35 6 + 0 ,50 01 04 *alt muj 1 50 1 55 1 60 1 65 1 70 1 75 a lt muj 4 2 5 2 6 2 7 2 8 2 p e s o m u j Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Cuadrado de Y 0,3570 12,74% Cuadrado Doble 0,3544 12,56% Logístico <sin ajuste> Log probit <sin ajuste> El StatAdvisor Esta tabla muestra los resultados de ajustar varios modelos curvilíneos a los datos. De los modelos ajustados, el modelo doble inverso es el que arroja el valor más alto de R-Cuadrada con 19,3227%. Este es 4,36477% mayor que el modelo lineal seleccionado. Para cambiar los modelos, seleccione el cuadro de diálogo de las Opciones de Análisis. Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario Práctica Nº 5 NÚMEROS INDICES 1. En el siguiente cuadro se presenta la producción anual de soja (en toneladas) en Argentina durante el período 2000-2011: Período Producción Soja 2000 26.880.850 2001 30.000.000 2002 34.818.550 2003 31.576.752 2004 38.289.742 2005 40.537.363 2006 47.482.786 2007 46.238.087 2008 30.989.469 2009 52.676.216 2010 48.878.771 2011 40.100.197 Fuente: MAGyP a) Construye un nº índice simple para la producción de soja, tomando como base el año 2000. b) Obtiene las variaciones porcentuales respecto al año base y al año anterior. c) Interpreta los valores obtenidos en términos del problema para el año 2007. 2. En la siguiente tabla se presenta el volumen de exportaciones anuales (en millones de dólares) de nuestro país, en el período 2000-2010: a) Construye un nº índice simple para el volumen de exportaciones, tomando como base el año 2000. b) Obtiene las variaciones porcentuales respecto al año base y al año anterior. c) Interpreta los valores obtenidos en términos del problema para el año 2010. 3. En la siguiente tabla se presenta la producción anual de soja y trigo (en toneladas), en Argentina durante el período 2000-2011: Período Producción Soja Producción Trigo Año Exportaciones 2000 26.340,04 2001 26.541,40 2002 25.649,72 2003 29.938,23 2004 34.549,30 2005 40.385,76 2006 46.544,90 2007 55.778,23 2008 69.446,18 2009 55.280,55 2010 31.459,24 Fuente INDEC Gps Económicas UNR - Conducción del CECEyE Estadística II Facultad de Ciencias Económicas y Estadística Licenciatura en Economía Universidad Nacional de Rosario 2000 26.880.850 15.959.352 2001 30.000.000 15.291.660 2002 34.818.550 12.301.442 2003 31.576.752 14.562.955 2004 38.289.742 15.959.580 2005 40.537.363 12.593.396 2006 47.482.786 14.547.960 2007 46.238.087 16.354.091 2008 30.989.469 8.376.452 2009 52.676.216 9.023.138 2010 48.878.771 15.875.651 2011 40.100.197 14.500.517 Fuente. MAGyP a) Obtiene un índice simple que refleje la evolución de la producción anual de trigo, tomando como base el año 2000. b) Obtiene las variaciones porcentuales respecto al año base y al año anterior e interpreta los valores obtenidos para el año 2010. c) Obtiene un índice promedio simple de relativos que refleje la evolución global de la producción anual de soja y trigo, tomando como base el año 2000. d) Obtiene las variaciones porcentuales respecto al año base y al año anterior e interpreta los valores obtenidos para el año 2011. 4. Los siguientes datos representan la cantidad de autos nuevos y usados vendidos mensualmente por una concesionaria rosarina durante el 1er.trimestre del año 2013: Período Nuevos Usados Ene/ 2013 13 40 Feb/ 2013 11 32 Mar/ 2013 21 34 a) Tomando como base el mes de enero de 2013, determina el índice de evolución global de los autos vendidos mensualmente. b) Calcula las variaciones porcentuales respecto al período base y al anterior. c) Interpreta los resultados obtenidos para el mes de marzo. 5. En una industria se está realizando un estudio de costos de los insumos que se compran. Se seleccionan 4 insumos básicos y se estudia la evolución del precio y de las cantidades compradas a lo largo de los 2 primeros trimestres de 2012. Los valores obtenidos son los siguientes: Insumo Primer Trimestre Segundo Trimestre Precio unitario (en decenas de $) Unidades compradas (en cientos) Precio unitario (en decenas de $) Unidades compradas (en cientos) A 2,80 220 3,06 244 B 4,50 30 4,30 34 C 0,24 40 0,38 43 D 0,48 21 0,51 24 a) Calcula los índices de Laspeyres y Paasche de precios, tomando como base el primer trimestre de 2012. Interpreta los resultados. b) Calcula los índices de Laspeyres y Paasche
Compartir