Logo Studenta

Tema_10_Prob_RegMul_EDB_2016_II (1)

¡Estudia con miles de materiales!

Vista previa del material en texto

Regresión Múltiple
Hoja de ejercicios
1. ¿Verdadero o falso? El modelo de regresión simple Y = �0 + �1X + u asume que:
(a) X es normal
(b) El término de error u debe ser homocedástico.
(c) El efecto de las variables que no están incluidas en los regresores tienen un efecto conjunto que se puede
modelizar como una normal de media cero.
(d) Los parámetros �0;�1han de ser positivos.
(e) u es normal
(f) �0 y �1 minimiznan
P
e2i :
(g) Las perturbaciones tienen media cero.
2. ¿Verdadero o falso? Sea el siguiente modelo de regresión:Y = 10 + 0:5X + u; con u � N(0; �2 = 1): Entonces:
(a) Si X aumenta en una unidad la media de Y aumenta en 10+0.5=10.5 unidades.
(b) Si X aumenta en una unidad, la media de Y aumenta en 0.5 unidades.
(c) Si X aumenta en una unidad Y disminuirá en 11.5 unidades por término medio.
3. El �chero FrenosITV tiene algunas propiedades de una muestra de vehículos. Queremos saber si la antigüedad
del coche o su potencia ayudan a predecir la e�cacia de frenado. Construye sendos modelos de regresión simple
que predigan la e�cacia en función de cada una de estas dos variables. Construye tambén el modelo de regresión
múltiple y compara los resultados.
4. ¿Verdadero o falso? El modelo lineal general (de regresión múltiple) yi = �0 + �1x1i + � � �+ �KxKi + ei asume
que:
(a) Los regresores X1; :::; XK siguen una distribución normal.
(b) La varianza de X1; :::; XK debe ser constante.
(c) La variable respuesta Y condicionada a valores observados de X debe ser constante.
(d) El término de error e debe ser homocedástico.
(e) El efecto de las variables que no están incluidas en los regresores tienen un efecto conjunto que se puede
modelizar como una normal de media cero.
(f) Los parámetros �0;�1; :::; �k han de ser positivos.
5. ¿Verdadero o falso? Sea el siguiente modelo de regresión múltiple:Y = 10+0:5X1�3X2+e; con e � N(0; �2 = 1):
Entonces
(a) Si X1 = 0 y X2 = 0; no se puede calcular Y:
(b) Si X1 = 0 y X2 = 0; Y � N(10; 1):
(c) Si X1 = y X2 = 1; Y = 12:
(d) Si X1 = 1 y X2 = 1; Y � N(7:5; 1):
(e) Si X1 = 1 y X2 = 1; Ŷ = 7:5:
(f) Si X1 = 1 y X2 = 1; Y = 7:5:
(g) Si X1 = 1 y X2 = 1; E(Y jX1; X2) = 10:
6. ¿Verdadero o falso? Sea el siguiente modelo de regresión múltiple:Y = 10+0:5X1�3X2+e; con e � N(0; �2 = 1):
Entonces:
(a) Si X1 aumenta en una unidad y X2 permanece constante, la media de Y aumenta en 10+0.5=10.5 unidades.
(b) Si X1 aumenta en una unidad y X2 permanece constante, la media de Y aumenta en 0.5 unidades.
(c) Si X2 aumenta en una unidad y X1 permanece constante, Y disminuirá en 3 unidades por término medio.
7. El �chero FrenosITV tiene algunas propiedades de una muestra de vehículos. Queremos saber si la antigüedad
del coche y su potencia ayudan a predecir la e�cacia de frenado. Construye un modelo de regresión múltiple que
prediga la e�cacia en función de los kilómetros recorridos por el automóvil (variable KM) y su Potencia.
8. Se denomina PM10 a las pequeñas partículas sólidas o líquidas dispersas en la atmósfera. Altas concentraciones
de PM10 peden ser perjudiciales para la salud. El �chero ConcentraPM10.sf3 contiene una muestra de 500
observaciones de concentración horaria de PM10 junto con otras variables. Estas variables son:
� Coches=número de coches que pasaron delante del medidor de concentración en esa hora.
� Temperatura del aire a una altura de 2m del suelo.
� Viento=velocidad del viento (m/s).
� Hora=Hora del día.
Se pide:
(a) Construye un modelo que explique la concentración de PM10 en función de la velocidad del viento. Se
supone que a mayor velocidad del viento, el aire se limpia al dispersarse las partículas de PM10. El efecto
puede ser no lineal, así que compara transformaciones de la variable así como regresión polinómica.
(b) Construye un modelo que explique la concentración de PM10 en función del trá�co de coches, temperatura
y velocidad del viento. Analiza los residuos. El modelo sólo tiene que tener variables signi�cativas.
(c) Algunos analistas piensan que la luz del sol disminuye la concentración de PM10 al destruir, por efecto
bioquímico, algunas partículas. Otros analistas opinan que si durante la noche hay menos PM10 es sólo
por el efecto del trá�co de los coches. Sabiendo que las horas de sol en el lugar donde se tomaron los datos
van desde las 7 a las 18, analiza cuál de los dos analistas (o los dos) tiene razón.
9. Utilizando el �chero AlumnosIndustriales, contrasta las siguientes a�rmaciones:
(a) Los chicos suelen ir con más dinero que las chicas
(b) Los estudiantes que viven más lejos (tardan más en llegar a la universidad) llevan más dinero encima
(c) Un chico y una chica que sean igual de altos, tendrán, por término medio, la misma talla de zapato
10. Se quiere comparar el lenguaje más rápido para ordenar una lista de 1.000.000 de números enteros, comprendidos
entre 0 y 100, utilizando el mismo algoritmo de ordenación elegido para la ocasión, el QuickSort (ordenación
rápida). Se quiere comparar la rapidez del algoritmo programado en C y porgramado en Java. Para cada
lenguaje se repite el experimento de ordenación 200 veces. Los tiempos de ejecución de cada experimento (en
milisegundos) se encuentra en el �chero CyJava.sf3. ¿Cuál es el más rápido?
11. El �chero FrenosITV tiene datos de un conjunto de automóviles que acuden a la ITV de Leganés. La variable
e�cacia es una magnitud entre 0 y 100 que mide la e�cacia de frenado, de manera que a mayor e�cacia mejor es
la frenada, en el sentido de que la presión de los frenos es mayor. La variable ABS tiene el valor 1 si el vehículo
tiene ABS y 0 si no tiene ABS. ¿Tienen los vehículos con ABS una mayor e�cacia de frenado?
12. El �chero IndiceMC tiene el índice de masa corporal de una muestra de estudiantes, así como su sexo (chicos=1,
chicas=0). ¿Es el índice de masa corporal medio (poblacional) de los chicos igual que el de las chicas?
13. El gerente de un centro comercial está interesado en conocer cómo in�uye la renta de sus clientes (euros) y su
sexo (1 si el cliente es hombre y 0 si es mujer) en las compras (en cientos de euros). Para ello ajusta un
modelo y obtiene:
Compras = 2:5 + 0:016 log(Renta)� 0:064 Sexo+e
¿Cuál es la diferencia media entre las compras de los hombres y de las mujeres asumiendo que tienen la misma
renta y que las variables Renta y Sexo son signifcativas? Marca la respuesta correcta
(a) 256.4 euros.
(b) 6.4 euros menos para los hombres.
(c) 6.4 euros más para los hombres.
(d) Depende del valor de la renta.
14. El departamento comercial de una empresa dedicada a la venta de ropa por catálogo ha hecho un estudio para
estimar las ventas realizadas (V), en cientos de euros. Para ello se han recogido datos durante 300 días de las
siguientes variables: No de líneas telefónicas abiertas para pedidos (L), No de catálogos enviados por correo
durante la semana anterior(C) y el Día de la semana (D) en el que se realizó la venta (D=1: �n de semana,
D=0: de lunes a viernes). En la siguiente tabla presentamos el resultado de dicho estudio.
Utilizando la información que aparece en esta tabla, responda verdadero (V) o falso (F) a las siguientes cuestiones
(a) Las variables líneas abiertas (L) no es signi�cativa para estimar las Ventas
(b) Si abrimos una línea telefónica adicional, manteniendo constante el número de catálogos enviados y el día
de la semana, las ventas medias aumentan en 500 euros.
(c) El cierre de una línea de teléfono puede compensarse con el envío de 500 catálogos
(d) Observado la tabla podemos saber que se cumple el supuesto de homocedasticidad
(e) En los �nes de semana las ventas medias aumentan 300 euros
(f) Sólo el número de catálogos enviados es signi�cativo para explicar las ventas

Continuar navegando

Materiales relacionados

41 pag.
Tema4_VariablesAleatorias_EDB_2016-II

SIN SIGLA

User badge image

Sebastian Sanchez Guerrero

48 pag.
TEMA_2_DescBivariante_Diapositivas_EDB_2016-II

SIN SIGLA

User badge image

Sebastian Sanchez Guerrero

27 pag.
Tema8_InferenciaNormal_EDB_2016-II

SIN SIGLA

User badge image

Sebastian Sanchez Guerrero