Vista previa del material en texto
Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Examen final de julio, bloque no 1. 10-07-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.75 puntos) Qué probabilidad hay de acertar la máxima categoŕıa en el sorteo del eu- romillón si se hace una sola apuesta? (5 números acertados de 50 posibles y 2 números acertados de 11 posibles) Solución: A = “acertar el sorteo”, A1 = “acertar la primera parte del sorteo”, A2 = “acertar la segunda parte del sorteo”. P (A) = P (A1)P (A2) = 1( 50 5 ) · 1( 11 2 ) = 5! 50 · 49 · 48 · 47 · 46 · 2! 11 · 10 = 8.58 · 10−9. 2. (0.5 puntos) Si dos sucesos A y B son excluyentes o incompatibles con probabilidades P (A) y P (B), ¿Cuál es la probabilidad de su unión? Solución: P (A ∪B) = P (A) + P (B). 3. (0.75 puntos) Sean dos Va X e Y independientes, con varianzas V ar(X) y V ar(Y ). La varianza de 2X − 3Y + 1 es: Solución: V ar(2X − 3Y + 1) = 22V ar(X) + (−3)2V ar(Y ) = 4V ar(X) + 9V ar(Y ). Página 1 de 4 Examen final de julio, bloque no 1. – 10-07-2012 (cont.) 4. (0.75 puntos) Demostrar que V ar(X) = E(X2)− (E(X))2. Solución: V ar(X) = E((X − E(X))2) = E(X2 + (E(X))2 − 2XE(X)) = E(X2)− (E(X))2. 5. (3.75 puntos) 5. Si una determinada Va X tiene como función de densidad: f(x) = { C sin(x) si π/2 < x < π 0 en otro caso , se pide: (a) (0.75 puntos) Hallar C para que f sea una función de densidad. Solución:∫ ∞ −∞ f(x)dx = ∫ π/2 −∞ 0dx+ ∫ π π/2 C sin(x)dx+ ∫ ∞ π 0dx = −C[cos(x)]ππ/2 = C = 1. (b) (0.75 puntos) Hallar su función de distribución. Solución: Si x < π/2 F (x) = 0, Si π/2 ≤ x ≤ π F (x) = ∫ x π/2 sin(u)du = −[cos(u)]xπ/2 = − cos(x), Si x > π F (x) = 1. (c) (0.75 puntos) Hallar su esperanza. Solución: E(X) = ∫ ∞ −∞ xf(x)dx = ∫ π π/2 x sin(x)dx = −[x cos(x)]ππ/2 + [sin(x)] π π/2 = π − 1. (d) (0.75 puntos) Calcular la probabilidad de que X tome valores menores que 2. Solución: P (X < 2) = ∫ 2 −∞ f(x)dx = ∫ 2 π/2 sin(x)dx = −[cos(x)]2π/2 = − cos(2) + 0 ≈ 0.416. Otra forma: P (X < 2) = P (X ≤ 2) = F (2) = − cos(2) ≈ 0.416. Página 2 de 4 Examen final de julio, bloque no 1. – 10-07-2012 (cont.) (e) (0.75 puntos) Sabiendo que X es inferior a 2, calcular la probabilidad de que sea inferior a 1.8. Solución: P (X < 1.8|X < 2) = P (X < 1.8 ∩X < 2) P (X < 2) = P (X < 1.8) P (X < 2) ≈ ∫ 1.8 π/2 sin(x)dx 0.416 ≈ 0.546. 6. (2 puntos) En un control de calidad de una empresa farmacéutica se muestrearon al azar 50 vacunas de un lote de 1000 unidades, obteniéndose que 7 de ellas estaban contaminadas (C = “vacuna contaminada”; V = “vacuna válida”; C∗= “vacuna clasificada como contaminada”; V ∗ = “vacuna clasificada como válida”). Del test de calidad que se realiza para determinar la contaminación de una vacuna, se sabe que tiene un 10% de falsos positivos y un 4% de falsos negativos. Se pide: (a) (0.5 puntos) Calcular la probabilidad de que una vacuna tomada al azar del lote de 1000 unidades esté contaminada, suponiendo que la proporción de vacunas contami- nadas en la muestra es representativa del lote completo. Solución: P (C) = 7 50 = 0.14. (b) (0.75 puntos) Calcular la probabilidad de que una vacuna tomada al azar del lote sea clasificada como contaminada Solución: P (C∗) = P (C∗|C)P (C)+P (C∗|V )P (V ) = (1− 0.04)0.14+0.1(1− 0.14) = 0.2204. (c) (0.75 puntos) Si la prueba ha clasificado una vacuna tomada al azar como válida, calcular la probabilidad de que salga a la calle estando realmente contaminada. Solución: P (C|V ∗) = P (V ∗ ∩ C) P (V ∗) = P (V ∗|C)P (C) 1− P (C∗) = 0.04 · 0.14 1− 0.2204 ≈ 0.00718. 7. (1.5 puntos) Se estima que en Madrid la temperatura media en el mes de julio sigue una distribución normal con media µ =26oC y desviación t́ıpica σ =5oC. Se pide: (a) (0.75 puntos) Calcular la probabilidad de que en el año 2012 la temperatura media del mes de julio supere los 35oC. Solución: P (X > 35) = P ( X − 26 5 > 35− 26 5 ) = P (U > 1.8) = 1−P (U ≤ 1.8) ≈ 0.03593. (b) (0.75 puntos) Calcular la probabilidad de que la temperatura esté dentro del intervalo (µ− 3σ, µ+ 3σ). Página 3 de 4 Examen final de julio, bloque no 1. – 10-07-2012 (cont.) Solución: P (µ−3σ < X < µ+3σ) = P (−3 < U < 3) = Φ(3)−Φ(−3) = 2Φ(3)−1 ≈ 0.9973. Página 4 de 4 ESTADÍSTICA. 1ER CURSO. TITULACIONES DE GRADO DE LA ETSI MINAS Examen final de junio, bloque nº 1 06-06-2012 Apellidos y nombre: Grupo: INSTRUCCIONES: � La duración de esta prueba es de 50 minutos. � Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reservado para ello en la propia hoja de enunciado. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. � Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. � Los teléfonos móviles deben estar apagados y guardados. 1. (0.75 puntos) Dado un espacio muestral Ω infinito no numerable y acotado, se dice que P sigue una distribución al azar o equiprobable si la probabilidad de obtener un determinado suceso A es: 2. (0.75 puntos) Anualmente, el número de incendios forestales de superficie quemada superior a 2000 hectáreas ocurridos en España viene dado por una Va con función de masa de Poisson, ( ) ...,2,1,0 ! == − x x exf xλλ de parámetro λ = 5. Calcular la probabilidad de que en un año haya al menos dos incendios forestales de más de 2000 ha de superficie quemada. 3. (0.5 puntos) Dos sucesos incompatibles son necesariamente (rodear con un círculo): a) Independientes. b) Dependientes. c) Complementarios. d) Idénticos. ��� � 2� � 1 ��� � 0� ��� � 1� � 1 ��0� ��1� � 1 � � 5�0! � � 5� 1!� 1 � � 5� � � 0.9596 P�A� � med�A�med�Ω� 4. (0.75 puntos) Un dado de roll de diez caras tiene cuatro caras con el nº 1, tres caras con el nº 2, dos caras con el nº 3 y una única cara con el nº 4. Se lanza el dado dos veces. Calcular la probabilidad de que la suma de las dos tiradas sea igual a 5. 5. (0.75 puntos) En el experimento del ejercicio anterior, si se sabe que la primera tirada ha salido un 2, calcular la probabilidad de que la suma sea mayor que 4. 6. (0.75 puntos) Sea una Va X con la función de densidad ( ) [ ] [ ] ∉ ∈+ = − 2,10 2,12 xsi xsiBxAx xf y sea su esperanza E(X)=1.6402. ¿Qué valor deben tomar A y B para que f sea una función de densidad de probabilidad? � ������ � � ��� + "���� � � � #$ $ % 12 + 1& + " %2 1 2& � 1 � ������� � � ��� � + "� ��� � � � #$ $ ln�2� + " %83 1 3& � 1.6402 Resolviendo el sistema resulta " � 1 y � � 1. ��, > 4 | 1ª 2� � ��, > 4,1ª 2���1ª 2� � ��22,33� + ��22,43� ��1ª 2� � 0.3 × 0.2 + 0.3 × 0.1 0.3� 0.3 ��1� � 410 � 0.4, ��2� � 3 10 � 0.3, ��3� � 2 10 � 0.2, � �4� � 1 10 � 0.1 ��, � 5� � ��21,43 ∪ 24,13 ∪ 22,33 ∪ 23,23�� ��21,43� + ��24,13� + ��22,33� + ��23,23�� 0.4 × 0.1 + 0.1 × 0.4 + 0.3 × 0.2 + 0.2 × 0.3 � 0.2 7. (0.75 puntos) Enunciar brevemente los dos axiomas de la probabilidad. 8. Varios test de inteligencia sobre una determinada población dieron un cociente intelectual (CI) que sigue una ley normal con media 110 y desviación típica 20. a) (1 punto) De acuerdo a los criterios diagnósticos de los trastornos mentales del DSM-IV-TR, determinar la probabilidad de que unapersona elegida al azar tenga algún tipo de retraso mental (CI<70). b) (1 punto) ¿Qué intervalo centrado en 110 contendría al 50% de la población? ��110 6 < 89 < 110 + 6� � � %110 6 11020 < : < 110 + 6 110 20 & � � ; 620 < : < 6 20< � Φ; 6 20< Φ; 6 20< � Φ; 6 20< >1 Φ; 6 20<? � 2Φ; 620< 1 � 0.5 Φ; 620< � 0.75 → 6 20 � 0.67 → 6 � 13.4 ��89 < 70� � � %89 11020 < 70 110 20 & � ��: < 2� � 1 ��: < 2� � 1 Φ�2�� 1 0.97725 � 0.02275 ��∪ �B� �C���B� 1) Si �B son excluyentes D�B ∩ �F � ∅H: 2) ��Ω� � 1 9. Sea X la variable aleatoria del tiempo diario (horas) que pasa una persona viendo la televisión, cuyo modelo de distribución no se conoce, pero sí se conoce E(X)=2 y Var(X)=9. a) (1 punto) Hallar la probabilidad de que al cabo de un año una persona haya visto la televisión durante más de 600 horas. 10. La Va X tiene densidad ( ) ( ) ( ) ( ) −∉ −∈ = ππ πππ ,0 ,21 xsi xsi xf a) (1 punto) Hallar su función de distribución y su función de cuantiles. I��� � 0 JK � ≤ M I��� � � ������ �N $ � 12M �� � 1 2 + � 2M JK � ∈ P M, MQ N R I��� � 1 JK � � M I��� � 12 + � 2M � S → � � M�2S 1� JK S ∈ P0,1Q Función de distribución: Función de cuantiles: �T �C�B UV� BW� X��T� �CX��B� � 365 × 2 � 730 ���T > 700� � � %�T 730√1095 > 700 730 √1095 & � ��: > 0.91� � ��: < 0.91�� 0.81859 Supuestas las �B independientes: Z6[��T� � ∑Z6[��B� � 365 × 3 � 1095 Por el teorema central del límite: b) (1 punto) Calcular su esperanza y su varianza. X��� � � ������� �#$ $ � �2M R R �� � 0 X�� � � � � ������ �#$ $ � � 2M R R �� � M 3 Z6[��� � X�� � �X���� � M 3 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Evaluación continua, prueba no 1. Mañana. 22-03-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.4 puntos) Si A y B no pueden suceder a la vez entonces P (AB) = Solución: 0 2. (0.4 puntos) Si A y B no pueden suceder a la vez entonces P (A | B) = Solución: 0 3. (0.4 puntos) Expresado en función de F (x), P (a < X ≤ b) = Solución: F (b)− F (a) 4. (0.4 puntos) Si X es continua con densidad f (x) entonces c ∫ R f (x) dx = Solución: c 5. (0.4 puntos) Si X es continua con densidad f (x) entonces E (g (X)) = Página 1 de 4 Evaluación continua, prueba no 1. Mañana. – 22-03-2012 (cont.) Solución: ∫ ∞ −∞ g(x)f(x)dx 6. (0.4 puntos) Si X es una variable cualquiera se define V ar (X) = Solución: E((X − E(X))2) 7. (0.4 puntos) Si X es una variable cualquiera entonces V ar (a+ bX) = Solución: b2V ar(X) 8. (0.4 puntos) Si Xi son cualesquiera con esperanzas E (Xi) = µi entonces E ( ∑ aiXi + c) = Solución: ∑ aiµi + c 9. (0.4 puntos) Si X es cualquiera con E (X) = µ y V ar (X) = σ2 entonces V ar ( X−µ σ ) = Solución: 1 10. (0.4 puntos) Si Xi son independientes con esperanzas E (Xi) = µ y V ar (Xi) = σ 2 y si n es grande entonces P ( ∑n i=1Xi ≤ a) ≈ Solución: ϕ ( a− nµ σ √ n ) Página 2 de 4 Evaluación continua, prueba no 1. Mañana. – 22-03-2012 (cont.) 11. (2 puntos) En la sección de pronóstico meteorológico de un informativo de televisión el lo- cutor dice lo siguiente: “la probabilidad de que llueva el sábado es del 50% y la probabilidad de que llueva el domingo también es del 50% por lo tanto la probabilidad de que llueva el fin de semana es del 100%”. ¿Es correcta la afirmación del locutor? Si no lo es, ¿Cuál es la probabilidad de que llueva en algún momento del fin de semana? Nota: se supondrá que la proposición “que llueva el fin de semana” es cierta si llueve el sábado o el domingo y que los sucesos llover el domingo y llover el sábado son independientes. Solución: Si se denota: A = “que llueva el sábado” y B = “que llueva el domingo” entonces A ∪B = “que llueva el fin de semana”. En consecuencia: P (A ∪B) = P (A) + P (B)− P (AB) = 0.5 + 0.5− 0.25 = 0.75. Por lo tanto la afirmación del locutor es incorrecta, siendo la probabilidad de que llueva en algún momento del fin de semana igual a 0.75. 12. (2 puntos) Sea X una variable aleatoria discreta y sea f la función definida por f(x) = { k 2|x| si x ∈ {−2,−1, 1, 2} 0 si x /∈ {−2,−1, 1, 2} , k ∈ lR. (a) (0.5 puntos) ¿Qué valor debe tomar k para que f sea la función de masa de X? Solución: Supóngase que se denota por x1 = −2, x2 = −1, x3 = 1, x4 = 2 a los cuatro puntos del conjunto S = {−2,−1, 1, 2} en los que f toma valores no nulos. Entonces: 4∑ i=1 f(xi) = 3 2 k = 1 ⇒ k = 2 3 ≈ 0.667. (b) (1.5 puntos) Si F es la función de distribución de X, ¿cuánto vale F (0)? Dibújese una gráfica de la función F en el intervalo [−3, 3]. Solución: F (0) = P (X ≤ 0) = f(−2) + f(−1) = 3 4 k = 1 2 = 0.500. F(x) x−2 −1 1/6 −3 0 1 5/6 1 1/2 2 3 Figura 1: Dibujo de la función F en el intervalo [−3, 3] Página 3 de 4 Evaluación continua, prueba no 1. Mañana. – 22-03-2012 (cont.) 13. (2 puntos) Un oleoducto se forma uniendo tramos de tubeŕıa cuya longitud Xi vaŕıa aleato- riamente según una distribución desconocida con E(Xi)=5m y √ V ar(Xi)=0.5m. Calcule, aproximadamente, la probabilidad de que uniendo 1000 tramos de manera independiente se complete una longitud L = ∑1000 i=1 Xi superior a 5010m. Solución: E(Xi) = 5m, √ Var(Xi) = 0.5m. Aplicando el teorema central del ĺımite, L = ∑1000 i=1 Xi se puede aproximar mediante una variable aleatoria normal con E(L) = 1000 × 5 = 5000m y √ Var(L) = √ 1000× 0.5 ≈ 15.811m. Entonces: P (L > 5010) ≈ P (U > 0.63246) = 1− Φ(0.63246) ≈ 0.264. Página 4 de 4 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Evaluación continua, prueba no 1. Tarde. 22-03-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.4 puntos) Si A y B no pueden suceder a la vez entonces P (A ∪B) = Solución: P (A) + P (B) 2. (0.4 puntos) Si A y B pueden suceder a la vez entonces P (A ∪B) = Solución: P (A) + P (B)− P (AB) 3. (0.4 puntos) Si A y B son independientes entonces, expresado en función de P (A) y P (B), P (AcB) = Solución: (1− P (A))P (B) 4. (0.4 puntos) La función de distribución de X se define F (x) = Solución: P (X ≤ x) 5. (0.4 puntos) Si X es continua, expresado en función de la densidad f (x), P (a < X < b) = Página 1 de 4 Evaluación continua, prueba no 1. Tarde. – 22-03-2012 (cont.) Solución: ∫ b a f(x)dx 6. (0.4 puntos) Si X es continua con densidad f (x) se define E (X) = Solución: ∫ ∞ −∞ xf(x)dx 7. (0.4 puntos) Si X tiene E (X) = µ y V ar (X) = σ2 entonces E ( X2 ) = Solución: σ2 + µ2 8. (0.4 puntos) Si X es una variable cualquiera entonces E (a+ bX) = Solución: a+ bE(X) 9. (0.4 puntos) SiXi son independientes con varianzas V ar (Xi) = σ 2 i entonces V ar ( ∑ aiXi + c) = Solución: ∑ a2iσ 2 i 10. (0.4 puntos) Si X es cualquiera con E (X) = µ y V ar (X) = σ2 entonces E ( X−µ σ ) = Solución: 0 Página 2 de 4 Evaluación continua, prueba no 1. Tarde. – 22-03-2012 (cont.) 11. (2 puntos)Se desea estudiar la validez de una nueva prueba cĺınica para la detección de cierta enfermedad, cuya prevalencia en la población bajo estudio es de un 10%. La prueba puede dar positivo o negativo. En el primer caso el individuo se clasifica como enfermo (E∗) y en el segundo como sano (S∗). Para la prueba se conocen los porcentajes de falsos positivos (la prueba da positivo estando el individuo sano) y de falsos negativos (la prueba da negativo estando el individuo enfermo), que resultan ser 4% y 15% respectivamente. Se pide calcular los valores predictivos positivo (probabilidad de que un individuo esté enfermo (E) si la prueba ha dado positivo) y negativo (probabilidad de que el individuo esté sano (S) si la prueba ha dado negativo) de la prueba. Solución: Prevalencia = P (E) = 0.1. Falso positivo = P (E∗|S) = 0.04. Falso negativo = P (S∗|E) = 0.15. Valor predictivo positivo: P (E|E∗) = P (E ∗|E)P (E) P (E∗|E)P (E) + P (E∗|S)P (S) = (1− 0.15)0.1 (1− 0.15)0.1 + 0.04(1− 0.1) ≈ 0.702. Valor predictivo negativo: P (S|S∗) = P (S ∗|S)P (S) P (S∗|S)P (S) + P (S∗|E)P (E) = (1− 0.04)(1− 0.1 (1− 0.04)(1− 0.1) + 0.15(0.1) ≈ 0.983. 12. (2 puntos) Dada la función f : R → R tal que f(x) = k/x si x ∈ (1, 2) y f(x) = 0 si x /∈ (1, 2), se pide contestar a las dos preguntas siguientes. (a) (1 punto) Determinar el valor de k para que f sea una función de densidad de proba- bilidad. Solución: ∫ 2 1 k x dx = k[lnx]21 = k ln 2 = 1 ⇒ k = 1 ln 2 ≈ 1.443. (b) (1 punto) Si X es una variable aleatoria cuya función de densidad es f , determinar el cuantil de orden 0.95 (x0.95, el número real tal que F (x0.95) = 0.95). Solución: F (x0.95) = P (X ≤ x0.95) = 1 ln 2 ∫ x0.95 1 1 u du = 1 ln 2 lnx0.95 = 0.95 ⇒ x0.95 = 2 0.95 ≈ 1.932. 13. (2 puntos) El volumen de ventas diarias de una empresa (expresado en miles de euros) es una variable aleatoria X con E(X) = 100 Ke y Var(X) = 4.1(Ke)2. Determinar, aproximadamente, la probabilidad de que a lo largo de un periodo de 100 d́ıas, el volumen de ventas supere 10005Ke, suponiendo que el volumen de ventas de cada d́ıa es independiente del de los restantes. Página 3 de 4 Evaluación continua, prueba no 1. Tarde. – 22-03-2012 (cont.) Solución: Xi = volumen de ventas diarias de una empresa. E(Xi) = 100 Ke, Var(Xi) = 4.1(Ke)2. Z = Volumen de ventas en un periodo de 100 d́ıas. Aplicando el teorema central del ĺımite, Z = ∑100 i=1Xi se puede aproximar mediante una variable aleatoria normal con E(Z) = 100× 100 = 10000 Ke y √ Var(Z) = √ 100× √ 4.1 ≈ 20.249 Ke. Entonces: P (Z > 10005) ≈ P (U > 0.247) = 1− Φ(0.247) ≈ 0.401. Página 4 de 4 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Examen final de julio, bloque no 2. 10-07-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.5 puntos) Si (X1, X2, ..., Xn) es una muestra aleatoria de una Va X con E (X) = µ y V ar (X) = σ2, demuestre que V ar ( X ) = σ2/n Solución: Caṕıtulo 5, sección 5.3 2. (0.5 puntos) Si X tiene densidad exponencial de parámetro λ demuestre que X es insesgado para 1/λ Solución: Se sigue de que E (X) = 1/λ (vea el formulario) y E ( X ) = E (X). 3. (0.5 puntos) (cont.) ¿Cuánto vale su varianza? Solución: V ar ( X ) = 1 nλ2 ya que V ar ( X ) = V ar (X) n y (vea el formulario) V ar (X) = 1 λ2 4. (1.5 puntos) La Va X tiene densidad f (x) = { λ exp (−λ (x− θ)) si x > θ 0 si x ≤ θ Página 1 de 5 Examen final de julio, bloque no 2. – 10-07-2012 (cont.) para la cual es E (X) = θ + 1 λ V ar (X) = 1 λ2 Estime los parámetros λ y θ por el método de los momentos y calcule las estimaciones con la muestra (1, 7, 4).(con 1 decimal) Solución: V ar (X) = 1 λ2 λ = 1√ V ar (X) = 1√ E (X2)− (E (X))2 λ̂ = 1√ 1 n ∑ X2i − ( 1 n ∑ Xi )2 θ = E (X)− 1 λ θ̂ = 1 n ∑ Xi − √ 1 n ∑ X2i − ( 1 n ∑ Xi )2 Con la muestra (1, 7, 4) es 1 n ∑ xi = (1 + 7 + 4) /3 = 4 1 n ∑ x2i = ( 12 + 72 + 42 ) /3 = 22 y resultan las estimaciones λ̂ = 1√ 22− 42 ≈ 0.4 θ̂ = 4− √ 22− 42 ≈ 1.6 5. (0.5 puntos) T1 y T2 son estimadores insesgados de la magnitud µ. Compruebe que el esti- mador combinado T = αT1 + (1− α)T2 es también insesgado. Solución: E (T1) = E (T2) = µ pues son insesgados. Por su parte (esperanza de una combinación lineal) E (T ) = αE (T1) + (1− α)E (T2) y resulta E (T ) = αµ+ (1− α)µ = µ Página 2 de 5 Examen final de julio, bloque no 2. – 10-07-2012 (cont.) 6. (1 punto) (cont.) Los estimadores tienen distinta precisión: V ar (T1) = 1 y V ar (T2) = 2 y son independientes. Halle el valor del peso α que hace mı́nima V ar (T ) y calcule dicho valor mı́nimo. Solución: Varianza de una combinación lineal de Vas independientes: V ar (T ) = α2V ar (T1) + (1− α)2 V ar (T2) = α2 + 2 (1− α)2 que es una función de α continua y diferenciable (parábola positiva). Para hallar el α que la hace mı́nima d dα V ar (T ) = α− 2 (1− α) = 0 → α = 2/3 y el valor mı́nimo es V ar (T ) = ( 2 3 )2 + 2 ( 1 3 )2 = 6 9 = 2 3 7. (0.5 puntos) (cont.) Si T1 es N (µ, 1) y T2 es N ( µ, √ 2 ) , y son independientes, ¿cuál es la distribución del estimador T anterior (el de varianza mı́nima)? Solución: T (combinación lineal de Vas normales independientes) es N ( µ, √ 2 3 ) . 8. (2 puntos) (cont.) Construya un intervalo de confianza 1−α para µ. Calcúlelo si se dispone de dos medidas particulares t1 = 10 y t2 = 8, con 1− α = 0.95. Solución: Como T − µ√ 2/3 ∼ N (0, 1) es P ( −u1−α/2 < T − µ√ 2/3 < u1−α/2 ) = 1− α y despejando µ P ( T − u1−α/2 √ 2 3 < µ < T + u1−α/2 √ 2 3 ) = 1− α La estimación de µ es t = 2 3 × 10 + 1 3 × 8 ≈ 9.3 Página 3 de 5 Examen final de julio, bloque no 2. – 10-07-2012 (cont.) y el error 1− α = 0.95 u1−α/2 = u0.975 = 1.96 ε = u1−α/2 √ 2 3 = 1.96× √ 2 3 = 1.6 9. (1.5 puntos) La resistencia a la compresión (en Nmm−2), en probetas de hormigón de 28 d́ıas de curación se modeliza como una variable aleatoria X ∼ N (µ, σ). Con una muestra de 30 probetas de X se ha obtenido ∑ xi = 976.5 y ∑ x2i = 32021. Estime un ĺımite x tal que P (X > x) ≥ 0.95 con una confianza del 95% (es decir, al menos el 95% del hormigón colocado en obra posee, a los 28 d́ıas, una resistencia igual o mayor que x con una confianza del 95%) (con 2 decimales). Solución: El ĺımite inferior buscado (de tolerancia) es de la forma x = x− k × s donde k = 2.220 en la tabla VI. x = 976.5 30 y s = √√√√ 1 n− 1 ( n∑ i=1 X2i − 1 n (∑ Xi )2) = √ 1 29 ( 32021− 1 30 × 976.52 ) = 2.852252588 x− k × s = 976.5 30 − 2.220× 2.852252588 ≈ 26.22 Nmm−2 10. (1.5 puntos) Para estimar la proporción p de piezas defectuosas en una linea de producción se examina un lote de 1000 resultando 10 defectuosas. Calcule un intervalo aproximado para p de confianza 95%.(redondeado a 3 decimales). Solución: El intervalo es (sección 6.4 del Caṕıtulo 6) p ∈ ( x± u1−α/2 √ x (1− x) n ) 1− α = 0.95 u1−α/2 = u0.975 = 1.96 x = 10 1000 = 0.01 ε = 1.96× √ 0.01× 0.99 1000 ≈ 6.1× 10−3 Página 4 de 5 Examen final de julio, bloque no 2. – 10-07-2012 (cont.) y el intervalo resulta p ∈ (0.004, 0.016) con una confianza del 95%. Página 5 de 5 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Examen final de junio, bloque no 2. 06-06-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciadode la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. Nota: En las cuestiones 1 a 4 (X1, X2, ..., Xn) es una muestra aleatoria de una Va X con E (X) = µ y V ar (X) = σ2. 1. (0.5 puntos) ¿Cuánto vale V ar ( X ) ? Solución: σ2 n 2. (0.5 puntos) ¿Cuánto vale E (( X )2) ? Solución: E (( X )2) = V ar ( X ) + ( E ( X ))2 = σ2 n + µ2 3. (0.5 puntos) ¿Cuánto vale E ( 1 n ∑( Xi −X )2) ? Solución: n− 1 n σ2 4. (1.5 puntos) A partir de la identidad (Xi − µ) = ( Xi −X ) + ( X − µ ) demuestre que ∑ (Xi − µ)2 = ∑( Xi −X )2 + n ( X − µ )2 Página 1 de 4 Examen final de junio, bloque no 2. – 06-06-2012 (cont.) Solución: Elevando al cuadrado: (Xi − µ)2 = ( Xi −X )2 + ( X − µ )2 + 2 ( Xi −X ) ( X − µ ) Sumando:∑ (Xi − µ)2 = ∑( Xi −X )2 + ∑( X − µ )2 + 2 ∑( Xi −X ) ( X − µ ) Pero∑( Xi −X ) ( X − µ ) = ( X − µ )∑( Xi −X ) = ( X − µ ) (∑ Xi − nX ) = 0 y resulta lo propuesto. 5. (0.5 puntos) Si T es un estad́ıstico tal que E (T ) = 2θ+1 forme a partir de él un estimador insesgado para θ Solución: T − 1 2 6. (0.5 puntos) Si X ∼ N (µ, σ) y n = 20 halle el número a P ( −a < X − µ S/ √ n < a ) = 0.95 Solución: La distribución de X−µ S/ √ n es Student(19) aśı que a = t0.975 (19) = 2.0930 7. (0.5 puntos) (cont.) Si x = 10 y s = 0.1, dé un intervalo para µ Solución: Despejando µ queda P ( X − a S√ n < µ < X + a S√ n ) = 0.95 y sustituyendo µ ∈ ( 10− 2.0930× 0.1√ 20 , 10 + 2.0930× 0.1√ 20 ) = (9.953, 10.047) con una confianza del 95%. Página 2 de 4 Examen final de junio, bloque no 2. – 06-06-2012 (cont.) 8. (0.5 puntos) Si X ∼ N (µ, σ) y n = 20 halle el número a P ( (n− 1)S2 σ2 < a ) = 0.95 Solución: La distribución de (n−1)S 2 σ2 es ji-cuadrado(19) aśı que a = χ20.95 (19) = 30.1435 9. (0.5 puntos) (cont.) Si x = 10 y s = 0.1 dé un ĺımite inferior para σ Solución: Despejando σ queda P ( S √ n− 1 a < σ ) = 0.95 y sustituyendo σ > 0.1× √ 19 30.1435 = 0.0794 con una confianza del 95%. 10. (0.5 puntos) A partir de una muestra (x1, x2, .., xn) de una Va X con función de densidad (de Pareto) f (x) = a xa+1 x > 1 cuya esperanza es E (X) = a a− 1 a > 1 hallar la estimación de a por el método de los momentos. Solución: Estimando E (X) por x y denotando â la estimación de a x = â â− 1 → â = x x− 1 11. (1.5 puntos) (cont.) Hallar la estimación de a por el método de máxima verosimilitud. Solución: La función de verosimilitud (densidad de probabilidad de la muestra como función de a) es L (a) = ∏ f (xi) = ∏ a xa+1i = an ∏ 1 xa+1i Página 3 de 4 Examen final de junio, bloque no 2. – 06-06-2012 (cont.) y hay que hallar el a que la hace máxima. Es más cómodo maximizar lnL (a) lnL (a) = n ln a− (a+ 1) ∑ lnxi derivando e igualando a cero d lnL (a) da = n a − ∑ lnxi = 0 → â = n∑ lnxi que corresponde a un máximo pues d2 lnL (a) da2 = − n a2 < 0 12. (0.5 puntos) (cont.) Hallar la estimación de E (X) por el método de los momentos. Solución: La estimación es x 13. (0.5 puntos) (cont.) Hallar la estimación de E (X) por el método de máxima verosimilitud. Solución: Por la propiedad de invariación la estimación es â â− 1 donde â es la estimación de máxima verosimilitud de a. 14. (1.5 puntos) (cont.) Calcular las estimaciones anteriores con la muestra (1.11, 1.47, 1.48, 1.49, 1.56, 1.05, 13.38, 1.83, 4.51, 1.20). Solución: La estimación de E (X) por el método de los momentos es x = 1.11 + 1.47 + 1.48 + 1.49 + 1.56 + 1.05 + 13.38 + 1.83 + 4.51 + 1.20 10 = 2.908 La estimación de a por el método de los momentos es â = x x− 1 = 2.908 2.908− 1 = 1.5241 La estimación de a por el método de máxima verosimilitud es â = n∑ lnxi = 10 6.6606 = 1.5014 La estimación de E (X) por el método de máxima verosimilitud es â â− 1 = 1.5014 1.5014− 1 = 2.9944 Página 4 de 4 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Evaluación continua, prueba no 2. Mañana. 03-05-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.5 puntos) Demuestre que para una muestra aleatoria de tamaño n, V ar ( X ) = V ar(X)n . Solución: V ar ( X ) = V ar ( 1 n n∑ i=1 Xi ) = 1 n2 n∑ i=1 V ar(Xi) = 1 n V ar(X). 2. (0.5 puntos) Dados dos estimadores insesgados, T1 y T2, de un cierto parámetro θ y tales que V ar(T1) > V ar(T2). ¿Cuál de los dos tiene un error cuadrático medio más pequeño?, ¿cuánto vale? Solución: T2, V ar(T2). 3. (0.5 puntos) Un estimador T converge en probabilidad a θ si se cumple: Solución: 1) ĺım n→∞ E(T ) = θ, 2) ĺım n→∞ V ar(T ) = 0, n = tamaño de la muestra aleatoria. 4. (0.5 puntos) Si la estimación de Máxima Verosimilitud de un cierto parámetro p es p̂, ¿cuál es la estimación de Máxima Verosimilitud de p2 + 3p? Solución: p̂2 + 3p̂. Página 1 de 4 Evaluación continua, prueba no 2. Mañana. – 03-05-2012 (cont.) 5. (0.5 puntos) Dada una muestra de n elementos, ¿un intervalo de confianza del 99% tiene mayor o menor longitud que uno del 95%? Solución: Mayor. 6. (0.5 puntos) Si deseamos estimar un intervalo de confianza para la media de una distribu- ción normal con σ desconocida, ¿debemos usar la distribución de Student o la Ji-cuadrado? Solución: La de Student. 7. (0.5 puntos) Si [a, b] es un intervalo de confianza 1−α para un parámetro θ de una variable aleatoria X, ¿qué relación hay entre [a, b] y θ? Solución: θ ∈ [a, b] con confianza 1− α ó (equivalente) P (A < θ < B) = 1− α A,B : estad́ısticos cuyas realizaciones son, respectivamente, a y b. 8. (1.5 puntos) Una variable aleatoria X tiene una función de distribución F (x) = 1 − e−λx (x > 0). El parámetro λ es desconocido aunque se sabe que solo puede valer 0.75 ó 2. Una muestra de tamaño 1 ha resultado en un valor comprendido entre 1.7 y 2.6. Estime el parámetro usando el principio de máxima verosimilitud. Solución: La función de verosimilitud es: L(λ|x) = P (1.7 < X < 2.6) = F (2.6)− F (1.7) = e−1.7λ − e−2.6λ. Por otro lado L(0.75|x) = e−1.7(0.75)− e−2.6(0.75) ≈ 0.137 y L(2|x) = e−1.7(2)− e−2.6(2) ≈ 0.028, de donde se deduce que L(0.75|x) > L(2|x) y la estimación del parámetro es λ̂ = 0.75 9. (2 puntos) Sea una Va X de Poisson de parámetro λ. (a) (1.5 puntos) Halle el estimador MV de λ con una muestra de tamaño n. Página 2 de 4 Evaluación continua, prueba no 2. Mañana. – 03-05-2012 (cont.) Solución: L(λ|x) = ∏( e−λ λxi xi! ) = e−nλλ ∑ xi (∏ 1 xi! ) lnL(λ|x) = −nλ+ ∑ xi lnλ+ ln (∏ 1 xi! ) d lnL dλ (λ|x) = −n+ nx λ = 0 λ̂ = x que corresponde a un máximo pues d2 lnL dλ2 (λ|x) = −nx λ2 < 0 ∀λ El estimador de máxima verosimilitud es X. (b) (0.5 puntos) Halle el estimador de MV de 1λ . Solución: Si el estimador de MV de λ es X entonces, aplicando el principio de invariación, el de 1/λ es 1/X. 10. (3 puntos) En un examen, evaluado de 0 a 10 puntos, han tomado parte todos los alumnos de una clase. Se sabe que la distribución de las calificaciones del examen sigue una normal N(µ, σ) con parámetros µ y σ desconocidos. El profesor corrige los 10 primeros exámenes y comprueba que obtienen el siguiente resultado: (3.5, 4, 6.5, 3, 7, 1.5, 4, 4.5, 9, 5). Se pide: (a) (1 punto) Estimar la nota media, µ, usando la media muestral, y la desviación t́ıpica, σ, usando la desviación t́ıpica muestral. Solución: x =∑10 i=1 xi 10 = 4.8 s = [∑10 i=1(xi − x)2 9 ] 1 2 = 1 9 10∑ i=1 x2i − 1 10 ( 10∑ i=1 xi )2 12 ≈ 2.176 (b) (1 punto) Determinar intervalos de confianza del 95% para la nota media y la desvia- ción t́ıpica. Solución: µ ∈ ( x− t0.975(9) s√ 10 , x+ t0.975(9) s√ 10 ) = ( 4.8− 2.26222.1756√ 10 , 4.8 + 2.2622 2.1756√ 10 ) ≈ (3.24, 6.36) Página 3 de 4 Evaluación continua, prueba no 2. Mañana. – 03-05-2012 (cont.) σ ∈ ( s √ n− 1 χ21−α/2 , s √ n− 1 χ2α/2 ) = ( 2.1756 √ 9 χ20.975(9) , 2. 175 6 √ 9 χ20.025(9) ) = ( 2.175 6 √ 9 19.0228 , 2.175 6 √ 9 2.7004 ) ≈ (1.497, 3.972) (c) (1 punto) Determinar un intervalo de tolerancia para la calificación del examen de contenido 0.95 y confianza también 0.95. Interpretar el resultado. Solución: p = 0.95, 1− α = 0.95, n = 10. Entonces k = 3.393. El intervalo de tolerancia es entonces (x− ks, x+ ks) = (4.8− 3.393 · 2.1756, 4.8 + 3.393 · 2.1756) ≈ (−2.582, 12.182) El resultado nos diŕıa que con una confianza del 95%, el 95% de los alumnos tendrán una nota entre −2.58 y 12.18. Pero estos ĺımites sobrepasan las notas máxima y mı́nima posibles y, por tanto, no obtenemos una información relevante. La muestra no aporta ninguna información adicional sobre algo que ya sab́ıamos sin necesidad de corregir ningún examen: más del 95% (de hecho el 100%) de las notas están en [0, 10] y por lo tanto en [−2.58, 12.18]. Página 4 de 4 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Evaluación continua, prueba no 2. Tarde. 03-05-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.5 puntos) Una muestra aleatoria simple de tamaño n = 5 de una variable aleatoria X es: Solución: X = (X1, X2, X3, X4, X5) , donde las Xi son idénticas a X e independientes. 2. (0.5 puntos) Demuestre que E(X) = E(X). Solución: E(X) = E ( 1 n n∑ i=1 Xi ) = 1 n n∑ i=1 E(Xi) = 1 n n∑ i=1 E(X) = n n E(X) = E(X). 3. (0.5 puntos) Un estimador T es insesgado para el parámetro θ si E(T − θ) = Solución: 0. 4. (0.5 puntos) Una cierta distribución de probabilidad contiene tres parámetros. Tomamos una muestra de n elementos y queremos estimar dichos parámetros en función de los re- sultados de la muestra. Para ello usamos el método de los momentos. ¿Cuántos momentos debemos calcular? Página 1 de 4 Evaluación continua, prueba no 2. Tarde. – 03-05-2012 (cont.) Solución: Tres. 5. (0.5 puntos) Si deseamos estimar un intervalo de confianza para la desviación t́ıpica de una distribución normal, ¿debemos usar la distribución de Student o la Ji-cuadrado? Solución: La Ji-cuadrado. 6. (0.5 puntos) ¿Qué tamaño de muestra se necesita para estimar, con confianza 0.95, la media de una variable aleatoria normal de σ = 0.2 con un error menor que 0.01? Solución: n = (u0.975σ ε )2 = ( 1.96(0.2) 0.01 )2 ≈ 1536.6 ⇒ n = 1537. 7. (0.5 puntos) Si [a, b] es un intervalo de tolerancia con contenido p y confianza 1 − α para X, ¿qué relación hay entre [a, b] y X? Solución: P (a < X < b) ≥ p con confianza 1−α ó (equivalente) P (P (A < X < B) ≥ p) = 1−α. A,B : estad́ısticos cuyas realizaciones son, respectivamente, a y b. 8. (1.5 puntos) Una variable aleatoria X tiene función de masa de Poisson. El parámetro de la distribución, λ, es desconocido, aunque se sabe que solo puede ser igual a 2 ó 3. Una muestra de tamaño 2 de X ha resultado x = (1, 3). Estime λ usando el principio de máxima verosimilitud. Solución: La función de verosimilitud es: L(λ|x) = e−λλ x1 x1! e−λ λx2 x2! = e−2λ λ4 6 . Por otro lado L(2|x) = 246 e −2(2) ≈ 0.049 y L(3|x) = 346 e −2(3) ≈ 0.033, de donde se deduce que L(2|x) > L(3|x) y la estimación del parámetro es λ̂ = 2. Página 2 de 4 Evaluación continua, prueba no 2. Tarde. – 03-05-2012 (cont.) 9. (2 puntos) La variable X tiene una función de densidad f (x) = x σ2 e ( − x 2 2σ2 ) x > 0 (de Rayleigh) y su esperanza es E (X) = σ √ π 2 . Se pide: (a) (1.5 puntos) Hallar la estimación de máxima verosimilitud de σ con una muestra (x1, x2, ..., xn) . Solución: L (σ|x) = ∏ f (xi) = ∏ xi σ2 exp ( − x 2 i 2σ2 ) = 1 σ2n exp ( − ∑ x2i 2σ2 )∏ xi lnL (σ|x) = −2n lnσ − ∑ x2i 2σ2 + ∑ lnxi igualando a cero la derivada d dσ lnL (σ|x) = −2n σ + ∑ x2i σ3 = 0 → σ̂ = √ 1 2n ∑ x2i la solución es σ̂ = √ 1 2n ∑ x2i que corresponde a un máximo pues( d2 dσ2 lnL (σ̂|x) ) = − 8n 2∑ x2i < 0 (b) (0.5 puntos) Hallar la estimación de máxima verosimilitud de E (X) Solución: La estimaciónde MV de E (X) es σ̂ √ π 2 . 10. (3 puntos) La resistencia a la rotura de cierto tipo de cables de acero, expresada en Kp, se supone que es una VA X ∼ N(µ, σ). Una muestra de 6 cables ha dado los valores (533, 538, 552, 539, 564, 541). Se pide: (a) (1 punto) Estimar la resistencia media, µ, usando la media muestral, y la desviación t́ıpica, σ, usando la desviación t́ıpica muestral. Solución: x = ∑6 i=1 xi 6 = 544.5 Kp s = [ 1 5 ( 6∑ i=1 (xi − x)2 )] 1 2 = [ 1 5 ( 6∑ i=1 x2i − 6x2 )] 1 2 = [ 1 5 (1779535− 1778881.5) ] 1 2 ≈ 11.432 Kp (b) (1 punto) Construir intervalos del 95% para la resistencia media y la desviación t́ıpica. Página 3 de 4 Evaluación continua, prueba no 2. Tarde. – 03-05-2012 (cont.) Solución: El intervalo del 95% para µ es x ± t0.975s/ √ n donde t0.975(5) = 2.5706 y resulta µ ∈ (532.502, 556.498) Kp. El intervalo del 95% para σ es ( s √ n−1 χ2 1−α/2 , s √ n−1 χ2 α/2 ) donde χ20.975(5) = 12.8325 y χ20.025(5) = 0.8312 y resulta σ ∈ (7.136, 28.039) Kp. (c) (1 punto) Estimar con una confianza del 99% la tensión que pueden soportar el 95% de los cables, es decir, el ĺımite inferior de tolerancia para la resistencia. Solución: Para hallar el ĺımite inferior de tolerancia con 1− α = 0.99, p = 0.95 y n = 6, en la tabla V se lee k = 5.406 y el ĺımite inferior es xL = 544.5− 5.406× 11.432 = 482.696 es decir, con una confianza del 99% P (X > 482) ≥ 0.95 o, lo que es lo mismo, el 95% de los cables tienen una resistencia mayor que 482 Kp. Página 4 de 4 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Examen final de julio, bloque no 3. 10-07-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.75 puntos) Suponga que b0+b1x es la recta de mı́nimos cuadrados que ajusta la muestra {(xi, yi)}, i = 1, 2, ..., n. Si ŷi = b0 + b1xi, demuestre que ∑n i=1(yi − ŷi) = 0. Solución: Si b0 y b1 son los coeficientes de la recta de mı́nimos cuadrados se debe verificar: ∂q ∂b0 (b0, b1) = n∑ i=1 (yi − ŷi) = 0 En donde q(b0, b1) = ∑n i=1(yi − (b0 + b1xi))2. 2. (0.75 puntos) Si en una muestra {(xi, yi)}, i = 1, 2, ..., n se verifica ∑n i=1(xi − x)2 = 0, ¿cómo están situados en el plano los puntos de la muestra? Solución: Están alineados según una recta vertical. 3. (0.75 puntos) En la ecuación XtXb = Xty, ¿Cuál es el vector Xty si se desea ajustar la parábola y = b0 + b1x+ b2x 2 a los datos {(xi, yi)} = {(1, 2), (3, 3), (5, 2), (2, 8)}? Solución: Xty = 1537 111 Página 1 de 5 Examen final de julio, bloqueno 3. – 10-07-2012 (cont.) 4. (0.5 puntos) ¿Cuáles son los valores posibles de r (coeficiente de correlación lineal)? Solución: r ∈ [−1, 1] 5. (0.75 puntos) Suponga que b0+b1x es la recta de mı́nimos cuadrados que ajusta la muestra {(xi, yi)}, i = 1, 2, ..., n. Si ŷi = b0+b1xi, ¿cuál es la relación entre ∑n i=1(yi−y)2, ∑n i=1(ŷi− y)2 y ∑n i=1(yi − ŷi)2. Solución: ∑ (yi − y)2 = ∑ (yi − ŷi)2 + ∑ (ŷi − y)2 6. (1.5 puntos) En un ajuste por mı́nimos cuadrados se utiliza una muestra de tamaño n = 20. Sabiendo que r = 0.9, b1 = 0.5 y ∑n i=1(xi−x)2 = 40, halle la cota de error de la estimación de µ(x) = β0 + β1x en x = x con una confianza del 99%. Utilice cuatro decimales en los cálculos. Solución: ε = t1−α 2 s √ 1 n + (x− x)2∑ (xi − x)2 = t1−α 2 s √ 1 n = 2.8784 · 0.3610 · √ 1 20 = 0.2324. Donde: s2 = 1 18 SSres = 1 18 ( 1 r2 − 1 ) SSex = 1 18 · 0.2346 · 0.52 · 40 = 0.1303, s = 0.3610. 7. (3.5 puntos) Se realiza un estudio de mercado del precio de la vivienda en una cierta zona. Para ello, se anotan los precios de las viviendas en venta y su superficie. El resultado es la siguiente tabla: Precio (miles de euros) 102 123 161 79 96 150 53 Superficie (metros cuadrados) 50 60 80 40 47 75 25 (a) (1.5 puntos) Ajuste el modelo lineal Y (x) = β0 + β1x + U a los datos de la muestra (siendo x la superficie e Y(x) el precio), estimando β0 y β1 por el método de mı́nimos cuadrados. Calcule el coeficiente de correlación del ajuste y estime la desviación t́ıpica de Y (x). Utilice cuatro cifras decimales en los cálculos. Página 2 de 5 Examen final de julio, bloque no 3. – 10-07-2012 (cont.) Solución: x = 53.8571, y = 109.1429, ∑ x2i = 22559, ∑ y2i = 92220, ∑ xiyi = 45607.∑ (xi−x)2 = ∑ x2i −nx2 = 2254.8571, ∑ (yi−y)2 = ∑ y2i −ny2 = 8834.8571∑ (xi − x)(yi − y) = ∑ xiyi − nxy = 4460.1429. b1 = (xi − x)(yi − y)∑ (xi − x)2 = 4460.1429 2254.8571 = 1.9780. b0 = y − b1x = 2.6126. s = √∑ (yi − y)2 − b21 ∑ (xi − x)2 n− 2 = √ 8834.8571− 1.97802 · 2254.8571 5 = 1.5978. r = ∑ (xi − x)(yi − y)√∑ (xi − x)2 ∑ (yi − y)2 = 4460.1429√ 8834.8571 · 2254.8571 = 0.9993. (b) (1 punto) Suponiendo un modelo normal, construya un intervalo de confianza del 95% para el precio de una vivienda de 85 metros cuadrados. Solución: El intervalo lo delimitan (b0 + b1x)± t1−α 2 s √ 1 n + (x− x)2∑ (xi − x)2 = 2.6126 + 1.9780 · 85± 2.5706 · 1.5978 √ 1 7 + (85− 53.8571)2 2254.8571 = 170.7439± 3.1091 miles de euros. donde hemos usado t1−α 2 (n− 2) = t0.975(5) = 2.5706. (c) (1 punto) Suponiendo un modelo normal, construya un intervalo de confianza del 95% para el precio por metro cuadrado de las viviendas situadas en la zona estudiada. Solución: El intervalo lo delimitan 1.9780± t1−α 2 s √ 1∑ (xi − x)2 = 10.2840± 2.5706 · 1.5978 √ 1 2254.8571 = 1.9780± 0.0865 miles de euros/m2 8. (1.5 puntos) Un serie de medidas para determinar la masa del bosón de Higgs (medida en GeV/c2, es decir Gigaelectron-voltios partido por la velocidad de la luz al cuadrado) arroja los siguientes valores: x = (112.4, 121.3, 121.4, 124.0, 130.0, 132.5, 133.3, 135.0, 155.0) Página 3 de 5 Examen final de julio, bloque no 3. – 10-07-2012 (cont.) (a) (1 punto) Calcule los cuartiles, los valores at́ıpicos de la muestra y estudie la simetŕıa. Solución: Con p = 0.25 es np+0.5 = 9 · 0.25+0.5 = 2+0.75, aśı que k = 2 y r = 0.75. Por lo tanto q1 = Q̂(0.25) = x2+0.75(x3−x2) = 121.3+0.75(121.4−121.3) = 121.374 GeV/c2. q2 = xm = x8 = 130 GeV/c 2. Con p = 0.75 es np+0.5 = 9 · 0.75+0.5 = 7+0.25, aśı que k = 7 y r = 0.25. Por lo tanto q3 = Q̂(0.75) = x7+0.25(x8−x7) = 133.3+0.25(135−133.3) = 133.725 GeV/c2. El coeficiente de simetŕıa es: q3 + q1 − 2xm q3 − q1 = 133.725 + 121.374− 2 · 130 133.725− 121.374 = −0.3968. La muestra es asimétrica a la izquierda (los datos a la izquierda de la mediana se extienden más lejos que a la derecha). El ĺımite inferior de valores at́ıpicos es li = q1 − 1.5(q3 − q1) = 102.85 < x1, aśı que no hay valores at́ıpicos inferiores. El ĺımite superior de valores at́ıpicos es ls = q3 + 1.5(q3 − q1) = 152.25 < x9, aśı que x9 = 155 es at́ıpico. Página 4 de 5 Examen final de julio, bloque no 3. – 10-07-2012 (cont.) (b) (0.5 puntos) Dibuje el diagrama de caja (boxplot) de la muestra. ¿Es consistente el resultado obtenido con la masa de 126 GeV/c2 predicha por la teoŕıa? Solución: 115 120 125 130 135 140 145 150 155 1 M as a de l b os ón d e H ig gs ( G eV /c 2 ) 1 q 1 q 3 x m x 9 x 1 x 8 Figura 1: Diagrama de caja de la muestra x El diagrama de caja indica que el resultado podŕıa ser consistente con la masa pre- dicha por la teoŕıa pues se observa que 126 está dentro del rango intercuart́ılico y no muy alejado de xm. En cualquier caso los diagramas de caja no dan resultados concluyentes, habŕıa que analizar la muestra en detalle: calcular la media (esti- mación de la masa del bosón) y estimar el error cometido en la estimación (una conclusión del análisis seŕıa que habŕıa que aumentar el tamaño de la muestra para obtener acotaciones del error aceptables). El diagrama de caja únicamente permite una visión rápida de la distribución de la muestra pero no puede sustituir a la muestra. Página 5 de 5 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Examen final de junio, bloque no 3. 06-06-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.75 puntos) Suponga que b0+b1x es la recta de mı́nimos cuadrados que ajusta la muestra {(xi, yi)}, i = 1, 2, ..., n. Si ŷi = b0 + b1xi, demuestre que ∑n i=1 xi(yi − ŷi) = 0. Solución: Si b0 y b1 son los coeficientes de la recta de mı́nimos cuadrados se debe verificar: ∂q ∂b1 (b0, b1) = n∑ i=1 xi(yi − ŷi) = 0 En donde q(b0, b1) = ∑n i=1(yi − (b0 + b1xi))2. 2. (1.5 puntos) En el modelo lineal Y (x) = β0+β1x+U , el estimador de mı́nimos cuadrados de β1 es B1 = ∑n i=1(xi−x)(Yi−Y )∑n j=1(xj−x) 2 y el de β0 es B0 = Y −B1x, siendo n el número de elementos de la muestra. Demuestre queB0 también se puede expresar como ∑n i=1 ( 1 n − xi−x∑n j=1(xj−x)2 x ) Yi. Solución: B1 = ∑n i=1 (xi − x) ( Yi − Y )∑n j=1 (xj − x) 2 = ∑n i=1 (xi − x)Yi − Y ∑n i=1 (xi − x)∑n j=1 (xj − x) 2 = ∑n i=1 (xi − x)Yi∑n j=1 (xj − x) 2 . Ya que ∑ (xi − x) = 0. Sustituyendo el valor de B1 en la expresión de B0: B0 = n∑ i=1 1 n Yi − ∑n i=1 (xi − x)Yi∑n j=1 (xj − x) 2 x = n∑ i=1 ( 1 n − xi − x∑n j=1 (xj − x) 2x ) Yi. 3. (0.5 puntos) Se dispone de una muestra {(xi, yi)}, i = 1, 2, ..., n para la que se cumple r = 1. ¿Cómo están situados en el plano los puntos de la muestra? Página 1 de 5 Examen final de junio, bloque no 3. – 06-06-2012 (cont.) Solución: Formando una recta 4. (0.75 puntos) En la ecuación XtXb = Xty, ¿Cuál es la matriz X si se desea ajustar el plano y = b0 + b1x+ b2z a los datos {(xi, zi, yi)} = { (14 , 1, 2), (1, 2, 3), ( 2 3 , 5, 1), (2, 6, 8) } ? Solución: X = 1 1/4 1 1 1 2 1 2/3 5 1 2 6 5. (0.75 puntos) Suponga que b0+b1x es la recta de mı́nimos cuadrados que ajusta la muestra {(xi, yi)}, i = 1, 2, ..., n. Si ŷi = b0 + b1xi, demuestre que y = ŷ. Solución: ŷ = 1 n n∑ i=1 ŷi = 1 n n∑ i=1 (b0 + b1xi) = b0 + b1x = y. 6. (0.75 puntos) En un ajuste por mı́nimos cuadrados se utiliza una muestra de tamaño n = 20. Sabiendo que R2 = 0.82 y ∑n i=1(yi − y)2 = 40, halle la cota de error de la estimación de µ(x) = β0 + β1x en x = x con una confianza del 95%. Utilice cuatro decimales en los cálculos.Solución: ε = t1−α 2 s √ 1 n + (x− x)2∑ (xi − x)2 = t1−α 2 s √ 1 n = 2.1009 · 0.6325 · √ 1 20 = 0.2971. Donde: s2 = 1 18 SSres = 1 18 ( 1−R2 ) SStot = 1 18 · 0.18 · 40 = 0.4, s = 0.6325. 7. (3.5 puntos) Una empresa mide el tiempo (en minutos), y, que 15 empleados tardan en llegar al trabajo desde su domicilio. En la muestra obtenida por la empresa también se anota la distancia (en Km), x, entre el domicilio de cada empleado y el centro de trabajo. De esta muestra se conoce lo siguiente: ∑15 i=1 xi = 184, ∑15 i=1 yi = 403, ∑15 i=1 x 2 i = 2616,∑15 i=1 y 2 i = 12493 y ∑15 i=1 xiyi = 5623. Página 2 de 5 Examen final de junio, bloque no 3. – 06-06-2012 (cont.) (a) (1.5 puntos) Ajuste el modelo lineal Y (x) = β0 + β1x + U a los datos de la muestra, estimando β0 y β1 por el método de mı́nimos cuadrados. Calcule el coeficiente de corre- lación del ajuste y estime la desviación t́ıpica de Y (x). Utilice cuatro cifras decimales en los cálculos. Solución: x = 184 15 = 12.2667, y = 403 15 = 26.8667.∑ (xi−x)2 = ∑ x2i −nx2 = 358.9333, ∑ (yi−y)2 = ∑ y2i −ny2 = 1665.7333.∑ (xi − x)(yi − y) = ∑ xiyi − nxy = 679.5333. b1 = (xi − x)(yi − y)∑ (xi − x)2 = 679.5333 358.9333 = 1.8932. b0 = y − b1x = 403 15 − 1.8932184 15 = 3.6434. s = √∑ (yi − y)2 − b21 ∑ (yi − y)2 n− 2 = √ 1665.7333− 1.89322 · 358.9333 13 = 5.4011. r = ∑ (xi − x)(yi − y)√∑ (xi − x)2 ∑ (yi − y)2 = 679.5333√ 358.9333 · 1665.7333 = 0.8788. (b) (1 punto) Suponiendo un modelo normal, construya un intervalo de confianza del 95% para el tiempo medio que tardan en llegar los empleados que viven a una distancia de 7 Km del centro de trabajo. Solución: El intervalo lo delimitan (b0 + b1x)± t1−α 2 s √ 1 n + (x− x)2∑ (xi − x)2 = 3.6434 + 1.8932 · 7± 2.1604 · 5.4011 √ 1 15 + (7− 12.2667)2 358.9333 = 16.8958± 4.4270 min. donde hemos usado t1−α 2 (n− 2) = t0.975(13) = 2.1604. (c) (1 punto) Suponiendo un modelo normal, construya un intervalo de tolerancia de con- tenido p = 0.95 y confianza 0.95 para el tiempo que tardan en llegar los empleados que viven a una distancia de 7 Km del centro de trabajo. Solución: El intervalo lo delimitan yL = (b0 + b17)− ks = 16.8958− 3.1091 · 5.4011 = 0.1030 min. yS = (b0 + b17) + ks = 16.8958 + 3.1091 · 5.4011 = 33.6886 min. Página 3 de 5 Examen final de junio, bloque no 3. – 06-06-2012 (cont.) En donde: k = u0.975 √ 13 χ20.05 [ 1 + d2 2 − d4 ( 2u20.975 − 3 ) 24 ] = 1.96 √ 13 5.8919 [ 1 + d2 2 − d4 ( 2(1.96)2 − 3 ) 24 ] = 3.1091. d2 = 1 n + (x− x)2∑ (xi − x)2 = 1 15 + (7− 12.2667)2 358.9333 = 0.1439. 8. (1.5 puntos) En 1879 Michelson realizó 100 medidas de la velocidad de la luz en el aire. La medidas se realizaron en cinco grupos de 20 medidas cada uno. A continuación se propor- ciona la muestra correspondiente a uno de los grupos. La unidad son 1000 Km/s y se les ha restado 299 (es decir, el número 0.65 corresponde a una medida de 299.65× 103 Km/s). x = (0.65, 0.74, 0.76, 0.81, 0.85, 0.85, 0.88, 0.90, 0.93, 0.93, 0.95, 0.96, 0.96, 0.98, 0.98, 0.98, 1.00, 1.00, 1.00, 1.07) (a) (1 punto) Calcule los cuartiles, los valores at́ıpicos de la muestra y estudie la simetŕıa. Solución: Con p = 0.25 es np+ 0.5 = 20 · 0.25 + 0.5 = 5 + 0.5, aśı que k = 5 y r = 0.5. Por lo tanto q1 = Q̂(0.25) = x5+0.25(x6−x5) = 0.85+0.5(0.85−0.85) = 0.85 (299.85 · 103 Km/s). q2 = xm = x8 = 0.94 (299.94 · 103 Km/s). Con p = 0.75 es np+0.5 = 20 ·0.75+0.5 = 15+0.5, aśı que k = 15 y r = 0.5. Por lo tanto q3 = Q̂(0.75) = x15+0.5(x12−x11) = 0.98+0.75(0.98− 0.98) = 0.98 (299.98 · 103 Km/s). El coeficiente de simetŕıa es: q3 + q1 − 2xm q3 − q1 = 0.98 + 0.85− 2 · 0.94 0.98− 0.85 = −0.3846. La muestra es asimétrica a la izquierda (los datos a la izquierda de la mediana se extienden más lejos que a la derecha). El ĺımite inferior de valores at́ıpicos es li = q1 − 1.5(q3 − q1) = 0.6550 > x1, aśı que x1 = 0.65 es at́ıpico. El ĺımite superior de valores at́ıpicos es ls = q3 + 1.5(q3 − q1) = 1.175 > x20, aśı que no hay valores at́ıpicos superiores. (b) (0.5 puntos) Dibuje el diagrama de caja (box-plot) de la muestra. Página 4 de 5 Examen final de junio, bloque no 3. – 06-06-2012 (cont.) Solución: 299.65 299.7 299.75 299.8 299.85 299.9 299.95 300 300.05 1 V el oc id ad d e la lu z (1 03 K m /s ) q 3 x m x 1 x 2 x 20 q 1 Figura 1: Diagrama de caja de la muestra X Página 5 de 5 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Evaluación continua, prueba no 3. Mañana. 24-05-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.75 puntos) Escriba la cantidad que se hace mı́nima para ajustar el modelo lineal µ (x) = β0 + β1x a la muestra {(xi, yi)}, i = 1, 2, ..., n Solución: q(b0, b1) = n∑ i=1 ((yi − (b0 + b1xi))2 2. (0.75 puntos) Si en una muestra {(xi, yi)}, i = 1, 2, ..., n se verifica ∑n i=1(yi − y)2 = 0, ¿cómo están situados en el plano los puntos de la muestra? Solución: Están alineados según una recta horizontal. 3. (0.5 puntos) ¿Cuáles son los valores posibles de R2? Solución: R2 ∈ [0, 1] 4. (0.75 puntos) Se dispone de una muestra {(xi, yi)}, i = 1, 2, ..., n para los que se cumple yi = 3xi + 2. ¿Cuánto vale el coeficiente de correlación lineal? Solución: r = 1. Página 1 de 4 Evaluación continua, prueba no 3. Mañana. – 24-05-2012 (cont.) 5. (0.75 puntos) Suponga que b0+b1x es la recta de mı́nimos cuadrados que ajusta la muestra {(xi, yi)}, i = 1, 2, ..., n. Si ŷi = b0 + b1xi, demuestre que ∑n i=1(xi − x)(yi − ŷi) = 0. Solución: n∑ i=1 (xi − x)(yi − ŷi) = n∑ i=1 xi(yi − ŷi)− x n∑ i=1 (yi − ŷi) = 0− 0 = 0, ya que: ∂q ∂b1 (b0, b1) = n∑ i=1 xi(yi − ŷi) = 0 y ∂q ∂b0 (b0, b1) = n∑ i=1 (yi − ŷi) = 0. 6. (0.75 puntos) Si el modelo ajustado por mı́nimos cuadrados es µ̂ (x) = 2− 5x y R2 = 0.64, ¿cuánto vale r? Solución: r = − √ 0.64 = −0.8. 7. (0.75 puntos) ¿Cómo se caracteriza la simetŕıa o asimetŕıa de una muestra por medio de los cuartiles emṕıricos? Solución: Estudiando si q3 − xm es igual o distinto que xm − q1. Si son iguales la muestra es simétrica, si son distintos la muestra es asimétrica. 8. (3.5 puntos) Se dispone de la muestra {(1.70, 1.73), (1.73, 1.75), (1.78, 1.73), (1.70, 1.70), (1.75, 1.73), (1.80, 1.78)}, donde x es la altura del padre e y la del hijo (en metros). (a) (1.5 puntos) Ajuste un modelo lineal Solución: ∑ xi = 10.46, ∑ x2i = 18.2438∑ yi = 10.42, ∑ y2i = 18.0996∑ xiyi = 18.1694∑ (xi − x)2 = ∑ x2i − (∑ xi )2 /n = 0.0085333∑ (yi − y)2 = ∑ y2i − (∑ yi )2 /n = 0.0035333 Página 2 de 4 Evaluación continua, prueba no 3. Mañana. – 24-05-2012 (cont.) b1 = ∑ xiyi − ( ∑ xi) ( ∑ yi) /n∑ x2i − ( ∑ xi) /n = 0.453125 b0 = y − b1x = 0.946719 m SSres = ∑ (yi − ŷi)2 = ∑ (yi − y)2 − b21 ∑ (xi − x)2 = 0.003533− 0.4531252 × 0.008533 = 0.0017812 s = √ SSres n− 2 = √ 0.0017812 4 = 0.0211 m (b) (0.5 puntos) ¿Qué porcentaje de la variabilidad de las alturas de los hijos es explicado por la relación lineal con las alturas de los padres? Solución: R2 = 1− SSres SStot = 1− 0.0017812 0.0035333 = 0.49588 (49.59%) (c) (0.5 puntos) ¿Cuál es la estimación de la altura media de los hijos cuyos padres son de 1.75 m? Solución: µ̂ (1.75) = 0.946719 + 0.453125× 1.75 = 1.73968775 m (d) (1 punto) Suponiendo un modelo normal, acote el error de la estimación anterior con una confianza del 95%. Solución: t0.975 (4) = 2.7764 ε = t1−α/2 × s× √ 1 n + (x− x)2∑ (xi − x)2 = 2.7764× 0.0211× √ 16 + (1.75− 10.46/6)2 0.0085333 = 0.0242868322 m 9. (1.5 puntos) En la siguiente muestra se recoge el peso (en centigramos) de 18 semillas de una leguminosa: x = ( 18, 19 20 21 22 23 24 24 25 25 26 27 28 29 29 29 30 31 ) . Se pide: (a) (1 punto) Dibujar el histograma que estima la densidad de probabilidad de la variable aleatoria X = peso de la semilla (en centigramos) a partir de la muestra anterior. Al Página 3 de 4 Evaluación continua, prueba no 3. Mañana. – 24-05-2012 (cont.) dibujarlo se tomará el origen de intervalos en 18 y la longitud de las clases (h) igual a 5. Es imprescindible indicar qué representan los ejes de abscisas y de ordenadas y escribir en ambos los valores numéricos necesarios para poder interpretar el resultado. Solución: 18 20 22 24 26 28 30 32 34 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 Peso de las semillas (centigramos) D en si da d de p ro ba bi lid ad (b) (0.5 puntos) Escribir la expresión de la función de densidad emṕırica dibujada en el apartado anterior y comprobar que, efectivamente, verifica las propiedades de una función de densidad. Solución: f̂(x) = 0 si x < 18 6 18·5 ≈ 0.0667 si x ∈ [18, 23] 7 18·5 ≈ 0.0778 si x ∈ (23, 28] 5 18·5 ≈ 0.0556 si x ∈ (28, 33] 0 si x > 33 f̂ es una función de densidad porque: 1. f̂(x) ≥ 0 ∀x ∈ ℜ, 2. ∫ ℜ f̂(x)dx = 6 18 + 7 18 + 5 18 = 1. Página 4 de 4 Estad́ıstica 1er Curso. Titulaciones de grado de la ETSI Minas Evaluación continua, prueba no 3. Tarde. 24-05-2012 Apellidos y nombre: Grupo: Instrucciones : La duración de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisión y brevedad en el espacio reser- vado para ello en la propia hoja de enunciados. Salvo indicación contraria en el enunciado de la pregunta, los números reales se deben expresar con tres decimales. Como material de apoyo para la realización de la prueba se podrá utilizar únicamente una calculadora. Los teléfonos móviles deben estar apagados y guardados. 1. (0.75 puntos) En el modelo lineal Y (x) = β0+β1x+U , el estimador de mı́nimos cuadrados de β1 es B1 = ∑ (xi−x)(Yi−Y )∑ (xi−x)2 . Demuestre que B1 también se puede expresar como B1 =∑ (xi−x)Yi∑ (xi−x)2 Solución: B1 = ∑ (xi − x) ( Yi − Y )∑ (xi − x)2 = ∑ (xi − x)Yi − Y ∑ (xi − x)∑ (xi − x)2 = ∑ (xi − x)Yi∑ (xi − x)2 . Ya que ∑ (xi − x) = 0. 2. (0.75 puntos) Se dispone de una muestra {(xi, yi)}, i = 1, 2, ..., n para los que se cumple yi = 2xi. ¿Cuánto vale el coeficiente de correlación lineal? Solución: r = 1. 3. (0.75 puntos) En la ecuación XtXb = Xty, ¿Cuál es la matriz X si se desea ajustar la parábola y = b0 + b1x+ b2x 2 a los datos {(xi, yi)} = { (12 , 2), (1, 3), ( 3 2 , 5), (2, 8) } ? Solución: X = 1 1/2 1/4 1 1 1 1 3/2 9/4 1 2 4 Página 1 de 5 Evaluación continua, prueba no 3. Tarde. – 24-05-2012 (cont.) 4. (0.75 puntos) Indique cuál es la expresión del coeficiente de determinación de un ajuste por mı́nimos cuadrados y explique brevemente que representa. Solución: R2 = ∑n i=1(ŷi − y)2∑n i=1(yi − y)2 = 1− ∑n i=1(yi − ŷi)2∑n i=1(yi − y)2 . El coeficiente de determinación, R2, representa la proporción de la variabilidad total de las yi explicada por la relación lineal y(x) = b0 + b1x. 5. (0.75 puntos) Suponga que b0+b1x es la recta de mı́nimos cuadrados que ajusta la muestra {(xi, yi)}, i = 1, 2, ..., n. Si zi = yi − ŷi, en donde ŷi = b0 + b1xi, ¿cuánto vale z? Solución: z = ∑n i=1 zi n = ∑n i=1 yi n − ∑n i=1 ŷi n = y − ŷ = 0. Debido a que ŷ = b0 + b1x = y. 6. (0.75 puntos) De una muestra de tamaño n se conocen los siguientes datos: r = 0.8,∑n i=1(xi − x)2 = 16.9, ∑n i=1(yi − y)2 = 96.1, x = 6 e y = 12. A partir de los mismos, obténganse la recta de regresión mı́nimo cuadrática de X sobre Y. Solución: a1 = r √∑n i=1(xi − x)2∑n i=1(yi − y)2 = 0.8 √ 16.9 96.1 ≈ 0.335, a0 = x− a1y ≈ 1.974. Por lo tanto: Ê(X|Y = y) = 1.974 + 0.335y. 7. (0.5 puntos) Dada la muestra {1, 1, 2, 3, 5, 6, 7, 8}, determinar el cuartil q2 (es decir, la me- diana). Solución: 4 8. (3.5 puntos) Con objeto de verificar experimentalmente la ley de Hooke, se miden las dis- tintas fuerzas Fi que soporta un muelle a distintas longitudes xi conocidas. Se obtienen aśı los datos de la siguiente tabla Fuerza (Newtons) 1 2 3 4 5 6 Longitud (metros) 0.22 0.30 0.39 0.51 0.62 0.68 Página 2 de 5 Evaluación continua, prueba no 3. Tarde. – 24-05-2012 (cont.) Teniendo en cuenta que la ley de Hooke establece que la fuerza aplicada es proporcional a la deformación, F = k(x− x0) (es decir, F = b1x+ b0 siendo b1 = k y b0 = −kx0), se pide: (a) (1.5 puntos) Ajustar los datos al modelo lineal y calcular el coeficiente de correlación r. Dar una estimación de la constante del muelle k. Solución: ∑ Fi = 21, F = 21 6 = 3.5∑ xi = 2.72, x = 2.72 6 = 0.45333∑ F 2i = 91∑ Fixi = 11.21∑ x2i = 1.3974 b1 = ∑ xiFi − nxF∑ x2i − nx2 = 11.21− 6216 2.72 6 1.3974− 6 ( 2.72 6 )2 = 10.2840 b0 = F − b1x = 21 6 − 10.28402.72 6 = −1.1621 s = √∑ F 2i − nF 2 − b21 (∑ x2i − nx2 ) n− 2 = √√√√91− 6 (216 )2 − 10.28402 (1.3974− 6 (2.726 )2) 4 = 0.1732 r = ∑ (xi − x)(Fi − F )√∑ (xi − x)2 ∑ (Fi − F )2 = ∑ xiFi − nxF√(∑ x2i − nx2 ) (∑ F 2i − nF 2 ) = 11.21− 6216 2.72 6√( 1.3974− 6 ( 2.72 6 )2)( 91− 6 ( 21 6 )2) = 0.9966 La constante k se puede aproximar por 10.2840 N/m. (b) (1 punto) Suponiendo un modelo normal, calcular un intervalo de confianza del 95% para la fuerza que correspondeŕıa a una longitud de muelle de 0.4 m. Solución: El intervalo lo delimitan (b0 + b1x)± t1−α 2 s √ 1 n + (x− x)2∑ (xi − x)2 = −1.1621 + 10.2840 · 0.4± 2.7764 · 0.1732 √ 1 6 + (0.4− 0.4533)2 0.1643 = 2.9515± 0.20625 N Página 3 de 5 Evaluación continua, prueba no 3. Tarde. – 24-05-2012 (cont.) donde hemos usado t1−α 2 (n− 2) = t0.975(4) = 2.7764. (c) (1 punto) Suponiendo un modelo normal, calcular un intervalo de confianza del 95% para el valor de k. Solución: El intervalo lo delimitan 10.2840± t1−α 2 s √ 1∑ (xi − x)2 = 10.2840± 2.7764 · 0.1732 √ 1 0.1643 = 10.2840± 1.1863 N/m 9. (1.5 puntos) La Agencia europea para la seguridad y la salud en el trabajo fija un ĺımite de exposición profesional para el plomo en el aire de 150µgm−3. Para controlar los valores X de contaminación en un laboratorio se han muestreado 15 puntos resultando las siguientes concentraciones (en µgm−3) : 4, 7, 15, 19, 22, 59, 68, 80, 115, 120, 132, 208, 309, 371, 579. (a) (0.5 puntos) Calcule los cuartiles, el coeficiente de simetŕıa y los valores at́ıpicos. Solución: Con p = 0.25 es np+0.5 = 15 ·0.25+0.5 = 4+0.25, aśı que k = 4 y r = 0.25. Por lo tanto q1 = Q̂(0.25) = x4+0.25(x5−x4) = 19+0.25(22− 19) = 19.75. q2 = xm = x8 = 80. Con p = 0.75 es np+0.5 = 15·0.75+0.5 = 11+0.75, aśı que k = 11 y r = 0.75. Por lo tanto q3 = Q̂(0.75) = x11 +0.75(x12 − x11) = 132+ 0.75(208− 132) = 189. El coeficiente de simetŕıa es: q3 + q1 − 2xm q3 − q1 = 189 + 19.75− 2 · 80 189− 19.75 = 0.288. La muestra es asimétrica a la derecha (los datos a la derecha de la mediana se extienden más lejos que a la izquierda). El ĺımite inferior de valores at́ıpicos es li = q1− 1.5(q3− q1) = −234.12 < x1, aśı que no hay valores at́ıpicos inferiores. El ĺımite superior de valores at́ıpicos es ls = q3+1.5(q3− q1) = 442.88 < x15, aśı que x15 = 579 es at́ıpico. (b) (1 punto) Dibuje el diagrama de caja de la muestra de X Página 4 de 5 Evaluación continua, prueba no 3. Tarde. – 24-05-2012 (cont.) Solución: 0 100 200 300 400 500 600 1 q 3 q 1 x 15 x 14 x 1 x m Figura 1: Diagrama de caja de la muestra X Página 5 de 5 prueba1_julio prueba1_junio prueba1_manana prueba1_tarde prueba2_julio prueba2_junio prueba2_manana prueba2_tarde prueba3_julio prueba3_junio prueba3_manhana prueba3_tarde