Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Ejercicios Resueltos y Propuestos Curso EYP 2113 Tomo I Primera Edición Trabajo de Recopilación , Organización y Elaboración Patricia Jiménez P. & Ricardo Olea O. Dpto. de Estad́ıstica - Facultad de Matemáticas Pontificia Universidad Católica de Chile Santiago, Diciembre 2004 Prefacio Con la intención de apoyar la labor docente que desarrolla el Departamento de Estad́ıstica de la Facultad de Matemáticas de la Pontificia Universidad Católica de Chile, se ha real- izado un trabajo de recopilación y elaboración de ejercicios resueltos y propuestos para el curso EYP2113, algunos de los cuales fueron desarrollados en ayudant́ıas y han sido parte de interrogaciones en semestres anteriores. Queremos agradecer muy en especial a FONDEDOC, por haber confiado en este proyecto y habernos entregado todo su apoyo para poder ver realizada esta necesidad tanto para el Departamento de Estad́ıstica, como para todos los alumnos y alumnas que son beneficiados de los cursos de servicio que ofrece el mismo. Este trabajo ha sido fruto de la labor que desarrollaron docentes y ayudantes que dictaron el curso durante los años 2002 y 2003. Espećıficamente deseamos agradecer a los profesores Ricardo Aravena Alejandro Jara Ignacio Vidal Además quisiéramos agradecer el aporte de Jorge González, Mario Tagle y Joaqúın Rojas, tanto por el material donado, como por la revisión de este libro. Atentamente. Dirección Departamento de Estad́ıstica Facultad de Matemáticas Santiago, Diciembre 2004 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. II Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. Índice general 1. Estimación 1 1.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2. Test de Hipótesis 49 2.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 3. Ejercicios Resueltos de Interrogaciones 81 3.1. Interrogaciones I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.2. Soluciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 3.3. Interrogaciones II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 3.4. Soluciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 A. Formulario de Distribuciones I B. Formulario de Análisis de Regresión Simple III C. Tablas de distribución VII C.1. Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII C.2. Distribución χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VIII C.3. Distribución F (α = 0,05) . . . . . . . . . . . . . . . . . . . . . . . . . . . . IX C.4. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XI Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. IV ÍNDICE GENERAL Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. Caṕıtulo 1 Estimación 1.1. Ejercicios Resueltos EJERCICIO 1 Suponga que se tiene una m.a. de tamaño 2n tomada de una población X, con E(X) = µ y V ar(X) = σ2. Sean: X1 = 1 2n 2n∑ i=1 xi y X2 = 1 n n∑ i=1 xi dos estimadores de µ.¿Cuál es el mejor estimador de µ?. Explique su elección. SOLUCIÓN El mejor estimador será aquel que tenga menor error cuadrático medio E.C.M.. Primero veamos si son insesgados los estimadores. E(X1) = 1 2n E ( 2n∑ i=1 xi ) = 1 2n 2n∑ i=1 E(xi) = 1 2n 2nµ = µ E(X2) = 1 n E ( n∑ i=1 xi ) = 1 n n∑ i=1 E(xi) = 1 n nµ = µ Luego ambos estimadores son insesgados, por lo tanto el mejor estimador de entre los dos, será aquel que tenga menor varianza. V ar(X1) = 1 4n2 V ar ( 2n∑ i=1 xi ) ind = 1 4n2 2n∑ i=1 V ar(xi) = 1 4n2 2nσ2 = σ2 2n V ar(X2) = 1 n2 V ar ( n∑ i=1 xi ) ind = 1 n2 n∑ i=1 V ar(xi) = 1 n2 nσ2 = σ2 n Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2 Caṕıtulo 1. Estimación Luego, como el que tiene menor varianza es X1, escogemos éste, pues esto produce un menor E.C.M. EJERCICIO 2 Suponga que Θ̂1 y Θ̂2 son estimadores insesgados del parámetro θ. Se sabe que V ar(Θ̂1) = 10 y V ar(Θ̂2) = 4.¿Cuál es el mejor y en que sentido lo es? SOLUCIÓN Como ambos son insesgados, el mejor estimador será aquel que tenga menor varianza, lo que, en este caso, conlleva a tener un menor E.C.M.. Luego observando, vemos que Θ̂2 tiene menor varianza que Θ̂1, por lo tanto escogemos Θ̂2 como mejor estimador de θ. EJERCICIO 3 Suponga que Θ̂1 y Θ̂2 son estimadores del parámetro θ. Se sabe que E(Θ̂1) = θ, E(Θ̂2) = θ 2 , V ar(Θ̂1) = 10 y V ar(Θ̂2) = 4. ¿Cuál es el mejor y en qué sentido lo es? SOLUCIÓN Si observamos cuidadosamente, vemos que Θ̂1 es insesgado para θ pero que Θ̂2 no lo es. Ahora la mejor forma de ver cual es mejor es comparando los E.C.M. de cada uno, ya que esta medida considera el sesgo producido por cada estimador y la varianza que tienen. E.C.M.(Θ̂1) = V ar(Θ̂1) + Sesgo 2(Θ̂1) = 10 + 0 2 = 10 E.C.M.(Θ̂2) = V ar(Θ̂2) + Sesgo 2(Θ̂2) = 4 + ( θ 2 − θ )2 = 4 + (−θ 2 )2 Como se puede ver, el E.C.M. de Θ2 depende del verdadero valor que tiene θ, luego debemos hacer un análisis más detallado, para saber cuando Θ̂2 será mejor que Θ̂1. Cuando ocurre: E.C.M.(Θ̂1) ≤ E.C.M.(Θ̂2) 10 ≤ 4 + ( −θ 2 )2 10 ≤ 16 + θ 2 4 40 ≤ 16 + θ2 θ2 ≥ 40− 16 θ2 ≥ 24 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 3 Es decir, Θ̂1 será mejor estimador de θ que Θ̂2 cuando el verdadero valor de θ sea: θ ≥ √ 24 o cuando θ ≤ − √ 24 Equivalentemente, Θ̂2 será mejor estimador de θ que Θ̂1 cuando − √ 24 < θ < √ 24 EJERCICIO 4 Sea X1, . . . , Xn una muestra aleatoria de tamaño n, de una población N(µ, σ 2). (a) Demuestre que X 2 es un estimador sesgado de µ2. (b) Determine la magnitud del sesgo en el estimador. (c) ¿Qué sucede con el sesgo a medida que aumenta el tamaño n de la muestra? SOLUCIÓN (a) Como X ∼ N(µ, σ2) entonces se sabe que X ∼ N(µ, σ2 n ), luego si queremos demostrar que X 2 es sesgado para µ2 ocupamos la siguiente relación: V ar(X) = E(X 2 )− E2(X) σ2 n = E(X 2 )− µ2 Luego despejando lo que necesitamos, obtenemos: E(X 2 ) = σ2 n + µ2 Lo cual es distinto de µ2, que es el caso donde habŕıa sido insesgado el estimador. (b) La magnitud del sesgo, no es más que el tamaño de éste, es decir, su valor. Sesgo(X 2 ) = E(X 2 )− µ2 Sesgo(X 2 ) = σ2 n + µ2 − µ2 = σ 2 n (c) A medida que el tamaño de muestra aumenta, el sesgo σ 2 n → 0, es decir, el estimador es asintóticamente (cuando n→∞) insesgado. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 4 Caṕıtulo 1. Estimación EJERCICIO 5 Una máquina produce art́ıculos defectuosos con probabilidad π. En la inspección de art́ıculos se define la v.a. Yi = { 1, si el art́ıculo i es defectuoso; 0, si el art́ıculo i no es defectuoso. En una muestra de tamaño 5 se observan dos art́ıculos defectuosos: (a) Proponga un modelo apropiado para el problema y estime la proporción de art́ıculos defectuosos usando el método de máxima verosimilitud. SOLUCIÓN (a) Dada la definición del problema y la estructura de la variable aleatoria, Y tiene una distribución Bernoulli Y ∼ Ber(p)→ P (Y = y) = py(1− p)1−y donde el parámetro p, que es la probabilidad del éxito, es desconocida, por lo que la estimaremos por máxima verosimilitud. L(y; p) = 5∏ i=1 pyi(1− p)1−yi L(y; p) = p ∑5 i=1 yi(1− p)5− ∑5 i=1 yi Aplicando logaritmo natural, obtenemos: `(y; p) = ( 5∑ i=1 yi ) ln(p) + ( 5− 5∑ i=1 yi ) ln(1− p) Luego, para maximizar la función de verosimilitud, derivamos conrespecto al parámetro p, que es el que estamos buscando e igualamos a cero para despejar p. ∂` ∂p = 5∑ i=1 yi p + ( 5∑ i=1 yi ) − 5 1− p = 0 p̂ = 5∑ i=1 yi 5 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 5 Pero como nos dicen que se observaron dos art́ıculos defectuosos, es decir sólo dos de los yi son 1, la suma de éstos es 2, ∴ p̂ = 2 5 EJERCICIO 6 El número de conexiones mal soldadas por microcircuito integrado en una operación de manufactura electrónica sigue una distribución Binomial(20,p) con p desconocida. El costo de corregir los errores, por microcircuito, es: C = 3X + X2 En base a una muestra aleatoria X1, X2, ..., Xn encuentre el EMV del costo total esperado de corregir los errores de estos microcircuitos observados. SOLUCIÓN Como p es desconocida, hay que estimarla en una primera instancia, en este caso por máxima verosimilitud. L(x; p) = n∏ i=1 ( 20 xi ) pxi(1− p)20−xi L(x; p) = p ∑n i=1 xi(1− p)20n− ∑n i=1 xi n∏ i=1 ( 20 xi ) Aplicando logaritmo natural, obtenemos: `(x; p) = ( n∑ i=1 xi ) ln(p) + ( 20n− n∑ i=1 xi ) ln(1− p) Luego, para maximizar la función de verosimilitud, derivamos con respecto al parámetro p, que es el que estamos buscando e igualamos a cero para despejar p. ∂` ∂p = n∑ i=1 xi p + ( n∑ i=1 xi ) − 20n 1− p = 0 p̂ = n∑ i=1 xi 20n Ahora procedemos a calcular el costo esperado por medio de la esperanza. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 6 Caṕıtulo 1. Estimación E(C) = 3E(X) + E(X2) = 3np + np(1− p) + (np)2 = 3np + np− np2 + n2p2 = 4np + np2(n− 1) Luego el E.M.V. de E(C) es Ê(C) = 4np̂ + np̂2(n− 1) por invarianza del E.M.V. EJERCICIO 7 En encuestas, es dif́ıcil obtener respuestas precisas a preguntas delicadas tales como ¿Has usado alguna vez heróına? o ¿Has hecho trampa alguna vez en un examen?. Warner introdujo el método de respuestas aleatorizadas para tratar tales situaciones. El encuestado hace girar una flecha en una rueda o extrae una bola desde una urna que contiene dos bolas de dos colores para determinar cual de las dos afirmaciones contestará: (1)“Tengo la caracteŕıstica A”, o (2)“No tengo la caracteŕıstica A”. El encuestador no conoce cual afirmación será con- testada pero solamente anotará un śı o un no. Se cree que es más probable que el encuestado responda verazmente si él o ella saben que el encuestador no conoce cual afirmación será con- testada. Sea R la proporción de una muestra que contesta Śı. Sea p la probabilidad que la afirmación 1 sea contestada (p es conocido desde la estructura del método aleatorizado), y sea q la proporción de la población que tiene la caracteŕıstica A. Sea r la probabilidad que un encuestado responda śı. (a) Muestre que r = (2p− 1)q + (1− p) (b) Si r es conocida, ¿Cómo podŕıa determinarse q? SOLUCIÓN Definamos como: R: Proporción de la muestra que contesta śı. p: Probabilidad que la afirmación 1 sea contestada. q: Probabilidad de la población que tiene la caracteŕıstica A. r: Probabilidad que un encuestado responda si. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 7 (a) r = P (responda śı) = P (responda śı | contesta afirmación 1)P (contesta afirmación 1) + P (responda śı | no contesta afirmación 1)P (no contesta afirmación 1) = pq + (1− p)(1− q) = pq + 1− p− q + pq = 2pq + 1− p− q = (2pq + 1)q + (1− p) (b) Seŕıa cosa de despejar q, es decir, r − (1− p) = (2p− 1)q luego q = r + p− 1 2p− 1 EJERCICIO 8 Suponga que X1, X2, ..., Xn constituye una m.a. de una distribución cuya función densidad es la siguiente f(x; θ) = { θxθ−1, 0 < x < 1; 0, e.o.c. Además, suponga que el valor de θ es desconocido (θ > 0). (a) Determine el EMV de θ. (b) Determine el EMV de E(X). SOLUCIÓN Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 8 Caṕıtulo 1. Estimación (a) L(x1, . . . , xn; θ) = n∏ i=1 θxθ−1i = θn ( n∏ i=1 xi )θ−1 / ln l(x1, . . . , xn; θ) = n ln θ + (θ − 1) n∑ i=1 ln xi /∂θ ∂l(x1,...,xn,θ) ∂θ = n θ + n∑ i=1 ln xi ⇒ θ̂EMV = −nn∑ i=1 ln xi (b) E(X) = ∫ 1 0 xθxθ−1dx = ∫ 1 0 θxθdx = θxθ+1 θ + 1 ∣∣∣1 0 = θ θ + 1 Luego Ê(X) = θ̂ θ̂+1 por la invarianza del E.M.V. EJERCICIO 9 Sean X1, X2, . . . , Xn variables aleatorias i.i.d. con función densidad dada por fX(x) = { (α + 1)xα ;0 < x < 1 0 ;e.o.c. (a) Encuentre el estimador de α por el método de momentos. (b) Encuentre el estimador de α por el método de máxima verosimilitud. (c) Evalúe ambos estimadores usando los siguientes datos: X 0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9 Frecuencia 3 1 2 3 SOLUCIÓN Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 9 (a) El método de momentos consiste en igualar el momento muestral con el momento poblacional. Para el caso k = 1 tenemos la siguiente igualdad E(X) = X Necesitamos calcular E(X): E(X) = ∫ Rec X xfX(x)dx = ∫ Rec X x · (α + 1)xαdx = (α + 1) ∫ 1 0 xα+1dx = (α + 1) xα+2 α + 2 ∣∣∣x=1 x=0 = α + 1 α + 2 Luego E(X) = X ⇒ α + 1 α + 2 = X ⇒ α + 1 = αX + 2X ⇒ α(1−X) = 2X − 1 ⇒ α̂MM = 2X − 1 1−X (b) L(x; α) = n∏ i=1 f(xi) = n∏ i=1 (α + 1)xαi = (α + 1) n ( n∏ i=1 xi )α \ ln `(x; α) = n ln(α + 1) + α n∑ i=1 ln(xi) \∂α Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 10 Caṕıtulo 1. Estimación ∂` ∂α = n α + 1 + n∑ i=1 ln(xi) = 0 ⇒ n α + 1 = − n∑ i=1 ln(xi) ⇒ α + 1 = −nn∑ i=1 ln(xi) ⇒ α̂MV = − nn∑ i=1 ln(xi) + 1 (c) Para evaluar los estimadores necesitamos convertir los datos tabulados a un set de datos compuestos por las marcas de cada clases Marca de Clase (0.2) (0.45) (0.65) (0.8) X 0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9 Frecuencia 3 1 2 3 Se puede representar el conjunto de valores para X como: [X : 0,2; 0,2; 0,2; 0,45; 0,65; 0,65; 0,8; 0,8; 0,8] Calculando ahora lo necesario para poder evaluar los estimadores con estos datos tab- ulados X = 1 n k∑ i=1 mi · fi = 1 9 (0,2 · 3 + 0,45 · 1 + 0,65 · 2 + 0,8 · 3) = 0,5277 n∑ i=1 ln(xi) = ln ( n∏ i=1 xi ) = ln(0,000778752) = −7,15781 Luego al evaluar estos resultados en los estimadores, estos toman los siguientes valores: α̂MM = 2X − 1 1−X = 2 · 0,52777− 1 1− 0,52777 = 0,117612 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 11 α̂MV = − nn∑ i=1 ln(xi) + 1 = − ( 9 −7,15781 + 1 ) = 0,257367 EJERCICIO 10 Sean X1, ..., Xn, Y1, ..., Yn v.a. independientes con Xi ∼ Exp( 1α) e Yj ∼ Exp( 1 β ), con i = 1, ..., n; j = 1, ..., n. Se define el parámetro θ = (θ1, θ2) por θ1 = α y θ2 = β α . (a) Determine los EMV (estimador máximo verośımil) para θ1 y θ2 (b) Encuentre el sesgo y el ECM (error cuadrático medio) de θ̂1 SOLUCIÓN (a) Dada la independencia existente entre las variables, tenemos que fXi,Yj (xi, yj) = 1 α e− xi α 1 β e− yi β , luego la verosimilitud conjunta es la siguiente: L(x, y; θ) = 1 αnβn e− ∑ xi α e− ∑ yi β \ ln `(x, y; θ) = − ∑ xi α − ∑ yi β − n ln(α)− n ln(β) \∂α ∂` ∂α = ∑ xi α2 − n α = 0 −→ α̂ = x = θ̂1 ∂` ∂β = ∑ yi β2 − n β = 0 −→ β̂ = y Tenemos que por la invarianza de los EMV’s, θ̂2 = β̂ α̂ , luego reemplazando queda que θ̂2 = y x . (b) Por fórmula el ECM(θ̂1) = V ar(θ̂1) + Sesgo 2(θ̂1), donde el Sesgo(θ̂1) = E(θ̂1) − θ1. Luego veremos primero si tiene sesgo (sesgado): E(θ̂1) = E n∑ i=1 xi n = 1n n∑ i=1 E(xi) = 1 n n∑ i=1 α = α Luego como es insesgado (recuerde que θ1 = α), el Sesgo(θ̂1) = 0. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 12 Caṕıtulo 1. Estimación Por lo tanto para calcular el ECM(θ̂1) basta calcular su varianza. V ar(θ̂1) = V ar n∑ i=1 xi n = 1n2Var ( n∑ i=1 xi ) ind = 1 n2 n∑ i=1 V ar(xi) = 1 n2 n∑ i=1 α2 = α2 n Por lo tanto ECM(θ̂1) = α2 n el cual n→∞−→ 0. EJERCICIO 11 Sean X1, ..., Xn iid con densidad λe −λx, x ≥ 0, n ≥ 2. Sea Sn = n∑ i=1 Xi. Es bien conocido que Z = λSn tiene densidad: fZ(z) = zn−1e−z (n− 1)! , z ≥ 0 Utilice esto para calcular el sesgo y el ECM de λ̂ = n−1 Sn . SOLUCIÓN Necesitamos calcular la esperanza y varianza de λ̂. E(λ̂) = E ( n− 1∑ xi ) = (n− 1)E ( 1∑ xi ) = (n− 1)E ( λ λ ∑ xi ) = (n− 1)E ( λ Z ) = λ(n− 1)E ( 1 Z ) = λ(n− 1)E(Z−1) = λ(n− 1) ∫ ∞ 0 z−1 zn−1e−z (n− 1)! dz = λ(n− 1) ∫ ∞ 0 zn−2e−z (n− 1)! dz = λ(n− 1) n− 1 ∫ ∞ 0 zn−2e−z (n− 2)! dz = λ Por lo tanto λ̂ es un estimador insesgado, es decir, Sesgo(λ̂) = 0. Luego queda que: Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 13 ECM(λ̂) = V ar(λ̂) = E(λ̂2)− E2(λ̂) = E ([ n− 1 Sn ]2) − λ2 = (n− 1)2E ( λ2 Z2 ) − λ2 = λ2(n− 1)2E(Z−2)− λ2 = λ2(n− 1)2 ∫ ∞ 0 z−2 zn−1e−z (n− 1)! dz − λ2 = λ2(n− 1)2 (n− 1)(n− 2) ∫ ∞ 0 zn−3e−z (n− 3)! dz − λ2 = λ2(n− 1) (n− 2) − λ2 = λ2 n− 2 Por lo tanto el ECM(λ̂) = λ 2 n−2 n→∞−→ 0. EJERCICIO 12 Sean Y1, ..., Yn iid∼ U(0, θ). Sea T = Max(Y1, ..., Yn) y considere los estimadores de θ de la forma cT, c ≥ 0. (a) ¿Para qué valor de c, cT es insesgado? (b) ¿Para qué valor de c, el ECM(cT ) es mı́nimo? SOLUCIÓN Si T corresponde al Máximo, entonces su función densidad es de la forma fT (t) = n[FY (t)] n−1fY (t), donde fY (t) = 1 θ y FY (t) = t θ . Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 14 Caṕıtulo 1. Estimación (a) Calcularemos la esperanza para determinar el insesgamiento. E(cT ) = cE(T ) = c ∫ θ 0 tn tn−1 θn−1 1 θ dt = cn θn ∫ θ 0 tndt = cn θn tn+1 n + 1 ∣∣∣θ 0 = cn θn θn+1 n + 1 = cnθ n + 1 Luego si c = n+1 n , cT es insesgado. (b) En primer lugar calcularemos lo necesario para obtener el ECM y aśı después encontrar el c que lo minimice. E(θ̂2) = E((cT )2) = c2E(T 2) = c2 ∫ θ 0 t2n tn−1 θn−1 1 θ dt = c2n θn ∫ θ 0 tn+1dt = c2n θn ( tn+2 n + 2 ∣∣∣θ 0 ) = c2nθ2 n + 2 Ahora calculemos V ar(θ̂): V ar(θ̂) = c2nθ2 n + 2 − c 2n2θ2 (n + 1)2 = c2nθ2 ( 1 n + 2 − n (n + 1)2 ) = c2nθ2 ( (n + 1)2 − n(n + 2) (n + 1)2(n + 2) ) = c2nθ2 ( 1 (n + 1)2(n + 2) ) Además el sesgo queda de la siguiente forma: Sesgo(θ̂) = cnθ n + 1 − θ = θ ( cn− n− 1 n + 1 ) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 15 y aśı obtenemos el ECM , resultando: ECM(θ̂) = c2nθ2 (n + 1)2(n + 2) + θ2 ( (cn− n− 1)2 (n + 1)2 ) Ahora utilizando los métodos matemáticos (1a Derivada) para minimizar, encontraremos el c correspondiente. ∂ECM(θ̂) ∂c = 2cnθ2 (n + 1)2(n + 2) + 2θ2n(cn− n− 1) (n + 1)2 = 0 −→ c = n + 2 n + 1 Para verificar si realmente es mı́nimo, se calcula la segunda derivada. ∂2ECM(θ̂) ∂c2 = 2nθ2 (n + 1)2(n + 2) + 2n2θ2 (n + 1)2 la cual es positiva ∀n > 0, luego cuando c = n+2 n+1 , el ECM(θ̂) se minimiza. EJERCICIO 13 Suponga que X sigue una distribución de Pareto, su función de densidad está dada por: f(x; α, θ) = θαθx−θ−1, x ≥ α y θ ≥ 1 Asuma que α > 0 es conocido y que X1, ..., Xn son v.a. iid. (a) Encuentre un estimador de momentos para θ. (b) Determine el EMV de θ. SOLUCIÓN Como los Xi siguen distribución de Pareto, se tiene que su esperanza y varianza son conoci- das: E(X) = θα θ − 1 , θ > 1 V ar(X) = θα2 (θ − 1)2(θ − 2) , θ > 2 (a) Igualando el momento poblacional con el muestral, se obtiene el estimador de momen- Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 16 Caṕıtulo 1. Estimación tos: θα θ − 1 = 1 n n∑ i=1 xi θα θ − 1 = x θα− θX = −x θ̂ = x x− α (b) Teniendo que las observaciones distribuyen Pareto, la función de verosimilitud es la siguiente: L(x; α, θ) = n∏ i=1 θαθx −(θ+1) i = θnαnθ ( n∏ i=1 xi )−(θ+1) \ ln `(x; α, θ) = n ln(θ) + nθ ln(α)− (θ + 1) n∑ i=1 ln(xi) \∂θ ∂` ∂θ = n θ + n ln(α)− n∑ i=1 ln(xi) = 0 → θ̂ = −n n ln(α)− n∑ i=1 ln(xi) EJERCICIO 14 Sea Y1, ..., Yn una muestra aleatoria proveniente de una población N(θ, θ), con θ > 0 y de- sconocido. A partir de una muestra aleatoria correspondiente a 25 pesos de circuitos, con n∑ i=1 Yi = 1264 y con n∑ i=1 Y 2i = 5240, determine la estimación máximo verośımil de θ. SOLUCIÓN Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 17 L(y; θ) = n∏ i=1 1√ 2πθ exp { 1 2θ (yi − θ)2 } = (2πθ)− n 2 exp { − 1 2θ n∑ i=1 (yi − θ)2 } \ ln `(y; θ) = −n 2 ln(2π)− n 2 ln(θ)− 1 2θ n∑ i=1 (yi − θ)2 = −n 2 ln(2π)− n 2 ln(θ)− 1 2θ n∑ i=1 (y2i − 2θyi + θ2) = −n 2 ln(2π)− n 2 ln(θ)− 1 2θ n∑ i=1 y2i + n∑ i=1 yi − nθ 2 \∂θ ∂` ∂θ = − n 2θ + 1 2θ2 n∑ i=i y2i − n 2 = 0 −→ −n θ + 1 θ2 n∑ i=1 y2i − n = 0 \ · θ2 −nθ + n∑ i=1 y2i − nθ2 = 0 \ · − 1n θ − n∑ i=1 y2i /n + θ 2 = 0 θ2 + θ − y2 = 0 θ̂ = −1± √ 1+4y2 2 θ̂1 = 13,98 θ̂2 = −14,98 y como en el enunciado nos dicen que θ > 0, nos quedamos con θ̂1 = 13,98. EJERCICIO 15 Ingenieros eléctricos japoneses han inventado un sistema de radar llamado detector de blancos Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 18 Caṕıtulo 1. Estimación móviles (MTD, moving target detector), diseñado para rechazar los ecos parásitos provocados por el terreno, la lluvia, las aves y otras fuentes de interferencia. Los investigadores han demostrado que la magnitud X de la frecuencia Doppler de una señal recibida por radar se puede modelar por una distribución Weibull, con parámetro α = 2 y β > 0, tal que: f(x) = 2x β exp { − 1 β x2 } x > 0 En base a una muestra aleatoria de tamaño n, determine el estimador máximo verośımil de β y obtenga su estimación con las siguientes magnitudes de frecuencias si ∑50 i=1 x 2 i = 51,9. SOLUCIÓN L(x; β) = n∏ i=1 2xi β exp { − 1 β x2i } = 2 n βn ( n∏ i=1 xi ) exp { − 1 β n∑ i=1 x2i } \ ln `(x; β) = n ln(2)− n ln(β) + n∑ i=1 ln(xi)− 1 β n∑ i=1 x2i \∂β ∂` ∂β = −n β + n∑ i=1 x2i β2 = 0 → n∑ i=1 x2i n = β 2 β β̂ = n∑ i=1 x2i n Reemplazando por los valores dados en el inicio, queda que β̂ = 1,038 EJERCICIO 16 En una fábrica se seleccionan diariamente motores y se inspeccionan hasta encontrar el primer motor defectuoso. Sea (X1, . . . , Xn) una m.a. de X distribuida geométricamente con p desconocido. (a) Determine el estimador de momentos para p. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 19 (b) Determine el estimador máximo verośımil de p. (c) De los registros de 100 d́ıas se obtuvo la siguiente información del número de motores inspeccionados. Nde motores inspeccionados 1 2 3 4 5 Nde d́ıas 8 10 15 25 42 Estime la probabilidad de que en un d́ıa cualquiera se deban inspeccionar más de dos motores para encontrar uno defectuoso. SOLUCIÓN Dado que Xi ∼ Geom(p) tenemos que: P (X = x) = p(1− p)x−1; E(X) = 1 p V ar(X) = 1 p2 (a) Igualando momento poblacional con el muestral, queda: 1 p = n∑ i=1 xi n p̂ = n n∑ i=1 xi = 1 x (b) Haciendo el procedimiento usual tenemos lo siguiente: Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 20 Caṕıtulo 1. Estimación L(x; p) = n∏ i=1 p(1− p)xi−1 = pn(1− p) ∑ (xi−1) = pn(1− p) ∑ xi−n \ ln `(x; p) = n ln(p) + ( n∑ i=1 xi − n ) ln(1− p) = n ln(p) + n∑ i=1 xi ln(1− p)− n ln(1− p) \∂p ∂` ∂p = n p − n∑ i=1 xi 1− p + n 1− p = 0 n p = n∑ i=1 xi − n 1− p n(1− p) = p ( n∑ i=1 xi − n ) p̂ = n n∑ i=1 xi = 0,2610 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 21 (c) Recordando la propiedad de invarianza que tienen losestimadores máximo verośımiles, lo que se pide, se puede traducir estad́ısticamente en: P (X > 2) = 1− P (X ≤ 2) = 1− P (X = 1)− P (X = 2) = 1− p̂(1− p̂)1−1 − p̂(1− p̂)2−1 = 1− p̂− p̂(1− p̂) = (1− p̂)2 = 0,5459 EJERCICIO 17 Sean X1, . . . , Xn iid∼ U(θ1, θ2). Es decir, la densidad de Xi es: f(x) = 1 θ2 − θ1 θ1 ≤ x ≤ θ2 (a) Encuentre el estimador de momentos para los parámetros de esta distribución. (b) Encuentre el estimador máximo verośımil para θ1 y θ2. SOLUCIÓN (a) Se necesita encontrar los estimadores de θ1 y θ2, luego por ser dos parámetros, utilizaremos el primer y segundo momento para armar un sistema de ecuaciones. Momentos poblacionales: E(X) = θ1 + θ2 2 E(X2) = ∫ θ2 θ1 x2 1 θ2 − θ1 dx = θ22 + θ2θ1 + θ 2 1 3 Igualando momentos poblacionales con muestrales, queda el siguiente sistema de ecuaciones: Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 22 Caṕıtulo 1. Estimación θ1 + θ2 2 = x (1) θ22 + θ2θ1 + θ 2 1 3 = x2 (2) Despejando tenemos de (1) que θ1 = 2x − θ2 y reemplazando en la segunda ecuación se obtiene: (2x− θ2)2 + (2x− θ2)θ2 + θ22 = 3x2 4x2 − 4xθ2 + θ22 + 2xθ2 − θ22 + θ22 = 3x2 θ22 − 2xθ2 + 4x2 − 3x2 = 0 Resolviendo esta ecuación de segundo grado con los métodos usuales, se obtiene: θ̂2 = 2x± √ 4x2 − 16x2 + 12x2 2 = x± √ 3x2 − 3x2 = x± √ 3S2 Luego reemplazando θ̂2 en (1) se tiene que θ̂1 = 2x− θ̂2 = 2x− x∓ √ 3S2 = x∓ √ 3S2. (b) En el caso de aquellas distribuciones en que su dominio depende de los parámetros a estimar (en este caso la distribución es válida cuando θ1 ≤ x ≤ θ2), el procedimiento de estimación debe considerar un muy pequeño detalle como se muestra a continuación: L(x; θ1, θ2) = 1 (θ2 − θ1)n I(θ2−θ1)(x1) . . . I(θ2−θ1)(xn) = 1 (θ2 − θ1)n n∏ i=1 I(θ2−θ1)(xi) = 1 (θ2 − θ1)n n∏ i=1 I(xi>θ1)(xi)I(xi<θ2)(xi) = 1 (θ2 − θ1)n n∏ i=1 I(min(xi)>θ1)(xi)I(max(xi)<θ2)(xi) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 23 Como se muestra a continuación tanto el mı́nimo como el máximo de los xi son el estimador máximo verośımil de θ1 y θ2 respectivamente. Figura 1.1: Estimación Theta 1 Figura 1.2: Estimación Theta 2 EJERCICIO 18 Sea X1, . . . , Xn una m.a. con media µ y varianza σ 2. Se propone estimar µ mediante X = n∑ i=1 ciXi donde los ci son números fijos. Determine los ci tal que el estimador sea insesgado y de varianza mı́nima. SOLUCIÓN Se tiene que µ̂ = X = ∑n i=1 ciXi. Se determinará inicialmente los ci para que se cumpla el insesgamiento. E(µ̂) = E ( n∑ i=1 ciXi ) = n∑ i=1 ciE(Xi) = µ n∑ i=1 ci luego para que µ̂ sea insesgado, debe cumplirse que n∑ i=1 ci = 1 La varianza es la siguiente: V ar(µ̂) = V ar ( n∑ i=1 ciXi ) m.a. = n∑ i=1 c2i V ar(Xi) = n∑ i=1 c2i σ 2 = σ2 n∑ i=1 c2i Para determinar que sea de varianza mı́nima, se ocuparán procedimientos de cálculo (mul- tiplicadores de Lagrange) para que se cumpla el insesgamiento y la variabilidad mı́nima simultáneamente. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 24 Caṕıtulo 1. Estimación L = mı́n ci σ2 n∑ i=1 c2i − λ ( n∑ i=1 ci − 1 ) ∂ L ∂ci = σ22ci − λ = 0 (1) ∂ L ∂λ = n∑ i=1 ci − 1 = 0 (2) Para poder ocupar la condición dada en (2), sumaremos las n ecuaciones que se obtienen al derivar con respecto a ci, i = 1, . . . , n, resultando la siguiente ecuacion: 2σ2 n∑ i=1 ci − nλ = 0 (3) Luego despejando (2) y reemplazando en (3), queda lo siguiente: 2σ2 = nλ λ = 2σ2 n (4) Finalmente, reemplazando (4) en (1) resulta: 2σ2ci = 2σ2 n ci = 1 n Luego µ̂ = X es el estimador óptimo. EJERCICIO 19 Sean X1, . . . , Xn una m.a. N(0, σ 2). (a) Encuentre el EMV de σ2. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 25 (b) Sea σ̃2 = X21+X 2 n 2 otro estimador de σ2. ¿Son insesgados ambos estimadores? (c) ¿Cuál de los dos es mejor?. Justifique. SOLUCIÓN (a) Usando el procedimiento usual, tenemos: L(x; σ2) = n∏ i=1 1√ 2πσ2 exp { − x 2 i 2σ2 } = (2πσ2)− n 2 exp { − ∑ x2i 2σ2 } \ ln `(x; σ2) = −n 2 ln(2πσ2)− ∑ x2i 2σ2 \∂σ2 ∂` ∂σ2 = −n 2 1 2πσ2 2π + ∑ x2i 2(σ2)2 = 0 Luego simplificando y despejando se obtiene que: σ̂2 = n∑ i=1 x2i n (b) E(σ̂2) = E n∑ i=1 x2i n = 1n n∑ i=1 E(x2i ) = 1 n n∑ i=1 (V ar(xi) + E 2(xi)) = 1 n n∑ i=1 (σ2 + 0) = σ2 Por lo tanto el EMV es insesgado. Veremos ahora el propuesto. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 26 Caṕıtulo 1. Estimación E(σ̃2) = E ( x21 + x 2 n 2 ) = E(x21) + E(x 2 n) 2 = [V ar(x1) + E 2(x1)] + [V ar(xn) + E 2(xn)] 2 = [σ2 + 0] + [σ2 + 0] 2 = σ2 Luego el estimador propuesto σ̃2 también es insesgado. (c) Para determinar cual de ellos es mejor, se calcula el ECM que en este caso, por ser ambos insesgados, se reduce a el cálculo de sus varianzas. V ar(σ̂2) = V ar n∑ i=1 x2i n m.a.= 1n2 n∑ i=1 V ar(x2i ) = 1 n2 n∑ i=1 (E(x4i )− E2(x2i )) = 1 n2 n∑ i=1 (3σ4 − σ4) = 1 n2 n∑ i=1 2σ4 = 2σ4 n V ar(σ̃2) = V ar ( x21 + x 2 n 2 ) ind = 1 4 (V ar(x21) + V ar(x 2 n)) = 1 4 (2σ4 + 2σ4) = σ4 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 27 Como 2σ 4 n < σ4 para n > 2, σ̂2 es mejor estimador que σ̃2. Nota: Observe que si n = 2 los estimadores son igualmente eficientes. EJERCICIO 20 Sean X1, X2 ind. con Xi ∼ P (λ). Se desea estimar P (X1 = 0) = e−λ. (a) Encuentre el EMV de P (X1 = 0). (b) Encuentre ECM de: i. ( 1 2 )X1+X2 ii. Proporción de Xi = 0 (puede ser 0, 0.5 ó 1) (c) Demuestre que i. tiene menor ECM para todo λ > 0 (d) Muestre que el estimador T = ( 1 2 )X1+X2 no alcanza la cota de cramer rao. SOLUCIÓN (a) Para esto primero se debe sacar el EMV de λ y después usar la propiedad de invarianza. L(x; λ) = 2∏ i=1 e−λλxi xi! = e−2λλx1+x2 x1!x2! \ ln `(x; λ) = −2λ + (x1 + x2) ln(λ)− ln(x1!)− ln(x2!) \∂λ ∂` ∂λ = −2 + x1 + x2 λ = 0 Despejando se obtiene que: λ̂ = x1 + x2 2 = x Por lo tanto ̂P (X = 0) = e−λ̂λ̂0 0! = e−λ̂ = e−x = e− x1+x2 2 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 28 Caṕıtulo 1. Estimación (b-i.) Denominaremos θ̂1 = ( 1 2 )Z , donde X1 + X2 = Z ∼ P (2λ). En primer lugar calculamos el sesgo. E [( 1 2 )Z] = ∞∑ z=0 ( 1 2 )z P (Z = z) = ∞∑ z=0 ( 1 2 )z (2λ)ze−2λ z! = e−2λ ∞∑ z=0 λz z!︸ ︷︷ ︸ eλ ←− por Taylor = e−2λeλ = e−λ Por lo tanto es un estimador insesgado para P (X1 = 0), luego el ECM se reduce a la Vari- anza. ECM(θ̂) = V ar ([ 1 2 ]Z) = E ([ 1 2 ]2Z) − E2 ([ 1 2 ]Z) = ∞∑ z=0 ( 1 2 )2z (2λ)ze−2λ z! − e−2λ = ∞∑ z=0 ( 1 4 )z 2zλze−2λ z! − e−2λ Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 29 = e−2λ ∞∑ z=0 ( λ 2 )z 1 z!︸ ︷︷ ︸−e −2λ eλ/2 = e−2λ · eλ/2 − e−2λ = e−3λ/2 − e−2λ (b-ii.) Por otra parte definamos θ̂2 = 2∑ i=1 I(Xi=0) 2 que precisamente representa la proporción de Xi = 0, entonces 2θ̂2 ∼ Binomial(2, e−λ) y es claro que E(2θ̂2) = 2e−λ por lo que θ̂2 es insesgado, luego el ECM se reduce a al cálculo de la varianza. ECM(θ̂2) = V ar(θ̂2) = 1 4 V ar(2θ̂2) = 1 4 2e−λ(1− e−λ) = 1 2 e−λ(1− e−λ) (c) Para tal demostración, ocuparemos la siguiente tautoloǵıa: 0 < (e− 1 2 λ − e−λ)2 < e−λ − 2e− 3 2 λ + e−2λ < 1 2 e−λ − e− 3 2 λ + 1 2 e−2λ = 1 2 e−λ − e− 3 2 λ + e−2λ − 1 2 e−2λ Luego despejando resulta que e− 3 2 λ − e−2λ < 1 2 e−λ(1− e−λ). Por lo tanto ECM(θ̂1) < ECM(θ̂2) ∀λ > 0. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 30 Caṕıtulo 1. Estimación (d) Recordemos que la CCR = (h(θ) ′)2 I(θ) donde I(θ) = −E ( ∂2 ∂θ2 `(x) ) . De la parte (b-i) tenemos que la V ar(T ) es V ar(T ) = V ar ([1 2 ]x1+x2) = e− 3 2 λ − e−2λ Ahora necesitamos: h(θ) = e−λ \∂λ h(θ)′ = −e−λ ( )2 (h(θ)′)2 = e−2λ I(θ) = −E ( ∂2 ∂λ2 `(x) ) = −E ( −x1 + x2 λ2 ) = 2λ λ2 = 2 λ Luego se obtiene que CCR = e−2λ 2/λ = λe−2λ 2 6= V ar(T ) es decir, T no alcanza la CCR. EJERCICIO 21 Sean X1, . . . , Xn v.a. iid con función de densidad dada por: f(x) = β xβ+1 , x > 1, β > 1 (a) Determine el EMV de β. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 31 (b) Encuentre el EMV de e 1 β . SOLUCIÓN (a) L(x; β) = n∏ i=1 β xβ+1i = βn( n∏ i=1 xi )β+1 \ ln `(x; β) = n ln(β)− (β + 1) n∑ i=1 ln(xi) \∂β ∂` ∂β = n β − n∑ i=i ln(xi) = 0 Despejando se obtiene que β̂ = n n∑ i=1 ln xi (b) Utilizando la propiedad de invarianza que tienen los EMV, obtenemos que: ê 1 β = e 1 β̂ = e ∑ ln xi n EJERCICIO 22 Sean X1, . . . , Xn iid∼ U(0, θ). Sean c y d dos constantes positivas y considere los estimadores de θ: θ̃c = cX θ̃d = dXmax (a) Calcule los errores cuadráticos medios de θ̃c y θ̃d en función de c, d y θ. (b) Encuentre los valores de ĉ y d̂ de c y d, que minimizan los errores cuadráticos medios. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 32 Caṕıtulo 1. Estimación SOLUCIÓN (a) Tenemos que ECM(θ̃c) = V ar(θ̃c) + Sesgo 2(θ̃c). V ar(θ̃c) = V ar(cX) = c 2V ar(X) = c2 n2 n∑ i=1 V ar(Xi) = c2 n2 n θ2 12 = c2θ2 12n Sesgo(θ̃c) = E(θ̃c)− θ = cE(X)− θ = c n n∑ i=1 E(Xi)− θ = c θ 2 − θ = θ c− 2 2 Por lo tanto, queda que ECM(θ̃c) = c2θ2 12n + θ2 ( c− 2 2 )2 Tenemos que ECM(θ̃d) = V ar(θ̃d) + Sesgo 2(θ̃d). Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 33 V ar(θ̃d) = d 2V ar(max{Xi}) Por lo que recordemos que la distribución del máximo(Z) de los Xi es: fZ(z) = n[FX(z)] n−1fX(z) Luego en este caso, haciendo Z = max{Xi}, la distribución queda de la siguiente forma fZ(z) = n (z θ )n−1 1 θ = n zn−1 θn , 0 < z < θ Ahora se calculan las esperanzas correspondientes para obtener la varianza necesaria para el ECM . E(Z) = ∫ θ 0 znzn−1θ−ndz = nθ−n ∫ θ 0 zndz = nθ−n zn+1 n + 1 ∣∣∣∣∣ θ 0 = n θ−nθn+1 n + 1 = n n + 1 θ Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 34 Caṕıtulo 1. Estimación E(Z2) = ∫ θ 0 z2nzn−1θ−ndz = nθ−n ∫ θ 0 zn+1dz = nθ−n zn+2 n + 2 ∣∣∣∣∣ θ 0 = nθ−n θn+2 n + 2 = n n + 2 θ2 −→ V ar(θ̃d) = d2 [ E(Z2)− E2(Z) ] = d2 [ n n + 2 θ2 − n 2 (n + 1)2 θ2 ] = d2θ2 [ n n + 2 − n 2 (n + 1)2 ] Sesgo(θ̃d) = E(θ̃d)− θ = dE(max{Xi})− θ = d n n + 1 θ − θ = θ ( d n n + 1 − 1 ) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 35 Por lo tanto, queda que ECM(θ̃d) = d 2θ2 [ n n + 2 − n 2 (n + 1)2 ] + θ2 ( d n n + 1 − 1 )2 (b) Para esto utilizaremos el método de la derivada ∂ ∂c ECM(θ̃c) = 2c θ2 12n + θ2c 2 − θ2 = 0 −→ 2c θ 2 12n + cθ2 2 − θ2 = 0 c ( 1 6n θ2 + θ2 2 ) = θ2 c ( θ2 + 3nθ2 6n ) = θ2 c = 6n 1 + 3n Verificando con el criterio de la segunda derivada, es fácil ver que ésta es positiva ∀ θ > 0, luego el valor de c encontrado minimiza el ECM(θ̃c). ∂ ∂d ECM(θ̃d) = 2θ 2d ( n n + 2 − n 2 (n + 1)2 ) + 2θ2 ( d n n + 1 − 1 ) n n + 1 = 0 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 36 Caṕıtulo 1. Estimación −→ 2θ2d ( n n + 2 − n 2 (n + 1)2 ) + 2θ2 ( d n2 (n + 1)2 − n n + 1 ) = 0 2θ2d ( n(n + 1)2 − n2(n + 2) (n + 2)(n + 1)2 ) + 2θ2d n2 (n + 1)2 − 2θ2 n n + 1 = 0 2θ2 /(n(n + 1)2 − n2(n + 2) + n2(n + 2) (n + 2)(n + 1)2 ) = 2θ2 / n n + 1 d = n n + 1 ( (n + 2)(n + 1)2 n(n + 1)2 ) d = n + 2 n + 1 Verificando con el criterio de la segunda derivada, es fácil ver que ésta es positiva ∀ θ > 0, luego el valor de d encontrado minimiza el ECM(θ̃d). EJERCICIO 23 Sean X1, X2, ..., Xn variables aleatorias con función de densidad dada por: f(x; α, β) = 1 2β e −|x−α| β x, α ∈ R y β ≥ 0 Determine un estimador insesgado y de varianza mı́nima para β Hint: E(X) = α, V (X) = 2β2 y | X − α |∼ Exp( 1 β ). SOLUCIÓN Para encontrar tal estimador, se utilizará el método del EMV. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 37 L(x; β) = n∏ i=1 1 2β e− |xi−α| β = 1 (2β)n exp { − 1 β n∑ i=1 |xi − α| } \ ln `(x; β) = − 1 β n∑ i=1 |xi − α| − n ln(2β) \∂β ∂` ∂β = n∑ i=1 |xi − α| β2 − n β = 0 −→ β̂ = n∑ i=1 |xi − α| n Para determinar si es insesgado, se ocupa el Hint: E(|X − α|) = β V ar(|X − α|) = β2 Por lo tanto resulta: E n∑ i=1 |xi − α| n = 1n n∑ i=1 E(|xi − α|) = 1 n n∑ i=1 β = β ∴ Por lo tanto es Insesgado Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 38 Caṕıtulo 1. Estimación Recordemos que la CCR = (h(β) ′)2 I(β) donde I(β) = −E ( ∂2 ∂β2 `(x) ) . Calculamos la varianza, y veremos si alcanza la CCR, de ser aśı seŕıa de varianza mı́nima. V ar n∑ i=1 |xi − α| n = 1n2 n∑ i=1 V ar(|xi − α|) = 1 n2 n∑ i=1 β2 = β2 n Como el estimador es insesgado, solo queda por calcular I(β) I(β) = −E ( ∂2 ∂β2 `(x) ) = −E −2 n∑ i=1 |xi − α| β3 + n β2 = 2 β3 E ( n∑ i=1 |xi − α| ) − n β2 = 2 β3 nβ − n β2 = n β2 Por lo tanto CCR = β 2 n la cual corresponde a la V ar(β̂). Por lo tanto es de varianza mı́nima. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 39 EJERCICIO 24 Sea X1, . . . , Xn iid Ber(p). (a) Demuestre utilizando dos formas distintas que T = n∑ i=1 xi es un estad́ıstico suficiente. (b) Se quiere estimar V ar(X1). Muestre que W = X1(1 −X2) es un estimador insesgado de V ar(X1). (c) Encuentre un mejor estimador de W . SOLUCIÓN (a) Por Teorema de Factorización de Neyman. Teorema 1 Si existen funciones g() y h(), tales que f(x; θ) = g(T (x), θ) · h(x), en- tonces T (x) es estad́ıstico suficiente. Para este caso de la Bernoulli: L(x; θ) = n∏ i=1 f(x; θ) = n∏ i=1 θxi(1− θ)1−xi = θ ∑ xi(1− θ)n− ∑ xi︸ ︷︷ ︸ · 1︸︷︷︸ g(T (x), θ) h(x) −→ T (x) = n∑ i=1 xi Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 40 Caṕıtulo 1. Estimación Por familia Exponencial Si f(x, θ) = exp{T (x)c(θ) + d(θ) + s(x)} entonces T (x) es estad́ıstico suficiente. Para este caso de la Bernoulli: L(x; θ) = n∏ i=1 f(x; θ) = n∏ i=1 θxi(1− θ)1−xi = θ ∑ xi(1− θ)n− ∑ xi = ( θ 1− θ )∑ xi (1− θ)n \ ln \ exp = exp n∑ i=1 xi︸ ︷︷ ︸ ln ( θ 1− θ ) ︸ ︷︷ ︸+ n ln(1− θ)︸ ︷︷ ︸+ 0︸︷︷︸ T (x) c(θ) d(θ) s(x) Por lo tanto T (x) = n∑ i=1 xi es estad́ıstico suficiente. (b) Tenemos que W = X1(1−X2) y como X1 ∼ Ber(p) entonces V ar(X1) = p(1− p). E(W ) = E(X1(1−X2)) = E(X1)− E(X1X2) ind = E(X1)− E(X1)E(X2) = p− p2 = p(1− p) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.1 Ejercicios Resueltos 41 Por lo tanto W es un estimador insesgado de la varianza de X1. (c) Usando el Teorema Rao - Blackwell, el cual dice: Teorema 2 Si T (y) es un estimador insesgado de h(θ) y S(y) es un estad́ıstico suficiente de θ, entonces I(y) = E(T (y)|S(y)) es un estimador insesgado de h(θ) y cumple con V ar(I(y)) ≤ V ar(T (y)). tenemos lo siguiente: Φ(x) = E ( X1(1−X2) ∣∣∣∣ n∑ i=1 xi = u ) = 1 · P ( X1(1−X2) = 1 ∣∣∣∣ n∑ i=1 xi = u ) + 0 · P ( X1(1−X2) = 0 ∣∣∣∣ n∑ i=1 xi = u ) = P ( X1(1−X2) = 1 ∣∣∣∣ n∑ i=1 xi = u ) = P ( X1 = 1, X2 = 0 ∣∣∣∣ n∑ i=1 xi = u ) = P ( X1 = 1, X2 = 0, n∑ i=1 xi = u ) P ( n∑ i=1 xi = u ) = P ( X1 = 1, X2 = 0, n∑ i=3 xi = u− 1− 0 ) P ( n∑ i=1 xi = u ) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 42 Caṕıtulo 1. Estimaciónind = P (X1 = 1)P (X2 = 0)P ( n∑ i=3 xi = u− 1 ) P ( n∑ i=1 xi = u ) = p(1− p) ( n−2 u−1 ) pu−1(1− p)n−2−u+1( n u ) pu(1− p)n−u = ( n−2 u−1 )( n u ) = u(n− u) n(n− 1) = X(n− u) n− 1 · 1/n 1/n = nX(1−X) n− 1 El cual, por Rao-Blackwell, es mejor estimador. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.2 Ejercicios Propuestos 43 1.2. Ejercicios Propuestos 1. Sean X1, . . . , Xn i.i.d∼ P(λ). Se considera el estimador de λ, Sa = aX. a) Encuentre el sesgo, varianza y E.C.M. de Sa(X) en función de a y de λ. b) Para λ fijo, encuentre el valor de a que minimice el E.C.M. c) Para a fijo, determine para qué valores de λ, Sa(X) es mejor que X. 2. Sean X1, . . . , Xn i.i.d∼ N(µ, σ2) y considere la familia de estimadores σ2α = α n∑ i=1 (Xi −X)2 Encuentre el valor de α que minimice el E.C.M. 3. Sean X1, . . . , Xn i.i.d∼ N(µ, σ2). Sea Ta(X1, . . . , Xn) = aX. Encuentre el valor de a que minimice el E.C.M. si se quiere estimar µ. Estudie el comportamiento cuando: a) σ → 0 b) σ →∞ c) n→∞ 4. Sean Y1, . . . , Yn i.i.d. con distribución Uniforme en el intervalo [0, θ] y sea Ymax el máximo de los n valores. Alguien sugiere utilizar Ymax para estimar θ. Calcule el error cuadrático medio de este estimador en función de θ. Indicación: Verifique que a) Ymax θ ∼ Beta(n, 1) b) Si Z ∼ Beta(α, β) entonces V (Z) = α α+β β α+β 1 α+β+1 5. Demuestre que n∑ i=1 xi es suficiente minimal cuando a) xi i.i.d. P(λ) b) xi i.i.d. E(λ) 6. Sea X1, . . . , Xn una muestra de una población con densidad f(x) = 1 σ exp{−(x− µ)/σ}, µ < x <∞, 0 < σ <∞ Encuentre un estad́ıstico suficiente bidimensional para (µ, σ). 7. Suponga X1, . . . , Xn es una muestra de una población con cada una de las siguientes densidades. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 44 Caṕıtulo 1. Estimación a) f(x|θ) = θxθ−1, 0 < x < 1, θ > 0. b) f(x|θ) = θaxa−1exp(−θxa), x > 0, θ > 0, a > 0. c) f(x|θ) = θaθ/x(θ+1), x > a, θ > 0, a > 0. Encuentre una estad́ıstica suficiente real valorada para θ , con a fijo. 8. Sea θ = (θ1, θ2) un parámetro bivariado. Suponga que T1(x) es suficiente para θ1 siempre que θ2 sea fijo y conocido, mientras que T2(x) es suficiente para θ2 siempre que θ1 sea fijo y conocido. Asuma que θ1 , θ2 vaŕıan independientemente,θ1 ∈ Ω1, θ2 ∈ Ω2 y que el conjunto S = {x : f(x|θ) > 0} no depende de θ. a) Muestre que si T1 y T2 no dependen de θ1 y θ2 respectivamente, entonces (T1(X), T2(X)) es suficiente para θ. b) Exhiba un ejemplo en el cual (T1(X), T2(X)) es suficiente para θ, T1(X) es sufi- ciente para θ1 cuando θ2 es fijo y conocido, pero T2(X) no es suficiente para θ2 cuando θ1 es fijo y conocido. 9. Sea X1, . . . , Xn una muestra de una población con densidad f(x|θ) dada por f(x|θ) = 1 σ exp { − ( x− µ σ )} , x ≤ µ Donde θ = (µ, σ) con −∞ < µ <∞, σ > 0. a) Muestre que mı́n(X1, . . . , Xn) es suficiente para µ cuando σ es fijo. b) Encuentre un estad́ıstico suficiente minimal para σ cuando µ es fijo. c) Encuentre un estad́ıstico suficiente bidimensional para θ. 10. Sea X1, . . . , Xn una m.a de una población con densidad f(x) = θxθ−1, 0 < x < 1, θ > 0 a) ¿Es ∑ Xi suficiente para θ?. 11. Sean X1, . . . , Xn iid∼ Poisson(θ), θ > 0. Se quiere estimar g(θ) = exp{−aθ} con a 6= 0. Se propone el estimador siguiente Tn = ( 1− a n )nX Estudie y comente las propiedades que tiene el estimador propuesto. 12. Sean Y1, . . . , Yn una m.a. de una población con densidad Beta(p, q). Muestre que el estad́ıstico suficiente para (p, q) es (t1, t2), donde t1 = ( n∏ i=1 yi )1/n , t2 = ( n∏ i=1 (1− yi) )1/n son la media geométrica de los yi y de (1− yi) respectivamente. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.2 Ejercicios Propuestos 45 13. Muestre que las siguientes distribuciones pertenecen a la Familia Exponencial a) Poisson b) Exponencial c) Gamma d) Beta e) Weibull 14. Sean X1, . . . , Xn i.i.d. con densidad f(x, θ) = θxθ−1, 0 ≤ x ≤ 1, θ > 0 Encuentre el estimador de θ por el método de sustitución de momentos. 15. Sean X1, . . . , Xn i.i.d. U(θ1, θ2). Encuentre el estimador de momentos de q(θ1, θ2) = θ1+θ2 2 . 16. Sean X1, . . . , Xn i.i.d con función de densidad f(x, θ) = e−(x−θ)e−e −(x−θ) , −∞ < x <∞, −∞ < θ <∞ Encuentre un estad́ıstico suficiente. 17. En un experimento de cruce de arvejas, una arveja puede resultar de tipo 1 con prob- abilidad (1 − θ)2, de tipo 2 con probabilidad 2θ(1 − θ) o de tipo 3 con probabilidad θ2, 0 < θ < 1, θ desconocido. Se examinan n arvejas y se observa Nj = número de arvejas del tipo j, j = 1, 2, 3. a) Demuestre que N2 + 2N3 es un estad́ıstico suficiente. b) Encuentre los EMV de las probabilidades que una arveja resulte del tipo j, j = 1, 2, 3. 18. El número de errores tipográficos en una página de un diario sigue una P(λ). Se tienen observaciones X1, . . . , Xn independientes, donde Xi = número de errores tipográficos en la i-ésima página de un diario, i = 1, . . . , n. Encuentre el EMV de q(λ) = los errores de una página exceden 21. 19. Sean X1, . . . , Xn i.i.d Bernoulli(p) con 0 < p < 1. Se quiere estimar insesgadamente g(p) = p. a) Muestre que el estimador X1 es insesgado para g(p) y mediante el teorema de Rao-Blackwell encuentre un estimador mejor que X1. Compruebe que es mejor. b) Muestre que el estimador 1 2 (X1 + X2) es insesgado para g(p) y al igual que en (a) encuentre un mejor estimador. Compruebe que es mejor. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 46 Caṕıtulo 1. Estimación 20. Sean X1, . . . , Xn i.i.d con función de densidad f(x; θ) = 1 σ exp{−(x− µ)/σ}1(x>µ) con θ = (µ, σ) a) Muestre que E(x) = µ + σ. b) Muestre que T = (X(1), ∑n i=1(Xi −X(1))) es suficiente para θ. 21. Suponga que X1, . . . , Xn, Xn+1 son i.i.d Bernoulli(p). Se quiere estimar g(p) = P ( ∑n i=1 Xi > Xn+1). a) Muestre que 1(∑ni=1 Xi>Xn+1) es un estimador insesgado de g(p). b) Encuentre un estimador mejor que el propuesto en (a). 22. Sea Y1, ..., Yn ∼ N(µ, σ2). Si µ es conocido, demuestre que σ̂2 = ∑ (Yi−µ)2 n alcanza la cota de Cramer–Rao. Comente la significancia de este resultado. 23. Suponga que cuando medimos el radio de un ćırculo lo hacemos con un error cuya distribución es N(0, σ2) y que realizamos n mediciones independientes. Encuentre un estimador insesgado para el área del ćırculo y vea si la varianza de este estimador alcanza la cota de Cramer-Rao. 24. Sea Y una v.a. con función de probabilidad PY (y; θ) = ( θ 2 )|y| (1− θ)1−|θ| , y = −1, 0, 1 y 0 ≤ θ ≤ 1. a) Defina el estimador W (Y ) = { 2 si Y = 1 0 en otro caso Muestre que W (Y ) es un estimador insesgado de θ. b) Encuentre un estimador insesgado mejor que W (Y ) y muestre que es mejor. c) Verifique si el estimador en (b) alcanza la cota de Cramer-Rao. 25. Sean X1, . . . , Xn i.i.d N(µ, σ 2). Muestre que T = Γ(n−1 2 ) √ 2Γ(n 2 ) √√√√ n∑ i=1 (Xi −X)2 es insesgado para σ2. 26. Se tienen 2 lotes con artefactos de 2 marcas distintas. Cada artefacto de marca i falla con probabilidad pi, i = 1, 2. Se obtienen m.a de tamaño ni del lote i = 1, 2 y se observa Xi = número de defectuosos en la muestra i. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 1.2 Ejercicios Propuestos 47 a) Encuentre un estad́ıstico suficiente para (p1, p2). b) Encuentre estimadores insesgados de p1 y p2 que sean funciones del estad́ıstico encontrado en (a). 27. Sea Y1, . . . , Yn una muestra aleatoria de la distribución Binomial(1, π), donde π es un parámetro desconocido. Calcule los estimadores máximo verośımil y de momentos de π. 28. Suponga una muestra de tamaño n de la distribución Normal(µ, σ2). Encuentre el estimador máximo verośımil para µ, con σ2 conocido y el estimador máximo verośımil para σ2, con µ conocido. 29. Sea Y1, ..., Yn una muestra de la distribución N(µ, σ 2). a) Grafiquela función de verosimilitud y su logaritmo si σ2 = 1, Y = 10. b) Grafique el logaritmo de la función verosimilitud si Y = 10, ∑ (Yi − Y )2 = 20. c) Repita (a) si el tamaño de la muestra es 100. Compare los resultados. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 48 Caṕıtulo 1. Estimación Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. Caṕıtulo 2 Test de Hipótesis 2.1. Ejercicios Resueltos EJERCICIO 25 Sean X1, ..., Xn v.a. i.i.d. N(µ, σ 2), con σ2 conocido (a) Encuentre la region de rechazo para el T.R.V. de H0 : µ = µ0 versus H1 : µ 6= µ0 (b) Encuentre el I.C. de 1− α % resultante de la inversion del test en (a) SOLUCIÓN (a) El primer paso a seguir es construir la verosimilitud de los datos y encontrar el EMV del parámetro testeado. L(x; µ) = n∏ i=1 (2πσ2)− 1 2 exp { − 1 2σ2 (xi − µ)2 } = (2πσ2)− n 2 exp { − 1 2σ2 n∑ i=1 (xi − µ)2 } \ ln `(x; µ) = −n 2 ln(2πσ2)− 1 2σ2 n∑ i=1 (xi − µ)2 \∂µ Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 50 Caṕıtulo 2. Test de Hipótesis ∂`(x; µ) ∂µ = 1 σ2 n∑ i=1 (xi − µ) = 0 −→ n∑ i=1 xi = nµ µ̂ = n∑ i=1 xi n = x Ahora, para construir el TRV encontramos λ de la forma: λ = LH0(x) LH1(x) < c de modo que en LH0(x) se reemplaza el valor de µ bajo H0 y en LH1(x) se reemplaza el valor de µ bajo H1, en caso de no ser espećıfico tal valor, se reemplaza por el EMV . Por lo tanto se tiene: λ = (2πσ2)− n 2 exp { − 1 2σ2 n∑ i=1 (xi − µ0)2 } (2πσ2)− n 2 exp { − 1 2σ2 n∑ i=1 (xi − x)2 } = exp { − 1 2σ2 n∑ i=1 (xi − µ0)2 + 1 2σ2 n∑ i=1 (xi − x)2 } = exp { 1 2σ2 [ n∑ i=1 (xi − x)2 − n∑ i=1 (xi − µ0)2 ]} = exp { − n 2σ2 (x2 − 2µ0x + µ20) } \ ln ln(λ) = − n 2σ2 (x2 − 2µ0x + µ20) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 51 Debe cumplirse que − n 2σ2 (x2 − 2µ0x + µ20) < c \ − 2σ2 n < 0 (x− µ0)2 > c1 \ √ · |x− µ0| > k Por lo tanto la región de rechazo R = {|x−µ0| > k} donde k dependerá del nivel de confianza y la distribución del resultado. (b) La inversión de la región anterior, se traduce en una región de confianza A = Rc = {|x− µ0| ≤ k} Por lo tanto un intervalo de confianza simétrico y de nivel α, bajo H0, se traduce en: P (|x− µ| ≤ k) = 1− α P (|x− µ| ≤ k) = P (−k ≤ x− µ ≤ k) Por otro lado sabemos que X ∼ N(µ, σ2 n ), luego estandarizando se tiene que √ n(x−µ) σ ∼ N(0, 1). P (−k ≤ x− µ ≤ k) = P ( −k √ n σ ≤ √ n(x− µ) σ ≤ k √ n σ ) = P ( Z ≤ k √ n σ ) − P ( Z < −k √ n σ ) = P ( Z ≤ k √ n σ ) − 1 + P ( Z < k √ n σ ) = P ( Z ≤ k √ n σ ) = 1− α 2 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 52 Caṕıtulo 2. Test de Hipótesis Por lo tanto debe cumplirse que: k √ n σ = Z1−α 2 k = Z1−α 2 σ√ n Finalmente, el intervalo de 100(1− α) % confianza será de la forma −Z1−α 2 σ√ n ≤ x− µ ≤ Z1−α 2 σ√ n x− Z1−α 2 σ√ n ≤ µ ≤ x + Z1−α 2 σ√ n EJERCICIO 26 Sea X una v.a. con densidad f(x) = e−x, x > 0 Se obtiene una observación de la v.a. Y = Xθ, θ ∈ (1, 2) y se necesita construir un test para H0 : θ = 1 versus H1 : θ = 2 (a) Encuentre el test óptimo al nivel de significancia α = 0,01 (b) Calcule la potencia del test en la parte (a). SOLUCIÓN (a) Lo primero que debemos hacer, es encontrar la función densidad de Y , para poder realizar el TRV . Utilizando técnicas de Probabilidades (Teorema Cambio de Variable), se tiene que: fY (y) = 1 θ e−y 1 θ y 1−θ θ , y > 0 Recordemos que solo tenemos una observación, por lo que la verosimilitud es la misma den- sidad. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 53 λ = fY (y)H0 fY (y)H1 → e −y e−y 1 2 y− 1 2 ≤ c → e−y+ √ yy 1 2 ≤ c1 \ ln → − y +√y + ln(√y) ≤ c2 Esta inecuación, se refleja en la siguiente gráfica Figura 2.1: TRV Luego las soluciones cumplen con y ≤ c4 o y ≥ c5 (Región de Rechazo). Por lo tanto, bajo H0, Y ∼ Exp(1) y resulta: P (Y ≤ c4 ∨ Y ≥ c5) = ∫ c4 0 e−xdx + ∫ ∞ c5 e−xdx Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 54 Caṕıtulo 2. Test de Hipótesis Ahora, hay varias alternativas, por ejemplo que c4 = 0. P (Rechazo) = ∫ ∞ c5 e−xdx = −e−x ∣∣∣∞ c5 = e−c5 = α \ ln −c5 = ln(α) c5 = − ln(α) Por lo tanto R = {y ≥ − ln(α)} es el test óptimo de acuerdo al Lema de Neyman - Pearson. Reemplazando α = 0,10, se tiene que R = {y ≥ 2,3}. (b) Recordemos que la potencia del test, es P (Rechazar|H1), por lo que se tiene: P (Y ≥ 2,3) = P (X2 ≥ 2,3) = P (X ≥ √ 2,3) = ∫ ∞ √ 2,3 e−xdx = −e−x ∣∣∣∞√ 2,3 = e− √ 2,3 = 0,219 EJERCICIO 27 La legislación impone a los aeropuertos ciertas normas con respecto al ruido emitido por los aviones en el despegue y aterrizaje. En los alrededores, el limite aceptado es de 80 decibels. Mas allá de este limite el aeropuerto debe pagar multa. Los habitantes aseguran que el ruido en dicha zona sobrepasa el valor limite. El aeropuerto, que asegura que no es cierto, decide contratar un grupo de expertos, quienes para concluir asumen que la intensidad del ruido sigue una distribución N(µ, 49). Si se considera H0 : µ = 80 versus H1 : µ = 78 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 55 Encuentre la region critica de Neyman-Pearson, para un nivel de significación del 0.05. ¿Qué decisión tomarán los expertos si se obtiene un promedio de 79.1 decibels en una mues- tra de 100 aviones ? Encuentre el error tipo I y el error tipo II. SOLUCIÓN Comenzamos por calcular la verosimilitud de los datos, para posteriormente reemplazar los valores de µ, según Neyman-Pearson. L(x) = n∏ i=1 ( 1 2πσ2 ) 1 2 exp { −1 2 (xi − µ)2 σ2 } = (2πσ2)− n 2 exp − n∑ i=1 (xi − µ)2 2σ2 Por lo tanto el test queda de la siguiente forma: λ = LH0(x) LH1(x) = (2π49)− n 2 exp − n∑ i=1 (xi − 80)2 2·49 (2π49)− n 2 exp − n∑ i=1 (xi − 78)2 2·49 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 56 Caṕıtulo 2. Test de Hipótesis = exp − n∑ i=1 (xi − 80)2 2 · 49 + n∑ i=1 (xi − 78)2 2 · 49 \ ln = − n∑ i=1 (xi − 80)2 2 · 49 + n∑ i=1 (xi − 78)2 2 · 49 Empezando a despejar la inecuación, resulta: − n∑ i=1 (xi − 80)2 2 · 49 + n∑ i=1 (xi − 78)2 2 · 49 < c \2 · 49 − n∑ i=1 (xi − 80)2 + n∑ i=1 (xi − 78)2 < c1 4 n∑ i=1 xi − 316n < c2 4 n∑ i=1 xi < c3 n∑ i=1 xi < k Luego la región de rechazo es R = { n∑ i=1 xi < k } Ahora para encontrar k, calcularemos el error Tipo I, recordando que X ∼ N(µ, 49 100 ). Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 57 P (RechazarH0|H0) = α P ( n∑ i=1 xi < k ∣∣∣µ = 80) = α P n∑ i=1 xi n < k n ∣∣∣µ = 80 = α P (X < k2|µ = 80) = α P ( x− µ√ 0,49 < k2 − µ√ 0,49 ∣∣∣µ = 80) = α P ( Z < k2 − 80√ 0,49 ) = 0,05 k2 − 80√ 0,49 = −1,65 k2 = 78,845 Luego la región de rechazo es R = n∑ i=1 xi n < 78,845 En este caso x = 79,1 > 78,845 Por lo tanto no existe evidencia en los datos para rechazar H0, luego el ĺımite del ruido es aceptado. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 58 Caṕıtulo 2. Test de Hipótesis P (error Tipo I) = P (rechazar H0|H0) = P n∑ i=1 xi n < 78,845 ∣∣∣µ = 80 = P ( x− µ 0,7 < 78,845− µ 0,7 ∣∣∣µ = 80) = P (Z < −1,65) = 0,05 = α P (error Tipo II) = P (aceptar H0|H1) = P n∑ i=1 xi n > 78,845 ∣∣∣µ = 78 = 1− P ( x− µ 0,7 < 78,845− µ 0,7 ∣∣∣µ = 78) = 1− P (Z < 1,21) = 1− 0,8869 = 0,1131 = β Luego la potencia del Test es 1− β = 1− 0,1131 = 0,8869.Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 59 EJERCICIO 28 Considere una muestra aleatoria X1, . . . , Xn proveniente de una distribución Bernoulli(θ), en donde θ ∈ {0,2, 0,4}. Encuentre un test de tamaño α = 0,05 para la hipótesis H0 : θ = 0,2 versus H1 : θ = 0,4. SOLUCIÓN Comenzaremos por calcular la verosimilitud asociada a esta distribución, para luego aplicar el Lema de Neyman-Pearson. L(x, θ) = θ ∑ xi(1− θ)n− ∑ xi = ( θ 1− θ )∑ xi (1− θ)n Por lo tanto, queda lo siguiente: T = LH1(x) LH0(x) = ( 0,4 0,6 )∑ xi 0,610( 0,2 0,8 )∑ xi 0,810 = 2,666 ∑ xi0,7510 ≥ k \ ln n∑ i=1 xi ln(2,666) + 10 ln(0,75) ≥ k1 n∑ i=1 xi ≥ k1 − 10 ln(0,75) 0,98 n∑ i=1 xi ≥ k1 + 2,876 0,98 = k2 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 60 Caṕıtulo 2. Test de Hipótesis Note que n∑ i=1 xi ∼ Bin(n, θ), por lo tanto para encontrar k, se calcula el error tipo I. P (rechazar H0|H0) = 0,05 P ( n∑ i=1 xi ≥ k2|θ = 0,2 ) = 0,05 EJERCICIO 29 Sea X una variable aleatoria proveniente de una distribución loǵıstica, esto es, f(x) = ex−θ [1 + ex−θ]2 , x ∈ R (a) Encuentre el test de Neyman-Pearson para H0 : θ = 0 versus H1 : θ = 1. (b) Determine la región de rechazo (c) Determine la potencia del test. SOLUCIÓN (a) Según Neyman-Pearson, se rechaza H0 si LH1(x) LH0(x) ≥ k En este caso, como solo se tiene una observación, las verosimilitudes se reducen simplemente a la densidad. Por lo tanto la razón queda de la siguiente forma: ex−1 [1+ex−1]2 ex [1+ex]2 ≥ k (1 + ex)2 ≥ ke(1 + ex−1)2 \√ 1 + ex ≥ √ ke(1 + ex−1) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 61 ex − ex−1 √ ke ≥ √ ke− 1 ex(1− √ ke e ) ≥ √ ke− 1 ex ≥ √ ke− 1 1− √ k√ e = e √ k − √ e √ e− √ k \ ln x ≥ ln ( e √ k − √ e √ e− √ k ) (b) Para encontrar la región de rechazo con α = 0,20, k debe ser tal que P (R|H0) = α Por lo tanto queda lo siguiente P [ X > ln ( e √ k − √ e √ e− √ k )] = 0,2 = ∫ ∞ ln(∗) ex [1 + ex]2 dx = − 1 1 + ex ∣∣∣∣∣ ∞ ln(∗) = 1 1 + eln(∗) = 1 1 + e √ k− √ e√ e− √ k = 0,2 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 62 Caṕıtulo 2. Test de Hipótesis −→ (5− 1)( √ e− √ k) = e √ k − √ e 4 √ e− 4 √ k = 2,7183 √ k − 1,6487 6,7183 √ k = 8,2436 k = 1,5056 Luego con un nivel de confianza del 80 % se rechaza H0 cuando x ≥ 1,3862. (c) La potencia del Test es P (R|H1), luego queda P (R|H1) = P ( x > ln [ e √ 1,51− √ e√ e− √ 1,51 ] ∣∣∣∣∣H1 : θ = 1 ) = ∫ ∞ ln(1,39) ex−1 (1 + ex−1)2 dx = − 1 1 + ex−1 ∣∣∣∣∣ ∞ 1,39 = 1 1 + e1,39−1 = 0,4029 Luego la potencia del test es de 0.4029 cuando α = 0,20. EJERCICIO 30 Use el Lema de Neyman Pearson para establecer la región cŕıtica al hacer un test para H0 : λ = λ0 versus H1 : λ = λ1 con λ1 < λ0 con α = 0,05 y a partir de una muestra aleatoria (Y1, . . . , Yn) de una población con función de densidad f(y, λ) = λ2ye−λy y > 0, λ > 0 SOLUCIÓN Según Neyman Pearson, necesitamos Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 63 Lλ1(y) = n∏ i=1 λ21yie −λ1yi = λ2n1 ( n∏ i=1 yi ) e−λ1 ∑ yi Lλ0(y) = n∏ i=1 λ20yie −λ0yi = λ2n0 ( n∏ i=1 yi ) e−λ0 ∑ yi Por lo tanto haciendo el cuociente, se obtiene λ2n1 ( n∏ i=1 yi ) e−λ1 ∑ yi λ2n0 ( n∏ i=1 yi ) e−λ0 ∑ yi > k ( λ1 λ0 )2n e ∑ yi(λ0−λ1) > k \ ln 2n ln ( λ1 λ0 ) + n∑ i=1 yi(λ0 − λ1) > k1 n∑ i=1 yi(λ0 − λ1) > k1 − 2n ln ( λ1 λ0 ) n∑ i=1 yi > k1 − 2n ln ( λ1 λ0 ) λ0 − λ1 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 64 Caṕıtulo 2. Test de Hipótesis Como se quiere conocer la región para α = 0,05, necesitamos encontrar el valor de k1−2n ln ( λ1 λ0 ) λ0−λ1 correspondiente. Para tal efecto es necesario conocer la distribución de ∑ Yi, pero como Yi ∼ Gamma(2, λ) y son independientes, se tiene que ∑ Yi ∼ Gamma(2n, λ). Luego la re- gión cŕıtica está dada por: P (R|H0) = α P n∑ i=1 Yi > k1 − 2n ln ( λ1 λ0 ) λ0 − λ1 ∣∣∣∣∣H0 : λ = λ0 = 0,05 ∫ ∞ k1−2n ln(λ1λ0 ) λ0−λ1 λ20ye −λ0ydy = 0,05 Luego la región cŕıtica, resultará de la integral evaluada y despejando el valor de k1. EJERCICIO 31 Sea Y1, . . . , Yn una muestra de la distribución Normal con media µ y varianza σ 2 conocida. Considere las hipótesis H0 : µ ≤ µ0 vs H1 : µ > µ0 Determine el valor de k (la región cŕıtica) en función de un nivel de significancia α∗ prede- terminado si se rechaza H0 para Y > k. SOLUCIÓN En primer lugar tenemos que si los Yi ∼ N(µ, σ2) entonces Y ∼ N(µ, σ2/n). Luego para encontrar tal k, recordando que Z ∼ N(0, 1), se precede de la siguiente manera: P (R|H0) = α∗ P (Y > k|H0) = α∗ P (√ n(Y − µ) σ > √ n(k − µ) σ ∣∣∣H0 : µ ≤ µ0) = α∗ Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 65 P ( Z > √ n(k − µ0) σ ) = α∗ 1− P ( Z ≤ √ n(k − µ0) σ ) = α∗ P ( Z ≤ √ n(k − µ0) σ ) = 1− α∗ √ n(k − µ0) σ = Z1−α∗ √ n(k − µ0) = σZ1−α∗ k = µ0 + σ√ n Z1−α∗ Luego la región de rechazo es R = { y : y > µ0 + σ√ n Z1−α∗ } EJERCICIO 32 Sean X1, . . . , Xn variables aleatorias iid con función de densidad f(x, θ) = 2x θ e− x2 θ , x > 0, θ > 0 Construya un TRV para verificar las hipótesis H0 : θ ≥ θ0 versus H1 : θ < θ0 y encuentre su región cŕıtica. Ayuda: ¿Cómo distribuye X2i ?. SOLUCIÓN El supremo de θ ∈ Θ, en L(x) está dado por el EMV de θ. Luego se tiene: Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 66 Caṕıtulo 2. Test de Hipótesis Lθ(x) = n∏ i=1 2xi θ e− x2i θ = ( 2 θ )n( n∏ i=1 xi ) e− 1 θ ∑ x2i \ ln `(x) = n[ln(2)− ln(θ)] + n∑ i=1 ln(xi)− 1 θ n∑ i=1 x2i \∂θ ∂`(x) ∂θ = −n θ + 1 θ2 n∑ i=1 x2i = 0 n∑ i=1 x2i θ2 = n θ n∑ i=1 x2i n = θ2/ θ / θ̂ = n∑ i=1 x2i n = x2 Luego el TRV, toma la siguiente forma: 2n∑ i=1 x2i n n n∏ i=1 xi / exp − n n∑ i=1 x2i ∖ n∑ i=1 x2i ∖ ( 2 θ0 )n n∏ i=1 xi / exp { − n θ0 n∑ i=1 x2i } > k Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 67 nθ0n∑ i=1 x2i n exp { −n + 1 θ0 n∑ i=1 x2i } > k \ ln n ln nθ0n∑ i=1 x2i − n + 1θ0 n∑ i=1 x2i > k1 n ln nθ0n∑ i=1 x2i − 1 + 1θ0 n∑ i=1 x2i > k1 n∑ i=1 x2i > θ0k1 n ln nθ0n∑ i=1 x2i ︸ ︷︷ ︸ c Por lo tanto la región de cŕıtica está dada por: R = { x : n∑ i=1 x2i > c } donde c debe cumplir que P ( n∑ i=1 x2i > c ∣∣∣H0) = α Luego para determinar c se necesita conocer la distribución de n∑ i=1 x2i . Por teoŕıa de Probabilidades (Teorema Cambio de Variable) se tiene que W = n∑ i=1 x2i ∼ Gamma ( n, 1 θ ) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 68 Caṕıtulo 2. Test de Hipótesis Por lo tanto, para conocer c, dado un cierto nivel de significancia α, se deberá resolver la siguiente ecuación: P ( n∑ i=1 x2i > c ∣∣∣H0) = ∫ ∞ c 1 θnΓ(n) wn−1e− w θ dw = α EJERCICIO 33 Sea Xi la diferencia entre los tiempos de duración de las i-ésimas piezas de dos equipos similares, i = 1, . . . , n. Si todas las piezas funcionan independientemente y los tiempos de duración de estas piezas siguen una distribución exponencial de parámetro λ, se puede demostrar que X1, . . . , Xn es una muestra aleatoria iid con función de densidad dada por: f(x, λ) = 1 2 λe−λ|x| x ∈ R, λ > 0 Construya un TRV para verificar las hipótesis H0 : λ ≥ λ0 versus H1 : λ < λ0 y encuentre su región cŕıtica. Ayuda: ¿Cómo distribuye |Xi|?. SOLUCIÓN El TRV dice que rechace H0 si: LH1(x) LH0(x) > k Luego para comenzar,es necesario conocer el EMV de λ para su posterior reemplazo en el TRV . L(x; λ) = n∏ i=1 1 2 λe−λ|xi| = ( λ 2 )n e−λ ∑ |xi| \ ln `(x; λ) = n(ln(λ)− ln(2))− λ n∑ i=1 |xi| \∂λ ∂`(x; λ) ∂λ = n λ − n∑ i=1 |xi| = 0 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 69 n λ = n∑ i=1 |xi| λ̂ = n n∑ i=1 |xi| Luego el TRV nos queda como sigue: n 2 n∑ i=1 |xi| n exp − n n∑ i=1 |xi| / n∑ i=1 |xi| / ( λ0 2 )n exp { −λ0 n∑ i=1 |xi| } > k n λ0 n∑ i=1 |xi| n exp { −n + λ0 n∑ i=1 |xi| } > k \ ln n ln n λ0 n∑ i=1 |xi| − n + λ0 n∑ i=1 |xi| < k1 λ0 n∑ i=1 |xi| < k1 − n ln n λ0 n∑ i=1 |xi| − 1 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 70 Caṕıtulo 2. Test de Hipótesis n∑ i=1 |xi| < k1 − n ln n λ0 n∑ i=1 |xi| − 1 λ0︸ ︷︷ ︸ c Luego la región de rechazo está dada por R = { x : n∑ i=1 |xi| < c } donde c se obtiene para algún α dado como: P ( n∑ i=1 |xi| < c ∣∣∣H0) = α considerando que n∑ i=1 |xi| ∼ Gamma(n, λ). EJERCICIO 341 Sea X1, . . . , X25 una muestra aleatoria de una población normal con varianza igual a 100. (a) Derive, paso a paso, el test óptimo para determinar la región de rechazo de H0 : µ = 0 versus H1 : µ = 2 con un nivel de significancia de α = 10 %. ¿Cuál es la potencia del test? (b) Para la misma situación anterior, pero con H1 : µ > 0. Evalue la potencia en µ = 1 y µ = 2 para n = 25 y n = 100. A partir de estos puntos, bosqueje las curvas de potencia del test en el mismo eje de coordenadas (indique claramente la leyenda de los ejes). SOLUCIÓN (a) Considerando las hipótesis, el test óptimo está dado por Neyman-Pearson, por lo tanto se tiene: 1Pregunta I2 II Sem. ’03 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 71 λNP = LH0(x) LH1(x) = (2πσ2)− n 2 e− 1 2σ2 ∑ x2i (2πσ2)− n 2 e− 1 2σ2 ∑ (xi−2)2 = e− 1 2σ2 [ ∑ x2i− ∑ (xi−2)2] = e− 1 2σ2 [4( ∑ xi−n)] Ahora lo que se necesita es el valor de c tal que P (λNP < c ∣∣∣H0) = α, es decir P ( e− 1 2σ2 [4( ∑ xi−n)] < c ∣∣∣H0 : µ = 0) = α P ( n∑ i=1 xi > c ∗ ∣∣∣H0 : µ = 0) = α Además tenemos que bajo H0, ∑ xi n ∼ N(0, σ2/n) con σ2 = 100 y n = 25, luego resulta: P ( n∑ i=1 xi > c ∗ ∣∣∣H0 : µ = 0) = P n∑ i=1 xi n > c∗∗ Se estandariza: P ( x 10/ √ 25 > c∗∗ 2 ) = α = 0,1 −→ c ∗∗ 2 = 1,28 c∗∗ = 2,56 −→ c∗ = 64 Luego la región de rechazo para H0 es Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 72 Caṕıtulo 2. Test de Hipótesis R = { x : n∑ i=1 xi > 64 } o bien R = {x : x > 2,56} Ahora la potencia del test, está dada por P ( n∑ i=1 xi > 64 ∣∣∣H1) = P (x− µ1 σ/ √ n > 2,56− 2 2 ) = P (Z > 0,28) = 1− 0,6103 = 0,3897 (b) Cuando n = 25 y σ2 = 100 con α = 10 %. Se rechaza H0 si x > 2,56, luego tenemos que ∏ (µ = 1) = P (x > 2,56) = P (Z > 2,56− 1 2 ) = P (Z > 0,78) = 0,2177 ∏ (µ = 2) = P (x > 2,56) = P (Z > 2,56− 2 2 ) = P (Z > 0,28) = 0,3897 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 73 Cuando n = 100 y σ2 = 100 con α = 10 %. Se rechaza H0 si x > 2,56, luego tenemos que ∏ (µ = 1) = P (x > 1,28) = P (Z > 1,28− 1 1 ) = P (Z > 0,28) = 0,3897 ∏ (µ = 2) = P (x > 1,28) = P (Z > 1,28− 2 1 ) = P (Z > −0,72) = 0,7642 Figura 2.2: Curvas de Potencia Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 74 Caṕıtulo 2. Test de Hipótesis EJERCICIO 352 Sea X1, . . . , Xn variables aleatorias independientes distribuidas según la siguiente función de probabilidad discreta, con 0 < θ < 1 x 1 2 3 P (X = x) θ2 2θ(1− θ) (1− θ)2 Sea Ni el número de observaciones igual a i, para i = 1, 2, 3, con ∑ Ni = n. Determine la regla óptima de nivel α = 0,1, en términos de N1, N2, N3, para la hipótesis H0 : θ = θ0 versus H1 : θ 6= θ0. SOLUCIÓN En este caso la regla óptima se traduce a utilizar el TRV , para lo cual en esta ocasión nece- sitamos el EMV de θ. L(x) = n! N1!N2!N3! (θ2)N1(2θ(1− θ))N2((1− θ)2)N3 = n! N1!N2!N3! 2N2θ2N1+N2(1− θ)2N3+N2 \ ln `(x) = (2N1 + N2) ln(θ) + (2N3 + N2) ln(1− θ) \∂θ ∂`(x) ∂θ = 2N1 + N2 θ − 2N3 + N2 1− θ = 0 θ̂ = 2N1 + N2 2(N1 + N2 + N3) Por lo tanto, construyendo la razón de verosimilitudes, se obtiene: Λ = n! N1!N2!N3! 2N2θ2N1+N20 (1− θ0)2N3+N2 n! N1!N2!N3! 2N2 θ̂2N1+N2(1− θ̂)2N3+N2 = ( θ0 θ̂ )2N1+N2 (1− θ0 1− θ̂ )2N3+N2 2Pregunta I2 II Sem. ’03 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.1 Ejercicios Resueltos 75 Recordemos que −2 ln(Λ) ∼ χ2(m). Por lo tanto se rechaza H0 si −2 ln(Λ) > χ2α(m) , esto es: −2 [ (2N1 + N2) ln ( θ0 θ̂ ) + (2N3 + N2) ln ( 1− θ0 1− θ̂ )] > 2,71 = χ20,1(1) EJERCICIO 36 Un fabricante de fibras textiles está investigando una nueva fibra para tapiceŕıa, la cual tiene una elongación media por hilo de 12 kg. con una desviación estándar de 0.5 kg. La compañ́ıa desea probar la hipótesis H0 : µ1 ≥ 12, utilizando para ello una muestra aleatoria de tamaño 4. (a) ¿Cuál es la probabilidad del error tipo I si la región cŕıtica está definida como x < 11,5kg. (b) Encuentre el error tipo II para el caso donde la verdadera elongación promedio es 11.5 kg. SOLUCIÓN (a) Error Tipo I : P (rechazar H0 ∣∣H0) = α. Considerando (bajo H0) que X ∼ N(12, 0,52) −→ X ∼ N(12, 0,52/4) P (x < 11,5 ∣∣H0) = P ((x− 12)√4 0,5 < (11,5− 12) √ 4 0,5 ) = P (Z < −2) = 0,02275 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 76 Caṕıtulo 2. Test de Hipótesis (b) Error Tipo II: P (aceptar H0 ∣∣H1) = β Considerando (bajo H1) que X ∼ N(11,5, 0,52) −→ X ∼ N(11,5, 0,52/4) P (x ≥ 11,5 ∣∣H1) = P ((x− 11,5)√4 0,5 ≥ (11,5− 11,5) √ 4 0,5 ) = P (Z ≥ 0) = 0,5 Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.2 Ejercicios Propuestos 77 2.2. Ejercicios Propuestos 1. Sean Y1, . . . , Yn v.a i.i.d representando la proporciónón de cierta componente qúımica presente en n muestras de un determinado producto, y cuya función de densidad es dada por f(y|θ) = θyθ−1, 0 < y < 1 a) Encuentre el EMV de θ. b) Utilizando el Lema de Neyman-Pearson, construya un test de nivel α para con- trastar H0 : θ = θ0 vs H1 : θ = θ1 (θ1 > θ0) c) Evalúe el test cuando θ0 = 0,3, θ1 = 0,6, α = 0,05 y y1 0.1 y2 0.8 y3 0.5 y4 0.4 y5 0.6 Ayuda: Utilice que −2 ∑n i=1 log Yi ∼ χ22n y que χ210(0,95) = 18,30 2. Suponga que el número de tiros al aro de Michael Jordan hasta que éste convierte su primera anotación sigue una distribución geométrica de parámetro θ, donde θ repre- senta la probabilidad de convertir una anotación, es decir P (X = x) = (1− θ)x−1θ x = 1, 2, . . . 0 ≤ θ ≤ 1 a) En una m.a de n partidos, en los cuales M. Jordan ha convertido al menos un gol se observan X1, . . . , Xn donde Xi = Número de tiros al arco del “aéreo” hasta convertir una anotación en el i-ésimo partido. Determine la región cŕıtica de nivel α para contrastar las siguientes hipótesis: H0 : θ = θ0 H1 : θ = θ1 (θ1 > θ0) Utilice aproximación Normal. b) Suponga que θ0 = 0,5 y θ1 = 0,8 ¿Cuál seŕıa si conclusión a partir de una muestra de 32 partidos con media muestral de 2.73? Use α = 0,05. 3. Sean X1, . . . , Xn v.a i.i.d con distribución de Pareto, es decir f(x|θ, ν) = θν θ xθ+1 1[ν,∞) θ > 0 ν > 0 a) Muestre que el TRV de H0 : θ = 1 vs H1 : θ 6= 1 rechaza H0 si −T + n log T < k con T = log ( ∏n i=1 Xi (mı́ni Xi)n ) Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 78 Caṕıtulo 2. Test de Hipótesis 4. Un fabricante de neumáticos afirma que, bajo condiciones normales, la vida promedio de sus neumáticoses mayor que 50,000 kms. En una muestra aleatoria simple de 15 neumáticos sometidos a pruebas de duración, se obtiene un promedio de 54,000 kms. con una desviación estándar de 10,000 kms. Suponiendo que la duración de los neumáticos sigue una distribución normal: a) Encuentre un intervalo de 99 % de confianza para la duración promedio de los neumáticos. b) Realice un test de hipótesis para contrastar la afirmación realizada por el fabri- cante de neumáticos. Formule H0 y H1 suponiendo que una publicidad engañosa es el error más grave. Use nivel de significancia 5 %. Concluya. c) Calcule la potencia del test realizado en (b) para µ = 52, 000 kms. 5. Un fabricante sostiene que el diámetro interior de un tubo de aluminio que produce es de 100 mm. Una muestra de 10 tubos fue medida con los siguientes resultados: 100.36 100.31 99.99 100.11 100.64 100.85 99.42 99.91 99.35 100.51 a) ¿ Se aceptaŕıa lo que dice el fabricante? b) ¿Cuál es la probabilidad de aceptar lo que el fabricante afirma cuando el diámetro es realmente 100.55 mm.? (Utilice S2 como estimador de σ2). 6. Muchas casas antiguas tienen sistemas eléctricos que utilizan fusibles en lugar de inter- ruptores automáticos de circuito. Un fabricante de fusibles de 40 A quiere estar seguro de que la media de corriente a la que se queman los fusibles es 40. Si la media de corriente es menor de 40, los clientes se quejan porque deben cambiar los fusibles con mucha frecuencia. Si la media de corriente es mayor de 40, el fabricante podŕıa ser el culpable de los daños al sistema eléctrico por el mal funcionamiento de los fusibles. Para verificar la corriente de los fusibles se debe seleccionar e inspeccionar una mues- tra de éstos. Si fuera a realizarse una prueba de hipótesis sobre los datos resultantes, ¿cuáles hipótesis nula y alternativa seŕıan de interés para el fabricante? 7. Una mezcla de ceniza pulverizada de combustible y cemento Portland para techar debe tener una resistencia a la compresión de más de 1,300KN/m2. La mezcla no se utilizará a menos que una evidencia experimental indique de manera concluyente que se ha cumplido la especificación de resistencia. Supongamos que la resistencia a la compresión para espećımenes de esta mezcla está distribuida normalmente con σ = 60. Representemos con µ el verdadero promedio de resistencia a la compresión. a) ¿Cuáles son las hipótesis nula y alternativa adecuadas? b) Representemos con X el promedio muestral de resistencia a la compresión para n = 20 espećımenes seleccionados al azar. Considere el procedimiento de prueba utilizando el estad́ıstico de prueba X y la región de rechazo x ≥ 1331,26. ¿Cuál es la distribución de probabilidad del estad́ıstico de prueba cuando H0 es verdadera?. ¿Cuál es la probabilidad de un error tipo I para el procedimiento de prueba? Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 2.2 Ejercicios Propuestos 79 8. La consejaĺıa de la juventud de un ayuntamiento maneja el dato de que la edad a la que los hijos se independizan de sus padres es una v.a. normal con media 29 años. Aunque la desviación estándar no plantea dudas, se sospecha que la media ha aumentado, sobre todo por el poco apoyo a la poĺıtica de ayuda al empleo que ha llevado a cabo el ayun- tamiento. Aśı de un estudio reciente sobre 100 jóvenes, que se acaban de independizar, se ha obtenido una media de 30.7 años de edad y una desviación estándar de 3 años. a) Con un nivel de significancia del 1 %, ¿es correcta la sospecha que se tiene, acerca de la edad media que se independizan los jóvenes? b) Se sabe que el porcentaje de personas, que corresponden al sexo femenino y se independizan antes de los 29 años, no supera el 45 %. Si una muestra de 60 jóvenes son mujeres, y 35 de ellas cumple con las caracteŕısticas antes expuestas, que se puede concluir con un nivel de significancia del 5 %. 9. Un consumidor de cierto producto acusa al fabricante diciendo que más del 20 % de las unidades producidas eran defectuosas para confirmar su acusación se utilizó una muestra de tamaño 50 donde el 27 % de los art́ıculos eran defectuosos ¿Qué concluye usted? 10. Una fábrica de hamburguesas inició un proceso de revisión de los estándares de calidad de sus productos. Dichos estándares establecen ciertas dimensiones para el diámetro de sus hamburguesas, el diámetro medio es de 13.9 cm con una desviación estándar estimada de 0.9 cm. Una estándar de calidad establece que el diámetro medio de las hamburguesas debe ser de 14.5 cm ¿Hay alguna evidencia en los datos que las hamburguesas tienen un diámetro incorrecto? ¿Qué supuesto utilizó? 11. Se efectúa una prueba de impacto Izod sobre 20 muestras de tubeŕıa PVC. El estándar ASTM para este material requiere que la resistencia al impacto Izod sea mayor que 1.0 ft-lb/in. El promedio y la desviación estándar muestrales son x = 1,25 y s = 0,25, respectivamente. Pruebe H0 : µ = 1,0 contra H1 : µ > 1,0 utilizando α = 0,01. Obtenga conclusiones. 12. El sistema de enfriamiento de un submarino nuclear está formado por un ensamble de tubeŕıas soldadas por donde circula un ĺıquido refrigerante. Las especificaciones requieren que la resistencia de la soldadura sea mayor o igual que 150 psi. a) Suponga que los ingenieros del diseño deciden probar la hipótesis H0 : µ = 150 contra H1 : µ > 150. Explique por qué esta elección de hipótesis alternativa mejor que H1 : µ < 150. b) Al tomar una muestra aleatoria de 20 soldaduras se tiene que x = 153,7 psi. y s = 11,3 psi. ¿Qué conclusiones pueden obtenerse con respecto a la hipótesis del inciso a)? Utilice α = 0,05. Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 80 Caṕıtulo 2. Test de Hipótesis Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. Caṕıtulo 3 Ejercicios Resueltos de Interrogaciones 3.1. Interrogaciones I 1. Sea X1, X2, . . . , Xn, una muestra aleatoria con función de densidad dada por: f (x |θ ) = θxθ−1I[0,1] (x) determine el EMV y el estimador de momentos de θ. 2. Sean X1, X2, . . . , Xn iid∼ E (λ). Determine la distribución asintótica del EMV de la tasa media µ, la cual se define por µ = 1 λ . 3. Sea X1, X2, . . . , Xn, una muestra aleatoria con función de densidad dada por: f (x |θ ) = θ (1 + x)θ+1 I(0,∞) (x) , donde θ > 0. Determine un estad́ıstico suficiente para θ. 4. Sean X1, X2, . . . , Xn iid∼ U ( θ − 1 2 , θ + 1 2 ) . Determine el error cuadrático medio del esti- mador de momentos de θ. 5. Suponga que X1 es la media de una muestra aleatoria de tamaño n de una población con media µ y varianza σ21, X2 es la media de una muestra aleatoria (independiente de la muestra aleatoria anterior) de tamaño n de una población con media µ y varianza σ22 y que además µ̂ = αX1 + (1− α) X2 es un estimador de µ. a) ¿µ̂ es insesgado? b) ¿Cuál debe ser el valor de α para que la varianza de µ̂ sea mı́nima? 6. Sean X1, X2, . . . , Xn iid∼ Poisson (λ). Recopilación, Organización y Elaboración por Patricia Jiménez P. & Ricardo Olea O. 82 Caṕıtulo 3. Ejercicios Resueltos de Interrogaciones a) Determine un intervalo de confianza a proximado del 95 % de confianza para λ si n = 100 y x = 4. b) Obtenga la distribución asintótica del estimador máximo verośımil de P (X = 0). 7. Sean X1, X2, . . . , Xn v.a. iid con función de densidad dada por: f (x |β ) = β xβ+1 I(1,∞) (x) , donde β > 0. a) Determine el EMV de β. b) Demuestre que n √∏n i=1 Xi es el EMV de exp ( 1 β ) . c) Demuestre que un intervalo de confianza aproximado de nivel (1− α) 100 % para exp ( 1 β ) viene dado por n √√√√ n∏ i=1 Xi ± z1−α 2 n √∏n i=1 Xi × ∑n i=1 ln (Xi) n 3 2 . 8. Sean Y1, . . . , Yn v.a. tales que Yi = βxi + εi, i = 1, . . . , n, con εi iid∼ N (0, σ2) y σ es conocido; y xi son constantes predeterminadas. a) Sean β̂ = 1 n n∑ i=1 Yi xi y β̃ = ∑n i=1 Yi∑n i=1 xi dos estimadores
Compartir