Vista previa del material en texto
http://bajalibrosdeeconomia.blogspot.com/ TRABAJO DE ECONOMETRIA (Heteroscedasticidad) 11.1 Establézcase si las siguientes afirmaciones son ciertas, falsas o inciertas y brevemente de sus razones. a) En presencia de heteroscedasticidad, los estimadores MCO son sesgados al igual que ineficientes. (F) Porque en presencia de heteroscedasticidad los estimadores de MCO siguen siendo insesgados y consistentes pero ya no tienen varianza mínima es decir, ya no son eficientes. b) Si hay heteroscedasticidad, las pruebas convencionales t y F son inválidas. (V) Porque dado que Var ( ) het2β̂ no es mínima los intervalos de confianza tienden a ser innecesariamente grandes y las pruebas “t” y “F” tienden a ser imprecisas. c) En presencia de heteroscedasticidad, el método MCO usual sobreestima siempre los errores estándar de los estimadores. (V) Porque la característica más sobresaliente de estos resultados es que los MCO, con o sin corrección por heteroscedasticidad , sobreestiman consistentemente el verdadero error estándar obtenido mediante el procedimiento MCG, especialmente para valores grandes de α, con lo cual se establece la superioridad de MCG. d) Si los residuales estimados a través de una estimación MCO exhiben un patrón sistemático, significa que hay presencia de heteroscedasticidad en los datos. (V) Porque si los residuos al cuadrado nos da un valor mayor que cero o nos presenta un patrón sistemático significa que existe heteroscedasticidad. e) No hay una prueba general de heteroscedasticidad que este libre de supuesto alguno sobre cuál de las variables esta correlacionada con el término de error. (F) Porque no existe una prueba que nos señale específicamente que variable explicativa esta relacionada con el término de perturbación, sino que más bien nos dan pruebas generales para detectar heteroscedasticidad. f) Si el modelo de regresión esta mal especificado (por ejemplo, se ha omitido una variable importante), los residuos MCO mostraran un patrón claramente distinguible. (V) Es verdadero porque al omitir una variable que tiene relevancia teórica en el modelo se va a distinguir claramente un patrón sistemático, ya que los residuos van a presentar un gran peso por la variable omitida. g) Si una regresora que tiene varianza no constante se omite (incorrectamente) de un modelo, los residuos MCO serán heteroscedásticos. (V) Es verdadero porque si se omite una variable que tiene varianza no constante, esta va a seguir presente en el modelo a través del término de perturbación y seguirá siendo heteroscedástica. 11.2 En una regresión de salarios promedio (W,$) sobre el número de empleados (N) para una muestra aleatoria de 30 empresas. Se obtuvieron los siguientes resultados: =Ŵ 7.5 + 0.009N t = n.a. (16.10) R 90.02 = NW /ˆ = 0.008 + 7.8 (1/N) t =(14.43) (76.58) 2R = 0.99 a) ¿Cómo se interpretan las dos regresiones? i) Dado un incremento unitario en el número de empleados se estima que los salarios promedio también se incrementará en 0.009 dólares, es decir existe una relación directa entre los salarios promedio y el número de empleados, por tanto si se incrementa el número de empleados también se incrementarán los salarios promedios y viceversa. ii) Como observamos en la segunda regresión podemos darnos cuenta que el autor trata de corregir la heteroscedasticidad dividiendo el modelo para la variable estocástica con lo cual el modelo mejora ya que se obtiene un coeficiente de determinación mayor y las pruebas “t” de significancia individual se incrementan. b) ¿Qué esta suponiendo el autor al pasar de la ecuación (1) a la (2)? ¿Estaba preocupado por la heteroscedasticidad? ¿Cómo se sabe? El autor al pasar de la ecuación (1) a la (2) supone que existe heteroscedasticidad y por la misma razón trata de corregir este problema dividiendo la regresión para la variable heteroscedástica a través del método de Mínimos Cuadrados Generalizados que es capaz de producir estimadores que son MELI. c) ¿Se puede relacionar las intersecciones y las pendientes de los modelos? http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ Sí, ya que estamos considerando un mismo modelo en donde las relaciones entre las variables son directas, pero se puede observar que las pendientes y las intersecciones cambian debido a que se utiliza una medida para corregir la heteroscedasticidad. d) ¿Se pueden comparar los valores 2R de los modelos? ¿Por que si o por que no? Los coeficientes de determinación no son comparables en estos dos modelos de regresión ya que la variable dependiente no es la misma debido a la corrección de la heteroscedasticidad. 11.4 Aunque los modelos logarítmicos tales como el modelo de la ecuación (11.6.12) frecuentemente reducen la heteroscedasticidad, se debe prestar cuidadosa atención a las propiedades del término de perturbación de tales modelos. Por ejemplo, el modelo: iii uXY 2 1 ββ= puede escribirse como iii uXY lnlnlnln 21 ++= ββ a) Si iuln tiene valor esperado cero, ¿cuál debe ser la distribución de iu ? La distribución debe ser normal porque la heteroscedasticidad no afecta a la distribución de ui sino que afecta a que la varianza en cada muestreo repetido es diferente. b) Si 1)( =iuE , ¿será 0)(ln =iuE ? ¿Porqué sí o porqué no? Si es igual porque el logaritmo natural de 1 es igual a cero, y por lo tanto no esta afectando al valor esperado de ui sino que afecta únicamente a la varianza de ui. c) Si )(ln iuE es diferente de cero, ¿qué puede hacerse para volverlo cero? Para que este sea cero podríamos multiplicar al resultado de )(ln iuE por cero y de esta manera lograríamos el objetivo, y por tanto el 1)( =iuE . 11.6 Con propósitos pedagógicos Hanushek y Jackson estiman el siguiente modelo: ittt uDPNBC +++= 321 βββ donde =tC gasto agregado de consumo privado en el año t, .PNBt=producto nacional bruto en el año t y Dt= gasto de defensa nacional en el año t, siendo el objetivo del análisis estudiar el efecto de los gastos de defensa sobre otros gastos en la economía. Postulan que 2σ t= 2σ (PNBt) 2, luego transforman (1) y estiman. tittttt PNBuPNBDPNBPNBC /)/()/1(/ 321 +++= βββ Los resultados empíricos basados en la información para 1946-1975 fueron los siguientes (errores estándar entre paréntesis): ttt DPNBC 4398.06248.019.26ˆ −+= (2.73) (0.0060) (0.0736) R2=0.999 )/(4315.06246.0)/1(92.25ˆ/ ttttt PNBDPNBBNPC −+= (2.22) (0.0068) (0.0597) R2=0.875 a) ¿Qué supuesto hacen los autores sobre la naturaleza de la heteroscedasticidad? ¿Puede justificarse? El supuesto que hacen los autores sobre la naturaleza de la heteroscedasticidad es que la varianza del término de perturbación no es constante a lo largo de la regresión y esto puede justificarse debido a que han sido omitidas algunas variables relevantes en el modelo. b) Compárense los resultados de las dos regresiones. ¿La transformación del modelo original ha mejorado los resultados, es decir, ha reducido los errores estándar estimados? ¿Por qué si o por qué no? En general podemos darnos cuenta que en los modelos las relaciones existentes entre las variables explicativas y la dependiente no cambian, pero como los autores señalan que existe heteroscedasticidad tratan de mejorar el modelo y como resultado se obtiene que en su mayoría los errores estándar disminuyen porque aplicando una medida de corrección se espera que la varianza sea mínima y por lo tanto los errores estándar también sean mínimos. c) ¿Se puede comparar los dos valores de R2? ¿Por qué si o por qué no? (Pista: Examínense las variables dependientes) http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ No se pueden comparar los valores del coeficiente de determinación ya que la variabledependiente en estos modelos de regresión no es la misma siendo esta una condición necesaria para que los 2R sean comparables. 11.8 Pruébese que si wwi = una constante, para cada 22 ˆ,, ββi son idénticos al igual que sus varianzas. ∑ ∑ = i ii x yx 22 β̂ Estimador de MCO ( )∑ ∑ ∑∑ ∑ − − = 222 ˆ ii iiii XXn YXYXn β ( )( ) ( )( ) ( )( ) ( )22 2 *ˆ ∑∑∑ ∑∑∑∑ − − = iiiii iiiiiiii XwXww YwXwYXww β Estimador MCG Si asumimos que wi = w tenemos que w = constante y utilizando artificios matemáticas tenemos: ( ) ( )( ) ( ) ( )2222 22 2 *ˆ ∑∑ ∑∑∑ − − = ii iiii XwXnw YXwYXnw β ( ) ( )( )[ ] ( ) ( )[ ]222 2 2 *ˆ ∑∑ ∑∑∑ − − = ii iiii XXnw YXYXnw β Tenemos que 22 * ˆˆ ββ = por lo tanto: ( ) ( )( )[ ] ( )[ ] 2222 * ˆˆ ββ = − − = ∑∑ ∑∑∑ ii iiii YXn YXYXn Varianza: ( ) ( )22 22 2 2 ˆvar ∑ ∑ = i ii x x σ β estimador de MCO ( ) ( )( ) ( )22 2 *2 ˆvar ∑∑∑ ∑ − = iiiii i xwxww w β estimador MCG Si asumimos que wi =w tenemos: w= constante: ( ) ( ) ( )2222 * 2 2 ˆvar ∑∑ − = ii XwXnw nw β ( ) ( ) ( )[ ]222 * 2 2 ˆvar ∑∑ − = ii XXnw nw β Pero como sabemos que: σ 1 =w entonces nos quedaría: ( ) ∑ = 2 * 2 2 ˆvar ix σ β 11.11 Con la información dada en la tabla 11.1, efectúese la regresión de la compensación salarial promedio Y sobre la productividad promedio X, considerando al tamaño de empleo como unidad de observación. Interprétense sus resultados y véase si éstos están de acuerdo con los presentados en (11.5.3). http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ Tabla 11.1 COMPENSACION POR EMPLEADO (US$) EN LA INDUSTRIA DE MANUFACTURA DE BIENES NO DURABLES, DE ACUERDO CON EL TAMAÑO DEL EMPLEO DEL ESTABLECIMIENTO, 1958 Empleo generado (número promedio de empleados) INDUSTRIA 01-abr 05-sep 01-oct 20-49 50-99 100-249 250-499 500-999 1000-2499 Alimentos y productos afines 2994 3295 3565 3907 4189 4486 4676 4968 5342 Productos derivados del trabajo 1721 2057 3336 3320 2980 2848 3072 2969 3822 Productos textiles 3600 3657 3674 3437 3340 3334 3225 3163 3168 Confecciones y productos relacionados 3494 3787 3533 3215 3030 2834 2750 2967 3453 Papel y productos derivados 3498 3847 3913 4135 4445 4885 5132 5342 5326 Industria de imprenta y editoriales 3611 4206 4695 5083 5301 5269 5182 5395 5552 Productos químicos y relacionados 3875 4660 4930 5005 5114 5248 5630 5870 5876 Productos del petróleo y del carbón 4616 5181 5317 5337 5421 5710 6316 6455 6347 Productos del caucho y del plástico 3538 3984 4014 4287 4221 4539 4721 4905 5841 Cuero y productos de Cuero 3016 3196 3149 3317 3414 3254 3177 3346 4067 Compensación salarial promedio 3396 3787 4013 4014 4146 4241 4387 4538 4843 Desviación Estándar 742,2 851,4 727,8 805,1 929,9 1080,6 1243,2 1307,7 1112,5 Productividad Promedio 9355 8584 7962 8275 8389 9418 9795 10281 11750 Con los datos presentados en la tabla anterior y aplicando el programa Eviews nos presenta los siguientes resultados: Dependent Variable: Y Method: Least Squares Date: 05/02/07 Time: 16:21 Sample: 1 9 Included observations: 9 Variable Coefficient Std. Error t-Statistic Prob. C 1992.062 936.6123 2.126880 0.0710 X 0.232999 0.099853 2.333428 0.0523 R-squared 0.437520 Mean dependent var 4161.778 Adjusted R-squared 0.357166 S.D. dependent var 420.6625 S.E. of regression 337.2744 Akaike info criterion 14.67280 Sum squared resid 796278.0 Schwarz criterion 14.71663 Log likelihood -64.02760 F-statistic 5.444885 Durbin-Watson stat 0.616592 Prob(F-statistic) 0.052349 ii XY ˆ2329.03452.1992ˆ += ee (936.4791) (0.0998) (11.5.3) t (2.1275) (2.333) R 4375.02 = ii XY ˆ232999.0062.1992ˆ += ee (936.6123) (0.099853) modelo corrido t (2.126880) (2.333428) R 4375.02 = Donde: =Ŷ Compensación salarial promedio =X̂ La productividad promedio Estos valores obtenidos si están de acuerdo con los datos presentados en el (11.5.3) INTERPRETACIÓN: 2β̂ http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ Dados incrementos unitarios en la producción promedio se estima que la compensación salarial promedio se incrementará en 0.233 dólares, en esta regresión existe una relación directa entre la compensación salarial promedio y la productividad promedio es decir, si incrementa el uno también se incrementará el otro y viceversa. a) De la regresión anterior, obténgase los residuos iû . Para cada Xi obtenemos como residuos los siguientes valores: RESIDUOS ( iû ) -775.7709 -205.1284 165.7972 183.8684 199.3065 54.55018 113.7094 150.4718 113.1957 -800 -600 -400 -200 0 200 400 7000 8000 9000 10000 11000 12000 X R E S ID RESID vs. X b) Siguiendo la prueba de Park, efectúese la regresión de 2ˆln iu sobre iXln y verifíquese la regresión (11.5.4) Dependent Variable: LNABSRESID Method: Least Squares Date: 04/30/07 Time: 16:30 Sample: 1 9 Included observations: 9 Variable Coefficient Std. Error t-Statistic Prob. LNX -2.802022 4.196134 -0.667763 0.5257 C 35.82684 38.32272 0.934872 0.3810 R-squared 0.059886 Mean dependent var 10.23844 Adjusted R-squared -0.074416 S.D. dependent var 1.414819 S.E. of regression 1.466517 Akaike info criterion 3.796787 Sum squared resid 15.05470 Schwarz criterion 3.840615 Log likelihood -15.08554 F-statistic 0.445907 Durbin-Watson stat 1.137101 Prob(F-statistic) 0.525681 Comparando los resultados de la regresión 11.5.4 con el modelo anteriormente corrido obtenemos los siguientes resultados. ii InXuIn 8099.2817.35ˆ 2 −= ee = (38.319) (4.216) (11.5.4) t = (0.934) (-0.667) R 0595.02 = ii InXuIn 80202.28268.35ˆ 2 −= ee = (38.3227) (4.1961) modelo corrido t = (0.93487) (-0.66776) R 0599.02 = http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ De acuerdo a la prueba de Park obtuvimos los resultados anteriores y fijándonos en el β̂ podemos concluir diciendo que no hay una relación estadísticamente significativa entre las dos variables y por lo tanto no hay heteroscedasticidad en la varianza del error. c) Siguiendo el método de Glejser, efectúese la regresión de iû sobre iX y luego efectúes la regresión de iû sobre iX y coméntense sus resultados. i) Modelo 1 ii iii Xu vXu 0203.04761.407 21 −= ++= ∧ ∧ ββ ee = (633.1895) (0.0675) t= (0.6435) (-0.301456) =2R 0.013 Como podemos darnos cuenta con los resultados obtenidos al aplicar la prueba de Glejser nos damos cuenta que no existe relación entre el valor absoluto de los residuos y la variable explicativa productividad promedio, ya que Glejser sugiere hacer la regresión sobre los valores absolutos de los residuos sobre la variable X que se cree que está muy asociada con la varianza, por lo tanto existe homoscedasticidad. ii) Modelo 2 Dependent Variable: ABSRESID Method: Least Squares Date: 04/30/07 Time: 16:50 Sample: 1 9 Included observations: 9 Variable Coefficient Std. Error t-Statistic Prob. RAIZX -3.710851 13.30840 -0.278835 0.7884 C 575.4432 1284.251 0.448077 0.6676 R-squared 0.010985 Mean dependent var 217.9776 Adjusted R-squared -0.130303 S.D. dependent var 214.6654 S.E. of regression 228.2231 Akaike info criterion 13.89165 Sum squared resid 364600.3 Schwarz criterion 13.93548 Log likelihood -60.51244 F-statistic 0.077749 Durbin-Watson stat 1.011648 Prob(F-statistic) 0.788429 Dependent Variable: ABSRESID Method: LeastSquares Date: 04/30/07 Time: 16:45 Sample: 1 9 Included observations: 9 Variable Coefficient Std. Error t-Statistic Prob. X -0.020350 0.067505 -0.301456 0.7718 C 407.4761 633.1895 0.643529 0.5404 R-squared 0.012816 Mean dependent var 217.9776 Adjusted R-squared -0.128210 S.D. dependent var 214.6654 S.E. of regression 228.0117 Akaike info criterion 13.88980 Sum squared resid 363925.4 Schwarz criterion 13.93363 Log likelihood -60.50411 F-statistic 0.090876 Durbin-Watson stat 1.015122 Prob(F-statistic) 0.771825 http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ (-0.2788) (0.4480) t (13,3084) (1284.251) 7108,34432.575 21 = = −= ++= ∧ ∧ ee Xu vXu ii iii ββ =2R 0.011 Utilizando otra de las formas funcionales de Glejser nos damos cuenta que no existe relación entre el valor absoluto de los residuos y la variable explicativa productividad promedio, es decir existe homoscedasticidad. d) Encuéntrese la correlación por rango entre iû y iX y coméntese sobre la naturaleza de la heteroscedasticidad presente en los datos, si ésta existe. XI iu Oxi Oui di di 2 9355.000 766.0088 5 9 -4 16 8584.000 189.0912 4 7 -3 9 7962.000 186.8968 1 6 -5 25 8275.000 112.4205 2 3 -1 1 8389.000 216.9308 3 8 -5 25 9418.000 63.79947 6 1 5 25 9795.000 118.8903 7 4 3 9 10281.00 152.6971 8 5 3 9 11750.00 103.4650 9 2 7 49 168 ( ) − −= ∑ 1 61 2 2 nn d rs i ( ) − −= 1819 168 61rs −= 720 168 61rs 4.11−=rs 4.0−=rs 21 2 rs nrs tdado − − = ( )13211111111.01 29566.0 − −− =dadot 823947.0 499259.1− =dadot 81960.1−=dadot 27.0−=calculadot -1.82 -0.27 1.82 http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ INTERPRETACIÓN: Como el “t” dado excede al “t” calculado en valores absolutos, entonces no hay suficiente evidencia estadística para rechazar la hipótesis de que existe homoscedasticidad por lo tanto hay heteroscedasticidad. 11.13. Prueba de homogeneidad de varianza de Bartlett. Suponga que hay k varianzas muestrales independientes s1 2,s2 2,…,sk2 cada uno con f1, f2,…, fk g de l, provenientes de poblaciones normalmente distribuidas con mediau y varianza 2iσ . Supóngase además que se desea probar la hipótesis nula 222 2 2 10 ... σσσσ ===== kH , es decir cada varianza muestral es una estimación de la misma varianza poblacional 2σ . Si la hipótesis nula es verdadera, entonces =2s 22 iiii sfsf ∑∑ = ∑ if f Constituye una estimación común (agrupada) de la varianza poblacional 2σ , donde fi=(ni-1), siendo ni el número de observaciones en el grupo i-ésimo y donde .1 i k i ff ∑ == Bartlett ha demostrado que la hipótesis nula puede probarse por la razón A/B, que está distribuida aproximadamente como la distribución 2χ con k-1 g de l, donde )ln(ln 22 ii sfsfA ∑−= y − − += ∑ ffk B 11 )1(3 1 1 1 Aplíquese la prueba de Bartlett sobre los datos de la tabla 11.1 y verifíquese que no se puede rechazar la hipótesis de que las varianzas poblacionales de la compensación salarial son las mismas para cada tamaño de empleo del establecimiento, al nivel de significancia del 5%. Nota: f1, los g de l para cada varianza muestral, es 9, puesto que ni para cada muestra(es decir clase de empleo) es 10. Hipótesis 222 2 2 10 ...: σσσσ ==== KH �Homoscedasticidad� :aH �Heteroscedasticidad f i 2 ii sf 2ln ii sf 1/ f i 9 4957747,56 118,97 0,11 9 6523937,64 121,44 0,11 9 4767235,56 118,62 0,11 9 5833094,432 120,44 0,11 9 7782426,09 123,03 0,11 9 10509267,24 125,73 0,11 9 13865196,96 128,23 0,11 9 15390713,61 129,17 0,11 9 11098892,25 126,123 0,11 81 80728511,34 1111,86 1 Para aplicar la prueba de Bartlett necesitamos el resultado de los datos obtenidos anteriormente: Entonces: f sf f sf s ii i k i ii ∑ ∑ ∑ == = 2 1 2 2 2881.996648 72 34.807285112 ==s � � � ( )∑−= 22 lnln ii sfsfA � 86.1111)81215322.13(81 −=A � http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ � 86.111178.1118 −=A 92.6=A ( ) − − += 81 1 1 123 1 1B [ ]987654321.0 3 1 1+=B 329218107.1=B 21.5 329218107.1 92.6 == B A 222 2 2 10 ...: σσσσ ==== KH �Homoscedasticidad� � :aH �Heteroscedasticidad 2/1 α− 975.02/05.01 =− gl= 10-2 gl= 8 χ 17973.22 = con 2/1 α− y con 8 gl. χ 2 = 17.5346 con α/2 y con 8 gl. º 2.18 5.21 17.53 INTERPRETACIÓN: Según la prueba de Bartlett no existe suficiente evidencia estadística para rechazar la 2222 2 10 ...: σσσσ ==== KH � con un 95% de confianza, por lo tanto existe homoscedasticidad, es decir que la varianza es constante a lo largo de la regresión. 11.15. La tabla 11.7 proporciona datos sobre 81 automóviles respecto a su: MPG (millas promedio por galón), CF(caballos de fuerza de su motor), VOL(pies cúbicos de su cabina), VM(velocidad máxima en millas por hora) y su PS(peso del vehículo en cientos de lbs). TABLA 11.7 obs MPG VM CF VOL PS 1 65.40000 96.00000 49.00000 89.00000 17.50000 2 56.00000 97.00000 55.00000 92.00000 20.00000 3 55.90000 97.00000 55.00000 92.00000 20.00000 4 49.00000 105.0000 70.00000 92.00000 20.00000 5 46.50000 97.00000 53.00000 92.00000 20.00000 6 46.20000 98.00000 70.00000 89.00000 20.00000 7 45.40000 107.0000 55.00000 92.00000 20.00000 8 59.20000 103.0000 62.00000 50.00000 22.50000 9 53.30000 113.0000 62.00000 50.00000 22.50000 10 43.40000 113.0000 80.00000 94.00000 22.50000 11 41.10000 103.0000 73.00000 89.00000 22.50000 12 40.90000 113.0000 92.00000 50.00000 22.50000 13 40.90000 113.0000 92.00000 99.00000 22.50000 http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ 14 40.40000 103.0000 73.00000 89.00000 22.50000 15 39.60000 100.0000 66.00000 89.00000 22.50000 16 39.30000 103.0000 73.00000 89.00000 22.50000 17 38.90000 106.0000 78.00000 91.00000 22.50000 18 38.80000 113.0000 92.00000 50.00000 22.50000 19 0.380000 106.0000 78.00000 91.00000 22.50000 20 42.20000 109.0000 90.00000 103.0000 25.00000 21 40.90000 110.0000 92.00000 99.00000 25.00000 22 40.70000 101.0000 74.00000 107.0000 25.00000 23 40.00000 111.0000 95.00000 101.0000 25.00000 24 39.30000 105.0000 81.00000 96.00000 25.00000 25 38.80000 111.0000 95.00000 89.00000 25.00000 26 38.40000 110.0000 92.00000 50.00000 25.00000 27 38.40000 110.0000 92.00000 117.0000 25.00000 28 38.40000 110.0000 92.00000 99.00000 25.00000 29 46.90000 90.00000 52.00000 104.0000 27.50000 30 36.30000 112.0000 103.0000 107.0000 27.50000 31 36.10000 103.0000 84.00000 114.0000 27.50000 32 36.10000 103.0000 84.00000 101.0000 27.50000 33 35.40000 111.0000 102.0000 97.00000 27.50000 34 35.30000 111.0000 102.0000 113.0000 27.50000 35 35.10000 102.0000 81.00000 101.0000 27.50000 36 35.10000 106.0000 90.00000 98.00000 27.50000 37 35.00000 106.0000 90.00000 88.00000 27.50000 38 33.20000 109.0000 102.0000 86.00000 30.00000 39 32.90000 109.0000 102.0000 86.00000 30.00000 40 32.30000 120.0000 130.0000 92.00000 30.00000 41 32.20000 106.0000 95.00000 113.0000 30.00000 42 32.20000 106.0000 95.00000 106.0000 30.00000 43 32.20000 109.0000 102.0000 92.00000 30.00000 44 32.20000 106.0000 95.00000 88.00000 30.00000 45 31.50000 105.0000 93.00000 102.0000 30.00000 46 31.50000 108.0000 100.0000 99.00000 30.0000047 31.40000 108.0000 100.0000 111.0000 30.00000 48 31.40000 107.0000 98.00000 103.0000 30.00000 49 31.20000 120.0000 130.0000 86.00000 30.00000 50 33.70000 109.0000 115.0000 101.0000 35.00000 51 32.60000 109.0000 115.0000 101.0000 35.00000 52 31.30000 109.0000 115.0000 101.0000 35.00000 53 31.30000 109.0000 115.0000 124.0000 35.00000 54 30.40000 133.0000 180.0000 113.0000 35.00000 55 28.90000 125.0000 160.0000 113.0000 35.00000 56 28.00000 115.0000 130.0000 124.0000 35.00000 57 28.00000 102.0000 96.00000 92.00000 35.00000 58 28.00000 109.0000 115.0000 101.0000 35.00000 59 28.00000 104.0000 100.0000 94.00000 35.00000 60 28.00000 105.0000 100.0000 115.0000 35.00000 61 27.70000 120.0000 145.0000 111.0000 35.00000 62 25.60000 107.0000 120.0000 116.0000 40.00000 63 25.30000 114.0000 140.0000 131.0000 40.00000 64 23.90000 114.0000 140.0000 123.0000 40.00000 65 23.60000 117.0000 150.0000 121.0000 40.00000 66 23.60000 122.0000 165.0000 50.00000 40.00000 67 23.60000 122.0000 165.0000 114.0000 40.00000 68 23.60000 122.0000 165.0000 127.0000 40.00000 69 23.60000 122.0000 165.0000 123.0000 40.00000 70 23.50000 148.0000 245.0000 112.0000 40.00000 71 23.40000 160.0000 280.0000 50.00000 40.00000 72 23.40000 121.0000 162.0000 135.0000 40.00000 73 23.10000 121.0000 162.0000 132.0000 40.00000 74 22.90000 110.0000 140.0000 160.0000 45.00000 75 22.90000 110.0000 140.0000 129.0000 45.00000 76 19.50000 121.0000 175.0000 129.0000 45.00000 77 18.10000 165.0000 322.0000 50.00000 45.00000 78 17.20000 140.0000 238.0000 115.0000 45.00000 79 17.00000 147.0000 263.0000 50.00000 45.00000 80 16.70000 157.0000 295.0000 119.0000 45.00000 81 13.20000 130.0000 236.0000 107.0000 55.00000 Donde: VOL = pies cúbicos del espacio de la cabina CF = caballos de fuerza del motor. MPG = millas promedio por galón. VM = velocidad máxima. PS = peso del vehiculo, cientos de libra. http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ a) Considere el siguiente modelo: ii uPSCFVMMPG ++++= 4321 ββββ Estime los parámetros de este modelo e interprete los resultados. ¿Tiene significado económico? Con los datos presentados en la tabla anterior corremos el modelo en el programa Eviews y obtenemos los siguientes resultados: Dependent Variable: MPG Method: Least Squares Date: 05/03/07 Time: 17:52 Sample: 1 81 Included observations: 81 Variable Coefficient Std. Error t-Statistic Prob. C 75.72373 28.61802 2.646015 0.0099 VM -0.111336 0.289859 -0.384103 0.7020 CF 0.011069 0.095636 0.115738 0.9082 PS -1.003452 0.265787 -3.775403 0.0003 R-squared 0.664598 Mean dependent var 33.36765 Adjusted R-squared 0.651531 S.D. dependent var 10.70712 S.E. of regression 6.320552 Akaike info criterion 6.573612 Sum squared resid 3076.102 Schwarz criterion 6.691856 Log likelihood -262.2313 F-statistic 50.85849 Durbin-Watson stat 1.394075 Prob(F-statistic) 0.000000 PSCFVMMPGi 00.101.011.072.75 −+−= ee = (28.62) (0.29) (0.0956) (0.266) t = (2.65) (-0.38) (0.12) (-3.78) =2R 0.665 INTERPRETACIÓN: 2β̂ Dados incrementos unitarios en la velocidad máxima se estima que las millas promedio por galón disminuirán en 0.11 millas por galón manteniendo todo lo demás constante, es decir existe una relación inversa entre MPG y la velocidad máxima. 3β̂ Dados incrementos en los caballos de fuerza de motor se estima que las millas promedio por galón también se incrementarán en 0.01 milla por galón manteniendo todo lo demás constante, es decir existe una relación directa entre MPG y los caballos de fuerza de motor, por tanto si incrementa el uno también incrementará el otro y viceversa. 4β̂ Dados incrementos unitarios en el peso del vehículo, cientos de libras se estima que las millas promedio por galón disminuirá en 1.00 millas por galón manteniendo todo lo demás constante, es decir existe una relación inversa entre las MPG y el peso del vehiculo, cientos de libra. a) ¿Se esperaría que la varianza del error en el modelo anterior sea heteroscedástica? ¿Por qué? Si se esperaría que la varianza del error en este modelo sea heteroscedástica ya que estamos utilizando datos de corte transversal y es en este caso donde existe mayor probabilidad que se de heteroscedasticidad es decir que la varianza no sea constante a lo largo de la regresión. b) Utilice la prueba White para averiguar si la varianza de error es heteroscedástica. White Heteroskedasticity Test: F-statistic 0.287759 Probability 0.976044 Obs*R-squared 2.850614 Probability 0.969924 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/03/07 Time: 19:01 Sample: 1 81 Included observations: 81 Variable Coefficient Std. Error t-Statistic Prob. C -20940160 28561411 -0.733163 0.4659 VM 445660.3 594060.7 0.750193 0.4556 http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ VM^2 -2282.160 3124.536 -0.730400 0.4675 VM*CF 1214.655 1966.184 0.617773 0.5387 VM*PS -2242.884 5680.112 -0.394866 0.6941 CF -114865.3 198918.2 -0.577450 0.5655 CF^2 -151.9130 342.2568 -0.443857 0.6585 CF*PS 418.6345 2188.015 0.191331 0.8488 PS 163107.1 603790.5 0.270139 0.7878 PS^2 509.4899 4019.457 0.126756 0.8995 R-squared 0.035193 Mean dependent var 37597.08 Adjusted R-squared -0.087107 S.D. dependent var 309158.7 S.E. of regression 322342.5 Akaike info criterion 28.31976 Sum squared resid 7.38E+12 Schwarz criterion 28.61537 Log likelihood -1136.950 F-statistic 0.287759 Durbin-Watson stat 2.109911 Prob(F-statistic) 0.976044 ( ) ( ) −−+−−−= PSVMCFVMVMVMMPGt *884.2242*655.1214160.22823.44566020940160 2 ���������������� ( ) 22 4899.5091.1631076345.4189130.1513.114865 PSPSPSCFCFCF +−−−− De acuerdo a la prueba de White podemos observar que los valores “p” son mayores que a un α de 0.05 por lo que podemos decir que existe homoscedasticidad. c) Obténgase los errores estándar de White que son consistentes con la heteroscedasticidad, así como los valores t, y compare los resultados con los obtenidos mediante los MCO. Valores “t” mediante los MCO. t = (2.65) (-0.38) (0.12) (-3.78) ee= (28.62) (0.29) (0.0956) (0.266) Valores “t” mediante White t= (-0.733) (0.750) (-0.577) (-0.270) ee=(28561411) (594060.7) (198918.2) (603790.5) Comparando los valores “t” de MCO con los obtenidos en la prueba de White podemos darnos cuenta que estos valores en su mayoría son poco significativos, por lo tanto se puede concluir diciendo que existe homoscedasticidad, ahora las desviaciones estándar de MCO son mínimos a comparación de los obtenidos a partir de la prueba de White ya que su varianza se ha inflado enormemente y por lo tanto ya no son eficientes. d) Si se establece la heteroscedasticidad, ¿Cómo se podría transformar los datos de manera que en los datos transformados la varianza de error sea homoscedástica? Muestre los cálculos necesarios. Si se establece heteroscedasticidad se puede corregir aplicando el método de MCG para que de esta manera la varianza de error sea homoscedástica pero en este caso no se puede hacer ningún cálculo debido a que este modelo presenta homoscedasticidad, como podemos darnos cuenta en los siguientes gráficos: * Relacionando los residuos al cuadrado con la velocidad máxima al cuadrado. -400 0 400 800 1200 1600 2000 5000 10000 15000 20000 25000 30000 CUADRADEVM C U A D R A D E R E S ID CUADRADERESID vs. CUADRADEVM Observando el gráfico podemos decir que no existe mucha variabilidad de los datos con respecto a su media y por lo tanto no hay presencia de heteroscedasticidad.*Relacionando los residuos al cuadrado con los caballos de fuerza de motor al cuadrado. http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ -400 0 400 800 1200 1600 2000 0 40000 80000 120000 CUADRADECF C U A D R A D E R E S ID CUADRADERESID vs. CUADRADECF Observando el gráfico podemos decir que no existe mucha variabilidad de los datos con respecto a su media y por lo tanto no hay presencia de heteroscedasticidad. *Relacionando los residuos al cuadrado con el peso de vehículo, cientos de libras al cuadrado. -400 0 400 800 1200 1600 2000 0 1000 2000 3000 4000 CUADRADEPS C U A D R A D E R E S ID CUADRADERESID vs. CUADRADEPS Observando el gráfico podemos decir que no existe mucha variabilidad de los datos con respecto a su media y por lo tanto no hay presencia de heteroscedasticidad. SEGUNDA PARTE Con los siguientes datos se pide aplicar todas las pruebas para la detección de heteroscedasticidad. GASTOS INGRESOS GASTOS INGRESOS 275 6.247 359 9.032 275 6.183 388 6.505 531 8.914 311 7.478 316 7.505 397 7.839 304 6.813 315 6.242 431 7.873 315 7.697 316 6.640 356 7.624 427 8.063 missing 7.597 259 5.736 339 7.374 294 7.391 452 8001 423 8.818 428 10.001 335 6.607 403 8.380 320 6.951 345 7.696 342 7.526 260 6.615 268 6.489 427 8.306 353 6.541 477 7.847 320 6.456 433 7.051 821 10851 279 7.277 387 8.850 447 8.267 424 8.604 322 7.812 265 6.700 412 7.733 437 8.745 321 6.841 355 8.001 417 6.622 327 6.333 415 8.450 466 8.442 500 9.096 274 7.342 � MODELO CORRIDO � Dependent Variable: GASTOS Method: Least Squares http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ � � � � � � � � � � � � � � � Del modelo corrido se obtuvieron los siguientes resultados: YG 069.005.152ˆ +−= � ee= (64.120) (0.008) t= (-2.37) (8.27) � � INTERPRETACIÓN: 05.152ˆ1 −=β Un 05.152ˆ1 −=β nos dice que es el gasto autónomo cuando el ingreso tiene un valor de cero es decir, que el gasto no depende del ingreso. 069.0ˆ2 =β � Un 069.0ˆ2 =β nos diría que dado un incremento unitario en el ingreso per cápita se estima que el gasto per cápita también se incrementará en 0.069 dólares, ya que la relación entre estas variables es directa, es decir si se incrementa el ingreso también se incrementará el gasto y viceversa. � PRUEBAS PARA LA DETECCIÓN DE LA HETEROSCEDASTICIDAD Se pueden examinar algunos de los métodos informales y formales para detectar la heteroscedasticidad, comenzaremos primero por los métodos informales. � 1) Métodos Informales Dentro de los métodos informales tenemos únicamente el método gráfico que lo presentamos a continuación: MÉTODO GRÁFICO � � 200,00 300,00 400,00 500,00 600,00 yest 0,00 10000,00 20000,00 30000,00 40000,00 50000,00 60000,00 u i2 � Date: 05/03/07 Time: 17:25 Sample: 1 51 Included observations: 50 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. INGRESOS 0.069046 0.008350 8.268729 0.0000 C -152.0547 64.12009 -2.371405 0.0218 R-squared 0.587529 Mean dependent var 373.2600 Adjusted R-squared 0.578936 S.D. dependent var 94.55326 S.E. of regression 61.35508 Akaike info criterion 11.11041 Sum squared resid 180693.4 Schwarz criterion 11.18689 Log likelihood -275.7603 F-statistic 68.37187 Durbin-Watson stat 2.335192 Prob(F-statistic) 0.000000 http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ Conclusión: De acuerdo al método gráfico se puede decir que la varianza del término de perturbación esta relacionada linealmente con el ingreso per cápita, por lo tanto se ve la existencia de algún grado de heteroscedasticidad. 2) Métodos Formales i) PRUEBA DE PARK La forma funcional sugerida por Park es la siguiente: vi ii eX βσσ 22 = � � A la regresión anterior se la puede linealizar, Entonces nos quedaría, viX ii ++= lnlnln 22 βσσ � Como no se conoce la varianza del término de perturbación a nivel poblacional, Park utiliza la 2ˆiu como una aproximación y corre la siguiente regresión. viXu viXu ii ii ++= ++= lnˆln lnlnˆln 2 22 βα βσ � � � Dependent Variable: LNUI2 Method: Least Squares Date: 05/03/07 Time: 17:40 Sample: 1 51 Included observations: 50 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. INGRESOS 0.000820 0.000324 2.531760 0.0147 C 0.476994 2.487254 0.191775 0.8487 R-squared 0.117806 Mean dependent var 6.716200 Adjusted R-squared 0.099427 S.D. dependent var 2.507940 S.E. of regression 2.379998 Akaike info criterion 4.611254 Sum squared resid 271.8907 Schwarz criterion 4.687735 Log likelihood -113.2814 F-statistic 6.409807 Durbin-Watson stat 2.105620 Prob(F-statistic) 0.014677 � � � � � Hipótesis: � Ho: 2β = 0 Homoscedasticidad� Ha: ≠2β 0 Heteroscedasticidad � n= 50 gl= 48 021.2=dadot � 53.2 00324.0 000820.0 = = = ∧ ∧ calculado calculado calculado t t se t β β � � � � � � 0.118R (2.532) (0.197) t (0.000324) (2.487) ln0008.04769.0ˆln 2 2 == = += se Xu ii http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ -2.02 2.02 2.5 INTERPRETACIÓN: Como el “t” calculado es mayor que el “t” dado no existe suficiente evidencia estadística para aceptar la Ho: 2β = 0, es decir se acepta la Ha: ≠2β 0 por lo tanto podemos decir que existe heteroscedasticidad en este modelo ii) PRUEBA DE GLEJSER Esta prueba es muy similar a la prueba de Park con la única diferencia de que Glejser sugiere hacer la regresión sobre los valores absolutos de los residuos estimados sobre la variable X que se cree que esta muy asociada con la varianza del término de perturbación estocástica a nivel poblacional y para esto aplico algunas formas funcionales que se mencionan en el libro, nosotros escogimos la siguiente forma funcional. viXu ii ++= ∧ 21 ββ � Modelo corrido � � � � � � � � � � � � � � � � � � � � Con los datos de la tabla, aplicando el programa Eviews obtuvimos los siguientes resultados: 190.0R (3.355) (-2.117) t (0.004) (7.703) 016.0845.79 2 == = +−= ∧ se Xu ii � � � Hipótesis: � Ho: 2β = 0 Homoscedasticidad� Ha: ≠2β 0 Heteroscedasticidad n= 50 gl= 48 021.2=dadot � 35.3 004910.0 016477.0 = = = ∧ ∧ calculado calculado calculado t t se t β β � � � � � Dependent Variable: Ui Method: Least Squares Date: 05/3/07 Time: 17:42 Sample: 1 51 Included observations: 50 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. INGRESOS 0.016477 0.004910 3.355730 0.0016 C -79.84539 37.70291 -2.117751 0.0394 R-squared 0.190023 Mean dependent var 45.51160 Adjusted R-squared 0.173148 S.D. dependent var 39.67505 S.E. of regression 36.07707 Akaike info criterion 10.04837 Sum squared resid 62474.65 Schwarz criterion 10.12485 Log likelihood -249.2093 F-statistic 11.26092 Durbin-Watson stat 2.031507 Prob(F-statistic) 0.001554 http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ � -2.02 2.02 3.35 � INTERPRETACIÓN: Como el “t” calculado es mayor que el “t” dado no existe suficiente evidencia estadística para aceptar la Ho: 2β = 0, es decir se acepta la Ha: ≠2β 0 por lo tanto podemos decir que existe heteroscedasticidad en este modelo � � � iii) PRUEBA DE CORRELACIÓN POR GRADO DE SPEARMAN� � Spearman definió el coeficiente de correlación por rango como: ( ) − −= ∑ 1 61 2 2 nn d r i s ��������� Ordenando de manera ascendente tenemos: �������� iû ��������rango de iûXi rango de Xi d d 2 � 4,28 4 6247 4 0 0 0,14 2 6183 2 0 0 67,58 41 8914 47 -6 36 50,14 34 7505 24 10 100 14,36 9 6813 15 -6 36 39,45 29 7873 34 -5 25 9,59 8 6640 13 -5 25 22,33 16 8063 37 -21 441 15 11 5736 1 10 100 64,27 38 7391 22 16 256 33,8 25 8818 45 -20 400 30,87 24 6607 10 14 196 7,89 7 6951 17 -10 100 25,59 19 7526 25 -6 36 27,99 21 6489 7 14 196 53,42 37 6541 9 28 784 26,29 20 6456 6 14 196 223,83 51 10851 51 0 0 72,01 43 8850 46 -3 9 18,02 13 8604 43 -30 900 45,56 33 6700 14 19 361 14,76 10 8745 44 -34 1156 45,39 32 8001 35 -3 9 41,78 30 6333 5 25 625 35,16 27 8442 41 -14 196 80,88 44 7342 20 24 576 112,57 50 9032 48 2 4 90,91 46 6505 8 38 1444 53,27 36 7478 23 13 169 7,8 6 7839 32 -26 676 36,07 28 6242 3 25 625 64,4 39 7697 29 10 100 18,36 15 7624 27 -12 144 1 7597 26 -25 625 18,09 14 7374 21 -7 49 51,61 35 8001 36 -1 1 110,48 48 10001 50 -2 4 23,55 17 8380 40 -23 529 34,33 26 7696 28 -2 4 44,69 31 6615 11 20 400 5,56 5 8306 39 -34 1156 �� http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ 87,25 45 7847 33 12 144 98,21 47 7051 18 29 841 71,4 42 7277 19 23 529 28,25 22 8267 38 -16 256 65,34 40 7812 31 9 81 30,12 23 7733 30 -7 49 0,71 3 6841 16 -13 169 111,83 49 6622 12 37 1369 16,39 12 8450 42 -30 900 24,01 18 9096 49 -31 961 17988 � Con los resultados de la tabla anterior aplicamos a la fórmula y obtenemos: 1860.0 )2600(51 17988 61 = −= s s r r � � Para aplicar la prueba de significancia individual nos planteamos las siguientes hipótesis: Ho: sρ = 0 Homoscedasticidad Ha: ≠sρ 0 Heteroscedasticidad � 21 2 s s dado r nr t − − = � � � 33.1 034596.01 2511860.0 = − − =dadot � � � � n= 50 gl= 48 021.2=dadot � � � � � � - 2.021 1.33 2.021 � � INTERPRETACIÓN: Con 48 grados de libertad el valor “t” no es significativo a un nivel de significancia del 5% por tanto hay suficiente evidencia estadística para aceptar la�Ho: sρ = 0 por lo tanto se rechaza la Ha: ≠sρ 0 Heteroscedasticidad. � iiii) PRUEBA DE GOLDFELD – QUANT.� � Éste método es aplicable si se supone que la varianza heteroscedástica, 2iσ está relacionada positivamente con una de las variables explicativas en el modelo de regresión. Para aplicar esta prueba nos basamos en los siguientes pasos: http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ Paso 1. Ordenar las observaciones de acuerdo con los valores de Xi (ingresos per cápita) empezando por el valor de X más bajo. Paso 2. Luego omitir “c” observaciones centrales, en este caso se han omitido 16 observaciones. Paso 3. Posteriormente se procede a ajustar las regresiones y se obtiene la SRC1 que representa los ingresos bajos y SRC2 que representa los ingresos altos. Paso 4. Se calcula la razón ( )λ . Y con grados de libertad dado por: � � ( ) l de 2 2 o 2 2 g kcn k c −− − − � � Entonces: � VALORES DE INGRESOS PER CAPITA BAJOS � �������������������� Estado Gastos Ingresos bajos Miss, 259 5736 Ark. 275 6183 S.C. 315 6242 Ala. 275 6247 Maine 327 6333 W. Va. 320 6456 Tenn. 268 6489 N.Mex. 388 6505 Vt. 353 6541 N.C. 335 6607 Ky. 260 6615 Urah. 417 6622 La 316 6640 Ga. 265 6700 Indaho 304 6813 S.Dak. 321 6841 Okla. 320 6951 � � � � Modelo 1 Dependent Variable: GASTOS Method: Least Squares Date: 05/3/07 Time: 19:07 Sample: 1 17 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. INGRESOS 0.047758 0.037536 1.272329 0.2226 C 2.340721 244.2585 0.009583 0.9925 R-squared 0.097409 Mean dependent var 312.8235 Adjusted R-squared 0.037236 S.D. dependent var 44.66435 S.E. of regression 43.82490 Akaike info criterion 10.50841 Sum squared resid 28809.33 Schwarz criterion 10.60644 Log likelihood -87.32150 F-statistic 1.618821 Durbin-Watson stat 2.405128 Prob(F-statistic) 0.222627 17 l de g 28809.33SRC 0974,0r (2.2723) (0.0095) t (0.0375) (244.25) 04771.0340.2 1 2 = = = = = += ∧ se XG � � � � � � http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ VALORES DE INGRESOS PER CÁPITA ALTOS � Estado Gastos Ingresos altos Iowa 431 7873 Kans. 355 8001 Colo. 452 8001 Mass. 427 8063 N. Y. 447 8267 Md. 427 8306 Hawai 403 8380 Mich. 466 8442 Wash. 415 8450 Del. 424 8604 Ill. 437 8745 N.J. 423 8818 Cal. 387 8850 Ct. 531 8914 Nev. 359 9032 Wyo. 500 9096 D. C. 428 10001 Alaska 821 10851 � � Modelo 2 � � Dependent Variable: GASTOS Method: Least Squares Date: 05/3/07 Time: 19:10 Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. INGRESOS 0.095576 0.024560 3.891483 0.0013 C -380.1783 214.5324 -1.772125 0.0954 R-squared 0.486251 Mean dependent var 451.8333 Adjusted R-squared 0.454142 S.D. dependent var 101.4879 S.E. of regression 74.98149 Akaike info criterion 11.57680 Sum squared resid 89955.57 Schwarz criterion 11.67573 Log likelihood -102.1912 F-statistic 15.14364 Durbin-Watson stat 2.453728 Prob(F-statistic) 0.001297 18 l de g 89955.57SRC .4860r (3.8914) (-1.7721) t (0.02456) (214.532) 0955.0178.380 2 2 = = = = = +−= ∧ se XG � � Con los resultados anteriores calculamos λ . � � l de / l de / 1 2 gSRC gSRC=λ � � � 978.217/33.28809 18/57.89955 ==λ � � � INTERPRETACIÓN Como el valor “F” crítico para 18 grados de libertad en el numerador y 17 grados de libertad en el denominador es de 2.23, por lo tanto se observa que el F dado es menor al F calculado entonces se puede decir que existe algún grado de probabilidad de heteroscedastidcidad. � iiiii) PRUEBA GENERAL DE HETEROSCEDASTICIDAD DE WHITE http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ La prueba general de White no se apoya en el supuesto de normalidad y es fácil de llevar a cabo, para aplicar esta prueba seguimos los pasos planteados en el libro. � Para ello nos planteamos las siguientes hipótesis: Ho: Homoscedasticidad Ha: Heteroscedasticidad � White Heteroskedasticity Test: F-statistic 41.76532 Probability 0.000000 Obs*R-squared 31.99656 Probability 0.000000 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/3/07 Time: 19:25 Sample: 1 51 Included observations: 50 � Como 2 l de g 2 X sigue * Rn Entonces: � 2 l de 2gX sigue 99656.31 � � � 0 .010 5.99 31.996 � � INTERPRETACIÓN: Como el valor χ 2 calculado esta en la zona de aceptación se puede decir que existe suficiente evidencia estadística para aceptar la Ho: Homoscedasticidad, por lo tanto se concluye diciendo que existe homoscedasticidad es decir que la varianza es constante a lo largo de la regresión. iiiiii) PRUEBA DE LA RAZÓN DE LA VEROSIMILUD�� � Esta es una prueba especialmente par muestras grandes, se basa en las estimaciones de máxima verosimilitud y se supone que se ha identificado adecuadamente los grupos con varianzas diferenciadas. Para aplicar este método nos planteamos las siguientes hipótesis: � Ho: Homoscedasticidad Ha: Heteroscedasticidad Entonces se calcula el estadístico de prueba con la siguiente igualdad: � n p i ni i Donde u σ σ λ λ ˆ ˆ : ln2 1 ∏ == −= � � http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ Grupo diferenciado n1 (ingresos bajos)� � Estado Gastos Ingresos bajos Miss, 259 5736 Ark. 275 6183 S.C. 315 6242 Ala. 275 6247 Maine 327 6333 W. Va. 320 6456 Tenn. 268 6489 N.Mex. 388 6505 Vt. 3536541 N.C. 335 6607 Ky. 260 6615 Urah. 417 6622 La 316 6640 Ga. 265 6700 Indaho 304 6813 S.Dak. 321 6841 Okla. 320 6951 � Con los datos anteriores corremos el modelo en el programa Eviews obteniendo los siguientes resultados: � � � � � � � � � � � � � � � � � .4860R (1.272) (0.009) t (0.0375) (244.25) 0477.0340.2 2 = = = += ∧ se XG bajos � � � Grupo diferenciado n2 (ingresos medios) � Estado Gastos Ingresos bajos Mont. 433 7051 N.H. 279 7277 Mo. 274 7342 Ariz. 339 7374 Nebr. 294 7391 N. Dak. 311 7478 Fla 316 7505 R.I. 342 7526 Wisc. missing 7597 Va. 356 7624 Ind. 345 7696 Texas 315 7697 Pa. 412 7733 Ohio 322 7812 Oreg 397 7839 Minn. 477 7847 Lowa 431 7873 � � Con los datos anteriores corremos el modelo en el programa Eviews obteniendo los siguientes resultados: Modelo corrido Dependent Variable: GASTOS Method: Least Squares Date: 05/3/07 Time: 20:22 Sample: 1 17 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. INGRESOS 0.047758 0.037536 1.272329 0.2226 C 2.340721 244.2585 0.009583 0.9925 R-squared 0.097409 Mean dependent var 312.8235 Adjusted R-squared 0.037236 S.D. dependent var 44.66435 S.E. of regression 43.82490 Akaike info criterion 10.50841 Sum squared resid 28809.33 Schwarz criterion 10.60644 Log likelihood -87.32150 F-statistic 1.618821 Durbin-Watson stat 2.405128 Prob(F-statistic) 0.222627 http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ � � � ������������������� � � � � � � � � � � � � � � � � 0.1537R (1.59501) (-0.84387) t (0.06208) (470.0026) 0990.0623.396 2 = = = +−= ∧ se XG medios � � � Grupo diferenciado n3 (ingresos altos)� � Estado Gastos Ingresos bajos Kans. 355 8001 Colo. 452 8001 Mass. 427 8063 N.Y. 447 8267 Md. 427 8306 Hawai 403 8380 Mich. 466 8442 Wash. 415 8450 Del. 424 8604 I ll. 437 8745 N.J 423 8818 Cal. 387 8850 Ct. 531 8914 Nev. 359 9032 Wyo. 500 9096 D.C. 428 10001 Alaska 821 10851 � Con los datos anteriores corremos el modelo en el programa Eviews obteniendo los siguientes resultados: � � � � � � � � � � � � � � � 0.507R (3.932153) (-1.92285) t (0.025838) (226.9379) 10160.03693.436 2 = = = +−= ∧ se XG altos � � Con los datos de las regresiones aplicamos la siguiente fórmula: Dependent Variable: GASTOS Method: Least Squares Date: 05/3/07 Time: 20:26 Sample: 1 17 Included observations: 16 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. INGRESOS 0.099029 0.062087 1.595010 0.1330 C -396.6227 470.0026 -0.843873 0.4129 R-squared 0.153775 Mean dependent var 352.6875 Adjusted R-squared 0.093330 S.D. dependent var 60.22261 S.E. of regression 57.34350 Akaike info criterion 11.05246 Sum squared resid 46035.87 Schwarz criterion 11.14904 Log likelihood -86.41972 F-statistic 2.544058 Durbin-Watson stat 1.651810 Prob(F-statistic) 0.133030 Dependent Variable: GASTOS Method: Least Squares Date: 05/3/07 Time: 20:40 Sample: 1 17 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. INGRESOS 0.101600 0.025838 3.932153 0.0013 C -436.3693 226.9379 -1.922858 0.0737 R-squared 0.507580 Mean dependent var 453.0588 Adjusted R-squared 0.474752 S.D. dependent var 104.4740 S.E. of regression 75.71642 Akaike info criterion 11.60200 Sum squared resid 85994.65 Schwarz criterion 11.70002 Log likelihood -96.61698 F-statistic 15.46183 Durbin-Watson stat 2.461265 Prob(F-statistic) 0.001331 http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/ n p i ni i σ σ λ ˆ ˆ 1 ∏ == � � Donde: ∏ = El operador de multiplicación. p= El número de grupos. n i = El tamaño de cada grupo en la muestra. n= El tamaño de la muestra =∑ = p i inn 1 ( ) ( ) ( )[ ] ( ) 039692449.0 35508.61 71642.7534350.5782490.43 50 171617 = = λ λ � � A continuación se obtiene el estadístico de prueba aplicando la siguiente fórmula: ( ) 453188622.6 039692449.0ln2 = −= u u � � ( )gl 1-pcon sigue 2χu � � � 0.01 5.99 6.45 � INTERPRETACIÓN: Dado que u es mayor que el Ji-cuadarado dado se puede asumir que existe algún grado de heteroscedasticidad por lo tanto no existe suficiente evidencia estadística para aceptar Ho: Homoscedasticidad es decir se acepta la Ha: Heteroscedasticidad. http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/http://bajalibrosdeeconomia.blogspot.com/ http://bajalibrosdeeconomia.blogspot.com/