EWF - Musterlösung 6 PDF

Title	EWF - Musterlösung 6
Course	Empirische Wirtschaftsforschung
Institution	Technische Universität Darmstadt
Pages	6
File Size	268.8 KB
File Type	PDF
Total Downloads	67
Total Views	153

Preview

CLICK TO PREVIEW PDF

Summary

Download EWF - Musterlösung 6 PDF

Description

Übung zur Vorlesung Empirische Wirtschaftsforschung Wintersemester 2018/19 - Aufgabenblatt 6 - Musterlösung Aufgabe 1 (Zahlenbeispiel) Regressionsmodell: yi = β1 + β2 x i + u i     2 4 4   4 Beobachtungsvektoren: x =   , y =   6 2 8 2

a)

b)

    1 0 0 0 1 0 0 0 1 0 2 0 0  0 2 0 0 b = (X ′ Ω−1 X )−1 X ′ Ω−1 y mit Ω =  β  bzw. Ω−1 =    G LS 0 0 2 0 0 0 21 0 0 0 0 1 0 0 0 1   −1     1 0 0 0 1 0 0 0 4 1 2     1 1 1 1 0 12 0 0  4  1 1 1 1 0 21 0 0 1 4  =    2 4 6 8 0 0 12 0  2 2 4 6 8 0 0 12 0 1 6  2 0 0 0 1 1 8 0 0 0 1    −1    4  1 2   −1   1 1 1 1 3 15 9 1 2 2 1  4  1 2 2 1  1 4  = =  2 2 3 8  2 2 2 3 8 1 6  38 15 94 2 1 8       94 − 15     1 94 −15 9 57 57 4.84 9 = = = 3 15 −0.37 38 3 38 3 · 94 − 152 −15 − 57 57 b G LS ) = σ b 2 (X ′ Ω−1 X )−1 Vb ( β

σ2 = b

   4 1  4  1  2 −  1 2 1

 −0.1

 ′  1 2   4.84   0 4   6 −0.37 0 8 0

0.64

=

b b V (β G LS ) = 0.21 ·

mit σb2 =

−0.62

 1  0 0.12  0 0

′ −1 b b (y − X β G LS ) Ω (y − Xβ G LS ) n−k

0 1 2

0 0

0 0

0

3 15

1 2

4−2

0

1 2

0 0

2



    0 4 1 0  4  1   2  − 1 0 2 1 1

 94 −1 57 15 = 0.21 · 94 − 15 57

  −0.1 0 0 0 0  0.64    −0.62 1 0 2 0.12 0 1 − 15 57 3 57



=



=

0.347 −0.055

  2   4.84  4   6 −0.37 8

0.42 = 0.21 2  −0.055 0.011

1

c)

t -Statistik: t 2 = q

βb2,G LS

b (β b G LS )22 V

−0.37 =p = −3.528 0.011

Kritischer Wert: t 0.95 (2) = 2.92 < |t 2 | Interpretation: Die ermittelte t -Statistik ist absolut größer als der kritische Wert. Daher ist β2 auf dem 10%-Niveau statistisch signifikant von Null verschieden.

d)

R2 = 1 −

= 1−

e)

b (y − XβbG LS )′ (y − X β G LS ) P4 2 ( y − ¯ y ) i i=1  −0.1

0.64

−0.62 4



 −0.1  0.64 0.12  −0.62 0.12

= 1−

0.8184 = 0.795 4

Interpretation: 79.5 % der Variationen in y können durch Variationen in x bei Verwendung des GLS-Schätzers b β G LS erklärt werden. Überprüfung der Ergebnisse mit R:

> library(MASS) > x X y D W R1 R1$coef (Intercept) x 4.8421053 -0.3684211 > S2 S2 [1] 0.2105263 > V V x 0.34718375 -0.05540166 x -0.05540166 0.01108033 > Rs Rs [1] 0.7950139

2

Aufgabe 2 (Theorie) a)

Herleitung OLS-Schätzer und Varianz:

min Z = β

n X

n X

u2i =

i=1

∂Z = −2 ∂β

i=1

n X i=1

( yi − β) = 0

 Var βbO LS = Var 

b)

( yi − β)2



⇒ nβ =

n X

n

i=1

 n n n n σ2 X 2 1 X 1X 1 X z [Mit Var(u i ) = σ2 zi2 ] Var(u i ) = Var (β + u i ) = yi = n i=1 n2 i=1 n2 i=1 n2 i=1 i

Var(u i ) = σ2 ⇒ zi2

Var(u i ) = σ2 zi2

1X yi ⇒ βbO LS = n i=1

yi

Transformiertes Regressionsmodell:

⇒ Var yi zi

=

β zi

+



 ui = σ2 zi

ui zi

i = 1, . . . , n

Herleitung GLS-Schätzer und Varianz:   n  n  X u i 2 X yi β 2 min Z = − = β zi zi zi i=1 i=1

 n  X ∂Z yi β 1 =0 = −2 − ∂β zi zi zi i=1   1 Var βbG LS =  Pn 



1 i=1 z 2 i

= P c)

d)

n X n X z2

i = z2 i=1 j=1 j

n+

1

n 1 i=1 z 2 i

2 

2 

n X

n n X X yi 1 = ⇒ β 2 z z2 i=1 i i=1 i

Var

i=1



yi zi2

2 n  X 1 z 2i

i=1





=  Pn

1

1 i=1 z 2 i

σ2 σ2 z 2i = Pn

2 

Pn

yi i=1 z 2

⇒ βbG LS = Pn

i

1 i=1 z 2 i

n  X 1 2 z i i=1

2

Var(β + u i )

1 i=1 z 2 i

n n X X z 2i i=1 j=1, j6= i

z 2j

= n+

n−1 X n X zi2

= n+

n(n − 1) w ¯ 2

z2 i=1 j=i+1 j

+

z 2j z 2i mit w¯ =

1

n−1 X n X zi2

n(n−1) z2 i=1 j=i+1 j 2

+

zj2 zi2

    Zu zeigen: Var βbO LS ≥ Var βbG LS

n n n X n n n n X X X σ2 1 σ2 X 2 1 1 X 2X 1 2 2 ≥ 1 ⇔ P ≥ z z zi2 · 2 ≥ n2 z ⇔ ≥ n ⇔ n i i i 2 2 1 n2 n2 z z z 2 i j i=1 i=1 z i=1 i=1 j=1 i=1 i=1 i=1 i i

Mit dem Ergebnis aus c) folgt:

n+

n(n − 1) (n − 1) (n − 1) w w w ¯≥2 ¯ ≥ n2 ⇔ 1 + ¯≥n ⇔ ¯ ≥ n−1 ⇔ w 2 2 2

3

Um zu zeigen, dass der Mittelwert größer oder gleich 2 ist, reicht es zu zeigen, dass jedes Paar 2

größer oder gleich 2 ist. Hierfür definieren wir b i = zi und b j =

z 2j

und somit folgt:



zi 2

zj2

+

z 2j  z2 i

bj bi + ≥2 bj bi ⇔ bi2 + b 2j ≥ 2b i b j ⇔ bi2 − 2b i b j + b 2j ≥ 0 ⇔ (b i − b j )2 ≥ 0 (Binomische Formel) b ). Für den Fall z = z ∀i, j Da diese Ungleichung immer erfüllt ist, giltw¯ ≥ 2 und somit Var(βbO LS ) ≥ Var( β G LS i j  2 2 z zi 1 1 j bG LS ). D.h. wenn alle “Gewichte” zi gleich sind, ergibt sich 2 + 2 = + = 2 und somit Var(βbO LS ) = Var( β 1 1 zj zi folgt die Gleichheit der Varianzen der beiden Schätzer.

Aufgabe 3 (Empirie)

> library(Ecdat) > data(DoctorAUS) > D R1 summary(R1) Call: lm(formula = doctorco ~ age + illness, data = D) Residuals: Min 1Q Median 3Q -0.8274 -0.3258 -0.1906 -0.0714

Max 8.2046

Coefficients: Estimate Std. Error (Intercept) 0.0248973 + age 0.0537071 + illness 0.0079458 --Signif. codes: 0 '***' 0.001 '**'

signiﬁkanz eine Koefﬁzient: 0.037 0.971 1.t,value-t,kritisch vergleichen 5.963 2.65e-09 *** 2.p,wert klein= signiﬁkant 15.001 < 2e-16 *** 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.7754 on 5187 degrees of freedom Multiple R-squared: 0.05644, n-k Adjusted R-squared: 0.05608 F-statistic: 155.1 on and DF, p-value: < 2.2e-16

x1,age x2,illness

+ 0.32 Besuche. Durch jeden KrankInterpretation: Pro Jahr an Lebensalter steigt die Anzahl der Arztbesuche um + heitstag steigt die Anzahl an Arztbesuchen um 0.12 Besuche. Beide Koeffizienten sind statistisch signifikant von Null verschieden. Dies lässt sich sowohl an den, verglichen mit dem kritischen Wert von t 0.975 (5187) = 1.9604, großen t -Statistiken als auch an den kleinen p -Werten erkennen. Standard t-test : T(n-k) 1-alpha/2 ,signi:0,05 n= 4

Regression (2)

Y=ß1 +ß2. age+ ß3 illness +ß4 illness^2 +ui

> R2 summary(R2) Call: lm(formula = doctorco ~ age + illness + I(illness^2), data = D) Residuals: Min 1Q Median 3Q -0.7791 -0.3437 -0.1991 -0.0548

Max 8.2534

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.016683 0.027206 -0.613 0.540 age 0.324758 0.053773 6.039 1.65e-09 *** illness 0.152320 0.022139 6.880 6.69e-12 *** I(illness^2) -0.007988 0.004983 0.109 --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.7753 on 5186 degrees of freedom Multiple R-squared: 0.05691, Adjusted R-squared: 0.05636 F-statistic: 104.3 on 3 and 5186 DF, p-value: < 2.2e-16 Interpretation: Der Koeffizient der quadrierten Anzahl an Krankheitstagen ist . Dies lässt sich an der t -Statistik erkennen, die mit − absolut von t 0.975 (5186) = 1.9604 ist. Alternativ weist auch der p -Wert, der mit 0.109 größer als 0.05 ist, darauf hin, dass der Koeffizient nicht signifikant ist. D.h. das Niveau an Krankheitstagen hat keinen Einfluß auf den .

illness a un effect sur Anzahl an Arztbesuchen mais pas Niveau an Krankheitstagen Regression (3)

> R3 |t|) (Intercept) 0.05837 0.03441 1.697 0.0898 . age 0.18135 0.07861 2.307 0.0211 * illness 0.07786 0.01885 4.131 3.67e-05 *** I(age * illness) 0.09089 0.03758 2.418 0.0156 * --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.7751 on 5186 degrees of freedom Multiple R-squared: 0.05751, Adjusted R-squared: 0.05696 F-statistic: 105.5 on 3 and 5186 DF, p-value: < 2.2e-16 Interpretation: Der Koeffizient des Interaktionsterms des Alters mit den Krankheitstagen ist statistisch signifikant von Null verschieden, wie sich an der t -Statistik (2.418) erkennen lässt, die größer ist als der kritische Wert von t 0.975 (5186) = 1.9604. Zum selben Ergebnis führt die Betrachtung des p -Wertes (0.0156),welcher kleiner ist als 0.05. D.h.

ß4x (illness. age)

5

b)

Überprüfung des Unterschieds

> R4 summary(R4) Call: lm(formula = doctorco ~ age + illness + I(age * illness) + I(sex * ess), data = D) Residuals: Min 1Q Median 3Q -0.9145 -0.3074 -0.1891 -0.0985

Max 8.1840

Coefficients: Estimate Std. Error t value Pr(>|t|) P,wert =0.05 (Intercept) 0.058695 0.034413 1.706 0.0881 . age 0.181112 0.078619 2.304 0.0213 * illness 0.075196 0.019293 3.898 9.84e-05 *** I(age * illness) 0.086797 0.038113 2.277 0.0228 * I(sex * illness) 0.007399 0.011443 0.647 0.5179 --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.7751 on 5185 degrees of freedom Multiple R-squared: 0.05758, Adjusted R-squared: 0.05685 F-statistic: 79.2 on 4 and 5185 DF, p-value: < 2.2e-16

t,value < t,kri et p,value > p,krit => nicht signifikant Interpretation: Der Koeffizient des Interaktionsterms (I(sex * illness)) ist nicht signifikant von Null verschieden. Erkennen lässt sich dies wiederum am kleinen t -Wert (0.647 < 1.9604 = t 0.975 (5186)) oder am großen p -Wert (0.5179 > 0.05). Somit lässt sich kein Unterschied im Effekt der Krankheitstage auf die Anzahl der Arztbesuche zwischen Männern und Frauen feststellen. c)

est

> library(lmtest) > (R2,~age+illness+I(illness^2)+I(age^2)+I(illness^2) + +I(illness^4)+I(age*illness)+I(illness^3)+I(age*illness^2),data=D) studentized Breusch-Pagan test data: R2 BP = 103.886, df = 8, p-value < 2.2e-16 Interpretation: Die Nullhypothese wird auf dem 1%-Niveau verworfen ( p -Wert < 0.01). Somit liegt statistisch signifikant Heteroskedastizität in Regressionsmodell (2) vor. Der White-Test führt bei einer Verk(k+1) 4·5 wendung aller Quadrate und Kreuzprodukte eigentlich zu 2 − 1 = 2 − 1 = 9 Restriktionen. Da jedoch der Regressor I(illnessˆ2) doppelt vorkommt wird dieser von R automatisch aus der Regression entfernt und die Anzahl an Restriktionen reduziert sich auf 8.

6...