Title | EWF - Musterlösung 6 |
---|---|
Course | Empirische Wirtschaftsforschung |
Institution | Technische Universität Darmstadt |
Pages | 6 |
File Size | 268.8 KB |
File Type | |
Total Downloads | 67 |
Total Views | 153 |
Download EWF - Musterlösung 6 PDF
Übung zur Vorlesung Empirische Wirtschaftsforschung Wintersemester 2018/19 - Aufgabenblatt 6 - Musterlösung Aufgabe 1 (Zahlenbeispiel) Regressionsmodell: yi = β1 + β2 x i + u i 2 4 4 4 Beobachtungsvektoren: x = , y = 6 2 8 2
a)
b)
1 0 0 0 1 0 0 0 1 0 2 0 0 0 2 0 0 b = (X ′ Ω−1 X )−1 X ′ Ω−1 y mit Ω = β bzw. Ω−1 = G LS 0 0 2 0 0 0 21 0 0 0 0 1 0 0 0 1 −1 1 0 0 0 1 0 0 0 4 1 2 1 1 1 1 0 12 0 0 4 1 1 1 1 0 21 0 0 1 4 = 2 4 6 8 0 0 12 0 2 2 4 6 8 0 0 12 0 1 6 2 0 0 0 1 1 8 0 0 0 1 −1 4 1 2 −1 1 1 1 1 3 15 9 1 2 2 1 4 1 2 2 1 1 4 = = 2 2 3 8 2 2 2 3 8 1 6 38 15 94 2 1 8 94 − 15 1 94 −15 9 57 57 4.84 9 = = = 3 15 −0.37 38 3 38 3 · 94 − 152 −15 − 57 57 b G LS ) = σ b 2 (X ′ Ω−1 X )−1 Vb ( β
σ2 = b
4 1 4 1 2 − 1 2 1
−0.1
′ 1 2 4.84 0 4 6 −0.37 0 8 0
0.64
=
b b V (β G LS ) = 0.21 ·
mit σb2 =
−0.62
1 0 0.12 0 0
′ −1 b b (y − X β G LS ) Ω (y − Xβ G LS ) n−k
0 1 2
0 0
0 0
0
3 15
1 2
4−2
0
1 2
0 0
2
0 4 1 0 4 1 2 − 1 0 2 1 1
94 −1 57 15 = 0.21 · 94 − 15 57
−0.1 0 0 0 0 0.64 −0.62 1 0 2 0.12 0 1 − 15 57 3 57
=
=
0.347 −0.055
2 4.84 4 6 −0.37 8
0.42 = 0.21 2 −0.055 0.011
1
c)
t -Statistik: t 2 = q
βb2,G LS
b (β b G LS )22 V
−0.37 =p = −3.528 0.011
Kritischer Wert: t 0.95 (2) = 2.92 < |t 2 | Interpretation: Die ermittelte t -Statistik ist absolut größer als der kritische Wert. Daher ist β2 auf dem 10%-Niveau statistisch signifikant von Null verschieden.
d)
R2 = 1 −
= 1−
e)
b (y − XβbG LS )′ (y − X β G LS ) P4 2 ( y − ¯ y ) i i=1 −0.1
0.64
−0.62 4
−0.1 0.64 0.12 −0.62 0.12
= 1−
0.8184 = 0.795 4
Interpretation: 79.5 % der Variationen in y können durch Variationen in x bei Verwendung des GLS-Schätzers b β G LS erklärt werden. Überprüfung der Ergebnisse mit R:
> library(MASS) > x X y D W R1 R1$coef (Intercept) x 4.8421053 -0.3684211 > S2 S2 [1] 0.2105263 > V V x 0.34718375 -0.05540166 x -0.05540166 0.01108033 > Rs Rs [1] 0.7950139
2
Aufgabe 2 (Theorie) a)
Herleitung OLS-Schätzer und Varianz:
min Z = β
n X
n X
u2i =
i=1
∂Z = −2 ∂β
i=1
n X i=1
( yi − β) = 0
Var βbO LS = Var
b)
( yi − β)2
⇒ nβ =
n X
n
i=1
n n n n σ2 X 2 1 X 1X 1 X z [Mit Var(u i ) = σ2 zi2 ] Var(u i ) = Var (β + u i ) = yi = n i=1 n2 i=1 n2 i=1 n2 i=1 i
Var(u i ) = σ2 ⇒ zi2
Var(u i ) = σ2 zi2
1X yi ⇒ βbO LS = n i=1
yi
Transformiertes Regressionsmodell:
⇒ Var yi zi
=
β zi
+
ui = σ2 zi
ui zi
i = 1, . . . , n
Herleitung GLS-Schätzer und Varianz: n n X u i 2 X yi β 2 min Z = − = β zi zi zi i=1 i=1
n X ∂Z yi β 1 =0 = −2 − ∂β zi zi zi i=1 1 Var βbG LS = Pn
1 i=1 z 2 i
= P c)
d)
n X n X z2
i = z2 i=1 j=1 j
n+
1
n 1 i=1 z 2 i
2
2
n X
n n X X yi 1 = ⇒ β 2 z z2 i=1 i i=1 i
Var
i=1
yi zi2
2 n X 1 z 2i
i=1
= Pn
1
1 i=1 z 2 i
σ2 σ2 z 2i = Pn
2
Pn
yi i=1 z 2
⇒ βbG LS = Pn
i
1 i=1 z 2 i
n X 1 2 z i i=1
2
Var(β + u i )
1 i=1 z 2 i
n n X X z 2i i=1 j=1, j6= i
z 2j
= n+
n−1 X n X zi2
= n+
n(n − 1) w ¯ 2
z2 i=1 j=i+1 j
+
z 2j z 2i mit w¯ =
1
n−1 X n X zi2
n(n−1) z2 i=1 j=i+1 j 2
+
zj2 zi2
Zu zeigen: Var βbO LS ≥ Var βbG LS
n n n X n n n n X X X σ2 1 σ2 X 2 1 1 X 2X 1 2 2 ≥ 1 ⇔ P ≥ z z zi2 · 2 ≥ n2 z ⇔ ≥ n ⇔ n i i i 2 2 1 n2 n2 z z z 2 i j i=1 i=1 z i=1 i=1 j=1 i=1 i=1 i=1 i i
Mit dem Ergebnis aus c) folgt:
n+
n(n − 1) (n − 1) (n − 1) w w w ¯≥2 ¯ ≥ n2 ⇔ 1 + ¯≥n ⇔ ¯ ≥ n−1 ⇔ w 2 2 2
3
Um zu zeigen, dass der Mittelwert größer oder gleich 2 ist, reicht es zu zeigen, dass jedes Paar 2
größer oder gleich 2 ist. Hierfür definieren wir b i = zi und b j =
z 2j
und somit folgt:
zi 2
zj2
+
z 2j z2 i
bj bi + ≥2 bj bi ⇔ bi2 + b 2j ≥ 2b i b j ⇔ bi2 − 2b i b j + b 2j ≥ 0 ⇔ (b i − b j )2 ≥ 0 (Binomische Formel) b ). Für den Fall z = z ∀i, j Da diese Ungleichung immer erfüllt ist, giltw¯ ≥ 2 und somit Var(βbO LS ) ≥ Var( β G LS i j 2 2 z zi 1 1 j bG LS ). D.h. wenn alle “Gewichte” zi gleich sind, ergibt sich 2 + 2 = + = 2 und somit Var(βbO LS ) = Var( β 1 1 zj zi folgt die Gleichheit der Varianzen der beiden Schätzer.
Aufgabe 3 (Empirie)
> library(Ecdat) > data(DoctorAUS) > D R1 summary(R1) Call: lm(formula = doctorco ~ age + illness, data = D) Residuals: Min 1Q Median 3Q -0.8274 -0.3258 -0.1906 -0.0714
Max 8.2046
Coefficients: Estimate Std. Error (Intercept) 0.0248973 + age 0.0537071 + illness 0.0079458 --Signif. codes: 0 '***' 0.001 '**'
signifikanz eine Koeffizient: 0.037 0.971 1.t,value-t,kritisch vergleichen 5.963 2.65e-09 *** 2.p,wert klein= signifikant 15.001 < 2e-16 *** 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.7754 on 5187 degrees of freedom Multiple R-squared: 0.05644, n-k Adjusted R-squared: 0.05608 F-statistic: 155.1 on and DF, p-value: < 2.2e-16
x1,age x2,illness
+ 0.32 Besuche. Durch jeden KrankInterpretation: Pro Jahr an Lebensalter steigt die Anzahl der Arztbesuche um + heitstag steigt die Anzahl an Arztbesuchen um 0.12 Besuche. Beide Koeffizienten sind statistisch signifikant von Null verschieden. Dies lässt sich sowohl an den, verglichen mit dem kritischen Wert von t 0.975 (5187) = 1.9604, großen t -Statistiken als auch an den kleinen p -Werten erkennen. Standard t-test : T(n-k) 1-alpha/2 ,signi:0,05 n= 4
Regression (2)
Y=ß1 +ß2. age+ ß3 illness +ß4 illness^2 +ui
> R2 summary(R2) Call: lm(formula = doctorco ~ age + illness + I(illness^2), data = D) Residuals: Min 1Q Median 3Q -0.7791 -0.3437 -0.1991 -0.0548
Max 8.2534
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.016683 0.027206 -0.613 0.540 age 0.324758 0.053773 6.039 1.65e-09 *** illness 0.152320 0.022139 6.880 6.69e-12 *** I(illness^2) -0.007988 0.004983 0.109 --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.7753 on 5186 degrees of freedom Multiple R-squared: 0.05691, Adjusted R-squared: 0.05636 F-statistic: 104.3 on 3 and 5186 DF, p-value: < 2.2e-16 Interpretation: Der Koeffizient der quadrierten Anzahl an Krankheitstagen ist . Dies lässt sich an der t -Statistik erkennen, die mit − absolut von t 0.975 (5186) = 1.9604 ist. Alternativ weist auch der p -Wert, der mit 0.109 größer als 0.05 ist, darauf hin, dass der Koeffizient nicht signifikant ist. D.h. das Niveau an Krankheitstagen hat keinen Einfluß auf den .
illness a un effect sur Anzahl an Arztbesuchen mais pas Niveau an Krankheitstagen Regression (3)
> R3 |t|) (Intercept) 0.05837 0.03441 1.697 0.0898 . age 0.18135 0.07861 2.307 0.0211 * illness 0.07786 0.01885 4.131 3.67e-05 *** I(age * illness) 0.09089 0.03758 2.418 0.0156 * --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.7751 on 5186 degrees of freedom Multiple R-squared: 0.05751, Adjusted R-squared: 0.05696 F-statistic: 105.5 on 3 and 5186 DF, p-value: < 2.2e-16 Interpretation: Der Koeffizient des Interaktionsterms des Alters mit den Krankheitstagen ist statistisch signifikant von Null verschieden, wie sich an der t -Statistik (2.418) erkennen lässt, die größer ist als der kritische Wert von t 0.975 (5186) = 1.9604. Zum selben Ergebnis führt die Betrachtung des p -Wertes (0.0156),welcher kleiner ist als 0.05. D.h.
ß4x (illness. age)
5
b)
Überprüfung des Unterschieds
> R4 summary(R4) Call: lm(formula = doctorco ~ age + illness + I(age * illness) + I(sex * ess), data = D) Residuals: Min 1Q Median 3Q -0.9145 -0.3074 -0.1891 -0.0985
Max 8.1840
Coefficients: Estimate Std. Error t value Pr(>|t|) P,wert =0.05 (Intercept) 0.058695 0.034413 1.706 0.0881 . age 0.181112 0.078619 2.304 0.0213 * illness 0.075196 0.019293 3.898 9.84e-05 *** I(age * illness) 0.086797 0.038113 2.277 0.0228 * I(sex * illness) 0.007399 0.011443 0.647 0.5179 --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.7751 on 5185 degrees of freedom Multiple R-squared: 0.05758, Adjusted R-squared: 0.05685 F-statistic: 79.2 on 4 and 5185 DF, p-value: < 2.2e-16
t,value < t,kri et p,value > p,krit => nicht signifikant Interpretation: Der Koeffizient des Interaktionsterms (I(sex * illness)) ist nicht signifikant von Null verschieden. Erkennen lässt sich dies wiederum am kleinen t -Wert (0.647 < 1.9604 = t 0.975 (5186)) oder am großen p -Wert (0.5179 > 0.05). Somit lässt sich kein Unterschied im Effekt der Krankheitstage auf die Anzahl der Arztbesuche zwischen Männern und Frauen feststellen. c)
est
> library(lmtest) > (R2,~age+illness+I(illness^2)+I(age^2)+I(illness^2) + +I(illness^4)+I(age*illness)+I(illness^3)+I(age*illness^2),data=D) studentized Breusch-Pagan test data: R2 BP = 103.886, df = 8, p-value < 2.2e-16 Interpretation: Die Nullhypothese wird auf dem 1%-Niveau verworfen ( p -Wert < 0.01). Somit liegt statistisch signifikant Heteroskedastizität in Regressionsmodell (2) vor. Der White-Test führt bei einer Verk(k+1) 4·5 wendung aller Quadrate und Kreuzprodukte eigentlich zu 2 − 1 = 2 − 1 = 9 Restriktionen. Da jedoch der Regressor I(illnessˆ2) doppelt vorkommt wird dieser von R automatisch aus der Regression entfernt und die Anzahl an Restriktionen reduziert sich auf 8.
6...