Title | Formelsammlung Statistik EWI |
---|---|
Author | Jonas Bobb |
Course | Statistik I |
Institution | Hochschule Darmstadt |
Pages | 24 |
File Size | 532 KB |
File Type | |
Total Downloads | 540 |
Total Views | 574 |
Warning: TT: undefined function: 32 Quantitative Methoden der Energiewirtschaft WS 2019/20 1. AuflageSeite I A. Einführung Inhaltsverzeichnis B. Deskriptive Statistik Univariate Analysen Mittelwerte Streuungsmaße Formmaße Konzentrationsmaße Bivariate und multivariate Analysen Darstellung und Grundbe...
Quantitative Methoden der Energiewirtschaft WS 2019/20
1. Auflage
Inhaltsverzeichnis A. Einführung..................................................................................................... 1 B. Deskriptive Statistik ...................................................................................... 3 1. Univariate Analysen ....................................................................................................... 3 1.1. Mittelwerte................................................................................................................ 3 1.2. Streuungsmaße ....................................................................................................... 6 1.3. Formmaße ............................................................................................................... 8 1.4. Konzentrationsmaße ................................................................................................ 9 2. Bivariate und multivariate Analysen ..........................................................................10 2.1. Darstellung und Grundbegriffe ............................................................................... 10 2.2. Korrelationsanalyse ............................................................................................... 12 3. Prognoseverfahren ...................................................................................................... 14 3.1. Regressionsanalyse............................................................................................... 14 3.2. Zeitreihenanalyse................................................................................................... 15 4. Indexzahlen ..................................................................................................................17
C. Wahrscheinlichkeitsrechnung ................................................................... 19 1. Kombinatorik ................................................................................................................ 19 2. Wahrscheinlichkeiten .................................................................................................. 19 3. Zufallsvariablen ............................................................................................................ 21
Seite I
1. Auflage
Seite II
Quantitative Methoden der Energiewirtschaft WS 2019/20
Quantitative Methoden der Energiewirtschaft WS 2019/20
1. Auflage
A. Einführung Statistische Einheiten Begriff
Definition
Statistische Einheit (Merkmalsträger)
Einzelobjekt einer statistischen Untersuchung; ein genau definierter Gegenstand oder Vorgang
Grundgesamtheit (Statistische Masse)
Menge der statistischen Einheiten mit übereinstimmenden Identifikationskriterien
Teilgesamtheit
Teilmenge der Grundgesamtheit
Stichprobe
Teilgesamtheit, bei deren Auswahl der Zufall eine Rolle spielt
Merkmal (Variable)
Eigenschaft einer statistischen Einheit
Merkmalsausprägung
Konkreter Wert des Merkmals für eine bestimmte statistische Einheit
Merkmalstypen Typ
Definition
qualitativ
Nominal- oder Ordinalskala
quantitativ
Kardinal- bzw. metrische Skala; mess- und quantifizierbare Unterschiede der Ausprägungen
diskret
Endlich oder abzählbar unendliche viele Ausprägungen
stetig
Alle Werte eines Intervalls sind mögliche Ausprägungen
quasi-stetig
Eigentlich diskretes Merkmal, das auf einer sehr feinen Abstufung gemessen wird und daher stetigen Charakter bekommt.
Skalenniveau Sinnvoll interpretierbare Rechenoperationen Skalenart
Auszählen
Ordnen
Differenzen bilden Quotienten bilden
nominal
ja
nein
nein
nein
ordinal
ja
ja
nein
nein
kardinal intervall (metrisch) verhältnis
ja
ja
ja
nein
ja
ja
ja
ja
Seite 1
1. Auflage
Quantitative Methoden der Energiewirtschaft WS 2019/20
Relative Häufigkeiten (Anteilswerte)
pi =
fi N
(i = 1,..., k)
k:
Zahl der Ausprägungen / Klassen
fi :
Absolute Häufigkeit
N:
Zahl der Beobachtungen in der Grundgesamtheit
Summenhäufigkeiten (kumulierte Häufigkeiten) Absolute Summenhäufigkeiten:
f1 + f2 + + fi =
i
∑f
j
j =1
Relative Summenhäufigkeiten:
Fi = p 1 + p 2 + + p i =
i
pj ∑ j=1
Empirische Verteilungsfunktion Diese Funktion stellt die Summe aller relativen Häufigkeiten der Merkmalsausprägungenx i dar, die höchstens gleich x sind.
0 F( x ) = Fi 1
für
x Z > M linksschiefe (rechtssteile) Verteilung: X < Z < M
Schiefemaße aus den Momenten absolut:
µ3 =
1 ⋅ N
N
∑
( x i −X) 3 =
i= 1
1 k ⋅ fi ( xi* −X )3 N i =1
∑
µ3 S3
standardisiert:
α3 =
•
Schiefe = 0:
Verteilung ist symmetrisch
•
Schiefe > 0:
Verteilung ist rechtsschief (linkssteil)
•
Schiefe < 0:
Verteilung ist linksschief (rechtssteil)
Wölbungsmaße aus den Momenten N
1 ⋅ N
∑ i =1
µ4
−3
( xi − X )4 =
1 ⋅ N
k
fi ( xi* − X ) 4 ∑ i =1
absolut:
µ4 =
standardisiert:
α4 =
•
Wölbung = 0:
mittelgewölbte Verteilung (Normalverteilung)
•
Wölbung > 0:
hochgewölbte Verteilung (steiler als die Normalverteilung)
•
Wölbung < 0:
flachgewölbte Verteilung (flacher als die Normalverteilung)
S
4
Boxplot 1.
Q1 = Anfang der Box
2.
Q3 = Ende der Box
3.
Z durch senkrechten Strich in der Box markieren
4.
Berechnung der „Zäune“: zu = Q1 − 1,5 ⋅ QA und z o = Q 3 + 1,5 ⋅ QA
5.
Zwei Linien („whiskers“) gehen von der Box aus zum kleinsten und größten Beobachtungswert innerhalb des Bereichs [zu, zo] der Zäune. (Üblicherweise werden die Endpunkte durch senkrechte Striche markiert.)
6.
Beobachtungen außerhalb der Zäune zu, zo werden einzeln markiert
Seite 8
Quantitative Methoden der Energiewirtschaft WS 2019/20
1. Auflage
1.4. Konzentrationsmaße Absolute Konzentration m x ∑ i =1 i = = ∑ pi N ∑ i=1x i i=1 m
Konzentrationsrate
Kc m
Herfindahl-Index
N x2 ∑ i =1 i KH = = ∑ pi 2 2 N ( ∑i=1x i ) i=1
Rosenbluth-Index
KR =
N
1
∑
2
Wertebereich: [1/ N; 1]
Wertebereich: [1/ N; 1]
N
i ⋅ pi − 1 i= 1
Relative Konzentration Lorenzkurve Einzeldaten:
ui =
vi
i N
∑ = ∑
i
x j= 1 j N x i= 1 i
=
i
∑q
j
j=1
Gini-Koeffizient
∑ i=1(2i −1) ⋅qi − 1 G= N
Einzeldaten:
N
Gnorm =
N ⋅G N −1
Wertebereich: [0; (N − 1)/N] Wertebereich: [0; 1]
Seite 9
1. Auflage
Quantitative Methoden der Energiewirtschaft WS 2019/20
2. Bivariate und multivariate Analysen 2.1. Darstellung und Grundbegriffe Kontigenztabelle: Merkmal X
Merkmal Y
Zeilensummen
y1
y2
...
yj
...
yc
x1
f 11
f 12
...
f1j
...
f1c
f1•
x2
f 21
f22
...
f2 j
...
f2 c
f2•
...
...
...
...
...
...
...
...
xi
fi1
f i2
...
fij
...
f ic
...
...f
...
...
...
...
...
xr
fr 1
fr 2
...
frj
...
f rc
f r•
f•1
f•2
...
f•j
...
f•c
N
Spaltensummen fij :
Gemeinsame absolute Häufigkeiten
fi• :
Summierte absolute Zeilenhäufigkeit
f •j :
Summierte absolute Spaltenhäufigkeit
Gemeinsame relative Häufigkeit p ij der Gruppe (i, j) p ij =
fij
[i =1, ...r; j = 1, ..., c]
N
Randverteilungen Betrachtung jeweils eines Merkmals Zeilensummen:
fi • =
c
∑f
bzw.
ij
j=1
p i• =
c
fi •
∑p = N ij
j= 1
Spaltensummen:
f• j =
r
∑ fij bzw. i =1 r
f• j
p ij = ∑ N i= 1
p•j =
Seite 10
f i• ...
Quantitative Methoden der Energiewirtschaft WS 2019/20
1. Auflage
Bedingte Häufigkeitsverteilungen fij
von X bei vorgegenem y j : p( x i y j ) =
p ij
=
f•j
r
,
wobei
p( x i y j ) = 1 ∑ i=1
,
wobei
∑p( y j xi ) =1
p •j
bzw. von Y bei vorgegenem x i : p( y j x i ) =
fij
=
fi •
p ij p i•
r
i=1
Bedingter Mittelwert Xyj =
∑ p(x i y j )⋅ x i bzw.
Y xi =
∑ p(y x )⋅ y j
i
j
Bedingte Varianz S 2x y j =
∑ p(x i y j )⋅ (x i − ( X y j ))2 bzw.
S 2y x i =
∑ p(y j x i )⋅ (y j − ( Y x i ))2
Statistische Unabhängigkeit fij =
fi • ⋅ f •j N oder
p ij = p i• ⋅p • j
Liegt statistische Unabhängigkeit vor, so müssen die tatsächlichen Werte aus der Tabelle stets den hypothetischen Werten f i• ⋅ f • j N entsprechen.
Seite 11
1. Auflage
Quantitative Methoden der Energiewirtschaft WS 2019/20
2.2. Korrelationsanalyse Koeffizienten für nominalskalierte Merkmale Quadratische Kontingenz
χ2 =
r
fi• f•. j − f ij c N fi• f• j j=1
2
∑∑ i=1
N
Wertebereich: 0 bis +∞ Kontingenzkoeffizient
C=
χ2 N + χ2
Wertebereich: 0 bis unter 1 •
0:
•
≈1: vollständige statistische Abhängigkeit
statistische Unabhängigkeit
Korrigierter Kontingenzkoeffizient
C korr = C ⋅
m , mit m = min(r,c) m−1
r = Anzahl, Zeilen c = Anzahl Spalten Wertebereich: 0 bis unter 1 •
0:
statistische Unabhängigkeit
•
1:
vollständige statistische Abhängigkeit
Koeffizienten für ordinalskalierte Merkmale Rangkorrelationskoeffizient nach Spearman
6⋅ ρR = 1−
N
2 Di ∑ i=1
N (N2 − 1)
D i ist die Rangdifferenz zwischen den einzelnen Merkmalen.
Sofern ein Rang mehrfach vergeben ist, ist das arithmetische Mittel zu berechnen und einzusetzen. Wertebereich: −1 bis unter +1 •
−1: vollständige negative Korrelation
•
0:
•
+1: vollständige positive Korrelation
Seite 12
statistische Unabhängigkeit
Quantitative Methoden der Energiewirtschaft WS 2019/20
1. Auflage
Koeffizienten für metrische Merkmale Kovarianz Einzeldaten:
S xy =
1 N ⋅ ( x i −X )( y i − Y ) bzw. N i =1
S xy =
1 ⋅ xi yi − X ⋅ Y N i =1
Klassierte Daten: Sxy =
S xy
∑ N
∑
1 ⋅ N
r
c
∑∑(x
− X )( y *j − Y ) f ij bzw..
* i
i=1 j=1 c
1 r ⋅ N i=1
∑∑x y f
* * i j ij
−X ⋅Y
j=1
Wertebereich: −∞ bis unter +∞ Korrelationskoeffizient nach Bravais-Pearson ρB =
S xy Sx Sy N
Einzeldaten:
ρB =
∑ (x − X )(y i
i=1
N
2
i
i=1
2
i=1
1 ⋅ N 1 ⋅ N
N
∑x y
i i−X
⋅Y
i=1
1 xi2 − X 2 ⋅ N i =1 N
∑
r
c
∑∑ ( x − X )(y i
Klassierte Daten: ρB =
bzw.
N
∑ ( x − X) ⋅ ∑ (y − Y) i
ρB =
− Y)
i
*
* i
N
∑y
2 i −
i =1
Y2
− Y )fij
i =1 i =1
r
∑
( x*i − X )2 fi• ⋅
i=1
c
∑ (y
* i
− Y )2 f• j
j =1
Wertebereich: −1 bis unter +1 •
−1: vollständige negative Korrelation
•
0:
•
+1: vollständige positive Korrelation
statistische Unabhängigkeit
Seite 13
1. Auflage
Quantitative Methoden der Energiewirtschaft WS 2019/20
3. Prognoseverfahren 3.1. Regressionsanalyse Nur für metrische Merkmale! Lineare Regression Regressionsfunktion: yˆ i = β0 + β1x i β0 = y-Achsenabschnitt β1 = Steigung
Regressionskoeffizienten: S xy
β1 =
1 N
β1 =
N
( x i − X )(y i − Y ) ∑ i =1 1 N
1 N
β1 =
β1 =
bzw.
S 2x
N
(x i − X ) ∑ i 1 =
N
∑x y
i i
i =1 N
1 N
2
∑
− X ⋅Y
bzw.
2 xi
−X
2
i =1
XY − X ⋅ Y X2 − X2
β0 = Y − β1 X
Bestimmtheitsmaß: N
∑ ( ˆy − Y )
2
i
R2 =
i=1 N
∑ (y − Y)
bzw.
2
i
i=1
R2 =
N
1 N
∑yˆ
1 N
∑
R2 = ρ2B Seite 14
i=1 N
i=1
2 i
−Y 2
y i2
2
bzw.
−Y
bzw.
Quantitative Methoden der Energiewirtschaft WS 2019/20
1. Auflage
Wertebereich: 0 bis 1 0:
sofern die Merkmale unkorreliert sind
1:
wenn Merkmalswerte auf einer Geraden mit negativer oder positiver Steigung liegen.
Je größer R2 , desto stärker werden die empirischen Werte durch die ermittelte Regressionsgerade erklärt.
3.2. Zeitreihenanalyse Zeitreihenkomponenten y t = f Tt , Z t , S t ,ε t für t = 1, 2, ..., T. Gt mit: T = Trend Z = Zyklische Komponente G = Glatte Komponente S = Saisonale Komponente ε = Restkomponente Additives Modell:
y t = Tt + Z t + St + εt für t = 1, 2, ..., T.
Multiplikatives Modell:
y t = T t ⋅ Z t ⋅S t ⋅ εt
für t = 1, 2, ..., T.
Methode der gleitenden Durchschnitte Gleitender 2er Schnitt:
1 1 1 g t = ⋅ y t−1 + y t + y t +1 2 2 2
Gleitender 3er Schnitt:
1 gt = ⋅ (y t −1 + y t + y t +1 ) 3
Gleitender 4er Schnitt:
1 1 1 gt = ⋅ y t− 2 + y t− 1 + y t + y t +1 + yt + 2 4 2 2
Gleitender 5er Schnitt:
1 g t = ⋅ ( y t− 2 + y t− 1 + yt + yt +1 + yt + 2 ) 5
etc. Seite 15
1. Auflage
Quantitative Methoden der Energiewirtschaft WS 2019/20
Exponentielles Glätten
g et = α ⋅ y t + (1 − α ) ⋅ g et− 1
wobei 0 < α < 1, ge1 = y 1 Trendfunktionen Linearer Trend: mit:
yˆ t = b 0 + b1 ⋅ t b1 =
S ty S2t
=
tY − t ⋅ Y 2
t −t
2
b0 = Y − b1 t
Exponentieller Trend:
yˆ t = b 0 b 1t
Durch Logarithmieren kann ein exponentielles Trendmodell der Formyˆ t = b0 b1t
in ein linea-
res Trendmodell überführt werden:ln(yt ) = ln(b0 ) + t ⋅ ln(b1 ). Bestimmung saisonbereinigter Werte 1. Schritt:
Ermittlung eines gleitenden Durchschnittsy * mit der Gliederzahl l (Anzahl der Perioden) Bestimmung der um die glatte Komponente bereinigten Zeitreihe:
y t − y *t 2. Schritt:
Für jede unterjährige Periode wird das arithmetische Mittel der Differenzen ermittelt, die sogenannte rohe Komponente: Sj =
3. Schritt:
1 m
m
(yij − yij*) ∑ i =1
Berechnung der korrigierten Saisonkomponente
S j(korr) = S j − 4. Schritt:
l
∑S
j
j=1
Bestimmung der saisonbereinigten Werte: y t − S j(korr)
Seite 16
1 l
Quantitative Methoden der Energiewirtschaft WS 2019/20
1. Auflage
4. Indexzahlen Preisindizes •
Preisindex nach Laspeyres n
P (L ) =
•
∑pt q0 i =1 n
p 0q0 ∑ i= 1
⋅100
Preisindex nach Paasche n
(P)
P
=
∑p t q t i =1 n
p 0qt ∑ i 1
⋅100
=
Mengenindizes •
Mengenindex nach Laspeyres n
(L )
Q
•
=
∑ q tp0 i= 1 n
q 0p 0 ∑ i =1
⋅100
Mengenindex nach Paasche n
(P)
Q
=
∑ q t pt i =1 n
q0 pt ∑ i= 1
⋅100
Wertindizes (Umsatzindizes) n
W=
p tq t ∑ = i 1 n
p 0q 0 ∑ i= 1
⋅100 =
P( P ) ⋅ Q(L ) P(L ) ⋅Q( P ) = 100 100
Umbasierung
Indexneue Basis =
Indexalte Basis ⋅ 100 Index neue Basis
Seite 17
1. Auflage
Quantitative Methoden der Energiewirtschaft WS 2019/20
Verknüpfu...