Formelsammlung Statistik EWI PDF

Title	Formelsammlung Statistik EWI
Author	Jonas Bobb
Course	Statistik I
Institution	Hochschule Darmstadt
Pages	24
File Size	532 KB
File Type	PDF
Total Downloads	540
Total Views	574

Preview

CLICK TO PREVIEW PDF

Summary

Warning: TT: undefined function: 32 Quantitative Methoden der Energiewirtschaft WS 2019/20 1. AuflageSeite I A. Einführung Inhaltsverzeichnis B. Deskriptive Statistik Univariate Analysen Mittelwerte Streuungsmaße Formmaße Konzentrationsmaße Bivariate und multivariate Analysen Darstellung und Grundbe...

Description

Quantitative Methoden der Energiewirtschaft WS 2019/20

1. Auflage

Inhaltsverzeichnis A. Einführung..................................................................................................... 1 B. Deskriptive Statistik ...................................................................................... 3 1. Univariate Analysen ....................................................................................................... 3 1.1. Mittelwerte................................................................................................................ 3 1.2. Streuungsmaße ....................................................................................................... 6 1.3. Formmaße ............................................................................................................... 8 1.4. Konzentrationsmaße ................................................................................................ 9 2. Bivariate und multivariate Analysen ..........................................................................10 2.1. Darstellung und Grundbegriffe ............................................................................... 10 2.2. Korrelationsanalyse ............................................................................................... 12 3. Prognoseverfahren ...................................................................................................... 14 3.1. Regressionsanalyse............................................................................................... 14 3.2. Zeitreihenanalyse................................................................................................... 15 4. Indexzahlen ..................................................................................................................17

C. Wahrscheinlichkeitsrechnung ................................................................... 19 1. Kombinatorik ................................................................................................................ 19 2. Wahrscheinlichkeiten .................................................................................................. 19 3. Zufallsvariablen ............................................................................................................ 21

Seite I

1. Auflage

Seite II

Quantitative Methoden der Energiewirtschaft WS 2019/20

Quantitative Methoden der Energiewirtschaft WS 2019/20

1. Auflage

A. Einführung Statistische Einheiten Begriff

Definition

Statistische Einheit (Merkmalsträger)

Einzelobjekt einer statistischen Untersuchung; ein genau definierter Gegenstand oder Vorgang

Grundgesamtheit (Statistische Masse)

Menge der statistischen Einheiten mit übereinstimmenden Identifikationskriterien

Teilgesamtheit

Teilmenge der Grundgesamtheit

Stichprobe

Teilgesamtheit, bei deren Auswahl der Zufall eine Rolle spielt

Merkmal (Variable)

Eigenschaft einer statistischen Einheit

Merkmalsausprägung

Konkreter Wert des Merkmals für eine bestimmte statistische Einheit

Merkmalstypen Typ

Definition

qualitativ

Nominal- oder Ordinalskala

quantitativ

Kardinal- bzw. metrische Skala; mess- und quantifizierbare Unterschiede der Ausprägungen

diskret

Endlich oder abzählbar unendliche viele Ausprägungen

stetig

Alle Werte eines Intervalls sind mögliche Ausprägungen

quasi-stetig

Eigentlich diskretes Merkmal, das auf einer sehr feinen Abstufung gemessen wird und daher stetigen Charakter bekommt.

Skalenniveau Sinnvoll interpretierbare Rechenoperationen Skalenart

Auszählen

Ordnen

Differenzen bilden Quotienten bilden

nominal

ja

nein

nein

nein

ordinal

ja

ja

nein

nein

kardinal intervall (metrisch) verhältnis

ja

ja

ja

nein

ja

ja

ja

ja

Seite 1

1. Auflage

Quantitative Methoden der Energiewirtschaft WS 2019/20

Relative Häufigkeiten (Anteilswerte)

pi =

fi N

(i = 1,..., k)

k:

Zahl der Ausprägungen / Klassen

fi :

Absolute Häufigkeit

N:

Zahl der Beobachtungen in der Grundgesamtheit

Summenhäufigkeiten (kumulierte Häufigkeiten) Absolute Summenhäufigkeiten:

f1 + f2 +  + fi =

i

∑f

j

j =1

Relative Summenhäufigkeiten:

Fi = p 1 + p 2 + + p i =

i

pj ∑ j=1

Empirische Verteilungsfunktion Diese Funktion stellt die Summe aller relativen Häufigkeiten der Merkmalsausprägungenx i dar, die höchstens gleich x sind.

0  F( x ) = Fi 1 

für

x Z > M linksschiefe (rechtssteile) Verteilung: X < Z < M

Schiefemaße aus den Momenten absolut:

µ3 =

1 ⋅ N

N

∑

( x i −X) 3 =

i= 1

1 k ⋅ fi ( xi* −X )3 N i =1

∑

µ3 S3

standardisiert:

α3 =

•

Schiefe = 0:

Verteilung ist symmetrisch

•

Schiefe > 0:

Verteilung ist rechtsschief (linkssteil)

•

Schiefe < 0:

Verteilung ist linksschief (rechtssteil)

Wölbungsmaße aus den Momenten N

1 ⋅ N

∑ i =1

µ4

−3

( xi − X )4 =

1 ⋅ N

k

fi ( xi* − X ) 4 ∑ i =1

absolut:

µ4 =

standardisiert:

α4 =

•

Wölbung = 0:

mittelgewölbte Verteilung (Normalverteilung)

•

Wölbung > 0:

hochgewölbte Verteilung (steiler als die Normalverteilung)

•

Wölbung < 0:

flachgewölbte Verteilung (flacher als die Normalverteilung)

S

4

Boxplot 1.

Q1 = Anfang der Box

2.

Q3 = Ende der Box

3.

Z durch senkrechten Strich in der Box markieren

4.

Berechnung der „Zäune“: zu = Q1 − 1,5 ⋅ QA und z o = Q 3 + 1,5 ⋅ QA

5.

Zwei Linien („whiskers“) gehen von der Box aus zum kleinsten und größten Beobachtungswert innerhalb des Bereichs [zu, zo] der Zäune. (Üblicherweise werden die Endpunkte durch senkrechte Striche markiert.)

6.

Beobachtungen außerhalb der Zäune zu, zo werden einzeln markiert

Seite 8

Quantitative Methoden der Energiewirtschaft WS 2019/20

1. Auflage

1.4. Konzentrationsmaße Absolute Konzentration m x ∑ i =1 i = = ∑ pi N ∑ i=1x i i=1 m

Konzentrationsrate

Kc m

Herfindahl-Index

N x2 ∑ i =1 i KH = = ∑ pi 2 2 N ( ∑i=1x i ) i=1

Rosenbluth-Index

KR =

N

1

∑

2

Wertebereich: [1/ N; 1]

Wertebereich: [1/ N; 1]

N

i ⋅ pi − 1 i= 1

Relative Konzentration Lorenzkurve Einzeldaten:

ui =

vi

i N

∑ = ∑

i

x j= 1 j N x i= 1 i

=

i

∑q

j

j=1

Gini-Koeffizient

∑ i=1(2i −1) ⋅qi − 1 G= N

Einzeldaten:

N

Gnorm =

N ⋅G N −1

Wertebereich: [0; (N − 1)/N] Wertebereich: [0; 1]

Seite 9

1. Auflage

Quantitative Methoden der Energiewirtschaft WS 2019/20

2. Bivariate und multivariate Analysen 2.1. Darstellung und Grundbegriffe Kontigenztabelle: Merkmal X

Merkmal Y

Zeilensummen

y1

y2

...

yj

...

yc

x1

f 11

f 12

...

f1j

...

f1c

f1•

x2

f 21

f22

...

f2 j

...

f2 c

f2•

...

...

...

...

...

...

...

...

xi

fi1

f i2

...

fij

...

f ic

...

...f

...

...

...

...

...

xr

fr 1

fr 2

...

frj

...

f rc

f r•

f•1

f•2

...

f•j

...

f•c

N

Spaltensummen fij :

Gemeinsame absolute Häufigkeiten

fi• :

Summierte absolute Zeilenhäufigkeit

f •j :

Summierte absolute Spaltenhäufigkeit

Gemeinsame relative Häufigkeit p ij der Gruppe (i, j) p ij =

fij

[i =1, ...r; j = 1, ..., c]

N

Randverteilungen Betrachtung jeweils eines Merkmals Zeilensummen:

fi • =

c

∑f

bzw.

ij

j=1

p i• =

c

fi •

∑p = N ij

j= 1

Spaltensummen:

f• j =

r

∑ fij bzw. i =1 r

f• j

p ij = ∑ N i= 1

p•j =

Seite 10

f i• ...

Quantitative Methoden der Energiewirtschaft WS 2019/20

1. Auflage

Bedingte Häufigkeitsverteilungen fij

von X bei vorgegenem y j : p( x i y j ) =

p ij

=

f•j

r

,

wobei

p( x i y j ) = 1 ∑ i=1

,

wobei

∑p( y j xi ) =1

p •j

bzw. von Y bei vorgegenem x i : p( y j x i ) =

fij

=

fi •

p ij p i•

r

i=1

Bedingter Mittelwert Xyj =

∑ p(x i y j )⋅ x i bzw.

Y xi =

∑ p(y x )⋅ y j

i

j

Bedingte Varianz S 2x y j =

∑ p(x i y j )⋅ (x i − ( X y j ))2 bzw.

S 2y x i =

∑ p(y j x i )⋅ (y j − ( Y x i ))2

Statistische Unabhängigkeit fij =

fi • ⋅ f •j N oder

p ij = p i• ⋅p • j

Liegt statistische Unabhängigkeit vor, so müssen die tatsächlichen Werte aus der Tabelle stets den hypothetischen Werten f i• ⋅ f • j N entsprechen.

Seite 11

1. Auflage

Quantitative Methoden der Energiewirtschaft WS 2019/20

2.2. Korrelationsanalyse Koeffizienten für nominalskalierte Merkmale Quadratische Kontingenz

χ2 =

r

fi• f•. j     − f ij c  N   fi• f• j j=1

2

∑∑ i=1

N

Wertebereich: 0 bis +∞ Kontingenzkoeffizient

C=

χ2 N + χ2

Wertebereich: 0 bis unter 1 •

0:

•

≈1: vollständige statistische Abhängigkeit

statistische Unabhängigkeit

Korrigierter Kontingenzkoeffizient

C korr = C ⋅

m , mit m = min(r,c) m−1

r = Anzahl, Zeilen c = Anzahl Spalten Wertebereich: 0 bis unter 1 •

0:

statistische Unabhängigkeit

•

1:

vollständige statistische Abhängigkeit

Koeffizienten für ordinalskalierte Merkmale Rangkorrelationskoeffizient nach Spearman

6⋅ ρR = 1−

N

2 Di ∑ i=1

N (N2 − 1)

D i ist die Rangdifferenz zwischen den einzelnen Merkmalen.

Sofern ein Rang mehrfach vergeben ist, ist das arithmetische Mittel zu berechnen und einzusetzen. Wertebereich: −1 bis unter +1 •

−1: vollständige negative Korrelation

•

0:

•

+1: vollständige positive Korrelation

Seite 12

statistische Unabhängigkeit

Quantitative Methoden der Energiewirtschaft WS 2019/20

1. Auflage

Koeffizienten für metrische Merkmale Kovarianz Einzeldaten:

S xy =

1 N ⋅ ( x i −X )( y i − Y ) bzw. N i =1

S xy =

1 ⋅ xi yi − X ⋅ Y N i =1

Klassierte Daten: Sxy =

S xy

∑ N

∑

1 ⋅ N

r

c

∑∑(x

− X )( y *j − Y ) f ij bzw..

* i

i=1 j=1 c

1 r ⋅ N i=1

∑∑x y f

* * i j ij

−X ⋅Y

j=1

Wertebereich: −∞ bis unter +∞ Korrelationskoeffizient nach Bravais-Pearson ρB =

S xy Sx Sy N

Einzeldaten:

ρB =

∑ (x − X )(y i

i=1

N

2

i

i=1

2

i=1

1 ⋅ N 1  ⋅ N 

N

∑x y

i i−X

⋅Y

i=1

 1 xi2 − X 2   ⋅  N i =1  N

∑

r

c

∑∑ ( x − X )(y i

Klassierte Daten: ρB =

bzw.

N

∑ ( x − X) ⋅ ∑ (y − Y) i

ρB =

− Y)

i

*

* i

N

∑y

2 i −

i =1

 Y2   

− Y )fij

i =1 i =1

r

∑

( x*i − X )2 fi• ⋅

i=1

c

∑ (y

* i

− Y )2 f• j

j =1

Wertebereich: −1 bis unter +1 •

−1: vollständige negative Korrelation

•

0:

•

+1: vollständige positive Korrelation

statistische Unabhängigkeit

Seite 13

1. Auflage

Quantitative Methoden der Energiewirtschaft WS 2019/20

3. Prognoseverfahren 3.1. Regressionsanalyse Nur für metrische Merkmale! Lineare Regression Regressionsfunktion: yˆ i = β0 + β1x i β0 = y-Achsenabschnitt β1 = Steigung

Regressionskoeffizienten: S xy

β1 =

1 N

β1 =

N

( x i − X )(y i − Y ) ∑ i =1 1 N

1 N

β1 =

β1 =

bzw.

S 2x

N

(x i − X ) ∑ i 1 =

N

∑x y

i i

i =1 N

1 N

2

∑

− X ⋅Y

bzw.

2 xi

−X

2

i =1

XY − X ⋅ Y X2 − X2

β0 = Y − β1 X

Bestimmtheitsmaß: N

∑ ( ˆy − Y )

2

i

R2 =

i=1 N

∑ (y − Y)

bzw.

2

i

i=1

R2 =

N

1 N

∑yˆ

1 N

∑

R2 = ρ2B Seite 14

i=1 N

i=1

2 i

−Y 2

y i2

2

bzw.

−Y

bzw.

Quantitative Methoden der Energiewirtschaft WS 2019/20

1. Auflage

Wertebereich: 0 bis 1 0:

sofern die Merkmale unkorreliert sind

1:

wenn Merkmalswerte auf einer Geraden mit negativer oder positiver Steigung liegen.

Je größer R2 , desto stärker werden die empirischen Werte durch die ermittelte Regressionsgerade erklärt.

3.2. Zeitreihenanalyse Zeitreihenkomponenten   y t = f  Tt , Z t , S t ,ε t  für t = 1, 2, ..., T.     Gt mit: T = Trend Z = Zyklische Komponente G = Glatte Komponente S = Saisonale Komponente ε = Restkomponente Additives Modell:

y t = Tt + Z t + St + εt für t = 1, 2, ..., T.

Multiplikatives Modell:

y t = T t ⋅ Z t ⋅S t ⋅ εt

für t = 1, 2, ..., T.

Methode der gleitenden Durchschnitte Gleitender 2er Schnitt:

1 1 1  g t = ⋅  y t−1 + y t + y t +1  2 2 2 

Gleitender 3er Schnitt:

1 gt = ⋅ (y t −1 + y t + y t +1 ) 3

Gleitender 4er Schnitt:

1 1 1  gt = ⋅  y t− 2 + y t− 1 + y t + y t +1 + yt + 2  4 2 2 

Gleitender 5er Schnitt:

1 g t = ⋅ ( y t− 2 + y t− 1 + yt + yt +1 + yt + 2 ) 5

etc. Seite 15

1. Auflage

Quantitative Methoden der Energiewirtschaft WS 2019/20

Exponentielles Glätten

g et = α ⋅ y t + (1 − α ) ⋅ g et− 1

wobei 0 < α < 1, ge1 = y 1 Trendfunktionen Linearer Trend: mit:

yˆ t = b 0 + b1 ⋅ t b1 =

S ty S2t

=

tY − t ⋅ Y 2

t −t

2

b0 = Y − b1 t

Exponentieller Trend:

yˆ t = b 0 b 1t

Durch Logarithmieren kann ein exponentielles Trendmodell der Formyˆ t = b0 b1t

in ein linea-

res Trendmodell überführt werden:ln(yt ) = ln(b0 ) + t ⋅ ln(b1 ). Bestimmung saisonbereinigter Werte 1. Schritt:

Ermittlung eines gleitenden Durchschnittsy * mit der Gliederzahl l (Anzahl der Perioden) Bestimmung der um die glatte Komponente bereinigten Zeitreihe:

y t − y *t 2. Schritt:

Für jede unterjährige Periode wird das arithmetische Mittel der Differenzen ermittelt, die sogenannte rohe Komponente: Sj =

3. Schritt:

1 m

m

(yij − yij*) ∑ i =1

Berechnung der korrigierten Saisonkomponente

S j(korr) = S j − 4. Schritt:

l

∑S

j

j=1

Bestimmung der saisonbereinigten Werte: y t − S j(korr)

Seite 16

1 l

Quantitative Methoden der Energiewirtschaft WS 2019/20

1. Auflage

4. Indexzahlen Preisindizes •

Preisindex nach Laspeyres n

P (L ) =

•

∑pt q0 i =1 n

p 0q0 ∑ i= 1

⋅100

Preisindex nach Paasche n

(P)

P

=

∑p t q t i =1 n

p 0qt ∑ i 1

⋅100

=

Mengenindizes •

Mengenindex nach Laspeyres n

(L )

Q

•

=

∑ q tp0 i= 1 n

q 0p 0 ∑ i =1

⋅100

Mengenindex nach Paasche n

(P)

Q

=

∑ q t pt i =1 n

q0 pt ∑ i= 1

⋅100

Wertindizes (Umsatzindizes) n

W=

p tq t ∑ = i 1 n

p 0q 0 ∑ i= 1

⋅100 =

P( P ) ⋅ Q(L ) P(L ) ⋅Q( P ) = 100 100

Umbasierung

Indexneue Basis =

Indexalte Basis ⋅ 100 Index neue Basis

Seite 17

1. Auflage

Quantitative Methoden der Energiewirtschaft WS 2019/20

Verknüpfu...