Statistik So Se17 PDF

Title Statistik So Se17
Course Statistik I
Institution Hochschule Darmstadt
Pages 88
File Size 2.5 MB
File Type PDF
Total Downloads 405
Total Views 905

Summary

Statistik undWirtschaftsmathematik für WING- Stand: SoSe 2017 -Diese Unterlagen wurden auf der Grundlage der Skripte von Dietrich Baumgarten und Jutta Groos er- stellt. Sie sind als Begleitmaterial zur Vorlesung Statistik und Wirtschaftsmathematik für WING (nur) für die Studierenden in diesem Studie...


Description

Statistik und Wirtschaftsmathematik für WING - Stand: SoSe 2017 -

Diese Unterlagen wurden auf der Grundlage der Skripte von Dietrich Baumgarten und Jutta Groos erstellt. Sie sind als Begleitmaterial zur Vorlesung Statistik und Wirtschaftsmathematik für WING (nur) für die Studierenden in diesem Studiengang gedacht und ersetzten nicht den Besuch der Vorlesung.

1

Inhaltsverzeichnis 1 Einleitung 1.1 Statistik, was ist das? . . . . . . . . . 1.2 Grundbegriffe . . . . . . . . . . . . . 1.3 Gestaltung der Frage(n) . . . . . . . . 1.4 Stichprobe und Grundgesamtheit . . . 1.5 Datenerhebung . . . . . . . . . . . . 1.6 Fehler, Ausreißer und fehlende Werte . 1.7 Merkmale, Merkmalsausprägungen und 1.7.1 Definitionen . . . . . . . . . . 1.7.2 Klassifizierung von Merkmalen 1.7.3 Skalen . . . . . . . . . . . . . 1.7.4 Die Datenmatrix . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Skalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4 4 5 6 6 7 7 8 8 8 9 9

2 Darstellung univariater Daten 11 2.1 Definition: Urliste, relative und absolute Häufigkeit . . . . . . . . . . . . . . . . . . . 11 2.2 Absolute und relative kumulierte Häufigkeit . . . . . . . . . . . . . . . . . . . . . . . 11 2.3 Häufigkeitstabelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.4 Graphische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.5 Die empirische Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6 Ein Beispiel: von der Urliste zur empirischen Verteilungsfunktion . . . . . . . . . . . . 13 3 Maßzahlen einer eindimensionalen Stichprobe (Lage und Streuung) 14 3.1 Lagemaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.1.1 Modus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.1.2 Median . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.1.3 Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.1.4 Boxplots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.1.5 Arithmetisches Mittel (’Mittelwert’) . . . . . . . . . . . . . . . . . . . . . . . 17 3.1.6 Geometrisches Mittel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3.1.7 Harmonisches Mittel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2 Streuungsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2.1 Streuungsmaße mit Bezug auf das arithmetische Mittel . . . . . . . . . . . . . 19 3.2.2 Streuungsmaß mit Bezug auf den Median . . . . . . . . . . . . . . . . . . . . 20 3.3 Eigenschaften der Maßzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4 Klassierte Daten 21 4.1 Klassen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 4.2 Häufigkeitstabelle klassierter Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.3 Histogramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.4 Approximierende empirische Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . 24 4.5 Maßzahlen bei klassierten Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.5.1 Der Modus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.5.2 Median und Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.5.3 Arithmetisches Mittel und Varianz . . . . . . . . . . . . . . . . . . . . . . . . 26

5 Zweidimensionale Stichproben 5.1 Kontingenztabelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Graphische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Stabdiagramm mit Unterteilung . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Streudiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Bedingte Häufigkeiten und deskriptive Unabhängigkeit . . . . . . . . . . . . . . . . . 5.3.1 Bedingte Häufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.2 Deskriptive Unabhängigkeit zweier Merkmale . . . . . . . . . . . . . . . . . . 5.4 Korrelationsanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1 Korrelationsanalyse für metrische Merkmale . . . . . . . . . . . . . . . . . . . 5.4.2 Zusammenhang zweier nominaler Merkmale (nachträglich eingefügt: für SoSe 17 nicht relevant) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27 27 29 29 29 29 29 30 30 30 33 33

6 Wahrscheinlichkeitsrechnung 35 6.1 Zufallsexperiment und Ergebnisraum . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6.2 Ereignisalgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6.3 Laplace-Experiment und Wahrscheinlichkeit nach Laplace . . . . . . . . . . . . . . . . 36 6.4 Wahrscheinlichkeit als relative Häufigkeit (von Mises) . . . . . . . . . . . . . . . . . . 38 6.5 Axiomatische Definition der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . 38 6.6 Rechnen mit Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 6.7 Bedingte Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 6.8 Multiplikationssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 6.9 Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 6.10 Satz von der totalen Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . 41 6.11 Satz von Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 7 Diskrete Zufallsvariablen 7.1 Definition einer diskreten Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Einführendes Beispiel (Baumgarten) . . . . . . . . . . . . . . . . . . . . . . . 7.1.2 Definition: Diskrete Zufallsvariable und Wahrscheinlichkeitsfunktion . . . . . . 7.1.3 Darstellung von Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.4 Definition: Verteilungsfunktion diskreter Zufallsvariablen . . . . . . . . . . . . 7.1.5 Eigenschaften von Wahrscheinlichkeits- und Verteilungsfunktion diskreter Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Erwartungswert und Varianz diskreter Zufallsvariablen . . . . . . . . . . . . . . . . . . 7.2.1 Beispiel: Zeitvertrieb im Paradies (Baumgarten) . . . . . . . . . . . . . . . . . 7.2.2 Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.3 Varianz und Standardabweichung . . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Linearkombination diskreter Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Beispiel Portfolio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.2 Erwartungswert und Varianz einer Linearkombination . . . . . . . . . . . . . . 7.4 Unabhängige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Wichtige diskrete Verteilungen 8.1 Diskrete Gleichverteilung . . 8.1.1 Beispiel . . . . . . . 8.1.2 Allgemein . . . . . . 8.1.3 Bemerkungen . . . . 8.2 Bernoulli-Verteilung . . . . . 8.2.1 Beispiel . . . . . . . 8.2.2 Allgemein . . . . . . 8.2.3 Bemerkungen . . . . 8.3 Binomialverteilung . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . . 2

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

43 43 43 44 45 46 46 47 47 47 48 49 49 50 50 52 52 52 53 53 53 53 54 54 54

. . . . . . . . . . . . . . .

54 55 55 56 56 56 56 56 56 56 57 57 57 58 58

9 Stetige Zufallsvariable 9.1 Verteilungsfunktion und Dichtefunktion für stetige Zufallsvariable . . . . . . . . . . . . 9.2 Erwartungswert und Varianz stetiger Zufallsvariablen . . . . . . . . . . . . . . . . . . 9.3 Unabhängigkeit stetiger Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Quantile stetiger Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.5 Symmetrische Verteilungen, affine Transformationen . . . . . . . . . . . . . . . . . . .

59 59 61 63 63 64

10 Stetige Verteilungen 10.1 Gleichverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Die Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Standardnormalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Standardnormalverteilte und normalverteilte Größen . . . . . . . . . . . . . . . . . . . 10.6 Näherung diskreter Verteilungen durch die Normalverteilung . . . . . . . . . . . . . . 10.7 Prüfverteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.8 Der zentrale Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67 67 68 69 70 71 74 75 75

11 Disparität und Indizes 11.1 Absolute und relative Konzentration . . . . . . . 11.2 Disparität (relative Konzentration) . . . . . . . . 11.2.1 Die Merkmalssumme und ihre Verteilung . 11.2.2 Beispiel . . . . . . . . . . . . . . . . . . 11.2.3 Beispiel . . . . . . . . . . . . . . . . . . 11.2.4 Die Lorenzkurve . . . . . . . . . . . . . . 11.2.5 Der Gini-Koeffizient . . . . . . . . . . . . 11.2.6 Der normierte Gini-Koeffizient . . . . . . 11.2.7 Relative Daten . . . . . . . . . . . . . . . 11.2.8 Klassierte Daten . . . . . . . . . . . . . . 11.3 Indizes . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

77 77 77 77 78 78 79 79 80 80 81 82

12 Anhang: Mengen und Kombinatorik 12.1 Mengen . . . . . . . . . . . . . . 12.1.1 Beispiele . . . . . . . . . . 12.1.2 Teilmengenbeziehung . . . 12.1.3 Mengenoperationen . . . . 12.1.4 kartesisches Produkt . . . 12.2 Rechnen mit ganzen Zahlen . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

83 83 83 83 83 84 85

8.4

8.5

8.6

8.3.1 Beispiel . . . . . . . . 8.3.2 Allgemein . . . . . . . 8.3.3 Bemerkungen . . . . . Geometrische Verteilung . . . . 8.4.1 Beispiel . . . . . . . . 8.4.2 Allgemein . . . . . . . 8.4.3 Bemerkungen . . . . . Hypergeometrische Verteilung . 8.5.1 Beispiel . . . . . . . . 8.5.2 Allgemein . . . . . . . 8.5.3 Bemerkungen . . . . . Poisson Verteilung . . . . . . . 8.6.1 Beispiel . . . . . . . . 8.6.2 Allgemein . . . . . . . 8.6.3 Bemerkungen . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . .

. . . . . . . . . . . . . . .

. . . . . .

. . . . . . . . . . . . . . .

. . . . . .

. . . . . . . . . . . . . . .

. . . . . .

3

. . . . . . . . . . . . . . .

. . . . . .

. . . . . . . . . . . . . . .

. . . . . .

. . . . . . . . . . . . . . .

. . . . . .

. . . . . . . . . . . . . . .

. . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

1

Einleitung

Übersicht und Lernziele In diesem Kapitel wird erklärt: • Grundsätzliches über die Statistik; • erste Definitionen – Statistische Einheit, – Grundgesamtheit, – Statistische Variable, – Merkmal, Ausprägung; • Grundsätzliches über Merkmale.

1.1

Statistik, was ist das?

Statistik ist die Wissenschaft von Sammeln, Aufbereiten, Darstellen, Analysieren und Interpretieren von Fakten und Zahlen. Staatliches Interesse an Informationen über demographische, soziale und ökonomische Sachverhalte war seit Jahrhunderten die Triebfeder für die Entwicklung der Statistik und gab ihr auch den Namen. Heute stimuliert die Notwendigkeit, große Mengen von verfügbaren Daten in vielen Anwendungsgebieten in nützliche Information zu verwandeln, die theoretische und praktische Weiterentwicklung der Statistik. In allen ’empirischen Wissenschaften’, wie der Medizin, Biologie, Geologie, Physik, Psychologie, Soziologie und der Wirtschaftswissenschaft, um nur die bekanntesten zu nennen, ist sie zu einer der wichtigsten Methoden der Erkenntnisgewinnung geworden. Zum Studium dieser Wissenschaften gehört deshalb auch eine intensive Beschäftigung mit Statistik. Aus den Buch: Statistische Methoden der VWL und BWL: Theorie und Praxis von Josef Schira (Pearson). → Statistik ist die Wissenschaft von • Sammeln, Aufbereiten, Darstellen: Deskriptive (=beschreibende) Statistik • Analysieren Explorative (=analysierende) Statistik • Interpretieren Induktive (=schließende, beurteilende) Statistik von Fakten und Zahlen. In der Wirtschaft: im Unternehmen werden (eigene) Daten gesammelt, ausgewertet, etwa für • Marketing • interne Zwecke (Personal) • Qualitätssicherung Daten werden nach Bedarf dazu gekauft, etwa: • Infos zur üblichen Mitarbeitervergütung in der Branche (Personalberatungen), • Infos über andere Unternehmen/Geschäftspartner [Kunden, Lieferanten] (Anbieter digitaler Wirtschaftsinformationen) • Qualitätssicherung Schon (noch?) länger ist der Staat an Daten interessiert wie 4

• Einwohnerzahlen ("Zensus") für Steuer, Wehrdienst, • Arbeitslosenstatistik, • Verbraucherindizes Offizielle Statistik-Quellen, etwa https://www.destatis.de das Statistische Bundesamt (Wiesbaden) liefert zum Beispiel Verbraucher-Index (bzw. Indizes). Mehr Gründe für Statistik auf dem Portal: http://www.statistikportal.de/Statistik-Portal/100Gruende.pdf Ruf/Verruf der Statistik Bücher wie "So lügt man mit Statistik" (Krämer), vs Interesse an übersichtliche Darstellung vieler Daten/ Hilfe bei Entscheidungen (ist Therapie B besser als A?, ist die Warensendung zurückzuschicken, oder hat diese die vertraglich festgelegte Qualität?) → Methodik verstehen und (korrekt) Anwenden!

1.2

Grundbegriffe

Anhand des Fragebogens werden einige wichtige Begriffe der Statistik erklärt. Fragebogen Geschlecht (m/w) Größe [cm] Schuhgröße Haarfarbe (blond, braun, schwarz, sonstige) Interesse für Statistik (gering, mittel, groß) Alter Entfernung Wohnort → Hochschule [km] Anzahl der Freunde auf FaceBook Anzahl der Semester an der Hochschule (inkl. dieses) Anzahl der Freunde auf FaceBook Mobiltelefon (einfach, mit Kamera, Smartphone) Die Statistik befasst sich mit der Aufgabe eine große Gruppe von Objekten (z.B. ’Studierende an deutschen Hochschulen’) auf ihre Merkmale hin zu untersuchen und mögliche Zusammenhänge zu erfassen. Das konkrete Interesse ist auf die Gesamtheit bezogen.Dabei ist die Gruppe meist zu groß um alle Objekte zu erfassen, weshalb man von Stichproben ausgeht. Die Statistik lässt sich grob in drei Teilbereiche zusammenfassen: Beispiele für Aufgaben aus den drei Teilbereichen der Statistik: • Beschreibende Statistik: Sammeln, ordnen und validieren von Beobachtungsdaten, (zusammenfassende) Darstellung von Kenngrößen (z.B. ’Durchschnittliche Schuhgröße’, Bearbeiten von Schuhgrößen wie ’Gr. 390’). • Explorative Statistik Erkennen von Mustern in den Daten (z.B. ’Die Merkmale Geschlecht und Schuhgröße korrelieren’.). • Schließende Statistik Unter Anwendung der Wahrscheinlichkeitsrechnung werden allgemeine Schlussfolgerungen gezogen (’Männliche Studierende an deutschen Hochschulen haben größere Füße als weibliche Studierende an deutschen Hochschulen’).

5

Abbildung 1: (Quelle: Zisgen nach Baumgarten)

1.3

Gestaltung der Frage(n)

Schon die Formulierung der Fragen beeinflusst die Aussagekraft einer Untersuchung (Was will man genau wissen?, Gefahr der Manipulation). Stichprobe und Grundgesamtheit

1.4

Stichprobe und Grundgesamtheit

• Grundgesamtheit: Alle Objekte über die man eine Aussage gewinnen will, die man eventuell nicht vollständig erfassen kann (etwa: ’Alle Studierende an deutschen Hochschulen’, oder ’Studierende im Bachelor Studiengang BWL, bzw. WING an der Hochschule Darmstadt", oder "Alle Anwesende im Vorlesungssaal am Tag X um Y Uhr’). Die Grundgesamtheit muss in sachlicher, räumlicher und zeitlicher Hinsicht (sinnvoll und ) genau abgegrenzt sein. Bei seltsamen Abgrenzungen Verdacht auf Manipulation? • Stichprobe (engl.: sample) Eine Teilmenge der Grundgesamtheit, die tatsächlich befragt wurde (→ Studierende einer Gruppe, die den Fragebogen ausgefüllt haben). Die Anzahl n der Objekte der Stichprobe heißt Stichprobenumfang. Einige Methoden zur Durchführung von Stichprobenuntersuchungen • Zufallsstichprobe • Systematische Auswahl: Objektives Kriterium, z.B. jeder 100. Artikel • Schichtenstichprobe: Die Grundgesamtheit wird auf Basis eines oder mehrerer Merkmale in Schichten eingeteilt. Die Schichten sollen bezüglich des Untersuchungsmerkmals möglichst homogen sein. Ansc...


Similar Free PDFs