Statistik Lernzettel (Wichtigsten Formeln) PDF

Title	Statistik Lernzettel (Wichtigsten Formeln)
Course	Deskriptive Statistik
Institution	Hochschule für angewandte Wissenschaften München
Pages	2
File Size	333.9 KB
File Type	PDF
Total Downloads	71
Total Views	122

Preview

CLICK TO PREVIEW PDF

Summary

Statistik I Kurzzusammenfassung der wichtigsten Formeln zur Berechnung von Mittelwerten, Varianzen, Korrelationen und vielem mehr...

Description

e

Formelsammlung – Statistik

Mittelwert

Ungerade Stichprobe

Box-Plot berechnen/Zeichnen: 1. Median berechnen → Eintragen + Box drum 𝑥 +𝑥 𝑥 +𝑥 2. Quartilgrenzen: Q1: 25% = 𝑖 𝑖 , Q3: 75% = 𝑖 𝑖

Gerade Stichprobe

2

Deskriptive Statistik

Median Werte In Rangfolge

3. IQA = Q3 – Q1 4. H-Linien: Ausreißer: 𝐼𝑄𝐴 ⋅ 1,5 Extremwerte: 𝐼𝑄𝐴 ⋅ 3 5. Whisker: Woben = H-Linie + Q3 Wunten = H-Linie – Q1

Varianz

2

Standarda bweichung Wie viel % sind besser/schlechter gleich eine Person (Tabelle

z-Transformation

Weitere Transformationen

68,2% 95,4%

Wahrscheinlichkeitstheorie

Lap ce Wa scheinlichkeit für Ere nis Multiplikationstheorem: wenn statistisch unabhängig Unabhängig, wenn Ereignis A und B sich nicht gegenseitig bedingen

(UND) Bedingte Wahrscheinlichkeit

Additionstheorem: disjunkt

Theorem von Bayes, wenn Schnittmenge nicht bekannt

Additionstheorem: nicht-disjunkt

(ODER) Vereinigungsmenge

Ablauf eines Hypothesentests: 1. Hypothesen aufstellen → 2. Entscheidungsregeln festlegen → 3. Stichprobe ziehen → 4. Daten auswerten → 5. Entscheiden Standardfehler des Mittelwerts

Konfidenzintervall (meist zweiseitig)

Inferenzstatistik

Konfidenzintervall (ei ig)

𝐾𝐼 = 𝑥 ± 𝑆𝐸𝑥 ⋅ 𝑧1−𝛼

Voraussetzung: Messwerte sind Normalverteilt

2

𝐾𝐼 = 𝑥 ± 𝑆𝐸𝑥 ⋅ 𝑧1−𝛼

Verteilung mit df eiheitsgraden

temp > tkrit Voraussetzung: Messwerte Intervallskaliert

Prüfgröße für unabhängige Stichproben

Prüfgröße für abhängige Stichproben

H0 ablehnen & H1 annehmen

Marc Haufe

Formelsammlung – Statistik Prüfung

Voraussetzung: - Variablen korreliert - Korrelation mögl. hoch

Lineare Geradengleichung

am 29.07.2019

Prädiktor (IQ) → x-Achse Kriterium (Note) → y-Achse

Anstieg b

Konstante a

Durchschnittlicher Fehler bei Vorhersage

Korrelation & Regression

Sta

KI um vorhergesagten Wert legen = Wie stark streuen beobachteten Werte um die Regressionsgerade

→ Mit p von (95%) liegt Wert zwischen _ - _

dschätzfehler

Kovarianz

Korrelation

ⅆ𝑓 = 𝑛 − 2

Konfidenzintervall berechnen

1. Fischer z-Transformation

𝑟𝑢/𝑜 =

′ ⅇ (2⋅𝑟 ) −1

2. Standardfehler

3. Konfidenzintervall

4. Rückrechnung in r

′ ⅇ (2⋅𝑟 ) +2

Korrelation signifikant von 0 verschieden

Unterschied zweier Korrelationen: Fisher z z = z-Wert Prüfgröße

= zemp

zemp > zkrit

Unterschied zweier Korrelationen signifikant

H0 ablehnen & H1 annehmen z-Verteilung Tabelle! Empirisches Relativ = Objekt → Merkmal

Homomorph = strukturerhaltend (→ empirisch beobachtbare Beziehungen zwischen Objekten spiegeln sich in den Zahlen wider) Numerisches Relativ = Zahlen → Variable Probleme des Messens: 1 Repräsentativitätsproblem 2 Eindeutigkeitsproblem 3 Bedeutsamkeitsproblem Dispersion (Streuung) = je größer die Variabilität desto stärker unterscheiden sich Personen in diesem Merkmal Varianz = Maß, welches ausdrückt, wie sehr sich Personen in einem Merkmal (vom Mittelwert betrachtet) unterscheiden Standardabweichung = Maß, welches ausdrückt, wie stark die Streuung der Werte um einen Mittelwert ist z-Transformation = um Messwerte zu vergleichen die mit unterschiedlichen Messinstrumenten gemessen wurden relativiert eine Differenz zwischen Messwert x einer Person y und dem Mittelwert einer Referenzstichprobe an der Standardab. Darstellung einzelner Variablen: kontinuierliche Variablen → Polygon, Histogramm, Stem-and-Leaf-Plot diskrete V→ Balken/Kreisdiagramm Stichprobenvergleiche von Variablen: Fehlerdiagramm, Box-Plot, Balkendiagramm Zusammenhang von zwei Variablen: Scatter Plot UNTERSCHIED Histogramm/Balkendiagram = Histo→ Stetigen, Balken → diskreten Fehlerdiagramm zur Darstellung von Stichprobenvergleichen (von 2 Variablen) Bedingte Wahrscheinlichkeit = Ein bestimmtes Ereignis tritt auf, unter der Bedingung, dass, ein anderes vorausgegangen ist Standardfehler = Aussagen über Genauigkeit des Mittelwerts einer Stichprobe (steht in direktem Verhältnis zur Größe der Stichprobe Konfidenzintervall = Der Bereich, innerhalb dessen Grenzen der Mittelwerte der Grundgesamtheit mit einer gewissen Wahrscheinlichkeit liegen Wahrscheinlichkeit, mit der der Konfidenzintervall den Populationsparameter umschließt (Überdeckungswahrscheinlichkeit) Kovarianz = drückt aus, in welchem Ausmaß zwei Variablen linear miteinander korrelieren (Kovarianz wird an der Varianz standardisiert) Korrelationskoeffizient = die Kovarianz den Standardisierten Variablen quantifiziert den Zusammenhang zwischen zwei Variablen unabhängig von Maßeinheit und Streuung Determinationskoeffizient r² = Ausmaß an Varianz einer Variable, das in einer Regression durch die Varianz einer anderen Variable vorhergesagt werden (z.B.: 34% der Unterschiede am Einkommen durch IQ erklärt) Lineare Regression Ziel = Wert einer Variablen wird vorhergesagt durch Rückschluss auf die Information die eine andere Variable liefe rt Man regrediert (führt) die Abiturnote auf den IQ (zurück) Homoskedastizität = Vorhersagefehler ist in allen Bereichen der Vorhersage (Regressionsgeraden) gleich Irrtumswahrscheinlichkeit = die Wahrscheinlichkeit für die Gültigkeit der Nullhypothese (H0) Irrtumswahrscheinlichkeit von .05 bedeutet, dass H0 mit p von0,05 abgelehnt wird, wenn die H0 richtig ist Wenn man H1 annimmt, kann die H0 immer noch zu 5% stimmen

Skalenniveau für abhängige Variable im T-Test = Intervall T-Test untersucht die Signifikanz der Mittelwertunterschiede Manifeste Merkmal = direkt beobachtbar → Geschlecht, Körpergröße Latente Merkmal = indirekt beobachtbar → Intelligenz, Extraversion Qual. Merkmal = Kategorie → Geschlecht (m/w) Quan. Merkmal = Ausprägung eines Merkmals (Kontinuum) → Alter: 21, 3

Def Messen In der Psychologie wird versucht, menschliches Verhalten zu erklären, zu beschreiben, vorherzusagen und zu verändern - Die Statistik hilft Beobachtungen fassbarer bzw. prüfbarer zu machen - Hierfür ist es nötig das Beobachtete in Zahlen zu transformieren => Verhalten wird gemessen

Einfluss von Stichprobengröße auf beide Fehler: a-Fehler → bleibt, da festgelegt ß-Fehler → sinkt mit zunehmender N → schneller Signifikant...