Title | Statistik Lernzettel (Wichtigsten Formeln) |
---|---|
Course | Deskriptive Statistik |
Institution | Hochschule für angewandte Wissenschaften München |
Pages | 2 |
File Size | 333.9 KB |
File Type | |
Total Downloads | 71 |
Total Views | 122 |
Statistik I Kurzzusammenfassung der wichtigsten Formeln zur Berechnung von Mittelwerten, Varianzen, Korrelationen und vielem mehr...
e
Formelsammlung – Statistik
Mittelwert
Ungerade Stichprobe
Box-Plot berechnen/Zeichnen: 1. Median berechnen → Eintragen + Box drum 𝑥 +𝑥 𝑥 +𝑥 2. Quartilgrenzen: Q1: 25% = 𝑖 𝑖 , Q3: 75% = 𝑖 𝑖
Gerade Stichprobe
2
Deskriptive Statistik
Median Werte In Rangfolge
3. IQA = Q3 – Q1 4. H-Linien: Ausreißer: 𝐼𝑄𝐴 ⋅ 1,5 Extremwerte: 𝐼𝑄𝐴 ⋅ 3 5. Whisker: Woben = H-Linie + Q3 Wunten = H-Linie – Q1
Varianz
2
Standarda bweichung Wie viel % sind besser/schlechter gleich eine Person (Tabelle
z-Transformation
Weitere Transformationen
68,2% 95,4%
Wahrscheinlichkeitstheorie
Lap ce Wa scheinlichkeit für Ere nis Multiplikationstheorem: wenn statistisch unabhängig Unabhängig, wenn Ereignis A und B sich nicht gegenseitig bedingen
(UND) Bedingte Wahrscheinlichkeit
Additionstheorem: disjunkt
Theorem von Bayes, wenn Schnittmenge nicht bekannt
Additionstheorem: nicht-disjunkt
(ODER) Vereinigungsmenge
Ablauf eines Hypothesentests: 1. Hypothesen aufstellen → 2. Entscheidungsregeln festlegen → 3. Stichprobe ziehen → 4. Daten auswerten → 5. Entscheiden Standardfehler des Mittelwerts
Konfidenzintervall (meist zweiseitig)
Inferenzstatistik
Konfidenzintervall (ei ig)
𝐾𝐼 = 𝑥 ± 𝑆𝐸𝑥 ⋅ 𝑧1−𝛼
Voraussetzung: Messwerte sind Normalverteilt
2
𝐾𝐼 = 𝑥 ± 𝑆𝐸𝑥 ⋅ 𝑧1−𝛼
Verteilung mit df eiheitsgraden
temp > tkrit Voraussetzung: Messwerte Intervallskaliert
Prüfgröße für unabhängige Stichproben
Prüfgröße für abhängige Stichproben
H0 ablehnen & H1 annehmen
Marc Haufe
Formelsammlung – Statistik Prüfung
Voraussetzung: - Variablen korreliert - Korrelation mögl. hoch
Lineare Geradengleichung
am 29.07.2019
Prädiktor (IQ) → x-Achse Kriterium (Note) → y-Achse
Anstieg b
Konstante a
Durchschnittlicher Fehler bei Vorhersage
Korrelation & Regression
Sta
KI um vorhergesagten Wert legen = Wie stark streuen beobachteten Werte um die Regressionsgerade
→ Mit p von (95%) liegt Wert zwischen _ - _
dschätzfehler
Kovarianz
Korrelation
ⅆ𝑓 = 𝑛 − 2
Konfidenzintervall berechnen
1. Fischer z-Transformation
𝑟𝑢/𝑜 =
′ ⅇ (2⋅𝑟 ) −1
2. Standardfehler
3. Konfidenzintervall
4. Rückrechnung in r
′ ⅇ (2⋅𝑟 ) +2
Korrelation signifikant von 0 verschieden
Unterschied zweier Korrelationen: Fisher z z = z-Wert Prüfgröße
= zemp
zemp > zkrit
Unterschied zweier Korrelationen signifikant
H0 ablehnen & H1 annehmen z-Verteilung Tabelle! Empirisches Relativ = Objekt → Merkmal
Homomorph = strukturerhaltend (→ empirisch beobachtbare Beziehungen zwischen Objekten spiegeln sich in den Zahlen wider) Numerisches Relativ = Zahlen → Variable Probleme des Messens: 1 Repräsentativitätsproblem 2 Eindeutigkeitsproblem 3 Bedeutsamkeitsproblem Dispersion (Streuung) = je größer die Variabilität desto stärker unterscheiden sich Personen in diesem Merkmal Varianz = Maß, welches ausdrückt, wie sehr sich Personen in einem Merkmal (vom Mittelwert betrachtet) unterscheiden Standardabweichung = Maß, welches ausdrückt, wie stark die Streuung der Werte um einen Mittelwert ist z-Transformation = um Messwerte zu vergleichen die mit unterschiedlichen Messinstrumenten gemessen wurden relativiert eine Differenz zwischen Messwert x einer Person y und dem Mittelwert einer Referenzstichprobe an der Standardab. Darstellung einzelner Variablen: kontinuierliche Variablen → Polygon, Histogramm, Stem-and-Leaf-Plot diskrete V→ Balken/Kreisdiagramm Stichprobenvergleiche von Variablen: Fehlerdiagramm, Box-Plot, Balkendiagramm Zusammenhang von zwei Variablen: Scatter Plot UNTERSCHIED Histogramm/Balkendiagram = Histo→ Stetigen, Balken → diskreten Fehlerdiagramm zur Darstellung von Stichprobenvergleichen (von 2 Variablen) Bedingte Wahrscheinlichkeit = Ein bestimmtes Ereignis tritt auf, unter der Bedingung, dass, ein anderes vorausgegangen ist Standardfehler = Aussagen über Genauigkeit des Mittelwerts einer Stichprobe (steht in direktem Verhältnis zur Größe der Stichprobe Konfidenzintervall = Der Bereich, innerhalb dessen Grenzen der Mittelwerte der Grundgesamtheit mit einer gewissen Wahrscheinlichkeit liegen Wahrscheinlichkeit, mit der der Konfidenzintervall den Populationsparameter umschließt (Überdeckungswahrscheinlichkeit) Kovarianz = drückt aus, in welchem Ausmaß zwei Variablen linear miteinander korrelieren (Kovarianz wird an der Varianz standardisiert) Korrelationskoeffizient = die Kovarianz den Standardisierten Variablen quantifiziert den Zusammenhang zwischen zwei Variablen unabhängig von Maßeinheit und Streuung Determinationskoeffizient r² = Ausmaß an Varianz einer Variable, das in einer Regression durch die Varianz einer anderen Variable vorhergesagt werden (z.B.: 34% der Unterschiede am Einkommen durch IQ erklärt) Lineare Regression Ziel = Wert einer Variablen wird vorhergesagt durch Rückschluss auf die Information die eine andere Variable liefe rt Man regrediert (führt) die Abiturnote auf den IQ (zurück) Homoskedastizität = Vorhersagefehler ist in allen Bereichen der Vorhersage (Regressionsgeraden) gleich Irrtumswahrscheinlichkeit = die Wahrscheinlichkeit für die Gültigkeit der Nullhypothese (H0) Irrtumswahrscheinlichkeit von .05 bedeutet, dass H0 mit p von0,05 abgelehnt wird, wenn die H0 richtig ist Wenn man H1 annimmt, kann die H0 immer noch zu 5% stimmen
Skalenniveau für abhängige Variable im T-Test = Intervall T-Test untersucht die Signifikanz der Mittelwertunterschiede Manifeste Merkmal = direkt beobachtbar → Geschlecht, Körpergröße Latente Merkmal = indirekt beobachtbar → Intelligenz, Extraversion Qual. Merkmal = Kategorie → Geschlecht (m/w) Quan. Merkmal = Ausprägung eines Merkmals (Kontinuum) → Alter: 21, 3
Def Messen In der Psychologie wird versucht, menschliches Verhalten zu erklären, zu beschreiben, vorherzusagen und zu verändern - Die Statistik hilft Beobachtungen fassbarer bzw. prüfbarer zu machen - Hierfür ist es nötig das Beobachtete in Zahlen zu transformieren => Verhalten wird gemessen
Einfluss von Stichprobengröße auf beide Fehler: a-Fehler → bleibt, da festgelegt ß-Fehler → sinkt mit zunehmender N → schneller Signifikant...