Statistik Zusammenfassung PDF

Title	Statistik Zusammenfassung
Course	Statistik
Institution	Fachhochschule Münster
Pages	8
File Size	403.4 KB
File Type	PDF
Total Downloads	59
Total Views	159

Preview

CLICK TO PREVIEW PDF

Summary

Download Statistik Zusammenfassung PDF

Description

Statistik Übungen Psychologie will Verhalten und Erleben beschreiben, erklären und vorhersagen. Induktiv: Vom Einzelnen aufs Allgemeine schließend (Verifikationsprinzip) -unendliche Beweise nötig, stattdessen: Falsifikationsprinzip Deduktiv: Vom Allgemeinen aufs Einzelne schließend Gute Theorie (verknüpfte Hypothesen) -logisch konsistent (keine Widersprüche) -gehaltvoll/informativ (potentiell falsifizierbar) -einfach (viele Befunde durch wenige Annahmen erklärt) -bewährt Gute Hypothese -Bezug auf reale Sachverhalte, also empirisch untersuchbar -allgemein gültig, also kein Einzelfall -Implizite Satzstruktur eines Konditionalsatzes -Potentielle Falsifizierbarkeit Unabhängige Variable beeinflusst abhängige Variable. Merkmal=Eigenschaft (zB:Augenfarbe) Merkmalsausprägung(zB: blau, grün...) Qualitativ=eine Merkmalskategorie Quantitativ=Ausprägungsgrad auf Kontinuum Manifest=direkt beobachtbar Latent=indirekt beobachtbar Operationalisierung=damit man Merkmal messen kann (Zahlen) Diskrete Variable= endlich viele Ausprägungen Stetige Variable= unendlich viele Ausprägungen Nominalskala: Unterschiedlichkeit Ordinalskala: Größer/Kleiner Intervallskala: bestimmter Abstand Verhältnisskala: mit Nullpunkt

-Modalwert, Range -“+Median, IQA -“+Ar. Mittel, Varianz, Standardabweichung -„+Varianzkoeffizient

i = 1,...,n – zählt die Elemente einer Merkmalsausprägung j =1,...,m – zählt die Merkmalsausprägungen N = Größe der Gesamtstichprobe n = Größe der Teilstichprobe N= m*n Gute Kategorisierung -disjunkt (einander ausschließend) -benachbart (keine Lücken) -gleich groß (offene Kategorien für Ausreißer) - inhaltlich sinnvoll begründet

Maße der zentralen Tendenz Modalwert (Mo) -Wert, der am häufigsten besetzt ist -stabil gegenüber Ausreißern -kann mehrere Werte geben Median (Md) -Wert, der in der Mitte ist (geordnete Liste) -stabil gegenüber Ausreißern -bei gerader Liste, 2 mittleren Werte/2 Arithmetisches Mittel (M) -Durchschnitt aller Werte= Summe aller Werte/N -empfindlich gegenüber Ausreißern Variationsbreite Range -größter Wert – kleinster Wert -empfindlich gegenüber Ausreißern -ab Ordinal: Größe des Intervalls in dem die Werte liegen -nominal: Anzahl der Kategorien Interquartilsabstand -die mittleren 50% (Q3-Q1=IQA) -stabil gegenüber Ausreißern Mittelwertsbezug Varianz

Xi=einzelnen Werte X(mit strich) = arithmetisches Mittel N= Größe der Stichprobe -empfindlicher für Ausreißer wegen Quadrierung Standardabweichung -Wurzel der Varianz -bessere Vergleichbarkeit -stabiler (aber empfindlich)gegenüber Ausreißern -nicht gut bei extrem steiler Verteilung/extremen Ausreißern Varianzkoeffizient -zum Vergleich der Variabilität Sx/X Zentrales Moment= Abweichung eines Wertes vom Mittelwert

a bestimmt die Ordnung. 1. Ordnung: Summe der Abweichungen der individuellen Werte vom Mittelwert ergibt 0.

2. Ordnung: Summe der Abweichungen der individuellen Werte vom Mittelwert ist minimal. 3.Ordnung Schiefe einer Verteilung MoMo – rechtssteil/Linksschief M=Md=Mo – symmetrisch 4.Ordnung Breite einer Verteilung 3 schmalgipfelig Boxplot Whiskers: letzter Wert vom Median aus, innerhalb IQA*1,5 Ausreißer: Median+/-IQA*3 Extremwerte: Median +IQA*3

Statistische Kennwerte

Freiheitsgrade -weil sonst unterschätzt die Stichprobe die Varianz der Population -Anzahl der Werte, die frei variieren können -Mittelwert: n Freiheitsgrade -Varianz: n-1

Ergebnis /= Ereignis -Ergebnis, ist beobachtbar -Ereignis, abstraktes Konzept, Wahrscheinlichkeiten können zugeordnet werden, kann sich aus mehreren Ergebnissen zusammen setzen A Priori (Laplace) vs. A Posterori (Bernoulli) -A Priori: Alle möglichen Ereignisse sind vorher bekannt -A Posteriori: Ereignisse vorher nicht bekannt, nach sehr viele Durchgängen kann die Wahrscheinlichkeit eines Ereignisses nach dem Gesetz der großen Zahl geschätzt Normalverteilung Mittelwert=Hochpunkt der Verteilung Streuung=Wendepunkt der Verteilung Bedeutung: arithmetisches Mittel +/- 1s = 68% aller Werte Arithmetisches Mittel +/-2s= 95% aller Werte Normalität: Intervall in dem 95% der Stichprobe liegen Standardnormalverteilung

-Werte können mit der z-Transformation in die Standardnormalverteilung überführt werden -Definition: M=1 und s=0 -Führt zu Dehnung/Stauchung entlang der x-Achse, andere Merkmale bleiben erhalten -z-Wert kann in Tabelle nach geschaut werden, wie viel Prozent haben unseren Wert? Mittelwertverteilung -bei steigendem n geht die Verteilung der Mittelwerte in eine Normalverteilung über: zentrales Grenzwerttheorem -die Mittelwerte der Mittelwertverteilung und der Populationsverteilung sind gleich -Die Varianz der Mittelwertverteilung 𝜎 2 𝑥 ist n-kleiner als die der Populationsverteilung 𝜎 2 Standardfehler -Streuung der Mittelwertverteilung -Wahrscheinlichkeit den Populationsmittelwert durch die Stichprobe gut zu schätzen -abhängig von der Größe der Stichprobe und Varianz der Population Konfidenzintervall -Bereich um den Stichprobenmittelwert, in dem zu einer bestimmten Wahrscheinlichkeit der Mittelwert der Population liegt -meist 95% (1,96=z) oder 99% -Berechnung:

Effekt -Differenz der Mittelwerte zweier Verteilungen Signifikanztest -Informationen über die Wahrscheinlichkeit eine gefundenen Effekts unter Annahme der 0Hypothese -bei N>30 -prüft, ob ein signifikanter Effekt vorhanden ist -Nullhypothese H0 geht davon aus, dass kein Effekt vorhanden ist -Alternativhypothese H1 geh davon aus, dass ein Effekt vorhanden ist (größer/kleiner/anders) -Zunächst Annahme von H0, wenn p-Wert unter das Signifikanzniveau 𝛼 fällt, Annahme von H1 ( Bei SPPSS pimmer kleinere Effekte statistisch signifikant -Praktisch relevanter Effekt kann aufgrund zu geringen Stichprobenumfangs nicht signifikant werden -Solange die Signifikanz der Differenz nicht vorliegt, muss von einem zufälligen Ergebnis ausgegangen werden

Lösungsansatz: Teil 1: -Schon bei der Planung einer Untersuchung (a priori) überlegen ob Effekt bei Stichprobengröße signifikant wird Teil 2: -Nachher nicht nur statistische Prüfwerte und Signifikanz berichten, auch standardisierte Mittelwertdifferenzen und Konfidenzintervalle Signifikanzniveau -𝛼 1% oder 5%- fehlerhaftes Verwerfen der Nullhypothese -𝛽 = 4 ∗ 𝛼- Fehlerhaftes Beibehalten der Nullhypothese Optimaler Stichprobenumfang = minimaler Stichprobenumfang (aus statistischer Sicht- beste Schätzung der Kennwerte Oder = notwendiger Stichprobenumfang ( aus ökonomischer Sicht – möglichst effizient ein bedeutsames Ergebnis erhalten  Je größer, desto ehr findet man Effekt (auch kleine) Effektgröße Cohen’s d

Unabhängige Stichprobe

Abhängige Stichprobe

Teststärke Wahrscheinlichkeit, dass ein Test einen Effekt aufdeckt, welcher tatsächlich vorhanden ist

𝜷 Fehler Beeinflussung durch 7 Faktoren: 1. Höhe des 𝛼 -Niveaus 2. Ein- oder zweiseitige Testung 3. Homogenität der Merkmalsverteilung (Streuung des Merkmals) 4. Stichprobenumfang 5. Größe des statistischen Effekts 6. Abhängige vs. Unabhängige Stichproben 7. Teststärke T-Verteilung -kompensiert Ungenauigkeiten bei kleinen Stichprobenumfängen -anders je nach Freiheitsgraden t-Test -N.05) -> H0 Significant (p H1

Bei Homogenität:

Bei Heterogenität:

Berechnung

Freiheitsgrade

Freiheitsgerade mit Korrekturvariable c bestimmt. Dadurch Freiheitgrade reduziert Höherer t-Wert Langsamer signifikant

t-Wert größer als angenommener Wert -> H0 t-Wert kleiner als angenommener Wert -> H1 Ergebnisse APA-konform: t(df)=T, p=sig. Df, T und sig. Entsprechend einsetzen Zusammenhangsmaße -mittels Korrelationsmaße besteht die Möglichkeit, beobachtete (lineare) Zusammenhänge zwischen zwei Variablen zu prüfen -Schätzung der Populationskovarianz über die Stichprobenparameter (X und Y hoch -> Kovarianz positiv, X hoch und Y niedrig und andersrum -> Kovarianz negativ, beide mittel -> keine Kovarianz -Für Vergleichbarkeit

|r|≈.10 schwacher Zusammenhang |r|≈.30 mittlerer Zusammenhang |r|≈.50 starker Zusammenhang -sehr empfindlich für Ausreißer Pearson’s r -Mittelwerte von Korrelationen sind ordinalskaliert 1. Fisher-z-Transformation z= ½ * ln ((1+r)/(1-r)) 2. Bildung des arithmetisches Mittels der z-Werte 3. z-Wertdifferenz in r rückführen Spearman’s p -gleiche Berechnung, aber Zahlenwerte bekommen Rangplätze zugeordnet -Signifikanzprüfung wie bei r -weniger teststark aber auch weniger empfindlich gegenüber Ausreißern...