Title | Statistik Zusammenfassung |
---|---|
Course | Statistik |
Institution | Fachhochschule Münster |
Pages | 8 |
File Size | 403.4 KB |
File Type | |
Total Downloads | 59 |
Total Views | 159 |
Download Statistik Zusammenfassung PDF
Statistik Übungen Psychologie will Verhalten und Erleben beschreiben, erklären und vorhersagen. Induktiv: Vom Einzelnen aufs Allgemeine schließend (Verifikationsprinzip) -unendliche Beweise nötig, stattdessen: Falsifikationsprinzip Deduktiv: Vom Allgemeinen aufs Einzelne schließend Gute Theorie (verknüpfte Hypothesen) -logisch konsistent (keine Widersprüche) -gehaltvoll/informativ (potentiell falsifizierbar) -einfach (viele Befunde durch wenige Annahmen erklärt) -bewährt Gute Hypothese -Bezug auf reale Sachverhalte, also empirisch untersuchbar -allgemein gültig, also kein Einzelfall -Implizite Satzstruktur eines Konditionalsatzes -Potentielle Falsifizierbarkeit Unabhängige Variable beeinflusst abhängige Variable. Merkmal=Eigenschaft (zB:Augenfarbe) Merkmalsausprägung(zB: blau, grün...) Qualitativ=eine Merkmalskategorie Quantitativ=Ausprägungsgrad auf Kontinuum Manifest=direkt beobachtbar Latent=indirekt beobachtbar Operationalisierung=damit man Merkmal messen kann (Zahlen) Diskrete Variable= endlich viele Ausprägungen Stetige Variable= unendlich viele Ausprägungen Nominalskala: Unterschiedlichkeit Ordinalskala: Größer/Kleiner Intervallskala: bestimmter Abstand Verhältnisskala: mit Nullpunkt
-Modalwert, Range -“+Median, IQA -“+Ar. Mittel, Varianz, Standardabweichung -„+Varianzkoeffizient
i = 1,...,n – zählt die Elemente einer Merkmalsausprägung j =1,...,m – zählt die Merkmalsausprägungen N = Größe der Gesamtstichprobe n = Größe der Teilstichprobe N= m*n Gute Kategorisierung -disjunkt (einander ausschließend) -benachbart (keine Lücken) -gleich groß (offene Kategorien für Ausreißer) - inhaltlich sinnvoll begründet
Maße der zentralen Tendenz Modalwert (Mo) -Wert, der am häufigsten besetzt ist -stabil gegenüber Ausreißern -kann mehrere Werte geben Median (Md) -Wert, der in der Mitte ist (geordnete Liste) -stabil gegenüber Ausreißern -bei gerader Liste, 2 mittleren Werte/2 Arithmetisches Mittel (M) -Durchschnitt aller Werte= Summe aller Werte/N -empfindlich gegenüber Ausreißern Variationsbreite Range -größter Wert – kleinster Wert -empfindlich gegenüber Ausreißern -ab Ordinal: Größe des Intervalls in dem die Werte liegen -nominal: Anzahl der Kategorien Interquartilsabstand -die mittleren 50% (Q3-Q1=IQA) -stabil gegenüber Ausreißern Mittelwertsbezug Varianz
Xi=einzelnen Werte X(mit strich) = arithmetisches Mittel N= Größe der Stichprobe -empfindlicher für Ausreißer wegen Quadrierung Standardabweichung -Wurzel der Varianz -bessere Vergleichbarkeit -stabiler (aber empfindlich)gegenüber Ausreißern -nicht gut bei extrem steiler Verteilung/extremen Ausreißern Varianzkoeffizient -zum Vergleich der Variabilität Sx/X Zentrales Moment= Abweichung eines Wertes vom Mittelwert
a bestimmt die Ordnung. 1. Ordnung: Summe der Abweichungen der individuellen Werte vom Mittelwert ergibt 0.
2. Ordnung: Summe der Abweichungen der individuellen Werte vom Mittelwert ist minimal. 3.Ordnung Schiefe einer Verteilung MoMo – rechtssteil/Linksschief M=Md=Mo – symmetrisch 4.Ordnung Breite einer Verteilung 3 schmalgipfelig Boxplot Whiskers: letzter Wert vom Median aus, innerhalb IQA*1,5 Ausreißer: Median+/-IQA*3 Extremwerte: Median +IQA*3
Statistische Kennwerte
Freiheitsgrade -weil sonst unterschätzt die Stichprobe die Varianz der Population -Anzahl der Werte, die frei variieren können -Mittelwert: n Freiheitsgrade -Varianz: n-1
Ergebnis /= Ereignis -Ergebnis, ist beobachtbar -Ereignis, abstraktes Konzept, Wahrscheinlichkeiten können zugeordnet werden, kann sich aus mehreren Ergebnissen zusammen setzen A Priori (Laplace) vs. A Posterori (Bernoulli) -A Priori: Alle möglichen Ereignisse sind vorher bekannt -A Posteriori: Ereignisse vorher nicht bekannt, nach sehr viele Durchgängen kann die Wahrscheinlichkeit eines Ereignisses nach dem Gesetz der großen Zahl geschätzt Normalverteilung Mittelwert=Hochpunkt der Verteilung Streuung=Wendepunkt der Verteilung Bedeutung: arithmetisches Mittel +/- 1s = 68% aller Werte Arithmetisches Mittel +/-2s= 95% aller Werte Normalität: Intervall in dem 95% der Stichprobe liegen Standardnormalverteilung
-Werte können mit der z-Transformation in die Standardnormalverteilung überführt werden -Definition: M=1 und s=0 -Führt zu Dehnung/Stauchung entlang der x-Achse, andere Merkmale bleiben erhalten -z-Wert kann in Tabelle nach geschaut werden, wie viel Prozent haben unseren Wert? Mittelwertverteilung -bei steigendem n geht die Verteilung der Mittelwerte in eine Normalverteilung über: zentrales Grenzwerttheorem -die Mittelwerte der Mittelwertverteilung und der Populationsverteilung sind gleich -Die Varianz der Mittelwertverteilung 𝜎 2 𝑥 ist n-kleiner als die der Populationsverteilung 𝜎 2 Standardfehler -Streuung der Mittelwertverteilung -Wahrscheinlichkeit den Populationsmittelwert durch die Stichprobe gut zu schätzen -abhängig von der Größe der Stichprobe und Varianz der Population Konfidenzintervall -Bereich um den Stichprobenmittelwert, in dem zu einer bestimmten Wahrscheinlichkeit der Mittelwert der Population liegt -meist 95% (1,96=z) oder 99% -Berechnung:
Effekt -Differenz der Mittelwerte zweier Verteilungen Signifikanztest -Informationen über die Wahrscheinlichkeit eine gefundenen Effekts unter Annahme der 0Hypothese -bei N>30 -prüft, ob ein signifikanter Effekt vorhanden ist -Nullhypothese H0 geht davon aus, dass kein Effekt vorhanden ist -Alternativhypothese H1 geh davon aus, dass ein Effekt vorhanden ist (größer/kleiner/anders) -Zunächst Annahme von H0, wenn p-Wert unter das Signifikanzniveau 𝛼 fällt, Annahme von H1 ( Bei SPPSS pimmer kleinere Effekte statistisch signifikant -Praktisch relevanter Effekt kann aufgrund zu geringen Stichprobenumfangs nicht signifikant werden -Solange die Signifikanz der Differenz nicht vorliegt, muss von einem zufälligen Ergebnis ausgegangen werden
Lösungsansatz: Teil 1: -Schon bei der Planung einer Untersuchung (a priori) überlegen ob Effekt bei Stichprobengröße signifikant wird Teil 2: -Nachher nicht nur statistische Prüfwerte und Signifikanz berichten, auch standardisierte Mittelwertdifferenzen und Konfidenzintervalle Signifikanzniveau -𝛼 1% oder 5%- fehlerhaftes Verwerfen der Nullhypothese -𝛽 = 4 ∗ 𝛼- Fehlerhaftes Beibehalten der Nullhypothese Optimaler Stichprobenumfang = minimaler Stichprobenumfang (aus statistischer Sicht- beste Schätzung der Kennwerte Oder = notwendiger Stichprobenumfang ( aus ökonomischer Sicht – möglichst effizient ein bedeutsames Ergebnis erhalten Je größer, desto ehr findet man Effekt (auch kleine) Effektgröße Cohen’s d
Unabhängige Stichprobe
Abhängige Stichprobe
Teststärke Wahrscheinlichkeit, dass ein Test einen Effekt aufdeckt, welcher tatsächlich vorhanden ist
𝜷 Fehler Beeinflussung durch 7 Faktoren: 1. Höhe des 𝛼 -Niveaus 2. Ein- oder zweiseitige Testung 3. Homogenität der Merkmalsverteilung (Streuung des Merkmals) 4. Stichprobenumfang 5. Größe des statistischen Effekts 6. Abhängige vs. Unabhängige Stichproben 7. Teststärke T-Verteilung -kompensiert Ungenauigkeiten bei kleinen Stichprobenumfängen -anders je nach Freiheitsgraden t-Test -N.05) -> H0 Significant (p H1
Bei Homogenität:
Bei Heterogenität:
Berechnung
Freiheitsgrade
Freiheitsgerade mit Korrekturvariable c bestimmt. Dadurch Freiheitgrade reduziert Höherer t-Wert Langsamer signifikant
t-Wert größer als angenommener Wert -> H0 t-Wert kleiner als angenommener Wert -> H1 Ergebnisse APA-konform: t(df)=T, p=sig. Df, T und sig. Entsprechend einsetzen Zusammenhangsmaße -mittels Korrelationsmaße besteht die Möglichkeit, beobachtete (lineare) Zusammenhänge zwischen zwei Variablen zu prüfen -Schätzung der Populationskovarianz über die Stichprobenparameter (X und Y hoch -> Kovarianz positiv, X hoch und Y niedrig und andersrum -> Kovarianz negativ, beide mittel -> keine Kovarianz -Für Vergleichbarkeit
|r|≈.10 schwacher Zusammenhang |r|≈.30 mittlerer Zusammenhang |r|≈.50 starker Zusammenhang -sehr empfindlich für Ausreißer Pearson’s r -Mittelwerte von Korrelationen sind ordinalskaliert 1. Fisher-z-Transformation z= ½ * ln ((1+r)/(1-r)) 2. Bildung des arithmetisches Mittels der z-Werte 3. z-Wertdifferenz in r rückführen Spearman’s p -gleiche Berechnung, aber Zahlenwerte bekommen Rangplätze zugeordnet -Signifikanzprüfung wie bei r -weniger teststark aber auch weniger empfindlich gegenüber Ausreißern...