Title | SPSS - SPSS Zusammenfassung |
---|---|
Course | Datenanalyse mit SPSS |
Institution | Johannes Gutenberg-Universität Mainz |
Pages | 22 |
File Size | 1.6 MB |
File Type | |
Total Downloads | 54 |
Total Views | 156 |
SPSS Zusammenfassung ...
datenanalyse Wie erkenne ich, welches verfahren das richtige ist?
4) Umgang mit Daten: Häufigkeitsauszählungen, Mehrfach-antworten, Filtern, Gruppen vergleichen 4.1 Häufigkeitszählungen Analysieren deskriptive Statistiken Häufigkeitsauszählung Für z.B. relative und absolute Häufigkeiten von Variablenausprägungen Frage: Wie viel Prozent ...?
Hier gibt es auch unter Statistiken o Perzentil Werte (Quartile, Perzentile) o Streuung (Standardabweichung, Varianz, ...) o Lagemaße (Median, Modalwert) o Verteilung (Schiefe, Kurtosis)
Ergebnis:
1
4.2 Berechnung des Medians Analysieren deskriptive Statistiken Häufigkeitsauszählung Statistiken Median
4.3 Berechnung des Arithmetischen Mittels Analysieren deskriptive Statistiken deskriptive Statistik Variable mit Mehrfachantworten auswerten: Analysieren Mehrfachantworten Variablensets definieren Mehrfachantworten Set definieren, also alle Variablen rüberschieben und dem Set einen Namen geben Häufigkeitsauszählung Variablen im Set müssen identisch codiert sein!
4.4 Mehrfachantworten Variablenstruktur bei Mehr- fachantworten: o Jede mögliche Antwort stellt eine eigene Variable dar dichotome Codierung
2
Auswertung 1. Mehrfachantworten-Set definieren o Analysieren Mehrfachantworten Variablenset definieren aktiviere dichotome Codierung schließen 2. Häufigkeitsauszählung oder Kreuztabelle erstellen o Analysieren Mehrfachantworten Häufigkeiten oder Kreuztabelle
Zu beachten: Alle Variablen im Set müssen identisch codiert sein!
Ergebnis:
4.5 Gruppen vergleichen Option 1: „Gruppen vergleichen“: die Ergebnisse werden in einer Tabelle neben-/untereinander dargestellt (Vergleichstabelle) o Daten Aufgeteilte Datei Gruppen vergleichen Variable nach der gruppiert werden soll eintragen Option 2: „Ausgabe nach Gruppen aufteilen“: die Ergebnisse werden für die Gruppen nacheinander dargestellt (getrennte Tabellen) o Daten Aufgeteilte Datei Ausgabe nach Gruppen aufteilen Variable nach der gruppiert werden soll eintragen
ACHTUNG! Eine Aufteilung bleibt immer solange aktiv, bis sie ausgeschaltet wird! Dies kann man in der Statusleiste (rechts unten) erkennen:
4.6 Filter Falls nur Bestimmte Personen mit bestimmten Eigenschaften betrachtet werden sollen Daten Fälle auswählen falls Bedingung zutrifft Bedingungen eingeben, unter denen Personen im Datensatz bleiben sollen
3
5) Umcodieren und Zählen 5.1 Umcodieren/Recodieren wenn Variablen nicht so erhoben wurden, wie man sie zum weiterrechnen braucht, muss man sie umcodieren Beispiel Aufgaben o Es sollen Alters-/ Einkommensgruppen verglichen werden (die einzelnen Alter und Einkommen müssen in Gruppen zusammengefasst werden) o Umpolen von Skalen (positiv wird zu negativ und negativ wird zu positiv)
Transformieren umcodieren in andere Variable Variable die umcodiert werden soll auswählen neuen Namen geben Jetzt umcodieren alte Werte neue Werte o Bereich KLEINSTER bis Wert = alles kleiner gleich dem Wert der eingetragen wird o Bereich Wert bis GRÖSTER = alles größer gleich der Wert der eingetragen wird Umcodierte Variablen Labeln: Daten Variableneigenschaften definieren
5.2 Zählen
Bei Mehrfachantworten: wie viele Antworten mit einem bestimmten Wert wurden genannt Bei Auswahlfragen: wie häufig wurde eine bestimmte Antwort über alle Auswahlfragen hinweg gegeben?
Transformieren Werte in Fällen zählen Schritt 1: Zähl-Variable erstellen o Welche Variablen fallen in die neue Variable o Weitere definieren welcher Wert soll gezählt werden Schritt 2: Mit der Zähl-Variable kann normal weitergerechnet werden (bspw. Häufigkeiten, Mittelwerte etc.)
4
6) Häufigkeitstabelle (zentrale Tendenz, Streuung, Schiefe etc.)
Deskriptive Statistik (Teil 2): Wie kann ich meine Daten detailliert beschreiben, bspw. um zu verstehen, wie meine Teilnehmer auf inhaltlich relevanten Fragen geantwortet haben? (Antwortverteilungen) Befehl: Häufigkeiten (Untermenü: Statistiken)
6.1 Häufigkeitstabelle und Kennwerte der Verteilung Befehl: Häufigkeiten o Analysieren deskriptive Statistik Häufigkeiten o Mittelwert o Median o Modalwert o Standardabweichung und Valenz o Spannweite o Quantile (z.B. Quartile, Terzile) o Schiefe
o
Wölbung (Kurtosis)
7) Befehl: Mittelwerte vergleichen
Wie kann ich Mittelwerte zwischen Teilnehmergruppen vergleichen? Befehl: Mittelwerte Vergleichen (z.B. wie unterscheidet sich der Mittelwert von Männern und Frauen im Hinblick auf ...?)
Analysieren Mittelwerte vergleichen Mittelwerte zu vergleichenden Variablen definieren
Ergebnis:
5
8) Befehl: Variablen berechnen
Wie kann ich Daten aus mehreren Variablen in eine neue Variable zusammenfassen? Befehl: Variablen berechnen
Typische Anwendung: Verrechnen von Variablen o Getrennte Abfrage der Tage pro Woche, an denen das Internet genutzt wird, und der Nutzungsdauer pro Tag alle Zusammenfassung in eine Variable Wöchentliche Meiden-Nutzungsdauer Berechnung von Anteilen o Anteil der Facebook-Nutzungszeit an der Gesamt-Internet-Nutzungszeit Also Facebook-Nutzungszeit / Gesamt-Internet-Nutzungszeit Ergebnis ist Prozentualer Anteil Umrechnen von Einheiten o Mediennutzungsdauer wurde in Minuten erfasst, soll aber in Stunden ausgewiesen werden Also Mediennutzungsdauer in Minuten / 60 Ergebnis ist Stunden
Transformieren Variable berechnen Zielvariable benenne Zielvariable definieren / Rechnungsart
Beispiel Aufgabe: Treatmentcheck: Wurde der Stimulus überhaupt als realistisch und glaubwürdig empfunden? Schritt 1: Mittelwertindex aus v_16a bis v_16c erstellen also MEAN (v_16a, ..., v_16c) Schritt 2: Index für die vier Experimentalgruppen vergleichen ( Mittelwerte vergleichen)
6
9) Indizes-/Skalenbildung und Reliabilität 9.1 Indizes- und Skalenbildung Warum? Messung komplexer Phänomene ist nicht über eine Frage/ ein Item möglich Es werden also mehrere Dimensionen eines Konstruktes befragt zur Validitätssteigerung der Messung zur Datenverdichtung
Index: Mehrere Items (also Variablen), die theoretisch zusammengehören, werden rechnerisch zusammengefasst Skala: Mehrere Items, die theoretisch zusammengehören UND intern konsistent sind (also auch rechnerisch zusammengehören), werden rechnerisch zusammengefasst Spezialfall von Indizes
Indikatoren des Ausmaßes des Victim Blamings
7
Hoher Wert bedeutet hohes Maß an Victim Blaming Aus diesen Items wird ein Index gebildet (Summen- oder Mittelwertindex) o Summenindex: je höher der Wert, desto höher liegt das Ausmaß des Victim Blamings ist aber schwer zu interpretieren o Mittelwertindex: Summe der einzelnen Items / die Anzahl an Items besser zum Interpretieren hat die gleiche Skalierung wie die Ursprungsskala
Manche Items können auch eine gegenteilige Bedeutung haben stimmt man diesem Item zu bedeutet es nicht, dass man Victim Blaming betreibt, sondern ganz im Gegenteil, das Opfer trägt nicht die Schuld Hoher Wert bedeutet kein hohes Maß an Victim Blaming Dieses Item muss umcodiert werden! (Siehe 5) o Transformieren umcodieren in andere Variable Variable die umcodiert werden soll auswählen neuen Namen geben o Jetzt umcodieren alte Werte neue Werte (15, 24, 33, 42, 51) o Labeln!
Index erstellen: Transformieren Variable berechnen neue Variable benennen alle Variablen + rechnen die zusammengenommen werden sollen Mittelwertindex: Variablen in Klammern setzten und durch die Anzahl an zusammengenommenen Variablen teilen Für den Index kann man eine Häufigkeitszählung machen (Analysieren deskriptive Statistik Häufigkeiten) Für den Index kann auch nach z.B. zwischen männlich und weiblich unterschieden (Analysieren Mittelwerte vergleichen Mittelwert UV Geschlecht und AV Index) o Ergebnis:
müsste aber noch durch einen t-Test auf Signifikanz geprüft werden
9.2 Reliabilität Reliabilitätsprüfung/interne Konsistenzprüfung: Gefahr von gegenläufigen Variablen Variablen die inhaltlich nicht dazu passen
8
Wie genau/zuverlässig ist meine Messung?
Es wird geprüft wie hoch der Zusammenhang/die Übereinstimmung zwischen verschiedenen Variablen Ausprägungen sind, die zu einer ähnlichen Fragestellung zusammengefasst werden können.
o Je ... desto ... Testverfahrenen für interne Konsistenz: Cronbachs Alpha also ob Items in eine Skala zusammengefasst werden dürfen
9.2.1 Cronbachs Alpha
Analysieren Skala Reliabilitätsanalyse Items: Variablen die auf intern Konsistenz geprüft werden sollen Statistiken: Skala, wenn Item gelöscht
Ergebnis:
der Reliabilität
9
Sind die Items intern konsistent, können sie dann im Anschluss in einem Index zusammengefasst werden
Wenn ein Item, was eigentlich umgepolt werden muss, nicht umgepolt wird, fällt das beim Cronbachs Alpha auf
10) Kreuztabellen
Um Zusammenhänge zwischen Variablen zu ermitteln
Sind Werte einer Stichprobe also nur zufällig, oder sind die Variablen in der GG tatsächlich abhängig/unabhängig voneinander
Man vergleicht tatsächlich beobachteten Häufigkeiten mit erwarteten Häufigkeiten (= wenn Variablen unabhängig voneinander wären) Anwendungsvoraussetzung: max. 20% der Zellen dürfen eine erwartete Häufigkeit von < 5 haben man könnte einzelne Gruppen zusammenfassen, um deren erwartete Häufigkeiten auch zusammenzufassen und > 5 zu sein
Wertebereich Chi2: 0 - unendlich ist der Zusammenhang signifikant oder nicht Maß der Stärke des Zusammenhangs: Cramers V (0 – 1) oder Phi
Kreuztabelle erstellen: Analysieren Deskriptive Statistiken Kreuztabellen Spalten UV und Zeilen AV Statistiken Chi-Quadrat und Phi & Cramers V Zellen Erwartete und spaltenweise Ergebnis für Chi2:
10
Antwort: Zwischen Geschlecht und Erfahrung, dass jemand etwas Gemeines auf die eigene Pinnwand oder die Pinnwand von Freunden geschrieben hat, besteht ein signifikanter Zusammenhang (Chi2 (2) = 14.599; p = 0.001): Es gibt mehr Männer, die diese Erfahrung bereits gemacht haben (25%) als Frauen (15%). Zudem gilt: es gibt mehr Männer, die diese Erfahrungen bereits mehrfach gemacht haben (Männer: 11%, Frauen 3%)
Ergebnis für Cramers V:
11
11) t-Tests
Gruppenvariable: o Es sollen zwei (oder mehr) Gruppen unterschieden werden o Nominales Datenniveau (max. ordinales, wenn nur wenige Ausprägungen) –es geht nur um Unterschiede o Bsp: Geschlecht, Schulbildung (hoch-mittel-niedrig), Experimentalgruppen…
Vergleichswert/-variable: o Anhänd ideser Variable sollen die Gruppen vergliche wernden o Wichtig: Metrisches Datenniveau ist zwingende Voraussetzung!
Arten von t-Tests: T-Test bei einer Stichprobe o Vergleich eines Mittelwertes gegen einen theoretischen Wert Ist der Wert größer/kleiner als ein fester kritischer Wert? T-test bei unabhängigen Stichproben (häufigster Anwendungsfall)
12
Vergleich der Mittelwerte zweier Gruppen gibt es einen Zusammenhang zwischen der Gruppeneinteilung und einer anderen Variable? T-test bei verbundenen/abhängigen Stichproben o Vergleich von zwei verschiedenen Mittelwerten (derselben Personen) gibt es einen Unterschied zwischen zwei verschiedenen Variablen? o
Voraussetzungen: Bei allen t-Tests: o Die AV ist metrisch o Die Variable bzw. die Differenzen zw. den beiden abhängigen Variablen sind normal verteilt Bei t-test für unabhängige Stichproben: o Keine Individuen gehören beiden Gruppen gleichzeitig an o Varianzen der beiden Gruppen sind homogen
11.1 t-Test bei einer Stichprobe
Vergleich eines Mittelwertes gegen einen theoretischen Wert Ist der Wert größer/kleiner als ein fester kritischer Wert? Bsp: Unterscheidet sich die Intensität des Victim Blaming signifikant von der theoretischen Skalenmitte (3)? Nullhypothese: Die Intensität des Victim Blaming unterscheidet sich nicht (signifikant) von der theoretischen Skalenmitte (3)
Vorgehen: Analysieren Mittelwerte vergleichen t-Test bei einer Stichprobe Testvariable und Wert gegen den getestet werden soll einfügen Ergebnis:
13
11.2 t-Test bei unabhängigen Stichproben
Vergleich der Mittelwerte zweier Gruppen gibt es einen Zusammenhang zwischen der Gruppeneinteilung und einer anderen Variablen? Bsp: Unterscheiden sich diejenigen, die das Profil mit vielen Infos gesehen haben, von denen, die das Profil mit wenigen Infos gesehen haben, in der Stärke des Victim Blamings? Nullhypothese: Diejenigen, die das Profil mit vielen Infos gesehen haben unterscheiden sich nicht (signifikant) von denen, die das Profil mit wenigen Infos gesehen haben, in der Stärke des Victim Blamings.
Vorgehen: Analysieren Mittelwerte vergleichen t-Test bei unabhängigen Stichproben Testvariable/AV eingeben UV eingeben und Gruppen definieren Ergebnis:
14
11.3 t-Test bei abhängigen Stichproben
Vergleich von zwei verschiedenen Mittelwerten (derselben Personen) gibt es einen Unterschied zw. zwei verschiedenen Variablen? Bsp.: Glauben die Befragten eher, dass das Opfer Selbstvertrauen verliert oder dass es depressiv wird? Nullhypothese: es gibt keinen (signifikanten) Unterschied zw. der Erwartung, dass das Opfer Selbstvertrauen verliert und dass es depressiv wird beides wird in gleichem Maße erwartet
Vorgehen: Analysieren Mittelwerte vergleichen t-Test bei verbundenen Stichproben die zu vergleichenden Variablen einfügen Ergebnis:
15
12) Varianzanalyse (ANOVA)
In einer einfaktoriellen ANOVA (ANalysisOfVAriance) kann der Effekt einer nominalen unabhängigen Variablen auf eine metrische abhängige Variable analysiert werden. Die Varianzanalyse prüft per F-Test, ob die durch den Faktor erklärte Varianz (Var Treatment) größer ist als die nicht erklärte Varianz (VarError)
12.1 Post-Hoc-Test ANOVA sagt nur aus, dass zw. min. zwei Gruppen signifikante Unterschiede bestehen, aber nicht zwischen welchen Post-Hoc-Test Ähnlich t-Test, prüft immer paarweise, bezieht aber mit ein bzw. korrigiert dafür, dass bei vielen Tests zufällig-signifikante Ergebnisse wahrscheinlicher werden (α-Fehler) Vorgehen:
16
Analysieren Mittelwerte vergleichen Einfaktorielle ANOVA AV und UV eingeben Post hoc Bonferroni Optionen deskriptive Statistik
Ergebnis:
Antwort:
17
Zwischen der experimentellen Manipulation und der Einstufung des Opfers als extravertiert besteht ein signifikanter Zusammenhang (F(3/582) = 360,844; p < .001). Die zwei experimentellen Bedingungen mit extravertiertem SNS-Profil (Extravertiert mit Info: M = 1,52, SD = 0,74; Extravertiert ohne Info: M = 1,73, SD = ,79) gehen mit höheren Extraversions-Ratings einher, als die experimentellen Bedingungen mit introvertiertem SNSProfil (Introvertiert mit Info: M = 3,86, SD = 0,85; Introvertiert ohne Info: M =3,79, SD= 0,68). Untereinander unterscheiden sich die zwei introvertierten vs. extrovertierten experimentellen Bedingungen nicht voneinander. Die experimentelle Manipulation kann 65% der Varianz, in der dem Opfer zugeschriebenen Extraversion erklären.
13) Korrelationskoeffizienten
Korrelationsanalysen versuchen, zwei Variablen in Zusammenhang zueinander zu bringen. Dabei muss man sich nicht auf eine Wirkrichtung (was ist die UV, was ist die AV?) festlegen!
Mögliche Ergebnisse: positive Korrelation = hohe/niedrige Werte in Variable A gehen mit hohen/niedrigen Werten in Variable B einher negative Korrelation = hohe Werte in Variable A gehen mit niedrigen Werten in Variable B einher keine Korrelation = bei Fällen mit einer hohen Ausprägung auf Variable A kann man keine Tendenz für Variable B ausmachen es gibt keine Kovarianz
18
Korrelationskoeffizienten: 1. Rangkorrelationskoeffizient nach Spearman (mind. Ordinales Datenniveau) o Wertebereich: -1 (max. negativer/gegenläufiger Zusammenhang) bis +1 (max. positiver/gleichsinniger Zusammenhang) 2. Produkt-Moment-Korrelationskoeffizient nach Pearson-Bravais (Pearson) (metrisches Datenniveau) o Wertebereich: -1 (max. negativer/gegenläufiger Zusammenhang) bis +1 (max. positiver/gleichsinniger Zusammenhang) der Wert 0 würde bedeuteten es gibt überhaupt keinen Zusammenhang je weiter der Wert an der Null dran liegt, desto schwächer ist der Zusammenhang Zu beachten: Wie sind die Variablen codiert? Was bedeuten hohe und niedrige Werte? Nur so kann die Richtung des Zusammenhangs richtig interpretiert werden.
In SPSS: Analysieren Korrelation Bivariat Variablen einfügen Fenster Korrelationskoeffizient: o Pearson für metrische Variablen o Spearman für ordinale Variablen
Ergebnis Pearson:
Korrelation der Korrelationswert in diesem Beispiel beträgt 0.132 Signifikanz der Alpha-Fehler liegt bei 0.001 die Wahrscheinlichkeit, dass die H1 („es besteht eine Korrelation“) fälschlicherweise angenommen wird, liegt bei 0.1% o An den ** kann man auch sehen, dass etwas signifikant ist Korrelationskoeffizient-Werte o 0.1 = schwacher Zusammenhang o 0.3 = mittlerer Zusammenhang o 0.5 = starker Zusammenhang es handelt sich in diesem Beispiel um einen schwachen positiven Zusammenhang
Antwort: Zwischen Zuschreibung, wer am Vorfall die Schuld trägt (1= das Opfer ist schuld, 5 = die Täter sind schuld) und dem geforderten Strafmaß (1 = keine Strafe, 5 = hohe Strafe) besteht ein
19
signifikanter Zusammenhang: Je eher den Tätern die Schuld gegeben wird, desto höher auch das geforderte Strafmaß (und umgekehrt; r = 0,132, p < .001). Es handelt sich um einen schwachen Zusammenhang.
14) Regression
Regressionsanalyse „Mathematisches“ Ziel: man will eine Variable (AV) aus einer (oder mehreren) anderen (UV) vorhersagen, also eine Gleichung finden, die den Zusammenhang ausdrückt „Interpretationsziel“: man will feststellen, wie stark eine Variable (häufig unter Kontrolle anderer Variablen) eine andere beeinflusst, es geht um die „Gewichtung“ der einzelnen Komponenten der Gleichung
20
Welche UV hat den größten Einfluss hat (bei multipler Regression)
Welche UV hat einen positiven oder negativen Einfluss hat
Welche Fragen sind zu beantworten? 1. Trägt das Modell überhaupt zur Erklärung der AV bei? o F-Statistik (ANOVA): Wie stark hat das Modell die Vorhersage verbessert verglichen mit dem Fehler, den das Modell enthält? Vergleichspunkt: der Mittelwert der AV 2. Wie viel kann das Modell erklären? o R2: Wie viel Varianz der AV kann das Modell erklären? 3. Welche Prädiktoren sind signifikant? o Steigungskoeffizient b wird mittels t-Test auf Signifikanz geprüft 4. Wie viel erklären die einzelnen UVs? o Regressionskoeffizienten der einzelnen UVs Beispiel: Was hat den größten Einfluss auf die Dauer der täglichen FB-Nutzung? Regressionsgleichung bei mehreren Prädiktoren: � Dach = a + b1*x1+ b2*x2+ b...*x... FB-Nutzung in Min = 12+ 0,5*Internetnutzu...