SPSS - SPSS Zusammenfassung PDF

Title	SPSS - SPSS Zusammenfassung
Course	Datenanalyse mit SPSS
Institution	Johannes Gutenberg-Universität Mainz
Pages	22
File Size	1.6 MB
File Type	PDF
Total Downloads	54
Total Views	156

Preview

CLICK TO PREVIEW PDF

Summary

SPSS Zusammenfassung ...

Description

datenanalyse Wie erkenne ich, welches verfahren das richtige ist?

4) Umgang mit Daten: Häufigkeitsauszählungen, Mehrfach-antworten, Filtern, Gruppen vergleichen 4.1 Häufigkeitszählungen  Analysieren  deskriptive Statistiken  Häufigkeitsauszählung  Für z.B. relative und absolute Häufigkeiten von Variablenausprägungen  Frage: Wie viel Prozent ...? 

Hier gibt es auch unter  Statistiken o Perzentil Werte (Quartile, Perzentile) o Streuung (Standardabweichung, Varianz, ...) o Lagemaße (Median, Modalwert) o Verteilung (Schiefe, Kurtosis)

Ergebnis:

1

4.2 Berechnung des Medians  Analysieren  deskriptive Statistiken  Häufigkeitsauszählung  Statistiken  Median

4.3 Berechnung des Arithmetischen Mittels  Analysieren  deskriptive Statistiken  deskriptive Statistik Variable mit Mehrfachantworten auswerten:  Analysieren  Mehrfachantworten  Variablensets definieren  Mehrfachantworten Set definieren, also alle Variablen rüberschieben und dem Set einen Namen geben  Häufigkeitsauszählung  Variablen im Set müssen identisch codiert sein!

4.4 Mehrfachantworten  Variablenstruktur bei Mehr- fachantworten: o Jede mögliche Antwort stellt eine eigene Variable dar  dichotome Codierung

2



Auswertung 1. Mehrfachantworten-Set definieren o Analysieren  Mehrfachantworten  Variablenset definieren  aktiviere dichotome Codierung  schließen 2. Häufigkeitsauszählung oder Kreuztabelle erstellen o Analysieren  Mehrfachantworten  Häufigkeiten oder Kreuztabelle



Zu beachten: Alle Variablen im Set müssen identisch codiert sein!

Ergebnis:

4.5 Gruppen vergleichen  Option 1: „Gruppen vergleichen“: die Ergebnisse werden in einer Tabelle neben-/untereinander dargestellt (Vergleichstabelle) o Daten  Aufgeteilte Datei  Gruppen vergleichen  Variable nach der gruppiert werden soll eintragen  Option 2: „Ausgabe nach Gruppen aufteilen“: die Ergebnisse werden für die Gruppen nacheinander dargestellt (getrennte Tabellen) o Daten  Aufgeteilte Datei  Ausgabe nach Gruppen aufteilen  Variable nach der gruppiert werden soll eintragen 

ACHTUNG! Eine Aufteilung bleibt immer solange aktiv, bis sie ausgeschaltet wird! Dies kann man in der Statusleiste (rechts unten) erkennen:

4.6 Filter  Falls nur Bestimmte Personen mit bestimmten Eigenschaften betrachtet werden sollen  Daten  Fälle auswählen  falls Bedingung zutrifft  Bedingungen eingeben, unter denen Personen im Datensatz bleiben sollen

3

5) Umcodieren und Zählen 5.1 Umcodieren/Recodieren  wenn Variablen nicht so erhoben wurden, wie man sie zum weiterrechnen braucht, muss man sie umcodieren  Beispiel Aufgaben o Es sollen Alters-/ Einkommensgruppen verglichen werden (die einzelnen Alter und Einkommen müssen in Gruppen zusammengefasst werden) o Umpolen von Skalen (positiv wird zu negativ und negativ wird zu positiv)  



Transformieren  umcodieren in andere Variable  Variable die umcodiert werden soll auswählen  neuen Namen geben Jetzt umcodieren alte Werte  neue Werte o Bereich KLEINSTER bis Wert = alles kleiner gleich dem Wert der eingetragen wird o Bereich Wert bis GRÖSTER = alles größer gleich der Wert der eingetragen wird Umcodierte Variablen Labeln: Daten  Variableneigenschaften definieren

5.2 Zählen  

Bei Mehrfachantworten: wie viele Antworten mit einem bestimmten Wert wurden genannt Bei Auswahlfragen: wie häufig wurde eine bestimmte Antwort über alle Auswahlfragen hinweg gegeben?

 

Transformieren  Werte in Fällen zählen Schritt 1: Zähl-Variable erstellen o Welche Variablen fallen in die neue Variable o Weitere definieren  welcher Wert soll gezählt werden Schritt 2: Mit der Zähl-Variable kann normal weitergerechnet werden (bspw. Häufigkeiten, Mittelwerte etc.)



4

6) Häufigkeitstabelle (zentrale Tendenz, Streuung, Schiefe etc.) 

Deskriptive Statistik (Teil 2): Wie kann ich meine Daten detailliert beschreiben, bspw. um zu verstehen, wie meine Teilnehmer auf inhaltlich relevanten Fragen geantwortet haben? (Antwortverteilungen)  Befehl: Häufigkeiten (Untermenü: Statistiken)

6.1 Häufigkeitstabelle und Kennwerte der Verteilung  Befehl: Häufigkeiten o Analysieren  deskriptive Statistik  Häufigkeiten o Mittelwert o Median o Modalwert o Standardabweichung und Valenz o Spannweite o Quantile (z.B. Quartile, Terzile) o Schiefe

o

Wölbung (Kurtosis)

7) Befehl: Mittelwerte vergleichen 

Wie kann ich Mittelwerte zwischen Teilnehmergruppen vergleichen?  Befehl: Mittelwerte Vergleichen (z.B. wie unterscheidet sich der Mittelwert von Männern und Frauen im Hinblick auf ...?)



Analysieren  Mittelwerte vergleichen  Mittelwerte  zu vergleichenden Variablen definieren

Ergebnis:

5

8) Befehl: Variablen berechnen 

Wie kann ich Daten aus mehreren Variablen in eine neue Variable zusammenfassen?  Befehl: Variablen berechnen

Typische Anwendung:  Verrechnen von Variablen o Getrennte Abfrage der Tage pro Woche, an denen das Internet genutzt wird, und der Nutzungsdauer pro Tag  alle Zusammenfassung in eine Variable  Wöchentliche Meiden-Nutzungsdauer  Berechnung von Anteilen o Anteil der Facebook-Nutzungszeit an der Gesamt-Internet-Nutzungszeit Also Facebook-Nutzungszeit / Gesamt-Internet-Nutzungszeit  Ergebnis ist Prozentualer Anteil  Umrechnen von Einheiten o Mediennutzungsdauer wurde in Minuten erfasst, soll aber in Stunden ausgewiesen werden Also Mediennutzungsdauer in Minuten / 60  Ergebnis ist Stunden 

Transformieren  Variable berechnen  Zielvariable benenne  Zielvariable definieren / Rechnungsart

Beispiel Aufgabe:  Treatmentcheck: Wurde der Stimulus überhaupt als realistisch und glaubwürdig empfunden?  Schritt 1: Mittelwertindex aus v_16a bis v_16c erstellen  also MEAN (v_16a, ..., v_16c)  Schritt 2: Index für die vier Experimentalgruppen vergleichen (  Mittelwerte vergleichen)

6

9) Indizes-/Skalenbildung und Reliabilität 9.1 Indizes- und Skalenbildung Warum?  Messung komplexer Phänomene ist nicht über eine Frage/ ein Item möglich  Es werden also mehrere Dimensionen eines Konstruktes befragt  zur Validitätssteigerung der Messung  zur Datenverdichtung  

Index: Mehrere Items (also Variablen), die theoretisch zusammengehören, werden rechnerisch zusammengefasst Skala: Mehrere Items, die theoretisch zusammengehören UND intern konsistent sind (also auch rechnerisch zusammengehören), werden rechnerisch zusammengefasst  Spezialfall von Indizes

Indikatoren des Ausmaßes des Victim Blamings

 

7

Hoher Wert bedeutet hohes Maß an Victim Blaming Aus diesen Items wird ein Index gebildet (Summen- oder Mittelwertindex) o Summenindex: je höher der Wert, desto höher liegt das Ausmaß des Victim Blamings  ist aber schwer zu interpretieren o Mittelwertindex: Summe der einzelnen Items / die Anzahl an Items  besser zum Interpretieren  hat die gleiche Skalierung wie die Ursprungsskala



 

Manche Items können auch eine gegenteilige Bedeutung haben  stimmt man diesem Item zu bedeutet es nicht, dass man Victim Blaming betreibt, sondern ganz im Gegenteil, das Opfer trägt nicht die Schuld Hoher Wert bedeutet kein hohes Maß an Victim Blaming Dieses Item muss umcodiert werden! (Siehe 5) o Transformieren  umcodieren in andere Variable  Variable die umcodiert werden soll auswählen  neuen Namen geben o Jetzt umcodieren alte Werte  neue Werte (15, 24, 33, 42, 51) o Labeln!

Index erstellen:  Transformieren  Variable berechnen  neue Variable benennen  alle Variablen + rechnen die zusammengenommen werden sollen  Mittelwertindex: Variablen in Klammern setzten und durch die Anzahl an zusammengenommenen Variablen teilen  Für den Index kann man eine Häufigkeitszählung machen (Analysieren  deskriptive Statistik  Häufigkeiten)  Für den Index kann auch nach z.B. zwischen männlich und weiblich unterschieden (Analysieren  Mittelwerte vergleichen  Mittelwert  UV Geschlecht und AV Index) o Ergebnis:

 müsste aber noch durch einen t-Test auf Signifikanz geprüft werden

9.2 Reliabilität Reliabilitätsprüfung/interne Konsistenzprüfung:  Gefahr von gegenläufigen Variablen  Variablen die inhaltlich nicht dazu passen

8



Wie genau/zuverlässig ist meine Messung?



Es wird geprüft wie hoch der Zusammenhang/die Übereinstimmung zwischen verschiedenen Variablen Ausprägungen sind, die zu einer ähnlichen Fragestellung zusammengefasst werden können.



o Je ... desto ... Testverfahrenen für interne Konsistenz: Cronbachs Alpha  also ob Items in eine Skala zusammengefasst werden dürfen

9.2.1 Cronbachs Alpha 

Analysieren  Skala  Reliabilitätsanalyse  Items: Variablen die auf intern Konsistenz geprüft werden sollen  Statistiken: Skala, wenn Item gelöscht



Ergebnis:

der Reliabilität

9



Sind die Items intern konsistent, können sie dann im Anschluss in einem Index zusammengefasst werden



Wenn ein Item, was eigentlich umgepolt werden muss, nicht umgepolt wird, fällt das beim Cronbachs Alpha auf

10) Kreuztabellen



Um Zusammenhänge zwischen Variablen zu ermitteln



Sind Werte einer Stichprobe also nur zufällig, oder sind die Variablen in der GG tatsächlich abhängig/unabhängig voneinander

 

Man vergleicht tatsächlich beobachteten Häufigkeiten mit erwarteten Häufigkeiten (= wenn Variablen unabhängig voneinander wären) Anwendungsvoraussetzung: max. 20% der Zellen dürfen eine erwartete Häufigkeit von < 5 haben  man könnte einzelne Gruppen zusammenfassen, um deren erwartete Häufigkeiten auch zusammenzufassen und > 5 zu sein

 

Wertebereich Chi2: 0 - unendlich  ist der Zusammenhang signifikant oder nicht Maß der Stärke des Zusammenhangs: Cramers V (0 – 1) oder Phi

Kreuztabelle erstellen:  Analysieren  Deskriptive Statistiken  Kreuztabellen  Spalten UV und Zeilen AV  Statistiken  Chi-Quadrat und Phi & Cramers V  Zellen  Erwartete und spaltenweise Ergebnis für Chi2:

10



Antwort: Zwischen Geschlecht und Erfahrung, dass jemand etwas Gemeines auf die eigene Pinnwand oder die Pinnwand von Freunden geschrieben hat, besteht ein signifikanter Zusammenhang (Chi2 (2) = 14.599; p = 0.001): Es gibt mehr Männer, die diese Erfahrung bereits gemacht haben (25%) als Frauen (15%). Zudem gilt: es gibt mehr Männer, die diese Erfahrungen bereits mehrfach gemacht haben (Männer: 11%, Frauen 3%)

Ergebnis für Cramers V:

11

11) t-Tests



Gruppenvariable: o Es sollen zwei (oder mehr) Gruppen unterschieden werden o Nominales Datenniveau (max. ordinales, wenn nur wenige Ausprägungen) –es geht nur um Unterschiede o Bsp: Geschlecht, Schulbildung (hoch-mittel-niedrig), Experimentalgruppen…



Vergleichswert/-variable: o Anhänd ideser Variable sollen die Gruppen vergliche wernden o Wichtig: Metrisches Datenniveau ist zwingende Voraussetzung!

Arten von t-Tests:  T-Test bei einer Stichprobe o Vergleich eines Mittelwertes gegen einen theoretischen Wert  Ist der Wert größer/kleiner als ein fester kritischer Wert?  T-test bei unabhängigen Stichproben (häufigster Anwendungsfall)

12

Vergleich der Mittelwerte zweier Gruppen  gibt es einen Zusammenhang zwischen der Gruppeneinteilung und einer anderen Variable? T-test bei verbundenen/abhängigen Stichproben o Vergleich von zwei verschiedenen Mittelwerten (derselben Personen)  gibt es einen Unterschied zwischen zwei verschiedenen Variablen? o



Voraussetzungen:  Bei allen t-Tests: o Die AV ist metrisch o Die Variable bzw. die Differenzen zw. den beiden abhängigen Variablen sind normal verteilt  Bei t-test für unabhängige Stichproben: o Keine Individuen gehören beiden Gruppen gleichzeitig an o Varianzen der beiden Gruppen sind homogen

11.1 t-Test bei einer Stichprobe   

Vergleich eines Mittelwertes gegen einen theoretischen Wert  Ist der Wert größer/kleiner als ein fester kritischer Wert? Bsp: Unterscheidet sich die Intensität des Victim Blaming signifikant von der theoretischen Skalenmitte (3)? Nullhypothese: Die Intensität des Victim Blaming unterscheidet sich nicht (signifikant) von der theoretischen Skalenmitte (3)

Vorgehen:  Analysieren  Mittelwerte vergleichen  t-Test bei einer Stichprobe  Testvariable und Wert gegen den getestet werden soll einfügen Ergebnis:

13

11.2 t-Test bei unabhängigen Stichproben   

Vergleich der Mittelwerte zweier Gruppen  gibt es einen Zusammenhang zwischen der Gruppeneinteilung und einer anderen Variablen? Bsp: Unterscheiden sich diejenigen, die das Profil mit vielen Infos gesehen haben, von denen, die das Profil mit wenigen Infos gesehen haben, in der Stärke des Victim Blamings? Nullhypothese: Diejenigen, die das Profil mit vielen Infos gesehen haben unterscheiden sich nicht (signifikant) von denen, die das Profil mit wenigen Infos gesehen haben, in der Stärke des Victim Blamings.

Vorgehen:  Analysieren  Mittelwerte vergleichen  t-Test bei unabhängigen Stichproben  Testvariable/AV eingeben  UV eingeben und Gruppen definieren Ergebnis:

14

11.3 t-Test bei abhängigen Stichproben   

Vergleich von zwei verschiedenen Mittelwerten (derselben Personen)  gibt es einen Unterschied zw. zwei verschiedenen Variablen? Bsp.: Glauben die Befragten eher, dass das Opfer Selbstvertrauen verliert oder dass es depressiv wird? Nullhypothese: es gibt keinen (signifikanten) Unterschied zw. der Erwartung, dass das Opfer Selbstvertrauen verliert und dass es depressiv wird  beides wird in gleichem Maße erwartet

Vorgehen:  Analysieren  Mittelwerte vergleichen  t-Test bei verbundenen Stichproben  die zu vergleichenden Variablen einfügen Ergebnis:

15

12) Varianzanalyse (ANOVA)

 

In einer einfaktoriellen ANOVA (ANalysisOfVAriance) kann der Effekt einer nominalen unabhängigen Variablen auf eine metrische abhängige Variable analysiert werden. Die Varianzanalyse prüft per F-Test, ob die durch den Faktor erklärte Varianz (Var Treatment) größer ist als die nicht erklärte Varianz (VarError)

12.1 Post-Hoc-Test  ANOVA sagt nur aus, dass zw. min. zwei Gruppen signifikante Unterschiede bestehen, aber nicht zwischen welchen  Post-Hoc-Test  Ähnlich t-Test, prüft immer paarweise, bezieht aber mit ein bzw. korrigiert dafür, dass bei vielen Tests zufällig-signifikante Ergebnisse wahrscheinlicher werden (α-Fehler) Vorgehen:

16

  

Analysieren  Mittelwerte vergleichen  Einfaktorielle ANOVA  AV und UV eingeben Post hoc  Bonferroni Optionen  deskriptive Statistik

Ergebnis:

Antwort:  

 

17

Zwischen der experimentellen Manipulation und der Einstufung des Opfers als extravertiert besteht ein signifikanter Zusammenhang (F(3/582) = 360,844; p < .001). Die zwei experimentellen Bedingungen mit extravertiertem SNS-Profil (Extravertiert mit Info: M = 1,52, SD = 0,74; Extravertiert ohne Info: M = 1,73, SD = ,79) gehen mit höheren Extraversions-Ratings einher, als die experimentellen Bedingungen mit introvertiertem SNSProfil (Introvertiert mit Info: M = 3,86, SD = 0,85; Introvertiert ohne Info: M =3,79, SD= 0,68). Untereinander unterscheiden sich die zwei introvertierten vs. extrovertierten experimentellen Bedingungen nicht voneinander. Die experimentelle Manipulation kann 65% der Varianz, in der dem Opfer zugeschriebenen Extraversion erklären.

13) Korrelationskoeffizienten



Korrelationsanalysen versuchen, zwei Variablen in Zusammenhang zueinander zu bringen. Dabei muss man sich nicht auf eine Wirkrichtung (was ist die UV, was ist die AV?) festlegen!

Mögliche Ergebnisse:  positive Korrelation = hohe/niedrige Werte in Variable A gehen mit hohen/niedrigen Werten in Variable B einher  negative Korrelation = hohe Werte in Variable A gehen mit niedrigen Werten in Variable B einher  keine Korrelation = bei Fällen mit einer hohen Ausprägung auf Variable A kann man keine Tendenz für Variable B ausmachen  es gibt keine Kovarianz

18

Korrelationskoeffizienten: 1. Rangkorrelationskoeffizient nach Spearman (mind. Ordinales Datenniveau) o Wertebereich: -1 (max. negativer/gegenläufiger Zusammenhang) bis +1 (max. positiver/gleichsinniger Zusammenhang) 2. Produkt-Moment-Korrelationskoeffizient nach Pearson-Bravais (Pearson) (metrisches Datenniveau) o Wertebereich: -1 (max. negativer/gegenläufiger Zusammenhang) bis +1 (max. positiver/gleichsinniger Zusammenhang)  der Wert 0 würde bedeuteten es gibt überhaupt keinen Zusammenhang  je weiter der Wert an der Null dran liegt, desto schwächer ist der Zusammenhang Zu beachten:  Wie sind die Variablen codiert? Was bedeuten hohe und niedrige Werte? Nur so kann die Richtung des Zusammenhangs richtig interpretiert werden.

In SPSS:  Analysieren  Korrelation  Bivariat  Variablen einfügen  Fenster Korrelationskoeffizient: o Pearson für metrische Variablen o Spearman für ordinale Variablen

Ergebnis Pearson:

 



Korrelation  der Korrelationswert in diesem Beispiel beträgt 0.132 Signifikanz  der Alpha-Fehler liegt bei 0.001  die Wahrscheinlichkeit, dass die H1 („es besteht eine Korrelation“) fälschlicherweise angenommen wird, liegt bei 0.1% o An den ** kann man auch sehen, dass etwas signifikant ist Korrelationskoeffizient-Werte o 0.1 = schwacher Zusammenhang o 0.3 = mittlerer Zusammenhang o 0.5 = starker Zusammenhang  es handelt sich in diesem Beispiel um einen schwachen positiven Zusammenhang

Antwort:  Zwischen Zuschreibung, wer am Vorfall die Schuld trägt (1= das Opfer ist schuld, 5 = die Täter sind schuld) und dem geforderten Strafmaß (1 = keine Strafe, 5 = hohe Strafe) besteht ein

19



signifikanter Zusammenhang: Je eher den Tätern die Schuld gegeben wird, desto höher auch das geforderte Strafmaß (und umgekehrt; r = 0,132, p < .001). Es handelt sich um einen schwachen Zusammenhang.

14) Regression

Regressionsanalyse  „Mathematisches“ Ziel: man will eine Variable (AV) aus einer (oder mehreren) anderen (UV) vorhersagen, also eine Gleichung finden, die den Zusammenhang ausdrückt  „Interpretationsziel“: man will feststellen, wie stark eine Variable (häufig unter Kontrolle anderer Variablen) eine andere beeinflusst, es geht um die „Gewichtung“ der einzelnen Komponenten der Gleichung 

20

Welche UV hat den größten Einfluss hat (bei multipler Regression)



Welche UV hat einen positiven oder negativen Einfluss hat

Welche Fragen sind zu beantworten? 1. Trägt das Modell überhaupt zur Erklärung der AV bei? o F-Statistik (ANOVA): Wie stark hat das Modell die Vorhersage verbessert verglichen mit dem Fehler, den das Modell enthält? Vergleichspunkt: der Mittelwert der AV 2. Wie viel kann das Modell erklären? o R2: Wie viel Varianz der AV kann das Modell erklären? 3. Welche Prädiktoren sind signifikant? o Steigungskoeffizient b wird mittels t-Test auf Signifikanz geprüft 4. Wie viel erklären die einzelnen UVs? o Regressionskoeffizienten der einzelnen UVs Beispiel:  Was hat den größten Einfluss auf die Dauer der täglichen FB-Nutzung?  Regressionsgleichung bei mehreren Prädiktoren: � Dach = a + b1*x1+ b2*x2+ b...*x...  FB-Nutzung in Min = 12+ 0,5*Internetnutzu...