Kapitel 4 - Maße der zentralen Tendenz PDF

Title Kapitel 4 - Maße der zentralen Tendenz
Author You're welcome
Course Grundlagen inferenzstatistischer Datenanalyse
Institution Universität Graz
Pages 3
File Size 83.3 KB
File Type PDF
Total Downloads 57
Total Views 146

Summary

Sommersemester...


Description

Kapitel - Maße der zentralen Tendenz: Modalwert: Der Modalwert, auch Modus (Mo) genannt, ist derjenige Wert einer Verteilung, der am häufigsten vorkommt. Dieser kann auch aus einer Häufigkeitstabelle abgelesen werden. Es ist der Messwert, der am häufigsten vorkommt, also die größte absolute Häufigkeit besitzt. Darstellung des Modalwerts: Die Bestimmung des Modalwerts erfolgt also über die Auszählung der Häufigkeiten der einzelnen Messwertausprägungen. Prinzipiell kann der Modalwert für alle Skalenniveaus sinnvoll interpretiert werden. Darstellung des Modalwerts bei gemessenen stetigen Variablen: Für gemessene stetige Variablen wird der Modalwert genauso bestimmt wie für diskrete Variablen. Stetige Variablen haben theoretisch unendlich viele Ausprägungen und eine beliebige Genauigkeit. Durch die Messung mit einer begrenzten Genauigkeit, beispielsweise Gewicht auf zwei Kommastellen genau, wird die stetige Größe wieder in eine diskrete Größe überführt. Mehrere Modalwerte: Es kann vorkommen, dass es zwei oder mehr Messwertausprägungen gibt, die zum einem gleich häufig und zum anderen häufiger als die anderen Messwertausprägungen auftreten. Liegen die beiden Messwertausprägungen nahe beieinander, ist dies bei der Interpretation der zentralen Tendenz weniger bedeutsam. Probleme ergeben sich allerdings, wenn die beiden Messwertausprägungen weiter auseinander liegen und zwei oder mehr Modalwerte vorliegen. In diesem Fall ist die zentrale Tendenz anhand des Modalwerts nicht eindeutig festzustellen und seine Angabe wenig sinnvoll. Eigenschaften des Modalwerts: Ein großer Vorteil des Modalwerts ist, dass er durch sehr hohe und sehr niedrige Variablenausprägungen nicht beeinflusst wird. Das heißt, kommen in der Stichprobe einige Probanden vor, die im Vergleich zu den restlichen Probanden sehr kleine oder sehr große Messwerte erzielt haben, so hat dies keinen Einfluss auf die Höhe des Modalwerts. Gerade wenn die grafische Inspektion der Messwerte ergeben hat, dass solche auffällig hohen oder niedrigen Messwerte vorkommen, kann es sinnvoll sein, den Modalwert zur Interpretation der zentralen Tendenz heranzuziehen. Wir bezeichnen hier zunächst Ausreißer- und Extremwert als auffällig.

Median: Wir definieren den Median (Md) zunächst als denjenigen Messwert, der eine nach Höhe der Messwerte geordnete Messwertreihe in die oberen und die untere 50 Prozent aufteilt. Man kann auch sagen, der Median teilt eine Verteilung von Messwerten in zwei gleich große Hälften. Somit ist die Anzahl der Messwerte über und unter dem Median gleich. Der Median ist daher auch als der Messwert definiert, an dem sich die Stichprobe in zwei gleich große Personengruppe teilt. Bestimmung des Medians: Es können zwei Rechenformeln angegeben werden, je nachdem ob die Stichprobe aus einer geraden oder ungeraden Anzahl von Personen besteht. Sowohl für eine gerade als auch für eine ungerade Anzahl von Personen müssen die Messwerte zunächst nach ihrer Größe mit Angabe der Person aufsteigend geordnet werden. Median und Skalenniveau:

Eine Bestimmung und Interpretation des Medians ist dann sinnvoll, wenn die untersuchten Variablen mindestens ordinalskaliert sind. Erst wenn die Variable Ordinalskalenniveau aufweist, können Messwerte nach ihrer Größe („besser“ oder „schlechter“) geordnet werden. Damit ist es informativ, welcher Wert die Stichprobe in zwei gleich große Hälften teilt. Für höhere Skalenniveaus ist die Bestimmung des Medians ebenfalls sinnvoll. Vorteile der Bestimmung des Medians: Wie der Modalwert, ist auch der Median nicht empfindlich gegenüber Ausreißerwerten. Zudem enthält er mehr Informationen als der Modalwert. Das am häufigsten genützten Maß der zentralen Tendenz ist jedoch der Mittelwert.

Ungewichteter Mittelwert: Mittelwert/Arithmetisches Mittel: Der Mittelwert wird in der Literatur auch oft als M angegeben. Der Mittelwert ergibt sich aus der Summe aller Messwerte, geteilt durch die Anzahl der Personen n. Der Mittelwert ist ein Maß der zentralen Tendenz und kennzeichnet den Durchschnitt aller Messwerte. Eigenschaften des Mittelwerts: Der Mittelwert hat einige besondere Eigenschaften, die erklären, warum er so häufig verwendet wird. Schwerpunkteigenschaft des Mittelwerts: Nutzt man den Mittelwert beispielsweise als Bezugspunkt und addiert die Abweichungen aller anderen Messwerte zu diesem Bezugspunkt auf, so ergibt sich als Summe die Zahl Null. Das heißt, positive und negative Abweichungen halten die Waage. Dies wird auch als Schwerpunkt- oder Ausgleichseigenschaft bezeichnet. Minimumeigenschaft des Mittelwerts: Werden die Abweichungen der Messwerte vom Mittelwert nicht nur einfach aufsummiert, sondern zuvor auch noch quadriert und dann erst aufsummiert, erhält man die Summe der quadrierten Abweichungen vom Mittelwert. Diese wird auch als (Abweichungs-)Quadratsumme bezeichnet. Es lässt sich nun zeigen, dass es keinen anderen möglichen Messwert gibt, dessen Abweichungsquadratsumme kleiner ausfällt als die des Mittelwerts. Man bezeichnet diese Eigenschaft auch als Minimumeigenschaft. Gehen wir als Beispiel von drei Werten aus. Die Messwerte lauten dabei 13,14 und 15. Nun bilden wir den Mittelwert und addieren die Werte daher zunächst auf: 13+14+15 = 42. Im Anschluss teilen wir die Summe noch durch drei (n). Nun erhalten wir einen Mittelwert von 42/3 = 14. Bilden wir nun die Summe der quadrierten Abweichungen von 14 für jeden Messwert erhalten wir: (13-14) ² + (14-14) ² + (15-14) ² = (-1) ² + 0² + 1² = 2 Wir können dies nun für die Messwerte 13 und 15 wiederholen: (13-13) ² + (14-13) ² + (15-13) ² = 0² + 1² + 2² = 5 (13-15) ² + (14-15) ² + (15-15) ² = (-2) ² + (-1) ² + 0 ² = 5 Dieses Beispiel soll verdeutlichen, dass kein anderer möglicher Messwert aus der Stichprobe die Eigenschaften hat, dass die quadrierten Abweichungen zwischen ihm und den anderen Messwerten ein Minimum ergeben. Lediglich für den Mittelwert lässt sich ein Minimum der quadrierten Abweichung erzielen. An dieser Stelle sei der Vollständigkeit halber angemerkt, dass der Median die Summe der Abweichungsbeträge minimiert. Verwendet man Abweichungsbeiträge, hat dies den Vorteil, dass extreme Werte bei der Bestimmung des Medians weniger stark ins Gewicht fallen als bei der Berechnung des Mittelwerts.

Abweichungen vom Mittelwert als Vorhersagefehler: Wie lässt sich dieses Phänomen nutzen? Wenn wir den Wert einer Person in der Stichprobe vorhersagen möchten, aber sonst keine Informationen über diese Person haben, könnten wir den Mittelwert nutzen. Die Abweichung zwischen dem vorhergesagten und dem tatsächlich beobachteten Wert wäre dann ein Vorhersagefehler. Außer dem Mittelwert gibt es, wie wir gesehen haben, keinen anderen Messwert, bei dem im Durchschnitt die quadrierten Abweichungen geringer wären. Dies ist sicherlich einer der Gründe, warum der Mittelwert so häufig als Maß der zentralen Tendenz genutzt wird. Ausreißerempfindlichkeit des Mittelwerts: Ein großer Nachteil des Mittelwerts ist jedoch seine Empfindlichkeit gegenüber Ausreißerwerten. Liegen in einer Stichprobe einige extrem hohe oder niedrige Messwerte vor, beeinflusst dies die Größe des Mittelwerts, vor allem in kleinen Stichproben. In diesem Fall kann der Mittelwert leicht durch die sogenannten Ausreißerwerte verzerrt werden. Daher sollte vor der Interpretation des Mittelwerts immer geprüft werden, ob solche Ausreißerwerte in der Stichprobe vorkommen. Mittelwert und Skalenniveaus: Eine Berechnung und Interpretation des Mittelwerts ist nur dann sinnvoll, wenn die untersuchten Variablen mindestens intervallskaliert sind. Erst dann können Differenzen zwischen Messwerten sinnvoll interpretiert werden, denn gleiche numerische Differenzen stehen für gleiche Differenzen in der Messwertausprägung. Nehmen wir an, der Abstand zwischen den gemessenen Werten 15 und 20 wäre in Wirklichkeit nicht fünf, sondern eins und der Abstand zwischen den Werte 25 und 30 wäre in Wirklichkeit nicht fünf, sondern zehn. In diesem Fall wäre der Mittelwert nicht mehr sinnvoll interpretierbar.

Gewichteter Mittelwert: Manchmal liegen Mittelwerte aus verschiedenen Stichproben vor, die zu einem gemeinsamen Mittelwert zusammengefasst werden sollen. So haben wir in unserem Beispiel zur Untersuchung der Fakinganfälligkeit von Leistungsmotivationsinstrumenten drei Gruppen: Eine Kontrollgruppe, eine Fake-Good-Gruppe und eine Fake-Bad-Gruppe. Der Altersdurchschnitt in der Kontrollgruppe ist 22, in der Fake-Good-Gruppe 23 und in der Fake-Bad-Gruppe 22. Es liegt nahe, diese Mittelwerte ebenfalls zu ermitteln, um den Gesamtmittelwert zu erlangen. Allerdings würden wir dann nicht alle Informationen nutzen, die wir zur Verfügung haben. Daher wird ein gewichteter Mittelwert berechnet, der auch noch die unterschiedliche Stichprobengröße der Teilgruppen berücksichtigt.

Gewichteter Mittelwert und Ausreißerempfindlichkeit sowie Skalenniveau: Voraussetzung für die Berechnung des gewichteten Mittelwerts ist in jedem Fall, dass die Daten mindestens Intervallskalenniveau besitzen, da Differenzen sinnvoll interpretierbar sein müssen. Auch das gewichtete arithmetische Mittel wird durch Extrem- oder Ausreißerwerte stark beeinflusst. Nun haben wir gesehen, wie man durch Häufigkeiten sowie Maße der zentralen Tendenz einen ersten Eindruck über die Daten gewinnen kann. Ein weiteres wichtiges Kennreichen bei der Beschreibung von Variablen ist deren Streuung oder Variabilität....


Similar Free PDFs