Klausur Statistik II WS 08 PDF

Title Klausur Statistik II WS 08
Course Statistik II
Institution Hochschule für Wirtschaft und Gesellschaft Ludwigshafen
Pages 4
File Size 71 KB
File Type PDF
Total Downloads 76
Total Views 146

Summary

Vlasic...


Description

Klausur Statistik II WS 08/09 Frage 1: Was versteht man unter induktiver Statistik und wie hängt sie mit der Auswahl von Stichproben zusammen? (8 Punkte ca. 6 Minuten) Induktive Statistik ist die schließende Statistik unter ihr versteht man also den Teil der Statistik bei der man von der Datenanalyse einer Stichprobe auf die jeweilige Grundgesamtheit (GG) schließt. Stichproben sollen in ihren Merkmalen die GG wiederspiegeln. Jedoch kann man nie genau sagen, wie die Merkmale in einer GG verteilt sind, deswegen werden zur wissenschaftlichen Analyse, Zufallsstichproben gebildet. Zuvor muss man die GG genau definieren, alle Merkmalsträger müssen die gleiche Chance haben in die Stichprobe zu kommen. Nach strengen Zufallskriterien wird dann eine Zufallsstichprobe gezogen, von der man annimmt, dass diese, wegen ihrer mathematischen Grundlage (Wahrscheinlichkeitsrechnung), die GG wiederspiegelt also repräsentativ ist. Frage 2: Stellen Sie kurz die vier Messniveaus von Daten dar und beschreiben Sie kurz deren Eigenschaften Nennen Sie für jedes Messniveau ein Beispiel. (8 Punkte Zeit ca 6 Minuten) 1. Nominalskala ist das unterste Skalenniveau und lässt lediglich die Aussagen zu ob 2 Merkmalsträger auf Grund der Merkmalsausprägung eines untersuchten Merkmals zu einer Gruppe gehören oder nicht, d.h. gleich sind oder nicht. Bsp: Geschlecht, 2 Personen sind entweder gleichen Geschlechtes oder nicht. 2. Ordinalskala lässt eine Rangfolge der gefundenen Merkmalsausprägungen zu, jedoch sind keine Aussagen über die Abstände zwischen den Rängen möglich. Bsp: Schulnoten 1-6, 1 ist besser als 2 aber die Abstände zwischen 1 und 2 sind ungleich dem Abstand zwischen 3 und 4. Es gibt also die Möglichkeiten der Aussage >,< und =. 3. Intervallskala ist das zweithöchste Skalenniveau neben den Eigenschaften der Ordinalskala ist es möglich eine Aussage über die Unterschiede zwischen den Merkmalsausprägungen zu machen, d.h. die Abstände sind überall gleich. Es gibt keinen natürlichen Nullpunkt. Wenn es einen Startwert gibt ist dieser willkürlich gewählt Bsp: Temperatur C°. 4. Verhältnisskala ist das höchste Skalenniveau neben allen Aussage Möglichkeiten die man mit einer Intervallskala tätigen kann ist es zusätzlich möglich Aussagen wie 2 ist doppelt so groß wie 1 zu machen. Erst ab diesem Niveau machen Multiplikationen und Divisionen Sinn, weil hier ein natürlicher Nullpunkt vorhanden ist. Bsp: Obstkiste mit Orangen, wenn sie leer ist keine Orangen also Nullpunkt.

Frage 3: Eine Fabrik stellt Neujahrsbrezeln her, die einen Durchmesser von genau 12 cm haben sollen. Stellen Sie dar, mit welcher Logik das Grundmodell des Signifikanztestens überprüft ob die Produktion eines bestimmten Tages diesen Anforderungen entspricht. (12 Punkte Zeit ca. 11min) Allgemein wird mit einem Signifikanztest, geprüft ob eine realisierte Stichprobe aus einer Grundgesamtheit stammt. In unserem Fall ist die Grundgesamtheit die gesamte Produktion eines bestimmten Tages. Da wir keine Vollerhebung durchführen können, weil dies zu aufwendig wäre, führen wir eine Stichprobe durch, in dem wir eine Zufallsauswahl treffen. Die Zufallsauswahl ist deshalb wichtig, weil jedes Element der GG die Möglichkeit haben muss in die Stichprobe zu kommen also jeder Merkmalsträger die gleiche Wahrscheinlichkeit hat gezogen zu werden. Bevor wir die Stichprobe durchführen, müssen wir allerdings erst mal unser Problem: wir wissen nicht ob unsere Produktion wirklich den Anforderungen entspricht, in eine statistisch überprüfbare Hypothese überführen. Dabei unterscheiden wir die Nullhypothese (H0) und die Alternativhypothese, nach der Logik des Signifikanztests untersuchen wir die H0, welche in diesem Fall aussagt, dass kein Unterschied zwischen der Stichprobe und der GG vorzufinden ist, also unsere Produktion den Vorgaben entspricht. Wenn wir diese Hypothese bejahen können, wir also keinen signifikanten Unterschied finden, gilt die H0 ansonsten greift die H1, die aussagt, dass es einen Unterschied gibt. Unter der Voraussetzung dass die Produktion normalverteilt ist (zu testen mit dem KolmogorowSmirnow-Anpassungstest) wird mit dem T-Test, der die Mittelwerte der Stichprobe mit den erwarteten Mittelwert der GG vergleicht, überprüft ob die Mittelwerte gleich oder ungleich sind. Dafür legen wir ein Signifikanzniveau von z.B. α= 0,05 fest. Dies bedeutet, wenn unser Mittelwert im Bereich von den äußeren 5% unserer Normalverteilung liegt können wir uns mit einer Irrtumswahrscheinlichkeit von 5% (umgekehrt mit einer Wahrscheinlichkeit von 95%) gegen die H0 entscheiden und feststellen, das es ein belastbares Ergebnis ist und somit die Mittelwertsunterschiede nicht zufällig sind. Frage 4: Welche Formen der Schichtung von Zufallsstichproben gibt es? Erklären Sie kurz das Vorgehen und den Zweck der Schichtung an jeweils einem Beispiel. (8 Punkte Zeit ca 6 Minuten)

Frage 5: Erklären Sie Ziel und Vorgehen der linearen Regressionsanalyse, gehen Sie dabei auch auf die Voraussetzungen für die Analyse ein. (12 Punkte ca. 11 Minuten) Die lineare Regressionsanalyse (RA) baut auf dem Zusammenhang zweier Variablen auf. Voraussetzungen einer linearen RA sind intervallskalierte Daten, Normalverteilung der Variablen, Homogenität der Varianzen, keine Autokorrelation der Variablen (zu prüfen mit dem DurbinWatson-Wert (muss zwischen 1,5 und 2,5 liegen)) und natürlich ein linearer Zusammenhang zwischen den Variablen. Bei der linearen Regressionsanalyse wird in die Punktwolke der zweidimensionalen Verteilung beider Merkmalsausprägungen eine Schätzfunktion als Ausgleichsgerade der Form y=b*x+a gelegt. Grundlage dieser Berechnungen bildet die Forderung, dass die Abstände zwischen den Messwerten der abhängigen Variable und den hierfür über die Ausgleichsgerade geschätzten Werten minimiert werden. Im Ergebnis führt dies also zu einer Funktion, aufgrund derer von xWerten auf y-Werte zu schließen ist. (Töpfer 2007a, S.817) Werden diese Schätzwerte sowie die beobachteten Werte der abhängigen Variable y im Hinblick auf ihre Streuung um den arithmetischen Mittelwert analysiert, kann man daraus das Bestimmtheitsmaß als ein Gütekriterium der durchgeführten Regressionsrechnung ermitteln. Hiermit lässt ich die Aussage treffen, ein wie großer Teil der Varianz der beobachteten y-Werte durch die Regressionsschätzung erklärt wird (vgl. Backhaus et al. 2006,S64ff.) Ziel der Regressionsanalyse ist die Prognose von Werten in Abhängigkeit einer Variablen. Dies geschieht auf Grund von bekannten Korrelationen. Zunächst wird also der Zusammenhang zweier Variablen analysiert und auf Grundlage der erkannten Korrelation eine Gerade berechnet, die sich durch den Punkteschwarm im Streudiagramm zieht. Diese Regressionsgerade wird mit Hilfe der Methode der kleinsten Quadraten also den quadrierten Abweichungen zwischen den einzelnen Punkten und der Geraden, einwickelt. So erhält man eine Gerade der Normalform y=bx+a (+e) wobei b die Steigung ist, a die konstante und e der Vorhersagefehler. Anhand dieser Gerade, kann man dann eine ungefähre Vorhersage vornehmen. Zur weiteren Überprüfung der Aussagekraft des Ergebnisses werden noch weitere Kennwerte bestimmt. Zum einen das Bestimmtheitsmaß R², dass den Anteil der erklärten Varianz durch die Regressionsanalyse wiederspiegelt, es gilt je höher R² desto aussagekräftiger kann man die Daten interpretieren. Das korrigierte R² gibt dies noch genauer an, es beziffert das erklärbare Schwankungsverhalten der abhängigen Variable, also wie stark die unabhängige die abhängige beeinflusst. Wenn man über den T-test herausgefunden hat, ob ein Wert signifikant ist (wert...


Similar Free PDFs