Statistik I - Zusammenfassung PDF

Title Statistik I - Zusammenfassung
Course Statistik 1
Institution Universität Bern
Pages 6
File Size 160 KB
File Type PDF
Total Downloads 11
Total Views 133

Summary

Zusammenfassung...


Description

Anzahl

Statistik Variablen I

Bivariat

Univariat

Unterschiede in der Lage (MW, Median, Quantile)

Veränderung relativer Anteile

Binomialtest

Nicht approx. normalverteilt

Nachweisen, dass Stichprobe anderst verteilt als vermutet

Approx. Normalverteilt Chiquadrat Anpassungstest

Vorzeichentest (Mediantest)

t-Test (wenn Standardab weichung in der Pop. nicht bekannt)

z-Test (wenn Standardab weichung in der Pop. bekannt)

Zshg. zw. binärem und kategoriellem Merkmal anhand von Stichprobenhä ufigkeit

Zshg. zw. 2 binären Merkmalen anhand von Chancenquotie nt (Odds Ratio)

Chiquadrat Unabhängigkeit stest

Fisher's exakter Test

Zshg. zw. numerischem und binärem Merkmal anhand eines MWvergleichs

t-Test im 2Stichprobenf all oder Wilcoxons Rangsument est

Zshg. zw. numerischem und kategoriellem Merkmal anhand eines Var Vergleichs

Verbundene Stichproben

F-Test

"paired" tTest

Allg. zu Tests Äquivalentstests Mann kann bei den meisten Tests wählen, ob man zeigen möchte, dass der wahre Wert in der Population grösser als, kleiner als oder ungleich ein bestimmter Wert ist. Was nicht geht, ist zu zeigen, dass er genau = diesem Wert ist. Dafür müsste man sich vor dem Test einen Intervall festlegen, in dem man seinen Wert tolerieren würde. Dieses Toleranzintervall muss nun vollständig im KI enthalten sein, damit man von einer ungefähren Äquivalents sprechen kann. Fehler erster- und zweiter Art Fehler erster Art: Man verwirft eine eigentlich wahre Nullhypothese Fehler zweiter Art: Man verwirft eine eigentlich falsche Nullhypothese nicht Wir ein Test auf dem Signifikanzniveau durchgeführt begeht man in höchstens etwa * 100% aller Fälle einen Fehler erster Art. Die Wahrscheinlichkeit , einen Fehler zweiter Art zu begehen ist unbekannt, nimmt aber mit zunehmender Stichprobengrösse ab. Die Gegenwahrscheinlichkeit 1-eines Fehlers zweiter Art wird die Power des Tests genannt. Über- und unterpowerte Tests Bei einem unterpowerten Test ist die Stichprobe zu klein, was dazu führen kann, dass eine deskriptiv starke Abweichung von der Nullhypothese doch nicht als signifikant erkannt wird  Fehler zweiter Art. Bei einem überpowerten Test (extrem grosse Stichprobe) kann schon eine marginale Abweichung zu grosser Signifikanz führen  Signifikanz ist ungleich Relevanz Multiples Testen Bei jedem Test kann ein Fehler erster- oder zweiter Art vorkommen. Wenn nun für die Beantwortung einer Fragestellung mehrere Tests notwendig sind, muss demnach das Signifikanzniveau angepasst werden. Dies passiert, indem man das Signifikanzniveau durch die Anzahl gewünschter Tests m teilt. Bsp: Man möchte eine Hypothese auf dem 5% Niveau testen, muss dazu aber zwei Tests anweden. Mit Bonferroni Korrektur müssen dazu die zwei einzelnen Tests je auf 5/2 = 2.5 Niveau getestet werden. Alternativ könnte der p-Wert auch mit 2 multipliziert werden.

Binomialtest Kurzbeschreibung / Beispiel Beim Binomialtest wird die Veränderung des relativen Anteils eines binären Merkmals geprüft. Schätzer für den wahren Wert in der Population ^p („p-Hut): relativer Anteil der zu untersuchenden Ausprägung in der Stichprobe. Bsp: relativer Anteil der Ecopop Befürworter in der Stichprobe Berechnung des Schätzers Anzahl günstiger Ausprägungen / n Prüfung via Konfidenzintervall anstatt Test Erstellung eines zweiseitigen KI via Software: Überprüfung, ob Schätzer in KI enthalten. Wenn nein  H0 kann verworden werden Einseitig / zweiseitig / beides möglich? Beides möglich:  Einseitig: Der effektive Anteil ist < / > als der damit zu vergleichende (früher gemessene) Wert  Zweiseitig: Der effektive Anteil ist ungleich

Vorzeichentest (Mediantest) Kurzbeschreibung / Beispiel Die Software erstellt ein Konfidenzintervall einer Stichprobe mit unbekannter Verteilung für ein gewünschtes Quantil. So kann z.B. auch geprüft werden, ob sich die teuersten 10% (90%-Quantil) der Mieten erhöht haben. Einseitig / zweiseitig / beides möglich? Sowohl zweiseitiges KI (der gemäss H1 zu beweisende Betrag, also im Bsp CHF 1000, ist nicht enthalten  H0 verwerfen) als auch untere oder obere KS (Schranke ist über / unter dem zu untersuchenden Betrag)

t-Test im Einstichprobenfall Kurzbeschreibung / Beispiel Der t-Test möchte beweisen, dass der MW der vorliegenden Stichprobe (numerische Merkmale) im Vergleich zur Population verdächtig gross oder verdächtig klein ist. Der Test kann nur bei normalverteilten oder gem. ZGwS approx. normalverteilten Stichproben angewendet werden. Schätzer für den wahren Wert in der Population Stichproben MW („ X quer“) für den wahren Wert in der Population Prüfung via Konfidenzintervall anstatt Test Meistens untere KS: Wenn > / < als der Stichproben-MW kann H0 verworfen werden Bsp: StichprobenMW der durch Prostituierten entjungferten < untere KS  H0 verwerfen Einseitig / zweiseitig / beides möglich? Beides möglich

z-Test Kurzbeschreibung / Beispiel Gleicher Ansatz wie t-Test nur weniger genau, der der Stichprobenmittelwert nicht studentisiert (unabhängig von der Stichprobengrösse) ist. Gleich genau wie t-Test, wenn die Standardabweichung der Population bekannt, da so der Effekt der Studentisierung wegfällt.

Chiquadrat Anpassungstest

Kurzbeschreibung / Beispiel

Mit diesem Test kann gezeigt werden, dass ein kategorielles Merkmal anders verteilt ist als vorgegeben / erwartet ACHTUNG: Kann NICHT beweisen, dass das Merkmal eine spezifische Verteilung hat, sondern eben nur, dass es eine gewisse Verteilung nicht hat. Schätzer für den wahren Wert in der Population Chiquadrat Teststatistik. Dieser Wert wird (wie bei Teststatistiken üblich) mit der durch die Software vorgegebenen kritischen Schranke verglichen. Wenn der Wert der Teststatistik grösser ist als die krit. Schranke, kann H0 verworfen werden. Berechnung des Schätzers Summe der quadrierten Pearson Residuen (Formel in der Formelsammlung) Prüfung via Konfidenzintervall anstatt Test NEIN

Chiquadrat Unabhängigkeitstest Kurzbeschreibung / Beispiel Mit diesem Test wird geprüft, ob ein Zusammenhang zwischen zwei kategoriellen Merkmalen besteht Schätzer für den wahren Wert in der Population Cramérs V . Für dieses Cramérs V wird eine untere KS von der Software berechnet. Wenn diese untere KS 0 nicht enthält ist das echte Cramérs V in der Population anhand der Daten in unserer Stichprobe nicht mit H0 vereinbar  Diese kann verworfen werden Berechnung des Schätzers Via Chiquadrat Teststatistik, die sich wiederum durch die Pearson Residuen der erwarteten und beobachteten Häufigkeiten der Kategorien beider Merkmale ergeben (Formel in der Formelsamlung). Zu erwähnen ist, dass ein Cramérs V Wert von > 0,1 für einen leichten und > 0,3 für einen deutlichen Zusammenhang spricht. Einseitig / zweiseitig / beides möglich? Meistens untere KS, es kann jedoch auch ein zweiseitiges KI berechnet werden, das dann einfach 0 nicht enthalten darf. Der Test an sich ist aber immer ungerichtet: Er beweist nur, ob es einen Zusammenhang gibt oder nicht.

Fisher’s exakter Test Kurzbeschreibung / Beispiel Dieser Test beweist den Zusammenhang zweier binärer Merkmale. Bsp: Es soll bewiesen werden, dass ein Zusammenhang zwischen der Anwesenheit von Gollum und dem einen Ring (TCS Flasche) besteht. Schätzer für den wahren Wert in der Population Als Schätzer wird der Chancenquotient (Odds Ratio verwendet). Diese drückt aus, wieviel mal grösser die Chance ist, eine Kategorie des einen Merkmals in Kombination mit einer Kategorie des anderen Merkmals anzutreffen als diejenige dieselbe Kategorie mit einem anderen Merkmal anzutreffen. Berechnung des Schätzers Zuerst wird eine Vierfeldertafel der beiden Merkmale aufgestellt. Danach multipliziert man die Werte übers Kreuz und teilt die Produkte durcheinander: W

X

Y

Z...


Similar Free PDFs