Bootstrap PDF

Title Bootstrap
Course Statistik
Institution FernUniversität in Hagen
Pages 5
File Size 367.1 KB
File Type PDF
Total Downloads 14
Total Views 166

Summary

Zusammenfassung der Bootstrap Vorlesung für Psychologie M2...


Description

Der Bootstrap Agenda • • • •

Der Bootstrap " Einführung" Vorteile von Bootstrap-Methoden " Der Bootstrap in SPSS "

Basisliteratur: Kapitel 19 aus Sedlmeier & Renkewitz, 2013 " "

Grundlagen statistischer Inferenz •

Stichprobenstatistik (z.B. Mittelwert) dient als Schätzer für einen Populationsparameter "



Stichprobenverteilungen bilden die Grundlage der Inferenzstatistik "



Die Größe des Standardfehlers (Standardabweichung der Stichprobenverteilung) zeigt die Genauigkeit der Schätzung an"



Standardfehler werden für die inferenzstatistische Absicherung verwendet: Parameterschätzer / Standardfehler "



Standardfehler ermöglichen das Berechnen von Konfidenzintervallen "

Form der Stichprobenverteilung? •

Verschiedene Möglichkeiten zur Bestimmung der Form einer Stichprobenverteilung (Rodgers, 1999): " • 1) #Population ist bekannt (direkt beobachtbar) ==> Stichprobenverteilung kann exakt bestimmt werden (optimal, auch wenn eigentlich nicht notwendig) $ • 2) #Verwendung von vereinfachenden Annahmen über die Verteilung von Werten in der Population ==> Mathematische Bestimmung einer Stichprobenverteilung (parametrische Testverfahren) $ • 3) #Empirische Bestimmung der Stichprobenverteilung ==> Verwendung von sogenannten Resampling-Techniken (Bootstrap, Jackknife, Kreuzvalidierung, Permutationstest) $



Möglichkeit 4: Wiederholte Ziehung von Zufallsstichproben aus einer Population "



Möglichkeit 3 (Resampling) erst wirklich nutzbar durch die weiter steigende und für jedermann/frau verfügbare Computerleistung "



Allen Resampling-Techniken ist die Generierung der Stichprobenverteilung basierend auf einer Stichprobe gemein "



Resampling-Techniken basieren auf weniger restriktiven Annahmen als parametrische"

1 von 5

Einführung in die Bootstrap-Methode •

Bootstrap = „to pull oneself up by one‘s bootstrap“ (Efron & Tibshirani, 1993) "



„Am eigenen Schopf aus dem Sumpf ziehen“ (Baron von Münchhausen) "



Eine auf den Daten basierende Simulationsmethode, die zur statischen Inferenz genutzt werden kann (Efron, 1979) "

Was ist der Bootstrap? •

“The bootstrap procedure is a means of estimating the statistical accuracy . . . from the data in a single sample. The idea is to mimic the process of selecting many samples . . . in order to find the probability that the values of their (test statistics) fall within various intervals. The samples are generated from the data in the original sample. . . . The data. . . are copied an enormous number of times, say a billion (for each group). . . . Samples . . . are then selected at random and the (test statistic) is calculated for each sample. . . . The distribution of the (test statistic) for the bootstrap samples can be treated as if it were a distribution constructed from real samples” (Diaconis & Efron, 1983, p. 120; Hervorhebungen nicht im Original). "



In der Praxis werden die Daten nicht “milliardenfach” kopiert, sondern wiederholt Stichproben mit Zurücklegen gezogen, um Stichproben der gleichen ursprünglichen Größe zu simulieren "

Schematische Darstellung des Bootstrap (aus Efron & Tibshirani, 1993, S. 13) "

"

Ein Beispiel - Korrelation •

Voraussetzung für die inferenzstatistische Absicherung einer Korrelation zwischen zwei metrischen Variablen ist die bivariate Normalverteilung "



Plausibilität der Annahme?"



Lösung: Bestimmung der Stichprobenverteilung mit dem Bootstrap " • Programm „Resampling Procedures“ von Howell (2001; verwendet in Howell, 2010) "

2 von 5

"

Vorteile von Bootstrap-Methoden • Der Bootstrap kann im Grunde bei allen inferenzstatistischen Testverfahren angewandt werden (z.B. t-Test, Regression) $ • Beruht auf weniger restriktiven Annahmen als parametrische Verfahren " • Keine Verteilungsannahmen notwendig (aber möglich; non-parametrischer versus $ parametrischer Bootstrap) " • Die Stichprobe sollte aber repräsentativ für die Population sein $ • Schätzung von unterschiedlichen Populationsparametern möglich (z.B. Median), für die die Stichprobenverteilung mathematisch nicht (oder nicht exakt) bestimmbar sind $

3 von 5

Der Bootstrap in SPSS

"

"

4 von 5

Der Bootstrap in SPSS "

"...


Similar Free PDFs