Übungsaufgaben Statistik PDF

Title Übungsaufgaben Statistik
Author Jan Felix
Course Statistik
Institution Christian-Albrechts-Universität zu Kiel
Pages 12
File Size 413.9 KB
File Type PDF
Total Downloads 64
Total Views 129

Summary

Übungsaufgaben für Statistik...


Description

Einführung in die Statistik Übungsaufgaben Aufgabe 1 Berechnen Sie folgende Summen! 3

a)

 2i

8

2

b)

i 1

2

10

 3a  11)

c)

a 5 3 2

10

d)

 (a

 (i  1)(i  1)  10

e)

i 1

2( ij 1) i1 j1

 (i  1)(i 1) 10 i1 3

f)

3

  (3i  2 j ) i 1 j 1, j i

Punkte: 1 Aufgabe 2 Stellen Sie folgende Terme mit Hilfe des Summenzeichens dar! a) 1 + 4 + 9 + 16 + 25 + 36 + 49

b) 20 + 22 + 24 + 26 c) 1 -

1 1 1 1 1 + - + + ... 3 5 7 9 11

d) 1 + 2 + 4 + 8 + 16 + 32 e) 4 + 7 + 13 + 25 + 49 + 97 Punkte: 1 Aufgabe 3 Gegeben sind folgende Durchschnittswerte (in mm) für den Niederschlag in den Jahren 19611990. Ort / Monat Kiel Hamburg Berlin Rom London Athen

Jan Feb Mä r Apr Mai Jun Jul Aug Sep Okt Nov Dez 61 37 47 49 53 65 88 70 64 65 83 73 65 42 63 46 54 77 75 73 68 64 69 78 43 36 41 38 53 67 55 62 45 37 45 57 81 74 64 50 42 21 19 37 74 94 105 94 78 53 60 54 55 58 44 55 67 73 76 80 44 48 42 29 18 10 3 4 12 50 51 66

Schreiben Sie mit Hilfe des Summenzeichens und berechnen Sie! a) den Jahresniederschlag in Kiel b) den Gesamtniederschlag in Rom und Athen in den ersten sechs Monaten des Jahres c) den Gesamtjahresniederschlag aller sechs Messstationen d) den durchschnittlichen monatlichen Niederschlag in Berlin Punkte: 1

Aufgabe 4 Welche Variablentypen entsprechen den folgenden Merkmalen? a) Automarken b) Temperatur (in Grad Celsius) c) Temperatur (in Kelvin) d) Schulnoten (in sehr gut, gut, …, ungenügend) e) Schulnoten (in 1,2,...,6) f) Schwierigkeitsgrad einer Skilanglaufstrecke (in blau, rot, schwarz) g) Körpergewicht (in kg) h) BMI (in kg/m2)

Punkte: keine Aufgabe 5 Bei der Bundestagswahl 2002 erhielt die SPD 18.488.668 Zweitstimmen, die CDU 14.167.561, die CSU 4.315.080, die Grünen 4.110.355, die FDP 3.538.815 und die PDS 1.916.702. Insgesamt gab es 47.996.480 gültige Stimmen. Stellen die diese Daten (in %) als Balkendiagramm dar!

Punkte: 1 Aufgabe 6 Gegeben seien folgende Daten (in mm). Messung Radius

1 4,31

2 0,5

3 4 5 6 7 8 9 10 1,72 10,01 0,03 12,13 0,33 0,59 5,01 0,16

Messung 11 12 13 Radius 11,26 8,91 1,89

14 2,38

15 8,19

16 6,19

17 18 19 20 5,98 3,09 2,67 1,58

a) Berechnen Sie den Mittelwert und die Standardabweichung dieser Messungen! b) Berechnen Sie die Quantilreihe (xmin, x0,25, x0,5, x0,75, xmax)! c) Interpretieren Sie sämtliche Werte! Punkte: 1 Aufgabe 7 Für zwei verschiedene Tierarten liegen folgende Stichproben von Gewichten (in g) vor.

Junge Meerschweinchen: Erwachsene Labormäuse:

300, 260, 250, 290, 295, 285 31, 33, 33, 28, 29, 32

Ermitteln Sie jeweils die Standardabweichung und den Variationskoeffizienten und interpretieren Sie das Ergebnis! Punkte: 0,5

n ist die Fallzahl, wie oft ich welchen wert geerntet habe. die summe aller n sind anzahl der pazellen Aufgabe 8 Gegeben seien folgende Ertragsdaten (in kg). i xi

1 380

2 535

3 645

4 720

5 860

ni

1

5

4

1

3

6 7 8 930 1050 1100 7

2

3

i 9 10 11 12 13 14 15 16 xi 1200 1340 1425 1540 1625 1840 1950 2055 ni 2 3 4 5 2 4 2 2

a) Zeichnen Sie ein (aussagekräftiges) Histogramm! b) Zeichnen Sie einen zugehörigen Boxplot! Punkte: 1 Aufgabe 9 Welche Verteilungen liegen den folgenden Merkmalen (höchstwahrscheinlich) zugrunde? a) Anzahl toter Insekten (von insgesamt 10 pro Pflanze) nach einer Insektizidbehandlung b) Wuchshöhe von Mais (in cm) c) Anzahl Insekten pro Blüte und Tag d) Gewicht von 14-jährigen Kindern (kg) e) Längenzuwachs von Acker-Pflanzen zum Vorjahr (in cm) f) Nitratgehalt in Lebensmitteln (in sehr gering/gering/hoch/sehr hoch) g) BMI (in kg/m2)

Punkte: keine Aufgabe 10 Skizzieren Sie grob a) die Dichte der Standardnormalverteilung! b) die Dichte der Normalverteilung mit Erwartungswert 5 und Varianz 1! c) die Dichte der Normalverteilung mit Erwartungswert 5 und Varianz 2! d) die Dichte der Normalverteilung mit Erwartungswert 5 und Varianz 0,5!

Punkte:0,5 Aufgabe 11 Zeichnen Sie (grob) jeweils die Dichte und einen möglichen zugehörigen Boxplot einer a) rechtsschiefe (linksgipflige) Verteilung! b) linksschiefe (rechtsgipflige) Verteilung! c) Was bedeuten diese Verteilungsformen in der Praxis?

Punkte: 0,5

Aufgabe 12 Für 20 zufällig ausgewählte Testpersonen wurde jeweils die Zeit (in min) gemessen, die diese zur Verrichtung eines normierten Arbeitsganges benötigt haben. Person 1 2 3 4 5 6 7 8 9 10 Zeit 61 58 58 59 62 61 59 51 59 57 Person 11 12 13 14 15 16 17 18 19 20 Zeit 55 49 47 60 59 53 41 58 56 55

a) Fertigen Sie ein zugehöriges Histogramm an! b) Welche Aussagen können mittels dieser Ergebnisse über die zu erwartende Verteilung des Merkmals gemacht werden? Punkte: 0,5 Aufgabe 13 Betrachten Sie das Beispiel zum Zweistichproben-t-Test aus der Vorlesung! Zur Überprüfung der Ergebnisse wurde ein ähnlicher Versuch an der CAU wiederholt und ergab folgende Messwerte (in cm).

unter Licht 8 43 32 6 41 39 47 52 33 7 bei Dunkelheit 23 11 8 11 36 35 20 41 16 19 Diese werden wieder als varianzhomogen und normalverteilt betrachtet. Kann dieser Versuch die bisherigen Ergebnisse bekräftigen? a) Testen Sie, ob die Wurzellängen unter Licht vergrößert sind. b) Berechnen Sie das zugehörige Konfidenzintervall. c) Interpretieren Sie die Ergebnisse aus a) und b) und vergleichen Sie diese mit denen aus dem Skript. Punkte: 1 Aufgabe 14 An der CAU wurde von insgesamt 16 Studierenden der BMI berechnet. Dabei wurde nach Geschlecht unterschieden. Es ergaben sich folgende Messwerte (in kg/m2).

männlich 29,6 28,2 35,0 30,9 20,8 29,3 20,1 21,8 30,1 weiblich 26,0 26,5 26,1 16,2 18,8 30,8 32,7 Diese werden als varianzhomogen und normalverteilt betrachtet. a) Berechnen Sie die Mittelwerte, Varianzen sowie die Quantilreihen (xmin, x0,25, x0,5, x0,75, xmax) dieser Stichprobe und interpretieren Sie sämtliche Werte! b) Zeichnen Sie den zugehörigen Boxplot und diskutieren Sie, ob die Annahmen (Normalverteilung, Varianzhomogenität) gerechtfertigt sind! Punkte: 1

Aufgabe 15 Für die Daten aus obiger Aufgabe: a) Testen Sie, ob sich die BMI von Männern und Frauen unterscheiden! b) Berechnen Sie das zugehörige Konfidenzintervall! c) Interpretieren Sie die Ergebnisse aus a) und b)! d) Welche grobe Schlussfolgerung ergibt sich zur Größe des zugehörigen p-Wertes?

Punkte: 1 Aufgabe 16 Betrachten Sie das Beispiel zum Zweistichproben-t-Test aus Aufgabe 14 bzw. 15 und führen Sie einen Welch-t-Test durch! Worin unterscheiden sich t-Test und Welch-t-Test?

Punkte: 1 Aufgabe 17 Erstellen Sie ein (sinnvolles!) Baumdiagramm der bisher durchgenommenen Testverfahren! (Hinweis: Dieses soll in folgenden ÜS noch erweitert werden.)

Punkte: keine Aufgabe 18 Die Gewichtszunahme bei Mastkälbern kann als normalverteilt angenommen werden. 20 Kälber erhalten Futter mit unterschiedlichem Proteingehalt: 11 Kälber erhalten Futter mit Proteingehalt 1 und 9 Kälber mit Proteingehalt 2. Für die Gewichtszunahme Xi bei Proteingehalt 1 und Yi bei Proteingehalt 2 wurden folgende Werte (in kg) gemessen.

Xi

85

97

53

68

75 112

76

63

64

Yi

45

68

61

59

82

43

47

56

70

82

83

a) Es soll bei einer Irrtumswahrscheinlichkeit von α = 0.05 untersucht werden, ob die Gewichtszunahme bei Mastkälbern vom Proteingehalt des Futters abhängt. Dabei gehe man davon aus, dass man nichts über die Varianzsituation weiß. b) Berechnen Sie das zugehörige Konfidenzintervall und interpretieren Sie es! c) Was würde sich am Testverfahren ändern, wenn man den Daten homogene Varianzen unterstellen würde (ohne Rechnung)? Punkte: 1 Aufgabe 19 Bei 5 Personen wurde der Hautwiderstand jeweils zweimal gemessen, einmal bei Tag (X) und einmal bei Nacht (Y). Man erhielt für die Messgröße Hautwiderstand folgende Daten.

Xi

25

30

20

27

23

Yi

19

26

14

23

18

Die Vermutung der Forscher geht dahin, dass der Hautwiderstand nachts absinkt. Lässt sich diese Vermutung durch die vorliegende Untersuchung erhärten? a) Testen Sie zu α = 0.05 und unter der Voraussetzung, dass die Daten normalverteilt sind! b) Welche grobe Schlussfolgerung ergibt sich zur Größe des zugehörigen p-Wertes? Punkte: 1 Aufgabe 20 Um die Wirkung von Vitamin B1 auf die Wachstumsförderung von Pilzen festzustellen, wurden von 24 Pilzen N=13 zufällig ausgewählte mit Vitamin B1 behandelt, die restlichen M=11 blieben unbehandelt. Es ergaben sich folgende Daten (in g):

xi 27 33 20.5 29.5 20 1) 28 20.1 1) 26.5 22 2) 24.5 34 35.5 19

yj 18 14.5 13.5 12 22.5 2) 24 21 17 18.5 9.5 14

Es stellt sich die Frage, ob die Vitaminbehandlung zu einem (signifikant) veränderten Pilzgewicht führt, d.h. H0: F1 = F2 vs. H A: F1 F2. Die Daten seien varianzhomogen, die Verteilungen unbekannt, aber stetig. Führen Sie den Rangsummentest von Wilcoxon zum Niveau α = 0.05 durch und entscheiden Sie, ob H0 abgelehnt werden kann, indem als kritische Werte a) Tabellenwerte (exakt) bzw. b) Approximationen mittels der Standardnormalverteilung benutzt werden! Punkte: 1 Aufgabe 21 a) Führen Sie bei gleichen Voraussetzungen und gleichem α wie in obiger Aufgabe den U-Test durch. Wie sieht die Entscheidung jetzt aus? b) Nachträglich ist aufgefallen, dass jemand sich verschrieben hatte beim Ausfüllen der Tabelle. Korrigieren Sie die oben mit 1) und 2) gekennzeichneten Werte zu 20 bzw. 22! Ändert sich die Entscheidung des Wilcoxon-Tests, wenn man die Bindungen mit in Betracht zieht?

Punkte: 1

Aufgabe 22 Bei einem Versuch mit Erbsen beobachtete Mendel 315 runde gelbe, 108 runde grüne, 101 runzlige gelbe und 32 runzlige grüne. Nach seiner Vererbungstheorie sollen die Anzahlen im Verhältnis 9 : 3 : 3 : 1 zueinander stehen. Besteht irgendein Grund, seine Theorie bei einer Irrtumswahrscheinlichkeit von (a) 0.05, (b) 0.01 in Zweifel zu ziehen?

Punkte: 1 Aufgabe 23 Zwei Gruppen, A und B, die jeweils aus 100 Pflanzen bestehen, leiden an einer Krankheit. Man gibt Gruppe A ein Heilmittel, aber nicht Gruppe B (die man Kontrollgruppe nennt). In jeder anderen Hinsicht werden die beiden Gruppen gleich behandelt. Es stellt sich heraus, dass sich in den Gruppen A und B 75 bzw. 65 Pflanzen wieder erholen. a) Man teste die Hypothese, dass das Mittel bei der Heilung der Krankheit hilft, und zwar bei einer Irrtumswahrscheinlichkeit von (i) 0.05, (ii) 0.025 und (iii) 0.01! b) Man löse vorhergehende Aufgabe unter Benutzung der Korrektur von Yates!

Punkte: 1 Aufgabe 24 In einer zufällig ausgewählten Packung (300g) befinden sich folgende, nach Geschmacksrichtung sortierte Anzahlen von Gummibären.

Geschmack Anzahl

Himbeer 42

Erdbeer 17

Orange 14

Zitrone 16

Ananas 24

Apfel 19

Überprüfen Sie mit Hilfe eines entsprechenden Tests zu α = 0.05 die Hypothese, dass alle Farben gleichverteilt, also im Verhältnis 1:1:1:1:1:1 vorkommen! Punkte: 1 Aufgabe 25 Von 10 Probanden wurden Blutdruck, Cholesterin-Spiegel und Alter erhoben.

Proband i Blutdruck Z1i Cholesterinspiegel Z2i Alter Z3i

1 129 220 47

2 117 195 38

3 120 200 25

4 150 240 52

5 148 260 60

6 140 218 51

7 125 205 48

8 157 270 70

9 130 185 34

10 145 225 50

Anhand dieser Daten sollen diverse Korrelationskoeffizienten ermittelt werden. a) Berechnen Sie für Z1/Z3 und Z2/Z3 den Korrelationskoeffizienten nach Pearson sowie das Bestimmtheitsmaß! b) Testen Sie einseitig die Signifikanz der Korrelationskoeffizienten! c) Es wird eine Scheinkorrelation zwischen Z1 und Z2 angenommen. Berechnen Sie deswegen die partielle Korrelation r(Z1,Z2)|Z3! d) Berechnen Sie den Rangkorrelationskoeffizienten nach Spearman für Z1/Z3 und Z2/Z3! Punkte: 1,5 für a+b, 1 für c+d

Aufgabe 26 Für 9 Nachkommen einer Kreuzung von Rebsorten haben zwei Kellermeister (Gutachter) Qualitätsränge wie folgt vergeben.

Nachkommen i Kellermeister A Kellermeister B

1 1 3

2 4 4

3 6 5

4 2 1

5 5 9

6 7 7

7 3 2

8 9 8

9 8 6

Der (lineare) Zusammenhang zwischen den Bewertungen der Kellermeister soll mittels Korrelationsanalyse beschrieben werden. a) Berechnen Sie hierfür den Korrelationskoeffizienten nach Spearman! b) Als p-Wert eines zugehörigen zweiseitigen Signifikanztests des Korrelationskoeffizienten ergibt sich Wert von 0.02139. Interpretieren Sie vor diesem Hintergrund den unter a) berechneten Wert! Punkte: 1 Aufgabe 27 Bei N=40 Personen wurden Länge X (in cm) und Gewicht Y (in kg) gemessen. Die Daten bzw. deren Residuen werden als normalverteilt angenommen.

Welchem Modelltyp (1 oder 2) entsprechen die Daten? Berechnen und interpretieren Sie a) die Schätzer a und b für die Regressionskoeffizienten  und ! b) die Schätzung der Reststreuung sR2 sowie der Streuung von b, sb2! c) das zweiseitige 95%-Konfidenzintervall für ! d) den Test für die Hypothese H0: = 0 vs. HA: 0! e) das Bestimmtheitsmaß! f) Interpretieren Sie den zugehörigen Residuenplot (siehe unten)!

Länge 175 175 184 180 173 173 184 179 168 183 178 185 180

Gewicht 75 73 74 82 77 70 88 68 60 82 79 86 64

Länge 175 173 180 185 170 178 166 168 160 157 158 163 168 170

Gewicht 70 64 91 84 81 72 67 66 45 47 61 57 57 69

Länge 163 158 166 167 161 172 156 162 168 160 156 164 173

Gewicht 76 54 61 62 51 62 50 63 56 72 60 81 65

Punkte: 1 Aufgabe 28 Die Reaktionszeit von insgesamt 9 Probanden wurde unter Alkoholeinfluss getestet. Es wird ein linearer Zusammenhang angenommen zwischen Reaktionszeit (in s) und Alkoholmenge (in ‰). Die Daten lauten wie folgt.

Proband Alkoholmenge Reaktionszeit

1 0.4 0.40

2 0.4 0.39

3 0.4 0.48

4 0.8 0.58

5 0.8 0.66

6 0.8 0.79

7 1.2 0.88

8 1.2 1.01

Führen Sie analog zur vorherigen Aufgabe a) - e) eine Regressionsanalyse durch! f) Welche Reaktionszeit könnte man bei 0.6‰ erwarten? Punkte: 1

9 1.2 0.90

Aufgabe 29 Von 15 amerikanischen Frauen zwischen 30 und 39 Jahren wurden Größe X (in inch/ Zoll) und Gewicht Y (in lb/ Pfund) gemessen. Die Daten bzw. deren Residuen werden als normalverteilt angenommen.

Welchem Modelltyp (1 oder 2) entsprechen die Daten? Berechnen und interpretieren Sie a) die Schätzer a und b für die Regressionskoeffizienten  und ! b) die Schätzung der Reststreuung sR2 sowie der Streuung von b, sb2! c) das einseitige (positiv) 95%-Konfidenzintervall für ! d) den Test für die Hypothese H0: ≤ 0 vs. HA:  > 0! e) das Bestimmtheitsmaß! f) Interpretieren Sie die zugehörigen Residuenplots (siehe unten)! Was wird hieran für diese Daten besonders deutlich?

woman height weight

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 115 117 120 123 126 129 132 135 139 142 146 150 154 159 164

Punkte: 1 Aufgabe 30 Gegeben seien die Daten aus obiger Aufgabe. Führen Sie nun eine Korrelationsanalyse durch! a) Bestimmen und interpretieren Sie den zugehörigen Korrelationskoeffizienten! b) Testen Sie einseitig (positiv) die Signifikanz des Korrelationskoeffizienten und berechnen Sie das Bestimmtheitsmaß! c) Vergleichen und interpretieren Sie die Ergebnisse mit denen aus obiger Aufgabe!

Punkte: 1 Aufgabe 31 Erstellen Sie analog zu Aufgabe 17 ein (sinnvolles!) Baumdiagramm der weiteren, bisherigen Testverfahren aus der Vorlesung!

Punkte: keine Aufgabe 32 Der Einfluss von Licht auf das Wurzelwachstum von Senf-Setzlingen (Wurzellänge in cm) soll untersucht werden (Beispieldaten des Zweistichproben-t-Tests der Vorlesung).

unter Licht bei Dunkelheit

21 39 31 13 52 39 55 50 29 17 22 16 20 14 32 28 36 41 17 22

Hat die Belichtung Einfluss auf die Wurzellängen? a) Analysieren Sie die Daten mittels Einweg-ANOVA! b) Vergleichen Sie die Ergebnisse mit denen des entsprechenden t-Tests aus der Vorlesung! Punkte: 1 Aufgabe 33 In einem Gewächshausversuch wurde die Stängellänge (in cm) einer Löwenzahnsorte mit drei Wiederholungen auf fünf unterschiedlichen Substraten und mit zwei Düngern analysiert. Untersuchen Sie die Daten mittels einer zweifachen ANOVA, balancierter Fall, Wechselwirkungen (WW) möglich, alle Aussagen zum 5% Niveau gesichert!

Wdh. 1 32,70 32,10 35,70 36,00 31,80 38,20 32,50 37,50 35,80 32,90

Wdh. 2 32,30 29,70 35,90 34,20 28,00 37,70 31,10 39,50 33,20 33,10

Wdh. 3 31,50 29,10 30,10 31,20 29,20 31,90 29,70 31,00 31,10 35,30

Substrat 1,00 2,00 3,00 4,00 5,00 1,00 2,00 3,00 4,00 5,00

Dünger 1,00 1,00 1,00 1,00 1,00 2,00 2,00 2,00 2,00 2,00

Punkte: 1 Aufgabe 34 Vollziehen Sie das Bsp. der Vorlesung (Multiple Vergleiche) nach! a) Vergleichen Sie alle Stämme miteinander und mittels Bonferroni-adjustierten, multiplen t-Tests! Hinweis: Greifen Sie auf die entsprechenden Mittelwerte und MQR aus der Einweg-ANOVA zurück, sowie auf das zugehörige t-Quantil aus der Vorlesung! (Es sollen im Gegensatz zur Vorlesung alle 15 Teststatistiken berechnet und ausgewertet werden.) b) Berechnen Sie zusätzlich auch die entsprechenden simultanen Konfidenzintervalle und zeichnen Sie diese skizzenhaft!

Punkte: 1 Aufgabe 35 Ziel eines Versuchs ist es herauszufinden, ob fünf verschiedene Erden einen Einfluss auf die Löwenzahnstängellänge (in cm) haben, und wenn ja, welche Erden sich signifikant unterscheiden. Dabei sollte die Erde mit den größten Längen bestimmt werden. Die Daten werden als normalverteilt und varianzhomogen betrachtet.

Erde A B C D E

Löwenzahn1 32.7 32.1 35.7 36.0 31.8

Löwenzahn2 32.3 29.7 35.9 34.2 28.0

Löwenzahn3 31.5 29.1 31.2 29.2

a) Führen Sie einen multiplen t-Test zum Niveau α=0.05 mit Bonferroni-HolmAdjustierung durch! Die nötigen Quantile lauten (df = 14-5 = 9): K=10: K-1=9: K-2=8: K-3=7:

3.689662 3.621868 3.546508 3.461591

K-4=6: K-5=5: K-6=4: K-7=3:

3.364203 3.249836 3.110935 2.933324

b) Wie müssten Sie vorgehen, wenn die Daten varianzheterogen wären? (Keine Rechnung!) Punkte: 1...


Similar Free PDFs