Oefenvragen statistiek PDF

Title Oefenvragen statistiek
Course Statistiek
Institution Universiteit Gent
Pages 14
File Size 293.3 KB
File Type PDF
Total Downloads 75
Total Views 144

Summary

voorbeeld oefeningen...


Description

Statistics Exam: 00001

3

1. Problem Reeks 1. Oefening 1.1 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Voer volgende berekening uit. P5

i=1

xi =

Solution P5

i=1

xi = 3 + 2 + 4 + 5 + 4 = 18

2. Problem Reeks 1. Oefening 1.2 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Voer volgende berekening uit. P5

i=3

xi yi =

Solution P5

i=3

xi yi = (4 × 5) + (5 × 2) + (4 × 4) = 20 + 10 + 16 = 46

3. Problem Reeks 1. Oefening 1.3 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. Voer volgende berekening uit.

Statistics Exam: 00001

4

i xi yi P3

i=1

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

ixi =

Solution P3

i=1

ixi = (1 × 3) + (2 × 2) + (3 × 4) = 3 + 4 + 12 = 19

4. Problem Reeks 1. Oefening 1.4 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Voer volgende berekening uit. P3

i=1 (1

− i)yi =

Solution P3

i=1 (1

− i)yi = (0 × 5) + ((−1) × 6) + ((−2) × 5) = 0 − 6 − 10 = −16

5. Problem Reeks 1. Oefening 1.5 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

Voer volgende berekening uit. P4

i=2 (xi

− 1)i =

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Statistics Exam: 00001

5

Solution P4

i=2 (xi

− 1)i = (2 − 1)2 + (4 − 1)3 + (5 − 1)4 = 1 + 27 + 256 = 284

6. Problem Reeks 1. Oefening 1.6 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Voer volgende berekening uit. P5

i=1 (−1)

i

=

i

= −1 + 1 − 1 + 1 − 1 = −1

Solution P5

i=1 (−1)

7. Problem Reeks 1. Oefening 1.7 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Voer volgende berekening uit. P5 P5 i=1

j=1 (i

+ j) =

Solution P5 P5

P5 P5 + j) = i=1 (i + 1) + (i + 2) + (i + 3) + (i + 4) + (i + 5) = i=1 15 + 5i = 15 + 5 + 15 + 10 + 15 + 15 + 15 + 20 + 15 + 25 = 150 i=1

j=1 (i

8. Problem Reeks 1. Oefening 1.8

Statistics Exam: 00001

6

i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. Voer volgende berekening uit. P5 P5 i=1

j=1 (i

+ xj ) =

Solution P5 P5

P5 P5 + xj ) = i=1 (i + 3) + (i + 2) + (i + 4) + (i + 5) + (i + 4) = i=1 5i + 18 = 5 + 18 + 10 + 18 + 15 + 18 + 20 + 18 + 25 + 18 = 165 i=1

j=1 (i

9. Problem Reeks 1. Oefening 1.9 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Voer volgende berekening uit. P5 P5 i=1

j=1 (j

+ yi ) =

Solution P5 P5

P5 P5 + yi ) = i=1 1 + yi + 2 + yi + 3 + yi + 4 + yi + 5 + yi = i=1 15 + 5yi = 15 + 5 ∗ 5 + 15 + 5 ∗ 6 + 15 + 5 ∗ 5 + 15 + 5 ∗ 2 + 15 + 5 ∗ 4 = 185 i=1

j=1 (j

10. Problem Reeks 1. Oefening 1.10 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Statistics Exam: 00001

7

Voer volgende berekening uit. P5 P5 i=1

j=1

yi xj =

Solution P5 P5

P5 P5 yi xj = i=1 3yi + 2yi + 4yi + 5yi + 4yi = i=1 18yi (5 ∗ 18) + (6 ∗ 18) + (5 ∗ 18) + (2 ∗ 18) + (4 ∗ 18) = 22 ∗ 18 = 396 i=1

j=1

11. Problem Reeks 1. Oefening 1.11 In onderstaande tabel vind je de waarden van xi en yi voor i gaande van 1 tot 5. i xi yi

1 3 5

2 2 6

3 4 5

4 5 2

5 4 4

Voer volgende berekening uit. P5 P5 i=1

j=1

yj xi =

Solution P5 P5 i=1

j=1

yj xi = 396

12. Problem Reeks 1. Oefening 2 Hieronder zie je twee frequentieverdelingen voor de punten op een examen (op 20), in twee verschillende klassen. Punten Klas A Klas B

]0,4] 1 9

]4,8] 9 2

]8,12] 9 1

Hieronder zie je ook de bijhorende histogrammen.

]12,16] 6 6

]16,20] 2 9

Statistics Exam: 00001

8

8 6 0

2

4

Frequentie

6 4 0

2

Frequentie

8

10

Histogram van klas ?

10

Histogram van klas ?

0

4

8

12

16

20

0

4

8

x

12

16

20

x

Welk histogram hoort bij welke klas? Omschrijf welke scores de leerlingen halen en hoe de twee klassen van elkaar verschillen. Maak deze oefening op papier. (a) Toon de oplossing. (b) Ga naar de volgende vraag zonder de oplossing te bekijken. Solution • De linkergrafiek hoort bij klas B, de rechtergrafiek bij klas A. • Het grootste deel van de leerlingen in klas A hebben een score tussen 4 en 16. Slechts enkele leerlingen hebben een score lager dan 4 of een score hoger dan 16. • In klas B behalen het grootste deel van de leerlingen een score lager dan 4 of een score hoger dan 12 en de minderheid heeft een score tussen 4 en 12. In klas B behaalt men dus meer extreme scores. 13. Problem Reeks 1. Oefening 3 Een onderzoeker analyseert een dataset genaamd “leeftijd” in R. Hij geeft volgende R-code in en krijgt onderstaande output. > Data table(Data) Data (15,20] (20,25] (25,30] (30,35] (35,40] 1 6 43 48 2 Daarna gebruikt de onderzoeker onderstaande code. > Data table(Data) Data (10,20] (20,30] (30,40] 1 49 50

Statistics Exam: 00001

9

Hieronder krijg je twee histogrammen. Koppel ze aan de juiste code. Welk histogram geeft jou de meeste informatie over de data? Maak deze oefening op papier

40 30 0

10

20

Frequentie

30 20 0

10

Frequentie

40

50

Histogram 2 van leeftijd

50

Histogram van leeftijd

15

20

25

30

35

40

10

leeftijd

15

20

25

30

35

40

leeftijd2

(a) Toon de oplossing. (b) Ga naar de volgende vraag zonder de oplossing te bekijken. Solution • Het linkse histogram hoort bij de eerste code, het rechtse bij de tweede. Je kan dit zien aan de breedtes van de klassen. • De keuze van hoe je de data groepeert heeft een grote invloed op de histogrammen en op de informatie die je nog kan aflezen. Het linkse histogram bevat meer informatie dan het rechtse histogram. Op basis van de linkse figuur kan je steeds de rechtse figuur opstellen, maar niet omgekeerd. 14. Problem Reeks 1. Oefening 4 Schets ruw een histogram waarvoor geldt dat (a) de mediaan groter is dan het gemiddelde; (b) de mediaan kleiner is dan het gemiddelde; (c) de mediaan gelijk is aan het gemiddelde. Tip: Is je data symmetrisch of scheef verdeeld (naar links of naar rechts)? Maak deze oefening op papier. (a) Toon de oplossing. (b) Ga naar de volgende vraag zonder de oplossing te bekijken. Solution Hieronder zie je drie histogrammen met telkens de mediaan (rood) en het gemiddelde (blauw) aangeduid.

Statistics Exam: 00001

10

(a) Bij de verdeling met de staart naar links (linkse figuur) is de mediaan groter dan het gemiddelde. Dit komt doordat de kleine waarden in de staart het gemiddelde naar beneden trekken, terwijl de mediaan niet beïnvloed wordt. (b) Bij de verdeling met de staart naar rechts (middelste figuur) is de mediaan kleiner is dan het gemiddelde. (c) Als de verdeling symmetrisch is (rechtse figuur) vallen het gemiddelde en de mediaan ongeveer samen.

Scheve distributie met staart naar rechts

Symmetrische distributie

−15

−10

−5

0

50 0

0 −20

100

Frequentie

100 50

Frequentie

100 0

50

Frequentie

150

150

150

200

Scheve distributie met staart naar links

0

−a

5

10

15

20

−2

0

2

a

4

6

8

10

a

15. Problem Reeks 1. Oefening 5 • De reactietijden (in ms) van 5 proefpersonen werden waargenomen : 615, 617, 635, 623 en 630. Bereken het gemiddelde en de variantie (sX2). • Stel dat we de reactietijden in seconden uitdrukken. Dan is het gemiddelde natuurlijk 1000 keer kleiner. Maar hoe wordt de variantie (sX2) getransformeerd? Maak deze oefening op papier. (a) Toon de oplossing. (b) Ga naar de volgende vraag zonder de oplossing te bekijken. Solution • x¯ = 624, s2X = 72 • Laten we kijken naar de formule voor de variantie: sX2 =

1 n−1

Pn

i=1 (xi

− x) ¯ 2.

– zowel xi als x¯ worden 1000 keer kleiner (omzetten van ms naar seconden) – (xi − x) ¯ wordt dus 1000 keer kleiner (indien je dit niet op het zicht ziet, probeer het dan eens met een voorbeeldje) – (xi − x) ¯ 2 zal dan 10002 kleiner worden Dus de variantie zal 10002 keer kleiner worden. 16. Problem Reeks 1. Oefening 6

Statistics Exam: 00001

11

Voor een onderzoek werden 24 mannen en 24 vrouwen gevraagd om op een schaal van 0 tot 10 aan te geven hoe gelukkig ze zijn. Hieronder zie je de twee histogrammen voor mannen en vrouwen. In welke groep zal de variantie (sX2 ) het grootste zijn? Bij de mannen of bij de vrouwen?

Histogram van vrouwen

4 3 0

0

1

2

Frequentie

3 2 1

Frequentie

4

5

5

6

Histogram van mannen

2

4

6

8

2

a

4

6

8

b

Maak deze oefening op papier. (a) Toon de oplossing. (b) Ga naar de volgende vraag zonder de oplossing te bekijken. Solution De variantie is hoger bij de vrouwen: • De mannen geven vaak een score rond het gemiddelde. • De vrouwen geven ofwel lage ofwel hoge scores. Intuïtief is de spreiding dus groter bij de vrouwen. 1 Pn ¯ 2 . (xi − x) ¯ 2 zal vaker Je kan dit ook zien aan de formule voor variantie: sX2 = n−1 i=1 (xi − x) groot zijn bij de vrouwen en de som van alle termen zal bijgevolg ook groter zijn.

17. Problem Reeks 1. Oefening 7 Twee variabelen x en y hebben elk 12 observaties en stellen de scores voor op een examen. In R vragen we de absolute frequenties op. > table(x) x 2 8 9 10 11 12 19 1 1 2 4 2 1 1 > table(y) y 2 3 5 8 10 11 14 16 18 19 1 2 1 1 1 1 1 2 1 1 Je krijgt ook volgende gegevens:

Statistics Exam: 00001 • •

Pn

i=1 (xi

− x) ¯ 2 = 156.92

i=1 (yi

− y¯ )2 = 422.92

Pn

12

Bepaal welke van de 5 stellingen correct is. Tip: Schrijf de formule voor de variantie op (sX2 ) en vergelijk met de gekregen gegevens. (a) sX2 < s2Y , variatiebreedte x < variatiebreedte y (b) sX2 < s2Y , variatiebreedte x = variatiebreedte y (c) s2X = s2Y , variatiebreedte x > variatiebreedte y (d) sX2 > s2Y , variatiebreedte x = variatiebreedte y (e) sX2 = s2Y , variatiebreedte x = variatiebreedte y Solution Op basis van de gegevens kun je voor zowel x als y de variantie (sX2 en sY2 ) en de variatiebreedte berekenen. Pn 1 × 156.92 = 14.27 1 • sX2 = n−1 ¯ 2 = 11 i=1 (xi − x) De variatiebreedte van x: 19 − 2 = 17 Pn 1 × 422.92 = 38.44 1 • sY2 = n−1 ¯ )2 = 11 i=1 (yi − y De variatiebreedte van y: 19 − 2 = 17 Op basis van deze berekeningen kunnen we besluiten dat stelling b correct is. 18. Problem Reeks 1. Oefening 8 Hieronder zie je twee frequentieverdelingen voor de punten op een examen (op 20), in twee verschillende klassen (A en B). Punten Klas A Klas B

]0,4] 1 9

]4,8] 9 2

]8,12] 9 1

]12,16] 6 6

]16,20] 2 9

(a) Bereken de spreidingsmaat d in beide klassen. (b) Vergelijk de twee waarden. Wat leid je hier uit af? Maak deze oefening op papier. (a) Toon de oplossing. (b) Ga naar de volgende vraag zonder de oplossing te bekijken. Solution

• Voor beide klassen is d gelijk: d=

1− fmo n 1− 1p

=

9 1− 27 1− 51

=

18 27 4 5

=

2 5 3 4

=

10 12

=

5 6

• De 2 verdelingen zijn heel verschillend, maar de spreidingsmaat d is voor beide hetzelfde. Deze spreidingsmaat zegt dus iets over hoe groot de spreiding is, maar zegt niets over de aard van de spreiding.

Statistics Exam: 00001

13

19. Problem Reeks 1. Oefening 9 Examenvraag van de voorbije jaren. Welke maat is geen spreidingsmaat? (a) P25 (b) De interkwartielafstand (c) De variatiebreedte (d) P90 − P10 Solution

• De interkwartielafstand (P75 − P25 ) en de variatiebreedte werden in de cursus reeds besproken als spreidingsmaten. • Hoe groter de spreiding, hoe groter de afstand tussen P90 en P10 . Het kan dus gebruikt worden als spreidingsmaat. • P25 is de waarde waarvoor 25 % van de observaties lager of gelijk zijn aan die specifieke waarde. Het zegt niets over de spreiding van de data en is dus geen spreidingsmaat. Het correcte antwoord is dus P25 . 20. Problem Reeks 1. Oefening 10 Examenvraag van de voorbije jaren. Hieronder de gegroepeerde verdeling van de variabele X in een steekproef. klasse ]0, 1] ]1, 2] ]2, 3] ]3, 4] ]4, 5] ]5, 6] ]6, 7]

fi 5 10 5 10 15 10 5

Welke bewering is correct? (a) P50 = 4.5 (b) Q = 3.5 (c) Geen van de andere alternatieven is correct (d) v = 3.5 Solution We bepalen eerst de cumulatieve frequentieverdeling en de relatieve cumulatieve frequentieverdeling.

Statistics Exam: 00001 klasse ]0, 1] ]1, 2] ]2, 3] ]3, 4] ]4, 5] ]5, 6] ]6, 7]

14 fi 5 10 5 10 15 10 5

Fi 5 15 20 30 45 55 60

relatieve cumulatieve frequentie 0.083 0.250 0.333 0.500 0.750 0.917 1

Nu kunnen we P50 , de interkwartielafstand Q en de variatiebreedte v afleiden: • P50 = 4. • P25 = 2 en P75 = 5. De interkwartielafstand Q is dus gelijk aan 3 (= 5 − 2). • De variatiebreedte (v ) is 7 − 0 = 7. Hieruit kunnen we afleiden dat het correcte antwoord is: “Geen van de andere alternatieven is correct”. 21. Problem Reeks 1. Oefening 11 Onderaan kan je de boxplots vinden van de variabele ‘Lengte’ voor twee steekproeven van 24 studenten.

180 165 150

155

165

175

185

195



Boxplot Lengte 195

Boxplot Lengte

(a) Vergelijk het eerste en het tweede boxplot met elkaar: Hebben de boxplots outliers? Hoe ziet de verdeling van de data er uit (symmetrisch of scheef). Welke steekproef heeft de grootste spreiding? (b) Controleer je idee door de mediaan, de interkwartielafstand en de maximum waarde te bepalen. Maak deze oefening op papier. (a) Toon de oplossing. (b) Ga naar de volgende vraag zonder de oplossing te bekijken.

Statistics Exam: 00001

15

Solution

(a) Wanneer we de boxplotten bekijken, zijn er verschillende zaken die we kunnen bemerken: • De eerste boxplot heeft een outlier, de tweede niet. • Bij de eerste boxplot zijn er twee zaken die wijzen op een scheve verdeling naar rechts: – de bovenste whisker is veel langer dan de onderste whisker – de mediaan bevindt zich in de onderste helft van de box • Bij de tweede boxplot : – hebben de whiskers ongeveer dezelfde lengte – de mediaan bevindt zich in de bovenste helft van de box • De box is langer bij de tweede boxplot dan bij de eerste. Er is dus, in termen van de interkwartielafstand, een grotere spreiding bij de tweede steekproef. (b) We kunnen de mediaan, interkwartielafstand en de maximumwaarde bij benadering aflezen: • De mediaan komt overeen met de horizontale lijn in de rechthoek. • De interkwartielafstand is P75 − P25 . P25 is de onderste horizontale lijn van de box, P75 de bovenste horizontale lijn. • De maximum waarde is de bovenste horizontale lijn in de boxplot of het bovenste punt indien er outliers zijn. Centrummaat mediaan interkwartielafstand maximum

boxplot 1 167 173-163=10 200

boxplot 2 180 185-165=20 200

22. Problem Reeks 1. Oefening 12 Een onderzoeker bevraagt bij 20 mensen hun natuurlijke haarkleur en geeft het volgende commando in R in en krijgt bijhorende output: > > > > > >

Haarkleur...


Similar Free PDFs