LES 6 Associatie Covariantie en correlatie 2 PDF

Title LES 6 Associatie Covariantie en correlatie 2
Author Tim Henckens
Course Statistiek
Institution UC Leuven-Limburg
Pages 28
File Size 1021.9 KB
File Type PDF
Total Downloads 37
Total Views 131

Summary

Download LES 6 Associatie Covariantie en correlatie 2 PDF


Description

SAMENHANG tussen DATA ASSOCIATIE, REGRESSIE, COVARIANTIE en CORRELATIE 1

Associatie (samenhang bij discrete data) Onderzoek: verband tssn op kot zitten en roken? X = op kot of niet op kot zitten (2 mogelijkheden) Y = roken of niet roken (2 mogelijkheden)

Vb. bij 51 studenten (n = 51)  2 X 2 tabel Yi Xi Op kot Niet op kot

Roker

Niet-roker

5 (a) 8 (c)

16 (b) 22 (d) 2

Associatie (samenhang bij discrete data) Is er een voorkeur-associatie van de variabelen? OF Zijn de variabelen louter toevallig geassocieerd? Om op deze vraag te antwoorden berekenen we de associatiemaat Φ (“fie”) 3

Associatie (samenhang bij discrete data)

Φ kan liggen tussen 0 en 1 (vb. zelf berekenen) (Φ = 0,03) 0: helemaal geen associatie, dus louter toevallig samengaan 1: perfecte associatie, gaan steeds samen 4

Associatie (samenhang bij discrete data) Opmerkingen - Kleine steekproef: opletten met conclusies ² 𝒏

- Χ (“chie”): zie volgend jaar bij hypothesetesten 5

Samenhang bij continue data (X en Y) (spreidingsdiagram) 1

2

14

14

12

12 10 8

6

6

4

4

2

2 0

0 0

5

10

0

15

5

3

10

15

10

15

4

14

14

12

12

10

10

8

8

6

6

4

4

2

2 0

0 0

5

10

15

0

5

Wat is regressie? = zoeken van een functioneel verband tussen 2 continue statistische veranderlijken “Hoe ziet dit functioneel verband eruit?” Vorm?  Y = f(X) lineair verband (Y = a*X + b) machtsverheff. verband (Y = a*Xb) exponentieel verband (Y = a*bX) logaritmisch verband (Y = a*logX+b) ander verband??? 7

Wat is correlatie? = onderzoek naar het (lineair) samen variëren van koppels waarnemingen “Hoe (goed) variëren de variabelen t.o.v. (met) elkaar?” Hoe goed gaan ze samen? VB: rokers en longkanker VB: isolatie woning en energieverbruik VB: schoenmaat en IQ??? VB: punten van WIS (X) en FYS (Y) 8

Wat is correlatie? 1PBA CE/BLT/MIL : vgl WIS tov FYS 2007-2008

Geen echt goede correlatie, geen echt goede voorspeller

20 18

y = 0,5952x + 1,4638 R² = 0,4188

16

punten FYS (op 20)

14 12 10 8 6 4 2 0 0

2

4

6

8

10

12

14

16

18

20

punten WIS (op 20)

9

Wat is correlatie? Y in f(X) 14 12 y = -0,1267x2 + 2,7808x - 5,9957 R² = 1

10 Y

8 6 Zeer goede correlatie, zeer goede voorspeller

4 2 0 0

5

10

15

X 10

Wat is covariantie? Covariantie en Correlatie zijn beide manieren om aan te geven HOE goed 2 (of meerdere) variabelen samengaan

11

Begrip COVARIANTIE

12

Covariantie Covariantie geeft de associatie of samenhang weer tussen 2 continue variabelen X en Y (onafhankelijk van de vorm) COVARIANTIE Cxy = 1/n * ∑((Xi – Xgem)*(Yi – Ygem))

Met deze formule “centreren” we het zwaartepunt van de puntenwolk in de oorsprong 13

Covariantie Lengte versus Gewicht (10 lln)

40

8

38 36 34 32 30 28 26 24 130

135

140

145

150

Lengte (cm) : met Xgem

Zwaartepunt puntenwolk is : (Xgem, Ygem)

Gewicht (kg) : Yi - Ygem

Ge wicht (cm) : met Ygem

Lengte versus Gewicht (10 lln)

6 4 2 0 -8

-6

-4

-2

-2

0

2

4

6

-4 -6 -8

Lengte (cm) : Xi - Xgem

Centreren rond (0,0) : Xi – Xgem en Yi - Ygem 14

8

Covariantie 

ALS covariantie > 0 DAN positieve samenhang



ALS covariantie < 0 DAN negatieve samenhang



ALS covariantie = 0 DAN geen specifieke samenhang 15

Covariantie Leerling

Lengte (cm)= Xi

Gewicht (kg)= Yi

1

135

29

-4.40

-3.20

14.08

2

145

35

5.60

2.80

15.68

3

139

34

-0.40

1.80

-0.72

4

142

32

2.60

-0.20

-0.52

5

137

33

-2.40

0.80

-1.92

6

137

32

-2.40

-0.20

0.48

7

134

27

-5.40

-5.20

28.08

8

144

36

4.60

3.80

17.48

9

135

26

-4.40

-6.20

27.28

10

146

38

6.60

5.80

38.28

1394

322

139.40

32.20

som gemidd. aantal

10

Covariantie = 13.82

Begrip CORRELATIE

17

Correlatie Nagaan van lineaire afhankelijkheid (hoe goed gaan deze variabelen lineair samen?) met een gestandaardiseerde, DIMENSIELOZE grootheid, nl. de (Pearson’s) correlatiecoëfficiënt Rxy DUS: eerst lineariseren !!! n

 ( x - x ) ( y - y) i

R xy =

i

i =1 n

n

 (xi - x ) i =1

2

2 ( y y )  i

Cxy R xy = Sx * S y

i =1

Pearson

18

Correlatie Andere formule voor Pearson’s correlatiecoëfficiënt Rxy n

r xy =

n 1 n xi yi -  xi  yi  n i=1 i=1 i=1

1 1 ( x - ( x ) )(  y - (  y ) ) n n n

n

2

2 i

i=1

n

2

2 i

i

i=1

n

i=1

i

i=1

 Te berekenen met rekenschema in Excel (of automatisch)

19

Vb. Lengte vs gewicht Leerling

Lengte (cm)= Xi

Gewicht (kg)= Yi

XiYi

Xi²

Yi²

1

135

29

3915

18225

841

2

145

35

5075

21025

1225

3

139

34

4726

19321

1156

4

142

32

4544

20164

1024

5

137

33

4521

18769

1089

6

137

32

4384

18769

1024

7

134

27

3618

17956

729

8

144

36

5184

20736

1296

9

135

26

3510

18225

676

10

146

38

5548

21316

1444

139,40

32,20

som gemidd. aantal

Correlatie = 0.88

Vb. Lengte vs gewicht Gewicht versus lengte bij lln 40 R² = 0,7722

gewicht (kg)

35

30

Correlatie = √0,7722 = 0,88

25

20 132

134

136

138

140 lengte (cm)

142

144

146

148

Correlatie: interpretatie rxy commentaar 1 perfecte positieve correlatie (RECHTE!) 0.9 sterke positieve correlatie 0.7 0.6 0 -0.6 -0.7

tamelijk belangrijke positieve correlatie kleine positieve correlatie geen correlatie kleine negatieve correlatie tamelijk belangrijke negatieve correlatie

-0.9 sterke negatieve correlatie -1 perfecte negatieve correlatie (RECHTE!) ERTUSSEN: commentaar aanpassen

22

Correlatie: interpretatie

Positieve correlatie

23

Correlatie: interpretatie Geen correlatie

24

Correlatie: interpretatie

Negatieve correlatie

25

Correlatie: interpretatie

Overzicht correlatie

26

Visualisatie van correlatie

27

Correlatie: interpretatie

OPGELET!

Hoge correlatie betekent NIET noodzakelijk dat er een CAUSAAL (oorzakelijk) verband bestaat tussen de 2 variabelen! Vb. Veel roken  hoge kans op longkanker (WEL causaal verband, bewezen door sterk doorgedreven onderzoek) Vb. Grote voeten  hoog IQ (posit. correlatie) Causaal verband??? 28...


Similar Free PDFs