Title | LES 6 Associatie Covariantie en correlatie 2 |
---|---|
Author | Tim Henckens |
Course | Statistiek |
Institution | UC Leuven-Limburg |
Pages | 28 |
File Size | 1021.9 KB |
File Type | |
Total Downloads | 37 |
Total Views | 131 |
Download LES 6 Associatie Covariantie en correlatie 2 PDF
SAMENHANG tussen DATA ASSOCIATIE, REGRESSIE, COVARIANTIE en CORRELATIE 1
Associatie (samenhang bij discrete data) Onderzoek: verband tssn op kot zitten en roken? X = op kot of niet op kot zitten (2 mogelijkheden) Y = roken of niet roken (2 mogelijkheden)
Vb. bij 51 studenten (n = 51) 2 X 2 tabel Yi Xi Op kot Niet op kot
Roker
Niet-roker
5 (a) 8 (c)
16 (b) 22 (d) 2
Associatie (samenhang bij discrete data) Is er een voorkeur-associatie van de variabelen? OF Zijn de variabelen louter toevallig geassocieerd? Om op deze vraag te antwoorden berekenen we de associatiemaat Φ (“fie”) 3
Associatie (samenhang bij discrete data)
Φ kan liggen tussen 0 en 1 (vb. zelf berekenen) (Φ = 0,03) 0: helemaal geen associatie, dus louter toevallig samengaan 1: perfecte associatie, gaan steeds samen 4
Associatie (samenhang bij discrete data) Opmerkingen - Kleine steekproef: opletten met conclusies ² 𝒏
- Χ (“chie”): zie volgend jaar bij hypothesetesten 5
Samenhang bij continue data (X en Y) (spreidingsdiagram) 1
2
14
14
12
12 10 8
6
6
4
4
2
2 0
0 0
5
10
0
15
5
3
10
15
10
15
4
14
14
12
12
10
10
8
8
6
6
4
4
2
2 0
0 0
5
10
15
0
5
Wat is regressie? = zoeken van een functioneel verband tussen 2 continue statistische veranderlijken “Hoe ziet dit functioneel verband eruit?” Vorm? Y = f(X) lineair verband (Y = a*X + b) machtsverheff. verband (Y = a*Xb) exponentieel verband (Y = a*bX) logaritmisch verband (Y = a*logX+b) ander verband??? 7
Wat is correlatie? = onderzoek naar het (lineair) samen variëren van koppels waarnemingen “Hoe (goed) variëren de variabelen t.o.v. (met) elkaar?” Hoe goed gaan ze samen? VB: rokers en longkanker VB: isolatie woning en energieverbruik VB: schoenmaat en IQ??? VB: punten van WIS (X) en FYS (Y) 8
Wat is correlatie? 1PBA CE/BLT/MIL : vgl WIS tov FYS 2007-2008
Geen echt goede correlatie, geen echt goede voorspeller
20 18
y = 0,5952x + 1,4638 R² = 0,4188
16
punten FYS (op 20)
14 12 10 8 6 4 2 0 0
2
4
6
8
10
12
14
16
18
20
punten WIS (op 20)
9
Wat is correlatie? Y in f(X) 14 12 y = -0,1267x2 + 2,7808x - 5,9957 R² = 1
10 Y
8 6 Zeer goede correlatie, zeer goede voorspeller
4 2 0 0
5
10
15
X 10
Wat is covariantie? Covariantie en Correlatie zijn beide manieren om aan te geven HOE goed 2 (of meerdere) variabelen samengaan
11
Begrip COVARIANTIE
12
Covariantie Covariantie geeft de associatie of samenhang weer tussen 2 continue variabelen X en Y (onafhankelijk van de vorm) COVARIANTIE Cxy = 1/n * ∑((Xi – Xgem)*(Yi – Ygem))
Met deze formule “centreren” we het zwaartepunt van de puntenwolk in de oorsprong 13
Covariantie Lengte versus Gewicht (10 lln)
40
8
38 36 34 32 30 28 26 24 130
135
140
145
150
Lengte (cm) : met Xgem
Zwaartepunt puntenwolk is : (Xgem, Ygem)
Gewicht (kg) : Yi - Ygem
Ge wicht (cm) : met Ygem
Lengte versus Gewicht (10 lln)
6 4 2 0 -8
-6
-4
-2
-2
0
2
4
6
-4 -6 -8
Lengte (cm) : Xi - Xgem
Centreren rond (0,0) : Xi – Xgem en Yi - Ygem 14
8
Covariantie
ALS covariantie > 0 DAN positieve samenhang
ALS covariantie < 0 DAN negatieve samenhang
ALS covariantie = 0 DAN geen specifieke samenhang 15
Covariantie Leerling
Lengte (cm)= Xi
Gewicht (kg)= Yi
1
135
29
-4.40
-3.20
14.08
2
145
35
5.60
2.80
15.68
3
139
34
-0.40
1.80
-0.72
4
142
32
2.60
-0.20
-0.52
5
137
33
-2.40
0.80
-1.92
6
137
32
-2.40
-0.20
0.48
7
134
27
-5.40
-5.20
28.08
8
144
36
4.60
3.80
17.48
9
135
26
-4.40
-6.20
27.28
10
146
38
6.60
5.80
38.28
1394
322
139.40
32.20
som gemidd. aantal
10
Covariantie = 13.82
Begrip CORRELATIE
17
Correlatie Nagaan van lineaire afhankelijkheid (hoe goed gaan deze variabelen lineair samen?) met een gestandaardiseerde, DIMENSIELOZE grootheid, nl. de (Pearson’s) correlatiecoëfficiënt Rxy DUS: eerst lineariseren !!! n
( x - x ) ( y - y) i
R xy =
i
i =1 n
n
(xi - x ) i =1
2
2 ( y y ) i
Cxy R xy = Sx * S y
i =1
Pearson
18
Correlatie Andere formule voor Pearson’s correlatiecoëfficiënt Rxy n
r xy =
n 1 n xi yi - xi yi n i=1 i=1 i=1
1 1 ( x - ( x ) )( y - ( y ) ) n n n
n
2
2 i
i=1
n
2
2 i
i
i=1
n
i=1
i
i=1
Te berekenen met rekenschema in Excel (of automatisch)
19
Vb. Lengte vs gewicht Leerling
Lengte (cm)= Xi
Gewicht (kg)= Yi
XiYi
Xi²
Yi²
1
135
29
3915
18225
841
2
145
35
5075
21025
1225
3
139
34
4726
19321
1156
4
142
32
4544
20164
1024
5
137
33
4521
18769
1089
6
137
32
4384
18769
1024
7
134
27
3618
17956
729
8
144
36
5184
20736
1296
9
135
26
3510
18225
676
10
146
38
5548
21316
1444
139,40
32,20
som gemidd. aantal
Correlatie = 0.88
Vb. Lengte vs gewicht Gewicht versus lengte bij lln 40 R² = 0,7722
gewicht (kg)
35
30
Correlatie = √0,7722 = 0,88
25
20 132
134
136
138
140 lengte (cm)
142
144
146
148
Correlatie: interpretatie rxy commentaar 1 perfecte positieve correlatie (RECHTE!) 0.9 sterke positieve correlatie 0.7 0.6 0 -0.6 -0.7
tamelijk belangrijke positieve correlatie kleine positieve correlatie geen correlatie kleine negatieve correlatie tamelijk belangrijke negatieve correlatie
-0.9 sterke negatieve correlatie -1 perfecte negatieve correlatie (RECHTE!) ERTUSSEN: commentaar aanpassen
22
Correlatie: interpretatie
Positieve correlatie
23
Correlatie: interpretatie Geen correlatie
24
Correlatie: interpretatie
Negatieve correlatie
25
Correlatie: interpretatie
Overzicht correlatie
26
Visualisatie van correlatie
27
Correlatie: interpretatie
OPGELET!
Hoge correlatie betekent NIET noodzakelijk dat er een CAUSAAL (oorzakelijk) verband bestaat tussen de 2 variabelen! Vb. Veel roken hoge kans op longkanker (WEL causaal verband, bewezen door sterk doorgedreven onderzoek) Vb. Grote voeten hoog IQ (posit. correlatie) Causaal verband??? 28...