BE2021 Descriptiva Bivar PDF

Title BE2021 Descriptiva Bivar
Author Eva Gonzalez
Course Bioestadística
Institution Universitat Autònoma de Barcelona
Pages 32
File Size 721.5 KB
File Type PDF
Total Downloads 82
Total Views 122

Summary

Download BE2021 Descriptiva Bivar PDF


Description

Bioestad´ıstica

Estad´ıstica descriptiva bivariant Giulia Binotto

Grau en Biologia - UAB

Estudi descriptiu de dues variables En l’estudi descriptiu de dues variables s’intenta respondre a preguntes com: • Tenen aquestes variables alguna relaci´ o? • Quina mena de relaci´ o suggereixen les dades? • Pot quantificar-se aquesta relaci´ o? • Podem predir una variable a partir de l’altra? Exemples: • Pes/al¸cada de persones. • Taxa de natalitat/renda per capital de diferents pa¨ısos.

Estudi descriptiu de dues variables Les dades aparalledes s´ on dues variables x i y sobre els mateixos individus, de manera que les obervacions seran del tipus (x1 , y1 ), . . . , (xn , yn ). El parell de valors (xi , yi ) es pot representar pel punt de coordenades (xi , yi ) del pla: y yi

· (xi ,yi ) xi

x

Diagrama de dispersi´o El diagrama de dispersi´ o o n´ uvol de punts consisteix en la col·lecci´ o de tots els punts representats sobre el pla. Exemple. Dades de Pes i Al¸cada de 100 persones.

Diagrama de dispersi´o Exemple. Relaci´ o lineal directa o positiva.

Dades de la marca dels medallistes d’or de salt d’al¸cada-homes de tots els jocs ol´ımpics, des de 1896 fins a 2012.

Diagrama de dispersi´o Exemple. Relaci´ o lineal inversa o negativa.

Dades del nombre m`axim de repeticions que poden fer diferents atletes amb respecte al pes que aixequen.

Diagrama de dispersi´o Exemple. Sense relaci´ o.

Dades de les notes de dos problemes d’un examen d’un curs de probabilitats.

Taules de conting`encia Suposem que tenim n observacions bivariants (x1 , y1 ), . . . , (xn , yn ). Definici´ o. La taula de conting`encia ´es una taula de doble entrada que distribueix les freq¨ u`encies de les parelles de valors (xi , yi ).

x1 x2 .. . xk

y1 y2 . . . n11 n12 . . . n21 n22 . . . .. ... . nk1 ...

yℓ n1ℓ n2ℓ .. . nkℓ

nij ´es la freq¨ u`encia absoluta de la parella (xi , yj ). Obs. Si les variables s´ on quantitatives cont´ınues, les agruparem per intervals.

Taules de conting`encia Exemple. Dades de color d’ulls i dels cabells de 5387 nens de Caithness (Esc` ocia). Eyes Blue Light Medium Dark Blue Light Medium Dark Blue Light Medium Dark Blue Light Medium Dark Blue Light Medium Dark

Hair Fair Fair Fair Fair Red Red Red Red Medium Medium Medium Medium Dark Dark Dark Dark Black Black Black Black

Freq 326 688 343 98 38 116 84 48 241 584 909 403 110 188 412 681 3 4 26 85

Taules de conting`encia

Fair Red Medium Dark Black Blue 326 38 Light 688 116 Medium 343 84 Dark 98 48

241 584 909 403

110 188 412 681

3 4 26 85

Taules de conting`encia Definici´ o. Les freq¨ u`encies marginals s´ on els totals que obtenim en els marges dret i inferior de la taula de conting`encia. y1 y2 . . . yℓ Total x1 n11 n12 . . . n1ℓ n1· x2 n21 n22 .. .. .. .. ... . . . . xk nk1 . . . nkℓ nk· Total n·1 . . . n·ℓ n·· = n • La freq¨ u`encia absoluta de xi : ni · =

ℓ X

nij .

• La freq¨ u`encia absoluta de yj : n·j =

j=1 k X

nij .

• La suma n =

k X l X i =1 j=1

i =1

nij .

Taules de conting`encia Exemple. (Caithness)

Fair Red Medium Dark Black Blue Light Medium Dark

326 38 688 116 343 84 98 48 1455 286

241 584 909 403 2137

110 188 412 681 1391

3 4 26 85 118

718 1580 1774 1315 5387

Taules de conting`encia La taula de conting`encia amb freq¨ u`encies relatives s’obt´e dividint les freq¨ u`encies absolutes nij per la grand` aria de la mostra n. y1 y2 . . . x1 f11 f12 . . . x2 f21 f22 .. .. .. . . . xk fk1 ... Total f·1 ... n

yℓ f1ℓ

Total f1·

.. .

...

fkℓ fk· f·ℓ f·· = 1

fij = nij ´es la freq¨ u`encia relativa de la parella (xi , yj ) i pren valors entre 0 i 1.

Taules de conting`encia • La suma 1=

k X l X

fij .

i =1 j=1

• Les freq¨ u`encies relatives de xi i de yj fi · =

ni · n

f·j =

n·j . n

• La freq¨ u`encia relativa de yj dins dels xi i la freq¨ u`encia relativa de xi dins dels yj nij nij . ni · n·j

Taules de conting`encia Exemple. (Caithness)

Fair Blue Light Medium Dark

0.061 0.128 0.064 0.018 0.270

Red Medium 0.007 0.022 0.016 0.009 0.053

0.045 0.108 0.169 0.075 0.397

Dark Black 0.020 0.035 0.076 0.126 0.258

0.001 0.001 0.005 0.016 0.022

0.133 0.293 0.329 0.244 1

Mesures de depend`encia: Covari`ancia

Definici´ o. La covari` ancia es defineix com la mitjana dels productes de les desviacions de les dades respecte a la seva mitjana: sxy

n 1 X = (xi − x¯) (yi − y¯ ). n i =1

Obs. sxx = sx2 .

Mesures de depend`encia: Covari`ancia Interpretaci´ o. La covari` ancia mesura si dues variables es mouen en la mateixa direcci´ o o en direccions oposades. • Covari` ancia gran positiva → Creixen o decreixen juntes. • Covari` ancia gran negativa→ Una creix quan l’altra disminueix. • Covari` ancia pr` oxima a zero → No tenen relaci´ o.

Problema. La covari` ancia dep`en de les unitats de mesura.

Mesures de depend`encia: Coeficient de correlaci´o

Definici´ o. El coeficient de correlaci´ o de Pearson es defineix com la covari` ancia entre les dues variables dividit pel producte de les seves desviacions t´ıpiques: sxy . rxy = sx sy

• −1 ≤ rxy ≤ 1. • No dep`en de les unitats de mesura.

Mesures de depend`encia: Coeficient de correlaci´o

Interpretaci´ o. El coeficient de correlaci´ o de Pearson detecta l’associaci´ oo depend`encia lineal entre dues variables. • 0.9 < |r | < 1

→ Correlaci´ o lineal forta.

• 0.5 < |r | < 0.9 → Correlaci´ o lineal moderada. • 0 < |r | < 0.5

→ Correlaci´ o lineal feble.

• r ≈0

→ No hi ha relaci´ o o ´es una relaci´ o no lineal.

Mesures de depend`encia: Coeficient de correlaci´o En els gr` afics d’il·lustracions anteriors teniem:

.

r = 0, 49

.

r = 0, 97

.

r = −0, 99

.

r = −0, 31

Mesures de depend`encia: Coeficient de correlaci´o Exemple. X

-5

-4

-3

-2

-1

0

1

2

3

4

5

Y

25

16

9

4

1

0

1

4

9

16

25

Hi ha depend`encia quadr` atica entre les dues variables: Y = X 2 , per` o rxy = 0.

Recta de regressi´o Donats n punts (xi , yi ) ∈ R2 , volem calcular a, b ∈ R de manera que la recta d’equaci´ o y = a+bx sigui una bona aproximaci´ o al conjunt de punts. o per m´ınims quadrats ´es la recta Definici´ o. La recta de regressi´ que millor aproxima aquests punts en el sentit que minimitza les dist` ancies entre aquests punts i la recta. ´Es a dir, ´es la recta que t´e els par` ametres a i b que fan m´ınima la funci´ o n X i =1

ri2

=

n X i =1

(yi − (a + b xi ))2

a, b ∈ R.

Recta de regressi´o

(xi , yi ) ri = yi − y˜i {

⋄ (xi , y˜i )

ri = yi − (a + b xi )

Recta de regressi´o

Calculant els m´ınims quadrats obtenim la recta de regressi´ o y = a + b x, on els par` ametre es calculen com b=

sxy sx2

i

a = y¯ − b x¯.

Recta de regressi´o

• Passa pel centre de gravetat (¯ x , y¯ ) del n´ uvol de punts: y − y¯ = b (x − x¯).

• El pendent de la recta t´e el mateix signe que sxy i que rxy : ◮ r > 0: Pendent positiu. ◮ r < 0: Pendent negatiu.

Recta de regressi´o: Valors ajustats Definici´ o. Per cada xi , el i -`esim valor ajustat b yi = a + b xi , ´es la ordenada del punt situat en la vertical de xi , sobre la recta de regressi´ o.

on una estimaci´ o dels errors d’ajustament Definici´ o. Els residus s´ als punts observats. Per cada xi , el i -`esim residu es defineix com yi . e i = yi − b

Coeficient de determinaci´o Definici´ o. El coeficient de determinaci´ o d´ ona la proporci´ o de la variabilitat de les dades que queda explicada pel model de regressi´ o. Es defineix com 2

R =

Obs. Donat que

sby2

sby2 sy2

.

2 sxy = 2, sx

R 2 = r 2. Per tant, tenim que R 2 ≤ 1.

Exemple Tenim un conjunt de n = 10 punts, que corresponen al pes i a l’al¸cada de 10 persones: x

180

170

165

190

170

181

175

174

167

160

y

90

73

67

95

83

80

73

80

62

60

Exemple Estad´ıstics: x¯

= 173.2,



= 76.3,

sx2

= 69.36,

s 2y

= 118.81,

sx

= 8.33,

sy

= 10.9,

˜sx2

= 77.07,

˜s y2

= 132.01,

˜sx

= 8.78,

˜sy

= 11.49,

˜sxy

= 89.16,

sxy

= 80.24,

rxy

= 0.88,

2 r xy

= 0.78.

Exemple Recta de regressi´ o: b=

˜sxy 89.16 = = 1.16, ˜sx2 77.07

a = y¯ − b x¯ = 76.3 − 1.16 × 173.2 = −124.07.

Exemple

Valors ajustats i residus: yˆi = a + b xi ,

yi = ei = yi − yˆi , e

1 ≤ i ≤ n.

x

180

170

165

190

170

181

175

174

167

160

y

90

73

67

95

83

80

73

80

62

60

yˆ 84.17 72.60 66.81 95.74 72.60 85.32 78.38 77.23 69.13 61.03 y e

5.83

0.40

0.19 -0.74 10.40 -5.32 -5.38

2.77 -7.13 -1.03

Exemple Punts ajustats sobre el diagrama de regressi´ o:...


Similar Free PDFs