Title | Teststatistica - Test statistica facultatea de marketing an 1, semestru doi |
---|---|
Course | Statistica Statistics |
Institution | Academia de Studii Economice din București |
Pages | 17 |
File Size | 1.2 MB |
File Type | |
Total Downloads | 143 |
Total Views | 347 |
Selectați informația care nu este adevărată referitoare la coeficientul de corelație: Alegeți o opțiune: a. ia valori în intervalul [-1; 1] b. se utilizează pentru studiul legăturii dintre două variabile, indiferent de scala de măsurare a acestora c. este un indicator sintetic al intensității legătu...
0,57
Selectați informația care nu este adevărată referitoare la coeficientul de corelație: Alegeți o opțiune: a. ia valori în intervalul [-1; 1] b. se utilizează pentru studiul legăturii dintre două variabile, indiferent de scala de măsurare a acestora c. este un indicator sintetic al intensității legăturii dintre două variabile
R 0.4; c) cele două corelații sunt la fel de puternice, deoarece 1.0 − 0.6 = 0.4; d) variabilele nu sunt corelate, deoarece coeficienții sunt < 1; e) nu putem spune care corelație este mai puternică, fără informații adiționale; f) nici unul din răspunsurile de mai sus nu este corect.
12. Un analist de marketing urmărește timp de 5 luni consecutive efectul reclamelor asupra veniturilor din vânzări pentru o firmă de produse cosmetice. El înregistrează cheltuielile cu reclama (X) (zeci mii euro) și veniturile din vânzări (Y) (sute mii euro). În urma prelucrării datelor obține: suma totală cheltuită cu reclama în cele 5 luni este 15; veniturile totale din vânzări obținute în perioada analizată sunt egale cu 10; suma pătratelor cheltuielilor cu reclama este 55; suma pătratelor veniturilor este egală cu 30; suma produselor dintre cheltuielile cu reclama și veniturile din vânzări pentru cele 5 luni este egală cu 37. În ipoteza unei dependențe liniare, coeficientul de corelație liniară Pearson este: 0,70; b) 0,56; c) 0,68; d) 0,82; e) 0,77; f) niciun răspuns corect.
1. Pentru un magazin de mobilă s-au cules date privind numărul de spoturi publicitare difuzate şi numărul vizitatorilor (mii pers.) timp de 14 zile. Să se măsoare intensitatea legăturii dintre cele două variabile cu ajutorul unui indicator adecvat. Datele sunt prezentate în tabelul 1.
Tabelul 1
𝑟=
Ziua
Nr. spoturi publicitare
Nr.vizitatori(mii pers.)
0
1
2
1
7
42
2
5
32
3
1
10
4
8
40
5
10
61
6
2
8
7
6
35
8
7
34
9
9
45
10
3
11
11
12
64
12
8
37
13
4
30
14
11
55
𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
√[𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 ][𝑛 ∑ 𝑦𝑖2 − (∑ 𝑦𝑖 )2 ]
=
10318
√2033(14 ⋅ 22190 − 5042 )
=
10318 = 0,9615 10731
Acest indicator ne arată o legătură directă şi foarte puternică ( r este pozitiv şi apropiat de valoarea unitară).
Pentru opt judeţe ale României, se cunosc: suprafaţa cultivată în 1996 ( mii ha) şi producţia agricolă totală în acelaşi an (mil. RON preţuri curente): Tabelul 4 Judeţul
Suprafaţa cultivată în 1996 (mii ha)
Producţia agricolă (mil. RON)
Alba
127
75,1
Arad
342
112,4
98
64,4
Botoşani
286
89,4
Braşov
111
80,4
Buzău
252
84,3
Caraş Severin
124
62
Călăraşi
404
96,5
Bistriţa Năsăud
Să se studieze existenţa, direcţia şi intensitatea legăturii dintre suprafaţa cultivată şi producţia agricolă, cu ajutorul coeficienţilor de corelaţie a rangurilor ai lui Spearman şi Kendall. rs = 1 −
6 12 = 0 ,86 , valoare ce indică o legătură directă, puternică, între cele două variabile. 8 63
Coeficientul lui Kendall se calculează cu relaţia: rk =
2S , unde S reprezintă diferenţa între suma rangurilor superioare (P) şi suma rangurilor n (n − 1)
inferioare (Q), corespunzătoare fiecărui rang curent (tabelul 6). rk =
2 20 = 0,71 , valoare a cărei interpretare este aceeaşi ca în cazul coeficientului lui Spearman. 8 7
Datele sistematizate, obţinute în urma unui studiu statistic privind vechimea în muncă şi timpul zilnic nelucrat, efectuat pe 800 de salariaţi ai unei societăţi comerciale, sunt: Tabelul 7 Timp nelucrat (u.m.) Vechimea
Qa =
sub 60 u.m.
peste 60 u.m.
peste 10 ani
300
150
sub 10 ani
100
250
ad − bc , unde a = 300, b = 150, c = 100, d = 250. ad + bc
Qa =
300 250 − 100 150 60.000 = = 0,67 . 300 250 + 100 150 90.000
Cum ad > bc, rezultă că între cele două variabile există o legătură de intensitate medie.
5. Un funcţionar al departamentului de sănătate doreşte să stabilească factorii determinanţi care influenţează cheltuielile medicale ale familiilor. În acest scop, pentru 13 familii el înregistrează numărul de membri ai familiei şi cheltuielile lunare cu îngrijirea sănătăţii (euro): Tabelul 8 Familia
Mărimea familiei (persoane)
Cheltuieli medicale lunare (euro)
1
2
20
2
2
28
3
4
52
4
5
50
5
7
78
6
3
35
7
8
102
8
10
88
9
5
51
10
2
22
11
3
29
12
5
48
13
2
25
a) Să se alcătuiască tabelul de asociere în raport cu mediile celor două variabile şi să se determine coeficientul de asociere; b) Să se măsorare intensitatea legăturii dintre variabile folosind coeficienţii de corelaţie a rangurilor ai lui Spearman şi Kendall.
Rezolvare: a) Notăm cu X variabila mărimea familiei şi cu Y variabila cheltuielile medicale.
x=
x i = 58 = yi = 628 = 48,31 euro. 4, 46 pers. , y = n
13
n
13
Tabelul 9 Mărimea familiei (X)
Cheltuieli medicale (Y)
Total (ni)
Qa =
(persoane)
y 48,31
y > 48,31
x 4,46
n11 = 6
n12 = 1
7
x > 4,46
n21 = 1
n22 = 5
6
Total (nj)
7
6
13
n11 n22 − n12 n21 36 − 1 = 0,95 = n11 n 22 + n12 n21 36 + 1
b) Se acordă ranguri celor două variabile (tabelul 10). Tabelul 10 Familia
Rix
Riy
di
di2
Pi
Qi
0
1
2
3
4
5
6
1
2,5
1
1,5
2,25
12
-
10
2,5
2
0,5
0,25
11
-
13
2,5
3
-0,5
0,25
10
-
2
2,5
4
-1,5
2,25
9
-
11
5,5
5
0,5
0,25
8
-
6
5,5
6
-0,5
0,25
7
-
3
7
10
-3
9
3
3
12
9
7
2
4
5
-
4
9
8
1
1
4
-
9
9
9
0
0
3
-
5
11
11
0
0
2
-
7
12
13
-1
1
-
1
8
13
12
1
1
-
-
Total
-
-
21,5
74
4
rs =1 −
6 di2
(
)
n n −1 2
=1 −
6 21,5 = 0,94 13 168
rk =
2S 2 (74− 4) = 0,89 , rk = n (n − 1) 13 12
Valorile celor doi coeficienţi de corelaţie a rangurilor arată că legătura dintre cele două variabile este foarte puternică şi directă.
. Pentru un eșantion de 7 studenți au fost înregistrate date referitoare la calificativul obținut la testul de absolvire al unui curs intensiv de programare a calculatoarelor și nota obținută la examenul de Informatică:
Nr. crt.
𝑟𝑠 = 1 −
Calificativ
Nota
1.
foarte bine (90-100 puncte)
8
2.
Bine (70-90 puncte)
6
3.
Bine (70-90 puncte)
8
4.
foarte bine (90-100 puncte)
10
5.
Bine (70-90 puncte)
9
6.
Suficient (50-70 puncte)
5
7.
Insuficient (sub 50 puncte)
7
6 ∑ 𝑑𝑖2 6 ⋅ 17.5 = 0,6875 =1− 2 7 ⋅ 48 𝑛(𝑛 − 1)
Valorile celor doi coeficienți arată o asociere, o legătură puternică și directă între calificativul obținut și nota la examen.
1. În urma unei cercetări statistice privind intenția de vot, realizată pe un eșantion aleator de 1495 cetățeni cu drept de vot din statul Virginia, s-a obținut următoarea distribuție a alegătorilor în funcție de gen și opinia Pro sau Contra față de candidata Hillary Clinton:
Genul
Opinia
Total
Pro
Contra
feminin
475
180
655
masculin
310
530
840
Total
785
710
1495
Pentru a analiza legătura existentă între genul persoanei și intenția de vot utilizăm coeficientul de asociere Yule, calculat cu relația:
Q=
n 11n 22 − n 21n 12 475 530 − 310 180 = = 0.637 n11n 22 + n 21n12 475 530 − 310 180...