Soluzioni esercizi elementari PDF

Title Soluzioni esercizi elementari
Course Statistica
Institution Sapienza - Università di Roma
Pages 23
File Size 913.9 KB
File Type PDF
Total Downloads 39
Total Views 133

Summary

Download Soluzioni esercizi elementari PDF


Description

Soluzioni Esercizi elementari Capitolo 1 1.1

carattere: Titolo di Studio, carattere qualitativo ordinato modalità: Diploma, Licenza media, Laurea, Licenz a elementare unità statistiche: Individui 1.2

carattere: Fatturato, carattere quantitativo continuo suddiviso in classi modalità: 0-|10, 10-|20, 20-|60, 60-|90 unità statistiche: Aziende 1.3

carattere: Addetti, carattere quantitativo discreto suddiviso in classi modalità: 0-|20, 20-|40, 40-|100, 100-|200 unità statistiche: Aziende 1.4

carattere: Numero cellulari, carattere quantitativo discreto modalità: 0, 1, 2, 3 unità statistiche: Famiglie

Capitolo 2 2.1

Reddito 0|- 10 10|- 30 30|- 60 60|-100

nj 60 50 40 10

Amp. classe

densità

10 20 30 40

60/10=6,00 50/20=2,50 40/30=1,33 10/40=0,25

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

2.2

nj

Num. addetti

Amp. classe

densità

2.5

densità

2

1.5

1

0.5

0 0

10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 Addetti

2.3

Dato che si tratta di una coppia di caratteri quantitativi osservati sulle stesse unità statistiche, il grafico più opportuno è quello di dispersione. 35 30 Voto statistica

25 20 15 10 5 0 0

5

10

15

20

25

30

35

Ore di studio

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

40

2.4

Azienda Telecom Wind Vodafone Altri

Quota

gradi

Capitolo 3 3.1

Reddito 0|- 5 5|-10 10|-20 20|-50

nj 40 30 20 10

Nj 40 70 90 100

Fj 0,4 0,7 0,9 1,0

La classe dove cade il secondo decile è la 0|- 5 poiché la frequenza relativa cumulata supera 0,2. Utilizzando la formula 3.7.1 si può approssimare il secondo decile: Secondo decile 0  0,2 0  5  0,4 0 

2,5

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

3.2

Reddito 0|- 10 10|- 30 30|- 60 60|-100

Nj 60 110 150 160

nj 60 50 40 10

Fj 0,38 0,69 0,94 1,00

Amp. classe 10 20 30 40

densità 60/10=6,00 50/20=2,50 40/30=1,33 10/40=0,25

La classe modale corrisponde alla classe con più elevata densità, dunque alla classe 0|- 10 La classe mediana corrisponde alla classe 10|- 30. Applicando la formula 3.5.1 possiamo trovare la seguente approssimazione della mediana: Me

 0,5 0,38  10   20 17,7  0,69 0,38 

3.3

Numero dipendenti 2 3 4 5 6 7 8 Totale

nj

Nj

Fj

xj nj

10 20 40 25 25 20 10 150

10 30 70 95 120 140 150

0,07 0,20 0,47 0,63 0,80 0,93 1,00

20 60 160 125 150 140 80 735

La media è data da x a

735 150

4, 9

La moda è Moda 4 La mediana è M e 5 3.4

Reddito 0|- 1 1|- 3 3|- 5 5|-10

nj

Nj

Fj

Amp. classe

10 30 50 30

10 40 90 120

0,08 0,33 0,75 1,00

1 2 2 5

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

 0,25 1   0,33  0,5 Q 2 3   0 ,75  0, 75 Q 3  3  0, 75

Q1

0 ,08   2 2,36 0 ,08  0,33   2 3,81 0 ,33  0,33   2 5,00 0,33 

3.5

La media è data da x a La moda è Moda 7

51 8

6,38

Ci sono due valori mediani, il 6 e il 7 che possiamo riassumere in un unico valore M e

6 7 2

6 ,5

3.6

Classi di Fatturato 0-|10 10-|20 20-|60 60-|90 Totale

Aziende

Nj

Fj

cj

cj nj

40 30 20 10 100

40 70 90 100

0,4 0,7 0,9 1,0

5 15 40 75

200 450 800 750 2200

2200 22 100 Il primo quartile è all’interno della classe 10-|20. Un’approssimazione del primo quartile è data da  0,25 0  Q1 0   10 6 ,25  0,40 0 

Un’approssimazione della media è data da xa

3.7

Numero di addetti 0-|20 20-|40 40-|100 100-|200 Totale

Aziende

Nj

Fj

cj

20 40 30 10 100

20 60 90 100

0,2 0,6 0,9 1,0

10 30 70 150

cjn j 200 1200 2100 1500 5000

5000 50 100 La classe mediana corrisponde alla classe 20-|40. Applicando la formula 3.5.1 possiamo trovare la seguente approssimazione della mediana:  0 ,5 0 ,2  M e 20   20 35  0 ,6 0,2 

Una approssimazione della media è data da x a

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

Capitolo 4 4.1

Si ordinano le aziende in ordine crescente rispetto al fatturato: Azienda E D C B A Totale

Fatturato 20 50 100 200 330

Fi 0,2 0,4 0,6 0,8 1,0

Ai 20 70 170 370 700

Qi 0,029 0,100 0,243 0,529 1,000

Fi - Qi 0,17 0,30 0,36 0,27 1,10

1 ,1 0 ,55 2 ,0 Dato che l’indice R varia tra 0 e 1, possiamo concludere che il fatturato è moderatamente concentrato.

Il rapporto di concentrazione è R

1 0.9 0.8 0.7

Qi

0.6 0.5 0.4 0.3 0.2 0.1 0 0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Fi

4.2 Equidistr. Max Conc. Famiglia Num. Cel. Num. Cel. A 2 0 B 2 0 C 2 0 D 2 0 E 2 10 Totale 10 10

Nel caso di massima concentrazione l’indice R vale 1, mentre nel caso di equidistribuzione vale 0.

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

4.3

X 1 2 3 4 Totale

n i X ni X2 n i 5 5 5 10 20 40 4 12 36 1 4 16 20 41 97

2

Y ni 0 5 1 13 2 2

Y ni 0 13 4

Y ni 0 13 8

20

17

21

Si ottengono i seguenti valori: 41 17 97 21 2 2 2 2 xa 2,05 y a 2 ,05 0 ,6475 0,85 0,3275 0, 85 X Y 20 20 20 20 0,80 0 ,57 100 39 ,3 CVY 100 67,3 0,80 X Y 0,57 CV X 2,05 0 ,85 Dai valori espressi dai coefficienti di variazione si deduce che nel collettivo preso in esame il carattere Y è più variabile del caratteri X 4.4

Numero di addetti 0-|20 20-|40 40-|100 100-|200 Totale

(ci-media) 2ni

Aziende

ci

c ini

20 40 30 10 100

10 30 70 150

200 1200 2100 1500 5000

Utilizzando la tabella si ottengono i seguenti valori: 5000 160000 2 40 CV X 50 xa 1600 X X 100 100

40 100 50

32000 16000 12000 100000 160000

80

4.5

Si ordinano le provincie in ordine crescente rispetto al numero di abitanti:

Provincia Rieti Viterbo Frosinone Latina Roma

Abitanti 16 32 49 55 419

Fi

Ai

Qi

F i -Qi

0.2 0.4 0.6 0.8 1 2

16 48 97 152 571

0.03 0.08 0.17 0.27 1.00

0.17 0.32 0.43 0.53 1.45

1,45 0,73 e quindi possiamo concludere che nel collettivo 2, 0 considerato gli abitanti sono molto concentrati in particolare a Roma.Il grafico della curva di concentrazione è il seguente:

Il rapporto di concentrazione è R

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

1 0.9 0.8 0.7

Qi

0.6 0.5 0.4 0.3 0.2 0.1 0 0

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

1

Fi

4.6

Si ordinano le aziende in ordine crescente rispetto alle quote di mercato: Azienda Altri Wind Telecom Vodafone

Quota 15 20 25 40

Ai

Fi 0.25 0.5 0.75 1 1.5

15 35 60 100

Qi 0.15 0.35 0.6 1

Fi -Q i 0.1 0.15 0.15 0.4

0,4 0 ,27 e quindi possiamo concludere che nel collettivo 1,5 considerato vi è un basso livello di concentrazione. Il grafico della curva di concentrazione è il seguente:

Il rapporto di concentrazione è R

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

4.7

Max Johnny Luisa Stefania Roberto Totale

Ore di studio (X)

Voto statistica (Y)

25 20 29 38 15 127

28 23 19 30 25 125

X2

625 400 841 1444 225 3535

Y2

784 529 361 900 625 3199

Si ottiene: xa

127 5

25,4 ya

125 5

25, 0

2 X

3535 5

25 ,4 2

7,86 100 31 CVY 25 4, Le ore di studio sono più variabili del voto. X

7,86

Y

3,85 CV X

61,8

2 Y

3199 5

25 2

14 ,8

3 ,85 100 15, 4 25

Capitolo 6 6.1

Nel caso di indipendenza sia i profili riga sia i profili colonna sono uguali fra loro. Pertanto sia le righe, sia le colonne della tabella devono essere proporzionale fra loro. Ad esempio, se 5 è un quarto di 20, anche ? deve essere un quarto di 4, ossia 1. Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

Y X A B C

M 1 4 8

F 5 20 40

6 24 48

13

65

78

Si può osservare che, data l’indipendenza tra i due caratteri, ogni frequenza interna alla tabella e ni . n. j . ottenibile come nij n 6.2

Considerando la seguente tabella otteniamo X 7 2 5 3 1 18

X2 42 2 25 6 4 79

Y2 49 4 25 9 1 88

3 ,6 y a

3, 6

2 X

79 5

XY 36 1 25 4 16 82

88 2 3 ,6 3 ,44 5 2 ,84 82 3 ,6 2 2 84 , 2,15 0,71 X Y 1,85 XY XY 2,15 1,85 5 Si ottiene un valore del coefficiente di correlazione lineare pari a 0,71, quindi i due caratteri sono fortemente correlati positivamente.

xa

18 5

Y 6 1 5 2 4 18 18 5

2 3,6

4 ,64

2 Y

6.3

Considerando la seguente tabella otteniamo

X

xa

2 2 10 4 5 6 1 16

Y 3 5 10 5 20

4 1 16 5 20 10 16 16 52

2 16 4 20 6 16 52

1 ∑∑ xi y j nij n i j

4

ya

2 16 3 20 4 16 52

3

2 2 10 2 3 5 2 4 1 4 2 5 4 3 10 4 4 5 6 2 1 6 3 5 6 4 10 52

12 ,7 4 3 0,7 XY La covarianza è positiva e quindi prevale tra i due caratteri la concordanza.

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

12 ,7

6.4

Considerando la formula 6.5.2 si ottiene: Y M 4 5 6 15

X basso medio alto totale

F 8 10 12 30

totale 12 15 18 45

Poiché uno dei due caratteri sconnesso, si può utilizzare l’indice Chi-quadrato o il V di Cramer che nel caso di indipendenza valgono entrambi 0. 6.5

Y X 0 1

0 1 0,2 0,2 0,4 0,3 0,3 0,6 0,5 0,5 1,0 Dalla tabella si può notare ogni frequenza relativa congiunta è ottenibile come prodotto tra le corrispondenti frequenze relative rispettivamente di X e di Y (ad esempio, 0,3=0,6*0,5). Se ne deduce che tra i due caratteri sussiste indipendenza e quindi la covarianza è nulla. Volendo calcolare il valore della covarianza si ha: 0 0,4 1 0,6

xa

∑∑ xi y j fij i XY

0 ,6

ay

0 0 ,5 1 0 ,5

0,5

0 0 0,2 0 1 0 ,2 1 0 0 ,3 1 1 0 ,3

0 ,3

j

0 3, 0 6, 0 5,

0

6.6

Filiale A B C D E Totale

20 y a

300 60 5

Fatturato (Y) 100 80 20 45 55 300 2 X

9050 5

2

X 7000 1600 40 135 275 9050

2

Y 4900 400 4 9 25 5338

XY 10000 6400 400 2025 3025 21850

5338 60 2 5 610 21850 25,8 Y 27,7 0 ,85 20 60 610 XY X XY 25,8 27 ,7 5 Esiste una forte correlazione positiva tra il fatturato medio e il numero di addetti.

xa

100 5

Addetti (X) 70 20 2 3 5 100

20 2

667 ,6

2 Y

6.7 Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

770

Fatturato (X) 3 6 1 4 6 20 xa X

20 5 1,9

4 ya Y

2,2

28 5

5 ,6 XY

Superf. (Y) 4 7 3 5 9 28 2 X

180 5

131 5 4 5,6

4

X2

Y2

XY

12 42 3 20 54 131

9 36 1 16 36 98

16 49 9 25 81 180

2

3,8

3,6 XY

98 2 5,6 5 3 ,8 0 ,93 1,9 2 ,2

2 Y

4 ,6

Il valore dell’indice di correlazione è positivo e molto vicino a +1, pertanto il valore 0,93 indica una situazione di dipendenza lineare quasi perfetta tra i due caratteri. 6.8

La tabella doppia è quadrata (stesso numero di righe e colonne) e si può osservare che per ogni riga e colonna vi è una sola frequenza diversa da zero. È la situazione di perfetta interdipendenza tra i due caratteri. In questo caso l’indice V di Cramer assume il suo valore massimo pari a 1. 6.9

La tabella è rettangolare con un numero di righe maggiore del numero di colonne e quindi è il carattere Sesso che può dipendere perfettamente dal carattere Grado di soddisfazione ma non il contrario. Ciò si verifica se per ogni riga si ha una sola frequenza diversa da zero. Tenendo conto dei vincoli dati dalle distribuzioni marginali, si ottiene la seguente tabella.

X/Y basso medio alto totale

M 10 0 15 25

F 0 35 0 35

10 35 15 60

6.10

Considerando la seguente tabella:

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

Ore di studio (X)

Voto statistica (Y)

X2

25 20 29 38 15 127

28 23 19 30 25 125

700 460 551 1140 375 3226

Max Johnny Luisa Stefania Roberto Totale

xa

127 5

125 5

25 ,4 ya

2 X

25

3226 5

25 ,4

2

61,84

Y2

XY

625 784 400 529 841 361 1444 900 225 625 3535 3199

2 Y

3535 5

25

2

14 ,8

10,2 3199 25 ,4 25 10 ,2 0 ,34 XY 7,86 3,85 5 Il voto di statistica è moderatamente correlato positivamente ma con il numero di ore di studio. X

7,86

Y

3,85

XY

Capitolo 8 8.1

Il problema fornisce i seguenti dati: Pr(Occupato Laureato)=0,9 Pr(Occupato Non Laureato)=0,7 Pr(Laureato)=0,5 e quindi Pr(Non Laureato)=1- Pr(Laureato)=0,5 Applicando il teorema di Bayes si ottiene: Pr Laureato Occupato

Pr Occupato Laureato Pr Laureato Pr Occupato Laureato Pr Laureato 0 ,9 0 ,5 0,9 0,5 0,7 0,5

0,45 0,80

Pr Occupato Non Laureato Pr Non Laureato

0,5625

8.2

Indicando con D1 e D2 i risultati dei due dadi, si vuole determinare la seguente probabilità: Pr(D1+D2=num. pari) La somma dei due risultati viene pari se: (D1=pari e D2=pari) oppure se (D1=dispari e D2=dispari), dunque: Pr(D1+D2=num. pari)=Pr(D1=pari ∩ D2=pari)+Pr(D1=dispari ∩ D2=dispari) poichè D1 e D2 sono indipendenti possiamo scrivere Pr(D1+D2=num. pari)= Pr(D1=pari)Pr(D2=pari)+Pr(D1=dispari)Pr(D2=dispari) dunque: Pr D1

D2

num . pari

33 66

33 66

1 . 2

Un modo alternativo di risolvere l’esercizio è quello di considerare la distribuzione di probabilità della v.c. D1+D2 e quindi calcolare: Pr(D1+D2=num.pari)= =Pr(D1+D2=2)+Pr(D1+D2=4)+Pr(D1+D2=6)+Pr(D1+D2=8)+Pr(D1+D2=10)+Pr(D1+D2=12)= Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

=1/36+3/36+5/36+5/36+3/36+1/36=18/36=1/2. 8.3

Il problema fornisce i seguenti dati: Pr(Vince)= 0,5 Pr(Pareggia)=0,3 Pr(Perde)=0,2 Pr(Bandiera Vince)=0,5 Pr(Bandiera Pareggia)=0,5 Pr(Bandiera Perde)=0 Si vogliono calcolare le seguenti probabilità: Pr(Vince Bandiera) Pr(Pareggia Bandiera) Pr(Perde Bandiera) Per far ciò si applica il teorema di Bayes: Pr Vince Bandiera Pr Bandiera Vince Pr Vince Pr Bandiera Vince Pr Vince

Pr Bandiera Pareggia Pr Pareggia

Pr Bandiera Perde Pr Perde

0, 5 0,5 0 ,25 0 ,625 , , , , , 0 5 0 5 0 5 0 3 0 0 2 0 ,40 in modo analogo si ottiene , Pr Pareggia Bandiera 0 15 0,375 0 ,40 0 0 Pr Perde Bandiera , 0 40 8.4

Se indichiamo con successo l’evento che il dado mostri la faccia con il numero 6, si vuole valutare la probabilità che in 5 lanci si osservino 6 successi. La variabile considerata è una variabile casuale Binomiale con parametri: n=5 e π=Pr(successo)=Pr(il dado mostra il numero 6)=1/6. 5  5! Pr X 2; n 5, , 5 2 0,17   0 ,17 2 1 0 17 0 ,17 2 0 ,83 3 10 0 ,17 2 0 ,83 3 0 165 , 2 2 3 ! !   La probabilità che in 5 lanci il numero 6 esca 2 volte è pari a 0,165. 8.5

Sappiamo che: Pr A riscrivere: Pr A B da cui Pr B

B Pr A

Pr A Pr B

Pr A B Pr A 1 Pr A

Pr B

Pr A

B ma poiché A e B sono indipendenti si può

Pr A Pr B

0,65 0,3 0 ,7

0,35 0 ,5 0,70

Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.

Capitolo 9 9.1

f(x) 0 0,1 2 0,8 4 0,1 Totale 1,0

Xf(x) X2f(x) 0,9 0,0 1,6 3,2 0,4 1,6 2,0 4,8

E X 0 01 , 2 0 8, 4 01 , 2

4 ,8

V X

22

0 ,8


Similar Free PDFs