Title | Soluzioni esercizi elementari |
---|---|
Course | Statistica |
Institution | Sapienza - Università di Roma |
Pages | 23 |
File Size | 913.9 KB |
File Type | |
Total Downloads | 39 |
Total Views | 133 |
Download Soluzioni esercizi elementari PDF
Soluzioni Esercizi elementari Capitolo 1 1.1
carattere: Titolo di Studio, carattere qualitativo ordinato modalità: Diploma, Licenza media, Laurea, Licenz a elementare unità statistiche: Individui 1.2
carattere: Fatturato, carattere quantitativo continuo suddiviso in classi modalità: 0-|10, 10-|20, 20-|60, 60-|90 unità statistiche: Aziende 1.3
carattere: Addetti, carattere quantitativo discreto suddiviso in classi modalità: 0-|20, 20-|40, 40-|100, 100-|200 unità statistiche: Aziende 1.4
carattere: Numero cellulari, carattere quantitativo discreto modalità: 0, 1, 2, 3 unità statistiche: Famiglie
Capitolo 2 2.1
Reddito 0|- 10 10|- 30 30|- 60 60|-100
nj 60 50 40 10
Amp. classe
densità
10 20 30 40
60/10=6,00 50/20=2,50 40/30=1,33 10/40=0,25
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
2.2
nj
Num. addetti
Amp. classe
densità
2.5
densità
2
1.5
1
0.5
0 0
10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 Addetti
2.3
Dato che si tratta di una coppia di caratteri quantitativi osservati sulle stesse unità statistiche, il grafico più opportuno è quello di dispersione. 35 30 Voto statistica
25 20 15 10 5 0 0
5
10
15
20
25
30
35
Ore di studio
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
40
2.4
Azienda Telecom Wind Vodafone Altri
Quota
gradi
Capitolo 3 3.1
Reddito 0|- 5 5|-10 10|-20 20|-50
nj 40 30 20 10
Nj 40 70 90 100
Fj 0,4 0,7 0,9 1,0
La classe dove cade il secondo decile è la 0|- 5 poiché la frequenza relativa cumulata supera 0,2. Utilizzando la formula 3.7.1 si può approssimare il secondo decile: Secondo decile 0 0,2 0 5 0,4 0
2,5
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
3.2
Reddito 0|- 10 10|- 30 30|- 60 60|-100
Nj 60 110 150 160
nj 60 50 40 10
Fj 0,38 0,69 0,94 1,00
Amp. classe 10 20 30 40
densità 60/10=6,00 50/20=2,50 40/30=1,33 10/40=0,25
La classe modale corrisponde alla classe con più elevata densità, dunque alla classe 0|- 10 La classe mediana corrisponde alla classe 10|- 30. Applicando la formula 3.5.1 possiamo trovare la seguente approssimazione della mediana: Me
0,5 0,38 10 20 17,7 0,69 0,38
3.3
Numero dipendenti 2 3 4 5 6 7 8 Totale
nj
Nj
Fj
xj nj
10 20 40 25 25 20 10 150
10 30 70 95 120 140 150
0,07 0,20 0,47 0,63 0,80 0,93 1,00
20 60 160 125 150 140 80 735
La media è data da x a
735 150
4, 9
La moda è Moda 4 La mediana è M e 5 3.4
Reddito 0|- 1 1|- 3 3|- 5 5|-10
nj
Nj
Fj
Amp. classe
10 30 50 30
10 40 90 120
0,08 0,33 0,75 1,00
1 2 2 5
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
0,25 1 0,33 0,5 Q 2 3 0 ,75 0, 75 Q 3 3 0, 75
Q1
0 ,08 2 2,36 0 ,08 0,33 2 3,81 0 ,33 0,33 2 5,00 0,33
3.5
La media è data da x a La moda è Moda 7
51 8
6,38
Ci sono due valori mediani, il 6 e il 7 che possiamo riassumere in un unico valore M e
6 7 2
6 ,5
3.6
Classi di Fatturato 0-|10 10-|20 20-|60 60-|90 Totale
Aziende
Nj
Fj
cj
cj nj
40 30 20 10 100
40 70 90 100
0,4 0,7 0,9 1,0
5 15 40 75
200 450 800 750 2200
2200 22 100 Il primo quartile è all’interno della classe 10-|20. Un’approssimazione del primo quartile è data da 0,25 0 Q1 0 10 6 ,25 0,40 0
Un’approssimazione della media è data da xa
3.7
Numero di addetti 0-|20 20-|40 40-|100 100-|200 Totale
Aziende
Nj
Fj
cj
20 40 30 10 100
20 60 90 100
0,2 0,6 0,9 1,0
10 30 70 150
cjn j 200 1200 2100 1500 5000
5000 50 100 La classe mediana corrisponde alla classe 20-|40. Applicando la formula 3.5.1 possiamo trovare la seguente approssimazione della mediana: 0 ,5 0 ,2 M e 20 20 35 0 ,6 0,2
Una approssimazione della media è data da x a
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
Capitolo 4 4.1
Si ordinano le aziende in ordine crescente rispetto al fatturato: Azienda E D C B A Totale
Fatturato 20 50 100 200 330
Fi 0,2 0,4 0,6 0,8 1,0
Ai 20 70 170 370 700
Qi 0,029 0,100 0,243 0,529 1,000
Fi - Qi 0,17 0,30 0,36 0,27 1,10
1 ,1 0 ,55 2 ,0 Dato che l’indice R varia tra 0 e 1, possiamo concludere che il fatturato è moderatamente concentrato.
Il rapporto di concentrazione è R
1 0.9 0.8 0.7
Qi
0.6 0.5 0.4 0.3 0.2 0.1 0 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Fi
4.2 Equidistr. Max Conc. Famiglia Num. Cel. Num. Cel. A 2 0 B 2 0 C 2 0 D 2 0 E 2 10 Totale 10 10
Nel caso di massima concentrazione l’indice R vale 1, mentre nel caso di equidistribuzione vale 0.
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
4.3
X 1 2 3 4 Totale
n i X ni X2 n i 5 5 5 10 20 40 4 12 36 1 4 16 20 41 97
2
Y ni 0 5 1 13 2 2
Y ni 0 13 4
Y ni 0 13 8
20
17
21
Si ottengono i seguenti valori: 41 17 97 21 2 2 2 2 xa 2,05 y a 2 ,05 0 ,6475 0,85 0,3275 0, 85 X Y 20 20 20 20 0,80 0 ,57 100 39 ,3 CVY 100 67,3 0,80 X Y 0,57 CV X 2,05 0 ,85 Dai valori espressi dai coefficienti di variazione si deduce che nel collettivo preso in esame il carattere Y è più variabile del caratteri X 4.4
Numero di addetti 0-|20 20-|40 40-|100 100-|200 Totale
(ci-media) 2ni
Aziende
ci
c ini
20 40 30 10 100
10 30 70 150
200 1200 2100 1500 5000
Utilizzando la tabella si ottengono i seguenti valori: 5000 160000 2 40 CV X 50 xa 1600 X X 100 100
40 100 50
32000 16000 12000 100000 160000
80
4.5
Si ordinano le provincie in ordine crescente rispetto al numero di abitanti:
Provincia Rieti Viterbo Frosinone Latina Roma
Abitanti 16 32 49 55 419
Fi
Ai
Qi
F i -Qi
0.2 0.4 0.6 0.8 1 2
16 48 97 152 571
0.03 0.08 0.17 0.27 1.00
0.17 0.32 0.43 0.53 1.45
1,45 0,73 e quindi possiamo concludere che nel collettivo 2, 0 considerato gli abitanti sono molto concentrati in particolare a Roma.Il grafico della curva di concentrazione è il seguente:
Il rapporto di concentrazione è R
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
1 0.9 0.8 0.7
Qi
0.6 0.5 0.4 0.3 0.2 0.1 0 0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
Fi
4.6
Si ordinano le aziende in ordine crescente rispetto alle quote di mercato: Azienda Altri Wind Telecom Vodafone
Quota 15 20 25 40
Ai
Fi 0.25 0.5 0.75 1 1.5
15 35 60 100
Qi 0.15 0.35 0.6 1
Fi -Q i 0.1 0.15 0.15 0.4
0,4 0 ,27 e quindi possiamo concludere che nel collettivo 1,5 considerato vi è un basso livello di concentrazione. Il grafico della curva di concentrazione è il seguente:
Il rapporto di concentrazione è R
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
4.7
Max Johnny Luisa Stefania Roberto Totale
Ore di studio (X)
Voto statistica (Y)
25 20 29 38 15 127
28 23 19 30 25 125
X2
625 400 841 1444 225 3535
Y2
784 529 361 900 625 3199
Si ottiene: xa
127 5
25,4 ya
125 5
25, 0
2 X
3535 5
25 ,4 2
7,86 100 31 CVY 25 4, Le ore di studio sono più variabili del voto. X
7,86
Y
3,85 CV X
61,8
2 Y
3199 5
25 2
14 ,8
3 ,85 100 15, 4 25
Capitolo 6 6.1
Nel caso di indipendenza sia i profili riga sia i profili colonna sono uguali fra loro. Pertanto sia le righe, sia le colonne della tabella devono essere proporzionale fra loro. Ad esempio, se 5 è un quarto di 20, anche ? deve essere un quarto di 4, ossia 1. Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
Y X A B C
M 1 4 8
F 5 20 40
6 24 48
13
65
78
Si può osservare che, data l’indipendenza tra i due caratteri, ogni frequenza interna alla tabella e ni . n. j . ottenibile come nij n 6.2
Considerando la seguente tabella otteniamo X 7 2 5 3 1 18
X2 42 2 25 6 4 79
Y2 49 4 25 9 1 88
3 ,6 y a
3, 6
2 X
79 5
XY 36 1 25 4 16 82
88 2 3 ,6 3 ,44 5 2 ,84 82 3 ,6 2 2 84 , 2,15 0,71 X Y 1,85 XY XY 2,15 1,85 5 Si ottiene un valore del coefficiente di correlazione lineare pari a 0,71, quindi i due caratteri sono fortemente correlati positivamente.
xa
18 5
Y 6 1 5 2 4 18 18 5
2 3,6
4 ,64
2 Y
6.3
Considerando la seguente tabella otteniamo
X
xa
2 2 10 4 5 6 1 16
Y 3 5 10 5 20
4 1 16 5 20 10 16 16 52
2 16 4 20 6 16 52
1 ∑∑ xi y j nij n i j
4
ya
2 16 3 20 4 16 52
3
2 2 10 2 3 5 2 4 1 4 2 5 4 3 10 4 4 5 6 2 1 6 3 5 6 4 10 52
12 ,7 4 3 0,7 XY La covarianza è positiva e quindi prevale tra i due caratteri la concordanza.
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
12 ,7
6.4
Considerando la formula 6.5.2 si ottiene: Y M 4 5 6 15
X basso medio alto totale
F 8 10 12 30
totale 12 15 18 45
Poiché uno dei due caratteri sconnesso, si può utilizzare l’indice Chi-quadrato o il V di Cramer che nel caso di indipendenza valgono entrambi 0. 6.5
Y X 0 1
0 1 0,2 0,2 0,4 0,3 0,3 0,6 0,5 0,5 1,0 Dalla tabella si può notare ogni frequenza relativa congiunta è ottenibile come prodotto tra le corrispondenti frequenze relative rispettivamente di X e di Y (ad esempio, 0,3=0,6*0,5). Se ne deduce che tra i due caratteri sussiste indipendenza e quindi la covarianza è nulla. Volendo calcolare il valore della covarianza si ha: 0 0,4 1 0,6
xa
∑∑ xi y j fij i XY
0 ,6
ay
0 0 ,5 1 0 ,5
0,5
0 0 0,2 0 1 0 ,2 1 0 0 ,3 1 1 0 ,3
0 ,3
j
0 3, 0 6, 0 5,
0
6.6
Filiale A B C D E Totale
20 y a
300 60 5
Fatturato (Y) 100 80 20 45 55 300 2 X
9050 5
2
X 7000 1600 40 135 275 9050
2
Y 4900 400 4 9 25 5338
XY 10000 6400 400 2025 3025 21850
5338 60 2 5 610 21850 25,8 Y 27,7 0 ,85 20 60 610 XY X XY 25,8 27 ,7 5 Esiste una forte correlazione positiva tra il fatturato medio e il numero di addetti.
xa
100 5
Addetti (X) 70 20 2 3 5 100
20 2
667 ,6
2 Y
6.7 Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
770
Fatturato (X) 3 6 1 4 6 20 xa X
20 5 1,9
4 ya Y
2,2
28 5
5 ,6 XY
Superf. (Y) 4 7 3 5 9 28 2 X
180 5
131 5 4 5,6
4
X2
Y2
XY
12 42 3 20 54 131
9 36 1 16 36 98
16 49 9 25 81 180
2
3,8
3,6 XY
98 2 5,6 5 3 ,8 0 ,93 1,9 2 ,2
2 Y
4 ,6
Il valore dell’indice di correlazione è positivo e molto vicino a +1, pertanto il valore 0,93 indica una situazione di dipendenza lineare quasi perfetta tra i due caratteri. 6.8
La tabella doppia è quadrata (stesso numero di righe e colonne) e si può osservare che per ogni riga e colonna vi è una sola frequenza diversa da zero. È la situazione di perfetta interdipendenza tra i due caratteri. In questo caso l’indice V di Cramer assume il suo valore massimo pari a 1. 6.9
La tabella è rettangolare con un numero di righe maggiore del numero di colonne e quindi è il carattere Sesso che può dipendere perfettamente dal carattere Grado di soddisfazione ma non il contrario. Ciò si verifica se per ogni riga si ha una sola frequenza diversa da zero. Tenendo conto dei vincoli dati dalle distribuzioni marginali, si ottiene la seguente tabella.
X/Y basso medio alto totale
M 10 0 15 25
F 0 35 0 35
10 35 15 60
6.10
Considerando la seguente tabella:
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
Ore di studio (X)
Voto statistica (Y)
X2
25 20 29 38 15 127
28 23 19 30 25 125
700 460 551 1140 375 3226
Max Johnny Luisa Stefania Roberto Totale
xa
127 5
125 5
25 ,4 ya
2 X
25
3226 5
25 ,4
2
61,84
Y2
XY
625 784 400 529 841 361 1444 900 225 625 3535 3199
2 Y
3535 5
25
2
14 ,8
10,2 3199 25 ,4 25 10 ,2 0 ,34 XY 7,86 3,85 5 Il voto di statistica è moderatamente correlato positivamente ma con il numero di ore di studio. X
7,86
Y
3,85
XY
Capitolo 8 8.1
Il problema fornisce i seguenti dati: Pr(Occupato Laureato)=0,9 Pr(Occupato Non Laureato)=0,7 Pr(Laureato)=0,5 e quindi Pr(Non Laureato)=1- Pr(Laureato)=0,5 Applicando il teorema di Bayes si ottiene: Pr Laureato Occupato
Pr Occupato Laureato Pr Laureato Pr Occupato Laureato Pr Laureato 0 ,9 0 ,5 0,9 0,5 0,7 0,5
0,45 0,80
Pr Occupato Non Laureato Pr Non Laureato
0,5625
8.2
Indicando con D1 e D2 i risultati dei due dadi, si vuole determinare la seguente probabilità: Pr(D1+D2=num. pari) La somma dei due risultati viene pari se: (D1=pari e D2=pari) oppure se (D1=dispari e D2=dispari), dunque: Pr(D1+D2=num. pari)=Pr(D1=pari ∩ D2=pari)+Pr(D1=dispari ∩ D2=dispari) poichè D1 e D2 sono indipendenti possiamo scrivere Pr(D1+D2=num. pari)= Pr(D1=pari)Pr(D2=pari)+Pr(D1=dispari)Pr(D2=dispari) dunque: Pr D1
D2
num . pari
33 66
33 66
1 . 2
Un modo alternativo di risolvere l’esercizio è quello di considerare la distribuzione di probabilità della v.c. D1+D2 e quindi calcolare: Pr(D1+D2=num.pari)= =Pr(D1+D2=2)+Pr(D1+D2=4)+Pr(D1+D2=6)+Pr(D1+D2=8)+Pr(D1+D2=10)+Pr(D1+D2=12)= Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
=1/36+3/36+5/36+5/36+3/36+1/36=18/36=1/2. 8.3
Il problema fornisce i seguenti dati: Pr(Vince)= 0,5 Pr(Pareggia)=0,3 Pr(Perde)=0,2 Pr(Bandiera Vince)=0,5 Pr(Bandiera Pareggia)=0,5 Pr(Bandiera Perde)=0 Si vogliono calcolare le seguenti probabilità: Pr(Vince Bandiera) Pr(Pareggia Bandiera) Pr(Perde Bandiera) Per far ciò si applica il teorema di Bayes: Pr Vince Bandiera Pr Bandiera Vince Pr Vince Pr Bandiera Vince Pr Vince
Pr Bandiera Pareggia Pr Pareggia
Pr Bandiera Perde Pr Perde
0, 5 0,5 0 ,25 0 ,625 , , , , , 0 5 0 5 0 5 0 3 0 0 2 0 ,40 in modo analogo si ottiene , Pr Pareggia Bandiera 0 15 0,375 0 ,40 0 0 Pr Perde Bandiera , 0 40 8.4
Se indichiamo con successo l’evento che il dado mostri la faccia con il numero 6, si vuole valutare la probabilità che in 5 lanci si osservino 6 successi. La variabile considerata è una variabile casuale Binomiale con parametri: n=5 e π=Pr(successo)=Pr(il dado mostra il numero 6)=1/6. 5 5! Pr X 2; n 5, , 5 2 0,17 0 ,17 2 1 0 17 0 ,17 2 0 ,83 3 10 0 ,17 2 0 ,83 3 0 165 , 2 2 3 ! ! La probabilità che in 5 lanci il numero 6 esca 2 volte è pari a 0,165. 8.5
Sappiamo che: Pr A riscrivere: Pr A B da cui Pr B
B Pr A
Pr A Pr B
Pr A B Pr A 1 Pr A
Pr B
Pr A
B ma poiché A e B sono indipendenti si può
Pr A Pr B
0,65 0,3 0 ,7
0,35 0 ,5 0,70
Simone Borra, Agostino Di Ciaccio, Statistica. Metodologie per le scienze economiche e sociali, terza edizione Copyright ©2014 McGraw-Hill Education (Italy) S.r.l.
Capitolo 9 9.1
f(x) 0 0,1 2 0,8 4 0,1 Totale 1,0
Xf(x) X2f(x) 0,9 0,0 1,6 3,2 0,4 1,6 2,0 4,8
E X 0 01 , 2 0 8, 4 01 , 2
4 ,8
V X
22
0 ,8