Elaborato Statistica Economica 2021 PDF

Title Elaborato Statistica Economica 2021
Course Statistica Economica
Institution Università telematica Universitas Mercatorum di Roma
Pages 7
File Size 532.5 KB
File Type PDF
Total Downloads 426
Total Views 466

Summary

II Elaborato marzo-aprile 2021 – L1. Esercizio Per la seguente distribuzione di frequenze che rappresenta il peso di 71 confezioni di burro calcolare:a. il valore mediano e il valore medio aritmetico della distribuzione b. una misura di variabilità che non dipenda dall’unità di misura c. come si pos...


Description

II Elaborato marzo-aprile 2021 – L14 1. Esercizio Per la seguente distribuzione di frequenze che rappresenta il peso di 71 confezioni di burro calcolare:

a. il valore mediano e il valore medio aritmetico della distribuzione b. una misura di variabilità che non dipenda dall’unità di misura c. come si possono confrontare questi risultati con quelli di una distribuzione di confezioni da 500 grammi con media pari a 503,3 grammi ed una varianza pari a 36 grammi?

SOLUZIONE PUNTO A Si osserva che dati del campione sono rappresentati con tabella di frequenze per classi e quindi il carattere delle nostre osservazioni è di tipo quantitativo. Essendo in classi, sono implicitamente ordinabili, per questi motivi si può calcolare la mediana. Definizione di mediana: la mediana è definita come quel valore (centrale) che, una volta ordinati i dati del campione, lascia alla sua sinistra e alla sua destra la metà del campione, ossia che divide a metà la distribuzione dei dati ordinati. Nel caso di dati raccolti in classi, bisogna individuare: 1. La classe mediana, che corrisponde alla posizione della mediana ed è data: Se “n” è dispari. La posizione è

𝑛+1 (il nostro caso) 2 𝑛

Se “n” è pari. Si hanno due valori, uno in posizione

2

e l’altro in posizione

𝑛 +1 2

2. Il valore specifico all’interno della classe mediana, ipotizzando che le osservazioni che cadono nell’intervallo della classe siano equidistribuite, dato da:

Me = xi +

𝑛+1 −𝑁𝑖−1 2

𝑙𝑖

Per comodità si riscrive la tabella per individuare tutti i parametri per eseguire l’esercizio:

Peso confezioni di burro espresso in grammi

Numero confezioni di burrro

ni

Ni

li

< 250 250-251 251-252 252-253 253-254 254-255 Totale

0 15 27 18 10 1 71

0 15 42 60 70 71

0 15 27 18 10 1

Ci Ci * ni

si

si2 si2* ni

Ni = Frequenza cumulata li = Densità di frequenza

ni = Frequenze osservate

Calcoliamo e inseriamo in tabella le frequenze cumulate con la formula: Calcoliamo la posizione della nostra mediana, tenendo conto che le nostre osservazioni sono “n” dispari, quindi individuiamo la classe in cui si trova la nostra mediana.

𝑛+1

La posizione è

2

=

𝟕𝟏+1 2

= 36

Nella colonna delle frequenze cumulate andiamo a vedere dove cade la posizione 36. Sappiamo che dalla posizione 16 alla 42 la classe della mediana è la classe 251-252, quindi la posizione della mediana (36) si trova nella classe 251-252, detta classe mediana. Trovata la classe mediana, andiamo a calcolare il valore all’interno della classe mediana. Prima, dobbiamo calcolarci la densità di frequenza (li) data da: dove

= ampiezza di classe

La nostra ampiezza di classe è costante ed è 1, quindi la densità di frequenza è: li = ni Il valore specifico all’interno della classe mediana, “valore mediano”, è:

Me = xi +

𝑛+1 2

−𝑁𝑖−1 𝑙𝑖

xi= valore inferiore della classe mediana = 251 li = densità di frequenza della classe mediana = 27 Ni-1= frequenza cumulata della classe precedente = 15 Me = 251 +

36−15 = 251,78 valore mediano 27

Definizione di media aritmetica: la media (aritmetica) è data dalla somma, diviso il numero di osservazioni

Quando le modalità sono espresse in classi non possiamo applicare la formula in maniera diretta. È necessario calcolare per ogni intervallo il rispettivo valore centrale Ci e poi su questo andare ad applicare la formula. Tale operazione implica una approssimazione nel calcolo della media, inevitabile.

Riprendendo la nostra tabella andiamo a inserire i dati della colonna Ci e Ci * ni

ni

Ni

li

< 250 250-251 251-252 252-253 253-254 254-255 Totale

0 15 27 18 10 1 71

0 15 42 60 70 71

0 15 27 18 10 1

Ci = valore centrale della classe 𝐱 =

Numero confezioni di burrro

Peso confezioni di burro espresso in grammi

17882,5 71

Ci Ci * ni 0

0

250,5 251,5 252,5 253,5

3757,5 6790,5 4545 2535

254,5

254,5 17882,5

si S2i s2i * ni

Ci * ni = prodotto del valore centrale per frequenza osservata

= 251,87 valore medio aritmetico SOLUZIONE PUNTO B

La misura di variabilità che non dipende dall’unità di misura che abbiamo scelto è lo "varianza”, indicato con “s2” o con “σ2” se ci riferiamo alla varianza campionaria come nel nostro caso. La varianza fornisce una misura della variabilità dei valori assunti dalla variabile stessa; nello specifico, la misura di quanto essi si discostino quadraticamente rispettivamente dalla media aritmetica. La formula della varianza è la seguente:

Nella formula della varianza, compare al numeratore la formula degli scarti al quadrato che indichiamo con s2i = (xi - 𝑥 )2 . Gli scarti dalla media esprimono quanto le osservazioni si discostano dalla media. Riprendendo la nostra tabella andiamo a inserire i dati della colonna si, s2i e s2i * ni N.B. i calcoli sono eseguiti in tabelle excel con formule, tenendo conto di tutte le cifre dopo la virgola

Peso confezioni di burro espresso in grammi

Numero confezioni di burrro

ni

Ni

li

< 250 250-251 251-252 252-253 253-254 254-255 Totale

0 15 27 18 10 1 71

0 15 42 60 70 71

0 15 27 18 10 1

Ci Ci * ni

si

s2i s2i * ni

0

0

0

0

0

250,5 251,5 252,5 253,5

3757,5 6790,5 4545 2535

-1,37 -0,37 0,63 1,63

1,87 0,13 0,40 2,67

28,00 3,62 7,23 26,69

254,5

254,5

2,63

6,94

6,94 72,48

17882,5

si = scarto (Ci - 𝑥) s2i = scarto al quadrato s2i * ni = scarto al quadrato per frequenza osservata

Ci = valore centrale della classe Esempio di calcolo si Classe 250-252 →

σ2 =

𝑠𝑖2 ∗ 𝑛𝑖

∑ 𝑛 −1 𝑖

=

𝒙 = 251,87

si = (Ci -  𝑥) = 250.5 - 251,87 = - 1,37

72,48 = 1,04 varianza campionaria 70

SOLUZIONE PUNTO C Per confrontare la distribuzione che abbiamo con quelli di una distribuzione di confezioni da 500 grammi con media pari a 503,3 grammi ed una varianza pari a 36 grammi, l “Coefficiente di Variazione”, Facciamo una precisazione, il valore 36 grammi espresso nella stessa unità di misura del campione, è inteso come lo “scostamento quadratico medio” della distribuzione da 500 grammi. Nel punto precedente abbiamo calcolato la varianza che ci esprime il valore in grammi al quadrato. Con lo scostamento quadratico medio riportiamo il valore in grammi. σ = √𝛔𝟐 = √1,04 = 1,02 grammi Una volta calcolato lo scostamento quadratico medio possiamo calcolare il “Coefficiente di Variazione”, attraverso la formula: CV250 grammi =

σ 𝑥

x 100 =

σ 𝑥

x 100 =

CV500 grammi =

1,02

251,87

x 100 = 0.4

36

503,3

x 100 = 1,19

Possiamo affermare che la distribuzione di confezioni da 500 gr. è più variabile di quella di 250 gr.

2. Esercizio Si disponga delle seguenti informazioni campionarie sulla soddisfazione per un servizio di vendita on line secondo la residenza anagrafica della clientela:

a. Calcolare l’indice del chi-quadro (mostrando i passaggi necessari per il calcolo dell’indice) b. Calcolare un indice del chi-quadro relativo c. Commentare i risultati

SOLUZIONE PUNTO A Per semplicità e per avere i dati necessari per il calcolo di quanto richiesto abbiamo riorganizzato la tabella doppia come segue:

Tabella vendita online - Distribuzione di frequenza doppia x e y N.B. i numeri ricavati da tabella excel tengono conto di tutti i numeri dopo la virgola.

Frequenza osservata = nij Frequenza teorica = nij* Differenza contingenza = cij 2 2 Contingenza al quadrato = cij Indice Chi quadro = χ Indice di Cramer = V Step 1: Abbiamo evidenziato in amaranto le frequenze osservate nij. Dalla somma delle frequenze osservate, per ogni riga e colonna, la frequenza marginale: righe: colonne:

7+10+9= 26 12+28+18= 58 14+12+9= 35 4+14+5= 23 7+12+14+4= 37 10+28+12+14= 64 9+18+9+5= 41

La somma delle frequenze marginali di ogni riga e di ogni colonna è: 142 righe: 26+58+35+23= 142 colonne: 37+64+41= 142 Step 2: Per calcolare il Chi quadro, ci serve calcolare le frequenze teoriche di indipendenza nij*. Sappiamo che se i = grado di soddisfazione e j = residenza anagrafica sono indipendenti, le frequenze che stanno all’interno della distribuzione devono soddisfare la proprietà della formula:

𝑛𝑖 𝑥 𝑛𝑗 𝑛 ni = marginale riga nj = marginale colonna n = totale frequenze marginali Inseriamo una colonna nij*per ogni residenza anagrafica e inseriamo i dati della formula, Es. Roma

nij* =

Soddisfatto

nij* =

37 𝑥 26 142

= 6,77

Abbastanza soddisfatto

nij* =

37 𝑥 58 142

= 15,11

Poco soddisfatto

nij* =

37 𝑥 35 142

= 9,12

Insoddisfatto

nij* =

37 𝑥 23 142

= 5,99

Stesso procedimento per le colonne Torino e Milano. Step 3: Una volta calcolate le frequenze teorica, andiamo a calcolarci la differenza di contingenza cij, che esprime la differenza tra le frequenze osservate e quelle teoriche: cij = nij - nij* Come in precedenza, andiamo a inserire la colonna delle cij per ogni residenza anagrafica. Es. Roma Soddisfatto cij = 7 - 6,77 = 0,23 Abbastanza soddisfatto

cij = 12 – 15,11 = - 3,11

Poco soddisfatto

cij = 14 – 9,12 = 4,88

Insoddisfatto

cij = 4 – 5,99 = - 1,99

Stesso procedimento per le colonne Torino e Milano. Step 4: Sappiamo che nella formula del chi quadro appare la contingenza al quadrato, quindi inseriamo una nuova colonna cij2 per ogni residenza. Es. Roma Soddisfatto

cij2 = 0,232 = 0,05

Abbastanza soddisfatto

cij2 = - 3,112 = 9,69

Poco soddisfatto

cij2 = 4,882 = 23,82

Insoddisfatto

cij2 = - 1,992 = 3,97

Stesso procedimento per le colonne Torino e Milano.

Step 5: Per aiutarci nel calcolo del chi quadro, andiamo a inserire una nuova colonna χ2, per ogni residenza, dove inseriamo il valore che otteniamo dividendo la contingenza al quadrato cij2 per la corrispondente frequenza teorica nij* Questo perché il chi quadro è dato da: Es. Roma Soddisfatto

χ2=

0,05

Abbastanza soddisfatto

χ2=

9,69

Poco soddisfatto

χ2=

Insoddisfatto

χ2=

6,77

= 0,01

15,11

23,82 9,12 3,97 5,99

= 0,64 = 2,61

= 0,66

Stesso procedimento per le colonne Torino e Milano. Step 6: Una individuati tutti i valori dello step precedente andiamo a sommarli per riga e per colonna (valori indicati in blu nella tabella), ottenendo il valore del χ 2 = 7.40 indice del chi quadro Questo valore ≠ da 0 significa che la situazione non è di indipendenza, ma c’è un legame tra i e j.

SOLUZIONE PUNTO B L’indice del chi quadro relativo scelto è l’indice di Cramer V. Per calcolare l’indice di Cramer dato dalla formula: V =

2



χ2

χ2𝑚𝑎𝑥

dobbiamo calcolare χ 2max che è dato dalla formula: χ 2max = n · min [(h-1); (k-1)] = 142 x 2 = 284 Ora possiamo applicare la formula dell’indice di Cramer: V=

2

χ2

√ χ2

𝑚𝑎𝑥

=

2



7,40 = 0,16 indice relativo del chi quadro 284

SOLUZIONE PUNTO C Le Tabelle doppie di frequenze sono utili per analizzare simultaneamente due caratteri. Da queste possiamo misurare il grado di dipendenza/interdipendenza tra due caratteri con il chi2. Per superare il difetto di non essere un indice “relativo”, calcolato l’indice relativo di Cramer, che sappiamo che varia tra zero ed uno. Il risultato ottenuto ci dice che nel nostro caso abbiamo “una dipendenza bassa”...


Similar Free PDFs