Lezione 14 PDF

Title	Lezione 14
Course	Statistica Sociale
Institution	Università Cattolica del Sacro Cuore
Pages	5
File Size	355.2 KB
File Type	PDF
Total Downloads	68
Total Views	142

Preview

CLICK TO PREVIEW PDF

Summary

Download Lezione 14 PDF

Description

NORMALIZZARE E STANDARDIZZARE Obiettivi ! • Comprendere il signiﬁcato dei due verbi! • Identiﬁcare come si normalizza un indicatore! • Identiﬁcare come si normalizza lo s.q.m ! • Comprendere come si standardizza una variabile statistica ! NORMALIZZARE UN INDICATORE! La normalizzazione di una misura è una procedura con due signiﬁcati diversi tra loro connessi. ! Nel primo signiﬁcato, un indicatore è normalizzato se è "ricondotto a norma", sterilizzando (ovvero annullando) l'eﬀetto di alcuni fattori di disturbo. ! Per esempio, abbiamo visto come la varianza è una misura di variabilità inﬂuenzata dall'ordine di grandezza del fenomeno osservato (perché nasce dal calcolo degli scarti della media della variabile, e poi sono elevati al quadrato). ! Un modo grezzo (ma eﬃcace) per ‘normalizzare’ la varianza consiste quindi nell'annullare (o sterilizzare da) l'eﬀetto dell'ordine di grandezza della variabile, deﬁnendo una quantità adimensionale (o numero puro, ovvero che non risente della dimensione/ordine di grandezza del fenomeno osservato) detta coeﬃciente di variazione: !

cvx = Vx / mx Coeﬃciente di variazione di una generica variabile x = rapporto tra lo scarto quadratico medio (sigma x) e la media di x. ! Esempio:% - peso rilevato in un gruppo di neonati (ordine di grandezza del fenomeno è tra 2 – 5 kg) ! - peso rilevato in un gruppo di adulti (ordine di grandezza del fenomeno è tra 50 – 70 kg) ! È ovvio che se confrontassi la variabilità del peso del gruppo di neonati con la variabilità del peso del gruppo di adulti, questo confronto risentirebbe dell’ordine di grandezza del fenomeno. Rischiando cosi di dire che è più variabile il peso rilevato in un gruppo di adulti di quanto non sia il peso rilevato in un gruppo di neonati, semplicemente perché non depuro dal fattore di disturbo, che è l’ordine di grandezza. Se invece costruisco il numero a-dimensionale, e lo costruisco rapportando il valore di sigma x alla sua media, sia in riferimento ai neonati sia agli adulti, e lo divido per il valore medio, posso confrontare le due variabilità. ! [Se il carattere è trasferibile possiamo calcolare la Variabile massima (x) e costruire una misura di varianza normalizzata]. !

NORMALIZZARE UN INDICATORE TRA ZERO E UNO! C’è un secondo modo per intendere il concetto di normalizzazione. Un indice è normalizzato se è compreso tra un minimo e un massimo convenzionale, di facile percezione. Per esempio:!

0dId1 Questo rende possibili i confronti. !

L’indice asteriscato sarà sempre compreso tra 0 e 1. ! Esempio: Luca si è diplomato al Liceo nel ‘94 con I1=40/60 (punteggio massimo era 60 mentre il punteggio minimo era 36), suo fratello Matteo pochi anni dopo con I2=65/100 (punteggio massimo è 100 mentre quello minimo è 60). Come confrontare i due risultati? !

I*1=>I1-Imin@/>Imax-Imin@=>40-36@/>60-36@=0,167;

!

I*2=>65-60@/>100-60@=0,125 Tutti e due sono andati maluccio, ma Matteo (anche se 65>40) ha fatto peggio!! ALTRA SITUAZIONE “PROBLEMATICA”! Fin qui abbiamo imparato a ‘normalizzare’ un singolo indicatore di sintesi di una v.s., come la varianza. Ma possiamo ora radicalizzare l’operazione, quindi possiamo andare a guardare all’intera variabile statistica. ! Nella ricerca sociale si ha spesso l’esigenza di confrontare i valori di due o più distribuzioni statistiche che non hanno la stessa unità di misura (peso/altezza; reddito/numero case possedute; popolazione immigrata per età e tassi di disoccupazione giovanili). ! Si rende necessario « riportare» o disporre i valori osservati dei fenomeni sulla stessa unità di misura. ! In generale ogni volta che è necessario confrontare la distribuzione di due caratteri quantitativi che hanno medie e deviazioni standard (scarti quadratici medi) molto diﬀerenti, bisogna trasformare i valori originari in valori standardizzati, cioè in valori che appartengono alla stessa scala, la cui unità di misura diventa la deviazione standard (sigma x). !

STANDARDIZZARE UNA VARIAIBLE ! Chiamiamo standardizzazione di una v.s. X l'aﬃancamento alla sua legge di distribuzione di una trasformata Z: !

x X= i ni

x − mx   zi = i Z= x  ni 



Ogni modalità subisce una sottrazione rispetto alla media e questa sottrazione viene divisa per sigma x. Quindi su ciascuna modalità si fa questa operazione di standardizzazione. ! Le numerosità non vengono toccate, perché non è su queste che interviene l’operazione di normalizzazione e l’operazione di standardizzazione dagli eﬀetti di disturbo. È sulla modalità che si va ad operare. ! Ogni valore zi della nuova variabile esprime il numero di deviazioni standard di cui la modalità iesima è superiore o inferiore alla media. Questo è un modo per interpretare la nuova modalità z con i. Quindi la nuova modalità standardizzata z con i mi dice il numero di deviazioni standard di cui la modalità i-esima è superiore o inferiore alla media. ! UNA TRASFORMATA MOLTO DOTATA!

Si dimostra che, qualunque sia la v.s. X, la sua standardizzata Z = (X – mx) / 

x

ha sempre media nulla e varianza unitaria.

!

xi − m x

«mz=0». Sia z i =

x

q

q

m = M (Z ) =  z  f =  z

i

i =1

= = =

1



1



x −m i

x



i =1

i



x

q

i

q



  x  f −m  f = i

i

i =1

x

f = i

x

x

x

allora:

q

q

Vz =  (zi − mz )2  fi =  z i2  f i = i =1

x

i =1

i

q  x − mx    fi = =   i  x  i =1  q 1 2 = 2   ( xi − mx )  fi =

x

x

 m − m  = 0

xi − m x

2

q

i =1

1



allora:

  ( x − m ) f = i= 1

x

i

«Varz=1». Sia z i =

=

 

2 x 2 x

i =1

=1

[   z = 1]

x

Stare attenti a riconoscere la sommatoria per i che va da 1 a q, dove q è il numero delle modalità di x con i per f con i, questa è la formula della media di x. !

COME STANDARDIZZARE UNA VARIABILE !

xi

fi

xi fi

xi2 fi

zi =(xi–mx)/V VX

fi

zi fi

zi2 fi

x1

f1

x1 f1

x12 f1

z1=(x1–mx)/V VX

f1

z1 f1

z12 f1

x2

f2

x2 f2

x22 f2

z2=(x2–mx)/V VX

f2

z2 f2

z22 f2

x3

f3

x3 f3

x32 f3

z =(x3–mx)/V VX

f3

z3 f3

z32 f3

x4

f4

x4 f4

x42 f4

z4=(x4–mx)/V VX

f4

z4 f4

z42 f4

x5

f5

x5 f5

x52 f5

z5=(x5–mx)/V VX

f5

z5 f5

z52 f5

1

mX

m 2X

1

0!!

1!!

Standardizzare una variabile è operazione semplice. Basta sostituire alle modalità xi le corrispondenti modalità trasformate !

zi =(xi–mx)/V VX. Ad esse si aﬃancano le stesse numerosità (o frequenze) che non vengono toccate. ! Potete veriﬁcare che m(Z) è nulla, e che V(Z), calcolata come:!

6mi= 1(zi-0)2fi=6zi2fi è proprio 1. ! ATTENZIONE ALLE CLASSI! Se la variabile statistica è per classi le frequenze non cambiano, ma le densità di frequenza sì. Perché? L’ampiezza delle classi è diversa quindi cambia il denominatore della formula della densità di frequenza (hi = ni / Delta i). ! UNA QUESTIONE DI “FORMA”!

𝑧 = 𝑍=ቐ 𝑖

𝑥𝑖 − 𝑚 𝑥 𝜎𝑥 𝑛𝑖

Una variabile statistica è "standardizzata" se è stata "ricondotta a norma", sterilizzando l'inﬂuenza di due fattori di disturbo: l'ordine di grandezza e l'unità di misura della dispersione. !

Per esempio, due distribuzioni di frequenza f(x) e f(y), apparentemente diverse, possono rivelarsi simili (nella forma) una volta che si prescinda dall'ordine di grandezza e dall'unità di misura della dispersione. ! Sappiamo che la media misura l’ordine di grandezza di una v.s. quantitativa, e che lo scarto quadratico medio (o deviazione standard) (sigma x) misura l’unità standard di dispersione intorno alla media. ! La standardizzazione è dunque un'operazione che consente la comparazione della forma di diverse distribuzioni di frequenza, prescindendo da ordine di grandezza e dispersione. !

CONFONTARE LA FORMA!

La distribuzione dei redditi appare ‘asimmetrica’, quella del peso molto meno

Blu:reddito

Rosso: peso

00

Se sovrappongo le due distribuzioni standardizzate, facendo attenzione a uniformare le scale degli assi (quello orizzontale con i valori z, quello verticale con le densità ricalcolate),si colgono le diﬀerenze nella forma delle v.s. depurate dall’inﬂuenza sia dell’ordine di grandezza che della dispersione, ora tenute sotto controllo. !

Dopo l'ordine di grandezza e la dispersione, la terza proprietà fondamentale della forma di una variabile è la asimmetria....