Title | Lezione 14 |
---|---|
Course | Statistica Sociale |
Institution | Università Cattolica del Sacro Cuore |
Pages | 5 |
File Size | 355.2 KB |
File Type | |
Total Downloads | 68 |
Total Views | 142 |
Download Lezione 14 PDF
NORMALIZZARE E STANDARDIZZARE Obiettivi ! • Comprendere il significato dei due verbi! • Identificare come si normalizza un indicatore! • Identificare come si normalizza lo s.q.m ! • Comprendere come si standardizza una variabile statistica ! NORMALIZZARE UN INDICATORE! La normalizzazione di una misura è una procedura con due significati diversi tra loro connessi. ! Nel primo significato, un indicatore è normalizzato se è "ricondotto a norma", sterilizzando (ovvero annullando) l'effetto di alcuni fattori di disturbo. ! Per esempio, abbiamo visto come la varianza è una misura di variabilità influenzata dall'ordine di grandezza del fenomeno osservato (perché nasce dal calcolo degli scarti della media della variabile, e poi sono elevati al quadrato). ! Un modo grezzo (ma efficace) per ‘normalizzare’ la varianza consiste quindi nell'annullare (o sterilizzare da) l'effetto dell'ordine di grandezza della variabile, definendo una quantità adimensionale (o numero puro, ovvero che non risente della dimensione/ordine di grandezza del fenomeno osservato) detta coefficiente di variazione: !
cvx = Vx / mx Coefficiente di variazione di una generica variabile x = rapporto tra lo scarto quadratico medio (sigma x) e la media di x. ! Esempio:% - peso rilevato in un gruppo di neonati (ordine di grandezza del fenomeno è tra 2 – 5 kg) ! - peso rilevato in un gruppo di adulti (ordine di grandezza del fenomeno è tra 50 – 70 kg) ! È ovvio che se confrontassi la variabilità del peso del gruppo di neonati con la variabilità del peso del gruppo di adulti, questo confronto risentirebbe dell’ordine di grandezza del fenomeno. Rischiando cosi di dire che è più variabile il peso rilevato in un gruppo di adulti di quanto non sia il peso rilevato in un gruppo di neonati, semplicemente perché non depuro dal fattore di disturbo, che è l’ordine di grandezza. Se invece costruisco il numero a-dimensionale, e lo costruisco rapportando il valore di sigma x alla sua media, sia in riferimento ai neonati sia agli adulti, e lo divido per il valore medio, posso confrontare le due variabilità. ! [Se il carattere è trasferibile possiamo calcolare la Variabile massima (x) e costruire una misura di varianza normalizzata]. !
NORMALIZZARE UN INDICATORE TRA ZERO E UNO! C’è un secondo modo per intendere il concetto di normalizzazione. Un indice è normalizzato se è compreso tra un minimo e un massimo convenzionale, di facile percezione. Per esempio:!
0dId1 Questo rende possibili i confronti. !
L’indice asteriscato sarà sempre compreso tra 0 e 1. ! Esempio: Luca si è diplomato al Liceo nel ‘94 con I1=40/60 (punteggio massimo era 60 mentre il punteggio minimo era 36), suo fratello Matteo pochi anni dopo con I2=65/100 (punteggio massimo è 100 mentre quello minimo è 60). Come confrontare i due risultati? !
I*1=>I1-Imin@/>Imax-Imin@=>40-36@/>60-36@=0,167;
!
I*2=>65-60@/>100-60@=0,125 Tutti e due sono andati maluccio, ma Matteo (anche se 65>40) ha fatto peggio!! ALTRA SITUAZIONE “PROBLEMATICA”! Fin qui abbiamo imparato a ‘normalizzare’ un singolo indicatore di sintesi di una v.s., come la varianza. Ma possiamo ora radicalizzare l’operazione, quindi possiamo andare a guardare all’intera variabile statistica. ! Nella ricerca sociale si ha spesso l’esigenza di confrontare i valori di due o più distribuzioni statistiche che non hanno la stessa unità di misura (peso/altezza; reddito/numero case possedute; popolazione immigrata per età e tassi di disoccupazione giovanili). ! Si rende necessario « riportare» o disporre i valori osservati dei fenomeni sulla stessa unità di misura. ! In generale ogni volta che è necessario confrontare la distribuzione di due caratteri quantitativi che hanno medie e deviazioni standard (scarti quadratici medi) molto differenti, bisogna trasformare i valori originari in valori standardizzati, cioè in valori che appartengono alla stessa scala, la cui unità di misura diventa la deviazione standard (sigma x). !
STANDARDIZZARE UNA VARIAIBLE ! Chiamiamo standardizzazione di una v.s. X l'affiancamento alla sua legge di distribuzione di una trasformata Z: !
x X= i ni
x − mx zi = i Z= x ni
Ogni modalità subisce una sottrazione rispetto alla media e questa sottrazione viene divisa per sigma x. Quindi su ciascuna modalità si fa questa operazione di standardizzazione. ! Le numerosità non vengono toccate, perché non è su queste che interviene l’operazione di normalizzazione e l’operazione di standardizzazione dagli effetti di disturbo. È sulla modalità che si va ad operare. ! Ogni valore zi della nuova variabile esprime il numero di deviazioni standard di cui la modalità iesima è superiore o inferiore alla media. Questo è un modo per interpretare la nuova modalità z con i. Quindi la nuova modalità standardizzata z con i mi dice il numero di deviazioni standard di cui la modalità i-esima è superiore o inferiore alla media. ! UNA TRASFORMATA MOLTO DOTATA!
Si dimostra che, qualunque sia la v.s. X, la sua standardizzata Z = (X – mx) /
x
ha sempre media nulla e varianza unitaria.
!
xi − m x
«mz=0». Sia z i =
x
q
q
m = M (Z ) = z f = z
i
i =1
= = =
1
1
x −m i
x
i =1
i
x
q
i
q
x f −m f = i
i
i =1
x
f = i
x
x
x
allora:
q
q
Vz = (zi − mz )2 fi = z i2 f i = i =1
x
i =1
i
q x − mx fi = = i x i =1 q 1 2 = 2 ( xi − mx ) fi =
x
x
m − m = 0
xi − m x
2
q
i =1
1
allora:
( x − m ) f = i= 1
x
i
«Varz=1». Sia z i =
=
2 x 2 x
i =1
=1
[ z = 1]
x
Stare attenti a riconoscere la sommatoria per i che va da 1 a q, dove q è il numero delle modalità di x con i per f con i, questa è la formula della media di x. !
COME STANDARDIZZARE UNA VARIABILE !
xi
fi
xi fi
xi2 fi
zi =(xi–mx)/V VX
fi
zi fi
zi2 fi
x1
f1
x1 f1
x12 f1
z1=(x1–mx)/V VX
f1
z1 f1
z12 f1
x2
f2
x2 f2
x22 f2
z2=(x2–mx)/V VX
f2
z2 f2
z22 f2
x3
f3
x3 f3
x32 f3
z =(x3–mx)/V VX
f3
z3 f3
z32 f3
x4
f4
x4 f4
x42 f4
z4=(x4–mx)/V VX
f4
z4 f4
z42 f4
x5
f5
x5 f5
x52 f5
z5=(x5–mx)/V VX
f5
z5 f5
z52 f5
1
mX
m 2X
1
0!!
1!!
Standardizzare una variabile è operazione semplice. Basta sostituire alle modalità xi le corrispondenti modalità trasformate !
zi =(xi–mx)/V VX. Ad esse si affiancano le stesse numerosità (o frequenze) che non vengono toccate. ! Potete verificare che m(Z) è nulla, e che V(Z), calcolata come:!
6mi= 1(zi-0)2fi=6zi2fi è proprio 1. ! ATTENZIONE ALLE CLASSI! Se la variabile statistica è per classi le frequenze non cambiano, ma le densità di frequenza sì. Perché? L’ampiezza delle classi è diversa quindi cambia il denominatore della formula della densità di frequenza (hi = ni / Delta i). ! UNA QUESTIONE DI “FORMA”!
𝑧 = 𝑍=ቐ 𝑖
𝑥𝑖 − 𝑚 𝑥 𝜎𝑥 𝑛𝑖
Una variabile statistica è "standardizzata" se è stata "ricondotta a norma", sterilizzando l'influenza di due fattori di disturbo: l'ordine di grandezza e l'unità di misura della dispersione. !
Per esempio, due distribuzioni di frequenza f(x) e f(y), apparentemente diverse, possono rivelarsi simili (nella forma) una volta che si prescinda dall'ordine di grandezza e dall'unità di misura della dispersione. ! Sappiamo che la media misura l’ordine di grandezza di una v.s. quantitativa, e che lo scarto quadratico medio (o deviazione standard) (sigma x) misura l’unità standard di dispersione intorno alla media. ! La standardizzazione è dunque un'operazione che consente la comparazione della forma di diverse distribuzioni di frequenza, prescindendo da ordine di grandezza e dispersione. !
CONFONTARE LA FORMA!
La distribuzione dei redditi appare ‘asimmetrica’, quella del peso molto meno
Blu:reddito
Rosso: peso
00
Se sovrappongo le due distribuzioni standardizzate, facendo attenzione a uniformare le scale degli assi (quello orizzontale con i valori z, quello verticale con le densità ricalcolate),si colgono le differenze nella forma delle v.s. depurate dall’influenza sia dell’ordine di grandezza che della dispersione, ora tenute sotto controllo. !
Dopo l'ordine di grandezza e la dispersione, la terza proprietà fondamentale della forma di una variabile è la asimmetria....