Title | Indipendenza |
---|---|
Course | statistica |
Institution | Liceo (Italia) |
Pages | 6 |
File Size | 296.7 KB |
File Type | |
Total Downloads | 14 |
Total Views | 131 |
indipendenza...
INDIPENDENZA Consideriamo due caratteri X e Y di qualunque natura. X e Y sono indipendenti se: 1. fij= fi. x f.j per ogni i= 1,…,R j=1,…,C in alternativa è possibile verificare la condizione di indipendenza attraverso la frequenza condizionale: 2. X e Y sono indipendenti se fi/j= fi. per ogni i= 1,…,R ↓ j=1,…,C Frequenze condizionate di X dato Y=yj. In altre parole frequenza condizionata di X dato Y sono uguali alla frequenza marginale di X. Conoscere il valore di Y non modifica la distinzione di frequenza di X. 3. X e Y sono indipendenti se fj/i = f.j per ogni i,j ↓
Frequenza condizionata di y dato X= xi Cioè frequenze condizionate di Y dato X sono uguali alle frequenze marginali di Y. I 3 modi di verificare l’indipendenza sono equivalenti: cond.1)
se e solo se Cond.2)
se e solo se Cond.3)
basta verificarne una. Esempio: considerando i caratteri X= genere Y= reddito. La seguente tabella a doppia entrata racchiude le frequenze congiunte di X e Y: Alto
Basso
fi.
M
0.18 (f11)
0.12 (f12)
0.30
F
0.42
0.28
0.70
f.j
0.60
0.40
1
X
Y
Verificare se X e Y sono indipendenti? 1. Definizione di indipendenza: fij = fi. x f.j per ogni i,j
0.18 = 0.30*0.60 sì 0.12= 0.30*0.40 sì 0.42= 0.60*0.70 sì 0.28= 0.70*0.40 sì Dunque X e Y sono indipendenti. 3.definizione di indipendenza: fj/i = f.j per ogni i,j calcoliamo le frequenze condizionate di Y dato X: Y Alto Basso
fj/1 (dato X=maschio) 0.60 0.12/0.30=0.40 1
fj/2 (dato X=femmina) 0.42/0.70=0.60 0.28/0.70=0.40 1
f11/f1. = (frequenza congiunta di X= maschio e Y= alto) / (frequenza margina di X=maschio) = 0.18/0.30= 0.60 Dato che fj/i = f.j allora X e Y sono indipendenti. Se X e Y non sono indipendenti, come misuro il grado di questa dipendenza? Utilizzo l’indice CHI-QUANDO (INDICE DI CONNESSIONE) 2 casi estremi: 1. Assenza di connessione= indipendenza (vedi tre definizioni sopra definite di indipendenza) 2. Massima connessione= quando ad un valore (o modalità) è associato un solo valore ( o modalità di Y) e viceversa. Esempio: X
Y
Y1
Y2
Y3
X1
12
0
0
X2
0
0
30
X3
0
27
0
CASI INTERMEDI: usiamo indice chi-quando Caso anomalo attraverso un esempio: tabella a doppia entrata X
Y -1 0 1 f.j
-1
1
fi.
0.1 0.05 0.05 0.2
0.4 0.3 0.1 0.8
0.5 0.35 0.15 1
1. X e Y sono indipendenti? 1°definizione d’indipendenza: fij = fi. x f.j per ogni i,j Controesempio: 0.05 ≠ 0.35 x 0.2 quindi X e Y NON SONO INDIPENDENTI 2. Se non lo sono, misuriamo il grado di connessione tra X e Y? Per calcolare l’indice chi-quando dobbiamo fare i seguenti passaggi: - Faccio delle tabelle a doppia entrata teorica in caso di indipendenza: X
Y -1 0 1 f.j
-1
1
fi.
0.1 0.07 0.03 0.2
0.4 0.28 0.12 0.8
0.5 0.35 0.15 1
Si tengono fisse le frequenze marginali (vedi tabella asservate) e si modificano le frequenze congiunte fi. x f.j = fij ( frequenze teoriche) - Calcolo tabella delle differenze: Cij = fij - fij X y -1 0 1
-1
1
0 -0.02 0.02
0 -0.02 -0.02
- INDICE CHI-QUANDO:
Nel nostro esempio: X2= 02/0.1 + 02/0.4 + (-0.02)2/0.07 + (0.02)2/0.28 + 0.022/0.03 + (-0.02)2/0.12 = 0.0024 grado di connessione è molto debole È un valore alto o basso? Devo sapere gli estremi di X2: 0 ≤ X2 ≤ min (R-1
Numero di righe
;
C-1)
Numero di colonne
Nel nostro esempio: 0 ≤ X2 ≤ min ( 3-1 ; 2-1) - Indice di chi-quando normalizzato:
SINTESI DELL’INDICE X2: A. Se le tabelle a doppia entrata con frequenze congiunte RELATIVE (fij):
- Calcolare le frequenze congiunte relative TEORICHE - Calcolare le contingenze:
- Indice di chi-quando
- Indice chi-quando NORMALIZZATO
B. Se tabelle a doppia entrata ha frequenze congiunte assolute (nij), i passaggi per il calcolo dell’indice X2 di connessione: - Calcolare le frequenze congiunte assolute teoriche:
- Calcolo le contingenze: - Indice chi-quando:...