Indici di variabilità - appunti lezioni + riassunti + slide + dispense PDF

Title Indici di variabilità - appunti lezioni + riassunti + slide + dispense
Author Roby
Course Statistica
Institution Università telematica Unitelma Sapienza
Pages 4
File Size 97.1 KB
File Type PDF
Total Downloads 94
Total Views 135

Summary

appunti lezioni + riassunti + slide + dispense...


Description

INDICI DI VARIABILITA’ La variabilità di una distribuzione esprime la temdenza delle unità di un collettivo ad assumere diverse modalità di un carattere. Il termine variabilità si riferisce a caratteri quantitativi mentre si parla di mutabilità in caso di caratteri qualitativi. Limitando l’attenzione alle variabili quantitative, la variabilità può essere valutata come: ➔ Dispersione ➔ Disuguaglianza Nell’ambito delle misure di variabilità si individuano: - gli indici di dispersione che mirano a calcolare quanto in media ogni termine differisce da un valore rappresentativo, che nella maggior parte dei casi viene individuato nella media aritmetica della distribuzione; - gli indici di disuguaglianza, invece, sono quelli che verificano di quanto ciascun termine differisce mediamente da tutti gli altri. Da tali osservazioni possiamo ricavare due proprietà essenziali di una misura di variabilità: ➢ Essere nulla quando e solo quando tutti i termini della distribuzione sono uguali tra loro ➢ Crescere all’aumentare della disuguaglianza tra i termini INDICI

.

Gli indici di variabilità si distinguono in due categorie: 1. Indici che misurano la variabilità rispetto ad una misura di posizione: si basano su una sintesi degli scarti delle modalità rispetto al valore centrale di riferimento. 2. Indici che misurano la variabilità rispetto all’ordinamento delle modalità: si basano sulla funzione di ripartizione empirica e quindi all’ordine che assumono le modalità nella distribuzione considerata Indici di variabilità assoluti: Gli indici di variabilità assoluta assumono valori in una scala di variazione che dipende strettamente dall’unità di misura e dall’intervallo in cui la variabile assume valori. Ciò rende difficile il confronto tra distribuzioni diverse. ➔ Varianza: La varianza di un insieme di n valori osservati. Quindi la varianza è la media dei quadrati degli scarti della media aritmetica. Nel caso di distribuzione di frequenze di una variabile x con k modalità, la varianza si calcola:

Proprietà: 1. E’ una misura non negativa 2. Cresce al crescere della misura degli scarti e quindi della variabilità della distribuzione 3. E’ nulla se le unità assumono tutte lo stesso valore (variabile degenere)

4. Se si aggiunge una costante a tutte le osservazioni, la misura degli scarti non cambia e quindi la varianza resta immutata. ➔ Devianza: Si definisce devianza la somma degli scarti al quadrato ed è pari al numeratore della varianza. Nel caso di distribuzione di frequenze di una variabile x con k modalità, la varianza si calcola:

Caratteristiche: ➢ aumenta all’aumentare del numero di dati ➢ ha come unità di misura il quadrato della variabile x (molto scomodo) ➢ sono confrontabili solo devianze che derivano dall stesso numero di dati ➔ Scarto quadratico medio: Si definisce scarto quadratico medio la radice della media degli scarti al quadrato ed è pari alla radice quadrata della varianza. Lo sqm può leggersi come “lo scostamento medio delle modalità della distribuzione rispetto alla media”, ovvero, esprime di quanto, mediamente, ciascun valore della distribuzione differisce dalla media

In tal modo, ci si riconduce ad un indice di variabilità espresso nella stessa unità di misura della variabile considerata, esso, tuttavia, non consente di eseguire confronti tra la variabilità di fenomeni che presentano unità di misura diverse o ordini di grandezza diversi. ➔ Scostamento semplice medio dalla media aritmetica: Si definisce scostamento semplice dalla media, la media degli scarti, in valore assoluto, tra i valori osservati e la media aritmetica. ➔ Scostamento semplice medio dalla mediana: Si definisce scostamento semplice dalla mediana la media degli scarti in valore assoluto tra i valori osservati e la mediana.

Indici di variabilità relativa: Gli indici di variabilità relativa non dipendono dall’unità di misura e dall’ordine di grandezza della variabile. Il più diffuso è il coefficiente di variazione che si ottiene rapportando lo sqm alla media in valore assoluto. ➔ Coefficiente di Variazione: Il coefficiente di variazione della distribuzione di un carattere x, di media (min e ugu)0 e scarto quadratico medio o, è dato dal rapporto tra lo scarto quadratico medio e la media aritmetica moltiplicato per 100. Proprietà:

1. Per distribuzioni con valori negativi e positivi, la media aritmetica non esprime l’ordine di grandezza effettivo 2. Ha il minimo pari a 0 ed il massimo non definito; pertanto, consente il confronto tra la variabilità di due distribuzioni, ,a non sull’intensità della variabilità Si possono costruire indici relativi di variabilità: Indici di forma: Gli indici di forma sono così definiti in quanto descrivono la forma della distribuzione visualizzabile attraverso la sua rappresentazione grafica e abbiamo: 1. le misure di concentrazione: vengono calcolate sulle variabili che godono della proprietà di essere trasferibili. Si parla di: a. concentrazione minima o equidistribuzione quando l’ammontare complessivo della variabile è ripartito in misura uguale tra tutte le unità statistiche. Un carattere è equidistribuito se ognuna delle n unità possiede 1/n dell’ammontare complessivo del carattere. b. concentrazione massima: quando l’ammontare complessivo della variabile è posseduto da un’unica unità statistica mentre le rimanenti posseggono 0. L’intero ammontare del carattere, A, è posseduto da una sola unità del collettivo. c. concentrazione di Gini: le differenze (F-Q) possono essere sintetizzate nel rapporto di concentrazione di Gini: d. curva di Lorenz: la concentrazione è rappresentata graficamente attraverso un grafico, curva di lorenz, rappresentando graficamente le coppie di valori F e Q e congiungendo i punti risultanti. Sul grafico dove la bisettrice è pari alla situazione di equidistribuzione e l’area compresa tra questa e la curva misura invece l’indice R. ● Proprietà: ○ la curva di lorenz è sempre convessa verso l’asse delle ascisse, quindi giace sotto la linea di equidistribuzione, in quanto le F sono sempre maggiori o uguali alle Q ○ quanto maggiori sono le differenze tanto maggiore è la distanza tra la retta di equidistribuzione e la curva di concentrazione ○ nel caso di concentrazione massima accade che la spezzata di concentrazione coincide con l’asse delle ascisse fino all’n-1 esima unità per poi raggiungere il punto. La curva di concentrazione coincide, quindi, con i cateti OA e AB del triangolo OAB, ovvero l'intensità del carattere è nulla in n-1 casi ed uguale a nx in un solo caso. 2. indici di asimmetria: una distribuzione si dice simmetrica rispetto ad un centro di simmetria se a scostamenti da a positivi corrispondono scostamenti negativi aventi la stessa frequenza. Con riferimento a variabili discrete la distribuzione può presentare: asimmetria a destra, asimmetria a sinistra o simmetria Con riferimento a variabili continue ci possono essere casi di asimmetria a sinistra, asimmetria a destra, simmetria.

I principali indici di simmetria sono l’indice di asimmetria ed il coefficiente analitico di simmetria.

3. Indici di curtosi: l’indice di curtosi è un indice che in statistica determina la forma di una distribuzione di frequenza e che misura lo “spessore” delle code di una funzione di densità, e dunque la maggiore o minore lunghezza delle code. La curtosi ha rilievo per una distribuzione di frequenza unimodale, la cui curva è di forma campanulare e per valutare questo aspetto della curva, la stessa è paragonata ad una normale. E’ normale una distribuzione che: a. presenta con una forma campanulare e simmetrica rispetto alla posizione centrale b. gli indici di posizione assumono uguale valore (media=mediana=moda) c. molti caratteri statistici si manifestano con una distribuzione empirica che si approssima molto bene con una funzione di densità normale PROPRIETÀ: - sempre positiva - forma simmetrica e campanulare - due punti di flesso simmetrici in corrispondenza dei quali cambia la concavità della curva Confronto tra il grafico della distribuzione empirica e quello della distribuzione normale 1. distribuzione ipernormale: se la distribuzione osservata presenta una maggiore frequenza dei valori centrali e di quelli estremi, e una frequenza minore di quelli intermedi, si avrà una distribuzione più alta al centro e più bassa ai lati 2. distribuzione iponormale: se la distribuzione osservata presenta una minore frequenza dei valori centrali ed estremi, con una frequenza maggiore di quelle estreme, si avrà una distribuzione più bassa al centro e più alta ai lati INDICE DI CURTOSI DI PEARSON

INDICE DI CURTOSI DI FISHER...


Similar Free PDFs