Matematica - Riassunto Statistica PDF

Title Matematica - Riassunto Statistica
Author Laura Tomaino
Course Statistica
Institution Università degli Studi Magna Graecia di Catanzaro
Pages 7
File Size 236.2 KB
File Type PDF
Total Downloads 36
Total Views 133

Summary

TEORIA SULLA STATISTICA...


Description

Matematica LA STATISTICA Intorno al XV secolo, la statistica è nata come scienza descrittiva degli stati, cioè aveva lo scopo di raccogliere i dati demografici ed economici dei vari stati. Questa scienza raggiunse un notevole sviluppo nel XVIII e XIV secolo grazie a matematici come La Place, Pascal e Fermat, che affiancarono ad essa lo studio del calcolo delle probabilità (matematica dell’incerto). Agli inizi del XX secolo la statistica diventò una scienza autonoma e successivamente al suo interno si formalizzò un ramo chiamato inferenza statistica, che analizzando un piccolo numero di elementi si occupa di trarne conclusioni generali. L’organo competente dello studio dei fenomeni statistici è l’ISTAT. L'Istituto nazionale di statistica (ISTAT) è un ente di ricerca pubblico italiano, le cui attività comprendono: 

censimenti sulla popolazione;



censimenti sull'industria, sui servizi e sull'agricoltura;

 indagini campionarie sulle famiglie (consumi, forze di lavoro, aspetti della vita quotidiana, salute, sicurezza, tempo libero, famiglia e soggetti sociali, uso del tempo ecc.); 

numerose indagini economiche (contabilità nazionale, prezzi, commercio estero, istituzioni, imprese, occupazione, ecc.).

Fu istituito come Istituto Centrale di Statistica nel 1926 (legge 9 luglio 1926, n. 1162), durante il Fascismo, per raccogliere, in forma organizzata, alcuni dati essenziali riguardanti lo Stato. È stato in seguito riorganizzato, con il decreto legislativo 6 settembre 1989, n. 322 che ha istituito il Sistema Statistico Nazionale (SISTAN) e ha dettato norme sui compiti e l'organizzazione dell'ISTAT, cambiandone tra l'altro la denominazione in Istituto nazionale di statistica. La statistica è quella scienza che ha lo scopo di studiare quantitativamente e qualitativamente i fenomeni collettivi, cioè di indagare su fenomeni che riguardano un insieme di individui, raccogliendo su di essi informazioni (dati) relative ad una o più

caratteristiche, traducendole, poi, in un modello numero (tabelle), che potrà essere successivamente analizzato, elaborato e rappresentato. Le fasi attraverso cui è necessario passare per organizzare un’indagine statistica sono: raccolta dati, spoglio e trascrizione dei dati, elaborazione dei dati e rappresentazione grafica. I termini specifici adoperati in statistica sono: -

Popolazione: l’insieme degli elementi oggetto di un’indagine;

-

Campione: sottoinsieme dell’intera popolazione o meglio l’insieme delle unità statistiche, che realmente vengono prese in considerazione (uno studio per campione prende il nome di statistica inferenziale);

-

Carattere: proprietà che si vuole studiare. Può essere tipo qualitativo o di tipo quantitativo che a sua volta può essere discreto (quando il valore numerico è intero) o continuo (espresso con un intervallo o una classe di valore);

-

Modalità: le diverse manifestazioni del carattere;

-

Frequenza: il numero che si determina in corrispondenza ad una data modalità del carattere.

La descrizione di un fenomeno statistico avviene attraverso l’utilizzo di tabelle semplici (formate solo da due colonne: carattere-frequenza), composte (formate da più colonne: un carattere e più frequenze) e a doppia entrata (studiano un fenomeno a due caratteri e si tratta di una tabella studiata per righe e per colonne). A seconda che i dati siano di tipo qualitativo o quantitativo vi sono diverse rappresentazioni grafiche. Per indagini qualitative si utilizzano: -

diagrammi circolari o a torta;

-

ideogrammi formati da figure che rappresentano il carattere;

-

cartogrammi, che utilizzano delle carte geografiche;

-

diagrammi a rettangoli distanziati (orizzontali o verticali);

-

ortogrammi, in questo caso l’altezza del rettangolo è proporzionale alla frequenza di ogni modalità.

Per indagini quantitative di natura discreta si utilizzano: -

diagrammi cartesiani o diagrammi a pali.

Per indagini quantitative di natura continua si utilizzano: -

gli istogrammi.

Rispettivamente in un piano cartesiano, essi danno origine ad una spezzata o ad una serie di segmenti di altezza uguale alla frequenza assoluta (Fa) oppure ad una serie di rettangoli concatenati, che hanno come base le singole classi riferite al carattere e l’area è uguale o proporzionale alla Fa. Spesso aver raccolto dei dati, averli organizzati, averne dato una rappresentazione grafica non è sufficiente. Si ricorre così, a particolari valori che mettono in evidenza alcune caratteristiche di una distribuzione. Le medie, ad esempio, nascono dall’esigenza di esprimere mediante un unico valore il carattere di un fenomeno statistico. Le medie si distinguono in medie lasche e medie ferme. Medie lasche Per la misura di questi valori si ricorre non all’utilizzo di tutti i dati, ma solo di alcuni di essi (sono necessarie solo le prime due colonne). Le medie lasche sono due: -

moda, il termine a cui corrisponde la massima frequenza nella distribuzione;

-

mediana, il termine che, disposti in ordine in ordine crescente, occupa il posto centrale.

Medie ferme Per la misura di questi valori si ricorre all’utilizzo di tutti i dati della distribuzione. Nella pratica si usano frequentemente alcuni tipi di medie, che possono essere semplici per tabelle di natura qualitativa e ponderate per tabelle di natura quantitativa. Esse si classificano in: -

Media aritmetica semplice, che viene utilizzata per riassumere con un solo numero un insieme di dati su un fenomeno misurabile. Viene calcolata sommando tutti i valori a disposizione e dividendo il risultato per il numero complessivo dei dati.

La formula è: MA = X1 + X2 + X3 + ….+ Xn n

-

Media aritmetica ponderata (o media pesata), che viene calcolata sommando i valori in analisi, ognuno moltiplicato per un coefficiente (detto anche peso) che ne definisce l' importanza e dividendo tutto per la somma dei pesi.

La formula è: MAp = X1*F1 + X2*F2 + …. + Xn*Fn F Lo scarto della media aritmetica è una misura di variabilità, che indica la differenza di ciascun termine della distribuzione dalla media aritmetica. (S=Xi-X) I valori degli scarti possono essere alcuni positivi e altri negativi, ciò sta a significare che c’è variabilità nell’indagine oggetto di studio. Proprietà fondamentale è che la somma degli scarti è sempre uguale a 0. -

Media geometrica di n termini è la radice n-esima del prodotto degli n valori:

Mg = n√X1*X2*X3*Xn Mgp = n√X1f1* X2f2* X3f3* Xnfn -

Media quadratica, se si considera la somma dei quadrati dei valori x1, x2… xn.

Mq = √X12 +X22+X32+Xn2 n Mqp = √ X12*f1+ X22 *f2+ Xn2*fn F -

Media armonica è l’inverso della sommatoria dei reciproci dei valori della distribuzione.

Ma =

1 1 1+1+1+1 N X1 X2 X3 Xn

Map =

F f1 + f2 + f3 + fn X1 X2 X3 Xn

La media aritmetica a volte non è sufficiente per avere un quadro chiaro o completo del fenomeno; ci servono informazioni più precise su come si distribuiscono i dati attorno al valore medio calcolato. Sono misure di variabilità: -

Campo di variazione, uguale alla differenza tra il termine più grande e quello più piccolo;

-

Scarti o scostamenti della media aritmetica, uguali alla differenza di ogni termine e della media aritmetica;

-

Varianza, uguale alla media aritmetica calcolata sugli scarti al quadrato.

-

б2 = ∑(Xi-X)2 n Scarto quadratico medio, uguale alla radice quadratica del valore della varianza.

б = √ б2 Tra le misure di variabilità, può essere studiato per alcuni tipi di indagine l’indice concentrazione; una delle applicazioni più significative è relativa alla distribuzione del reddito, che può riguardare ad esempio un certo numero di lavoratori. Studiare la concentrazione significa stabilire quale percentuale di un certo bene si concentra su una certa percentuale di popolazione. Il diagramma di Lorenz è una rappresentazione grafica che consente di mettere rapidamente a confronto

una

situazione

di

concentrazione

realmente osservata con la situazione ideale di equidistribuzione, nonché di calcolare alcune misure sintetiche della concentrazione.

Distribuzione statistica a due variabili L’osservazione di un fenomeno che riguarda due variabili statistiche x e y (peso e altezza di una popolazione, domanda e offerta di un bene, ecc.) porta alla rilevazione di dati esprimibili mediante coppie ordinate di numeri (Xi, Yi). Gli n punti di coordinate (Xi, Yi) rappresentanti in un piano cartesiano, si distribuiscono in quello che si chiama diagramma a dispersione o nube di punti.

Statistica bivariata La statistica bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E’ possibile, ad esempio, studiare il legame che esiste tra il peso e l’altezza di un gruppo di persone oppure, considerando 100 famiglie, si può studiare il legame che esiste tra il numero di membri di una famiglia e il numero di automobili di proprietà di ciascuna famiglia ecc. Interpolazione statistica Si parla di interpolazione statistica quando: note alcune coppie di dati (x,y), interpretabili come punti del piano,ci si propone di costruire una funzione (interpolatrice) che sia in grado di descrivere la relazione esistente tra l’insieme dei valori di x e quello dei valori di y. Ci sono due modi diversi di concepire l’interpolazione: 1) Si parla di interpolazione matematica quando si ricerca una funzione interpolante che passa per i punti (Xi, Yi) 2) Si parla di interpolazione statistica quando si ricerca una funzione interpolante che passa tra i punti osservanti.

A seconda dello scopo per cui viene calcolata la funzione interpolante, si parla di:  perequazione, quando si vogliono sostituire i dati osservati con altri perché potrebbero errati;  interpolazione, quando si vogliono trovare valori intermedi rispetto a quelli osservati;  estrapolazione, quando si vogliono trovare valori che stanno al di fuori dell’intervallo in cui rientrano le osservazioni (previsioni). Dalla raccolta dati lo scopo è trovare l’equazione di una curva che passi fra gli n punti osservati; il problema però mette in luce due aspetti:  la scelta del tipo di curva: una parabola, un’iperbole o una curva qualsiasi;  una volta scelto il tipo di curva (ad esempio una retta poiché ne esistono infinite), è necessario stabilire un criterio che consenta di scegliere quella che più si accosta alla nube dei punti. La retta e i minimi quadrati Per trovare la curva che più si accosta ai punti osservati, si utilizza il metodo dei minimi quadrati. Per ogni Xi osservato, vogliamo ricercare l’equazione della retta interpolante: YiI = axi + b I punti (Xi, Yi) non stanno esattamente sulla nostra retta e le n differenze sono numeri non nulli che indicano gli eventuali errori. La somma degli errori al quadrato mostra, matematicamente, una funzione a due variabili: S (a, b) = Σ (YI-Yi )2 = Σ (axi + b – yi)2 Il problema consiste nel trovare la coppia A, B che rende minima la funzione somma. Retta interpolante con il metodo del baricentro yI = ax + b Esiste un modo diverso e più semplice per calcolare la retta interpolante ed è considerare la coppia (X; Y) individuata dalla media aritmetica dei valori xi e yi e scrivere l’equazione della retta passante per questo punto. y – y = a (x – x) → centro della distribuzione. a = Σ (Xi – X) (Yi – Y) passa per la coppia (X; Y) Σ (Xi – X)2...


Similar Free PDFs