Riassunto libro fondamenti di statistica con formule esercizi domande esame PDF

Title	Riassunto libro fondamenti di statistica con formule esercizi domande esame
Course	Politiche sociali
Institution	Università degli Studi di Firenze
Pages	30
File Size	1.2 MB
File Type	PDF
Total Downloads	130
Total Views	221

Preview

CLICK TO PREVIEW PDF

Summary

Riassunto libro di con formule, esercizi, domande esame Fondamenti di psicologia della comunicazione (Libera di Lingue e Comunicazione IULM) Distribuzione proibita Scaricato da Ester Mannucci FONDAMENTI DI STATISTICA 1) ISTAT: DI COSA SI OCCUPA? un sito in cui si trovano dati, statistiche italiane, ...

Description

Riassunto - libro "Fondamenti di statistica" con formule, esercizi, domande esame Fondamenti di psicologia della comunicazione (Libera Università di Lingue e Comunicazione IULM)

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

FONDAMENTI DI STATISTICA 1) ISTAT: COS’È, DI COSA SI OCCUPA? È un sito in cui si trovano dati, statistiche italiane, relative alla struttura della popolazione e alle dinamiche demografiche. Oggi, i dati statistici sono molto utilizzati dai media e dai giornali, però, spesso i cittadini comuni fanno fatica a comprenderli. La statistica è uno strumento che aiuta i cittadini che vogliono capire i fenomeni; infatti, nella vita di tutti i giorni è importante saper valutare tutte le numerose informazioni che ci giungono da fonti diverse.

2) STATISTICA + STATISTICA DESCRITTIVA + STATISTICA INFERENZIALE + PARAMETRO + STATISTICA STATISTICA = è la scienza che permette di raccogliere, sintetizzare e analizzare le informazioni al fine di trarne una o più conclusioni. Inoltre, statistica fornisce una misura di probabilità associata ad ogni conclusione raggiunta. STATISTICA DESCRITTIVA = Si basa sulla POPOLAZIONE. Si occupa di organizzare e sintetizzare le caratteristiche salienti delle info in pochi n° o grafici significativi. STATISTICA INFERENZIALE = Si basa sul CAMPIONE. Si occupa di trarre conclusioni sulla popolazione, basandosi su risultati ottenuti da un campione. PARAMETRO = è la sintesi numerica della POPOLAZIONE: tutte le misure vengono ricavate sulla popolazione ES: 48% studenti IULM possiede un auto. STATISTICA = è la sintesi numerica del CAMPIONE: tutte le misure vengono ricavate sul campione. ES: Se estraiamo un campione di 100 studenti IULM, il 48% possiede auto.

3) INFERENZA STATISTICA (pag. 5) L’inferenza statistica si concentra su risultati ottenuti su un campione e li estende all’intera popolazione, misurandone l’affidabilità. ES: Se ricorriamo all’inferenza statistica, invece che affermare, per esempio, che il 78% della popolazione restituirebbe 100€ trovati per terra, diremmo che: al 95% (LIVELLO DI CONFIDENZA / MISURA DI AFFIDABILITÀ) confidiamo nel fatto che la percentuale di popolazione che restituirà i soldi potrebbe variare tra il 76% e l’80% (RANGE DI VALORI CHE TIENE CONTO DELLA VARIABILIT DEI DATI).

1

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

4) FASI DEL PROCESSO STATISTICO (pag. 5) 1- IDENTIFICARE L’OBIETTIVO DELLA RICERCA: definire le domande in modo dettagliato e identificare la popolazione da esaminare. 2- RACCOGLIERE I DATI NECESSARI PER FORNIRE RISPOSTE ALLE DOMANDE DEL PUNTO 1: spesso l’accesso alla popolazione è difficile e costoso, per questo si ricorre al campione. 3- DESCRIVERE I DATI: attraverso la statistica descrittiva si organizzano i dati e si sintetizzano ricorrendo ai metodi statistici più opportuni. 4- FARE INFERENZA STATISTICA: estendere i risultati ottenuti dal campione sull’intera popolazione, indicando il livello di confidenza, di affidabilità.

5) VARIABILI NASCOSTE / “IN AGGUATO” / LURKING VARIABLE (pag. 3) In statistica, queste variabili devono essere considerate con attenzione, perché spesso capita che 2 variabili che stiamo analizzando, possono in realtà essere influenzate da una terza variabile. ES: Studi dimostrano che il QI è > nei bambini allattati piuttosto che nei bambini alimentati con latte artificiale. Tuttavia, altri fattori, oltre al latte materno potrebbero contribuire ad aumentare il QI.

6) CENSIMENTO È l’unico strumento che permette di conoscere, per esempio, quanti siamo effettivamente in Italia. Significa RILEVARE-MISURARE. Consente di: - o quantificare una popolazione - o conoscere caratteristiche della popolazione - o prevedere dinamiche della popolazione (saldi demografici, saldi migratori).

7) QUAL È L’OGGETTO DI RIFERMINETO DELLA STATISTICA? È il COLLETTIVO STATISTICO o POPOLAZIONE STATISTICA = insieme di individui / UNITÀ STATISTICHE accumunate da un fenomeno FENOMENO COLLETTIVO. ES: Voglio andare a vedere un film al cinema. Decido di basarmi sulle recensione delle PERSONE che hanno già visto il film. Queste PERSONE sono il COLLETTIVO STATISTICO e sono accumunate da un FENOMENO COLLETTIVO (hanno già visto il film).

8) DIFFERENZA TRA POPOLAZIONE – INDIVIDUO – CAMPIONE POPOLAZIONE = è l’intero gruppo di individui studiato. È l’insieme degli individui/unità statistiche accumunati da un fenomeno: fenomeno collettivo. INDIVIDUO = È una persona o oggetto che è membro della popolazione studiata. CAMPIONE = È un sottoinsieme della popolazione che sta per essere studiata. È la riproduzione in miniatura delle stesse identiche caratteristiche della popolazione. Quindi, il CAMPIONE DEVE ESSERE RAPPRESENTATIVO DELLA POPOLAZIONE.

2

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

9) COSA RILEVIAMO? / DIFFERENZA TRA VAR. QUALITATIVE E QUANTITATIVE Per descrivere la popolazione statistica dobbiamo rilevare delle info, le quali si presentano sottoforma di ASPETTI/CARATTERI/VARIBILI. Ogni VARIABILE descrive un individuo appartenente alla popolazione statistica. Le variabili possono essere: -QUALITATIVE/MUTABILI/CATEGORICHE = sono quelle che forniscono una classificazione delle unità statistiche sulla base di alcuni attributi, caratteristiche, qualità. - QUANTITATIVE/NUMERABILI/VARIABILI =sono quelle che forniscono una classificazione numerica delle unità statistiche. Le singole caratteristiche delle variabili qualitative e quantitative si chiamano MODALITÀ/DATI. Sulle modalità delle variabili quantitative non si possono eseguire operazioni matematiche. Sulle modalità delle variabili quantitative si possono eseguire operazioni matematiche, come l’addizione e la sottrazione, ottenendo importanti risultati per la comprensione della realtà circostante.

10) CLASSIFICAZIONE DELLE VARIABILI QUALITATIVE possono essere: - SCONNESSE = le modalità non sono ordinabili secondo un criterio oggettivo (sesso, religione, colore capelli). - CICLICHE = le modalità sono ordinabili, cicliche (giorni settimana, gradi di un cerchio, punti cardinali). QUANTITATIVA può essere: - DISCRETA = è una variabile quantitativa la cui modalità assume un valore finito (0, 1, 2, 3..). Quindi, le variabili discrete sono NUMERABILI: sono contabili e sono rilevate senza virgola (n° libri, n° figli, n° scarpe). - CONTINUA = è una variabile quantitativa la cui modalità assume un valore infinito. Quindi, le variabili continue sono NON NUMERABILI: sono misurabili e sono rilevate con la virgola (distante, pesi, litri).

11) COME SI PRESENTANO LE VARIABILI? Le variabili qualitative e quantitative si presentano sottoforma di MODALITÀ/DATI = modi di presentarsi della variabile; sono AGGETTIVI per le variabili qualitative; sono NUMERI per le variabili quantitative.

12) COME SI INDICANO SIMBOLICAMENTE CARATTERI E MODALITÀ? X(maiuscolo)  indica il carattere, variabile. Si può anche utilizzare Y, Z. x (minuscolo)  indica la modalità associata ad un’unità statistica.

3

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

13) COME SI MISURANO LE VARIABILI? / SCALE DI MISURA Le variabili sono rilevate attraverso le SCALE DI MISURA, le quali ci condizionano sia nella scelta delle rappresentazioni grafiche, sia nella scelta dei calcoli di sintesi. Ci sono 4 scale di misura: 2 per le variabili qualitative, 2 per le variabili quantitative. 1- SCALA NOMINALE = le variabili qualitative sono rilevate su scala di misura nominale se le modalità (nomi, etichette o categorie) si presentano sottoforma di elenco, lista. Quindi, tra le modalità non c’è gerarchia, non sono ordinabili. Genere: m-f Modello auto: Fiat 500, Lancia Ypsilon, Punto… Motore di ricerca: Google, Yahoo Possesso iPhod: si-no 2- SCALA ORDINALE = le variabili qualitative sono rilevate su scala ordinale se le modalità (nomi, etichette o categoria) sono ordinabili e, quindi, vi è una gerarchia tra le modalità. Livello d’istruzione: elementare - media inferiore – media superiore – laurea Taglia maglione: XS-S-M-L-XL Gradimenti corso statistica: NO < PIÙ NO CHE SI < PIÙ SI CHE NO < SI 3- SCALA AD INTERVALLI = le variabili quantitative sono rilevate su scala ad intervalli, se il punto d’origine è DIVERSO DA 0. Un valore pari a 0, nella scala ad intervalli non significa assenza di quantità. Sono consentite operazioni matematiche: di addizione e sottrazione, per confrontare singoli valori numerici, e di moltiplicazione e divisione, per confrontare le differenze tra i valori numerici Temperatura ambiente: i gradi possono essere di 0  scala ad intervalli. Termometro corporeo: i gradi partono da 35°C  origine diversa da 0. Valutazione punteggio da 1 a 5  origine diversa da 0. 4- SCALA DI RAPPORTO = le variabili quantitative sono rilevate su scala di misura di rapporto se il punto d’origine è UGULE A 0. Un valore pari a 0, nella scala di rapporto, significa assenza di quantità. Sono consentite tutte le operazioni aritmetiche elementari per confrontare i singoli valori. (Altezza, peso, giorni di vacanza, litri…).

14) QUANTE VOLTE DI PRESENTANO LE MODALITÀ? FREQUENZE = n° delle volte che si presenta una modalità. DISTRIBUZIONE DI FREQUENZE = consiste nell’associare ad ogni modalità, il n° delle volte che si presenta la modalità stessa. Dà alito a 2 rappresentazioni: - RAPPRESENTAZIONI TABELLARI - RAPPRESENTAZIONI GRAFICHE

4

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

15) SPIEGARE IL SIGNIFICATO DELLA FRASE “I DATIO VARIANO”. IN CHE MODO QUESTA VARIABILITÀ INFLUISCE SUI RISULTATI DELL’ANALISI STATISTICA? (pag. 27) “I dati variano”, ossia sono soggetti a variabilità. In assenza di variabilità non si ricorrerebbe alla statistica inferenziale perché, per es., se tutti i pomodori avessero lo stesso peso (variabile indagata: peso pomodori), basterebbe il peso di un pomodoro per conoscere quello di tutti i pomodori. In realtà i dati variano: un obiettivo della ricerca statistica è quello di comprendere le ragioni di tale variabilità.

5

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

STATISTICA DESCRITTIVA 16) CAMPIONE È un sottoinsieme della popolazione che sta per essere studiata. È una riproduzione in miniatura delle stesse identiche caratteristiche della popolazione. Quindi, il campione deve essere rappresentativo della popolazione.

17) CAMPIONAMENTO È il processo di selezione di un campione. L’utilizzo di un campione risponde a 3 esigenze fondamentali: - risparmio di tempo - risparmio di costi - praticità della gestione

18) RAPPRESENTATIVITÀ È la prima proprietà della statistica che fa riferimento al campione e ci dice che un campione è ben costruito perché riesce a rappresentare in piccolo tutte le caratteristiche della popolazione e tutto questo è possibile solo se i campioni sono selezionati n modo probabilistico.

19) TERIA DEI CAMPIONI La costruzioni dei campioni è relativamente recente. Il primo a porre l’attenzione sulla necessità di costruire dei campioni fu Kiaer (1895). In seguito altri studiosi svilupparono la teoria dei campioni: tutto ciò che fa riferimento alla costruzione dei campioni probabilistici e non, va sotto il nome di teoria dei campioni.

20) CAMPIONE RAPPRESENTATIVO (pag. 20) Un campione si dice rappresentativo quando i risultati di un’indagine sono affidabili e, quindi, le caratteristiche individuate nel campione possono essere estese a tutta la popolazione.

21) TIPOLOGIE DI CAMPIONAMENTO a- CAMPIONAMENTO NON PROBABILISTICO = Con il campionamento non probabilistico si ottiene un campione nel quale gli individui sono selezionati in maniera non casuale, ossia casaccio. Per questo motivo i risultati ottenuti sul campione non possono essere estesi a tutta la popolazione. Ciò che si ottiene un CAMPIONE DI COMODO, il quale non è rappresentativo della popolazione, perché le persone sono scelte senza regole o logica. ES: Un esempio sono i CAMPIONI AUTOSELEZIONATI o A RISPOSTA VOLONTARIA: infatti, coloro che, per es., rispondono ad un sondaggio online non sono rappresentativi della popolazioni, perché, avendo risposto, sono coloro che hanno un’opinione forte sull’argomento. 6

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

b- CAMPIONAMENTO PROBABILISTICO = È il processo che si utilizza il caso per la selezioni degli individui di una popolazione da includere nel campione: gli individui sono selezionati sulla base di regole, che a loro volta su basano sulla probabilità. Per questo motivo, i campioni probabilistici sono rappresentativi della popolazione: studiando una parte di popolazione, essa rispecchia tutte le caratteristiche della popolazione. Un campionamento probabilistico può essere: - CAMPIONAMENTO CASUALE SEMPLICE - CAMPIONAMENTO STRATIFICATO - CAMPIONAMENTO SISTEMATICO - CAMPIONAMENTO A GRAPPOLO

22) CAMPIONAMENTO CASUALE SEMPLICE = Un campione di grandezza n è ottenuto attraverso campionamento casuale semplice da una popolazione di grandezza N, se tutte le unità della popolazione hanno la stessa probabilità di essere scelte. Il campione che si ottiene prende il nome di CAMPIONE CASUALE SEMPLICE. Per spiegare il campionamento casuale semplice si può far riferimento alla tombola: i 90 n° sono la popolazione (N); in modo casuale ne estraiamo 1 (primo componente del nostro campione); dopo di che ne estraiamo altri.  Non c’è ripetizione; > è il campione, < è la possibilità d’errore. Per costruire un campione casuale semplice dobbiamo: - costruire un elenco di tutta la popolazione - numerare ogni elemento (l’ultimo corrisponderà a N) - e, infine, utilizzare una tabella dei numeri casuali o un software (Excel) per generare n numeri, dove n corrisponde all’ampiezza del campione

N.B:N  numerosità della popolazione n  numerosità del campione

23) DATA UNA POPOLAZIONE DI AMPIEZZA N E UN CAMPIONE DI AMPIEZZA n, COME POSSO SAPERE QUANTE POSSIBILI COMBINAZIONI DI CAMPIONI POSSO ESTRARRE? Attraverso la FORMULA DEL COEFFICIENTE BINOMIALE, la quale mi permette di sapere quante possibili combinazioni di campioni di ampiezza n posso ottenere da una popolazione di ampiezza N. n=n![k!(n-k)!] ES: N=n=6

N (numerosità popolazione)  n (numerosità popolazione nella formula coeff.) n (numerosità campione)  k (numerosità campione nella formula coeff.) n=k=3

n=n![k!(n-k)!] n=

6·5·4·3·2·1 3·2·1·(6−3)

n=

6·5·4·3·2·1 = 20 3·2·1·3·2·1 7

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

24) TABELLA DEI NUMERI CASUALI Nel 1940, 2 studiosi russi, attraverso un algoritmo hanno generato in maniera casual una serie di numeri, che sembrano non aver nessun collegamento tra loro, generando la casualità. Possiamo utilizzare questa tabella dei numeri casuali per estrarre il mio campione attraverso campionamento casuale semplice. STEP: - Elenco e numero la mia popolazione N (0-30) - Scelgo a caso il mio punto di partenza nella tabella - Visto che la mia popolazione ha massimo 2 cifre (30), nella tabella scelgo 2 cifre e mi sposto in verticale o orizzontale adottando sempre lo stesso metodo finché raggiungo l’ampiezza del mio campione.

25) LISTA DI CAMPIONAMENTO (FRAME) (pag. 13) È un elenco di tutti gli individui della popolazione. ES: La lista di tutti gli elettori del senato può essere un frame.

26) CAMPIONAMENTO STRATIFICATO Un campione stratificato è ottenuto separando la popolazione in gruppi non sovrapponibili, chiamati STRATI. Ogni strato è omogeneo per certe caratteristiche. Dopo di che, si ottiene un campione casuale semplice da ogni strato. Se da ogni strato estraggo lo stesso n° di individui  il processo prende il nome di CAMPIONAMENTO STRATIFICATO CON PROBABILITÀ COSTANTI. Se da ogni strato estraggo lo stesso un diverso n° di individui  il processo prende il nome di CAMPIONAMENTO STRATIFICATO CON PROBABILITÀ VARIABILI.

27) DATE 2 VARIABILI, CON 2 MODALITÀ CIASCUNA, QUANTI STRATI POSSO OTTENERE? Devo moltiplicare le modalità tra loro; quindi: 2x2=4 strati. Poi ottengo un campione casuale semplice, senza ripetizioni, per ogni strato, e ottengo il campione stratificato.

28) CAMPIONAMENTO SISTEMATICO Un campione sistematico si ottiene selezionando ogni k-esimo individuo della popolazione. k si ottiene dal rapporto tra numerosità della popolazione (N) e numerosità del campione (n)  k=

𝑁 𝑛

k si chiama TASSO DI CAMPIONAMENTO e indica il n° delle modalità da mantenere per costruire il campione Il 1° individuo selezionato corrisponde ad un n° casuale semplice compreso tra 1 e k, chiamato p. Il campione sarà composto dai seguenti individui: p, p+k, p+2k,..., p+(n-1)k

8

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

STEP: 1) N 2) n 3) k=

4) p  n° compreso tra 1 e k selezionato casualmente 5) p, p+k, p+2k,..., p+(n-1)k 𝑁 𝑛

ES: 1) N=16 2) n=4 16 3) k= 4

4) 3 5) p, p+k, p+2k,..., p+(n-1)k  3, 3+4, 3+8,..., 3+(4-1)4  3,7,11,15

29) QUALE CAMPIONAMENTO POSSO APPLICARE IN ASSENZA DI UNA LISTA DELLA POPOLAZIONE? Il campionamento sistematico, perchè non abbiamo bisogno degli strati, ma solo della numerosità N e n.

30) CAMPIONAMENTO A GRAPPOLO Un campione a grappolo è ottenuto selezionando tutti gli individui di un gruppo (CLUSTER), selezionato attraverso campionamento casuale semplice. I cluster sono disomogenei e presentano le stesse identiche caratteristiche della popolazione in miniatura. Questo campionamento permette di superare le difficoltà di raggiungere unità statistiche collocate in località diverse e difficili da raggiungere. ES: Milano è composta da 9 circoscrizioni. In modo casuale semplice seleziono una circoscrizione (cluster) e poi studio tutti gli individui al suo interno.

31) DIFFERENZA TRA CAMPIONE STRATIFICATO E A GRAPPOLO C. STRATIFICATO  dividiamo la popolazione in 2 o più gruppi omogenei (STRATI) e poi effettuo il campionamento casuale semplice su ogni gruppo/strato. C. A GRAPPOLO  dividiamo la popolazione in gruppo disomogenei (CLUSTER), che presentano le stesse caratteristiche della popolazione, e poi studiamo tutti gli individui all’interno del cluster scelto casualmente.

32) PERCHÈ È NECESSARIO UTILIZZARE LA LISTA DI CAMPIONAMENTO PER OTTENERE UN CAMPIONE CASUALE SEMPLICE? La lista di campionamento è necessaria perchè elenca tutti gli individui appartenenti alla popolazione. Ogni individuo è associato ad un n° e i n° si ottengono attraverso la tabella dei n° casuali.

33) PERCHÈ IN STATISTICA SI UTILIZZA IL CAMPIONAMENTO CASUALE SEMPLICE? Perchè è un metodo probabilistico per la selezione del campione, ossia permette la generalizzazione dei risultati sulla popolazione. 9

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

34) CAMPIONAMENTO SENZA REINSERIMENTO Significa che l’individuo, una volta scelto, viene tolto dalla popolazione e non può più essere riscelto.

35) CLUSTER OMOGENEI E DISOMOGENEI OMOGENEI  è meglio individuare un n° maggiore di cluster, perchè un cluster potrebbe essere diverso da un altro. DISOMOGENEI  sono rappresentativi della popolazione.

36) COME DETERMINARE L’AMPIEZZA DEL CAMPIONE Il tempo e i soldi determinano il livello di affidabilità dei risultati. Più tempo e denaro il ricercatore ha a disposizione, più i risultati saranno accurati.

10

Distribuzione proibita | Scaricato da Ester Mannucci ([email protected])

DISTRIBUZIONI DI FREQUENZE 37) DISTRIBUZIONI DI FREQUENZE Consiste nell’associare ad ogni modalità (xi) il n° di volte che si presenta la modalità stessa. Può essere, DISTRIBUZIONE DI FREQUENZE: - ASSOLUTE (ni) - RELATIVE (fi) - PERCENTUALI (pi) Una distribuzione di...