NEW Statistica - Statitica PDF

Title	NEW Statistica - Statitica
Author	Vincy E Sabry
Course	Statistica
Institution	Università Telematica Pegaso
Pages	13
File Size	210.1 KB
File Type	PDF
Total Downloads	99
Total Views	154

Preview

CLICK TO PREVIEW PDF

Summary

Statitica...

Description

INTRUDUZIONE ALLA STATISTICA La statistica ci offre gli strumenti per: Organizzare, riassumere, analizzare i dati relativi ad un fenomeno, ottenuti attraverso le misurazioni. L’inferenza ha lo scopo di: Dedurre le caratteristiche dell’intera popolazione a partire dai dati raccolti. La statistica descrittiva: Organizza e riassume i dati. La popolazione è: L’universo di elementi che forma l’oggetto di uno studio statistico. Il campione è: Un sottoinsieme della popolazione. Un campione rappresentativo è: Casuale. Il campionamento sistematico è Caratterizzato dalla sezione di un elemento K elementi successivi. Il campionamento stratificato è: Caratterizzato da popolazione divisa in sottogruppi omogeni. Il campionamento a blocchi è: Caratterizzato da cluster. La statistica permette di ragionare: Facendo deduzioni ed induzioni. INDAGINE STATISTICA Le fasi di una indagine statistica si conviene siano le seguenti: Definizione degli obiettivi della ricerca, rilevazione dei dati, elaborazione metodologica, presentazione ed interpretazione dei risultati, utilizzazione dei risultati raggiunti. L’indagine statistica può essere: Campionaria o di tipo censuario. La statistica induttiva: Fa inferenza. La mutabile è: Un carattere qualitativo. Il numero di lanci di una moneta è una: Variabile discreta. Il reddito pro-capite è una: Variabile continua. Consideriamo la relazione y=f(x) dove x è rappresentato dall’inflazione ed y sono i tassi di interesse nell’euro area: X è la variabile indipendente. Considera la relazione causa-effetto y= -f(x) , calcola la y sapendo che f(x) = -10 ed indica il tipo di relazione: y=10, la relazione è lineare. Considera la relazione causa-effetto y= -f(x) calcola la y sapendo che f(x)= -10 ed indica il tipo di relazione: y=100, la relazione non è lineare. La sommatoria di tutte le frequenze relative di una tabella di frequenza è pari a: 1. STATISTICA INTRODUZIONE E APPROFONDIMENTI Che cosa è l’unità statistica: L’unità elementare oggetto di osservazione e di studio. La popolazione è finita: Quando è determinabile il numero di unità che compongono. Il lancio di una moneta è un esempio di: Popolazione infinita. Il carattere sesso è: Carattere qualitativo sconnesso. Il carattere età è: Un carattere continuo. Il carattere titolo di studio è: Un carattere qualitativo rettilineo. Il carattere stato civile è: Carattere qualitativo sconnesso. Il carattere numero di figli è: Carattere discreto. Il carattere professione è: Un carattere qualitativo sconnesso. Non è una scala di misura delle manifestazioni di carattere statistico: La scala semilogaritmica. FREQUENZA E DISTRIBUZIONI STATISTICHE La frequenza assoluta è: Il numero delle volte ni in cui la modalità xi è stata osservata. La frequenza relativa è uguale: ni /n In una distribuzione statistica, la somma della frequenza relative: È sempre uguale a 1. Una classe è aperta: Se entrambi gli estremi sono esclusi. Una classe è chiusa: Se entrambi gli estremi sono inclusi. L’ampiezza della classe è: La differenza tra estremo superiore e estremo inferiore della classe. La classe è chiusa a sinistra se: Solo l’estremo è incluso. Il valore centrale è: La semisomma dei due estremi. In una tabella doppia se entrambi le variabili sono qualitative, si parla di: Tabella di contingenza. In una tabella doppia se entrambi le variabili sono quantitative, si parla di: Tabella di correlazione. RAPPRESENTAZIONI GRAFICHE La rappresentazione grafica di distribuzioni di frequenze che si sviluppa attraverso una serie di rettangoli contigui viene chiamata: Istogramma.

La densità di frequenza di un istogramma: Si ottengono dal rapporto tra la frequenza di una classe e l’ampiezza della classe medesima. Come viene classificato l’ortogramma: Sia a nastro sia a colonne. Costituiscono rappresentazioni grafiche adatte per caratteri quantitativi: L’istogramma e box-plot. La rappresentazione grafica che si sviluppa attraverso una circonferenza suddivisa in tanti spicchi, viene chiamata: Diagramma circolare. Per la costruzione di un box plot si utilizzano i seguenti valori: Xmin Q1 Med Q3 xmax. Il box plot, rappresentato tramite un rettangolo, è diviso al suo interno: Dalla mediana. Il box plot fornisce le informazioni: Sulla variabilità, sulla presenza di valori anomale e sulla simmetria/asimmetria della distribuzione. All’interno del rettangolo (box plot) sono contenute: il 50% delle osservazioni. Costituiscono rappresentazioni grafiche adatte per caratteri qualitativi: Ortogramma e diagramma circolare. LE RELAZIONI STATISTICHE Tra due variabili vi è indipendenza assoluta se: Le frequenze osservate sono uguali alle frequenze teoriche. Si chiama contingenza: La differenza tra frequenze osservate e frequenze teoriche. La somma delle contingenze di ciascuna riga e di ciascuna colonna sono: Nulle. L’indice chi-quadrato di Pearson (x2): Dipende dalla dimensione del collettivo. Se si raddoppia la numerosità campionaria, il valore del chi-quadrato: Raddoppia. Il max x2 è uguale: n x [ min ( r – 1; c – 1 ) ] L’indice di contingenza quadratica medio ø2 è uguale: x2 / n L’indice di connessione di Cramer varia: Tra 0 e 1 Indice di chi-quadrato è un indice: Simmetrico. Quali di questi indici è relativo: L’indice di connessione di Cramer. LE MEDIE RAZIONALI Vengono prelevate 15 compresse da un lotto di produzione, i valori sono: 0,485, 0.442, 0,466, 0,448 , 0, 419, 0,450, 0,435, 0,434, o,450, 0,422, 0,440 , 0,464. Calcolare il peso medio: 0,4415. Considerando i seguenti dati: Calcolare la media aritmetica: 34.19 La media geometrica è uguale: Alla radice n-esima del prodotto dei termini. Trovare la media geometrica: 3,5,6,6,7,10,12: 6.43 Calcolare la media geometrica relativa all’andamento dei prezzi di un dato prodotto: 1,103 1,031 0,939 1,097: 1.04 I voti riportati da uno studente in fisica, statistica e matematica sono: 71 78 89 (voti in centesimi). I psi attribuiti alle discipline sono rispettivamente 2 4 5. Calcolare la media dei voti: 82. La media armonica è: Il reciproco della media aritmetica dei reciproci dei termini. Due punti C e D, distano 80 km, un corpo si muove da C a D alla velocità di 80 km/h e da D a C alla velocità di 20 km/h. Determinare la velocità media dell’interno tragitto: 32 km/h. La media armonica è particolarmente usata: Quando si mediano rapporti di tempo. La media geometrica è particolarmente usata: Quando i diversi valori vengono per loro natura moltiplicati. LE MEDIE Calcolare la mediana della seguente serie di voti: 19 20 22 18 26 30 28: 22 Calcolare la mediana della seguente serie: -2 -3 -5 0 1 4 7 : 0 Il secondo quartile coincide con: La mediana. Si consideri la seguente distribuzione in classi: la classe mediana: 58-62 pesi frequenze Con riferimento alla domanda 4(la precedente) la mediana: 61.52 Il primo quartile: Quel valore che lascia alla sua destra il 75% delle osservazione e alla sua sinistra il 25% delle osservazioni. Si consideri la seguente distribuzione in classi: Calcolare il primo quartile: 55.97 pesi frequenze Si consideri la seguente distribuzione in classi: Calcolare il terzo quartile: 69. pesi frequenze Data una serie di valori numerici, il valore a cui corrisponde la massima frequenza si chiama: Moda

LA VARIABILITÀ: Cosa si intende variabilità: È l’attitudine di un fenomeno quantitativo ad assumere differente modalità. Quale dei seguenti indica la variabilità di una serie dei dati: Scarto quadratico medio. La devianza è: La somma degli scarti della media aritmetica al quadrato. Conoscendo la devianza, lo scarto quadratico medio si ricava calcolando: La radice quadrata del rapporto tra devianza e numerosità del collettivo. Calcolare la varianza dei seguenti numeri: 12 6 7 3 15 10 18 5: 23,75 Calcolare lo scarto quadratico medio dei seguenti numeri: 12 6 7 3 15 10 18 5 : 4.87 Il coefficiente di variazione è dato dal rapporto, espresso in termine percentuali tra: Lo scarto quadratico medio e media aritmetica. La differenza interquartile è data dalla: Tra terzo e primo quartile. Il campo di variazione è dato dalla: Differenza tra valore massimo e minimo della distribuzione. La mutabilità è: L’attitudine di un fenomeno qualitativo ad assumere differente modalità. INDICI DI FORMA: Dire se la seguente distribuzione è simmetrica: 8,14,16,16,16,21,21:Non è simmetrica L'asimmetria di una distribuzione denota che: I valori del del caratteri sono distribuiti con frequenze differenti attorno al suo valore centrale. L'asimmetria di una distribuzione può essere: Nulla, positiva o negativa. Se la distribuzione è asimmetria positiva si ha: Med-Q1 < Q3- Med Se la distribuzione è asimmetria negativa si ha: Med-Q1 > Q3- Med L'indice di asimmetria Skewness di Pearson è calcolato: Come differenza tra la media aritmetica e la moda divisa la deviazione standard. La curtosi rappresenta: Il grado di schiacciamento di una distribuzione intorno al suo centro di gravità e rispetto alla curva normale. La distribuzione di dice platicurtica se: È più schiacciata rispetto alla normale. La distribuzione di dice leptocurtica se:È più appuntita rispetto alla normale. Il coefficiente di curtosi di Pearson è uguale: Momento quadrato/quadrato della varianza. LE RELAZIONI STATISTICHE: INDIPENDENZA IN MEDIA: Si ha indipendenza in media tra due variabili statistiche se: La media parziali sono uguali tra di loro ed uguali alla media generale. L’indipendenza in media: Non è un concetto simmetrico. Il rapporto di correlazione di Pearson varia: Tra 0 e 1 Si ha concordanza tra due variabili se: Cod (X,Y)>0 Si ha discordanza tra due variabili se: Cod (X,Y) < 0 Si ha indipendenza correlativa tra due variabili se: Cod (X,Y) = 0 Due variabili si dicono perfettamente correlate se: Il coefficiente di correlazione è pari a 1 in valore assoluto. Date le variabili:X(Velocità km/h): 60,80,100,120,130 Y(Consumo in quinta km/litro): 28.8, 24.2,20,18.2,16. La codevianza (X,Y) è: -577.6 La covarianza (X,Y): È una misura simmetrica. Il coefficiente di correlazione: È un numero puro. LA REGRESSIONE LINEARE SEMPLICE: Il coefficiente angolare bi rappresenta: La pendenza della retta. Con il metodo dei minimi quadrati:Si minimizza la somma dei quadrati degli scarti tra valori osservati e valori teorici. Date le variabili: X(Velocità km/h): 60, 80, 100,120,130 Y(Consumo in quinta km/litro): 29.8, 24.2, 20, 18.2, 16,2. Determinare l'equazione della retta: y^= 39,882-0,1857xi Date le variabili: X(Velocità km/h): 60, 80, 100,120,130 Y(Consumo in quinta km/litro): 29.8, 24.2, 20, 18.2, 16,2, il coefficiente di determinaziome lineare è: 0,9650 Il coefficiente di determinazione lineare è uguale a 1 se è nulla: La devianza residua La devianza di regressione misura: Quanta parte della variabilità della Y è spiegata dalla relazione lineare Se la Cod (X,Y)>0: La retta di regressione è crescente Il coefficiente di determinazione lineare è: Il quadrato del coefficiente di correlazione lineare Il coefficiente di determinazione lineare è nullo se è nulla: La devianza di regressione Se il coefficiente di correlazione r=0: Non c’è correlazione lineare.

ELEMENTI DI CALCOLO DELLE PROBABILITÀ Un esperimento casuale è: Un’operazione il cui risultato non può essere previsto con certezza. Dati i seguenti eventi: A=(1,2,3), B=(2,3,4). Determinare A∪B: A∪B={1,2,3,4} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare A ∪ B ∪ C: A∪B∪C={1,3,5,7,9,10} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare A∩B: A∩B={3,5} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare A∩C: A∩C={1,5} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare B∩C: B∩C={5,9,10} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare A∩B∩C: A∩B∩C={5} Per il postulato 2 dell'assiomatizzazione del calcolo delle probabilità, l'evento certo Ω ha probabilità: P(Ω)=1Ω)=1)=1 La probabilità dell'unione di due eventi A e B non incompatibili: P(Ω)=1A ∪B)= P(Ω)=1A)+P(Ω)=1B)P(Ω)=1A∩B) Se due eventi A e B sono indipendenti allora: P(Ω)=1A∩B)= P(Ω)=1A)P(Ω)=1B) VARIABILI CASUALI: Una variabile casuale: È una funzione definita sullo spazio dei campioni. La funzione di ripartizione di una variabile casuale: Esprime la probabilità che la variabile casuale assuma valori inferiori o uguali ad un valore fissato. Una distribuzione di probabilità di una variabile casuale: L'insieme delle coppie probabilità dei diversi valori possibili della variabile casuale. La funzione di ripartizione di una variabile casuale discreta: E' una funzioni a gradini non decrescente. Sia data una v.c X, se essa assume valori in corrispondenza di un insieme numerabile allora X è: Discreta. Una variabile casuale continua X: Assume tutti i valori appartenti ad un intervallo. Affinchè una v.c X continua sia ben definità occorre che: Il valore atteso E(b+X) è: (b è una costante reale): E(b+X)=b+E(X) l valore atteso E(X+Y) è: (X e Y sono due varibili casuali): E(X+Y)= E(X)+E(Y) La Var (aX+b) è: a e b sono due costanti reali: Var (aX+b)=a²Var (X) PRINCIPALI DISTRIBUZIONI DI PROBABILITÀ La variabile casuale uniforme discreta: E' tale che ogni sua realizzazione è equiprobabile La distribuzione della normale standardizzata: Ha media uguale a 0 e varianza uguale 1 La distribuzione binomiale: Può essere utilizzata per descrivere casi in cui gli esiti possibili di una prova sono solo due. La distibuzione normale è: E' simmetrica rispetto al valor medio. A quanto corrisponde l'area sotto la curva normale tra z=0 e z=1,2: 0,3849 A quanto corrisponde l'area sotto la curva normale tra z=0 e z=1,4: 0,4192 A quanto corrisponde l'area sotto la curva normale tra z=0,81 e z=1,94: 0,1828 La variabile casuale chi-quadrato: Non può assumere valori negativi. La variabile casuale t di student: Al tendere di n all'infinito la v.c t di student tende alla normale standardizzata. La variabile casuale F di Fisher-Snedecor: Ha valore atteso E(F)= m/(m-2) ESERCITAZIONE DISTRIBUZIONE BINOMINALE E NORMALE (manca test) CAMPIONAMENO E DISTRIBUZIONI CAMPIONARIE: Nel campionamento bernoulliano: Ogni unità statistica può entrare a far parte più volte del campione. Nel campionamento bernoulliano: I risultati delle estrazioni sono indipendenti. Da una popolazione composta da 5 unità statistiche ( A, B, C, D, E ) si voglia estrarre, con ripetizione, un campione casuale di numerosità 2. Lo spazio campionario è composto da: 25 possibili campioni. Da una popolazione composta da 4 unità statistiche ( A, B, C, D ) si voglia estrarre, con ripetizione, un campione casuale di numerosità 2. Lo spazio campionario è composto da: 16 possibi campioni. Da una popolazione composta da 4 unità statistiche ( A, B, C, D ) si voglia estrarre, con ripetizione, un campione casuale di numerosità 3. Lo spazio campionario è composto da: 64 possibili campioni Una statistica è: Una variabile casuale definita sui campioni. Una distribuzione campionaria è: La distribuzione di probabilità di una statistica. La media della distribuzione della media campionaria: Coincide con la media della popolazione Quando la popolazione è infinita: Lo schema di campiomento con ripetizione coincide con lo schema di campiomaento senza ripetizione.

Il teorema del limite centrale: Afferma che al crescere di n la forma della distribuzione della media campionaria si approssima alla forma normale. TEORIA DELLA STIMA STATISTICA: Cosa si intende per stima puntuale: La stima attraverso la quale si giunge alla determinazione di un solo valore numerico per uno o più parametri della popolazione. Cosa si intende per stima intervallare: La stima attraverso la quale si giunge alla determinazione di un intervallo, che include il parametro stimato, con livello di confidenza 1Lo stimatore di un parametro: È una variabile casuale Si definisce stima: Il valore assunto dallo stimatore per un dato campione Uno stimatore corretto: È tale che il suo valore medio coincide con il valore del parametro da stimare Se lo stimatore è corretto: EQM=Varianza dello stimatore Lo stimatore varianza campionaria corretta: Ha media pari al parametro da stimare Uno stimatore si dice consistente: Al crescere della numerosità campionaria, tende a concentrarsi sul parametro da stimare. Uno stimatore corretto è più efficiente di un altro stimatore corretto del parametro"teta"non noto se: Se presenta varianza inferiore. Dati due stimatori T1 e T2 di uno stesso parametro: Se entrambi sono non distorti, il confronto tra i due stimatori in termini di efficienza può essere effettuato solo sulla base della varianza TEORIA DELLA STIMA STATISTICA-STIMA PER INTERVALLI: Un intervallo di confidenza è: Un intervallo di valori che si ritiene contenga il vero parametro della popolazione con una prestabilita "fiducia" Una quantità pivotale è: Una quantità che è funzione delle osservazione e del parametro del quale si vuole costruire l'intervallo di confidenza, con la caratteristica che la sua distribuzione è nota e non dipende dal parametro in esame L'ampiezza dell'intervallo è tanta più elavata quanto più: n è piccolo Per la determinazione dell'intervallo di confidenza per la media di una popolazione normale con varianza nota, si utilizza: La distribuzione normale standardizzata. Per la determinazione dell'intervallo di confidenza per la media di una popolazione normale con varianza non nota (n: La distribuzione t di student Se la popolazione non è normale per il teorema del limite centrale, quando n>30, si può costruire l'intervallo di confidenza: Basato sulla distribuzione normale standardizzata Per trovare l'intervallo di confidenza per la media di una popolazione normale, si utilizza la t di student, anziché la normale standardizzata perché: La varianza della popolazione non è nota. Si effettuano 60 misurazioni sperimentali da cui si evince una media campionaria uguale a 33. Costruire un intervallo di confidenza al 90% per la media della popolazione, la quale si distribuisce normalmente con varianza pari a 115: IC=[30,723; 35,277] Supponiamo che la perdita di peso di n=16 pezzi di metallo, dopo un certo intervallo di tempo, sia di 3,42 gr con varianza campionaria corretta pari a 0,4624. Costruire un intervallo di confidenza al 99% per la media della popolazione di peso dei pezzi di metallo: IC=[2,92;3,92] Da una partita di bulloni metallici è stato estratto un campione di n=100 elementi e se ne sono trovati 20 difettosi. Costruire un intervallo di confidenza al 95% per la proporzione p dei pezzi difettosi: IC=[0,1216;0,2784] DETERMINAZIONE DELLA NUMEOSITÀ CAMPIONARIA: L'ampiezza A dell'intervallo di confidenza per : In riferimento alla domanda 1 la numerosità n è uguale: Quanto dovrebbe essere grande un campione per avere un intervallo di confidenza al 95% per il contenuto medio di nicotina di una data marca di sigarette, se il contenuto di nicotina ha una distribuzione normale con σ=8,5 mg e l'ampiezza dell'intervallo deve essere di 6 mg: n=31 Una partita di pistoncini di freni presenta un diametroμ incognito; la varianza del diametro dei pistoncini è invece nota e pari 0,01 cm. Si estrae un campione di n=1000 pistoncini, sui quali si osserva un diametro medio pari a 1,2 cm. Si calcoli l'intervallo di confidenza per μ ad un livello di confidenza del 95%: IC=[1,1938;1,2062] In rifermento alla domanda 4 si calcoli l'ampiezza di tale intervallo: 0.0124 Nel caso di estrazione senza ripetizione la deviazione standard delle frequenze campionarie è: Nel caso di estrazione con ripetizione la deviazione standard delle frequenze campionarie è:

L'ampiezza dell'intervallo di confidenza per una proporzione è: Se la popolazione è sufficiente grande, o nel caso di estrazione con ripetizionesi ha che: Si vuole conoscere la proporzione di pezzi difettosi prodotti da una macchina. Determinare la numerosità campionaria necessaria affinchè la vera proporzione cada in un intervallo al 90%, tollerando un errore non superiore al 3%: n=751,67 LA VERIFICA DELLE IPOTESI: Un ipotesi statistica è: Un affermazione sulla distribuzione di probabilità di una variabile casuale La verifica delle ipotesi:Consiste nel formulare, sulla base di dati campionari, un giudizio che induca ad accettare o rifiutare l'ipotesi nulla, con un prefissato livello di significatività L'ipotesi parametrica riguarda: I parametri caratteristici di una particolare distribuzione di cui si conosce la forma analitica Le ipotesi statistiche: Si tratta due ipotesi alternative complementari e logicamente e...