Title | NEW Statistica - Statitica |
---|---|
Author | Vincy E Sabry |
Course | Statistica |
Institution | Università Telematica Pegaso |
Pages | 13 |
File Size | 210.1 KB |
File Type | |
Total Downloads | 99 |
Total Views | 154 |
Statitica...
INTRUDUZIONE ALLA STATISTICA La statistica ci offre gli strumenti per: Organizzare, riassumere, analizzare i dati relativi ad un fenomeno, ottenuti attraverso le misurazioni. L’inferenza ha lo scopo di: Dedurre le caratteristiche dell’intera popolazione a partire dai dati raccolti. La statistica descrittiva: Organizza e riassume i dati. La popolazione è: L’universo di elementi che forma l’oggetto di uno studio statistico. Il campione è: Un sottoinsieme della popolazione. Un campione rappresentativo è: Casuale. Il campionamento sistematico è Caratterizzato dalla sezione di un elemento K elementi successivi. Il campionamento stratificato è: Caratterizzato da popolazione divisa in sottogruppi omogeni. Il campionamento a blocchi è: Caratterizzato da cluster. La statistica permette di ragionare: Facendo deduzioni ed induzioni. INDAGINE STATISTICA Le fasi di una indagine statistica si conviene siano le seguenti: Definizione degli obiettivi della ricerca, rilevazione dei dati, elaborazione metodologica, presentazione ed interpretazione dei risultati, utilizzazione dei risultati raggiunti. L’indagine statistica può essere: Campionaria o di tipo censuario. La statistica induttiva: Fa inferenza. La mutabile è: Un carattere qualitativo. Il numero di lanci di una moneta è una: Variabile discreta. Il reddito pro-capite è una: Variabile continua. Consideriamo la relazione y=f(x) dove x è rappresentato dall’inflazione ed y sono i tassi di interesse nell’euro area: X è la variabile indipendente. Considera la relazione causa-effetto y= -f(x) , calcola la y sapendo che f(x) = -10 ed indica il tipo di relazione: y=10, la relazione è lineare. Considera la relazione causa-effetto y= -f(x) calcola la y sapendo che f(x)= -10 ed indica il tipo di relazione: y=100, la relazione non è lineare. La sommatoria di tutte le frequenze relative di una tabella di frequenza è pari a: 1. STATISTICA INTRODUZIONE E APPROFONDIMENTI Che cosa è l’unità statistica: L’unità elementare oggetto di osservazione e di studio. La popolazione è finita: Quando è determinabile il numero di unità che compongono. Il lancio di una moneta è un esempio di: Popolazione infinita. Il carattere sesso è: Carattere qualitativo sconnesso. Il carattere età è: Un carattere continuo. Il carattere titolo di studio è: Un carattere qualitativo rettilineo. Il carattere stato civile è: Carattere qualitativo sconnesso. Il carattere numero di figli è: Carattere discreto. Il carattere professione è: Un carattere qualitativo sconnesso. Non è una scala di misura delle manifestazioni di carattere statistico: La scala semilogaritmica. FREQUENZA E DISTRIBUZIONI STATISTICHE La frequenza assoluta è: Il numero delle volte ni in cui la modalità xi è stata osservata. La frequenza relativa è uguale: ni /n In una distribuzione statistica, la somma della frequenza relative: È sempre uguale a 1. Una classe è aperta: Se entrambi gli estremi sono esclusi. Una classe è chiusa: Se entrambi gli estremi sono inclusi. L’ampiezza della classe è: La differenza tra estremo superiore e estremo inferiore della classe. La classe è chiusa a sinistra se: Solo l’estremo è incluso. Il valore centrale è: La semisomma dei due estremi. In una tabella doppia se entrambi le variabili sono qualitative, si parla di: Tabella di contingenza. In una tabella doppia se entrambi le variabili sono quantitative, si parla di: Tabella di correlazione. RAPPRESENTAZIONI GRAFICHE La rappresentazione grafica di distribuzioni di frequenze che si sviluppa attraverso una serie di rettangoli contigui viene chiamata: Istogramma.
La densità di frequenza di un istogramma: Si ottengono dal rapporto tra la frequenza di una classe e l’ampiezza della classe medesima. Come viene classificato l’ortogramma: Sia a nastro sia a colonne. Costituiscono rappresentazioni grafiche adatte per caratteri quantitativi: L’istogramma e box-plot. La rappresentazione grafica che si sviluppa attraverso una circonferenza suddivisa in tanti spicchi, viene chiamata: Diagramma circolare. Per la costruzione di un box plot si utilizzano i seguenti valori: Xmin Q1 Med Q3 xmax. Il box plot, rappresentato tramite un rettangolo, è diviso al suo interno: Dalla mediana. Il box plot fornisce le informazioni: Sulla variabilità, sulla presenza di valori anomale e sulla simmetria/asimmetria della distribuzione. All’interno del rettangolo (box plot) sono contenute: il 50% delle osservazioni. Costituiscono rappresentazioni grafiche adatte per caratteri qualitativi: Ortogramma e diagramma circolare. LE RELAZIONI STATISTICHE Tra due variabili vi è indipendenza assoluta se: Le frequenze osservate sono uguali alle frequenze teoriche. Si chiama contingenza: La differenza tra frequenze osservate e frequenze teoriche. La somma delle contingenze di ciascuna riga e di ciascuna colonna sono: Nulle. L’indice chi-quadrato di Pearson (x2): Dipende dalla dimensione del collettivo. Se si raddoppia la numerosità campionaria, il valore del chi-quadrato: Raddoppia. Il max x2 è uguale: n x [ min ( r – 1; c – 1 ) ] L’indice di contingenza quadratica medio ø2 è uguale: x2 / n L’indice di connessione di Cramer varia: Tra 0 e 1 Indice di chi-quadrato è un indice: Simmetrico. Quali di questi indici è relativo: L’indice di connessione di Cramer. LE MEDIE RAZIONALI Vengono prelevate 15 compresse da un lotto di produzione, i valori sono: 0,485, 0.442, 0,466, 0,448 , 0, 419, 0,450, 0,435, 0,434, o,450, 0,422, 0,440 , 0,464. Calcolare il peso medio: 0,4415. Considerando i seguenti dati: Calcolare la media aritmetica: 34.19 La media geometrica è uguale: Alla radice n-esima del prodotto dei termini. Trovare la media geometrica: 3,5,6,6,7,10,12: 6.43 Calcolare la media geometrica relativa all’andamento dei prezzi di un dato prodotto: 1,103 1,031 0,939 1,097: 1.04 I voti riportati da uno studente in fisica, statistica e matematica sono: 71 78 89 (voti in centesimi). I psi attribuiti alle discipline sono rispettivamente 2 4 5. Calcolare la media dei voti: 82. La media armonica è: Il reciproco della media aritmetica dei reciproci dei termini. Due punti C e D, distano 80 km, un corpo si muove da C a D alla velocità di 80 km/h e da D a C alla velocità di 20 km/h. Determinare la velocità media dell’interno tragitto: 32 km/h. La media armonica è particolarmente usata: Quando si mediano rapporti di tempo. La media geometrica è particolarmente usata: Quando i diversi valori vengono per loro natura moltiplicati. LE MEDIE Calcolare la mediana della seguente serie di voti: 19 20 22 18 26 30 28: 22 Calcolare la mediana della seguente serie: -2 -3 -5 0 1 4 7 : 0 Il secondo quartile coincide con: La mediana. Si consideri la seguente distribuzione in classi: la classe mediana: 58-62 pesi frequenze Con riferimento alla domanda 4(la precedente) la mediana: 61.52 Il primo quartile: Quel valore che lascia alla sua destra il 75% delle osservazione e alla sua sinistra il 25% delle osservazioni. Si consideri la seguente distribuzione in classi: Calcolare il primo quartile: 55.97 pesi frequenze Si consideri la seguente distribuzione in classi: Calcolare il terzo quartile: 69. pesi frequenze Data una serie di valori numerici, il valore a cui corrisponde la massima frequenza si chiama: Moda
LA VARIABILITÀ: Cosa si intende variabilità: È l’attitudine di un fenomeno quantitativo ad assumere differente modalità. Quale dei seguenti indica la variabilità di una serie dei dati: Scarto quadratico medio. La devianza è: La somma degli scarti della media aritmetica al quadrato. Conoscendo la devianza, lo scarto quadratico medio si ricava calcolando: La radice quadrata del rapporto tra devianza e numerosità del collettivo. Calcolare la varianza dei seguenti numeri: 12 6 7 3 15 10 18 5: 23,75 Calcolare lo scarto quadratico medio dei seguenti numeri: 12 6 7 3 15 10 18 5 : 4.87 Il coefficiente di variazione è dato dal rapporto, espresso in termine percentuali tra: Lo scarto quadratico medio e media aritmetica. La differenza interquartile è data dalla: Tra terzo e primo quartile. Il campo di variazione è dato dalla: Differenza tra valore massimo e minimo della distribuzione. La mutabilità è: L’attitudine di un fenomeno qualitativo ad assumere differente modalità. INDICI DI FORMA: Dire se la seguente distribuzione è simmetrica: 8,14,16,16,16,21,21:Non è simmetrica L'asimmetria di una distribuzione denota che: I valori del del caratteri sono distribuiti con frequenze differenti attorno al suo valore centrale. L'asimmetria di una distribuzione può essere: Nulla, positiva o negativa. Se la distribuzione è asimmetria positiva si ha: Med-Q1 < Q3- Med Se la distribuzione è asimmetria negativa si ha: Med-Q1 > Q3- Med L'indice di asimmetria Skewness di Pearson è calcolato: Come differenza tra la media aritmetica e la moda divisa la deviazione standard. La curtosi rappresenta: Il grado di schiacciamento di una distribuzione intorno al suo centro di gravità e rispetto alla curva normale. La distribuzione di dice platicurtica se: È più schiacciata rispetto alla normale. La distribuzione di dice leptocurtica se:È più appuntita rispetto alla normale. Il coefficiente di curtosi di Pearson è uguale: Momento quadrato/quadrato della varianza. LE RELAZIONI STATISTICHE: INDIPENDENZA IN MEDIA: Si ha indipendenza in media tra due variabili statistiche se: La media parziali sono uguali tra di loro ed uguali alla media generale. L’indipendenza in media: Non è un concetto simmetrico. Il rapporto di correlazione di Pearson varia: Tra 0 e 1 Si ha concordanza tra due variabili se: Cod (X,Y)>0 Si ha discordanza tra due variabili se: Cod (X,Y) < 0 Si ha indipendenza correlativa tra due variabili se: Cod (X,Y) = 0 Due variabili si dicono perfettamente correlate se: Il coefficiente di correlazione è pari a 1 in valore assoluto. Date le variabili:X(Velocità km/h): 60,80,100,120,130 Y(Consumo in quinta km/litro): 28.8, 24.2,20,18.2,16. La codevianza (X,Y) è: -577.6 La covarianza (X,Y): È una misura simmetrica. Il coefficiente di correlazione: È un numero puro. LA REGRESSIONE LINEARE SEMPLICE: Il coefficiente angolare bi rappresenta: La pendenza della retta. Con il metodo dei minimi quadrati:Si minimizza la somma dei quadrati degli scarti tra valori osservati e valori teorici. Date le variabili: X(Velocità km/h): 60, 80, 100,120,130 Y(Consumo in quinta km/litro): 29.8, 24.2, 20, 18.2, 16,2. Determinare l'equazione della retta: y^= 39,882-0,1857xi Date le variabili: X(Velocità km/h): 60, 80, 100,120,130 Y(Consumo in quinta km/litro): 29.8, 24.2, 20, 18.2, 16,2, il coefficiente di determinaziome lineare è: 0,9650 Il coefficiente di determinazione lineare è uguale a 1 se è nulla: La devianza residua La devianza di regressione misura: Quanta parte della variabilità della Y è spiegata dalla relazione lineare Se la Cod (X,Y)>0: La retta di regressione è crescente Il coefficiente di determinazione lineare è: Il quadrato del coefficiente di correlazione lineare Il coefficiente di determinazione lineare è nullo se è nulla: La devianza di regressione Se il coefficiente di correlazione r=0: Non c’è correlazione lineare.
ELEMENTI DI CALCOLO DELLE PROBABILITÀ Un esperimento casuale è: Un’operazione il cui risultato non può essere previsto con certezza. Dati i seguenti eventi: A=(1,2,3), B=(2,3,4). Determinare A∪B: A∪B={1,2,3,4} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare A ∪ B ∪ C: A∪B∪C={1,3,5,7,9,10} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare A∩B: A∩B={3,5} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare A∩C: A∩C={1,5} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare B∩C: B∩C={5,9,10} Dati i seguenti eventi: A=(1,3,5,7), B=(3,5,9,10), C(1,5,9,10). Determinare A∩B∩C: A∩B∩C={5} Per il postulato 2 dell'assiomatizzazione del calcolo delle probabilità, l'evento certo Ω ha probabilità: P(Ω)=1Ω)=1)=1 La probabilità dell'unione di due eventi A e B non incompatibili: P(Ω)=1A ∪B)= P(Ω)=1A)+P(Ω)=1B)P(Ω)=1A∩B) Se due eventi A e B sono indipendenti allora: P(Ω)=1A∩B)= P(Ω)=1A)P(Ω)=1B) VARIABILI CASUALI: Una variabile casuale: È una funzione definita sullo spazio dei campioni. La funzione di ripartizione di una variabile casuale: Esprime la probabilità che la variabile casuale assuma valori inferiori o uguali ad un valore fissato. Una distribuzione di probabilità di una variabile casuale: L'insieme delle coppie probabilità dei diversi valori possibili della variabile casuale. La funzione di ripartizione di una variabile casuale discreta: E' una funzioni a gradini non decrescente. Sia data una v.c X, se essa assume valori in corrispondenza di un insieme numerabile allora X è: Discreta. Una variabile casuale continua X: Assume tutti i valori appartenti ad un intervallo. Affinchè una v.c X continua sia ben definità occorre che: Il valore atteso E(b+X) è: (b è una costante reale): E(b+X)=b+E(X) l valore atteso E(X+Y) è: (X e Y sono due varibili casuali): E(X+Y)= E(X)+E(Y) La Var (aX+b) è: a e b sono due costanti reali: Var (aX+b)=a²Var (X) PRINCIPALI DISTRIBUZIONI DI PROBABILITÀ La variabile casuale uniforme discreta: E' tale che ogni sua realizzazione è equiprobabile La distribuzione della normale standardizzata: Ha media uguale a 0 e varianza uguale 1 La distribuzione binomiale: Può essere utilizzata per descrivere casi in cui gli esiti possibili di una prova sono solo due. La distibuzione normale è: E' simmetrica rispetto al valor medio. A quanto corrisponde l'area sotto la curva normale tra z=0 e z=1,2: 0,3849 A quanto corrisponde l'area sotto la curva normale tra z=0 e z=1,4: 0,4192 A quanto corrisponde l'area sotto la curva normale tra z=0,81 e z=1,94: 0,1828 La variabile casuale chi-quadrato: Non può assumere valori negativi. La variabile casuale t di student: Al tendere di n all'infinito la v.c t di student tende alla normale standardizzata. La variabile casuale F di Fisher-Snedecor: Ha valore atteso E(F)= m/(m-2) ESERCITAZIONE DISTRIBUZIONE BINOMINALE E NORMALE (manca test) CAMPIONAMENO E DISTRIBUZIONI CAMPIONARIE: Nel campionamento bernoulliano: Ogni unità statistica può entrare a far parte più volte del campione. Nel campionamento bernoulliano: I risultati delle estrazioni sono indipendenti. Da una popolazione composta da 5 unità statistiche ( A, B, C, D, E ) si voglia estrarre, con ripetizione, un campione casuale di numerosità 2. Lo spazio campionario è composto da: 25 possibili campioni. Da una popolazione composta da 4 unità statistiche ( A, B, C, D ) si voglia estrarre, con ripetizione, un campione casuale di numerosità 2. Lo spazio campionario è composto da: 16 possibi campioni. Da una popolazione composta da 4 unità statistiche ( A, B, C, D ) si voglia estrarre, con ripetizione, un campione casuale di numerosità 3. Lo spazio campionario è composto da: 64 possibili campioni Una statistica è: Una variabile casuale definita sui campioni. Una distribuzione campionaria è: La distribuzione di probabilità di una statistica. La media della distribuzione della media campionaria: Coincide con la media della popolazione Quando la popolazione è infinita: Lo schema di campiomento con ripetizione coincide con lo schema di campiomaento senza ripetizione.
Il teorema del limite centrale: Afferma che al crescere di n la forma della distribuzione della media campionaria si approssima alla forma normale. TEORIA DELLA STIMA STATISTICA: Cosa si intende per stima puntuale: La stima attraverso la quale si giunge alla determinazione di un solo valore numerico per uno o più parametri della popolazione. Cosa si intende per stima intervallare: La stima attraverso la quale si giunge alla determinazione di un intervallo, che include il parametro stimato, con livello di confidenza 1Lo stimatore di un parametro: È una variabile casuale Si definisce stima: Il valore assunto dallo stimatore per un dato campione Uno stimatore corretto: È tale che il suo valore medio coincide con il valore del parametro da stimare Se lo stimatore è corretto: EQM=Varianza dello stimatore Lo stimatore varianza campionaria corretta: Ha media pari al parametro da stimare Uno stimatore si dice consistente: Al crescere della numerosità campionaria, tende a concentrarsi sul parametro da stimare. Uno stimatore corretto è più efficiente di un altro stimatore corretto del parametro"teta"non noto se: Se presenta varianza inferiore. Dati due stimatori T1 e T2 di uno stesso parametro: Se entrambi sono non distorti, il confronto tra i due stimatori in termini di efficienza può essere effettuato solo sulla base della varianza TEORIA DELLA STIMA STATISTICA-STIMA PER INTERVALLI: Un intervallo di confidenza è: Un intervallo di valori che si ritiene contenga il vero parametro della popolazione con una prestabilita "fiducia" Una quantità pivotale è: Una quantità che è funzione delle osservazione e del parametro del quale si vuole costruire l'intervallo di confidenza, con la caratteristica che la sua distribuzione è nota e non dipende dal parametro in esame L'ampiezza dell'intervallo è tanta più elavata quanto più: n è piccolo Per la determinazione dell'intervallo di confidenza per la media di una popolazione normale con varianza nota, si utilizza: La distribuzione normale standardizzata. Per la determinazione dell'intervallo di confidenza per la media di una popolazione normale con varianza non nota (n: La distribuzione t di student Se la popolazione non è normale per il teorema del limite centrale, quando n>30, si può costruire l'intervallo di confidenza: Basato sulla distribuzione normale standardizzata Per trovare l'intervallo di confidenza per la media di una popolazione normale, si utilizza la t di student, anziché la normale standardizzata perché: La varianza della popolazione non è nota. Si effettuano 60 misurazioni sperimentali da cui si evince una media campionaria uguale a 33. Costruire un intervallo di confidenza al 90% per la media della popolazione, la quale si distribuisce normalmente con varianza pari a 115: IC=[30,723; 35,277] Supponiamo che la perdita di peso di n=16 pezzi di metallo, dopo un certo intervallo di tempo, sia di 3,42 gr con varianza campionaria corretta pari a 0,4624. Costruire un intervallo di confidenza al 99% per la media della popolazione di peso dei pezzi di metallo: IC=[2,92;3,92] Da una partita di bulloni metallici è stato estratto un campione di n=100 elementi e se ne sono trovati 20 difettosi. Costruire un intervallo di confidenza al 95% per la proporzione p dei pezzi difettosi: IC=[0,1216;0,2784] DETERMINAZIONE DELLA NUMEOSITÀ CAMPIONARIA: L'ampiezza A dell'intervallo di confidenza per : In riferimento alla domanda 1 la numerosità n è uguale: Quanto dovrebbe essere grande un campione per avere un intervallo di confidenza al 95% per il contenuto medio di nicotina di una data marca di sigarette, se il contenuto di nicotina ha una distribuzione normale con σ=8,5 mg e l'ampiezza dell'intervallo deve essere di 6 mg: n=31 Una partita di pistoncini di freni presenta un diametroμ incognito; la varianza del diametro dei pistoncini è invece nota e pari 0,01 cm. Si estrae un campione di n=1000 pistoncini, sui quali si osserva un diametro medio pari a 1,2 cm. Si calcoli l'intervallo di confidenza per μ ad un livello di confidenza del 95%: IC=[1,1938;1,2062] In rifermento alla domanda 4 si calcoli l'ampiezza di tale intervallo: 0.0124 Nel caso di estrazione senza ripetizione la deviazione standard delle frequenze campionarie è: Nel caso di estrazione con ripetizione la deviazione standard delle frequenze campionarie è:
L'ampiezza dell'intervallo di confidenza per una proporzione è: Se la popolazione è sufficiente grande, o nel caso di estrazione con ripetizionesi ha che: Si vuole conoscere la proporzione di pezzi difettosi prodotti da una macchina. Determinare la numerosità campionaria necessaria affinchè la vera proporzione cada in un intervallo al 90%, tollerando un errore non superiore al 3%: n=751,67 LA VERIFICA DELLE IPOTESI: Un ipotesi statistica è: Un affermazione sulla distribuzione di probabilità di una variabile casuale La verifica delle ipotesi:Consiste nel formulare, sulla base di dati campionari, un giudizio che induca ad accettare o rifiutare l'ipotesi nulla, con un prefissato livello di significatività L'ipotesi parametrica riguarda: I parametri caratteristici di una particolare distribuzione di cui si conosce la forma analitica Le ipotesi statistiche: Si tratta due ipotesi alternative complementari e logicamente e...