Distribuzione di frequenza con due variabili, covarianza PDF

Title Distribuzione di frequenza con due variabili, covarianza
Author aurora piantanida
Course Statistica
Institution Università di Pisa
Pages 3
File Size 113.8 KB
File Type PDF
Total Downloads 104
Total Views 142

Summary

come si procede quando ci troviamo a studiare due variabili, quindi con costruzione di tabelle di contingenza, diagrammi di dispersione, e misurazione del grado di relazione attraverso il coefficente di covariazione R pearson...


Description

Distribuzione di frequenza con due variabili Quando si fanno gli studi in ambito psicologico abbiamo in relazione più variabili. Si descriverà la relazione tra variabili a seconda della scala di misura delle variabili (come sono le mie variabili? Questo ci guiderà nel tipo di analisi). Quindi prima di tutto devo definire la scala di misura delle mie variabili:  Su scala qualitativa  ricorro a fare le tabelle di contingenza (dentro ci metto il numero di casi, le frequenze e le frequenze percentuali)  Su scala metrica  uso il diagramma di dispersione e posso calcolare un indice statistico chiamato coefficiente di correlazione Tutte queste mi vanno a descrivere la relazione tra variabili, si parlerà ora di analisi bivariata (a due variabili) Può essere:  di coovariazione (al variare di una variabile, mi varia anche l’altra. Ma non lo causa il suo variare)  causale (x causa y) lo scopo dell’analisi bivariata è quello di stabilire l’esistenza di una relazione tra variabili verificando quando la relazione individuata sia statisticamente significativa, ovvero quanto sia dovuta al caso o a reali relazioni presenti nella popolazione e riscontrate anche nel campione

 Variabili non metriche Tabelle di fre frequenza quenza Consentono di raccogliere i dati derivanti dal calcolo di distribuzione 1. Tabelle semplici (1 variabile) 2. Tabelle a doppia entrata (2 variabili) 3. Tabella a entrata multipla (più di 2 variabili)

Tabella a doppia entrata (o di contingenza) I dati sono classificati a due variabili Le frequenze sono calcolate tenendo conto delle combinazioni delle modalità delle variabili Maschi femmine 3 anni 20 20 40 4 anni 30 30 60 5 anni 25 25 50 75 75 150  i numeri in nero  frequenze di cella: sono la distribuzione congiunta ovvero quanti casi che mi rispondono in contemporanea a due livelli delle mie variabili (sono 20 i maschi e di 3 anni)  i numeri blu  frequenze di riga: distribuzione marginale perché si riferiscono soltanto ad una variabile (sono 40 i bambini di 3 anni, non mi dice niente a riguardo dell’altra variabile)  i numeri rossi frequenza di colonna: si riferisce alla frequenza della variabile in colonna  numero verde  numero totale dei casi Può riportare anche le frequenze percentuali (calcolate sul totale dei casi) O anche le frequenze marginali di riga e di colonna maschi femmine f % f % f % 3 anni 20 13. 20 13. 40 26. 3 3 7 4 anni 30 20. 30 20. 60 40. 0 0 0 5 anni 25 16. 25 16. 50 33. 7 7 3 75 50. 75 50. 150 100 0 0 Percentuali condizionate di riga: (esempio 20/40x100) maschi femmine f % f % f % 50. 20 50. 4 100 3 anni 20 0 0 0 4 anni 30 50. 30 50. 6 100 0 0 0

5 anni

25

50. 25 50. 4 100 0 0 0 -entro i 3 anni la ripartizione del sesso in % -entro i 4 anni la ripartizione del sesso in % -entro i 5 anni la ripartizione del sesso in % Percentuali condizionate di colonna: (esempio 20/75 x100) maschi femmine f % f % 3 anni 20 26.7 20 26. 7 4 anni 30 40.0 30 40. 0 5 anni 25 33.3 25 33. 3 75 100 75 100 -entro i maschi la ripartizione in età in % -entro le femmine la ripartizione in età in % Rappresentazione g grafica rafica  Grafico a barre  metto le variabili sull’asse delle x come due blocchi separati e con colore diverso per distinguerle, sull’asse delle y metto le frequenze. Per variabili qualitative. Con i grafici a barre si può notare l’interazione  a seconda del genere la variabile tipologia di disturbo si presenta in modo completamente diverso.

 Variabili metriche La correlazione Come si descrive i dati quando ho due variabili metriche La presenza di correlazione tra le variabili indica una variazione concomitante, ovvero al variare di una varia anche l’altra. Abbiamo una relazione di tipo causale quando una delle variabili causa l’altra. La correlazione indica se c’è una relazione tra variabili. Verrà calcolato poi il coefficiente di correlazione che ci indica la forza della relazione tra le variabili. La relazione misurata tramite questo coefficiente è detta lineare Età=x Peso=y 3 6 6 8 9 9 12 10 14 13 Vado a vedere se: a. Le due variabili sono indipendenti? b. Se c’è relazione, è lineare? (lineare se al variare di una varia proporzionalmente anche l’altra) c. Quanto è forte questa relazione? d. Che direzione ha, è positiva o negativa? La correlazione mette in evidenza la relazione esistente tra due variabili  Stabilire il tipo di relazione  Stabilire il grado di tale relazione  Stabilire la direzione di tale relazione Correlazione è un altro modo di dire relazione lineare  Covarianza  Misura l’associazione tra due variabili, quanto covariano le due variabili misura del grado di associazione tra due variabili. Con la covarianza non possiamo confrontare i valori ottenuti con due coppie di variabili in quanto possono differire per unità di misura.

y y −M ¿ ¿ ¿ (x−M x )¿ ∑¿ Cov=¿    



Valori positivi e negativi Cov=0  la x e la y sono indipendenti Aumenta con il grado di dipendenza tra x e y Limite: misura relativa, dipende dall’unità di misura delle variabili, è teorica, quindi ricorro al coefficiente di correlazione, si svincola dalle unità di misura Coefficiente di correlazione (r) di Bravais-Person  sostituisce l’elemento teorico della covarianza visto che si svincola dalle unità di misura e quindi serve per il calcolo. Fornisce una misura standardizzata della relazione tra le due variabili. Misura la forza della relazione. Il coefficiente r, per le caratteristiche della sua standardizzazione, non risente dell’unità di misura delle due variabili, permettendo il confronto tra variabili misurate in modo diverso e rilevate su campioni diversi. Il coefficiente di correlazione corrisponde alla covarianza ma standardizzata

y y−M ¿ ¿ ¿2 ¿ ¿ 2 (x−M ∑ x) ∑ ¿ √¿ (x−M x )( y−M y ) ∑ r= ¿ - se assume valori prossimi a -1  inversamente proporzionale e fortissima -se assume valori prossimi a +1  direttamente proporzionale e fortissima -se è 0  assenza di relazione Dove il segno mi indica la direzione e il numero la forza studiare la relazione esistente tra due variabili attraverso r significa stabilire: a. L’esistenza di una relazione lineare nel campione verifica l’ipotesi sul valore del coefficiente di correlazione ottenuto per fare assunzione sulla relazione lineare della popolazione b. Il grado di tale relazione  il valore del coefficiente di correlazione indica la direzione della relazione lineare c. La direzione della relazione  in segno del coefficiente di correlazione indica la direzione della relazione lineare Rappresentazione g grafica rafica  diagramma di dispersione  sulla x la variabile indipendente, sulla y quella dipendente. Poi metto tutti i punti nel piano cartesiano. L’insieme dei punti (nube dei punti) se si sviluppa secondo una retta è una relazione lineare. retta che mi rende minima la distanza da tutti i punti, interpola tutti i gruppi. Posso teoricamente calcolare il punto medio, punto che è la media delle mie x e la media delle mie y  per sintetizzare. Tanto più i punti nel diagramma sono in prossimità della retta tanto più la correlazione risulta elevata....


Similar Free PDFs