Title | Dispensa n.5 Regressione - Copy |
---|---|
Course | statistica descrittiva |
Institution | Università LUM Jean Monnet |
Pages | 14 |
File Size | 301.7 KB |
File Type | |
Total Downloads | 94 |
Total Views | 124 |
Appunti presi a lezione, utili per la preparazione all'esame...
UNIVERSITA’
LUM JEAN MONNET
FACOLTA’ DI ECONOMIA
APPUNTI DI STATISTICA
DOCENTE
PROF. MARIATERESA CUOCCIO
Dispensa n.5 Premessa:la presente dispensa non sostituisce il libro di testo ma lo integra.
REGRESSIONE Per lo studio della dipendenza di un carattere Y ,……, dal carattere X con h modalità introduciamo le h DISTRIBUZIONI CONDIZIONATE ( ) date da: (
)
dove le
{
sono le frequenze marginali della X
Analogamente
considerare k le DISTRIBUZIONI CONDIZIONATE ( ) di un carattere X dal carattere Y con k modalità ,…… , date da: ( dove le
)
possiamo
{ sono le frequenze marginali della Y 5.1
Esempio: consideriamo i dati di pag. 3.5 Y
Frequenze marginali
0
1
2
3
0,4
0
0
0,4
4
0,2
0,1
0,2
0,5
5
0,1
0
0
0,1
0,7
0,1
0,2
1
X
Frequenze marginali
Con indice di correlazione lineare ( )=0,29. Avremo che: (
) {
(
) {
(
) {
{
{
{
5.2
analogamente (
( (
) {
{
) {
{
{
) {
5.3
Si definisce FUNZIONE DI REGRESSIONE la funzionelache ad delle ogni distribuzioni modalità del condizionate carattere associa media (
).
Nel caso dell’esempio proposto: (
(
(
)
)
)
0 0
0
5.4
RETTA DI REGRESSIONE (detta anche RETTA DEI MINIMI QUADRATI o RETTA INTERPOLANTE)
) per Dati ( punti sperimentali risultati di osservazioni, si consideri la retta generica di equazione
che approssimi al meglio tali punti
5.5
Sia P( ) un punto di tale retta e pertanto avrà coordinate P( ). Sia d la distanza tra ciascun punto A ed il suo corrispondente B sulla retta quindi si avrà: (
)
Poiché d indica una approssimazione non è importante il segno di tale quantità ma la sua entità, pertanto considereremo tali quantità elevate al quadrato. Sia L la somma di tutte le distanze così ottenute: ∑[
(
)]
5.6
Dicesi retta di regressione o retta dei minimi quadrati la retta che minimizza la quantità L ovvero la retta di equazione:
dove
() ( )
() e ()
I coefficienti
sono determinati attraverso il
METODO DEI MINIMI QUADRATI.
Per ottenere i valori delle quantità e sopra indicati è necessario minimizzare la quantità sopra citata ∑[
(
)] 5.7
A tal fine che deriviamo rispetto ad e imponiamo tali derivate siano nulle. (
∑[
(
∑[
{
)]
()
)]
()
Analizziamo la (1) ∑
∑
[
(
(
) ∑
∑
)]
∑
(ricordando la definizione di media) () ( ) dividendo per ed esplicitando rispetto ad si ottiene ()
()
5.8
e
Analizziamo la (2)
∑
∑ [ (
(
)
)]
∑ ∑ – ∑ (ricordando la definizione di media congiunta) ( ) () ( ) dividendo per e sostituendo il valore precedentemente ricavato si ottiene: ( )– [ ()–
( )– ( ) ( )
( )] ( ) ()
di
( )
( )
(ricordando la definizione di covarianza e raccogliendo la )
5.9
( ) ( )
[()
( )
()
( )]
()
C.V.D.
Osservazioni: si noti che il sistema delle due derivate risolto ammette quale soluzione il punto (a,b) che sarà necessariamente di minimo in quanto punto estremante di una funzione quadratica e quindi limitata inferiormente.
5.10
Applicando considerato avremo:
quanto esposto nella funzione di
() ∑
= 0,5
() ∑
= 3,7
( ) ∑ ( ) () ( )
∑
=2
( ) ( ) ( ) = 0,15 ( ) – ( ) = 0,41 0,29
5.11
all’esempio regressione
Quindi ( )
()
()
()
0,5 –
Avremo quindi la retta di regressione:
5.12
L’INDICE DI DETERMINAZIONE:
con
( ) [ ]
Se
avremo caratteri indipendenti
Se retta
avremo massima efficienza della
Nell’esempio considerato ( ) E quindi possiamo concludere che abbiamo una retta scarsamente efficace. 5.13...