Appunti lezioni Statistica (parte 7) Serie storiche e territoriali PDF

Title Appunti lezioni Statistica (parte 7) Serie storiche e territoriali
Author Paolo Alberto Renò
Course Statistica 
Institution Università degli Studi di Bari Aldo Moro
Pages 12
File Size 594 KB
File Type PDF
Total Downloads 116
Total Views 145

Summary

Download Appunti lezioni Statistica (parte 7) Serie storiche e territoriali PDF


Description

ANALISI delle SERIE STORICHE 1) COS’È UNA SERIE STORICA Si definisce serie storica un insieme di valori relativi ad un fenomeno, ordinati in relazione al tempo. Le grandezze osservate sono esprimibili mediante una componente sistematica (o deterministica) e una componente aleatoria (o irregolare). La parte sistematica che fa riferimento al tempo è scomponibile nelle seguenti componenti: tendenziale, di lungo periodo (Tt ); congiunturale, di medio periodo (Ct ); stagionale, se le osservazioni hanno una cadenza inferiore all’anno (St ). In generale una serie storica è così definita: Tempi 1 2 . . t . . s

Valori del fenomeno y1 y2 . .

yt . .

ys

L’analisi delle serie storiche è rivolta ad osservare l’andamento dei valori del fenomeno, al fine di individuare un modello matematico che consenta di formulare previsioni future e permetta di stimare le variabili nei tempi in cui il fenomeno stesso non è stato rilevato. 2) RAPPRESENTAZIONE GRAFICA DELLE SERIE STORICHE

Per facilitare la fase di analisi di una serie storica si fa uso della rappresentazione grafica. Tale rappresentazione consente di mettere in evidenza la struttura e le tendenze del fenomeno oggetto di studio quali ad esempio oscillazioni o perturbazioni. In base alla tipologia di serie storica essa può essere rappresentata tramite diagrammi cartesiani o a colonna, dove sull’asse delle ascisse si riporta la variabile del tempo, mentre sull’asse delle ordinate i valori del fenomeno. 117

35 30 25 20 Serie1 15

Serie2

10 5 0 1

2

3

4

5

6

7

8

9

10

3) PRINCIPALI INDICI DI UNA SERIE STORICA Oltre a Media e Varianza, è possibile tener conto anche di due indici, giacché per le serie storiche esiste un ordine di successione. s −1

Indice di oscillazione Os =

∑ y t +1 − y t

t =1

s−1

, che misura l’intensità delle oscillazioni consecutive

Indice di evoluzione Ev = y s − y1 , che rappresenta la tendenza del fenomeno a crescere o diminuire s −1 4) COMPONENTI DI UNA SERIE STORICA

I valori di una serie storica sono influenzati da molteplici fattori individuabili e non, dunque per facilitare la sua analisi occorre scomporre una serie in alcune componenti, le quali rappresentano l’agire di un gruppo di fattori. Le principali componenti sono: a) Componente di fondo (trend) b) Componente ciclica (ciclo) c) Componente stagionale (stagionalità) d) Componente occasionale (episodica) e) Componente casuale (erratica) a) Il trend è la tendenza di fondo che caratterizza l’evoluzione del fenomeno nel lungo periodo,

esso mostra un andamento crescente, o decrescente o costante con fluttuazioni più o meno regolari. I metodi più utilizzati per determinare il trend sono il metodo dei minimi quadrati e il metodo delle medie mobili.

118

b) I cicli, in riferimento al linguaggio economico, sono dei movimenti caratterizzati da curve

sinusoidali che rappresentano oscillazioni periodiche o non periodiche intorno alla curva del trend, dovute ai cosiddetti “cicli economici” che, in genere, hanno durata che può variare da pochi anni ad alcuni decenni e sono costituiti da alcune fasi: fase di espansione, che a sua volta si distingue in due fasi: fase di ripresa, in cui l'investimento inizia a crescere; fase di prosperità, nella quale investimenti e consumi crescono rapidamente; fase di contrazione, anch'essa si differenzia in due fasi: della recessione, in cui la crescita dell'economia rallenta; della depressione, nella quale la crescita economica ristagna.

c) La stagionalità provoca variazioni che si manifestano negli stessi mesi in anni successivi.

Per evidenziare tale movimento occorre che i dati della serie storica siano stati rilevati per frazioni di anno, come bimestri, trimestri, si parla anche di movimento settimanale quando tali variazioni avvengono negli stessi giorni della settimana

d) La componente occasionale è quella legata a fattori che si manifestano in maniera episodica, ad

esempio bellici, importanti innovazioni tecnologiche, crisi politiche etc.. Se tale movimento si smorza rapidamente e non produce variazioni al trend, quel dato statistico viene escluso e sostituito da un dato "fittizio". e) La componente casuale include in sé non solo effetti di natura erratica, ma anche fattori di scarsa

importanza che sfuggono all’osservazione globale. La caratteristica principale di questa componente è che lascia inalterata la struttura della serie, poiché gli elementi che la formano si compensano tra loro. 119

5) MODELLI DI SERIE STORICHE

La gran parte delle serie storiche è costituita da tutte le componenti precedentemente analizzate. Da questa osservazione si è arrivati a introdurre vari modelli aventi lo scopo di assemblare le componenti in una serie totale. I modelli più comuni sono: a) Modello additivo b) Modello moltiplicativo c) Modelli misti a) Il modello additivo mette in relazione le singole componenti attraverso una sommatoria,

ipotizzando che l’una non influenzi l’entità di un’altra, ma ciò nei casi concreti non sempre accade. yt = Tt + Ct + St + Ot + Et

b) Il modello moltiplicativo esprime in termini assoluti il Trend, mentre considera le altre

componenti come fattori di proporzionalità.

yt = Tt × ct × s t × o t × e t 120

Inoltre il modello moltiplicativo con una semplice trasformazione logaritmica diventa un modello additivo rispetto ai logaritmi delle singole componenti.

log y t = log Tt + log ct + log st + log ot + log et c) I modelli misti sono caratterizzati da componenti che si legano tra loro additivamente e

moltiplicativamente, esistono vari modelli misti utilizzabili a seconda del fenomeno oggetto di studio. yt = ( Tt + C t + Ot ) × st × et

6) SCOMPOSIZIONE DELLE SERIE STORICHE

Operazione preliminare dell’analisi di una serie storica è la sua scomposizione nelle varie componenti, al fine di rimuovere, se necessario, la componente occasionale. La suddetta scomposizione si attua attraverso il metodo dei residui, ovvero si individua una componente e la si sottrae dalla serie originaria nel caso di modello additivo, ottenendo cosi la serie depurata, mentre nel caso di modello moltiplicativo la serie depurata si ottiene grazie al rapporto tra la componente e la serie originaria. Analogamente si procede alla separazione delle altre componenti. 7) SERIE STORICHE STAZIONARIE e SERIE STORICHE EVOLUTIVE

Un’ulteriore classificazione sulle serie storiche può essere effettuata in base al loro comportamento in relazione a differenti periodi di tempo. In alcuni casi accade che grandezze statistiche, come ad esempio la media o la varianza, non 121

subiscano variazioni in intervalli temporali precedenti o successivi a quello in cui è studiata la serie storica. Questa caratteristica prende il nome di invarianza temporale e definisce la cosiddetta stazionarietà di una serie storica. In contrapposizione a serie storiche con questo comportamento, esistono le serie storiche evolutive, individuabili da alcune precise caratteristiche come ad esempio, trend crescenti o decrescenti, componenti cicliche o stagionali accentuate ed immancabili oscillazioni casuali. Infine è opportuno precisare che è possibile attraverso passaggi di depurazione trasformare una serie evolutiva in stazionaria. 8) DETRENDIZZAZIONE

Per trasformare una serie evolutiva in stazionaria il primo passo da compiere è quello di eliminare il trend. Quest’ultima operazione prende il nome di detrendizzazione e consiste anzitutto nell’individuare la tipologia di trend, per poi toglierlo dalla serie originaria, in modo da ricavare una nuova serie residua che oscillerà intorno ad un valore medio. Per individuare il tipo di trend di una serie storica, occorre rappresentarla con una funzione matematica semplice. 9) PRINCIPALI TIPI DI TREND Tt = a + bt

¾ La retta

¾ La funzione esponenziale

T t = αβ t

¾ La parabola di secondo grado

Tt = a + bt + ct 2

¾ L’ esponenziale di parabola di secondo grado

¾ La funzione esponenziale generalizzata ¾ L’ iperbole

Tt =

Tt = αβ t γ t

2

Tt = a + bc t

1 a + bt

122

¾ La funzione di Gompertz

¾ La logistica

Tt =

Tt = αβ c

t

1 a + bc t

10) DESTAGIONALIZZAZIONE

Destagionalizzare una serie storica significa rimuovere la parte periodica. La disponibilità dei dati destagionalizzati consente di comparare dati di tempi adiacenti, senza che il confronto sia alterato dalla presenza di oscillazioni di carattere stagionale. Normalmente, per stimare la componente stagionale si utilizza il metodo delle medie mobili. Nel caso di serie storiche con dati mensili si dovrebbe operare con medie mobili in 12 termini, cosi facendo però non sarebbero centrate, ecco perché occorre operare, per evitare questo inconveniente, con 13 termini. Attraverso questa modifica si otterrebbero i valori interi dei cinque mesi prima e dopo e per metà i valori dei sei mesi prima e dopo, cosi facendo si garantisce ad ogni valore di rientrare nella media mobile con ugual peso. 1 1 y 't − 6 + y 't − 5 + y 't − 4 + ........ + y 't + ........ + y 't + 4 + y't +5 + y 't + 6 2 yt * = 2 , 12

per t = 7, 8, …, s−6

1 1 y ' t − 2 +y ' t − 1 + y ' t + y ' t + 1 + y ' t + 2 2 , per t = 3, 4, …, s−2 yt* = 2 4

(per dati mensili)

(per dati trimestrali)

In alternativa, il metodo adottato per la destagionalizzazione dipende dal modello di composizione: nel caso di un modello additivo è sufficiente sottrarre dalla serie originale la componente stagionale, mentre in quello moltiplicativo si divide. Δ 12 y't = y't − y' t −12 , t −12

Rt =

y' t , y ' t−12

per t = 13, 14, …, s

per t = 13, 14, ….., s

“per Modello Additivo” “per Modello Moltiplicativo”

11) INDIVIDUAZIONE DELLA COMPONENTE CICLICA

Si prenda in considerazione una serie a dati annuali: la serie detrendizzata yt * = yt − Tt contiene sia la componente ciclica che la componente erratica. Premesso ciò, per ottenere la componente ciclica occorrerà depurare la serie detrendizzata dalla componente erratica operando con le medie mobili 123

di 3 o 5 termini: yt * =

y 't + y 't + y 't −1 +1 3

yt * =

oppure

y 't + y't + y't + y' t + y't −2 −1 +1 +2 5

Si noti che nel caso di dati mensili (o trimestrali), la precedente destagionalizzazione ha già depurato la serie dalla componente erratica. 12) INDIVIDUAZIONE DELLA COMPONENTE STAGIONALE

Per individuare la componente stagionale da una serie storica, occorre sottrarre a quest’ultima la parte della componente erratica. Questa operazione può avvenire attraverso differenti metodi, ad esempio con l’utilizzo di funzioni trigonometriche, oppure con il metodo delle medie mensili, che consiste nel calcolare le medie aritmetiche della serie residuale, corrispondenti ai molteplici mesi presi in considerazione: in questo modo le medie dei dodici mesi esprimeranno la componente stagionale. 13) CORRELOGRAMMA (Analisi di una serie stazionaria)

Ottenuta una serie storica stazionaria grazie all’eliminazione del trend e delle altre componenti, essa può presentare ancora altri elementi fonti di studi ed analisi. I principali metodi di analisi di una serie stazionaria sono il correlogramma, lo spettrogramma e il periodogramma. Il correlogramma è la rappresentazione grafica dei coefficienti di autocorrelazione in funzione dei lag h, ovvero: s −h

∑ (y t − y )(y t + h − y )

ch =

t =1

,

s−h

h = 0, 1, 2, …., q < s.

“Autocovarianza di slittamento (Lag h)”

s− h

c rh = h = c0

∑ (yt − y)(yt + h − y)

t =1

(s − h )∑ (y t − y ) s

2

.

“Coefficiente di autocorrelazionedi lag h”

s

t =1

I termini di queste due espressioni corrispondono alle formule della covarianza e del coefficiente di correlazione slittati di h unità di tempo, pertanto essi consentono di misurare la concordanza e la discordanza tra i valori delle serie storica nelle h unità di tempo. Il correlogramma è utilizzato per accertare se la serie storica dei residui presenta caratteri regolari oppure se la serie è casuale, come ad esempio nello studio del lancio di un dado. In quest’ultimo 124

caso i valori dovrebbero essere tra loro non correlati, talché i valori degli rh dovrebbero oscillare intorno allo zero.

ANALISI delle SERIE TERRITORIALI 1) COS’È UNA SERIE TERRITORIALE

La serie territoriale è la sequenza dei valori assunti da una variabile nello stesso momento in diversi aggregati territoriali, esse sono espresse in tabelle statistiche, le cui modalità sono composte da unità territoriali con estensioni fissate in base a criteri amministrativi o convenzionali. Al fine pratico inoltre le stesse unità territoriali aventi limitatezza dell’estensione possono considerarsi di natura puntuale, ossia di estensione nulla. Le principali tipologie di serie territoriali sono: a) Serie statistiche di frequenza, che indicano il numero dei casi per ogni unità territoriale b) Serie statistiche di intensità, che indicano l’intensità complessiva di un fenomeno c) Serie che indicano l’intensità media di un fenomeno, dove la media è calcolata rispetto alla popolazione o rispetto alla superficie territoriale. d) Serie territoriali doppie, che esprimono l’analisi della frequenza o dell’intensità di un fenomeno, in relazione alle unità di origine ed a quelle di arrivo. e) Serie territoriali miste, con elemento fisso è la circoscrizione, che è un elemento di classificazione, mentre l’altro elemento è di una qualsiasi altra natura. L’analisi delle serie territoriali può essere svolta seguendo diverse procedure: a) Rappresentazione grafica b) Esame delle caratteristiche c) Ricerca di opportuni indici sintetici 125

2) ANALISI CENTROGRAFICA

L’analisi centrografica permette di ricavare centri medi territoriali a determinate condizioni. Alla base di questo metodo c’è l’individuazione e la sostituzione della circoscrizione territoriale con le coordinate geografiche, longitudine X calcolata a partire da un particolare meridiano, mentre latitudine Y a partire dall’Equatore.

Nel caso in cui le unità territoriali non siano di tipo puntuale, per ciascuna circoscrizione si richiede l’individuazione del baricentro del fenomeno, del baricentro demografico oppure del baricentro territoriale a seconda dei casi.

Per comodità comunque si sceglie durante gli studi, come centro rappresentativo della circoscrizione, il capoluogo, ipotizzando che questo non si discosti dal baricentro del fenomeno. Prendendo come esempio le province italiane nell’annuario di statistiche del 1974, indichiamo: per la i. ma circoscrizione, con xi e con yi , rispettivamente la longitudine e la latitudine del centro e s

con ni la frequenza del carattere per l’intero territorio ∑ ni = N . i =1

Inoltre occorre misurare la distanza tra due punti a prescindere dalla sfericità terrestre, per fare ciò si applica la formula pitagorica sul piano: d ij =

(x

− x j ) + ( yi − y j ) 2

i

2

,

dove ( xi , yi )e ( x j , y j ) sono le coordinate dei centri delle circoscrizioni i. esima e j.esima. I centri territoriali più utilizzati sono il centro di gravità ed il centro mediano, il primo deriva dalla condizione che la somma dei quadrati delle sue distanze da tutti gli altri punti è un minimo. Inoltre indicando con x e y le coordinate del centro di gravità e con di la sua distanza dal centro della circoscrizione si ottiene la condizione: s

∑ i= 1

s

(

)

s

(

)

d i 2 ni = ∑ x i − x n j + ∑ yi − y n j = minimo 2

i =1

2

i= 1

Il centro mediano invece è quel punto tale che sia un minimo la somma ponderata dei valori assoluti delle sue distanze da tutti gli altri punti. s

∑ i =1

s

d ni = ∑

(x − x ) + (y 2

i

)

2

i

− y n i = minimo

i =1

3) DISPERSIONE TERRITORIALE

Nel momento in cui si decide di iniziare un’analisi territoriale, si stabiliscono alcune caratteristiche e proprietà del fenomeno collettivo oggetto di studio, il punto del territorio che risponde meglio 126

alle richieste dell’analisi è detto centro territoriale. Questa assunzione però deve tener conto anche degli altri punti territoriali intorno a tale centro, proprio per questo è consigliabile studiare il grado attraverso un indice il grado di dispersione. L’indice più adatto a tale scopo è la dispersione territoriale data dalla media quadratica delle distanze tra tutti i punti territoriali ed il centro territoriale, ed è espresso come segue: 2 2 ∑ (x i − x ) n i + ∑ (y i − y ) n i

σ( X, Y ) =

s

s

i =1

i =1

2

= σ X + σY

N

2

(1)

4) DECOMPOSIZIONE DELLA DISPERSIONE TERRITORIALE

Si aggreghino N unità statistiche di una serie territoriale in r sottogruppi di numerosità NK, di un qualsiasi carattere, successivamente indichiamo le frequenze delle unità statistiche con nki e ni. Ora siamo in grado di calcolare le coordinate del centro di gravità del fenomeno in ciascun sottogruppo: s

∑ x i n ki

s

∑ yi n ki

i =1

xk =

N

, k

y k = i =1

,

Nk

k = 1, 2, …, r

e quelle del centro di gravità del fenomeno nell’intero collettivo: s

s



∑ y in i

xi ni

x = i=1

N

y=

,

i =1

N

Consideriamo ora la devianza territoriale s

(

) (

)

2 2 Dev(X, Y) = N σX 2 + N σ Y 2 = ∑ ⎡ x i − x + yi − y ⎤ n i ⎢ ⎥⎦ i=1 ⎣

Applicandone la formula di scomposizione della devianza si ottiene: Dev(X, Y ) =

∑ ∑ ⎡⎢⎣(xi − x k ) + (yi − y k ) k =1 i =1 r

s

2

2

r

(

⎡ x −x ⎤n + ⎢ k ⎥⎦ ki k∑ =1 ⎣

)2 + (yk − y)2 ⎤⎦⎥ N k

dove la prima sommatoria indica la somma delle dispersioni territoriali interne nei sottogruppi, mentre la seconda parte indica la somma delle dispersioni territoriali dei centri di gravità di ciascun sottogruppo rispetto al centro di gravità del collettivo. Questo dimostra se le serie territoriale relative a ciascun sottogruppo siano omogenee per quanto riguarda il centro di gravità e la loro dispersione territoriale. 127

5) DISTANZA TRA CIRCOSCRIZIONI DI PARTENZA E CIRCOSCRIZIONI DI ARRIVO

Supponiamo di avere una doppia serie territoriale che si presenta sotto forma di tabella a doppia entrata, conoscendo la distanza tra zone corrispondenti delle due serie storiche è facile calcolare la media relativa ai movimenti registrati, indicando con (xh, yh ) e (x’h, y’h) le coordinate delle due zone delle corrispondenti serie territoriali. Utilizzando la formula euclidea è possibile esprimere la distanza territoriale tra le zone, la distanza quadratica media al qua...


Similar Free PDFs