autoregressivo, modello
Modello statistico per le serie storiche, che mette in relazione il valore presente di una variabile con i suoi valori ritardati per tenere conto della possibile dipendenza statistica tra osservazioni corrispondenti a istanti diversi.
Si dice che una serie storica segue un modello a. di ordine 1, o AR(1), se soddisfa la relazione Yt=a0+ a1 Yt−1+ut, dove gli errori ut descrivono un rumore bianco (white noise), cioè una successione di variabili casuali incorrelate, con media zero e varianza finita costante, mentre a0 e a1 sono due coefficienti di regressione.
Un processo autoregressivo AR(1) si definisce stazionario se può essere rappresentato come combinazione lineare dell’errore corrente e degli errori passati, cioè se esistono coefficienti b, c0, c1, c2, ... per cui
t= b+c0ut+c1ut−1+c2 ut−2+ ... .
Condizione necessaria e sufficiente affinché tali coefficienti esistano è che il coefficiente a1 sia minore di 1, in valore assoluto. In tal caso, per la stazionarietà, Yt ha media e varianza costanti e uguali a E (Yt)=a0/(1−a1) e Var (Yt)=σ2u/(1−a12), mentre l’autocorrelazione, ossia la correlazione Y tra la variabile in tempi diversi, è Corr (Yt, Ys)=a1∣t−s∣. Di conseguenza, se il coefficiente a1 è positivo, nel caso di un processo AR(1) stazionario, la correlazione diminuisce all’aumentare dell’intervallo di tempo tra le due variabili Yt, Ys. Se invece a1 è negativo, la correlazione si riduce in valore assoluto, ma ha segni alterni. Se a1=1, il processo ha varianza infinita e non è stazionario.
Il modello AR(1) utilizza Yt−1 per prevedere Yt, ma ignora in tal modo l’informazione potenzialmente utile proveniente da un passato più remoto. Un modo per incorporare questa informazione è quello di includere ritardi addizionali nel modello AR(1), cioè utilizzare un modello a. di ordine p maggiore di 1. Si chiama quindi modello a. di ordine p, AR(p), il modello che considera la regressione di Yt su p valori ritardati: Yt=a0+a1Yt−1+a2Yt−2+ ... +apYt−p+ut, dove a0, a1,..., ap−1 sono i coefficienti della regressione lineare della variabile aleatoria Y rispetto ai suoi stessi valori ritardati. Il vettore dei p parametri di un modello AR(p) stazionario può essere stimato tramite lo stimatore dei minimi quadrati o il metodo dei momenti.
La teoria economica spesso suggerisce che altre variabili potrebbero aiutare a prevedere la variabile d’interesse. Queste altre variabili, o predittori, possono essere aggiunte a un’autoregressione per ottenere un modello di regressione temporale con predittori multipli. Quando altre variabili e i loro ritardi sono aggiunti a un’autoregressione, il risultato è un modello a. misto. I modelli a. misti, o ADL (Autoregressive Distributed Lag), sono a. perché tra i regressori figurano i valori ritardati della variabile dipendente, e misti perché tra i regressori compaiono anche i valori ritardati di predittori addizionali. In generale, un modello a. misto con p ritardi della variabile dipendente Yt e q ritardi di un predittore addizionale Xt è detto modello ADL(p, q). La scelta dell’ordine p di un’autoregressione è un aspetto critico: l’utilizzo di un ordine troppo piccolo infatti può diminuire l’accuratezza delle previsioni poiché vengono trascurate informazioni valide; aggiungere ritardi, tuttavia, aumenta l’incertezza della stima. La scelta della lunghezza dei ritardi deve bilanciare i benefici dell’utilizzare informazione addizionale e il costo di stimare coefficienti addizionali. Metodi per la scelta dell’ordine p possono essere basati su test di significatività dei parametri associati alle variabili ritardate o a criteri di informazione