robustezza statistica
Proprietà della statistica. Una statistica si dice robusta se produce risultati inferenziali (➔ inferenza statistica) che sono relativamente insensibili a modifiche nelle assunzioni del modello statistico (➔ modello statistico). La ricerca di statistiche robuste in ambito parametrico è motivata dal fatto che generalmente un modello parametrico costituisce soltanto una plausibile approssimazione della distribuzione a livello di popolazione (➔ distribuzione di probabilità).
Uno stimatore (➔) ^θ è robusto per θ se piccoli cambiamenti nella distribuzione della popolazione provocano lievi variazioni in quella campionaria di ^θ (➔ distribuzione campionaria). Intuitivamente, tale proprietà implica la continuità dello stimatore: la distribuzione campionaria di uno stimatore non robusto presenta ‘salti’ in corrispondenza di variazioni anche piccole nella distribuzione della popolazione. ● La r. qualitativa fornisce soltanto uno strumento per distinguere tra stimatori robusti e non robusti, ma non consente di misurare il grado di non robustezza. Per superare questo limite, si può usare il concetto di r. quantitativa. Questa si basa sul calcolo di una particolare funzione, chiamata funzione di influenza, che dipende dalla scelta dello stimatore, dal parametro da stimare e dalla distribuzione delle osservazioni. In particolare, la funzione di influenza può essere ottenuta dal seguente procedimento: dato il valore ^θn dello stimatore per un campione di n osservazioni, si immagini di poter ottenere una nuova stima ^θn+1 (➔ stima) di θ aggiungendo una nuova osservazione al campione. Sotto condizioni abbastanza generali, la differenza normalizzata n(^θn+1−^θn) tra la nuova stima e quella precedente è un’approssimazione della funzione di influenza, tanto più precisa quanto più n è grande. Uno stimatore è quantitativamente robusto se l’aumento di una sola osservazione determina un cambiamento nella stima molto piccolo e inversamente proporzionale a 1/n, cosicché la funzione di influenza è limitata. Esempi di stimatori che hanno una funzione di influenza illimitata, e che sono perciò non robusti secondo questa definizione, sono la media campionaria e lo stimatore dei MQO (➔ minimi quadrati, metodo dei). ● Il break-down point è una misura di r. basata sul numero massimo di osservazioni ‘sbagliate’ (➔ outlier) che lo stimatore è in grado di tollerare prima di cessare di essere informativo circa il parametro di interesse. La media campionaria n ha tale misura uguale a 1/n perché è sufficiente sostituire una sola osservazione in un campione (➔ campione statistico) di ampiezza n per ottenere un valore della media campionaria arbitrariamente lontano da n. La mediana (➔) ha invece il break-down point approssimativamente uguale a 1/2, ed esattamente uguale a 1/2 nel caso di un campione di numerosità arbitrariamente elevata.