mediana
Valore (non necessariamente unico) che, dato un insieme di n numeri {x1,...,xn}, divide le osservazioni in due gruppi di uguale numerosità: il gruppo di valori minori della m. e il gruppo di valori maggiori della mediana. Essenziale nel calcolo della m. ζ è quindi l’ordinamento degli n numeri in modo crescente (o decrescente).
La m. esiste sempre, ma può non essere unica. Consideriamo separatamente il caso di n dispari e di n pari. Se n è dispari, cioè n=2p+1 per qualche intero p, la m. è unica ed è uguale al (p+1)-esimo elemento dell’insieme ottenuto ordinando le xi in modo crescente. Per es., nell’insieme {2,4,6,7,10}, composto di n=5 elementi, la m. è unica ed è uguale al terzo elemento dell’insieme ordinato, ossia ζ=6. Se invece n è pari, cioè n=2p per qualche intero p, la m. non è unica ma è un qualsiasi numero scelto all’interno dell’intervallo compreso tra il p-esimo e il (p+1)-esimo elemento dell’insieme ottenuto ordinando le xi in modo crescente. Per es., la m. dell’insieme di valori {1,4,5,7,8,9} è un numero all’interno dell’intervallo (5,7). Una possibile scelta è la semisomma (5+7)/2=6.
Data una variabile aleatoria X con distribuzione di probabilità P (➔ distribuzione di probabilità), la m. di X è definita come il valore ζ tale che P(X≤ζ)≥1/2 e P(X≥ζ)≥1/2. Tale valore esiste sempre ed è unico se X è una variabile aleatoria continua con funzione di ripartizione strettamente crescente. In questo caso, infatti, la funzione di ripartizione F(x)=P(X≤x) è invertibile e il punto ζ=F−1(1/2) per definizione soddisfa la relazione F(ζ)=1/2. Se invece X è una variabile aleatoria discreta, allora la sua funzione di ripartizione è a scalini e quindi non è invertibile. In questo caso, la m. non è unica ma corrisponde a qualunque punto di un intervallo chiuso. Si consideri per es. la distribuzione discreta in cui X=0 con probabilità 1/4, X=1 con probabilità 1/4, X=2 con probabilità 1/2. In questo caso F(x)=1/2 per ogni x nell’intervallo chiuso [1,2] e la m. è un qualunque numero all’interno di tale intervallo. Per poter ottenere un valore unico, si definisce spesso la m. come funzione inversa generalizzata F− calcolata in u=1/2, dove F−(u)=inf{x:u≤F(x)}. Secondo tale convenzione, la m. dell’esempio precedente è l’estremo inferiore dell’intervallo che soddisfa la definizione di m.: ζ=inf{x:1/2≤F(x)}=1. La m. è un caso particolare di quantile (➔), essendo uguale al quantile di ordine α=1/2. Un’utile caratterizzazione della m. di una distribuzione di probabilità è il fatto che essa minimizza la deviazione media assoluta.
La m. di un campione casuale (➔ campione statistico) da una popolazione è detta m. campionaria e, sotto opportune condizioni di regolarità, è una stima consistente (➔ consistenza) e asintoticamente normale (➔ asintotica, distribuzione) della m. della popolazione. La principale condizione di regolarità è il fatto che la densità di probabilità della popolazione sia strettamente positiva. Se questa condizione è soddisfatta, la varianza asintotica della m. campionaria è inversamente proporzionale al valore della densità calcolata nella m. della popolazione.
La m. campionaria può anche essere usata per stimare la media di una distribuzione simmetrica, poiché in questo caso la media e la m. coincidono. Un vantaggio della m. rispetto alla media è la sua minore sensibilità alla presenza di valori anomali all’interno del campione (➔ outlier): la sostituzione di una delle osservazioni con un’altra che giace nelle code della distribuzione non modifica il valore della m. campionaria a patto che entrambe le osservazioni giacciano sullo stesso ‘lato’ rispetto alla mediana. Un altro vantaggio della m. è la sua maggiore precisione asintotica quando i dati hanno code pesanti.