distribuzione empirica
D. che assegna probabilità 1/n a ciascuna osservazione in un campione di n osservazioni {x1,...xn}, estratto da una popolazione rappresentata da una d. di probabilità F (continua o discreta). La funzione di ripartizione e. è Fˆ(x)={numero di xj≤x}h, cioè la frequenza relativa delle osservazioni inferiori o uguali a x. La media della funzione di ripartizione e. coincide con la media campionaria X‾=Σni=1Xi/n, e la varianza della funzione di ripartizione e. coincide con la varianza campionaria. È importante sottolineare la duplice natura di questa funzione: essa è la funzione di ripartizione di una distribuzione discreta condizionatamente a una particolare realizzazione campionaria, ma per ciascuna realizzazione del campione si ha una diversa d. empirica. Quindi, la funzione di ripartizione e. è una funzione aleatoria, la cui distribuzione campionaria (➔) deriva dalla casualità del campione. Le caratteristiche della funzione di ripartizione e. e le sue relazioni con la funzione di ripartizione della popolazione costituiscono un argomento di notevole importanza in statistica. Il risultato fondamentale è noto come teorema di Glivenko-Cantelli, pubblicato nel 1930, secondo il quale la distanza tra la funzione di ripartizione e. e la funzione di ripartizione della popolazione F tende a diminuire, progressivamente, con l’aumento della dimensione campionaria: in formule, limn→0supx∣Fˆ(x)−F(x)∣=0. Una conseguenza immediata di questo risultato è che la funzione di d. e. può essere usata per ottenere una stima consistente della funzione di ripartizione.