confidenza
confidenza termine usato in statistica come sinonimo di «fiducia». Indica la probabilità (e quindi il grado di fiducia) che la stima di un parametro sulla base di un campione (per esempio, una media o una percentuale) sia “vicina” al parametro effettivo della popolazione. L’intervallo di confidenza (o di fiducia) è l’intervallo di valori all’interno del quale si può ritenere che, “quasi sicuramente”, cioè con un alto livello di probabilità, ricada il valore incognito del parametro di una popolazione. Più precisamente, fissato un valore di probabilità 1 − α (con 0 < α < 1), detto livello o fascia di confidenza (per esempio 1 − α = 95%), l’intervallo di confidenza è l’intervallo [θ1, θ2] all’interno del quale si trova, con probabilità 1 − α, il valore del parametro θ da stimare: p(θ1, ≤ θ ≤ θ2) = 1 − α. Il numero α è detto livello di significatività ed esprime la probabilità di compiere un errore affermando che il valore del parametro da stimare appartiene all’intervallo di confidenza. Se per esempio si considera un campione X1, ..., Xn di media X̄ estratto da una popolazione con distribuzione normale e deviazione standard nota σ e si fissa un livello di confidenza del 95%, dalla tavola della funzione Φ*(x) = p(0 ≤ z ≤ x) relativa alla distribuzione normale, si ricava che il valore cui corrisponde un valore di probabilità 0,475 (va considerato questo valore, cioè la metà di 95%, dato che la tavola fornisce i valori di metà area, da 0 in poi) è 1,96. Poiché lo scarto quadratico medio del campione è
allora c’è una probabilità pari al 95% che il valore effettivo μ della media della popolazione appartenga all’intervallo
È questo l’intervallo di confidenza al 95% per la media della popolazione, nota la sua varianza σ2.