frequenza
frequenza numero di volte in cui la modalità di un carattere compare in una distribuzione statistica. Si dice distribuzione di frequenza l’insieme delle coppie ordinate il cui primo elemento corrisponde alla modalità e il secondo elemento alla frequenza associata a tale modalità. Le frequenze possono essere assolute (ni), se si considera quante volte la modalità compare effettivamente nel collettivo osservato, oppure relative (ƒi) se sono considerati i rapporti tra le frequenze assolute e il numero totale di unità statistiche che fanno parte del collettivo osservato (n). Una distribuzione di frequenze assolute si trasforma in distribuzione di frequenze relative tramite il rapporto:
con
dove i rappresenta una singola generica modalità e k il numero delle diverse modalità. Se il valore è rapportato a cento, allora si avrà la frequenza relativa percentuale; questa permette non solo di valutare il peso relativo delle singole modalità, ma soprattutto di confrontare rilevazioni di uno stesso fenomeno effettuate in tempi o in luoghi diversi (confronti temporali e spaziali). La somma delle frequenze assolute in una distribuzione statistica è uguale al totale delle unità che costituiscono il collettivo considerato, mentre la somma delle frequenze relative è uguale a uno.
Quando in una distribuzione di frequenze in cui le modalità di un carattere sono ordinate ci si pone il problema di quante siano le unità statistiche con modalità che non superano un valore prefissato, sono utilizzate le frequenze cumulate, calcolate in base alla somma delle frequenze delle modalità minori o uguali alla modalità xi considerata. La frequenza cumulata F(xi), relativa alla modalità xi è pari a
In caso di seriazione statistica continua, in cui le unità del collettivo sono suddivise in intervalli (dette classi), la frequenza assoluta di una classe è data dal numero delle unità che appartengono a una classe. In tali casi, per poter meglio valutare il peso relativo delle diverse modalità è necessario ricorrere alle densità di frequenza, costituite per ciascuna classe dal rapporto fra la frequenza della classe e la sua ampiezza, intesa come differenza fra l’estremo superiore e quello inferiore. Ciò è necessario perché la maggiore frequenza di una classe rispetto a un’altra potrebbe essere dovuta semplicemente alla sua maggiore ampiezza.
In una distribuzione di frequenze assolute, queste assumono generalmente valori diversi; se i valori sono tutti uguali, il collettivo si dice equidistribuito rispetto al carattere. Se, accanto a una generica distribuzione, si è interessati a calcolare la distribuzione che si avrebbe in caso di equidistribuzione, si ricorre alla frequenza media, dividendo il numero delle unità del collettivo per il numero delle modalità del carattere.
Le distribuzioni di frequenza possono essere rappresentate graficamente in diversi modi a seconda del fenomeno descritto (con un → diagramma circolare, oppure con un → diagramma a barre, oppure con un → istogramma).
In caso di distribuzione statistica congiunta di due caratteri X e Y, rappresentata da una tabella a doppia entrata, dalla tabella di frequenze assolute si possono derivare tre diverse tabelle di frequenze relative; indicando con A(i, j) il generico elemento della tabella corrispondente alla riga i e alla colonna j e con s una qualsiasi somma, per riga o per colonna, si avrà:
• frequenze relative per riga A(i, j)/s(i);
• frequenze relative per colonna A(i, j)/s(j);
• frequenze relative globali A(i, j)/n, dove n rappresenta il numero totale delle unità considerate.
In situazioni di questo tipo è di primario interesse analizzare la dipendenza o meno tra i due caratteri, e si confrontano perciò, all’interno della tabella a doppia entrata, le frequenze osservate e le frequenze teoriche o attese che si avrebbero nel caso di assoluta indipendenza tra i caratteri (→ contingenza, → chi-quadrato).