DIAGRAMMA (dal gr. διάγραμμα "disegno, figura"; fr. diagramme; sp. diagrama; ted. Diagram; ingl. graph, chart)
Fra i mezzi più efficaci d'esposizione e d'indagine di cui può spesso valersi lo studioso, e che trovano più frequente applicazione nella statistica sono da annoverare i diagrammi: figure atte a rappresentare, con la grandezza di alcuni loro elementi, le modalità quantitative di certi fenomeni, in corrispondenza alle modalità qualitative o quantitative di altri fenomeni. Si possono ideare diagrammi di svariatissime forme, ma il principio che presiede alla loro costruzione è sempre quello stesso che serve di fondamento alla geometria analitica e che consiste genericamente nello stabilire, attraverso la teoria della misura, una corrispondenza tra enti numerici (misure delle modalità dei fenomeni quantitativi) ed enti geometrici (segmenti, superficie, solidi); rispettivamente si hanno diagrammi lineari, superficiali, solidi. Nei diagrammi propriamente detti, cioè in quelli disegnati su un piano, non si possono generalmente mettere in relazione più di due fenomeni quantitativi, e in quelli tracciati nello spazio (stereogrammi) non più di tre. Tuttavia, sì negli uni che negli altri, si potranno, con opportuni artifici, fare intervenire le rappresentazioni, oltre che dei quantitativi, anche di uno o diversi fenomeni qualitativi. Qualora poi le modalità d'un fenomeno qualitativo abbiano un ordine naturale di successione e sia possibile stabilire una corrispondenza tra le modalità stesse e numeri convenienti, il fenomeno potrà essere riguardato come quantitativo e gioverà, di regola, rappresentarlo geometricamente come tale.
I diagrammi e gli stereogrammi possono, anzitutto, distinguersi in semplici o multipli, secondo che essi valgano a rappresentare uno solo o simultaneamente più fenomeni quantitativi, come funzioni d'uno stesso insieme di fenomeni (quantitativi, o qualitativi, o promiscui). E precisamente, si potranno costruire diagrammi semplici per rappresentare: A) un fenomeno quantitativo in funzione di uno qualitativo; A1) un fenomeno quantitativo in funzione di uno quantitativo; B) un fenomeno quantitativo in funzione di due qualitativi; B1) un fenomeno quantitativo in funzione di uno qualitativo e di uno quantitativo; B2) un fenomeno quantitativo in funzione di due quantitativi; C) un fenomeno quantitativo in funzione di tre o più altri. Occorrendo, s'indicheranno i corrispondenti diagrammi multipli mediante le stesse lettere accentate.
A) Si figurano su un piano le modalità quantitative del fenomeno funzione mediante altrettante figure geometriche aventi o una dimensione lineare o la superficie espressa dalla misura della corrispondente modalità. Così si potrà assumere una serie di segmenti rettilinei, oppure di rettangoli o triangoli di eguale base, di rettangoli o triangoli di uguale altezza, di quadrati, di cerchi, di settori d'uno stesso cerchio, ecc., in modo che, rispettivamente le lunghezze, le altezze, le basi, i lati oppure le superficie, i raggi oppure le superficie, le ampiezze, ecc., siano proporzionali a quelle misure. Nel caso di segmenti, di rettangoli o triangoli di ugual base o d'uguale altezza, saranno senz'altro evidenti le dimensioni da paragonare: se, invece, si assumono dei quadrati, dei cerchi, e in generale delle figure simili converrà, a scanso di dubbio, dichiarare esplicitamente se si debbono paragonare le dimensioni lineari omologhe (lati, raggi) oppure le superficie (poiché queste non sono proporzionali a quelle dimensioni, ma ai loro quadrati). Per completare la rappresentazione si potrà scrivere, accanto a ciascuna figura, la denominazione della corrispondente modalità del fenomeno qualitativo (diremo, brevemente, mutabile) di cui il quantitativo è stato considerato come funzione. Rientrano in questa categoria le rappresentazioni, molto usate a scopo divulgativo, costituite da una serie di figure simili ricordanti con la loro forma l'oggetto a cui si riferiscono; e vi rientrano anche quei diagrammi in cui una figura, generalmente un quadrato, è divisa (e suddivisa) in parti proporzionali ai valori della funzione per le varie modalità della mutabile.
A′) Le modalità quantitative delle diverse funzioni si rappresentano con altrettante serie di figure geometriche come ad A), una serie per ciascuna funzione. La designazione delle modalità della mutabile è fatta apponendone la denominazione accanto a ciascuna figura o mediante segni convenzionali. Per facilitare il confronto delle diverse funzioni fra di loro si accostano talora, o si rendono adiacenti lungo una dimensione uguale, tutte le figure corrispondenti a una stessa modalità della variabile; talaltra si attribuisce a ciascuna serie di figure un diverso tratteggio o colorazione. P. es. il diagramma multiplo corrispondente alla seguente tabella, che riassume alcuni risultati del censimento industriale e commerciale 15 ottobre 1927, è dato dalla fig. 1.
A1) Di gran lunga più utili degli A) e A′) sono i diagrammi rappresentativi del comportamento d'un fenomeno quantitativo in funzione d'un altro quantitativo (funzione, variabile). Se in un piano si conducono per un punto (origine) due assi cartesiani (v. coordinate), e si fissa in ciascuno il senso positivo e la scala di misura, ogni coppia di valori corrispondenti della variabile e della funzione sarà rappresentata dal punto di quel piano avente come ascissa il valore della variabile e come ordinata quello della funzione. Tutti i punti cosi ottenuti costituiranno, in riferimento agli assi e alle unità scelte, il diagramma cartesiano relativo alla coppia di fenomeni considerati. Se questi variano con continuità, il diagramma consterà d'una linea che si potrà effettivamente tracciare o per mezzo di appositi apparecchi, o talora, quando esista una legge di dipendenza della funzione della variabile e sia abbastanza semplice, anche col sussidio degli strumenti da disegno. Se invece, come più spesso avviene nella statistica, la variabile e la funzione variano saltuariamente, o se anche, pure essendo per loro natura continue, si conoscono di esse, per le rilevazioni fatte, soltanto alcune coppie di valori, il diagramma si ridurrà a un sistema discreto di punti. In tal caso si potrà ad esso conferire una maggiore evidenza rappresentando le ordinate di quei punti mediante rettangoletti di egual base o con tratti di sufficiente grossezza (diagrammi a ordinate: fig. 2, nuzialità in Italia dal 1913 al 1928, cioè numero dei matrimonî per 1000 ab. e per anno), oppure congiungendo quei punti ciascuno col successivo, mediante segmenti rettilinei (fig. 3, nati vivi, morti, matrimonî, in Italia, per 1000 abitanti e per anno). Si possono anche usare i diagrammi in coordinate polari, nei quali la posizione di ciascun punto viene determinata mediante la sua distanza (raggio vettore) da un punto fisso (polo) del piano in cui si costruisce la figura e mediante l'ampiezza dell'angolo (anomalia) che il raggio uscente dal polo e passante per il punto forma con un raggio fisso (asse polare) giacente sul piano. I valori, positivi o negativi, della variabile, misurati nel senso di rotazione che si fissa come positivo o rispettivamente negativo, si assumono come anomalie, e quelli della funzione come raggi vettori. I punti corrispondenti alle effettive rilevazioni si possono successivamente congiungere mediante segmenti rettilinei, ottenendo una spezzata che si svolge o si avvolge a spirale intorno al polo, qualora la funzione sia crescente o decrescente. Rappresentazioni siffatte potranno specialmente usarsi per le funzioni che manifestano delle oscillazioni periodiche in corrispondenza a un certo ciclo di valori della variabile, nel qual caso converrà dividere l'angolo di 3600 in tanti angoli uguali quante sono le modalità equidifferenti di questo ciclo, e congiungere anche l'ultimo punto del diagramma col primo. Per es., per l'Italia, il ritmo stagionale delle nascite (femmine) nel periodo 1911-1915 è messo in evidenza dalla spezzata interna della fig. 4, quando si prenda come unità di misura dei raggi vettori la frequenza media, ossia il raggio della circonferenza punteggiata. Altrettanto si dica per la spezzata e per la circonferenza esterna, che si riferiscono ai maschi nati nello stesso periodo.
Ritornando ai diagrammi cartesiani è da osservare, con Pearson, che quando della funzione si considerano non i valori assunti per i singoli valori della variabile, ma i valori globali corrispondenti a diversi intervalli di valori della variabile, giova rappresentare ciascuno di tali valori globali non mediante un'ordinata spiccata da un punto più o meno arbitrario del segmento che segna l'intervallo di variazione della variabile, ma mediante un rettangolo, di base costituita da questo segmento e d'altezza tale che l'area del rettangolo risulti uguale a quel valore globale. La figura (diagramma superficiale) si presenterà dunque come una serie di rettangoli appoggiati sopra una stessa retta e adiacenti (diagramma a colonne o istogramma). Nella fig. 5 è dato l'istogramma rappresentativo della distribuzione per età della popolazione italiana nei vecchi confini, quale risulta dal seguente prospetto (censimento 1° dicembre 1921).
Altri diagrammi del tipo A1, ai quali lo statistico deve fare spesso ricorso, sono quelli logaritmici, semplici e doppî. I primi, specialmente utili quando la funzione presenti un campo di variazione molto ampio (perché i logaritmi decimali dei numeri da 1 in poi crescono meno rapidamente dei numeri) e quando si voglia dare evidenza alle variazioni relative, che possono talora interessare più delle variazioni assolute, si ottengono assumendo come ascisse i valori naturali della variabile, e come ordinate i logaritmi decimali dei valori della funzione. Poiché log (ky) = log k + log ∥ y, a uguali variazioni relative di y corrispondono uguali variazioni assolute di logy, ossia delle ordinate del diagramma logaritmico. I diagrammi logaritmici doppî si hanno, invece, prendendo come coordinate di ciascun punto i logaritmi decimali sì della variabile che della funzione; e giovano particolarmente per i fenomeni che in scala naturale sarebbero rappresentati da curve del tipo y = kxα, (α reale; α > 0, tipo parabolico; α > 0, tipo iperbolico), poiché, essendo log y = log κ + α log x, il diagramma logaritmico si ridurrà a una retta di coefficiente angolare α. Nella fig. 6 è rappresentato il diagramma logaritmico doppio ottenuto distribuendo i contribuenti alla tassa di famiglia di 23 città italiane, nel 1887, a seconda dell'ammontare dei redditi:
e prendendo poi i logaritmi di questi numeri. Si osserva che i punti del diagramma sono pressoché allineati sopra una retta a coefficiente angolare negativo (Pareto, Benini).
A′1) Diverse funzioni d'una stessa variabile si possono rappresentare in coordinate cartesiane, riferendosi a un medesimo sistema di assi, assumendo sempre la stessa scala di misura sull'asse delle ascisse e scale e origini eventualmente diverse sull'asse delle ordinate per le diverse funzioni (fig. 3). Analogamente si potranno costruire diagrammi polari multipli (fig. 4) che servono a mettere in evidenza le eventuali relazioni (concomitanze, antagonismi, ecc.) fra le funzioni considerate.
B) Per rappresentare un fenomeno quantitativo in funzione di due fenomeni qualitativi (mutabili) converrà anzitutto presentare in forma schematica le m.n combinazioni a cui dànno luogo le possibili m modalità d'una mutabile con le possibili n modalità dell'altra; in corrispondenza alle diverse combinazioni si potranno poi, come in A), rappresentare i rispettivi valori della funzione con figure geometriche di cui certe dimensioni, esplicitamente indicate, siano proporzionali a quei valori. Dette a2, ..., am, le modalità della prima mutabile, e b1, b2,..., bn quale della seconda, lo schema rappresentativo delle diverse combinazioni potrà essere
e sul posto occupato da ciascuna combinazione si costruirà la corrispondente figura geometrica.
B′) Se si debbono figurare più funzioni d'una stessa coppia di mutabili il metodo sarà lo stesso, salvo che sul posto occupato da ciascuna combinazione si costruiranno, per es. una adiacente all'altra e con diverse colorazioni o tratteggi, le figure rappresentative delle singole funzioni.
B1) Se la funzione dipende da una variabile e da una mutabile si può considerarla provvisoriamente come dipendente dalla sola variabile, costruirne come in A1) il diagramma cartesiano e dividere, infine, ciascuna ordinata in parti proporzionali ai numeri di casi in cui rispettivamente si verificano le diverse modalità della mutabile. Si potranno poi congiungere i punti di divisione corrispondenti sulle successive ordinate, sicché la superficie compresa fra quel primo diagramma e l'asse delle ascisse risulterà divisa in tante zone quante sono le modalità della mutabile, zone alle quali si darà evidenza con colorazioni o tratteggi diversi.
B′1) Diagrammi multipli di questa specie non si possono costruire; tutt'al più, avendosi due funzioni d'una stessa variabile e d'una stessa mutabile, si potranno eseguire, con le medesime rispettive scale, due diagrammi come in B1) e disporli in modo che risultino affacciati rispetto ad un asse cartesiano comune. Nella fig. 7 la popolazione italiana maschile e quella femminile, censite il 1° dicembre 1921 nei vecchi confini, sono distribuite per età (variabile) e per stato civile (mutabile).
B2) Se si abbia una funzione dipendente da due variabili si potrà ancora far ricorso a un sistema cartesiano, assumendo per un punto dello spazio tre assi di riferimento fra loro ortogonali e rappresentando rispettivamente su ciascuno di essi, mediante convenienti scale, i valori delle due variabili e della funzione. Così ogni terna di valori corrispondenti, delle due variabili e della funzione, avrà come immagine il punto dello spazio di cui quei valori sono le coordinate; e l'insieme di tali punti costituirà, in riferimento a quei tre assi, lo stereogramma rappresentativo della funzione considerata. Se le due variabili e la funzione potessero variare con continuità, lo stereogramma sarebbe una superficie; ma nei casi pratici sarà formato da un sistema discreto di punti che tenderanno a disporsi sopra una superficie; di questa si potrà poi dare una rappresentazione piana o mediante una figura prospettica o, meglio, con qualcuno dei mezzi suggeriti dalla geometria descrittiva. Tagliando la superficie in parola mediante piani paralleli al piano degli assi su cui si rappresentano le variabili e che abbiano da esso distanze o quote determinate, e proiettando poi ortogonalmente sullo stesso piano le sezioni cosi ottenute, con l'avvertenza di scrivere accanto a ciascuna proiezione la relativa quota, si avrà un sistema di linee (di livello) che potrà dare un'idea del rilievo della superficie, a somiglianza di quanto si fa talora nelle carte topografiche. Si può così rappresentare (Perozzo) la distribuzione del numero dei matrimoni a seconda dell'età dello sposo e della sposa, ecc.
B'2) Diversi fenomeni quantitativi, funzioni tutti d'una stessa coppia di variabili, si potrebbero rappresentare in un medesimo sistema cartesiano a tre assi ortogonali (con eventuale adozione d'una diversa scala di misura e d'una diversa origine per ciascuna funzione, su quell'asse al quale queste si riferiscono) mediante altrettanti stereogrammi. Ciascuno di questi darebbe luogo a un corrispondente sistema di linee di livello, distinguibile dagli altri con speciale colorazione o punteggiatura.
C) Non è facile dare criterî generali per la rappresentazione grafica d'una funzione dipendente da tre fenomeni quantitativi o qualitativi o promiscui. Limitiamoci a due esempî. La fig. 7 si può considerare come un diagramma semplice d'una funzione (numero dei censiti), dipendente da una variabile (età) e da due mutabili (sesso e stato civile). In secondo luogo, se una funzione dipendesse da tre variabili soggette alla condizione di avere una somma costante (come potrebbero essere, p. es., le percentuali dei celibi, coniugati e vedovi, in una popolazione presso cui non viga il divorzio), si potrebbe, utilizzando una nota proprietà del triangolo equilatero, rappresentare nel piano ogni terna di valori delle variabili mediante il punto avente dai tre lati d'un triangolo equilatero distanze proporzionali a quei valori (coordinate triangolari).
Utilità dei diagrammi. - Essi dànno una visione sintetica del decorso d'uno o più fenomeni; permettono di cogliere eventuali concomitanze o antagonismi fra due fenomeni; possono mettere in evidenza eventuali irregolarità dei dati numerici; possono suggerire nuove ricerche; sostituiscono talora, con risparmio di spazio, una tabella numerica (come è degli orarî grafici in uso per le ferrovie); e, soprattutto, facilitano la ricerca della legge di dipendenza della funzione dalle variabili, qualora essa esista, salvo poi a determinarne la forma analitica. Difatti (nel caso d'una funzione d'una sola variabile), se il diagramma assumesse la forma d'un segmento di retta, d'un arco di circonferenza, di parabola, d'iperbole, o di qualunque altra linea di cui la geometria analitica insegna a determinare l'equazione, allora questa equazione esprimerebbe la legge di dipendenza della funzione della variabile, ciò che avrebbe interesse pratico in quanto consentirebbe di trovare anche i valori della funzione non effettivamente osservati. Naturalmente, trattandosi nei casi concreti che la statistica può offrire, di diagrammi costituiti da un insieme discontinuo di punti (o nel caso d'un istogramma dall'insieme dei segmenti che ne limitano gli elementi parallelamente all'asse delle ascisse), sarà questione di vedere se tali punti (o segmenti) giacciano o abbiano una tendenza a disporsi sopra una curva di tipo noto, di cui l'equazione potrà essere determinata coi procedimenti dell'interpolazione analitica. Così, se si rappresenta in coordinate cartesiane la durata della vita media in funzione dell'età, si trova che fra 20 e 60 anni la vita media è, approssimativamente, una funzione lineare dell'età (Gini).
Di fronte ai vantaggi offerti dalle rappresentazioni grafiche, di ben poco rilievo ne sono gl'inconvenienti, che per lo più derivano dall'arbitrio di scelta delle unità di misura. Descritta una curva in relazione a certe scale di misura fissate sugli assi, un cambiamento dell'unità per le ascisse non assecondato da un cambiamento proporzionale dell'unità per le ordinate, darà luogo a un diagramma dissimile dal primo, nel quale le eventuali oscillazioni appariranno attenuate o esagerate. Così pure un cambiamento d'origine sull'asse delle ordinate, muterà i loro rapporti.
Per il più spedito tracciamento dei diagrammi si trovano in commercio carte appositamente coperte di reticolati nei quali ciascuna linea o trama è il luogo dei punti aventi una certa coordinata. Per i diagrammi cartesiani in scala naturale serve la ben nota carta millimetrata da ingegneri. Vi sono poi carte logaritmiche semplici e doppie, le quali permettono l'immediato tracciamento di diagrammi logaritmici, senza bisogno di determinare previamente i logaritmi dei valori rappresentati. Infine esistono carte (per diagrammi polari) in cui un sistema di trame è costituito da circonferenze concentriche, e l'altro sistema da raggi uscenti dal centro; nonché carte per diagrammi in coordinate triangolari; ed altre ancora, nelle quali il reticolato consente di trasformare in rette le linee corrispondenti a certi tipi d'equazione.
Bibl.: L. Perozzo, Stereogr. demografici, in Annali di statistica, 1880; R. Benini, I diagr. in scala logaritmica, in Festgabe für Adolph Wagner, Lipsia 1905; E. Roesle, Graphisch-statistische Darstellungen, ecc., in Arhiv für Soziale Hygiene, Lipsia 1913; C. Gini, Dell'utilità delle rappresentaz. grafiche, in Giorn. degli econom., 1914; A. L. Bowley, Elements of Statistics, Londra 1920; M. Pirani, Graph. Darst. in Wissensch. u. Technik, Berlino 1922; G. Mortara, Nozioni element. sull'impiego delle rappresentaz. grafiche nella statistica, in Giorn. degli econ., Appendice, 1930. Uso dei diagrammi lineari, per es., in La vita econ. ital. indici del movim. econ. ital., pubbl. trimestr. dell'Ist. di statist. della R. Università di Roma.