ANTROPOLOGIA
(III, p. 580).
I metodi statistici.
I metodi statistici servono nell'antropologia alla valutazione delle varie misurazioni e osservazioni. Per questo scopo è necessario:
1. mettere in relazione reciproca le diverse misure somatiche dello stesso individuo;
2. caratterizzare in modo univoco un gruppo d'individui della stessa natura per mezzo di alcuni pochi valori;
3. determinare la posizione di un individuo isolato in seno al proprio gruppo;
4. fissare i rapporti scambievoli (correlazioni) esistenti tra caratteristiche diverse.
Calcoli sull'individuo. - Si chiama valore relativo il rapporto tra una parte e il tutto. Vengono così espresse: in percentuali della statura: l'altezza della testa, la lunghezza del tronco, la lunghezza delle braccia, la lunghezza delle gambe; in percentuali d'altezza della testa: l'altezza soprauricolare, la lunghezza della testa, la larghezza della testa, la larghezza della fronte, l'altezza faciale, l'altezza del naso, la larghezza del naso, le dimensioni dell'arco zigomatico, della mandibola; in percentuali della lunghezza del tronco: la larghezza delle spalle, la larghezza del torace, la profondità toracica, la circonferenza toracica, la larghezza del bacino, la larghezza delle anche; in percentuali di lunghezza delle braccia: braccio, avambraccio, mani, circonferenza del braccio, circonferenza dell'avambraccio; in percentuali delle gambe: coscia, gamba, piede, circonferenza della coscia, circonferenza del polpaccio.
Esempio: In un uomo sia la statura di mm. 1660, l'altezza della testa 232, la lunghezza del tronco 557, la lunghezza delle braccia 782, la lunghezza delle gambe 825, la lunghezza della testa 185, la larghezza della testa 158, la larghezza del tronco 251, la profondità del torace 196, il braccio 320, la coscia 425, ecc. Sarà allora: altezza della testa: statura 14%; lunghezza del tronco: statura 34%; lunghezza delle braccia: statura 47%; lunghezza delle gambe: statura 50%; lunghezza della testa: altezza della testa 80%; larghezza della testa: altezza della testa 68%; larghezza del torace: lunghezza del tronco 45%; profondità del torace: lunghezza del tronco 35%; braccio: lunghezza delle braccia 41%; coscia: lunghezza delle gambe 51%. Cfr. fig. 1 a sinistra.
Spesso tutte le misure vengono espresse in percentuali della statura. Ma ciò non fornisce un'immagine adeguata dei rapporti somatici, essendo la statura una misura complessa, sulla quale influisce in modo particola mente sensibile la lunghezza delle gambe.
Indice. - Si dice invece indice il rapporto di una parte a un'altra. Di solito la misura minore si esprime in percentuali della maggiore; così:
nella testa: in percentuali della lunghezza: la larghezza della testa, l'altezza soprauricolare, l'altezza della faccia; in percentuali della larghezza: l'altezza auricolare, la larghezza della fronte, l'arco zigomatico, la mandibola; in percentuali della circonferenza: la lunghezza e la larghezza della testa; in percentuali dell'altezza della faccia: l'altezza del naso, la mandibola; in percentuali dell'altezza del naso: la larghezza del naso; in percentuali dell'arco zigomatico: l'altezza della faccia, la larghezza della fronte, la mandibola; in percentuali della mandibola: la larghezza della fronte; in percentuali dell'altezza soprauricolare: l'altezza della faccia;
nel tronco: in percentuali della larghezza del torace: la profondità del torace; in percentuali della circonferenza del torace: la larghezza del torace, la profondità del torace; in percentuali della larghezza delle spalle: la larghezza del torace, la larghezza del bacino, la larghezza delle anche; in percentuali della larghezza del bacino: la larghezza del torace; in percentuali della larghezza delle anche: la larghezza del torace, la larghezza del bacino;
nelle estremità: in percentuali della lunghezza delle braccia: la lunghezza del tronco; in percentuali della lunghezza delle gambe: la lunghezza del tronco, la lunghezza delle braccia.
Esempio: Dalle misure surriferite risultano gl'indici seguenti: larghezza della testa: lunghezza della testa 85%; profondità del torace: larghezza del torace 78%; lunghezza delle braccia: lunghezza delle gambe 95%; lunghezza del tronco: lunghezza delle gambe 67%; lunghezza del tronco: lunghezza delle braccia 71%, ecc.
Cfr. fig. 1 in alto a destra.
Si possono formare indici soltanto dai valori della stessa potenza; sono pertanto matematicamente ingiustificabili indici tra il peso del corpo o la sezione orizzontale del corpo da un lato e una misura di lunghezza o larghezza o circonferenza dall'altro (Livi, Rohrer, Pirquet, ecc.). In generale non è necessario dare anche i decimali dei valori relativi e degl'indici.
La crescita dell'individuo è espressa dalle rate di crescenza assoluta e relativa. Le assolute si trovano sottraendo ciascun valore dal valore successivo; nelle relative la crescita assoluta è espressa in percentuali del valore della precedente classe o gruppo di età (v. accrescimento, I, p. 272).
Caratterizzazione di un gruppo. - Per formare un gruppo si devono innanzi tutto escludere tutti i casi patologici, giacché non può operarsi col calcolo che su elementi della stessa natura. Si possono poi costituire gruppi: secondo l'età; secondo la razza; secondo lo stato di salute; secondo il peso; secondo la condizione sociale; secondo il luogo di nascita o di abitazione; secondo una determinata misura somatica o un determinato indice; secondo qualsiasi attività determinata (scolastica, professionale, ginnastica, sportiva, ecc.).
Nella formazione di gruppi secondo l'età si calcola ad anni o a semestri di vita (si considerano quindi decenni i fanciulli fra i 9½ e i 10½ anni o - se si computa per semestri - settenni tra 63/4 e 7¼ e così via, di 7½ anni quelli tra i 7¼ e 73/4, ecc.); sarebbe invece impreciso - corrispondendo a valori diversi nei diversi individui - un raggruppamento fatto in base agli anni scolastici, o ad anni civili, ecc.
Si chiama valore medio la media dei valori del gruppo per ogni singola misura. La media del gruppo è la media aritmetica dei valori dei singoli individui.
Per un numero piuttosto grande d'individui si forma dapprima una serie di frequenza, ripartendo le misure trovate in classi di eguale estensione; con ciò le grandezze di classe vengono a trovarsi nel centro della classe relativa. Per es.: per la statura: grandezza di classe 162: da 161,5 a 162,4 cm.; grandezza di classe 163: da 162,5 a 163,4 cm., ecc. - Per il peso corporeo: grandezza di classe 59,0: da 58,8 a 59,2 kg.; grandezza di classe 59,5: da 59,3 a 59,7 kg.; grandezza di classe 60,0: da 59,8 a 60,2 kg., ecc.
L'ampiezza delle classi deve scegliersi in modo da ottenersi almeno 12 e al più 25 classi.
Per ciascuna classe si stabilisce quanti individui le competono, e questo numero è detto frequenza. Per calcolare il valore medio si moltiplica ogni grandezza di classe per la sua frequenza, si sommano i prodotti e si divide la somma per il numero degl'individui.
Possono parimenti calcolarsi valori medî da indici; anche da caratteristiche descrittive si ottengono valori medî qualora si ordinino le caratteristiche osservate in una serie progressiva, e si trattino i numeri susseguentisi di queste caratteristiche come grandezze di classe.
Esempio: Lunghezza del tronco di donne adulte:
Cfr. fig. 2.
Invece della media aritmetica M sono stati occasionalmente adoperati anche il valore centrale C o la media di densità D; ma questi due valori rendono molto imperfettamente le variazioni nella composizione dei gruppi; anche considerazioni puramente matematiche consigliano l'adozione della media aritmetica M. Spesso si calcola un cosiddetto "errore medio" del valore medio; ma esso non permette di trarre alcuna conclusione certa intorno alla validità generale del valore trovato: ogni valore medio vale soltanto per il gruppo preso in esame.
La deviazione indica se i singoli valori del gruppo sono addensati o dispersi intorno al valore medio. Si calcola la media aritmetica ε delle singole deviazioni e della grandezza di classe V dal valore medio M. Deve inoltre prendersi il valore assoluto di e (senza riguardo al segno), quindi:
la deviazione media è quindi
Un gruppo è adeguatamente individuato dai valori M e ε.
Esempio: Lunghezza del tronco di donne adulte (v. sopra):
Cfr. fig. 2.
Modo di facilitare il calcolo. - Si sceglie un numero intero o più comodo M′ come grandezza di partenza, e a partire da esso si calcolano le deviazioni e′ poi si sommano le frequenze al disotto (= i) e al disopra (= s) di M′; è allora
Esempio (cfr. l'esempio precedente): Si sceglie come grandezza di partenza la grandezza di classe 51; è allora M − M′ = 0,3.
Cfr. fig. 2:
Spesso invece della deviazione media ε si impiega la deviazione media quadratica σ, ossia la radice quadrata del valore medio dei quadrati delle singole deviazioni, quindi:
Poiché tuttavia in questa formula l'influsso esercitato dalla singola deviazione ε sul valore di σ aumenta secondo il quadrato della distanza dal valore medio, l'influsso più forte viene esercitato dai valori estremi, i quali dipendono in maniera straordinariamente grande dal caso, sicché la deviazione quadratica o può in determinate circostanze porgere un'immagine del tutto erronea della concentrazione dei singoli valori intorno al valore medio. Perciò si dovrebbe adoperare esclusivamente la deviazione media ε la quale riproduce in maniera del tutto soddisfacente la grandezza della concentrazione ed è molto sensibile alle alterazioni della distribuzione.
L'ampiezza di variazione, cioè la differenza tra la misura minima e la massima, non è adatta alla valutazione di un gruppo.
Per la crescita in un gruppo, se è stato misurato ripetutamente un gruppo rimasto del tutto identico, si possono calcolare crescite assolute e relative precisamente come nell'individuo (v. sopra); se invece vengono comparati tra loro alquanti gruppi di età diverse, possono essere calcolate differenze assolute e relative.
Esempio: In una festa ginnastica si misurano fanciulle dai 14 ai 18 anni:
Valutazione delle singole misure. - Distribuzione normale. - La valutazione di un individuo in seno al suo gruppo è tanto più sicura quanto più "normalmente" i singoli individui si distribuiscono nell'intera ampiezza di dispersione. In caso di distribuzione interamente "normale" si ha nella iappresentazione grafica la cosiddetta curva di Gauss che in caso di distribuzione simmetrica può svilupparsi secondo il binomio (1/2 + 1/2)2.
Se si formano tre classi, dovrebbero "normalmente" trovarsi il 25% d'individui "buoni", il 50% di "medî" e il 25% di "cattivi".
Se si divide un gruppo in 5 classi, dovrebbero secondo Gauss trovarsi 6,2% individui ottimi, 25% buoni, 37,6% medî, 25% cattivi; 6,2% pessimi. In una divisione in 11 classi (v. sotto) la distribuzione normale dà nella prima e undecima classe 0,1%, nella seconda e decima 1%, nella terza e nona 4,4%, nella quarta e ottava 11,7%; nella quinta e settima 20,5%, nella sesta 24,6% dell'intero gruppo.
Se la distribuzione effettiva varia notevolmente da questa distribuzione "normale" ciò è segno della presenza di qualche turbamento: o il gruppo non è unitario oppure la misura studiata è influenzata da due componenti di accrescimento di natura diversa. I metodi di valutazione che qui diamo successivamente hanno valore soltanto, bene inteso, in caso di distribuzione approssimativamente "normale".
Curve a profilo percentuale. - Per la valutazione di una misura, un rapporto regolare tra la dispersione della misura studiata da un lato, e la dispersione dei valori di notazione nella scala dei valori dall'altro, è stabilito in base ai principî seguenti:
1. il valore medio M deve trovarsi esattamente nel centro della scala di notazione scelta;
2. il numero dei gradi di notazione deve essere sempre dispari, perché dalla notazione media deve partire verso ciascuna direzione un numero eguale di gradi di notazione;
3. tutti i gradi di notazione devono avere la stessa ampiezza; da ciò deriva spontaneamente, in caso di distribuzione "normale", il concentrarsi intorno al valore medio nel senso della curva di Gauss;
4. la distanza dal valore medio al centro della nota peggiore, o rispettivamente migliore, deve essere eguale al doppio della deviazione ε, perché la deviazione media ε deve trovarsi nel mezzo tra il valore medio M e il limite esterno dell'ampiezza normale di oscillazione;
5. i valori estremi stanno al disopra e al disotto dei limiti dell'ampiezza normale di oscillazione.
La valutazione più semplice è quella che si ha con 5 gradi di notazione, perché in tal caso ciascun grado ha l'ampiezza ε.
1° Esempio: Lunghezza del tronco in donne adulte (v. sopra).
2° Esempio: L'indice larghezza della testa: lunghezza della testa dà per un gruppo di uomini M = 86; ε = 5.
Se eccezionalmente si vogliono usare solo 3 gradi di notazione (per es., con indici e valori relativi), ciascun grado ha l'ampiezza 2 ε.
3° Esempio: L'indice larghezza del naso: altezza del naso dà in un gruppo di donne M = 63,5; ε = 4.
La valutazione più esatta è tuttavia a 11 gradi di notazione, i quali vengono designati nella maniera più perspicua mediante valori percentuali: il valore limite inferiore con 0%, il medio con 50%, il valore limite superiore con 100%. Ogni grado ha l'ampiezza 2/5 ε.
4° Esempio: L'ampiezza del bacino in un gruppo di ragazzi decenni dà M = 21,5; ε = 0,75 cm.
Questo metodo di valutazione consente il confronto di tutti gli elementi tra loro: misure e indici assoluti e relativi, soggetti maschili e femminili, età, gruppi sociali, razze, professioni diverse, ecc. V. per altri esempî le figg. 4,5.
Valutazione delle osservazioni. - Essa deve procedere in maniera estimativa; perciò per molti caratteri descrittivi (p. es., la struttura scheletrica, la muscolatura, le condizioni di nutrizione, il tipo di atteggiamento stazionale) un punto di riferimento per l'esattezza della stima è dato da ciò che si è detto al principio di questo paragrafo sulla distribuzione di frequenza. Se i valori ottenuti differiscono notevolmente da tale distribuzione, si tratta o di alterazioni della normalità o di stima troppo larga ovvero troppo rigorosa.
Esempio: Per giudicare le condizioni di nutrizione si cominci con l'usare 5 gradi di notazione: 10% molto mal nutriti; 30% mal nutriti; 50% mediocremente nutriti; 70% ben nutriti; 90% molto ben nutriti.
Con un esercizio ripetuto sarà possibile intercalare altri gradi intermedî: −% straordinariamente mal nutriti, patologicamente denutriti; 0% particolarmente mal nutriti; 10% molto mal nutriti; 20% alquanto mal nutriti; 30% mal nutriti; 40% piuttosto mal nutriti; 50% mediocremente nutriti; 60% piuttosto ben nutriti; 70% ben nutriti; 80% alquanto ben nutriti; 90% molto ben nutriti; 100% particolarmente ben nutriti; −% straodinariamente ben nutriti, patologicamente ipernutriti.
Correlazioni. - Tra la maggior parte delle misure (p. es., tra la statura e il peso, tra la statura e la lunghezza del tronco, tra la larghezza delle spalle e la larghezza del torace, ecc.), esistono certe relazioni in modo che una misura è più o meno dipendente dall'altra. Queste relazioni si dicono correlazioni; compito del calcolo di correlazione è di esprimere numericamente la grandezza della dipendenza di una misura da un'altra.
Una correlazione può essere calcolata quando su uno stesso gruppo di soggetti furono prese due misure diverse. Particolarmente fecondo è il confronto tra correlazioni diverse. La certezza delle correlazioni istituite dipende dal numero dei soggetti e dalla normalità" del gruppo. In generale una correlazione può dirsi accertata quando si fonda su almeno 500 soggetti con distribuzione approssimativamente "normale".
I soggetti sono ordinati in serie crescente secondo una delle due misure da confrontarsi. Se in questa serie si attribuisce a ciascun soggetto singolo il valore della seconda misura, che gli appartiene, queste altre misure costituiscono la seconda serie, coordinata. La prima serie, ordinata, va dunque crescendo dalla misura più piccola alla maggiore, mentre la coordinata può assumere qualsivoglia aspetto.
Se in un sistema di coordinate cartesiane si proiettano con punti i valori medî del primo carattere studiato corrispondenti alle classi regolarmente crescenti dell'altro carattere, classi rappresentate sull'asse delle ascisse, congiungendo i punti stessi, si ha una spezzata che si può regolarizzare in una retta.
Procedendo in modo inverso, cioè proiettando i valori medî del secondo carattere, corrispondenti alle classi regolarmente crescenti del primo, classi rappresentate questa volta sull'asse delle ordinate, si ha una seconda linea spezzata, che si può regolarizzare in una retta.
Queste rette si chiamano, dal tempo di Galton, "linee di regressione". L'angolo da esse formato determina la correlazione: quanto più piccolo esso è, tanto maggiore è la correlazione.
I tre casi limiti della correlazione sono (fig. 6):
1. Correlazione completa: le due serie si corrispondono interamente; le due linee di regressione sono parallele e il loro angolo è 0°; la probabilità è = 100%.
2. Correlazione interamente inversa; la serie ordinata è l'esatta immagine speculare della coordinata; le due linee di regressione si tagliano ad angolo retto; probabilità = 0%.
3. Nessuna correlazione: le due serie non hanno alcun rapporto tra loro; le due linee di regressione si tagliano ad angolo di 45°; probabilità = 50%.
Per ottenere linee di regressione comparabili si deve eliminare l'influsso della lunghezza delle serie. Ciò si ottiene nella rappresentazione grafica "quadrando" la tavola di correlazione: si prendono come ordinate i valori da 0% a 100% e come ascisse le frequenze della serie ordinata espresse in percentuali della lunghezza n della serie. Dall'angolo formato dalle linee di regressione può quindi calcolarsi la probabilità con la quale per i singoli valori della prima misura si possono aspettare valori corrispondenti della seconda.
Calcolo delle correlazioni. - Le due misure da confrontare devono valutarsi in gradi di notazione a 11 divisioni e i valori estremi (minusvalori quando risultino al disotto, e plusvalori quando risultino al disopra del normale) devono eliminarsi; essi rimangono esclusi dal calcolo delle correlazioni. Invece, per gli 11 gradi di notazione, le frequenze devono essere espresse in percentuali del numero degl'individui (facendo astrazione dai valori estremi); e poi trasformate in 10 segmenti di frequenza, ciascuno dei quali comprende la metà della frequenza al disotto e la metà di quella al disopra.
Per ciascuno degli 11 gradi di notazione della serie ordinata si calcoli il rispettivo valore medio della serie coordinata e da questi valori medî si calcolino, tenendo conto del segno, le 10 differenze di valore consecutive, sottraendo ciascun valore medio da quello che gli consegue; le differenze di valore della serie ordinata sono sempre + 10%. Le differenze di valore delle due serie devono esprimersi in percentuali dei segmenti di frequenza trasformati; ai valori d così ottenuti corrispondono gli angoli indicati nella tabella seguente (non dimenticare il segno):
Gli angoli devono moltiplicarsi per la frequenza trasformata; sommando questi prodotti (sempre tenendo conto del segno) e dividendo la somma ottenuta per 100, si ottiene l'angolo medio delle due linee di regressione; sottraendo l'angolo della linea di regressione della serie coordinata dall'angolo della linea di regressione della serie ordinata, si ottiene l'angolo formato dalle due linee di regressione.
Nella tabella seguente si trova per ciascun angolo delle linee di regressione la probabilità percentuale rispettiva, con la quale si può dai valori della serie ordinata concludere sui valori corrispondenti della serie coordinata.
Esempio: Si debba calcolare la correlazione tra la larghezza delle spalle e quella del torace da un lato, tra la larghezza delle spalle e quella del bacino dall'altra. Le tre misurazioni sono state prese su un gruppo unitario di 650 uomini.
Le linee di regressione salgono, facendo con l'asse delle ascisse gli angoli seguenti (figura 7): per la larghezza delle spalle (linea continua) 33°,76; per la larghezza del torace (linea punteggiata) 30°,98; per la larghezza del bacino linea tratteggiata) 21°,09. Le linee di regressione: larghezza di spalle - larghezza di torace formano tra loro un angolo di 33°,76 − 30°,98 = 2°,78; dalla larghezza delle spalle si può dunque dedurre la larghezza del torace con una probabilità del 95%. Le linee di regressione: larghezza di spalle - larghezza di bacino formano tra loro un angolo di 33°,76 − 21°,09 = 12°,67; il che significa che dalla larghezza delle spalle può concludersi a una corrispondente larghezza del bacino soltanto con una probabilità dell'81%. Cfr. fig. 7.
Spesso la grandezza della correlazione si esprime, anziché mediante l'angolo delle linee di regressione e la probabilità, che ne dipende, della corrispondenza delle due serie, mediante il cosiddetto coefficiente di correlazione r. Questo in caso di correlazione completa è r = + 1, in caso di correlazione inversa completa è r = − 1, in caso di mancata correlazione è r = ± 0. Esso viene calcolato secondo la formula
in cui e1 indica la deviazione di un valore individuale del valore medio M1 del primo carattere; e2 la deviazione di un valore individuale del valore medio M2 del secondo carattere; n il numero degli individui; σ1 la deviazione quadratica media del primo carattere; σ2 la deviazione quadratica media del secondo carattere.
Questa formula non è tuttavia da raccomandarsi, perché essa fa uso della deviazione media quadratica; inoltre gli angoli delle linee di regressione sono molto più prossimi e infine le percentuali di probabilità possono calcolarsi immediatamente.