thesaurus
In linguistica, il termine thesaurus ha tre significati distinti:
(a) dizionario o lessico (➔ dizionario);
(b) dizionario privo di definizioni organizzato per campi semantici (o dizionario analogico);
(c) database terminologico relativo a un determinato campo di sapere (Hartmann 20062).
Il significato di lessico è tradizionalmente associato ai primi tentativi di raccogliere, in ordine alfabetico, tutte le parole utilizzate in una data lingua, per illustrare la ricchezza di questa.
È il caso, ad es., del Thesaurus Linguae Romanae et Britannicae di Thomas Cooper (1565), del Trésor de la langue française di Jean Nicot (1606), del Tesoro de la lengua castellana di Sebastián de Covarrubias (1611), o ancora – per l’area italiana – dei thesauri menzionati da Migliorini in Che cos’è un vocabolario? (19512):
Il Sansovino diceva [...] di lavorare intorno a un Tesoro della lingua volgare; il Montemerlo [..] dà il titolo di Thesoro della lingua toscana all’edizione del 1594 di quell’opera [...] chiamata Delle phrasi toscane (1566); il Lombardelli invoca “un ampio Tesoro dove sien raccolte tutte le voci attinenti a puro Toscanismo” [...]. Tesoro della lingua italiana fu chiamato nel Settecento il grande lessico incompiuto del Bergamini Della volgar elocuzione.
Tuttavia, proprio agli albori della lessicografia il tipo lessicale thesaurus fu impiegato largamente, in particolare in Italia (Thesaurus, Thesoro, Tesoro), Francia (Trésor) e Spagna (Tesoro), anche e soprattutto per indicare opere a carattere enciclopedico, organizzate secondo criteri non necessariamente omogenei, ma con pretese di esaustività, ampiezza e completezza.
Questa accezione aveva un illustre antecedente nei Livres dou Tresors composti da Brunetto Latini tra il 1260 e il 1266, che godettero di ampia circolazione manoscritta tanto in Italia quanto in Francia e in Spagna (Marshall 2001; ➔ storia della lingua italiana). Come noto, i Tresors latiniani sono una raccolta di «chose de grandisme vaillance» circa i maggiori argomenti filosofici del tempo («tous les membres de philosophie») – l’origine del mondo, l’astronomia, la geografia e la storia naturale (libro primo), la morale, i vizi e le virtù (libro secondo), la «scienza di ben parlare [...] e governare» (libro terzo) – argomenti paragonati per la loro importanza a denari, pietre preziose e oro.
Dai Tresors sarebbe quindi invalso l’uso, in particolare tra il XVI e il XVII secolo, di intitolare thesauri le opere di carattere enciclopedico-pedagogico, ricorrendo alla metafora del tesoro per la presunta vastità e preziosità dei materiali che vi venivano raccolti e presentati: dal Tresor de vertu di Bartolomeo Maraffi (1576: «où sont contenues les plus nobles, et excellentes sentences, et enseignements de tous les premiers Auteurs Hebreux, Grecz, et Latins, pour induire un chacun à bien et honnestement vivre») al Libro de abbaco che insegna a fare ogni ragione mercantile et pertegare le terre con l’arte della Geometria [...] El qual libro si chiama Thesoro universale, del matematico Hieronimo Tagliente (1579), strutturato secondo una progressione dal teorico al pratico e dal generale allo specifico; dal Tesoro della vita umana del cerusico bolognese Leonardo Fioravanti (1587) al Tesoro della sanità (1589) e al Thesoro dei poveri (1593) dei medici Castor Durante da Gualdo e Pietro Hispano. Fino alle diverse edizioni del Thesoro politico (1589-1618), l’anonima fortunata raccolta di relazioni di ambasciatori, istruzioni a cardinali e nunzi pontifici (Testa 2008).
Sfumata questa accezione enciclopedica, l’uso di thesaurus nel suo significato di «dizionario» fu autorevolmente ripreso dalla ➔ lessicografia moderna, come ricordano gli esempi ottocenteschi del Trésor dou félibrige di Frédéric Mistral per le parlate d’oc, e del monumentale Thesaurus linguae Latinae della Bayerische Akademie der Wissenschaften (tuttora in corso di edizione), o quelli novecenteschi del Trésor de la langue française: dictionnaire du XIXe & XXe siècle (1961; http://atilf.atilf.fr/tlf.htme) e, per l’area italiana, del Tesoro della lingua italiana delle origini (TLIO; www.vocabolario.org), il dizionario storico della lingua italiana in corso di redazione presso l’Istituto dell’Opera del Vocabolario Italiano «basato su tutta la documentazione disponibile a partire dal primo documento che si può dire italiano [...] cioè l’Indovinello veronese dell’inizio del secolo IX, fino alla fine del Trecento». Copre quasi tutto l’intero vocabolario della lingua inglese, dall’«Old English to the present day», lo Historical thesaurus of the Oxford English dictionary, pubblicato nel 2009 dalla Oxford University Press e a oggi – con i suoi 920.000 lemmi – il thesaurus più completo al mondo.
Tra le imprese lessicografiche rimaste sulla carta, invece, vale la pena menzionare, ancora per l’area italiana, l’ambizioso progetto di un tesoro della lingua italiana che il filologo Giorgio Pasquali presentò alla Reale Accademia d’Italia nel 1941, ma che non poté mai portare a termine (Pasquali 1941; Gomez Gane 2004).
Benché il significato di «dizionario» sia quello storicamente più rilevante, è oggi il significato di «dizionario organizzato per campi semantici», o «dizionario analogico» (o anche, meno spesso, «nomenclatore»), ad essere più in uso, almeno nella linguistica di derivazione anglo-americana (Hartmann 2006).
Esso trae origine dal Thesaurus of English words and phrases, compilato nella prima metà del XIX secolo da Peter Mark Roget e dato alle stampe nel 1852, per fornire al lettore alternative lessicali per esprimere lo stesso concetto (Hüllen 2004), seguendo un approccio che la moderna lessicografia definisce onomasiologico, nonché una visione d’insieme sul campo semantico, con accenni alla fraseologia, come rivela, ad es., la voce word (592):
N. word, term, vocable; name &c 564; phrase &c 566; root, etymon; derivative; part of speech &c (grammar) 567; ideophone†.
dictionary, vocabulary, lexicon, glossary; index, concordance; thesaurus; gradus [Lat.], delectus [Lat.].
etymology, derivation; glossology†, terminology orismology†; paleology &c (philology) 560 [Obs.].
lexicography; glossographer &c (scholar) 492; lexicologist, verbarian†.
Adj. verbal, literal; titular, nominal.
conjugate [Similarly derived], paronymous†; derivative.
Adv. verbally &c adj.; verbatim &c (exactly) 494.
Phr. the artillery of words [Swift]
I dizionari onomasiologici come il Roget, di contro ai più tradizionali dizionari semasiologici – i quali forniscono la spiegazione del significato di una data parola per mezzo di definizioni ed esempi (dalla parola al significato) – offrono una gamma di scelte lessicali, strutturate secondo relazioni gerarchiche (dal tutto a una parte), di equivalenza (sinonimia, omonimia, antonimia) e associative, di solito prive di definizione, e semanticamente legate a un unico concetto (dal significato alla parola). A seconda della specializzazione, i concetti possono inoltre essere organizzati in vere e proprie tassonomie, e i loro raggruppamenti accentuare la struttura tematica del dizionario.
Il primo ampio thesaurus di questo tipo fu, per l’area italiana, il noto vocabolario nomenclatore di Palmiro Premoli, Il Tesoro della lingua italiana (1909-1912) che, rispetto ai precedenti dizionari metodici di Giacinto Carena (Vocabolario metodico della lingua italiana, 1846) e di Stefano Palma (Vocabolario metodico-italiano, 1870), offriva anche una breve definizione del lemma indicizzato, non limitava i campi semantici a settori particolari del lessico (la casa, le professioni, ecc.), e procedeva – ricalcando il Roget – per «analogismo» perché, a detta del suo editore,
mette[va] intorno ad essa [la parola] non solo i sinonimi, le frasi, le locuzioni, i proverbi [...] ma tutta una legione, una pleiade di altre parole, che, con quelle avendo relazione, affinità, analogia, concorrono a completare il corredo linguistico necessario, tanto per ben conoscere una cosa nel suo complesso e nelle sue parti, quanto per esprimere in vari modi – nelle loro gradazioni, nelle loro sfumature – affetti, idee, sentimenti, ecc. Dunque, un metodo, e procedente per mezzo dell’analogismo (Premoli 1909-1912: V-VI).
L’ordine alfabetico delle voci, la definizione e l’accumulo per analogia sono alla base dei thesauri cosiddetti ibridi (Calzolari 1988), che a partire dagli anni Ottanta del Novecento hanno unito alle caratteristiche di un dizionario semasiologico quelle di un dizionario onomasiologico, perché prevalentemente rivolti a un’utenza di non madrelingua, provvista di conoscenze eterogenee circa le relazioni paradigmatiche nella L2. Particolarmente attenta a questa produzione si è rivelata la lessicografia anglo-americana (Marello 1990), diretta erede del Roget, che ha infatti sviluppato in parallelo thesauri ‘puri’ (come il New Oxford thesaurus of English), thesauri ibridi (come l’Oxford English dictionary), thesauri per native speaker (come l’Oxford learner’s wordfinder dictionary) e thesauri visuali (come l’Oxford visual dictionary).
Nel 2009 è uscito il Grande dizionario analogico della lingua italiana diretto da Raffaele Simone (Simone 2009), munito di CD-Rom, in due volumi, che incorpora una struttura concettuale elaborata e intonata alle ricerche recenti sulla struttura del lessico e le relazioni semantiche delle parole. Si tratta della più vasta e articolata opera di questo genere concernente l’italiano e, tolto l’Oxford sopra menzionato, una delle più vaste d’Europa.
Legata allo sviluppo di programmi di videoscrittura e del web è la diffusione, negli ultimi decenni, di thesauri intesi come database terminologici.
Nell’accezione più comune, si tratta di thesauri che forniscono per una parola data un elenco (chiuso) di ➔ sinonimi, ovvero di versioni estremamente semplificate di dizionari di sinonimi – generalmente fornite dalle case produttrici degli stessi software di videoscrittura – apparentemente rivolte a ogni tipologia di utenza ma di fatto destinate a chi possiede già un’ottima competenza attiva della lingua, e che già conosce tanto la definizione di un lemma quanto la specificità delle sue relazioni paradigmatiche.
Più complessa è invece l’architettura di thesauri che organizzano materiali presenti in Internet, e che permettono ricerche simultanee in più database elettronici, come l’Hasset (Humanities and Social Science Electronic Thesaurus), sviluppato e aggiornato dall’Università dell’Essex, in Inghilterra: attraverso il suo motore di ricerca, e partendo da una parola chiave, si possono ricavare informazioni gerarchicamente strutturate (dagli iperonimi agli iponimi) nel campo delle discipline umanistiche e delle scienze sociali (Asghar Shiri & Revie 2000). Ricercando la parola design, ad es., si ricavano «Building design», «Design and technology», «Environmental design», «Housing design», «Urban design», tutti sintagmi nominali da cui si accede ad altre voci strutturate ad albero (da «Urban design», ad es., «development», «urban planning», «urban centre»). In questo senso, questi database terminologici ricordano più i thesauri enciclopedici che quelli lessicali o di orientamento lessicografico.
Asghar Shiri, Ali & Revie, Crawford (2000), Thesauri on the Web: current developments and trends, «Online information review» 4, 24, pp. 273-280.
Calzolari, Nicoletta (1988), The dictionary and the thesaurus can be combined, in Relational models of the lexicon. Representing know-ledge in semantic networks, edited by M. Walton Evens, Cambridge, Cambridge University Press, pp. 75-96.
Gomez Gane, Yorick (2004), Per un Thesaurus della lingua italiana: un breve inedito di Giorgio Pasquali, «Studi linguistici italiani» 30, 1, pp. 112-117.
Hartmann, Reinhard R.K. (2006), Onomasiological dictionaries in 20th-century Europe, in Onomasiological dictionaries, edited by W. Hüllen, «Lexicographica» 21, pp. 6-19.
Hartmann, Reinhard R.K. (20062), Thesaurus, in Encyclopedia of language and linguistics, editor-in-chief K. Brown, Boston - Oxford, Elsevier, 14 voll., vol. 12º, pp. 668-676.
Hüllen, Werner (2004), A history of Roget’s Thesaurus. Origins, development, and design, Oxford, Oxford University Press.
Marello, Carla (1990), The thesaurus, in Handbücher zur Sprach- und Kommunikationswissenschaft, Berlin - New York, de Gruyter, 35 voll., 5º/2 (Wörterbücher. Ein internationales Handbuch zur Lexikographie, edited by F.J. Hausmann et al.), pp. 1083-1094.
Marshall, Jennifer (2001), The manuscript tradition of Brunetto Latini’s Li livres dou Tresor and its Italian versions (unpublished Ph.D. thesis, London, University of London).
Migliorini, Bruno (19512), Che cos’è un vocabolario?, Firenze, Le Monnier (1a ed. Roma, Edizioni della Bussola, 1946).
Pasquali, Giorgio (1941), Per un Tesoro della lingua italiana, «Atti della R. Accademia d’Italia. Rendiconti della classe di scienze morali e storiche» 12, pp. 490-521.
Premoli, Palmiro (1909-1912), Il Tesoro della lingua italiana. Vocabolario nomenclatore, Milano, Sonzogno, 2 voll (rist. anast., Bologna, Zanichelli, 1989).
Simone, Raffaele (dir.) (2009), Grande dizionario analogico della lingua italiana, Torino, UTET, 2 voll., con CD-Rom.
Testa, Simone (2008), From the “Bibliographical Nightmare” to a critical bibliography. Tesori politici in the British Library, and elsewhere in Britain, «Electronic British Library journal» (http://www.bl.uk/eblj/2008articles/article1.html).