PSICOLINGUISTICA
(App. IV, III, p. 100)
La p. è nata negli anni Cinquanta, come frutto della collaborazione tra psicologi interessati al linguaggio e linguisti, e ha svolto un ruolo di primo piano nello sviluppo della psicologia nella seconda metà del secolo e nell'emergere della scienza cognitiva. Tuttavia, la sua storia non è stata lineare ma ha riflesso i contrasti di fondo che ancora caratterizzano lo studio della mente e del comportamento.
Negli anni Cinquanta la p. aveva un'impostazione positivistica (niente postulazione di entità inosservabili, come la mente o le rappresentazioni, ma solo osservazione di stimoli e di risposte) e associazionistica (spiegare il comportamento linguistico come apprendimento di associazioni tra parole e cose e tra parole tra loro), in conformità con la psicologia comportamentista e la linguistica strutturale dell'epoca. Ma negli anni Sessanta la rivoluzione chomskiana in linguistica (Chomsky 1957) e l'emergere della psicologia cognitivista (Neisser 1967) capovolsero le scelte teoriche della psicolinguistica. La nuova p. faceva uso di nozioni mentalistiche come quella di rappresentazione e di regola, e il semplice meccanismo dell'associazione appariva ora del tutto inadeguato a dar conto delle capacità linguistiche. Nei decenni successivi la p. è rimasta in stretto collegamento con la linguistica chomskiana, ma due tendenze opposte hanno continuato fino a oggi a dividere gli studiosi del linguaggio: la prima tendenza, sostenuta da Chomsky, è quella dell'autonomia del linguaggio dalla cognizione; secondo questa concezione, il linguaggio è una capacità cognitiva distinta e indipendente dalle altre capacità cognitive, un sistema di regole e rappresentazioni specifiche che si sviluppano nel bambino con una forte e specifica base innata. La seconda tendenza è quella del minimalismo linguistico (Tanenhaus 1988); secondo tale tendenza non vi è ''modulo'' mentale separato per il linguaggio e non vi è una base innata specifica per le strutture linguistiche, ma il linguaggio emerge utilizzando varie capacità cognitive di per sé non linguistiche (Bates, McWhinney 1982; Langacker 1987).
Questa contrapposizione in realtà riflette un contrasto di priorità e di ''rapporti di potere'' tra le due discipline della linguistica e della psicologia. Se esiste una capacità separata del linguaggio, è la disciplina della linguistica che deve innanzitutto identificare le regole e le rappresentazioni che costituiscono questa capacità e i principi che la governano; solo in un secondo tempo, gli psicologi potranno esaminare come queste regole, rappresentazioni e principi vengono realizzati nell'uso effettivo del linguaggio. Invece, se il linguaggio non è che il mettere insieme processi, capacità e principi validi per tutta la cognizione, allora la dipendenza della p. dalla linguistica è immotivata, in quanto essa diventa semplicemente psicologia del linguaggio e caso mai il suo compito è quello di dar conto, in base a principi psicologici generali, dei dettagliati fatti empirici riguardanti il linguaggio scoperti in questi ultimi decenni dai linguisti (le cosiddette ''intuizioni linguistiche'', cioè i giudizi che chi parla una lingua sa dare sull'accettabilità, ambiguità, parafrasabilità, ecc., delle frasi della sua lingua).
Negli anni Ottanta questa situazione non è cambiata nella sostanza. Le ricerche sulla produzione, comprensione e acquisizione del linguaggio sono proseguite attivamente estendendosi ad altri fenomeni del linguaggio e accrescendo la loro sofisticazione metodologica, ma senza introdurre novità veramente significative e senza risolvere il conflitto tra le due posizioni teoriche illustrate sopra. Le principali aree di ricerca sono anch'esse rimaste le stesse: la percezione e la produzione del linguaggio parlato, la formazione delle parole (morfologia) e la natura del lessico mentale, la sintassi, il discorso formato da più frasi, inclusa la conversazione, la semantica e la conoscenza in quanto rappresentate nella mente, l'acquisizione del linguaggio nel bambino, i disturbi del linguaggio nell'adulto e nel corso dello sviluppo.
Alcuni aspetti innovativi della p. degli anni Ottanta rispetto a quella dei decenni precedenti hanno riguardato un maggiore interesse per la morfologia e il lessico (Laudanna e Burani 1993), oltre che per il linguaggio parlato rispetto a quello scritto (che tuttavia resta quello di fatto più studiato in p., nonostante i dubbi sull'applicabilità dei risultati ottenuti con il linguaggio scritto al linguaggio parlato), per la produzione rispetto alla comprensione linguistica e per la variabilità tra le diverse lingue. Inoltre, molte ricerche sono state dedicate a chiarire la natura dei compiti sperimentali usati nella disciplina (per es., il tempo necessario a decidere se una sequenza di lettere è una parola, oppure il tempo necessario per leggere ad alta voce una parola scritta), raffinando le metodologie di ricerca e scoprendo le possibilità e i limiti di ciascuna. Tuttavia, come si è già detto, le novità realmente significative sono state poche, in particolare dal punto di vista dei modelli teorici usati per interpretare in modo unitario dati empirici diversi. Questo rallentamento verificatosi nello sviluppo teorico della disciplina sembra essere dovuto a limiti intrinseci dei modelli usati, che da un lato non riescono a specificare in maniera sufficientemente dettagliata i processi che avverrebbero nella mente (cioè in una maniera che consentirebbe la loro simulazione su calcolatore) e dall'altro non entrano in vero e proprio contatto con la struttura e il modo di funzionare del sistema nervoso (Parisi e Burani 1988).
Il connessionismo e le reti neurali. - Il fatto nuovo degli anni Ottanta per la p. come per tutto lo studio della mente e del comportamento è stato invece l'emergere del connessionismo, cioè di un modello teorico che per certi aspetti si richiama al comportamentismo e alla linguistica strutturalista degli anni Cinquanta e dei decenni precedenti ma che per i molti suoi aspetti insoliti apre nuove prospettive per lo studio del comportamento in genere e di quello linguistico nel caso specifico (Rumelhart e McClelland 1986; Parisi 1989). Il connessionismo usa modelli simulati al calcolatore che sono ispirati alla struttura e al modo di funzionare del sistema nervoso (reti neurali, v. in questa Appendice). Una rete neurale è un insieme di unità simili ai neuroni il cui livello di attivazione in ogni determinato istante dipende dalle eccitazioni e dalle inibizioni che le giungono dalle altre unità con cui è collegata attraverso connessioni simili ai collegamenti sinaptici tra neuroni. Dato un pattern di valori di attivazione sulle unità d'ingresso (input) della rete, l'attivazione si propaga fino a giungere alle unità di uscita (output). I patterns d'ingresso codificano, per es., stimoli sensoriali, e i patterns di uscita codificano comportamenti motori. Quindi le capacità vengono analizzate come il saper rispondere con patterns di uscita appropriati ai patterns in ingresso che di volta in volta giungono alla rete.
Il modo con cui una rete neurale risponde all'input dipende dai ''pesi'' sulle sue connessioni, cioè dai valori quantitativi (positivi=eccitazioni; negativi=inibizioni) che determinano quanta attivazione si propaga attraverso una certa connessione. Ma il connessionismo è fondamentalmente una teoria dello sviluppo, cioè si richiama a un'epistemologia genetica simile a quella di Piaget secondo cui per capire X è necessario capire come X si è sviluppato, come è diventato X a partire da qualcosa che non era X. Una rete neurale non viene programmata da un essere umano (il quale peraltro avrebbe molte difficoltà a trovare i pesi appropriati per una rete anche di piccole dimensioni), ma si ''autoprogramma''. In concreto, i modelli connessionisti tendono a essere modelli dell'apprendimento. Quello che una rete apprende sono i pesi giusti che debbono avere le sue connessioni in modo da poter rispondere nel modo desiderato ai patterns d'ingresso. La rete parte da pesi scelti a caso e man mano, in funzione dell'esperienza, li modifica in modo che alla fine siano quelli giusti. Così, la rete viene a possedere una capacità che all'inizio non possedeva.
I modelli connessionisti hanno in comune con il comportamentismo l'idea che l'associazione (eccitazione/inibizione tra neuroni) sia un meccanismo di base della mente e del cervello ma, come si è detto, hanno anche molte caratteristiche che li rendono nuovi e promettenti. Una differenza essenziale rispetto all'associazionismo classico è che i modelli connessionisti sono modelli distribuiti e non localistici. Nei modelli localistici dell'associazionismo tradizionale un'entità psicologica (un concetto, una parola, un oggetto percepito o una sua proprietà, ecc.) è rappresentata da una singola unità del modello. Invece, nei modelli distribuiti del connessionismo un'entità psicologica è rappresentata da un particolare pattern di attivazione di un intero insieme di unità, e più entità diverse possono essere rappresentate da patterns diversi sulle stesse unità. Le associazioni quindi si stabiliscono tra interi patterns di attività, e questo consente di spiegare con naturalezza una serie di importanti proprietà della cognizione, come la capacità di generalizzare a casi nuovi, la capacità di scoprire analogie tra cose diverse, la capacità di ricostituire un tutto a partire da alcune sue parti, l'importanza dell'organizzazione tra le parti, e non delle sole parti prese isolatamente, nel determinare le proprietà di un tutto. In effetti, queste caratteristiche del connessionismo lo riavvicinano alla scuola psicologica storicamente avversaria del comportamentismo, cioè alla psicologia della forma (Gestalt).
Altro elemento di novità dei modelli connessionisti è il loro applicarsi simultaneamente al comportamento e alla mente, da un lato, e al sistema nervoso, dall'altro. Il connessionismo avanza seriamente la proposta di fondere scienze della mente (psicologia, linguistica) e scienze del sistema nervoso (neuroscienze) usando gli stessi concetti, modelli e metodi per studiare entrambi. Infine, il connessionismo usa la simulazione sul calcolatore come metodologia standard di ricerca, cioè come terzo grande strumento della scienza accanto al metodo sperimentale e all'elaborazione di teorie.
Il connessionismo è stato applicato all'analisi di alcune capacità linguistiche e queste ricerche hanno dato alcuni importanti risultati circa le questioni dibattute tradizionalmente nell'ambito della psicolinguistica. Sejnowski e Rosenberg (1987) hanno simulato con una rete neurale la capacità di leggere ad alta voce, cioè di trasformare una sequenza di lettere (input) nell'appropriata sequenza di fonemi (output), e lo hanno fatto per una lingua come l'inglese in cui la corrispondenza lettere/fonemi è tutt'altro che univoca. Dopo essere stata opportunamente addestrata, la rete neurale è in grado di leggere correttamente le parole sulle quali è stata addestrata ma anche parole nuove, mai incontrate durante l'addestramento. Questa ricerca dimostra alcune delle principali caratteristiche dei modelli connessionistici, e cioè la loro idoneità ad apprendere capacità complesse e di generalizzare a casi nuovi, e la possibilità di apprendimenti complessi basati sull'auto-organizzazione della rete in funzione delle regolarità che essa scopre nell'esperienza ma senza preesistenti postulazioni e codifiche all'interno del modello di entità (per es. i fonemi) o di regole (per es. regole di corrispondenza lettere/fonemi).
Rumelhart e McClelland (1986) e poi altri autori (per es. Plunkett e Marchmann 1991) hanno studiato l'apprendimento, da parte di una rete neurale, della capacità di fare il passato dei verbi inglesi. La rete riceve in ingresso una codifica della radice di un verbo e dà in uscita la forma corretta del passato del verbo. Nei bambini si assiste a tre fasi successive nell'apprendimento di questa capacità. In una prima fase, i verbi irregolari vengono prodotti correttamente (go/went) insieme a quelli regolari (work/worked). In una seconda fase, i verbi irregolari vengono regolarizzati in base alla regola ''aggiungi ed alla radice del verbo'' producendo errori (go/goed). In una terza fase, infine, sia i verbi regolari che quelli irregolari vengono prodotti correttamente. La spiegazione tradizionale di questa successione di fasi è che il passato di tutti i verbi, regolari e irregolari, viene prodotto nella prima fase come apprendimento che riflette meccanicamente l'esperienza del bambino (il linguaggio parlato dagli adulti e ascoltato dal bambino). Nella seconda fase il bambino scopre la regola dei verbi regolari (v. sopra) e la applica indistintamente a tutti i verbi. Nella terza fase, il bambino definisce meglio il campo di applicabilità della regola, restringendola ai verbi regolari mentre i verbi irregolari richiedono, a seconda della classe di verbi, o regole diverse o un apprendimento caso per caso. La simulazione con reti neurali di questi apprendimenti mostra che una rete neurale passa anch'essa attraverso queste tre fasi senza che sia necessario postulare l'esistenza di regole e la scoperta e l'incorporamento di tali regole come base per generare un certo comportamento. Il comportamento linguistico del bambino nelle diverse fasi dello sviluppo riflette semplicemente l'accumularsi dell'esperienza, la frequenza delle varie classi di verbi incontrati in tale esperienza, il grado di somiglianza fisica (fonologica) tra i verbi appartenenti alle varie classi, e l'organizzazione interna che si sviluppa inevitabilmente in un sistema del tipo rete neurale (il sistema nervoso del bambino) come risultato di tale esperienza.
Elman (1990) ha mostrato in altre simulazioni come sia possibile l'emergere di categorie linguistiche astratte (per es. verbo o nome) in sistemi che sono esposti al linguaggio parlato nel loro ambiente, senza che sia necessario postulare che tali categorie siano esplicitamente rappresentate nel sistema e siano ''innate'', cioè preesistenti all'apprendimento. La rete neurale in questo caso riceve in ingresso una parola di un ''testo'' (le sequenze di parole udite nell'ambiente) e deve produrre in uscita la parola successiva del testo. Per poter riuscire in questo compito la rete, venendo esposta ripetutamente a una varietà di testi, impara a classificare le parole in categorie generali (peraltro dai confini meno definiti di quanto postulato dalla linguistica) caratterizzate dai particolari contesti in cui compaiono. Questo avviene all'interno della rete come risultato automatico dell'esposizione della rete al linguaggio e dei suoi tentativi di ''predire'' la parola successiva a ogni parola udita.
Un'altra direzione importante delle ricerche connessioniste sul linguaggio ha riguardato i disturbi linguistici (cfr. Hinton e Shallice 1991). Proprio in quanto modelli ispirati al sistema nervoso, dalle reti neurali ci si aspettano comportamenti interessanti quando la rete, dopo aver appreso un compito, viene ''lesionata'' in vari modi (per es., eliminando una o più unità insieme alle loro connessioni). In effetti i comportamenti di una rete lesionata riproducono in modo spesso sorprendentemente fedele i deficit osservati nei pazienti che hanno disturbi nella lettura e in altre capacità linguistiche. Altrettanto interessanti sono le corrispondenze osservate tra reti neurali lesionate a vari stadi successivi nel loro apprendimento di una qualche capacità linguistica (per es. la produzione del passato dei verbi; v. sopra) e determinati disturbi linguistici che caratterizzano lo sviluppo linguistico (Marchmann 1993).
Questi risultati ottenuti con i modelli connessionisti applicati al linguaggio dimostrano che le analisi della p. chomskiana e cognitivista, finora dominanti, non sono le uniche in grado di dar conto delle capacità linguistiche e del loro sviluppo. Tuttavia, la p. connessionista fino a oggi ha dato l'impressione di volersi limitare a dare risposte diverse alle stesse domande che venivano poste dalla p. precedente. Invece, il connessionismo sembra essere destinato a cambiare le stesse domande sul linguaggio che vengono considerate importanti per capirne la natura. Per es., è necessario spiegare come sistemi privi di linguaggio (gli animali antenati della specie umana) possano trasformarsi nel tempo e diventare sistemi dotati di linguaggio (evoluzione delle capacità linguistiche), oppure come il linguaggio (o meglio, una particolare lingua) venga trasmesso da una generazione alla successiva, con possibili cambiamenti a lungo termine (trasmissione e cambiamento linguistico), oppure come il linguaggio influenzi le altre attività cognitive, da un lato, e il coordinamento sociale, dall'altro.
Un importante passo avanti in questa direzione è rappresentato dall'approccio ecologico alle reti neurali e dall'inserimento delle reti neurali in un progetto più ampio di studio del comportamento (algoritmi genetici, vita artificiale, sistemi dinamici complessi) che va al di là della psicologia. L'approccio ecologico considera una rete neurale come un modello del sistema nervoso di un organismo che vive in un ambiente anch'esso simulato nel calcolatore. L'ambiente è naturale e sociale, cioè contiene oggetti e altri organismi con i quali l'organismo artificiale interagisce. Esistono intere popolazioni di reti neurali che si riproducono in tale ambiente dando luogo a processi di evoluzione biologica e, in alcune specie di organismi, anche di evoluzione culturale. In questo quadro il comportamento linguistico può essere simulato e studiato con riferimento all'ambiente reale in cui viene usato e si sviluppa, e non solo alle condizioni artificiali di un compito di laboratorio, come avviene in molte simulazioni connessioniste riguardanti il linguaggio. Potrà essere possibile così affrontare con le simulazioni connessioniste aspetti e problemi riguardanti il linguaggio, che pur essendo di fondamentale importanza per capirne la natura e il ruolo nel comportamento umano sono stati finora tenuti in disparte dalla ricerca psicolinguistica di questi ultimi decenni.
Un aspetto importante di questo approccio più ampio allo studio connessionista del linguaggio è rappresentato dall'applicazione degli algoritmi genetici a popolazioni di reti neurali. In questo caso le reti neurali sono usate non (solo) come modelli dell'apprendimento individuale ma (anche) come modelli dell'evoluzione di intere specie di organismi. Come le reti neurali sono ispirate al sistema nervoso, così gli algoritmi genetici sono ispirati all'evoluzione biologica per selezione naturale (Darwin). Un algoritmo genetico è un altro modo per trovare i pesi giusti per le connessioni di una rete neurale. Si parte da una popolazione di reti neurali con pesi scelti a caso, per cui ogni rete sarà diversa da ogni altra rete. Le reti che hanno i pesi migliori e che quindi si comportano meglio rispetto a un dato compito (rispondere agli input con gli output giusti) vengono fatte riprodurre, cioè generano una o più copie dei propri pesi, mentre le altre reti scompaiono senza lasciare ''figli''. I figli sono simili ma non identici ai loro genitori in quanto sono nuove combinazioni di parti provenienti da due reti-genitori (riproduzione sessuata), e in ogni caso mutazioni casuali possono cambiare alcuni pesi. Le novità migliorative vengono conservate dalla riproduzione selettiva, mentre quelle peggiorative non si riproducono e vengono scartate. Alla fine, dopo un certo numero di ''generazioni'', le reti avranno i pesi giusti per svolgere il compito desiderato. L'evoluzione che si osserva in popolazioni di reti neurali che si riproducono selettivamente e con mutazioni lascia una traccia nel ''patrimonio genetico'' con cui nasce ogni rete e che è ereditato dai ''genitori'' della particolare rete. Questa metodologia crea le condizioni per uno studio simulativo e per un effettivo test empirico delle ipotesi riguardanti le possibili basi innate delle capacità linguistiche, la natura di queste basi (per es., se esse sono specifiche per le capacità linguistiche o sono condivise da molte capacità cognitive tra cui quelle linguistiche), e il ruolo dell'esperienza linguistica che agisce in interazione con queste basi innate.
Naturalmente, le componenti biologiche (genetiche) sono solo alcune delle componenti che entrano nel determinare la natura e l'acquisizione delle capacità linguistiche. Una lingua particolare è fondamentalmente un insieme di conoscenze trasmesse culturalmente, cioè tramite l'imitazione e l'apprendere dagli altri, anche se alcuni principi fondamentali che governano la natura di queste conoscenze appaiono universali e aventi una base innata. La trasmissione culturale del linguaggio da una generazione alla successiva e le modifiche che possono intervenire in tale trasmissione (cambiamento storico delle lingue) sono rimaste finora dominio esclusivo dell'antropologia e della linguistica storica senza coinvolgere in alcun modo la psicolinguistica. Alcune ricerche recenti indicano che questo stato di cose può essere destinato a cambiare all'interno di una p. di tipo connessionista. Sono stati proposti modelli dell'imitazione che consentono di affrontare la trasmissione culturale in popolazioni di reti neurali (possibilmente insieme e in interazione con la trasmissione genetica; v. sopra) e sono state compiute simulazioni che, usando questi modelli, cominciano a riprodurre determinati fenomeni di cambiamento linguistico.
Bibl.: N.A. Chomsky, Syntactic structures, L'Aia 1957 (trad. it., Bari 1970); U. Neisser, Cognitive psychology, New York 1967 (trad. it., Milano 1976); E. Bates, B. McWhinney, Functionalist approaches to grammar, in Language acquisition: the state of the art, a cura di E. Wanner, L.R. Gleitman, Cambridge 1982; D.E. Rumelhart, J.L. McClelland, On learning the past tense of English verbs, in Parallel distributed processing. Explorations in the microstructure of cognition, a cura di D.E. Rumelhart, J.L. McClelland, Cambridge (Mass.) 1986 (trad. it., PDP. Microstruttura dei processi cognitivi, Bologna 1991); T.J. Sejnowski, C.R. Rosenberg, Parallel networks that learn to pronounce English text, in Complex Systems, 1 (1987), pp. 145-68; R.W. Langacker, Foundations of cognitive grammar, Stanford 1987; M.K. Tanenhaus, Psycholinguistics: an overview, in Linguistics: the Cambridge survey, III. Language; psychological and biological aspects, a cura di F.J. Newmeyer, Cambridge 1988; D. Parisi, C. Burani, Observations on theoretical models in neuropsychology of language, in Perspectives on cognitive neuropsychology, a cura di G. Denes, P. Bisiacchi, Hillsdale (New Jersey) 1988; D. Parisi, Intervista sulle reti neurali, Bologna 1989; J.L. Elman, Finding structure in time, in Cognitive Science, 14 (1990), pp. 179-211; K. Plunkett, V. Marchmann, U-shaped learning and frequency effects in a multi-layered perceptron: implications for child language acquisition, in Cognition, 38 (1991), pp. 43-102; G.E. Hinton, T. Shallice, Lesioning an attractor network: investigations of acquired dislexia, in Psychological Review, 98 (1991), pp. 74-95; R.G. Reilly, N.E. Sharkey, Connectionist approaches to natural language processing, Hillsdale (New Jersey) 1992; Il Lessico. Processi e rappresentazioni, a cura di A. Laudanna e C. Burani, Bologna 1993; V. Marchmann, Constraints on plasticity in a connectionist model of the English past tense, in Journal of Cognitive Neuroscience, 5 (1993), pp. 215-34.