La grande scienza. Scienza cognitiva
Scienza cognitiva
Nella seconda metà del XX sec. le ricerche riguardanti il comportamento umano sono state effettuate in gran parte nell'ambito di un nuovo approccio interdisciplinare denominato scienza cognitiva (Posner 1989). Essa è nata con la 'rivoluzione cognitiva' che alla fine degli anni Cinquanta del secolo scorso ha soppiantato l'allora dominante comportamentismo. Tale scuola psicologica riteneva scientificamente legittimo, nello studio del comportamento umano, fare riferimento soltanto a entità direttamente osservabili come sono gli stimoli che giungono a un organismo e le risposte con cui esso reagisce a tali stimoli, ignorando, ossia trattando come un'impenetrabile 'scatola nera', quello che vi è e che accade tra gli stimoli e le risposte, e non è direttamente osservabile (fig. 1). La 'rivoluzione cognitiva' ha capovolto questa posizione affermando che la 'scatola nera' andava aperta e che il compito fondamentale della scienza del comportamento era quello di guardare al suo interno, scoprire quello che c'è tra gli stimoli e le risposte e spiegare perché a un certo stimolo l'organismo dà una certa risposta.
Esistono due definizioni di scienza cognitiva, una debole e una forte. Secondo la definizione debole, la scienza cognitiva è un approccio interdisciplinare allo studio del comportamento umano che chiama in causa in un modo o nell'altro il computer. Questa definizione, nella quale tutti quelli che affermano di essere scienziati cognitivi in qualche modo si riconoscono, è piuttosto generica in quanto non dice né quali specifiche discipline collaborano tra loro all'interno dell'impresa della scienza cognitiva né quale sia esattamente il ruolo del computer in essa. L'altra definizione, quella forte, prende posizione riguardo alle specifiche discipline che contribuiscono all'approccio interdisciplinare della scienza cognitiva e individua con precisione quale sia il ruolo che vi svolge il computer. Se si adotta una definizione forte tuttavia, è necessario riconoscere che oggi esistono due diverse, e sostanzialmente contrapposte, concezioni della scienza cognitiva o, addirittura, due diverse scienze cognitive: la scienza cognitiva computazionale e la scienza cognitiva neurale. La prima ha dominato la scena fino agli anni Ottanta del secolo scorso; la scienza cognitiva neurale è invece emersa nella seconda metà degli anni Ottanta e oggi si contrappone con crescente forza a quella computazionale.
Come si è detto, il comportamentismo riteneva che le esigenze della scienza imponessero che nello studio del comportamento ci si limitasse a parlare di entità direttamente percepibili e misurabili quali sono gli stimoli che entrano in un organismo e le risposte che ne escono, mentre era esclusa la possibilità di usare concetti che fanno riferimento a entità 'mentali' interne, e come tali non direttamente osservabili, quali per esempio rappresentazioni, credenze, scopi e intenzioni. In quanto non direttamente osservabili, le entità 'mentali' tendono a essere soggettive, mal definite, inverificabili, e quindi scientificamente non legittime. Per tutta la prima metà del XX sec. il comportamentismo ha dominato la ricerca sul comportamento negli Stati Uniti, e se alla fine degli anni Cinquanta in quello stesso paese è stato possibile quel cambiamento radicale e rapido di prospettive che è stata la 'rivoluzione cognitiva' anticomportamentista, la spiegazione va cercata nell'avvento del computer. Negli anni Cinquanta i computer erano ancora pochi, ingombranti, lenti e costosi, ma le idee che sono alla base del computer e dell'informatica erano già state sviluppate da logici e matematici nei decenni precedenti. Il computer è una macchina che 'computa', vale a dire che opera su simboli in base a regole o istruzioni anch'esse espresse mediante simboli. Le operazioni che il computer compie sui simboli (recuperarli dalla 'memoria', confrontarli tra loro, modificarli, formare nuovi simboli combinando quelli più elementari, ecc.) sono formali o, detto in altro modo, sintattiche, ossia operazioni che tengono conto soltanto della forma fisica dei simboli, non del loro significato. La 'rivoluzione cognitiva' è stata possibile poiché la 'mente', cioè quello che per la scienza cognitiva computazionale era il contenuto della 'scatola nera', è stata assimilata a un computer, vale a dire a un sistema che opera formalmente su simboli in base a regole anch'esse espresse mediante simboli. L'idea che la mente sia un computer, oppure sia simile nel suo modo di operare a un computer, ha reso scientificamente legittimo aprire la 'scatola nera' e usare concetti mentalistici per spiegare il comportamento. Ciò che permette a un computer di funzionare, il suo software, è studiato da una disciplina, l'informatica, che non ha nulla da invidiare, quanto a rigore, precisione, oggettività, alle rigorose e precise scienze della Natura. Se, sulla base dell'analogia tra la mente e il software di un computer, i concetti mentalistici con i quali viene interpretato e spiegato il comportamento sono traducibili nei concetti dell'informatica, allora è possibile andare al di là degli stimoli e delle risposte, aprire la 'scatola nera' e descrivere il suo contenuto restando nei limiti di una scienza rigorosa (fig. 2).
La visione computazionale della mente (Fodor e Katz 1964; Johnson-Laird 1988) è stata abbracciata da diverse discipline, in particolar modo da ampi settori della psicologia, ossia dalla tradizionale scienza del comportamento e della mente, dalla linguistica formale a cui negli stessi anni Cinquanta dava l'avvio Noam A. Chomsky, e naturalmente dall'informatica. Sono state queste tre discipline che, condividendo l'analogia mente uguale computer, hanno dato vita alla scienza cognitiva computazionale. La psicologia, nata come scienza nella seconda metà dell'Ottocento, per il fatto di aver adottato lo stesso metodo degli esperimenti di laboratorio che era stato così utile per lo sviluppo delle scienze della Natura, ha trovato nell'analogia tra la mente e il computer la possibilità di dare legittimità scientifica ai concetti mentalistici con cui da sempre, con la sola eccezione del comportamentismo, essa interpreta e spiega il comportamento. La linguistica chomskiana condivideva molte assunzioni dell'informatica, per esempio quella riguardante il carattere 'sintattico' delle regole che governano il comportamento linguistico e la stessa idea che la capacità linguistica possa essere descritta come insieme di regole che operano su simboli. L'informatica, infine, era interessata alla collaborazione con psicologi e linguisti in quanto non soltanto forniva loro i concetti e i modelli teorici con cui interpretare la mente e il linguaggio, ma aspirava, con l'intelligenza artificiale, a dotare il computer delle stesse capacità cognitive degli esseri umani. Il punto di massima convergenza interdisciplinare della nuova scienza della mente era la psicolinguistica, che cercava nel laboratorio sperimentale degli psicologi la verifica dei modelli del linguaggio ispirati al computer e all'informatica proposti dai linguisti chomskiani.
La definizione forte della scienza cognitiva computazionale è pertanto quella di un approccio interdisciplinare allo studio del comportamento umano che prevede un ruolo centrale di tre discipline, la psicologia, la linguistica formale e l'informatica, e che considera il computer come un 'modello' della mente. Questa scienza cognitiva è stata molto produttiva, soprattutto fino agli anni Ottanta ma anche successivamente, ed è riuscita a sfruttare molto bene i vantaggi della 'fecondazione' reciproca tra le diverse discipline che la costituivano. In particolare, in psicologia è cresciuta considerevolmente la nostra conoscenza del linguaggio e delle altre capacità cognitive superiori, cioè il pensiero, il ragionamento, l'organizzazione delle conoscenze, l'attività di pianificare e decidere azioni. Inoltre, dietro la spinta dell'ipotesi chomskiana di una forte e specifica base innata (genetica) non solo del linguaggio ma anche di altre capacità cognitive umane, si sono ottenuti numerosi risultati e molte conoscenze nuove sulle capacità cognitive del bambino in età infantile, quando l'esperienza e l'apprendimento non hanno avuto ancora tempo sufficiente di agire in modo tale da giustificare una spiegazione di queste capacità unicamente sulla base dell'esperienza e dell'apprendimento (Posner 1989). La linguistica chomskiana ha fatto compiere notevoli progressi alla nostra conoscenza del linguaggio, sia perché ha portato alla scoperta di numerosi fatti empirici nuovi e di regolarità in essi non ancora messe in luce dalla ricerca linguistica precedente, sia perché ha proposto teorie molto ambiziose e generali sulla natura della capacità linguistica, o almeno della sua componente sintattica, che cercano di individuarne le radici più profonde e universali. Infine l'intelligenza artificiale, cioè il tentativo di programmare i computer in modo tale che essi dimostrino di possedere capacità cognitive e linguistiche simili a quelle umane, per molto tempo è stata una fonte di idee e di modelli interessanti e creativi sulla natura dell'intelligenza nelle sue diverse manifestazioni (Rich 1983).
Molto importante è stata anche l'influenza della scienza cognitiva computazionale su altre discipline, in particolare su quelle che studiano le società umane. Sono nate antropologie, sociologie ed economie cognitive, ossia tentativi di dar conto in termini computazionali e di 'elaborazione dell'informazione' del comportamento degli individui che collettivamente producono i fenomeni culturali, sociali e economici. Inoltre la scienza cognitiva computazionale ha avuto un'influenza anche sullo studio del comportamento degli animali, che nella prima metà del XX sec. era stato campo di ricerca quasi esclusivo dei comportamentisti, dando luogo alla nascita di una etologia cognitiva.
Altrettanto importante è stato l'impatto culturale generale della scienza cognitiva computazionale, che può essere con qualche giustificazione considerata uno dei contributi più significativi del XX sec. alla storia intellettuale dell'Occidente. L'idea che la mente sia come un computer, o sia un computer, suggerisce una visione generale dell'uomo che ha avuto precedenti nella storia della filosofia occidentale ma che solo con il computer ha potuto ottenere la credibilità e il prestigio della scienza (e della tecnologia).
Per aver chiara l'importanza culturale e filosofica di questa idea, bisogna riflettere sul fatto che l'avvento del computer ha determinato una modificazione del concetto di macchina. Prima del computer una macchina era qualcosa che possedeva due proprietà: la meccanicità e la naturalità. Una macchina era innanzi tutto qualcosa di meccanico, ossia di prevedibile, attendibile, controllabile, fatta di parti il cui ruolo nel funzionamento complessivo poteva essere facilmente identificato e descritto. In secondo luogo una macchina era qualcosa che poteva e doveva essere descritto e spiegato con gli strumenti concettuali delle scienze naturali (fisica, chimica e biologia). La scienza e la tecnologia che precedono il computer trovavano ovviamente esempi di tali macchine negli artefatti tecnologici, ma anche in sistemi naturali come il Sistema solare o il corpo umano. Con l'avvento del computer il concetto di macchina è cambiato: ha mantenuto la proprietà della meccanicità ma ha perduto quella della naturalità. L'hardware del computer è una macchina nel senso tradizionale di questa parola, quindi qualcosa che è sia meccanico sia naturale; il software, l'insieme di dati e istruzioni che 'girano' nel computer e lo fanno funzionare fornendo i risultati desiderati, è invece una macchina in quanto è prevedibile, attendibile, controllabile, e fatto di parti che hanno un ruolo nel funzionamento complessivo che può essere identificato e descritto, ma non lo è più in quanto non può essere capito, analizzato e spiegato mediante i concetti e le leggi delle scienze della Natura. La logica e l'informatica sono le scienze del software, scienze che, pur avendo lo stesso rigore di quelle della Natura, sono concettualmente del tutto indipendenti da esse. L'assunzione che è alla base della scienza cognitiva computazionale, vale a dire che la mente degli esseri umani sia (come il software di) un computer, se da un lato fornisce una base rigorosa all'idea che la mente sia una macchina, dall'altro, innovando nel modo che abbiamo visto il concetto tradizionale di macchina, non include né la mente nella Natura né la scienza della mente in quelle della Natura (Parisi 1999).
In realtà la scienza cognitiva computazionale non fa che ribadire e dare una base rigorosa al tradizionale dualismo che caratterizza la concezione occidentale dell'uomo, secondo la quale egli è due cose, corpo e mente, ed è dentro la Natura in quanto corpo, ma ne è fuori in quanto mente. L'analogia tra la mente e il computer, che è alla base di questa scienza cognitiva, dà nuova forza a questo dualismo. Il computer è incontrovertibilmente una macchina dualistica: mentre lo hardware rientra nel dominio concettuale e nelle possibilità di spiegazione delle scienze naturali, il software rientra nel dominio concettuale e nelle possibilità di analisi e spiegazione della nuova scienza informatica che, come si è detto, è concettualmente autonoma dalle scienze naturali. Se il computer è una macchina dualistica, e gli esseri umani sono computer, allora anche gli esseri umani sono macchine dualistiche. Il loro hardware è il corpo, il loro software è la mente. In entrambi i casi si tratta di macchine nel senso della prima delle proprietà delle macchine, la meccanicità. Tuttavia, mentre il corpo degli esseri umani è legittimamente studiato dalle scienze della Natura, la loro mente non può essere analizzata e spiegata con gli strumenti concettuali di tali scienze, e richiede una disciplina che sia autonoma da esse. In questo modo la scienza cognitiva computazionale non solo rafforza il tradizionale dualismo mente/corpo conferendogli il prestigio del computer e della tecnologia, ma riesce a ritagliarsi una totale e perdurante autonomia e indipendenza di fronte all'avanzare delle scienze della Natura.
Come si è detto, la scienza cognitiva computazionale ha avuto il suo periodo di massima fortuna fino alla metà degli anni Ottanta, quando in pratica era la sola variante di scienza cognitiva esistente. In psicologia la visione computazionale della mente, che costituisce la base della psicologia cognitiva o cognitivista, era riuscita a marginalizzare tutte le scuole psicologiche che avevano dominato lo studio del comportamento nella prima metà del XX sec., e cioè non solo il comportamentismo, ma anche la psicologia della Gestalt e la psicologia di Jean Piaget. In linguistica le teorie chomskiane, pur modificandosi nel tempo, hanno mantenuto un'evidente superiorità in termini di raffinatezza e rigore teorico non solo nei confronti della linguistica tradizionale, descrittiva e storica, povera di modelli teorici forti, ma anche delle varianti di linguistica formale che cercavano, diversamente dalla linguistica chomskiana, di sostenere un più stretto legame tra componente sintattica e componente semantica all'interno del linguaggio e tra linguaggio e resto della mente. In informatica l'intelligenza artificiale, anche dietro la spinta di interessi pratici ed economici, ha continuato a esplorare nuovi aspetti e nuovi modelli della cognizione riproducibili al computer, con l'evidente vantaggio di aver trovato un modo diverso di studiare la mente.
Verso la metà degli anni Ottanta, tuttavia, la situazione è cambiata e ha cominciato a delinearsi la nuova scienza cognitiva neurale. La spinta iniziale è dovuta all'emergere di modelli del comportamento esplicitamente ispirati al sistema nervoso, in realtà già anticipati nei decenni precedenti, ma che le difficoltà tecniche e i successi dell'intelligenza artificiale e della scienza cognitiva computazionale avevano tenuto fino ad allora ai margini. Le reti neurali sono modelli simulativi (Parisi 2001), cioè espressi sotto forma di programmi che 'girano' in un computer, che riproducono, in maniera semplificata, le caratteristiche fisiche e il modo fisico di funzionare del sistema nervoso. Come il sistema nervoso è formato da cellule nervose, i neuroni, che hanno un livello di attivazione che cambia di momento in momento ed è influenzato dagli altri neuroni con i quali esistono collegamenti sinaptici eccitatori o inibitori, con una forza che può variare da sinapsi a sinapsi e che si modifica nel tempo dando luogo all'apprendimento, così una rete neurale (artificiale) è un insieme di unità collegate tra loro da connessioni eccitatorie o inibitorie attraverso le quali si propaga l'attivazione nella rete, ciascuna con un suo 'peso' quantitativo che può modificarsi con l'esperienza e l'apprendimento (Floreano 1996; Rumelhart e McClelland 1986).
La comparsa delle reti neurali e i primi successi ottenuti usando questi modelli nello studio di alcuni aspetti elementari del comportamento hanno portato a interrogarsi su tutti i principî che erano alla base della scienza cognitiva computazionale. Con le reti neurali emerge una nuova scienza cognitiva che condivide con quella cognitiva computazionale i due principî che definiscono la scienza cognitiva in senso debole: l'approccio interdisciplinare allo studio del comportamento e il coinvolgimento del computer in tale studio. Dal punto di vista di una definizione forte però, la scienza cognitiva neurale rappresentava qualcosa di molto diverso e, per alcuni aspetti fondamentali, opposto alla scienza cognitiva computazionale. Ciò risulta evidente se si passa dalla definizione debole a quella forte. Nella scienza cognitiva neurale il mix disciplinare è diverso da quello della scienza cognitiva computazionale. Mentre in quest'ultima le discipline che partecipano all'impresa interdisciplinare sono in primo luogo la psicologia cognitiva o cognitivista, la linguistica formale e l'informatica, nel caso della scienza cognitiva neurale il mix interdisciplinare comprende la psicologia tendenzialmente non cognitiva o cognitivista, le neuroscienze e la fisica-matematica. Anche il computer svolge un ruolo diverso nelle due scienze cognitive: in quella computazionale esso ha il ruolo di modello della mente, mentre in quella neurale rappresenta soltanto uno strumento di lavoro per far 'girare' le simulazioni che usano le reti neurali.
L'assunto di base della scienza cognitiva neurale è che la mente non è un computer, non è elaborazione dell'informazione oppure manipolazione di simboli sulla base di regole. La scienza cognitiva neurale condivide l'idea di base anticomportamentista della rivoluzione cognitiva degli anni Cinquanta: nello studio del comportamento non ci si può limitare a considerare gli stimoli e le risposte e a notare le regolarità che uniscono gli uni alle altre, ma è necessario andare a guardare quello che c'è tra gli stimoli e le risposte aprendo la 'scatola nera'. Tuttavia, mentre la scienza cognitiva computazionale aprendola trovava un computer, la scienza cognitiva neurale trova semplicemente il cervello. Per analizzare e spiegare il comportamento non bisogna postulare entità e processi mentali, anche se espressi come computazioni su simboli, ma è necessario semplicemente fare riferimento alle entità e ai processi che costituiscono il sistema nervoso e il suo funzionamento (fig. 3).
La scienza cognitiva neurale porta a compimento la rivoluzione che la psicologia aveva avviato alla fine dell'Ottocento con l'adozione del metodo sperimentale e che però aveva lasciato a metà nel corso di tutto il Novecento. Si può parlare di una rivoluzione lasciata a metà in quanto la psicologia ha adottato il metodo delle scienze naturali, cioè il metodo degli esperimenti di laboratorio, tuttavia continuando a usare un apparato concettuale e teorico diverso da quello delle scienze naturali. Esse considerano la realtà come costituita soltanto da effetti fisici di cause fisiche e nella quale ogni cosa ha una natura intrinsecamente, e fino in fondo, quantitativa. Per la psicologia, e ancora di più per la scienza cognitiva computazionale, la mente va invece analizzata e spiegata non come effetti fisici di cause fisiche di natura quantitativa, ma utilizzando concetti mentalistici di natura qualitativa o simboli e manipolazioni di simboli in base a regole, in entrambi i casi ignorando la base fisica della mente. La scienza cognitiva neurale completa la rivoluzione della psicologia in quanto adotta lo stesso apparato concettuale ed esplicativo delle scienze della Natura. In una rete neurale non vi sono e non avvengono altro che effetti fisici prodotti da cause fisiche e ogni cosa ha natura strettamente quantitativa. Per questo nel mix disciplinare della scienza cognitiva neurale scompaiono la linguistica formale e l'informatica e compaiono le neuroscienze e la fisica-matematica.
La contrapposizione tra scienza cognitiva computazionale e scienza cognitiva neurale emerge con chiarezza tornando ancora una volta al concetto di macchina. Per la scienza cognitiva computazionale la mente è meccanica, ma non è naturale. Al contrario, per la scienza cognitiva neurale la mente non è meccanica, cioè non è una macchina, ma è naturale, ossia deve essere studiata mediante l'apparato concettuale ed esplicativo delle scienze della Natura. Ciò è ovvia conseguenza del fatto che, come si è visto, i modelli teorici della scienza cognitiva neurale, le reti neurali, sono modelli direttamente ispirati alla struttura fisica e al modo di funzionare fisico del sistema nervoso, e nella spiegazione di qualunque comportamento o capacità non possono essere invocati altri concetti che non siano quelli previsti in tali modelli. Resta da chiarire perché per la scienza cognitiva neurale la mente (o, meglio, il sistema nervoso) non sia una macchina. Per spiegare questo punto è necessario fare riferimento a un importante sviluppo di portata generale della ricerca scientifica nel corso degli anni Novanta che sta avendo conseguenze in diverse discipline: lo studio dei sistemi complessi.
Secondo la visione tradizionale della scienza, la realtà è costituita da sistemi semplici. Un sistema semplice è formato da pochi elementi i quali si influenzano tra loro in modo lineare (cioè gli effetti di più cause si sommano tra di loro) e prevedibile. I sistemi semplici cambiano nel tempo in modo prevedibile, reagiscono a perturbazioni esterne in modo commisurato all'entità di tali perturbazioni, e quindi ancora una volta prevedibile, e possono essere studiati isolandoli dall''ambiente' in cui normalmente esistono e operano. Il metodo di ricerca empirica appropriato per i sistemi semplici è quello degli esperimenti di laboratorio, in quanto nel laboratorio sperimentale il ricercatore isola il fenomeno a cui è interessato dal suo contesto, manipola una o più condizioni che lo influenzano e si aspetta di poter prevedere le conseguenze di queste sue manipolazioni.
Negli ultimi due decenni è diventato invece sempre più chiaro, in una varietà di discipline, che una buona parte della realtà non funziona come un sistema semplice, ma ha piuttosto le caratteristiche di un sistema complesso. Questo è formato da un grande numero di elementi i quali interagiscono tra loro localmente (cioè ogni elemento interagisce solo con un numero in genere relativamente piccolo di altri elementi) e in modo altamente non lineare (le diverse cause non si sommano ma si moltiplicano tra di loro), con la conseguenza che da questo grande numero di interazioni locali emergono proprietà globali dell'intero sistema che non sono deducibili o prevedibili anche disponendo di una conoscenza perfetta degli elementi e delle leggi che regolano le loro interazioni. I sistemi complessi tendono ad avere caratteristiche opposte a quelle dei sistemi semplici. Essi cambiano nel tempo in modi imprevedibili, sono estremamente sensibili nella loro evoluzione temporale a differenze anche molto piccole nelle condizioni iniziali, reagiscono alle perturbazioni esterne in modi non commisurati all'entità delle stesse: perturbazioni anche forti vengono riassorbite dal sistema senza apparenti conseguenze e perturbazioni molto lievi possono avere conseguenze catastrofiche; essi, infine, non possono essere isolati dall''ambiente' in cui normalmente esistono in quanto lo influenzano costantemente e ne sono a loro volta influenzati. I sistemi complessi si presentano spesso in forma gerarchica, con molti elementi a un certo livello della gerarchia che, interagendo, vanno a costituire un singolo elemento del sistema esistente al livello immediatamente più alto della gerarchia. Mentre l'esperimento di laboratorio rappresenta il metodo d'elezione per lo studio dei sistemi semplici, quello per lo studio dei sistemi complessi è la simulazione con il computer (Parisi 2001).
La simulazione di un sistema complesso definisce una serie di elementi e le loro leggi di interazione e il ricercatore osserva le proprietà globali che emergono dalle innumerevoli interazioni tra gli elementi. In una simulazione il fenomeno di interesse non deve essere isolato dal suo normale contesto ('ambiente'), come invece accade nel laboratorio sperimentale, ma possono essere simulati sia il fenomeno sia il suo contesto. Inoltre le grandi capacità di memoria e di calcolo del computer permettono di simulare gerarchie di sistemi complessi che sarebbe impossibile studiare nel laboratorio sperimentale, in modo tale che quello che avviene a un livello più in alto nella gerarchia costituisce l'ambiente per quello che avviene a un livello più in basso, modificando così, in un processo causale a due vie, gli elementi del livello più basso.
L'avvento della scienza cognitiva neurale ha significato il passaggio da una visione della realtà come sistema semplice, che è ancora quella della scienza cognitiva computazionale, a una visione della realtà come sistema complesso. Una rete neurale, anche se costituita soltanto da poche decine di unità (a confronto con i molti miliardi di neuroni del sistema nervoso umano), è un sistema complesso in cui l'output della rete (il comportamento) è il risultato delle numerose interazioni non lineari tra le unità della rete. Un sistema complesso, però, non è una macchina, se per macchina si intende un sistema prevedibile, affidabile, controllabile, e costituito da parti il cui ruolo nel suo funzionamento complessivo può essere chiaramente identificato e descritto. Il concetto di macchina è legato alla visione della realtà come sistema semplice. Poiché i modelli teorici usati dalla scienza cognitiva neurale, le reti neurali, sono modelli di sistemi complessi, per la scienza cognitiva neurale ciò che sta dietro al comportamento non è una macchina, anche se deve essere studiato usando unicamente l'apparato concettuale ed esplicativo delle scienze naturali (Parisi 1999).
Nel corso degli anni Novanta del secolo scorso la scienza cognitiva neurale ha avuto importanti sviluppi che fanno intravedere una nuova scienza cognitiva per il XXI sec. destinata a modificare e ad ampliare considerevolmente le prospettive della scienza cognitiva neurale degli inizi, quella che si può chiamare classica. Si cercherà di identificare quali siano le caratteristiche della nuova scienza cognitiva che comincia ora a delinearsi.
Negli anni Novanta è emersa una nuova disciplina che ha preso il nome di vita artificiale. Essa si distingue dall'intelligenza artificiale perché, come risulta chiaramente dai termini usati, mentre quest'ultima aspira a riprodurre in un sistema artificiale le capacità che costituiscono l'intelligenza negli esseri umani, la vita artificiale mira a riprodurre in un sistema artificiale tutti i diversi fenomeni del mondo vivente (inclusi, eventualmente, quelli dell'intelligenza): origine della vita, evoluzione delle specie viventi, riproduzione, adattamento all'ambiente, comportamento e apprendimento negli organismi viventi, e così via. Le reti neurali della scienza cognitiva neurale sono modelli del sistema nervoso degli organismi viventi e quindi rientrano a pieno titolo nell'ambito della vita artificiale. Tuttavia, l'avvento della vita artificiale ha mostrato chiaramente che usare le reti neurali in una esplicita prospettiva di vita artificiale comporta alcune importanti differenze rispetto al modo 'classico' in cui esse erano usate all'inizio e ancora oggi continuano prevalentemente a esserlo (Nolfi e Floreano 2000; Parisi 1999).
1) Nell'ambito della vita artificiale le reti neurali sono viste più chiaramente come modelli di un sistema fisico, il sistema nervoso, mentre nell'approccio 'classico' le reti neurali tendono ancora a essere considerate quali sistemi computazionali o sistemi di elaborazione dell'informazione, anche se si afferma che lo 'stile' di computazione delle reti neurali è diverso dallo 'stile' di computazione dei sistemi della scienza cognitiva computazionale: parallelo anziché seriale, continuo anziché discreto, e così via. Con la vita artificiale diventano più chiari il distacco dal computazionalismo e l'adozione di uno schema di spiegazione naturalistico in base al quale ciò che avviene dentro una rete neurale non è altro che un insieme di cause fisiche che producono effetti fisici.
2) Diversamente dalle reti neurali classiche, le reti neurali della vita artificiale hanno un 'corpo'. Quello che viene simulato non è soltanto il sistema nervoso dell'organismo, ma anche il corpo dell'organismo, con la sua morfologia esterna e i suoi organi interni. Con la robotica biomorfa la vita artificiale riproduce con particolare realismo fisico la morfologia del corpo degli organismi (dimensioni, forma, effetti della gravitazione, aspetti meccanici, dinamici, di inerzia dei movimenti, ecc.), fino ad arrivare all'uso di veri e propri robot fisici, facendo emergere in questo modo con chiarezza quanto il comportamento degli organismi sia influenzato dalle caratteristiche fisiche del loro corpo e sia spiegabile in base a esse (Nolfi e Floreano 2000).
3) Nella vita artificiale le reti neurali esistono in un ambiente fisico, che viene simulato insieme alla rete neurale e al corpo dell'organismo o è addirittura un ambiente fisico reale quando si usano robot fisici e non simulati. Le reti neurali classiche esistono nel vuoto, o meglio in un 'ambiente' che è costituito dal ricercatore, che decide quali siano gli input che giungono dall'esterno alla rete neurale e valuta la validità degli output con cui la rete risponde agli input esterni. Le reti neurali della vita artificiale sono invece reti neurali ecologiche, ossia che vivono in un ambiente e interagiscono con esso. È l'ambiente che autonomamente invia input alla rete neurale e gli output della rete neurale danno luogo a modificazioni nell'ambiente o, quanto meno, nelle relazioni fisiche tra il corpo dell'organismo e l'ambiente. In questo modo è possibile studiare in che misura gli organismi viventi determinano loro stessi i propri input, invece di essere alla mercé di input che gli giungono dall'ambiente esterno e di non poter fare altro, quindi, che rispondere a essi in modo appropriato. Le reti neurali ecologiche permettono di studiare il comportamento come capacità di scegliersi i propri stessi input, cercando di ricevere dal mondo esterno input maggiormente informativi, da cui si può imparare di più, a cui si sa già come rispondere, e così via. Un'altra conseguenza dell'approccio ecologico alle reti neurali è che mentre le simulazioni che usano le reti neurali classiche tendono a riprodurre risultati di esperimenti di laboratorio, le simulazioni di vita artificiale tendono a riprodurre, pur con le necessarie semplificazioni, l'effettiva ecologia in cui vive una determinata specie di organismi, senza isolare l'organismo dal suo ambiente, come succede necessariamente negli esperimenti di laboratorio.
Ciò ha due conseguenze importanti, innanzi tutto le simulazioni di vita artificiale appaiono maggiormente appropriate per studiare sistemi complessi quali il sistema nervoso di un organismo, la popolazione di cui il singolo individuo è membro e l'insieme costituito dalla popolazione e dall'ambiente in cui essa vive, dato che, come si è detto, i sistemi complessi sono difficilmente analizzabili isolandone gli elementi tra loro e dal loro ambiente. La seconda conseguenza riguarda il fatto che ciò che caratterizza il comportamento di organismi anche semplici è l'autonomia, cioè la possibilità di comportarsi in modi che dipendono da meccanismi e stati interni piuttosto che da cause e istruzioni esterne. In un esperimento di laboratorio, che si fonda sul controllo da parte dello sperimentatore delle variabili che determinano i fenomeni osservati, il primo compito per lo sperimentatore è assoggettare il comportamento del 'soggetto' alle sue istruzioni, togliendogli ogni forma di spontaneità e autonomia. Le simulazioni che usano le reti neurali classiche, tendendo a riprodurre risultati di esperimenti di laboratorio piuttosto che comportamenti esibiti in condizioni di vita reale, hanno il limite di non poter cogliere la dimensione di spontaneità e autonomia che è così importante nel comportamento degli organismi, mentre le simulazioni con le reti neurali ecologiche della vita artificiale appaiono in grado, pur nelle forme semplificate che caratterizzano le simulazioni, di cogliere tale dimensione.
4) Mentre le reti neurali classiche nascono come una tabula rasa e acquisiscono i comportamenti solo attraverso l'apprendimento, nella vita artificiale un organismo non ha soltanto una rete neurale e un corpo ma anche un materiale genetico ereditato dai propri genitori. Tale materiale genetico, o genotipo, determina alcune delle caratteristiche di fondo dell'organismo, incluso il suo sistema nervoso e quindi il suo comportamento. Nel corso della vita dell'organismo, le caratteristiche di quest'ultimo si modificano in funzione sia del genotipo ereditato dai genitori sia delle esperienze che il particolare individuo fa nel particolare ambiente in cui gli capita di vivere. Ciò permette alle reti neurali, viste in una prospettiva di vita artificiale, di studiare i diversi tipi di cambiamento che avvengono nel corso della vita dell'individuo, da quelli in cui prevale il ruolo del materiale genetico ereditato (maturazione), a quelli in cui materiale genetico ed esperienza hanno entrambi un ruolo importante (sviluppo) e a quelli in cui l'esperienza ha un ruolo prevalente (apprendimento).
5) Le simulazioni della vita artificiale non studiano un singolo individuo (una singola rete neurale), come avviene nel caso delle reti neurali classiche, ma popolazioni di individui, uno diverso dall'altro. Gli individui nascono, si sviluppano, si riproducono e muoiono. La nascita di un individuo significa che viene creato un nuovo individuo che eredita il genotipo dei suoi due genitori, o del singolo genitore se la riproduzione è per clonazione. La riproduzione è selettiva o differenziale, il che significa che un individuo può avere più figli rispetto a un altro o addirittura nessun figlio, ed è accompagnata da mutazioni casuali (mutazioni genetiche) che modificano alcune parti del genotipo ereditato. L'effetto della riproduzione selettiva e della costante aggiunta di nuove varianti alla popolazione come conseguenza della ricombinazione dei genotipi nella riproduzione sessuale e delle mutazioni casuali, è che il pool genetico della popolazione cambia nel succedersi delle generazioni dando luogo all'evoluzione biologica. In questo modo la vita artificiale può studiare due diversi tipi di cambiamenti che si verificano negli organismi viventi: i cambiamenti che avvengono nel corso della vita dell'individuo (maturazione, sviluppo, apprendimento) e i cambiamenti evolutivi che avvengono a livello dell'intera popolazione; inoltre può studiare le interazioni che esistono tra questi due tipi di cambiamenti, dal momento che per esempio l'evoluzione crea le precondizioni e i vincoli per ciò che viene appreso nel corso della vita dell'individuo e a loro volta le tappe dello sviluppo dell'individuo condizionano le direzioni che può prendere l'evoluzione a livello della popolazione (Mitchell 1996; Elman et al. 1996).
6) In una simulazione di vita artificiale molti individui possono vivere insieme nello stesso ambiente e in questo modo possono influenzarsi a vicenda attraverso l'interazione sociale, la comunicazione e il trasferimento di risorse che vengono cedute da un individuo a un altro. Ciò apre alla vita artificiale prospettive di ricerca non più soltanto nel campo delle scienze biologiche (genetica, evoluzione, biologia dello sviluppo, neuroscienze, ecc.), ma anche nel campo delle scienze sociali. Se una rete neurale apprende durante la vita i propri comportamenti copiandoli da un altro individuo e se questo avviene da una generazione alla successiva, le simulazioni di vita artificiale possono studiare anche la trasmissione e il cambiamento culturale, e non più soltanto la trasmissione e l'evoluzione biologica. Anche in tale caso operano meccanismi di riproduzione o trasmissione selettiva (dei comportamenti e degli artefatti tecnologici prodotti dagli organismi) e inoltre nuove varianti al pool culturale di un gruppo sociale, che determinano il cambiamento culturale e tecnologico. L'interazione sociale può avvenire attraverso sistemi specializzati di comunicazione, tra i quali il più sofisticato appare il linguaggio umano, che viene appreso dall'individuo per via culturale (cioè copiando il comportamento linguistico degli altri) e quindi è soggetto a trasmissione e cambiamento culturale, ma sulla base di componenti del genotipo ereditato che si sono evolute biologicamente nella specie umana. Infine lo studio mediante le simulazioni di vita artificiale dei fenomeni di trasferimento sociale delle risorse permette di analizzare le varie forme della vita sociale ed economica e il loro cambiamento storico.
Come si vede, il passaggio dalle reti neurali classiche alle reti neurali della vita artificiale amplia molto le prospettive di ricerca della scienza cognitiva neurale, estendendo considerevolmente il campo dei fenomeni che vengono trattati dalla nuova scienza cognitiva. Restano tuttavia numerosi fenomeni e aspetti importanti del comportamento, in particolare di quello umano, che la nuova scienza cognitiva in linea di principio sembra in grado di affrontare, sebbene per ora solo in misura molto limitata; essi quindi rimangono come compiti di ricerca per il futuro. Si concluderà accennando a quattro di questi aspetti del comportamento.
Il primo aspetto è quello dei comportamenti e delle capacità più complesse. Se ha senso fare una distinzione tra capacità più elementari, semplici, di base del comportamento umano (percezione, movimento, memoria, attenzione, apprendimento) e capacità più complesse e di alto livello (linguaggio, pensiero, ragionamento, pianificazione, decisione), bisogna affermare che la scienza cognitiva computazionale si è dedicata più alle seconde che alle prime, mentre l'opposto è vero per la scienza cognitiva neurale, e ancora di più per la nuova scienza cognitiva che usa le reti neurali in una prospettiva di vita artificiale. Rimane quindi un compito per il futuro per la nuova scienza cognitiva: lo studio delle capacità cognitive più complesse e di alto livello. Lo studio di tali capacità non è facile in quanto la nuova scienza cognitiva adotta pienamente la prospettiva genetica (nel senso in cui Piaget parlava di epistemologia genetica) secondo la quale per capire qualcosa è necessario ricostruire come essa si sia sviluppata da qualcosa di diverso nel corso del tempo. I comportamenti e le capacità complesse degli esseri umani si sono evoluti a partire da comportamenti e capacità più semplici, e il punto di vista genetico della nuova scienza cognitiva richiede che per arrivare ai comportamenti e alle capacità complesse e di alto livello si cominci da quelli più semplici e di più basso livello, ricostruendone lo sviluppo nel corso dell'evoluzione biologica, dell'evoluzione dell'individuo e anche di quella storica e culturale.
Non sembrano esservi ostacoli di principio alla possibilità che la nuova scienza cognitiva affronti con successo lo studio delle capacità cognitive superiori. Tale studio richiede che si usino scenari simulativi più complessi (ambienti più complessi, compiti più complessi per gli organismi che vivono in tali ambienti e che debbono adattarsi a essi) e soprattutto reti neurali con architetture più complesse, e in particolare reti neurali modulari. Due questioni che hanno visto contrapporsi storicamente la scienza cognitiva computazionale e la scienza cognitiva neurale nella sua versione iniziale, o classica, sono quella delle basi innate del comportamento e la modularità dei sistemi cognitivi. La scienza cognitiva computazionale tende a schierarsi a favore del riconoscimento di importanti basi innate del comportamento umano e di un'organizzazione della cognizione in moduli distinti e specializzati (Fodor e Katz 1964; Fodor 1983), mentre la scienza cognitiva neurale nella sua versione classica si schiera a favore dell'importanza dell'apprendimento e dell'esperienza e di una organizzazione cognitiva omogenea e non modulare. Invece le due questioni non hanno ragione di creare una contrapposizione tra la scienza cognitiva computazionale e la nuova scienza cognitiva. Come si è visto, la nuova scienza cognitiva, quella che guarda alle reti neurali nella prospettiva della vita artificiale, dà molta importanza alle basi innate del comportamento, le riconosce in modo esplicito associando a ogni rete neurale un genotipo ereditato dai genitori, e ne studia l'emergere nelle sue simulazioni che affrontano l'evoluzione biologica di popolazioni di reti neurali. Anche per quanto riguarda la questione della modularità non c'è più una contrapposizione tra la scienza cognitiva computazionale e la nuova scienza cognitiva. Il genotipo ereditato da una rete neurale può codificare l'architettura della rete, ossia il pattern di connessioni che specifica quali unità siano connesse tra loro all'interno della rete. L'architettura evolve nel corso dell'evoluzione biologica, o anche si modifica nella fase dell'apprendimento, in modo da rendere possibile l'emergere di archittetture modulari, ossia architetture in cui sottoinsiemi di unità hanno più connessioni al loro interno piuttosto che con altre unità della rete e tali sottoinsiemi svolgono specifici compiti nel comportamento complessivo dell'organismo (moduli). Architetture modulari di questo tipo appaiono una necessità se la rete deve essere in grado di adattarsi a ambienti complessi e deve svolgere compiti complessi in tali ambienti, e se deve esibire capacità cognitive di alto livello. Dopotutto il sistema nervoso reale ha prestazioni così complesse ed elevate non soltanto perché è composto da un numero molto rilevante di neuroni, ma anche perché è organizzato, anatomicamente e funzionalmente, in un grande numero e in una ingente varietà di sottosistemi.
Un altro aspetto del comportamento che necessita di ulteriori approfondimenti è quell'insieme di fenomeni chiamati 'vita mentale'. È necessario distinguere chiaramente tra la vita mentale quale fenomeno empirico, ossia il fatto che organismi complessi come gli esseri umani abbiano immagini mentali, pensieri, ricordi, desideri, emozioni, e il vocabolario esplicativo 'mentalistico' della psicologia e della scienza cognitiva computazionale che invocano entità e processi non fisici per spiegare il comportamento e la stessa vita mentale. Essa è un insieme di fenomeni empirici di cui nessuna scienza si può permettere di negare l'esistenza e che la scienza deve soltanto cercare di spiegare nel modo migliore. Invece, il vocabolario mentalista della psicologia e della scienza cognitiva computazionale è soltanto esplicativo e, secondo la scienza cognitiva neurale, deve essere sostituito da un vocabolario teorico ed esplicativo migliore, quello naturalistico direttamente ispirato alla struttura fisica del sistema nervoso. Tuttavia il vocabolario esplicativo delle reti neurali deve spiegare non soltanto i comportamenti esterni degli organismi, come è stato largamente fatto finora, ma anche la loro vita mentale, almeno nel caso di organismi che, come gli esseri umani, abbiano una vita mentale.
È inutile nascondere che la vita mentale, per il suo carattere sfuggente e privato, pone problemi per qualunque scienza e anche per la nuova scienza cognitiva. Quest'ultima può cercare di affrontarli innanzi tutto chiedendosi quale tipo specifico di architettura neurale soggiaccia ai fenomeni della vita mentale. Nei comportamenti più elementari in cui l'organismo risponde a qualche stimolo esterno con qualche movimento rivolto verso l'esterno, l'architettura della rete è fondamentalmente un'architettura con connessioni 'in avanti', cioè connessioni attraverso le quali l'attivazione si propaga dalle unità di input (sensoriali) alle unità di output (motorie). Invece un'architettura appropriata come base per i fenomeni della vita mentale deve essere ricca anche di connessioni 'all'indietro', vale a dire che vanno da parti della rete più vicine all'output motorio a quelle più vicine all'input sensoriale. Queste architetture possono spiegare molti aspetti della vita mentale in termini di autogenerazione da parte della rete dei suoi stessi input, come un modo di rispondere agli input non producendo movimenti rivolti verso l'esterno, ma autogenerando nuovi input all'interno della rete. In secondo luogo, lo studio della vita mentale non può ignorare il fatto che molta parte della vita mentale è privata, cioè accessibile soltanto a un singolo individuo e non ad altri. L'ambiente fisico esterno ai corpi degli organismi è accessibile a molti individui nello stesso tempo in quanto produce stimoli per le unità di input delle reti neurali di tutti questi individui. Invece se il punto di origine di un certo input è fisicamente collocato all'interno del corpo di un singolo individuo, o addirittura all'interno della sua stessa rete neurale (nel caso degli input autogenerati), per ragioni puramente fisiche si tratterà di un input rivolto soltanto a quell'individuo, conferendo all'esperienza risultante quel carattere privato che caratterizza la vita mentale.
Il terzo aspetto del comportamento che dovrà essere approfondito è quello che riguarda le componenti non cognitive, ma dinamiche, motivazionali, emotive, affettive, del comportamento e della vita mentale. Nella tradizione della psicologia le componenti cognitive e quelle non cognitive sono quasi sempre state trattate separatamente, a svantaggio della nostra comprensione di entrambe. La scienza cognitiva, in tutte le sue versioni, ha privilegiato ingiustificatamente le componenti cognitive rispetto a quelle non cognitive. La nuova scienza cognitiva ha il compito di affrontare, come finora non ha fatto, le componenti non cognitive del comportamento, ossia il fatto che gli organismi non hanno soltanto capacità e conoscenze, ma anche motivazioni, emozioni e affetti, dormono, stanno svegli e hanno diversi stati intermedi di coscienza, sono depressi o eccitati, possono trovarsi in condizioni patologiche che li rendono fortemente infelici e incapaci di badare a sé stessi. Per affrontare questi aspetti non cognitivi del comportamento e della vita mentale le reti neurali non devono più considerare il sistema nervoso come limitato alla corteccia e come un sistema di neurotrasmissione basato su una specifica architettura della rete e su uno specifico insieme di pesi sinaptici, ma devono cominciare a considerarlo anche come un sistema con importanti e ricche strutture sottocorticali, funzionante in base a meccanismi di neuromodulazione e non soltanto di neurotrasmissione, e in stretta interazione con altri sistemi del corpo come quello endocrino e quello immunitario. La nuova scienza cognitiva appare in linea di principio attrezzata per tale scopo, in quanto le sue simulazioni non coinvolgono solamente il sistema nervoso dell'organismo, ma anche il resto del corpo, nonostante sia necessario riconoscere che finora la vita artificiale e la robotica biomorfica hanno studiato la morfologia esterna del corpo piuttosto che i sistemi interni diversi dal sistema nervoso e le interazioni tra il sistema nervoso e tali sistemi interni.
Il quarto e ultimo aspetto del comportamento che la nuova scienza cognitiva dovrà affrontare con più impegno in futuro è quello della socialità. Si è già accennato al fatto che la vita artificiale, esaminando gli organismi nel loro ambiente, è predisposta a studiare gli insiemi di individui e le loro interazioni, dato che una parte importante dell'ambiente di ogni particolare individuo in molte specie tende a essere quella costituta dagli altri individui della stessa specie. Considerata però l'importanza delle interazioni sociali per una specie altamente sociale come quella umana, gran parte del lavoro resta ancora da compiere. Nella specie umana esistono forme diverse di interazione tra individui, dalle interazioni puramente fisiche a quelle comunicative, verbali e non verbali, a quelle associate al trasferimento di risorse da un individuo all'altro. Esistono organizzazioni sopraindividuali costituite da insiemi di individui che, trasferendo le loro risorse individuali a una struttura centrale, permettono a quest'ultima di produrre nuovi tipi di risorse che nessuno degli individui, da solo, sarebbe in grado di produrre. Questa è l'origine delle formazioni politiche complesse (città, stato) e delle organizzazioni economiche moderne (imprese private in un mercato). Sviluppando quest'ultima direzione di ricerca, la nuova scienza cognitiva potrà assolvere l'importante compito di costituire un anello di congiunzione e un punto di passaggio tra le scienze biologiche che si occupano di entità più piccole del singolo organismo (molecole, cellule) e le scienze sociali e storiche che si occupano di entità più grandi dell'individuo (gruppi di individui, società, mercati, stati).
Chomsky 1969-79: Chomsky, Noam A., Saggi linguistici, 3 v., Torino, Boringhieri, 1969-1979.
Elman 1996: Elman, Jeffrey L. - Bates, Elizabeth A. - Johnson, Mark H. - Karmiloff-Smith, Annette - Parisi, Domenico - Plunkett, Kim, Rethinking innateness. A connectionist perspective on development, Cambridge (Mass.), Massachusetts Institute of Technology Press, 1996.
Floreano 1996: Floreano, Dario, Manuale sulle reti neurali, Bologna, Il Mulino, 1996.
Fodor, Katz 1964: The structure of language, edited by Jerry A. Fodor and Jerrold J. Katz, London-Englewood Cliffs, Prentice-Hall, 1964.
Fodor 1983: Fodor, Jerry A., The modularity of mind: an essay on faculty psychology, Cambridge (Mass.), Massachusetts Institute of Technology Press, 1983 (trad. it.: La mente modulare, Bologna, Il Mulino, 1988).
Johnson-Laird 1988: Johnson-Laird, Philip N., The computer and mind: an introduction to cognitive science, Cambridge (Mass.), Massachusetts Institute of Technology Press, 1988 (trad. it.: La mente e il computer. Introduzione alla scienza cognitiva, Bologna, Il Mulino, 1990).
Langton 1995: Artificial life: an overview, edited by Chris G. Langton, Cambridge (Mass.), Massachusetts Institute of Technology Press, 1995.
Mitchell 1996: Mitchell, Melanie, An introduction to genetic algorithms, Cambridge (Mass.), Massachusetts Institute of Technology Press, 1996.
Nolfi, Floreano 2000: Nolfi, Stefano - Floreano, Dario, Evolutionary robotics: the biology, intelligence and technology of self-organizing machines, Cambridge (Mass.), Massachusetts Institute of Technology Press, 2000.
Parisi 1999: Parisi, Domenico, Mente. I nuovi modelli della vita artificiale, Bologna, Il Mulino, 1999.
Parisi 2001: Parisi, Domenico, Simulazioni. La realtà rifatta nel computer, Bologna, Il Mulino, 2001.
Posner 1989: Foundations of cognitive science, edited by Michael I. Posner, Cambridge (Mass.), Massachusetts Institute of Technology Press, 1989.
Rich 1983: Rich, Elaine, Artificial intelligence, New York, McGrow Hill, 1983 (trad. it.: Intelligenza artificiale, Milano, McGraw Hill Italia, 1986).
Rumelhart, McClelland 1986: Rumelhart, David E. - McClelland, James L., Parallel distributed processing: exploration in the microstructure of cognition, Cambridge (Mass.), Massachusetts Institute of Technology Press, 1986 (trad. it.: PDP: Microstruttura dei processi cognitivi, Bologna, Il Mulino, 1991).