La nascita del Clicker Training
27 luglio 2011
8 min

La nascita del Clicker Training

addestramento
Negli anni Quaranta e Cinquanta del Novecento, era molto comune per gli psicologi della corrente del Comportamentismo utilizzare animali per i propri esperimenti, avendo però come fine lo studio dei processi di apprendimento umani.

Questa intensa sperimentazione sugli animali, però, portò anche a un altro risultato: una conoscenza molto più approfondita della mente animale e lo sviluppo di concetti quali rinforzo e condizionamento, entrambi alla base dei moderni metodi di addestramento. In questo contesto si situa il lavoro di Burrhus Frederic Skinner, eclettica figura di scienziato, scrittore e psicologo americano, il quale pur avendo come scopo principale lo studio dell’uomo, si trovò a effettuare alcune scoperte che si rivelarono in seguito estremamente utili per capire la mente degli animali e modellarne le azioni.

Nei suoi studi Skinner si concentrò principalmente sul concetto di rinforzo e sulle conseguenze che quest’ultimo aveva nella determinazione del comportamento. In particolare, lo scienziato utilizzò ratti e piccioni da laboratorio immettendoli in particolari gabbie (dette Skinner Box) e studiandone le reazioni quando a un’azione da lui selezionata (la pressione di una leva con il becco o con le zampe) veniva fatto seguire un rinforzo in cibo. Skinner notò subito come l’azione rinforzata avvenisse con frequenza sempre maggiore fino a essere completamente acquisita (appresa) dall’animale. Lo studioso chiamò questo tipo di condizionamento operante e lo oppose nettamente a quello studiato dal fisiologo russo Ivan Pavlov (condizionamento classico), perché nel secondo lo stimolo-segnale veniva dato al principio della sessione di lavoro e a esso seguiva la risposta, mentre nel condizionamento operante skinneriano era la risposta a essere posizionata al primo posto della sequenza comportamentale.

Fino al 1943, però, tutto ciò che Skinner era riuscito a ottenere era un ratto in grado di premere una leva per ottenere del cibo. Non aveva ancora elaborato il concetto cruciale dello shaping, il modellaggio del comportamento. Infatti, quando Skinner volle differenziare il comportamento del ratto, perché questo esprimesse una forza maggiore nella spinta della leva, fu costretto a modificare la leva stessa rendendola più “dura” da premere, ottenendo così un ratto che imprimeva maggior forza alla sua azione. L’eminente scienziato non aveva ancora avuto l’intuizione che lo stesso risultato si poteva ottenere attraverso il modellaggio del comportamento, senza toccare nulla all’interno della gabbia in cui era contenuto il topo.

L’illuminazione venne inaspettatamente nel 1943, mentre Skinner e due suoi studenti, Keller Breland e Norman Guttman, stavano lavorando a un progetto militare in una vecchia fabbrica di farina a Minneapolis. Le giornate trascorrevano noiose, aspettando ordini da Washington, e i tre decisero di insegnare a un piccione a giocare a bowling. Approntarono una gabbia contenente una piccola pallina di legno e si prepararono a rinforzare il comportamento desiderato. Il loro approccio iniziale si basava sull’attesa che il soggetto dell’esperimento esprimesse l’azione completa (come nel caso del ratto che premeva la leva). In questo caso, però, il piccione non ne voleva sapere di piegare la testa lateralmente e colpire la pallina: si trattava di un gesto che troppo si allontanava da quelli che l’animale era in grado di proporre (e che non potevano esulare dai comportamenti presenti nelle attività quotidiane del piccione, i comportamenti già appresi).

Ben presto, però, i tre si stancarono di aspettare e Skinner fu folgorato da un’idea eccezionale. Perché attendere all’infinito, quando si poteva rinforzare qualsiasi piccolissimo movimento verso l’obiettivo? Egli incominciò a fornire cibo all’animale non appena questi volgeva il capo verso la palla. Nel giro di pochi minuti il soggetto moltiplicò il comportamento. Successivamente lo studioso prese a rinforzare il solo abbassare la testa, poi lo stesso gesto ma solo se espresso nei pressi della pallina. In un passaggio ancora più avanzato, poi, il piccione fu in grado di colpire la pallina con il becco, muovendo la testa lateralmente. Come ebbe modo di osservare Skinner qualche anno dopo, il risultato non si fece attendere: nel giro di qualche minuto il piccione fu in grado di giocare a bowling. Ciò che Skinner, Breland e Guttman non compresero subito fu l’altra grandissima scoperta che senza volere avevano fatto. Mentre nei precedenti esperimenti di Skinner (anni Trenta) il cibo era posto manualmente in un piattino all’interno della scatola attraverso un’apertura nella parete, questa volta il trio si era servito di un congegno meccanico che veniva attivato dall’esterno. L’apparecchio lasciava cadere un chicco di grano alla volta, emettendo al contempo un leggero suono metallico, un “click”. Skinner si rese conto ben presto che rispetto alle sperimentazioni passate la velocità di apprendimento del soggetto era notevolmente superiore.

Fu però solamente nel 1951 che egli diede un nome a questo processo, chiamandolo shaping e descrivendolo come segue: “Si basa sul principio che quando si rinforza un determinate comportamento, si aumenta la possibilità che l’animale replichi quel medesimo comportamento. Questo rende possibile modellare il comportamento dell’animale nella maniera in cui uno scultore modella l’argilla”. È in questo testo fondamentale che il nostro studioso mostra di aver capito la reale portata dell’esperimento del 1943. Skinner si era ormai reso conto che il “click” del dispenser di chicchi di grano funzionava da ponte tra l’azione svolta dal piccione e il rinforzo, operando una connessione indelebile nella mente dell’animale che lo spingeva a ripetere con sempre maggior convinzione il comportamento che conduceva al cibo. Skinner aveva ormai compreso che il metodo migliore per far sì che si sviluppino processi di apprendimento rapidi e duraturi è proprio quello di utilizzare un ponte o marker uditivo che istituisca nella mente dell’animale un’associazione tra l’azione da compiere e il rinforzo che viene così ottenuto.

Mentre con il metodo classico non esiste un tale marcatore di eventi, o meglio, questo compito è riservato alla parola di lode (che però non possiede il tempismo e il tono neutro che, invece, è possibile ottenere con il clicker), il condizionamento operante skinneriano permette all’animale di individuare con precisione e rapidità il comportamento da eseguire grazie alla presenza di questo suono. Per far sì che il “click” venga identificato dall’animale con la figura mentale “ho fatto bene, ora arriverà un rinforzo” però, è necessario che il suono, inizialmente uno stimolo neutro, divenga stimolo condizionato. Questo si ottiene tramite un gran numero di associazioni tra il suono del click e l’arrivo di un premio, utilizzando in questo il seguente concetto pavloviano: un gran numero di associazioni tra stimolo neutro e stimolo incondizionato (stimolo in grado di suscitare nell’animale una Risposta Incondizionata che non necessita apprendimento) trasformano lo stimolo neutro in stimolo condizionato (stimolo in grado di suscitare nell’animale la risposta incondizionata pur senza la presenza dello stimolo incondizionato).

Ecco dunque delineate in nuce tutte le fondamentali intuizioni alla base del moderno clicker training. Nonostante l’incredibile portata delle sue teorie, Skinner non andò mai oltre l’insegnamento di alcuni semplici “tricks” a un cane. Egli era principalmente uno psicologo della mente umana e tale rimase per tutta la vita; considerava la sperimentazione sugli animali alla stregua di un utile “passatempo”, le cui scoperte andavano trasferite nel ramo della psicologia umana, senza soffermarsi sulle sue implicazioni riguardanti una migliore conoscenza della mente animale e dei suoi processi di apprendimento. Ma qualcun altro si accorse che il metodo skinneriano aveva un valore in sé, scollegato da un suo possibile trasferimento alla psicologia umana: fu Keller Breland, uno dei due studenti presenti quel fatidico giorno del 1943 a Minneapolis. Insieme alla moglie Marian, Breland fondò un nuovo ramo di studi, battezzandolo “psicologia applicata agli animali” o “ingegneria comportamentale”, utilizzando come punto di partenza le teorie skinneriane.

In breve tempo la coppia fu in grado di sbaragliare tutta la concorrenza nell’addestramento di animali, gettando le basi per gli odierni impieghi dei cani antidroga, antimina e per il supporto a diversamente abili. In anni più recenti, un numero sempre più elevato di istruttori si è votato al condizionamento operante; per nominarne alcuni dei più famosi, Ray Berwick (il principale preparatore dei cani attori della Universal Studios negli anni Settanta), Karen Pryor (che ha all’attivo una lunga carriera di addestramento incominciata con i delfini, ma successivamente applicata anche ad altri animali) e Ian Dunbar (veterinario e psicologo che ha sottolineato l’importanza di incominciare l’addestramento in età giovanile, consigliando l’istituzione delle puppy e socialization classes).

Si vede bene da questi esempi come le applicazioni del metodo skinneriano siano state ampie e foriere di molte e bellissime conseguenze. È oggi opinione accettata quasi da tutti che il clicker training sia un metodo di addestramento molto potente e soprattutto da preferire, come metodo gentile, ai metodi coercitivi utilizzati in precedenza. Esiste tuttora una minoranza che utilizza il rinforzo negativo, ossia la sospensione dello stimolo avversivo, per condizionare il comportamento; è auspicabile, tuttavia, che con il tempo questa minoranza diminuisca ulteriormente fino a sparire.