29.05.2013 Views

Regola di Hebb

Regola di Hebb

Regola di Hebb

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Un ponte tra appren<strong>di</strong>mento biologico e<br />

artificiale. La “<strong>Regola</strong> <strong>di</strong> <strong>Hebb</strong>” e le evidenze<br />

sperimentali nella Long-Term Potentiation.<br />

Marco Ernandes<br />

Tesina per il corso <strong>di</strong> Neuroscienze. Ph.D. Scienze Cognitive.<br />

1 Introduzione<br />

Nel campo dell’Intelligenza Artificiale è stato fatto spesso riferimento ad<br />

una presunta ispirazione biologica: si ritiene che l’Intelligenza “Naturale”<br />

del cervello possa venir riprodotta, seppur parzialmente e solo in un contesto<br />

simulativo, tramite il calcolatore. Nel settore delle Reti Neurali Artificiali<br />

(ANN), che più <strong>di</strong> ogni altro ha abbracciato questa filosofia, la realtà dei<br />

fatti è ben <strong>di</strong>versa. I sistemi che in letteratura sono risultati più efficienti<br />

riportano un numero <strong>di</strong> <strong>di</strong>fferenze rispetto al modello biologico (<strong>di</strong>fferenze<br />

architetturali, algoritmiche e funzionali) che <strong>di</strong> gran lunga supera quello<br />

delle similitu<strong>di</strong>ni.<br />

La <strong>di</strong>stanza tra il modello artificiale e quello biologico si avverte soprattutto<br />

nel momento in cui si tenta <strong>di</strong> far confluire nel simulatore informatico le<br />

capacità plastiche del sistema nervoso umano. L’estrema semplificazione su<br />

cui si basa l’architettura neuronale artificiale ha ridotto enormemente la variabilità<br />

del comportamento cellulare: tutti i fenomeni <strong>di</strong> natura biochimica e<br />

bioelettrica che prendono luogo nella comunicazione sinaptica sono stati rozzamente<br />

riassunti in un unico numero scalare denominato “peso sinaptico”<br />

che modula il segnale proveniente dall’assone del neurone eccitato. L’attività<br />

dei neurotrasmettitori e dei ricettori nel contesto della comunicazione sinaptica<br />

è estremamente variabile (lo stesso potenziale d’azione ha significati<br />

molto <strong>di</strong>versi a seconda delle varie combinazioni me<strong>di</strong>atore-ricettore che possono<br />

entrare in azione) e questa variabilità può sicuramente giocare un ruolo<br />

importante in fenomeni quali l’appren<strong>di</strong>mento per rinforzo: una tipologia <strong>di</strong><br />

learning 1 ritenuta tanto potente nel modello biologico quanto sterile nella<br />

1 Nel Machine Learning si tendono a <strong>di</strong>stinguere tre <strong>di</strong>versi modelli <strong>di</strong> appren<strong>di</strong>mento<br />

a seconda della modalità <strong>di</strong> presentazione degli esempi (cosa che ha delle ovvie e <strong>di</strong>rette<br />

ripercussioni sull’architettura interna del sistema). Due <strong>di</strong> questi, l’appren<strong>di</strong>mento supervisionato<br />

e quello non-supervisionato, sono <strong>di</strong>cotomici e rappresentano delle formulazioni<br />

“pure”: nel primo caso il sistema intelligente osserva degli esempi a cui sono associati<br />

dei valori <strong>di</strong> classificazione noti a priori e cerca <strong>di</strong> adattare il proprio comportamento in


Tesina per il corso <strong>di</strong> Neuroscienze. - Ph.D. Scienze Cognitive. 2<br />

simulazione informatica.<br />

Questa enorme ricchezza delle componenti elettrochimiche è stata negata<br />

nel modello simulativo artificiale ed il risultato è stato una scarsa capacità<br />

adattiva e plastica del neurone preso come unità in<strong>di</strong>pendente [1]. Ne<br />

è emersa la necessità <strong>di</strong> escogitare efficienti algoritmi adattivi per reti <strong>di</strong><br />

neuroni. La soluzione più brillante adottata dagli informatici a questo fine<br />

è stata l’idea della retropropagazione dell’errore [2]. Questa tecnica ha<br />

permesso la regolazione dei pesi sinaptici in modo molto semplice, prendendo<br />

<strong>di</strong>rettamente spunto dall’architettura della rete neuronale.<br />

L’algoritmo <strong>di</strong> BackPropagation, oltre a fornire un sensibile incremento<br />

delle capacità <strong>di</strong> appren<strong>di</strong>mento delle ANN, ha però anche accentuato le<br />

<strong>di</strong>stanze tra i modelli neurali biologici e artificiali, decretando una netta separazione<br />

delle due <strong>di</strong>scipline: l’appren<strong>di</strong>mento in BackPropagation su reti<br />

multistrato alimentate in avanti rappresenta uno straor<strong>di</strong>nario strumento<br />

matematico-statistico <strong>di</strong> approssimazione e ottimazione in sistemi non lineari,<br />

ma un abissale salto in <strong>di</strong>etro nel tentativo <strong>di</strong> riprodurre l’attività<br />

intelligente del cervello umano.<br />

Vi sono stati tentativi <strong>di</strong> produrre algoritmi <strong>di</strong> learning biologicamente<br />

plausibili. Il problema con cui si sono regolarmente imbattuti è stato quello<br />

<strong>di</strong> permettere l’addestramento anche in presenza <strong>di</strong> funzioni non linearmente<br />

separabili.<br />

Ultimamente sono emersi alcuni esempi in cui questo problema sembrerebbe<br />

superato. Quasi tutte queste ipotesi fanno capo ad un’unica regola <strong>di</strong><br />

modulazione adattiva della risposta sinaptica: la “regola <strong>di</strong> <strong>Hebb</strong>”. Vale la<br />

pena soffermarsi su questa, prima <strong>di</strong> accennare alle sue evoluzioni più recenti,<br />

e <strong>di</strong> osservare le evidenze sperimentali che ne <strong>di</strong>mostrano la plausibilità<br />

biologica.<br />

2 Descrizione della “<strong>Regola</strong> <strong>di</strong> <strong>Hebb</strong>”<br />

Questa regola rappresenta un modello ”ponte” tra appren<strong>di</strong>mento biologico e<br />

artificiale. Essa riesce a descrivere la capacità adattiva delle unità neuronali<br />

in contesti <strong>di</strong> appren<strong>di</strong>mento associativo.<br />

La sua formulazione originale, del 1949, è fornita dalla seguente postulazione<br />

(meramente teorica) <strong>di</strong> Donald <strong>Hebb</strong> [3]: quando un assone della<br />

cellula A (la cellula presinaptica) prende parte ripetitivamente nel processo<br />

modo da ridurre l’errore del sistema rispetto ai valori target, nel secondo caso invece non<br />

vi è nessuna label associata agli esempi e il sistema cerca autonomamente <strong>di</strong> scovare delle<br />

similitu<strong>di</strong>ni tra i pattern in modo da poterli organizzare in classi. Vi è un terzo modello,<br />

interme<strong>di</strong>o, in cui gli esempi sono privi <strong>di</strong> valori attribuiti a priori (in modo analogo<br />

all’appren<strong>di</strong>mento non-supervisionato) e in cui il concetto <strong>di</strong> errore è stato sostituito da<br />

un valore <strong>di</strong> rinforzo che segnala il comportamento positivo o negativo rispetto al pattern<br />

osservato. Il learning per rinforzo è sicuramente quello che più ricorda gli schemi <strong>di</strong><br />

appren<strong>di</strong>mento umani.


Tesina per il corso <strong>di</strong> Neuroscienze. - Ph.D. Scienze Cognitive. 3<br />

<strong>di</strong> eccitamento della cellula B (la cellula postsinaptica), qualche cambiamento<br />

strutturale o metabolico subentra in una o entrambe le cellule in modo che<br />

l’efficienza <strong>di</strong> A, come cellula eccitatrice <strong>di</strong> B, aumenti.<br />

Un ulteriore contributo <strong>di</strong> <strong>Hebb</strong> alla teoria connessionista e alle neuroscienze<br />

computazionali è stata quella <strong>di</strong> espandere la regola <strong>di</strong> <strong>Hebb</strong> a gruppi<br />

<strong>di</strong> neuroni: eccitandosi insieme questi formano raggruppamenti cellulari associativi.<br />

Secondo il pensiero <strong>di</strong> <strong>Hebb</strong> l’attività cognitiva è determinata<br />

dall’attivazione sequenziale <strong>di</strong> questi insiemi.<br />

La più semplice delle formulazioni matematiche proposte per descrivere<br />

la regola <strong>di</strong> <strong>Hebb</strong> è la seguente:<br />

∆wij = ηxixj<br />

∆wij rappresenta la variazione dell’efficienza sinaptica tra il neurone i e il<br />

neurone j, η la velocità <strong>di</strong> adattamento. Risulta evidente che se le due cellule<br />

si attivano contemporaneamente l’efficienza della sinapsi che le collega<br />

viene rafforzata. Questo permette <strong>di</strong> dar luogo ad un fenomeno <strong>di</strong> adattamento<br />

associativo che prescinde dalla presenza <strong>di</strong> una supervisione esterna<br />

all’attività neuronale.<br />

3 Long-Term Potentiation e le evidenze sperimentali della<br />

“<strong>Regola</strong> <strong>di</strong> <strong>Hebb</strong>”<br />

Le sinapsi che mettono in moto meccanismi associativi del tipo descritto<br />

dalla “learning hebbian rule” vengono tipicamente chiamate “sinapsi hebbiane”.<br />

La presenza <strong>di</strong> queste all’interno del cervello umano è stata provata<br />

oltre venti anni dopo la postulazione <strong>di</strong> <strong>Hebb</strong>. Ed è stata inoltre ricondotta<br />

a varie e <strong>di</strong>stinte manifestazioni <strong>di</strong> attività intellettuale legate all’appren<strong>di</strong>mento.<br />

Nel 1973 Bliss e Lømo [4] hanno sperimentalmente osservato che applicando<br />

treni <strong>di</strong> stimoli ad alta frequenza in una qualsiasi delle vie afferenti<br />

all’ippocampo (le tre tipologie <strong>di</strong> vie e i campi neuronali sono rappresentati<br />

in figura 1) si genera un aumento dei potenziali postsinaptici eccitatori.<br />

Questo fenomeno fu chiamato Potenziamento a Lungo Termine (LTP:<br />

Long-Term Potentiation, del quale è stato registrato anche l’inverso, la LTD:<br />

Long-Term Depression).<br />

Per indurre l’insorgere della LTP viene introdotto un elettrodo per la<br />

stimolazione extracellulare delle vie afferenti. Un secondo elettrodo, <strong>di</strong> registrazione,<br />

è posto in <strong>di</strong>retto contatto con il neurone <strong>di</strong> uscita e ne misura<br />

il potenziale <strong>di</strong> membrana. Il test (che è stato riprosto in figura 2) viene<br />

condotto per fasi:<br />

1. per prima cosa si stimolano le vie afferenti con una frequenza scarsa,<br />

insufficiente a far scaturire un potenziale d’azione; viene registrata la


Tesina per il corso <strong>di</strong> Neuroscienze. - Ph.D. Scienze Cognitive. 4<br />

via delle fibre<br />

collaterali <strong>di</strong> Shaeffer<br />

CA3<br />

via muscoide<br />

CA1<br />

giro dentato<br />

via perforante<br />

Fig. 1: Struttura dell’ippocampo e delle tre vie eccitatorie.<br />

Fig. 2: Potenziamento a lungo termine. Fase A: viene misurata la risposta postsinaptica<br />

ad una stimolazione delle vie afferenti. Fase B: viene prodotto un stimolo ad alta<br />

frequenza che genera un potenziale d’azione. Fase C: dopo il potenziale d’azione<br />

si registra la crescita della risposta postsinaptica al medesimo stimolo artificiale,<br />

la sinapsi produce LPT.<br />

conseguente risposta postsinaptica.<br />

2. alle cellule presinaptiche viene fornito uno stimolo ad alta frequenza in<br />

modo da ingenerare un potenziale d’azione (questa fase del test viene<br />

ripetuta più volte, se necessario).<br />

3. con lo stesso stimolo prodotto al punto 1 si osserva la risposta postsinaptica:<br />

questa risulta essere sensibilmente maggiore rispetto a quella<br />

iniziale e potrebbe anche risultare in un potenziale d’azione.<br />

Nel 1988 Gustafsson e Wingström [5] hanno potuto <strong>di</strong>mostrare che la<br />

comparsa dell’LTP si deve ad una simultanea attività del neurone presinaptico<br />

e <strong>di</strong> quello postsinaptico. Questa osservazione risulta essere in pieno<br />

accordo con quanto postulato da <strong>Hebb</strong>. Le verifiche sperimentali fornite<br />

dagli autori sono <strong>di</strong> tre tipi: i) bloccando l’inibizione postsinaptica con l’uso


Tesina per il corso <strong>di</strong> Neuroscienze. - Ph.D. Scienze Cognitive. 5<br />

<strong>di</strong> speciali tossine l’LTP viene notevolmente potenziato; ii) l’LTP può essere<br />

impe<strong>di</strong>to stimolando le afferenze inibitorie delle cellule postsinaptiche;<br />

iii) stimolando artificialmente e contemporaneamente la cellula presinaptica<br />

(con una frequenza insufficiente per la generazione <strong>di</strong> un potenziale d’azione)<br />

e quella postsinaptica si ingenera l’LTP.<br />

I neuroscienziati hanno fornito un modello che descrive l’attività elettrochimica<br />

delle sinapsi coinvolte nel potenziamento a lungo termine. Si<br />

ritiene che l’LTP si verifichi quando la frequenza del segnale <strong>di</strong> ingresso è<br />

tale da depolarizzare la membrana della spina dendritica e liberare il blocco<br />

del magnesio sui canali NMDA 2 , permettendo l’ingresso del calcio. Mentre<br />

i canali non-NMDA non permettono l’ingresso del calcio, attraverso i<br />

canali NMDA questo affluisce rapidamente all’interno della spina dendritica<br />

e la crescita della concentrazione <strong>di</strong> Ca 2+ favorisce l’insorgere <strong>di</strong> chinasi<br />

Ca 2+ -<strong>di</strong>pendenti che inducono la cellula postsinaptica a inviare un messaggero<br />

retrogrado (secondo un meccanismo ancora non accertato) alla cellula<br />

presinaptica.<br />

Il feedback fornito dal messaggio retrogrado è necessario perchè, se da<br />

un lato l’induzione dell’LTP è dovuta a fattori postsinaptici, dall’altro il<br />

mantenimento <strong>di</strong> questo fenomeno (che può durare a lungo: ore, se non ad<strong>di</strong>rittura<br />

molti giorni) richiede un cambiamento postsinaptico identificabile<br />

con l’aumento della liberazione <strong>di</strong> neurotrasmettitore. Malinow e Tsien [6]<br />

<strong>di</strong>mostrarono il verificarsi <strong>di</strong> questo cambiamento metabolico persistente nel<br />

campo CA1 dell’ippocampo.<br />

Come collegare il potenziamento a lungo termine (e <strong>di</strong> conseguenza il postulato<br />

<strong>di</strong> <strong>Hebb</strong>) a meccanismi cognitivi <strong>di</strong> appren<strong>di</strong>mento e memoria? Una<br />

risposta è arrivata da un interessante stu<strong>di</strong>o <strong>di</strong> Morris [7]. Questi ha osservato<br />

una forte influenza dell’LTP sulla capacità animale <strong>di</strong> organizzare e accedere<br />

alla memoria spaziale. Bloccando i recettori NMDA dell’ippocampo<br />

<strong>di</strong> un ratto impegnato in un compito <strong>di</strong> ritrovamento <strong>di</strong> un oggetto, Morris et<br />

al. osservarono che quando l’oggetto era fuori dal campo visivo dell’animale<br />

(richiedendo quin<strong>di</strong> l’uso <strong>di</strong> memoria spaziale) il compito non veniva portato<br />

a termine.<br />

4 Raffinamento del concetto <strong>di</strong> contemporaneità nella “<strong>Regola</strong><br />

<strong>di</strong> <strong>Hebb</strong>”<br />

Il postulato <strong>di</strong> <strong>Hebb</strong> fa riferimento ad un’attività pre e post-sinaptica contemporanea.<br />

Che cosa vuol <strong>di</strong>re questo esattamente? Quando si può parlare<br />

<strong>di</strong> simultaneità o <strong>di</strong> attività ravvicinata? Una risposta a queste domande è<br />

emersa recentemente.<br />

2 Si tratta <strong>di</strong> un particolare tipo <strong>di</strong> recettore ad accesso controllato <strong>di</strong>rettamente.<br />

Possiede un doppio meccanismo <strong>di</strong> controllo: uno tramite l’azione <strong>di</strong> un agonista, il glutammato,<br />

e l’altro tramite la variazione <strong>di</strong> voltaggio, questa produce la liberazione del<br />

magnesio bloccante. Entrambe le componenti sono necessarie per l’apertura del canale.


Tesina per il corso <strong>di</strong> Neuroscienze. - Ph.D. Scienze Cognitive. 6<br />

mo<strong>di</strong>ficazione<br />

efficacia<br />

sinaptica<br />

ampiezza<br />

intervallo tra<br />

stimolo presinaptico<br />

e stimolo postsinaptico<br />

Fig. 3: Relazione tra ampiezza dell’intervallo tra gli stimoli pre e postsinaptici e<br />

l’aggiornamento dell’efficacia sinaptica prodotto dal LTP.<br />

Bi e Poo [8] hanno osservato che la variazione dell’efficacia sinaptica è<br />

influenzata anche dalla <strong>di</strong>stanza temporale tra gli spike. I due autori hanno<br />

prodotto dei test in cui dei neuroni dell’ippocampo messi in coltura venivano<br />

forzati ad avere degli spike in tempi determinati. Da questi esperimenti è<br />

emersa una funzione che lega ∆wij/wij e t f<br />

j − tf<br />

i<br />

, del tipo rappresentato<br />

nel grafico in figura 3. Si può osservare agevolmente che quando la cellula<br />

presinaptica (j) si attiva prima della cellula postsinaptica (i) l’efficacia<br />

sinaptica cresce (e lo fa in maniera esponenziale col decrescere dell’intervallo<br />

tra gli stimoli). Se, al contrario, la cellula j viene attivata successivamente a<br />

i il legame sinaptico perde forza, in quanto lo spike su j non è stato indotto<br />

da i.<br />

5 Algoritmi biologicamente plausibili<br />

Un primo esempio <strong>di</strong> algoritmo <strong>di</strong> learning che coniuga plausibilità biologica<br />

ed efficacia in contesti <strong>di</strong> separabilità non lineare è quello fornito da Mazzoni,<br />

Andersen e Jordan [9]. Nel loro modello teorico questi autori hanno<br />

introdotto un valore <strong>di</strong> rinforzo sul comportamento del sistema (rinforzo<br />

che è ben lungi dall’essere un in<strong>di</strong>catore dell’errore in output, come avviene<br />

nell’appren<strong>di</strong>mento supervisionato) che va a colpire tutti i neuroni presenti<br />

nell’architettura.<br />

L’aggiornamento del peso sinaptico viene eseguito massimizzando il rinforzo<br />

sul set <strong>di</strong> addestramento seguendo lo schema seguente:<br />

∆wij = r(xi − pi)xj + xj + λ(1 − r)(1 − xi − pi)xi<br />

dove pi è la probabilità (questa identifica quin<strong>di</strong> la presenza <strong>di</strong> un elemento<br />

<strong>di</strong> randomizzazione nel learning) che il neurone xi presenti uno spike e r è<br />

lo scalare <strong>di</strong> rinforzo compreso tra 0 (errore nell’output) e 1 (performance<br />

perfetta).<br />

I risultati sperimentali hanno messo in luce che questo algoritmo, privo<br />

<strong>di</strong> retropropagazione dell’errore (e del concetto <strong>di</strong> errore stesso!) e privo <strong>di</strong>


Tesina per il corso <strong>di</strong> Neuroscienze. - Ph.D. Scienze Cognitive. 7<br />

supervisione completa è capace <strong>di</strong> convergere in maniera comparabile alle<br />

tecniche classiche <strong>di</strong> learning non biologico, seppur con una curva d’errore<br />

soggetta a forte instabilità.<br />

References<br />

[1] M. L. Minsky and S. A. Papert, Perceptrons. An introduction to Computational<br />

Geometry. Cambridge, Mass: Cambridge Press, 1969.<br />

[2] D. Rumelhart and J. McClelland, Parallel Distributed Processing. Cambridge,<br />

Mass: MIT Press, 1986.<br />

[3] D. O. <strong>Hebb</strong>, The organization of behavior. New York: John Wiley Inc.,<br />

1949.<br />

[4] T. V. P. Bliss and T. Lømo, “Long-lasting potentiation of synaptic transmission<br />

in the dentate area of the anaesthetized rabbit following stimulation<br />

of the perforant path,” Journal of Physiology, vol. 232, pp. 331–356,<br />

1937.<br />

[5] B. Gustafsson and H. Wingström, “Physiological mechanism underlying<br />

long-term potentiation,” Trends Neuroscience, vol. 11, pp. 156–162,<br />

1988.<br />

[6] R. Malinow and R. W. Tsien, “Presynaptic enhancement shown by<br />

whole-cell recor<strong>di</strong>ngs of long-term potentiation in hippocampal slices,”<br />

Nature, vol. 335, pp. 820–824, 1990.<br />

[7] R. G. M. Morris, E. Anderson, G. S. Lynch, and M. Baudry, “Selective<br />

impairment of learning and blockade of long-term potentiation by an nmethyl-d-aspartate<br />

receptor antagonist, ap5,” Nature, vol. 319, pp. 774–<br />

776, 1986.<br />

[8] X. Bi and X. Poo, “Synaptic mo<strong>di</strong>fications in cultured hippocampal neurons:<br />

Dependence on spike timing, synaptic strength, and postsynaptic<br />

cell type,” The Journal of Neuroscience, vol. 18, no. 24, pp. 10464–10472,<br />

1998.<br />

[9] R. A. P. Mazzoni and M. Jordan, “A more biologically plausible learning<br />

rule for neural networks,” Neurobiology, vol. 88, pp. 4433–4437, 1991.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!