19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Таким образом, значения невязок нейронов каждого скрытого слоя рассчитываются<br />

исходя из значений невязок нейронов последующего слоя, что<br />

можно условно описать процессом распространения ошибки в направлении,<br />

обратном распространению сигнала. Для сигмовидной передаточной функции<br />

(3) производная вычисляется по следующей формуле:<br />

−a<br />

d 1 e<br />

f '(<br />

a)<br />

= ( ) = = o(1<br />

− o)<br />

(12)<br />

− a<br />

−a<br />

2<br />

da 1+<br />

e (1 + e )<br />

Производные суммарного функционала ошибки для всей обучающей выборки<br />

могут быть получены суммированием производных индивидуальных<br />

функционалов ошибки:<br />

∂E(<br />

w)<br />

=<br />

[ n]<br />

∂w<br />

ji<br />

P<br />

∑<br />

p<br />

∂E<br />

( w)<br />

. (13)<br />

[ n]<br />

w<br />

p= 1 ∂<br />

ji<br />

Формулы (9-13) составляют суть метода обратного распространения, который<br />

можно рассматривать как очень эффективный алгоритм расчета градиента<br />

функционала ошибки нейросети в пространстве весов связей (поскольку<br />

суммарное время вычисления всех производных, число которых может быть<br />

очень велико, не превышает времени расчета самого функционала).<br />

1.2.4.4. Градиентные методы обучения<br />

Исторически первым методом обучения сетей обратного распространения<br />

явился метод Уидроу-Хоффа, называемый чаще дельта-правилом [43], который<br />

традиционно записывается в виде:<br />

Δw<br />

ji<br />

(<br />

= w − w = ηδ o , (14)<br />

t+ 1) ( t)<br />

ji ji<br />

i<br />

j<br />

ji<br />

(t)<br />

где: w - текущий вес на t-ом шагу обучения связи, идущей от нейрона j к нейрону<br />

i; δ<br />

i<br />

- невязка i-ого нейрона, получаемая по методу обратного распространения<br />

(см. выше); o j – выходное значение j-ого нейрона; η – параметр скорости<br />

обучения. Типичное значение параметра скорости обучения – 0.25, но оно может<br />

меняться в широких приделах, особенно в сторону уменьшения на окончательных<br />

этапах обучения.<br />

23

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!