Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
адаптивно настраиваемого темпа обучения на t-ой итерации для связи, соединяющей<br />
нейрон i c нейроном j.<br />
Если знак производной по данному весу изменил направление, то это означает,<br />
что величина шага по данной координате слишком велика, и поэтому<br />
алгоритм уменьшает ее в η - раз. В противном же случае шаг увеличивается в η +<br />
раз для ускорения обучения вдали от минимума.<br />
1.2.4.6. Методы сопряженных градиентов<br />
Методы сопряженных градиентов [48, 49], так же как и в случае расширенного<br />
дельта-правила, осуществляют на каждом шаге обучения движение в<br />
направлении, получаемом путем комбинирования направления антиградиента и<br />
направления движения на предыдущем шаге. Принципиальное же отличие методов<br />
сопряженных градиентов от последнего заключается в том, что размер<br />
шага в выбранном направлении не является фиксированным, а определяется на<br />
каждой итерации при помощи процедуры одномерного поиска минимума вдоль<br />
выбранного направления.<br />
Все алгоритмы методов сопряженных градиентов на первой итерации начинают<br />
поиск в направлении антиградиента:<br />
⎛ ∂E(<br />
w)<br />
⎞<br />
⎜ ⎟<br />
⎜ ∂w<br />
j(1)<br />
i(1)<br />
⎟<br />
(1) (1)<br />
p = −g<br />
= −∇E(<br />
w)<br />
= −⎜<br />
M ⎟<br />
(23)<br />
⎜ ∂E(<br />
w)<br />
⎟<br />
⎜<br />
∂w<br />
⎟<br />
j(<br />
M ) i(<br />
M )<br />
⎝ ⎠<br />
где: p (t) – вектор направления, вдоль которой ведется поиск на t-ой итерации; g (t)<br />
– вектор градиента функционала ошибки нейросети в пространстве весов связей<br />
на t-ой итерации; j(m) – номер нейрона, из которого выходит связь m; i(m) –<br />
номер нейрона, в который входит связь m; M – число связей в нейросети.<br />
После выбора направления определяется оптимальный шаг поиска α (t) , на<br />
величину которого меняются все веса связей по формуле:<br />
w<br />
( t + 1)<br />
( t)<br />
( t)<br />
( t)<br />
j(<br />
m)<br />
i(<br />
m)<br />
= w<br />
j(<br />
m)<br />
i(<br />
m)<br />
+ α p , (24)<br />
m<br />
29