На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

ния от шума, поиска скрытых закономерностей в «зашумленных» объектах и выделения из них исходного объекта-прототипа. В качестве характерных примеров можно привести осуществляемый при помощи нейросетей Хопфилда поиск промоторов в ДНК [18], скрытых повторов в ДНК и реконструкцию эволюционных изменений в них [103]. Машина Больцмана. Одним из недостатков нейросетей Хопфилда является их тенденция стабилизироваться в локальном, а не глобальном минимуме функции энергии. Одним из способов преодоления этой трудности является использование стохастического варианта нейросети Хопфилда, называемого обычно машиной Больцмана. Подобное название нейросетей этого класса обусловлено тесной связью методов их описания с математическим аппаратом статистической термодинамики (а также данью уважения к ее основателю Больцману). Если в детерминированных нейронных сетях, к которым относятся нейросети Хопфилда, нейрон всегда возбуждается при превышении сетевым входом a i определенного порогового значения (которое путем введения biasпсевдонейронов всегда можно сделать нулевым), то в стохастических нейросетях, к которым относится машина Больцмана, сетевой вход определяет лишь вероятность p i перехода нейрона i в возбужденное состояние: 1 p = i 1+ exp( −a / T ) , (57) i где T – искусственная температура. Заметим, что в знаменателе этого выражения находится фактор Больцмана, показывающий вероятность пребывания системы в условиях термодинамического равновесия при температуре T на энергетическом уровне, превышающем нулевой на k·a i энергетических единиц (где k – постоянная Больцмана). При запуске машины Больцмана на выходы вычислительных нейронов заносятся начальные значения, определяемые входным вектором. Машина запускается при высоком значении искусственной температуры, и сети предоставляется возможность самостоятельно минимизировать свою энергию при управляемом извне постепенном понижении указанной температуры. После ох- 58

лаждения системы и достижения термодинамического равновесия считываются выходные значения нейронов (при неполном охлаждении считываются вероятности пребывания нейронов в активном состоянии). Поскольку описанная процедура полностью соответствует известной процедуре нахождения глобального минимума по методу искусственного закаливания (simulated annealing), то всегда можно подобрать такую скорость охлаждения системы, чтобы можно было достигнуть глобального минимума энергии. В данном случае можно говорить о «кристаллизации мысли» у нейросети, поскольку как работа нейросети, так и реальный процесс кристаллизации из расплава, описывается одним и тем же математическим аппаратом статистической термодинамики. Более того, при анализе работы машины Больцмана часто используют те же самые фазовые диаграммы состояний и таким же образом рассматривают фазовые переходы, как и в физической химии для реальных веществ и материалов. Процесс обучения машины Больцмана обычно включает стадии «активного обучения», «разобучения во время сна» и «коррекции весов» [104]. На стадии «активного обучения» поочередно закрепляют на нейронах выходные значения, задаваемые входными векторами, дают сети релаксировать до наступления равновесия и для каждой пары нейронов по всему множеству обучаю- + щих векторов определяют P ij - вероятность того, что нейроны i и j одновременно находятся в активном состоянии. На стадии «разобучения во время сна» нейросеть запускают множество раз, начав со случайных состояний, и в результате для каждой пары нейронов определяют − P ij - вероятность того, что нейроны i и j одновременно находятся в активном состоянии. И, наконец, на последней стадии проводят коррекцию весов по формуле: − Δw = η ( P + − P ), (58) ij ij ij где η – коэффициент скорости обучения. 59

лаждения системы и достижения термодинамического равновесия считываются<br />

выходные значения нейронов (при неполном охлаждении считываются вероятности<br />

пребывания нейронов в активном состоянии). Поскольку описанная процедура<br />

полностью соответствует известной процедуре нахождения глобального<br />

минимума по методу искусственного закаливания (simulated annealing), то всегда<br />

можно подобрать такую скорость охлаждения системы, чтобы можно было<br />

достигнуть глобального минимума энергии. В данном случае можно говорить о<br />

«кристаллизации мысли» у нейросети, поскольку как работа нейросети, так и<br />

реальный процесс кристаллизации из расплава, описывается одним и тем же<br />

математическим аппаратом статистической термодинамики. Более того, при<br />

анализе работы машины Больцмана часто используют те же самые фазовые<br />

диаграммы состояний и таким же образом рассматривают фазовые переходы,<br />

как и в физической химии для реальных веществ и материалов.<br />

Процесс обучения машины Больцмана обычно включает стадии «активного<br />

обучения», «разобучения во время сна» и «коррекции весов» [104]. На<br />

стадии «активного обучения» поочередно закрепляют на нейронах выходные<br />

значения, задаваемые входными векторами, дают сети релаксировать до наступления<br />

равновесия и для каждой пары нейронов по всему множеству обучаю-<br />

+<br />

щих векторов определяют P<br />

ij<br />

- вероятность того, что нейроны i и j одновременно<br />

находятся в активном состоянии. На стадии «разобучения во время сна»<br />

нейросеть запускают множество раз, начав со случайных состояний, и в результате<br />

для каждой пары нейронов определяют<br />

−<br />

P<br />

ij<br />

- вероятность того, что нейроны<br />

i и j одновременно находятся в активном состоянии. И, наконец, на последней<br />

стадии проводят коррекцию весов по формуле:<br />

−<br />

Δw = η ( P<br />

+ − P ), (58)<br />

ij<br />

ij<br />

ij<br />

где η – коэффициент скорости обучения.<br />

59

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!