На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

рует все пришедшие к нему сигналы; 2) формирует выходной сигнал путем функционального преобразования полученной суммы: oi = f ( −θ i + ∑o jωij ) , (90) j где o i – выходной сигнал нейрона i, o j – выходной сигнал нейрона j, ω ij – вес синапса, через который проходит сигнал, θ i – порог активации нейрона, f – активационная функция, имеющая обычно сигмоидный вид: f ( x) = 1/(1 + exp( −x)) . (91) Обучение нейронного устройства заключается в нахождении таких весов синапсов и порогов активации нейронов, чтобы по предъявлению на ее вход сигналов, описывающих химическую структуру, на ее выходе формировались сигналы, соответствующие прогнозируемым значениям свойств этого соединения. Предлагаемая нами нейросетевая конструкция состоит из трех основных функциональных блоков: 1 – «мозга», 2 – набора «глаз» и 3 – единого «сенсорного поля» (см. Рис. 63). Информация о химической структуре воспринимается «сенсорным полем». Далее она поступает в «глаза» и подвергается обработке, в процессе которой формируется набор сигналов, числовые значения которых не зависят от нумерации атомов в молекуле. Эти сигналы далее поступают в «мозг» для окончательной обработки, на выходе из которого формируются сигналы, соответствующие прогнозируемым значениям свойств для данного химического соединения. Таким образом, как и в традиционном подходе, промежуточно формируется набор инвариантов молекулярных графов, однако эти инварианты не являются заранее заданными и фиксированными, а «подстраиваются» под прогнозируемые свойства в процессе обучения. Рассмотрим отдельные части этой системы. «Сенсорное поле» представляет собой квадратную матрицу, номера строк и столбцов которой соответствуют номерам атомов в химическом соединении. Размер «сенсорного поля» определяется максимальным числом неводородных атомов в рассматриваемых химических структурах. Сенсоры, расположенные на диагонали матрицы (атомные сенсоры) на пересечении i-ой строки с i-ым столбцом формируют на- 278

бор сигналов, соответствующих характеристикам i-ого атома в химической структуре. Такими характеристиками могут быть номер строки и столбца соответствующего элемента в Периодической системе Менделеева, заряд атома, число присоединенных к нему атомов водорода, значение электроотрицательности и т.д. Сенсоры, расположенные вне диагонали на пересечении i-ой строки с j-ым столбцом (i ≠ j) сенсорной матрицы, формируют сигналы, характеризующие отношение между атомами i и j в химической структуре: порядок связи (если эти атомы связаны), вхождение связи в цикл, расстояние (топологическое либо геометрическое) между атомами и т.д. Каждый «глаз» состоит из: 1) одного или нескольких «коллекторов» и 2) набора идентичных «рецепторов». Сформированные в «сенсорном поле» сигналы поступают на вход «рецепторов». Принципиально важным моментом здесь является то, что все «рецепторы» внутри «глаза» обладают одинаковыми значениями весов связей и порогов активации, т.е. они представляют собой копии одного «рецептора». Каждый из «рецепторов» обрабатывает сигналы «сенсоров», поступающие с небольшого «рецептивного поля», под которым подразумевается часть «сенсорного поля», охватывающая лишь несколько атомов и связей. Внутри «глаза» каждый «рецептор» может быть однозначно идентифицирован упорядоченным вектором (v 1 , v 2 , …, v i , …, v n ), где n – число атомов в рецептивном поле, v i – порядковый номер соответствующего атома в молекуле. Такой вектор назовем идентификатором рецептора. В общем случае число «рецепторов» внутри «глаза» должно быть равно числу способов построения таких векторов N!/(N – n)!, где N – число неводородных атомов в химическом соединении, n – число атомов внутри «рецептивного поля» (такие «рецепторы» назовем n-атомными). Например, в общем случае трехатомная молекула может быть «воспринята» при помощи трех одноатомных «рецепторов» с идентификаторами (1), (2), (3), шести двухатомных «рецепторов» с идентификаторами (1,2), (2,1), (1,3), (3,1), (2,3), (3,2) и шести трехатомных «рецепторов» с идентификаторами (1,2,3), (1,3,2), (2,1,3), (3,1,2) и (3,2,1). Целиком нейронное устройство со всеми «рецепторами», необходимыми для «восприятия» данной молекулы, образует его конфигурацию для нее. Конфигурация с одним «рецепто- 279

рует все пришедшие к нему сигналы; 2) формирует выходной сигнал путем<br />

функционального преобразования полученной суммы:<br />

oi<br />

= f ( −θ i<br />

+ ∑o<br />

jωij<br />

) , (90)<br />

j<br />

где o i – выходной сигнал нейрона i, o j – выходной сигнал нейрона j, ω ij – вес синапса,<br />

через который проходит сигнал, θ i – порог активации нейрона, f – активационная<br />

функция, имеющая обычно сигмоидный вид:<br />

f ( x)<br />

= 1/(1 + exp( −x))<br />

. (91)<br />

Обучение нейронного устройства заключается в нахождении таких весов<br />

синапсов и порогов активации нейронов, чтобы по предъявлению на ее вход<br />

сигналов, описывающих химическую структуру, на ее выходе формировались<br />

сигналы, соответствующие прогнозируемым значениям свойств этого соединения.<br />

Предлагаемая нами нейросетевая конструкция состоит из трех основных<br />

функциональных блоков: 1 – «мозга», 2 – набора «глаз» и 3 – единого «сенсорного<br />

поля» (см. Рис. 63). Информация о химической структуре воспринимается<br />

«сенсорным полем». Далее она поступает в «глаза» и подвергается обработке, в<br />

процессе которой формируется набор сигналов, числовые значения которых не<br />

зависят от нумерации атомов в молекуле. Эти сигналы далее поступают в<br />

«мозг» для окончательной обработки, на выходе из которого формируются сигналы,<br />

соответствующие прогнозируемым значениям свойств для данного химического<br />

соединения. Таким образом, как и в традиционном подходе, промежуточно<br />

формируется набор инвариантов молекулярных графов, однако эти инварианты<br />

не являются заранее заданными и фиксированными, а «подстраиваются»<br />

под прогнозируемые свойства в процессе обучения.<br />

Рассмотрим отдельные части этой системы. «Сенсорное поле» представляет<br />

собой квадратную матрицу, номера строк и столбцов которой соответствуют<br />

номерам атомов в химическом соединении. Размер «сенсорного поля» определяется<br />

максимальным числом неводородных атомов в рассматриваемых<br />

химических структурах. Сенсоры, расположенные на диагонали матрицы<br />

(атомные сенсоры) на пересечении i-ой строки с i-ым столбцом формируют на-<br />

278

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!