На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

менное состояние дел в этой быстро развивающейся области науки подробно рассмотрено нами в нескольких обзорах [37, 39, 109]. 1.4. Ограничения искусственных нейронных сетей Как и любой метод машинного обучения, искусственные нейронные сети имеют свои ограничения, которых, однако, по мере развития теории нейросетевого моделирования и общей теории обучающихся систем, становится все меньше и меньше. В начале 90-ых годов прошлого века, т.е. на момент появления первых работ по их применению для прогнозирования свойств химических соединений, такими ограничениями или даже недостатками считались следующие: • нейросеть – это «черный ящик», т.е. нейросетевые модели не поддаются интерпретации; • нейросетевые модели не могут быть точно воспроизведены ввиду инициализации весов связей перед обучением случайными числами; • нейронные сети не работают с большим числом дескрипторов; • нейросети легко «переучиваются», и тогда они хорошо воспроизводят свойства соединений, содержащихся в обучающей выборке, но при этом плохо прогнозируют свойства любых других соединений; • с помощью нейросетей ничего нельзя сделать такого, на что бы не были способны стандартные методы статистического анализа данных. Хотя перечисленные выше утверждения не всегда справедливы, они, тем не менее, указывают на реальные проблемы, с которыми столкнулись исследователи в ходе первых работ по применению нейронных сетей для прогнозирования свойств химических соединений. Без их решения нейросети не могли бы быть использованы как составная часть универсальной методологии прогнозирования свойств химических соединений. Поэтому разработка эффективных методов решения этих проблем составила важную часть диссертационной работы (см. Главу 4). 62

ГЛАВА 2. ФРАГМЕНТНЫЕ ДЕСКРИПТОРЫ В ПОИСКЕ ЗАВИСИМОСТЕЙ СТРУКТУРА-СВОЙСТВО Фрагментный дескриптор – это числовая характеристика химической структуры, показывающая, присутствует ли внутри нее определенный структурный фрагмент, либо специфицирующая сколько раз он в ней содержится. К преимуществам фрагментных дескрипторов обычно относят следующие (см. [110-116]): 1) простота и эффективность вычислений; 2) простота интерпретации со структурно-химической точки зрения; 3) базисный характер, выражающийся в возможности аппроксимировать с их помощью любую зависимость «структура-свойство». 2.1. История фрагментных дескрипторов Среди множества дескрипторов, используемых в настоящее время в исследованиях SAR/QSAR/QSPR, (см. [105]), фрагментные дескрипторы занимают особое место. Ранние работы по их применению для предсказания разнообразные свойств химических соединений датируются 50-ми, 40-ми и даже 30-ми годами прошлого столетия, когда они использовались в рамках методологии аддитивных схем. Фогель (Vogel) [117], Цан (Zahn) [118], Саудерс (Souders) [119, 120], Франклин (Franklin) [121, 122], Татевский [123], Бернштейн (Bernstein) [124], Лаидлер (Laidler) [125], Бенсон (Benson) и Басс (Buss) [126] и Аллен (Allen) [127] были первопроходцами в этом направлении. В цитированных работах все вычислительные подходы были основаны на классической структурной теории в рамках представлений об атомах и химических связях. Е.А.Смоленский был, по-видимому, первым, кто применил еще в 1964 г. язык теории графов для прогнозирования физико-химических свойств органических соединений [128]. Первые аддитивные схемы постепенно эволюционировали и превратились в современный набор методов групповых вкладов (group contribution methods). Основная отличительная черта аддитивных схем и методов групповых вкладов состоит в их тесной связи с физико-химической теорией, и по- 63

менное состояние дел в этой быстро развивающейся области науки подробно<br />

рассмотрено нами в нескольких обзорах [37, 39, 109].<br />

1.4. Ограничения искусственных нейронных сетей<br />

Как и любой метод машинного обучения, искусственные нейронные сети<br />

имеют свои ограничения, которых, однако, по мере развития теории нейросетевого<br />

моделирования и общей теории обучающихся систем, становится все<br />

меньше и меньше. В начале 90-ых годов прошлого века, т.е. на момент появления<br />

первых работ по их применению для прогнозирования свойств химических<br />

соединений, такими ограничениями или даже недостатками считались следующие:<br />

• нейросеть – это «черный ящик», т.е. нейросетевые модели не поддаются<br />

интерпретации;<br />

• нейросетевые модели не могут быть точно воспроизведены ввиду инициализации<br />

весов связей перед обучением случайными числами;<br />

• нейронные сети не работают с большим числом дескрипторов;<br />

• нейросети легко «переучиваются», и тогда они хорошо воспроизводят<br />

свойства соединений, содержащихся в обучающей выборке, но при этом<br />

плохо прогнозируют свойства любых других соединений;<br />

• с помощью нейросетей ничего нельзя сделать такого, на что бы не были<br />

способны стандартные методы статистического анализа данных.<br />

Хотя перечисленные выше утверждения не всегда справедливы, они, тем<br />

не менее, указывают на реальные проблемы, с которыми столкнулись исследователи<br />

в ходе первых работ по применению нейронных сетей для прогнозирования<br />

свойств химических соединений. Без их решения нейросети не могли бы<br />

быть использованы как составная часть универсальной методологии прогнозирования<br />

свойств химических соединений. Поэтому разработка эффективных<br />

методов решения этих проблем составила важную часть диссертационной работы<br />

(см. Главу 4).<br />

62

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!