На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

модели при помощи пошагового варианта множественной линейной регрессии и блок прогноза, которые совместно образуют программу «ЭММА» - головную программу комплекса), Д.Е.Петелин (дескрипторные блоки для расчета топологических индексов и физико-химических дескрипторов, в частности ETS, HB, HFORM, INDPAR, STERIC, VW и др.), О.Ломова (генератор химических структур GOLD [514, 515], который сейчас вполне обосновано можно назвать генератором виртуальных комбинаторных библиотек для виртуального скрининга) и А.Ю.Зотов (блок управления расчетом дескрипторов и некоторые дескрипторные блоки). Работы по созданию комплекса «ЭММА» проводились под руководством В.А.Палюлина и Н.С.Зефирова. В 1993-1995 гг. автором диссертационной работы (под руководством В.А.Палюлина и Н.С.Зефирова) была разработана для среды MS-DOS программа-эмулятор искусственных нейронных сетей, специально приспособленная для построения количественных моделей «структура-свойство», NASA (Neural Approach to Structure-Activity) [516]. При помощи этой программы были получены результаты, изложенные в подразделах 4.4.1 и 6.1 данной диссертационной работы. В 1996 г. автором диссертационной работы вместе с Н.М.Гальберштам (под руководством В.А.Палюлина и Н.С.Зефирова) была создана для среды Windows 3.1 первая версия программного комплекса NASAWIN (Neural Approach to Structure-Acivity for WINdows) [194, 517], и с тех пор он находится в постоянном развитии. Первоначально NASAWIN включала только эмулятор многослойной нейронной сети обратного распространения, перенесенный из программы NASA, и набор дескрипторных блоков, перенесенный из программного комплекса «ЭММА», при этом практически все перенесенные компоненты были перепрограммированы. Возможности дескрипторного блока FRAGMENT были существенно расширены по сравнению с версией, работавшей в комплексе «ЭММА» (работа по расширению возможностей этого блока велась вместе с Н.В.Артеменко). В ходе своего дальнейшего развития в NASAWIN было включено множество дополнительных методов статистического анализа, дескрипторных блоков, методов визуализации и архитектур нейронных сетей, в резуль- 296

тате чего NASAWIN превратился в мощный универсальный программный комплекс для построения моделей «структура-свойство» и прогнозирования свойств органических соединений. 8.2. Программный комплекс «NASAWIN» Отсутствие удобного для химика-органика инструмента, позволяющего получать, анализировать и использовать для прогноза нейросетевые модели зависимостей структура-свойство, побудило нас к разработке компьютерной программы, базирующейся на методологии искусственных нейронных сетей и ориентированной на работу с химической информацией. Программный комплекс «NASAWIN» позволяет: 1) загружать и просматривать базы данных, содержащие структуры химических соединений и их свойства; 2) вычислять наборы дескрипторов, описывающих химические структуры, и отбирать наиболее значимые; 3) выявлять и интерпретировать количественные зависимости между значениями дескрипторов и свойств химических соединений при помощи многослойной нейронной сети прямого распространения; 4) статистически оценивать полученные модели; 5) использовать полученные нейросетевые модели для прогнозирования свойств произвольных химических соединений. Программные коды написаны на языке С++ с использованием компилятора MVC++ 6.0. Программа содержит около 80000 строк. Наряду с общепринятыми алгоритмами работы с нейронными сетями, «NASAWIN» обладает множеством характерных черт, которые делают этот комплекс уникальным инструментом для исследования зависимости «структура-свойство» в химии. Рассмотрим основные возможности, которые предоставляет программа «NASAWIN» для получения нейросетевых моделей структура-свойство. 297

модели при помощи пошагового варианта множественной линейной регрессии<br />

и блок прогноза, которые совместно образуют программу «ЭММА» - головную<br />

программу комплекса), Д.Е.Петелин (дескрипторные блоки для расчета топологических<br />

индексов и физико-химических дескрипторов, в частности ETS, HB,<br />

HFORM, INDPAR, STERIC, VW и др.), О.Ломова (генератор химических<br />

структур GOLD [514, 515], который сейчас вполне обосновано можно назвать<br />

генератором виртуальных комбинаторных библиотек для виртуального скрининга)<br />

и А.Ю.Зотов (блок управления расчетом дескрипторов и некоторые дескрипторные<br />

блоки). Работы по созданию комплекса «ЭММА» проводились<br />

под руководством В.А.Палюлина и Н.С.Зефирова.<br />

В 1993-1995 гг. автором диссертационной работы (под руководством<br />

В.А.Палюлина и Н.С.Зефирова) была разработана для среды MS-DOS программа-эмулятор<br />

искусственных нейронных сетей, специально приспособленная<br />

для построения количественных моделей «структура-свойство», NASA (Neural<br />

Approach to Structure-Activity) [516]. При помощи этой программы были получены<br />

результаты, изложенные в подразделах 4.4.1 и 6.1 данной диссертационной<br />

работы.<br />

В 1996 г. автором диссертационной работы вместе с Н.М.Гальберштам<br />

(под руководством В.А.Палюлина и Н.С.Зефирова) была создана для среды<br />

Windows 3.1 первая версия программного комплекса NASAWIN (Neural Approach<br />

to Structure-Acivity for WINdows) [194, 517], и с тех пор он находится в<br />

постоянном развитии. Первоначально NASAWIN включала только эмулятор<br />

многослойной нейронной сети обратного распространения, перенесенный из<br />

программы NASA, и набор дескрипторных блоков, перенесенный из программного<br />

комплекса «ЭММА», при этом практически все перенесенные компоненты<br />

были перепрограммированы. Возможности дескрипторного блока FRAGMENT<br />

были существенно расширены по сравнению с версией, работавшей в комплексе<br />

«ЭММА» (работа по расширению возможностей этого блока велась вместе с<br />

Н.В.Артеменко). В ходе своего дальнейшего развития в NASAWIN было включено<br />

множество дополнительных методов статистического анализа, дескрипторных<br />

блоков, методов визуализации и архитектур нейронных сетей, в резуль-<br />

296

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!