На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

модели при помощи пошагового варианта множественной линейной регрессии и блок прогноза, которые совместно образуют программу «ЭММА» - головную программу комплекса), Д.Е.Петелин (дескрипторные блоки для расчета топологических индексов и физико-химических дескрипторов, в частности ETS, HB, HFORM, INDPAR, STERIC, VW и др.), О.Ломова (генератор химических структур GOLD [514, 515], который сейчас вполне обосновано можно назвать генератором виртуальных комбинаторных библиотек для виртуального скрининга) и А.Ю.Зотов (блок управления расчетом дескрипторов и некоторые дескрипторные блоки). Работы по созданию комплекса «ЭММА» проводились под руководством В.А.Палюлина и Н.С.Зефирова. В 1993-1995 гг. автором диссертационной работы (под руководством В.А.Палюлина и Н.С.Зефирова) была разработана для среды MS-DOS программа-эмулятор искусственных нейронных сетей, специально приспособленная для построения количественных моделей «структура-свойство», NASA (Neural Approach to Structure-Activity) [516]. При помощи этой программы были получены результаты, изложенные в подразделах 4.4.1 и 6.1 данной диссертационной работы. В 1996 г. автором диссертационной работы вместе с Н.М.Гальберштам (под руководством В.А.Палюлина и Н.С.Зефирова) была создана для среды Windows 3.1 первая версия программного комплекса NASAWIN (Neural Approach to Structure-Acivity for WINdows) [194, 517], и с тех пор он находится в постоянном развитии. Первоначально NASAWIN включала только эмулятор многослойной нейронной сети обратного распространения, перенесенный из программы NASA, и набор дескрипторных блоков, перенесенный из программного комплекса «ЭММА», при этом практически все перенесенные компоненты были перепрограммированы. Возможности дескрипторного блока FRAGMENT были существенно расширены по сравнению с версией, работавшей в комплексе «ЭММА» (работа по расширению возможностей этого блока велась вместе с Н.В.Артеменко). В ходе своего дальнейшего развития в NASAWIN было включено множество дополнительных методов статистического анализа, дескрипторных блоков, методов визуализации и архитектур нейронных сетей, в резуль- 296

тате чего NASAWIN превратился в мощный универсальный программный комплекс для построения моделей «структура-свойство» и прогнозирования свойств органических соединений. 8.2. Программный комплекс «NASAWIN» Отсутствие удобного для химика-органика инструмента, позволяющего получать, анализировать и использовать для прогноза нейросетевые модели зависимостей структура-свойство, побудило нас к разработке компьютерной программы, базирующейся на методологии искусственных нейронных сетей и ориентированной на работу с химической информацией. Программный комплекс «NASAWIN» позволяет: 1) загружать и просматривать базы данных, содержащие структуры химических соединений и их свойства; 2) вычислять наборы дескрипторов, описывающих химические структуры, и отбирать наиболее значимые; 3) выявлять и интерпретировать количественные зависимости между значениями дескрипторов и свойств химических соединений при помощи многослойной нейронной сети прямого распространения; 4) статистически оценивать полученные модели; 5) использовать полученные нейросетевые модели для прогнозирования свойств произвольных химических соединений. Программные коды написаны на языке С++ с использованием компилятора MVC++ 6.0. Программа содержит около 80000 строк. Наряду с общепринятыми алгоритмами работы с нейронными сетями, «NASAWIN» обладает множеством характерных черт, которые делают этот комплекс уникальным инструментом для исследования зависимости «структура-свойство» в химии. Рассмотрим основные возможности, которые предоставляет программа «NASAWIN» для получения нейросетевых моделей структура-свойство. 297

тате чего NASAWIN превратился в мощный универсальный программный комплекс<br />

для построения моделей «структура-свойство» и прогнозирования<br />

свойств органических соединений.<br />

8.2. Программный комплекс «NASAWIN»<br />

Отсутствие удобного для химика-органика инструмента, позволяющего<br />

получать, анализировать и использовать для прогноза нейросетевые модели зависимостей<br />

структура-свойство, побудило нас к разработке компьютерной программы,<br />

базирующейся на методологии искусственных нейронных сетей и ориентированной<br />

на работу с химической информацией.<br />

Программный комплекс «NASAWIN» позволяет:<br />

1) загружать и просматривать базы данных, содержащие структуры химических<br />

соединений и их свойства;<br />

2) вычислять наборы дескрипторов, описывающих химические структуры, и<br />

отбирать наиболее значимые;<br />

3) выявлять и интерпретировать количественные зависимости между значениями<br />

дескрипторов и свойств химических соединений при помощи многослойной<br />

нейронной сети прямого распространения;<br />

4) статистически оценивать полученные модели;<br />

5) использовать полученные нейросетевые модели для прогнозирования<br />

свойств произвольных химических соединений.<br />

Программные коды написаны на языке С++ с использованием компилятора<br />

MVC++ 6.0. Программа содержит около 80000 строк. Наряду с общепринятыми<br />

алгоритмами работы с нейронными сетями, «NASAWIN» обладает<br />

множеством характерных черт, которые делают этот комплекс уникальным инструментом<br />

для исследования зависимости «структура-свойство» в химии. Рассмотрим<br />

основные возможности, которые предоставляет программа<br />

«NASAWIN» для получения нейросетевых моделей структура-свойство.<br />

297

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!