Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
модели при помощи пошагового варианта множественной линейной регрессии и блок прогноза, которые совместно образуют программу «ЭММА» - головную программу комплекса), Д.Е.Петелин (дескрипторные блоки для расчета топологических индексов и физико-химических дескрипторов, в частности ETS, HB, HFORM, INDPAR, STERIC, VW и др.), О.Ломова (генератор химических структур GOLD [514, 515], который сейчас вполне обосновано можно назвать генератором виртуальных комбинаторных библиотек для виртуального скрининга) и А.Ю.Зотов (блок управления расчетом дескрипторов и некоторые дескрипторные блоки). Работы по созданию комплекса «ЭММА» проводились под руководством В.А.Палюлина и Н.С.Зефирова. В 1993-1995 гг. автором диссертационной работы (под руководством В.А.Палюлина и Н.С.Зефирова) была разработана для среды MS-DOS программа-эмулятор искусственных нейронных сетей, специально приспособленная для построения количественных моделей «структура-свойство», NASA (Neural Approach to Structure-Activity) [516]. При помощи этой программы были получены результаты, изложенные в подразделах 4.4.1 и 6.1 данной диссертационной работы. В 1996 г. автором диссертационной работы вместе с Н.М.Гальберштам (под руководством В.А.Палюлина и Н.С.Зефирова) была создана для среды Windows 3.1 первая версия программного комплекса NASAWIN (Neural Approach to Structure-Acivity for WINdows) [194, 517], и с тех пор он находится в постоянном развитии. Первоначально NASAWIN включала только эмулятор многослойной нейронной сети обратного распространения, перенесенный из программы NASA, и набор дескрипторных блоков, перенесенный из программного комплекса «ЭММА», при этом практически все перенесенные компоненты были перепрограммированы. Возможности дескрипторного блока FRAGMENT были существенно расширены по сравнению с версией, работавшей в комплексе «ЭММА» (работа по расширению возможностей этого блока велась вместе с Н.В.Артеменко). В ходе своего дальнейшего развития в NASAWIN было включено множество дополнительных методов статистического анализа, дескрипторных блоков, методов визуализации и архитектур нейронных сетей, в резуль- 296
тате чего NASAWIN превратился в мощный универсальный программный комплекс для построения моделей «структура-свойство» и прогнозирования свойств органических соединений. 8.2. Программный комплекс «NASAWIN» Отсутствие удобного для химика-органика инструмента, позволяющего получать, анализировать и использовать для прогноза нейросетевые модели зависимостей структура-свойство, побудило нас к разработке компьютерной программы, базирующейся на методологии искусственных нейронных сетей и ориентированной на работу с химической информацией. Программный комплекс «NASAWIN» позволяет: 1) загружать и просматривать базы данных, содержащие структуры химических соединений и их свойства; 2) вычислять наборы дескрипторов, описывающих химические структуры, и отбирать наиболее значимые; 3) выявлять и интерпретировать количественные зависимости между значениями дескрипторов и свойств химических соединений при помощи многослойной нейронной сети прямого распространения; 4) статистически оценивать полученные модели; 5) использовать полученные нейросетевые модели для прогнозирования свойств произвольных химических соединений. Программные коды написаны на языке С++ с использованием компилятора MVC++ 6.0. Программа содержит около 80000 строк. Наряду с общепринятыми алгоритмами работы с нейронными сетями, «NASAWIN» обладает множеством характерных черт, которые делают этот комплекс уникальным инструментом для исследования зависимости «структура-свойство» в химии. Рассмотрим основные возможности, которые предоставляет программа «NASAWIN» для получения нейросетевых моделей структура-свойство. 297
- Page 245 and 246: 7.1.4. Прогнозировани
- Page 247 and 248: сивов разрозненных
- Page 249 and 250: используются как т
- Page 251 and 252: были модифицирован
- Page 253 and 254: зависимости давлен
- Page 255 and 256: Объединенный набор
- Page 257 and 258: Оба механизма вклю
- Page 259 and 260: творителя, а также
- Page 261 and 262: Табл. 29. Характерис
- Page 263 and 264: набора дескрипторо
- Page 265 and 266: угодно сложные зав
- Page 267 and 268: симостей «структур
- Page 269 and 270: лей, хотя все модел
- Page 271 and 272: одновременно решае
- Page 273 and 274: Как видно приведен
- Page 275 and 276: принципе гарантиро
- Page 277 and 278: мерации атомов дос
- Page 279 and 280: бор сигналов, соотв
- Page 281 and 282: только с атомных се
- Page 283 and 284: 7.4.3. Примеры разных
- Page 285 and 286: Рис. 66. Минимальная
- Page 287 and 288: ров» ведет к ухудше
- Page 289 and 290: бензол, было отброш
- Page 291 and 292: на атому. После 4000 э
- Page 293 and 294: фов), то и все нейро
- Page 295: проведения линейно
- Page 299 and 300: 8.2.3. Химически-орие
- Page 301 and 302: 8.2.7. Нейросетевые п
- Page 303 and 304: 8.2.11. Кластеризация
- Page 305 and 306: нейросетевом прогр
- Page 307 and 308: 18 p1_Nlp Количество не
- Page 309 and 310: 43 p 4 _ SPR = ∑ R( a ) ⋅ R( a
- Page 311 and 312: делей. Программа та
- Page 313 and 314: позволяющая прогно
- Page 315 and 316: ЛИТЕРАТУРА 1. Гилле
- Page 317 and 318: 31. Aoyama T.; Ichikawa H. Neural N
- Page 319 and 320: 54. Karelson M.; Dobchev D.A.; Kuls
- Page 321 and 322: 79. Carpenter G.A.; Grossberg S. A
- Page 323 and 324: 103. Ежов А.А.; Токаев
- Page 325 and 326: 126. Benson S.W.; Buss J.H. Additiv
- Page 327 and 328: 148. Fisanick W.; Lipkus A.H.; Rusi
- Page 329 and 330: 169. Klopman G.; Macina O.T.; Levin
- Page 331 and 332: 189. Nilakantan R.; Bauman N.; Dixo
- Page 333 and 334: 209. Татевский В.М. Кл
- Page 335 and 336: ces and Related Descriptors in QSAR
- Page 337 and 338: 248. MOE, Molecular Operating Envir
- Page 339 and 340: 269. Estrada E.; Gonzalez H. What A
- Page 341 and 342: 288. Saigo H.; Kadowaki T.; Tsuda K
- Page 343 and 344: 309. Vladutz G. Modern Approaches t
- Page 345 and 346: 331. Rouvray D.H. Predicting Chemis
тате чего NASAWIN превратился в мощный универсальный программный комплекс<br />
для построения моделей «структура-свойство» и прогнозирования<br />
свойств органических соединений.<br />
8.2. Программный комплекс «NASAWIN»<br />
Отсутствие удобного для химика-органика инструмента, позволяющего<br />
получать, анализировать и использовать для прогноза нейросетевые модели зависимостей<br />
структура-свойство, побудило нас к разработке компьютерной программы,<br />
базирующейся на методологии искусственных нейронных сетей и ориентированной<br />
на работу с химической информацией.<br />
Программный комплекс «NASAWIN» позволяет:<br />
1) загружать и просматривать базы данных, содержащие структуры химических<br />
соединений и их свойства;<br />
2) вычислять наборы дескрипторов, описывающих химические структуры, и<br />
отбирать наиболее значимые;<br />
3) выявлять и интерпретировать количественные зависимости между значениями<br />
дескрипторов и свойств химических соединений при помощи многослойной<br />
нейронной сети прямого распространения;<br />
4) статистически оценивать полученные модели;<br />
5) использовать полученные нейросетевые модели для прогнозирования<br />
свойств произвольных химических соединений.<br />
Программные коды написаны на языке С++ с использованием компилятора<br />
MVC++ 6.0. Программа содержит около 80000 строк. Наряду с общепринятыми<br />
алгоритмами работы с нейронными сетями, «NASAWIN» обладает<br />
множеством характерных черт, которые делают этот комплекс уникальным инструментом<br />
для исследования зависимости «структура-свойство» в химии. Рассмотрим<br />
основные возможности, которые предоставляет программа<br />
«NASAWIN» для получения нейросетевых моделей структура-свойство.<br />
297