Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
ГЛАВА 6. СОЧЕТАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ И<br />
ФРАГМЕНТНЫХ ДЕСКРИПТОРОВ<br />
Данная глава посвящена изучению эффекта от совместного использования<br />
искусственных нейронных сетей и фрагментных дескрипторов. На большом<br />
числе примеров проводится сравнение с линейными моделями, построенными<br />
на тех же базах данных с применением тех же самых дескрипторов.<br />
6.1. Первые свидетельства эффективности совместного использования искусственных<br />
нейронных сетей и фрагментных дескрипторов<br />
В 1993 г. мы опубликовали статью, в которой искусственные нейронные<br />
сети и пошаговая множественная линейная регрессия были систематически<br />
применены при построении количественных корреляций «структура-свойства»<br />
(QSPR-моделей) для разнообразных физико-химических свойств углеводородов<br />
(главным образом, алканов) [406]. В частности, были построены модели для<br />
прогнозирования: 1) температуры алканов (выборка, насчитывающая 177 соединений,<br />
была взята из справочника [407]); 2) температуры плавления алканов<br />
(выборка, насчитывающая 90 соединений, была взята из справочника [407]); 3)<br />
октанового числа алканов, алкенов и циклоалкенов (выборка, насчитывающая<br />
153 соединения, была взята из работы [408]); 4) одновременно шести свойств<br />
(молярного объема, молярной рефракции, теплоты испарения, критической<br />
температуры, критического давления и поверхностного натяжения) алканов<br />
(выборка, насчитывающая 69 соединений, была взята с работы [409]).<br />
В ходе исследования два альтернативных набора дескрипторов были использованы<br />
для описания химических структур: топологические индексы (ТИ)<br />
[326] и фрагментные дескрипторы (ФД) [356]. Набор топологических индексов<br />
включал индексы молекулярной связности 0 χ, 1 χ, 2 χ, 3 χ p , 3 χ c , 4 χ p , 4 χ pc , индекс Винера<br />
W и индексы молекулярной формы 0 κ, 1 κ, 2 κ, 3 κ. Топологические индексы<br />
рассчитывались при помощи разработанных нами дескрипторных блоков<br />
CONNECT, BALABAN и KAPPA. В качестве структурных фрагментов брались<br />
198