Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Модель получена с помощью метода ИНС и имеет следующие параметры прогнозирующей способности: Q 2 DCV = 0.8561, RMSE DCV = 0.520 и MAE DCV = 0.41. Диаграмма разброса для нее представлена на Рис. 40. Прогноз, log 1/EC50 9 7 5 3 3 5 7 9 Эксперимент, log 1/EC50 Рис. 40. Диаграмма разброса для ингибирования обратной транскриптазы вируса ВИЧ-1 производными HEPT Рассматриваемый пример иллюстрирует возможность применения фрагментных дескрипторов с «выделенными» атомами для количественного прогнозирования биологической активности органических соединений внутри рядов соединений с одинаковым общим фрагментом (скелетом). Следует отметить, что обычно фрагментные дескрипторы редко используются для этой цели, поскольку аппроксимируемый с их помощью вклад конкретной группировки атомов в общее свойство оказывается независимым от того, где именно внутри химической структуры она находится. Поскольку это плохо соотносится с природой биологической активности, которая связана с точным пространственноэлектронным распознаванием молекул, то это часто приводит к плохой прогнозирующей способности построенных QSAR-моделей и к невозможности их интерпретации с целью выявления факторов, влияющих на биологическую активность. Предлагаемые фрагментные дескрипторы с «выделенными» атомами полностью решают эту проблему, поскольку позволяют позиционировать все рассматриваемые фрагменты относительно заранее заданных внутри химиче- 188
ской структуры «реперных точек». На приведенной на Рис. 40 общей структуре для рассматриваемого ряда соединений такими «реперными точками» являются места подсоединений заместителей к общему скелету, которые мы «выделили» путем приписывания им меток a, b, c и d. Благодаря этому аппроксимируемый при помощи фрагментных дескрипторов с «выделенными» таким образом атомами вклад группировки атомов в общую биологическую активность оказывается зависимым от ее положения внутри химической структуры. Это приводит не только к существенному росту прогнозирующей способности получающихся QSAR-моделей, но и делает их легко интерпретируемой со структурнохимической точки зрения, поскольку значения регрессионных коэффициентов в линейных моделях и введенной нами характеристики M x (см. раздел 4.2) для нейросетевых моделей четко показывают, какая группировка атомов в каком положении вносит какой вклад в биологическую активность, и, следовательно, какие изменения нужно внести для ее оптимизации. Более того, рассмотрение характеристик M xy (см. раздел 4.2) позволяет выявить синнергию и диссинергию во влиянии различных группировок атомов на биологическую активность. В определенном смысле предлагаемый подход можно считать дальнейшим развитием классического метода Фри-Вильсона [129]. 5.3.3. Прогнозирование констант скорости гидролиза эфиров карбоновых кислот База данных, содержащая сведения по константам скорости гидролиза, измеренным в диапазоне температур от 0 до 154°С в бинарных системах вода:растворитель (концентрация неводного компонента 0-98%), для 2092 эфиров карбоновых кислот, была использована для прогнозирования константы скорости реакции, lg k [397, 398]. В зависимости от природы заместителей у атомов С и О кислотного остатка эфиров экспериментальные значения lg k изменялись от -7.53 до -0.17. QSPR-модели строили с помощью метода ИНС с использованием в качестве дескрипторов температуры, концентрации органических растворителей, параметров, характеризующих их свойства [398], а также фрагментов, со- 189
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159 and 160: 5.2.1. Прогнозировани
- Page 161 and 162: зей, а также учитыв
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165 and 166: Построение QSPR-моде
- Page 167 and 168: работе [268], но с при
- Page 169 and 170: ляются удобным инс
- Page 171 and 172: чета этого свойств
- Page 173 and 174: База 2 (88 соединений
- Page 175 and 176: «редких фрагментов
- Page 177 and 178: пользовании 25 деск
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187: почечных фрагменто
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
- Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230: ного моделирования
- Page 231 and 232: ля и даже более сов
- Page 233 and 234: ного цианинового к
- Page 235 and 236: Значения констант
- Page 237 and 238: делена на обучающу
Модель получена с помощью метода ИНС и имеет следующие параметры<br />
прогнозирующей способности: Q 2 DCV = 0.8561, RMSE DCV = 0.520 и MAE DCV =<br />
0.41. Диаграмма разброса для нее представлена на Рис. 40.<br />
Прогноз, log 1/EC50<br />
9<br />
7<br />
5<br />
3<br />
3 5 7 9<br />
Эксперимент, log 1/EC50<br />
Рис. 40. Диаграмма разброса для ингибирования обратной транскриптазы вируса<br />
ВИЧ-1 производными HEPT<br />
Рассматриваемый пример иллюстрирует возможность применения фрагментных<br />
дескрипторов с «выделенными» атомами для количественного прогнозирования<br />
биологической активности органических соединений внутри рядов<br />
соединений с одинаковым общим фрагментом (скелетом). Следует отметить,<br />
что обычно фрагментные дескрипторы редко используются для этой цели,<br />
поскольку аппроксимируемый с их помощью вклад конкретной группировки<br />
атомов в общее свойство оказывается независимым от того, где именно внутри<br />
химической структуры она находится. Поскольку это плохо соотносится с природой<br />
биологической активности, которая связана с точным пространственноэлектронным<br />
распознаванием молекул, то это часто приводит к плохой прогнозирующей<br />
способности построенных QSAR-моделей и к невозможности их интерпретации<br />
с целью выявления факторов, влияющих на биологическую активность.<br />
Предлагаемые фрагментные дескрипторы с «выделенными» атомами<br />
полностью решают эту проблему, поскольку позволяют позиционировать все<br />
рассматриваемые фрагменты относительно заранее заданных внутри химиче-<br />
188