Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
статистических параметров моделей по сравнению с результатами, получаемыми при использовании только фрагментных дескрипторов. Табл. 23. Статистические показатели моделей, построенных для фенолов, карбоновых кислот и азотсодержащих соединений Класс соединенистроенных Параметры моделей, по- Параметры моделей построенных с использованием только ФД с использованием ФД и квантово-химических дескрипторов Фенолы МЛР: R 2 = 0.9746, s = 0.40, МЛР: R 2 = 0.9794, s = 0.36, RMSE t = 0.38, RMSE v = 0.57 ИНС: R 2 = 0.9815, RMSE t = 0.32, RMSE v = 0.53 RMSE t = 0.33, RMSE v = 0.41 ИНС: R 2 = 0.9831, RMSE t = 0.30, RMSE v = 0.42 Карбоновые кислоты МЛР: R 2 = 0.8966, s = 0.33, RMSE t = 0.31, RMSE v = 0.51 ИНС: R 2 = 0.9115, RMSE t = 0.28, RMSE v = 0.48 МЛР: R 2 = 0.9122, s = 0.31, RMSE t = 0.28, RMSE v = 0.34 ИНС: R 2 = 0.9534, RMSE t = 0.21, RMSE v = 0.27 Азотсодержащие МЛР: R 2 = 0.9302, s = 0.99, МЛР: R 2 = 0.9611, s = 0.75, со- RMSE t = 0.93, RMSE v = 1.14 RMSE t = 0.69, RMSE v = 0.94 единения ИНС: R 2 = 0.9306, RMSE t = 0.93, RMSE v = 1.13 ИНС: R 2 = 0.9692, RMSE t = 0.62, RMSE v = 0.60 где: R 2 - коэффициент детерминации, RMSE t , RMSE v – среднеквадратичная ошибка на обучающей и контрольной выборке, , s – стандартное отклонение. Как видно из данных, приведенных в Табл. 23, лучшие статистические параметры были получены методом ИНС для фенолов. Однако в этом случае статистические параметры моделей, построенных с использованием только 20 фрагментных дескрипторов (R 2 = 0.9815, RMSE t = 0.32, RMSE v = 0.53) и дополнительных 7 квантово-химических дескрипторов (R 2 = 0.9831, RMSE t = 0.30, RMSE v = 0.41) оказались достаточно близки. В отличие от этого, улучшение статистических параметров при использовании квантово-химических дескрипторов в комбинации с фрагментными дескрипторами для моделирования pK a карбоновых кислот и азотсодержащих соединений достаточно очевидно. Так как предложенный подход оказался эффективным при моделировании трех отдельных баз данных, нами была предпринята попытка построить общую модель “структура-свойство” для общей базы данных. С целью проверки прогностической способности QSPR-моделей база данных также была раз- 236
делена на обучающую выборку (609 соединений) и контрольную выборку (67 соединений). При моделировании общей базы данных было использовано различное количество дескрипторов. Первоначально, методом БПМЛР было отобрано 226 фрагментных и 7 квантово-химических дескрипторов, а в дальнейшем осуществлялось последовательное уменьшение их числа (Табл. 24). Такой подход представляется эффективным для выявления оптимального количества дескрипторов, что, в свою очередь, дает возможность получения более устойчивой предсказательной QSPR-модели. Табл. 24. Статистические параметры QSPR-моделей построенных с использованием фрагментных и квантово-химических дескрипторов D фр /D кх R 2 RMSE обуч RMSE контр 226/7 0.9938 0.34 0.40 194/6 0.9931 0.36 0.55 96/4 0.9862 0.36 0.46 46/4 0.9832 0.56 0.64 13/2 0.9658 0.78 0.92 Анализ полученных результатов показал что модель “структура – свойство”, построенная с использованием 96 фрагментных и 4 квантовохимических дескрипторов (Рис. 49), представляется наиболее оптимальной. Как видно из Табл. 24, переход от модели, построенной на двухстах дескрипторах, к модели на ста приводит лишь к незначительному уменьшению коэффициента корреляции при сохранении значения RMSE для обучающей выборки и улучшению RMSE для контрольной выборки. При этом дальнейшее уменьшение числа дескрипторов до 50 хотя и позволяет сохранить близкий коэффициент корреляции, но приводит к резкому увеличению значений RMSE как для контрольной, так и для обучающей выборки. 237
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
- Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230: ного моделирования
- Page 231 and 232: ля и даже более сов
- Page 233 and 234: ного цианинового к
- Page 235: Значения констант
- Page 239 and 240: ность. Основной цел
- Page 241 and 242: На Рис. 50 приводятс
- Page 243 and 244: молекул с конденси
- Page 245 and 246: 7.1.4. Прогнозировани
- Page 247 and 248: сивов разрозненных
- Page 249 and 250: используются как т
- Page 251 and 252: были модифицирован
- Page 253 and 254: зависимости давлен
- Page 255 and 256: Объединенный набор
- Page 257 and 258: Оба механизма вклю
- Page 259 and 260: творителя, а также
- Page 261 and 262: Табл. 29. Характерис
- Page 263 and 264: набора дескрипторо
- Page 265 and 266: угодно сложные зав
- Page 267 and 268: симостей «структур
- Page 269 and 270: лей, хотя все модел
- Page 271 and 272: одновременно решае
- Page 273 and 274: Как видно приведен
- Page 275 and 276: принципе гарантиро
- Page 277 and 278: мерации атомов дос
- Page 279 and 280: бор сигналов, соотв
- Page 281 and 282: только с атомных се
- Page 283 and 284: 7.4.3. Примеры разных
- Page 285 and 286: Рис. 66. Минимальная
статистических параметров моделей по сравнению с результатами, получаемыми<br />
при использовании только фрагментных дескрипторов.<br />
Табл. 23. Статистические показатели моделей, построенных для фенолов, карбоновых<br />
кислот и азотсодержащих соединений<br />
Класс соединенистроенных<br />
Параметры моделей, по-<br />
Параметры моделей построенных<br />
с использованием<br />
только ФД<br />
с использованием ФД<br />
и квантово-химических дескрипторов<br />
Фенолы МЛР: R 2 = 0.9746, s = 0.40, МЛР: R 2 = 0.9794, s = 0.36,<br />
RMSE t = 0.38, RMSE v = 0.57<br />
ИНС: R 2 = 0.9815,<br />
RMSE t = 0.32, RMSE v = 0.53<br />
RMSE t = 0.33, RMSE v = 0.41<br />
ИНС: R 2 = 0.9831,<br />
RMSE t = 0.30, RMSE v = 0.42<br />
Карбоновые<br />
кислоты<br />
МЛР: R 2 = 0.8966, s = 0.33,<br />
RMSE t = 0.31, RMSE v = 0.51<br />
ИНС: R 2 = 0.9115,<br />
RMSE t = 0.28, RMSE v = 0.48<br />
МЛР: R 2 = 0.9122, s = 0.31,<br />
RMSE t = 0.28, RMSE v = 0.34<br />
ИНС: R 2 = 0.9534,<br />
RMSE t = 0.21, RMSE v = 0.27<br />
Азотсодержащие<br />
МЛР: R 2 = 0.9302, s = 0.99, МЛР: R 2 = 0.9611, s = 0.75,<br />
со-<br />
RMSE t = 0.93, RMSE v = 1.14 RMSE t = 0.69, RMSE v = 0.94<br />
единения ИНС: R 2 = 0.9306,<br />
RMSE t = 0.93, RMSE v = 1.13<br />
ИНС: R 2 = 0.9692,<br />
RMSE t = 0.62, RMSE v = 0.60<br />
где: R 2 - коэффициент детерминации, RMSE t , RMSE v – среднеквадратичная<br />
ошибка на обучающей и контрольной выборке, , s – стандартное отклонение.<br />
Как видно из данных, приведенных в Табл. 23, лучшие статистические<br />
параметры были получены методом ИНС для фенолов. Однако в этом случае<br />
статистические параметры моделей, построенных с использованием только 20<br />
фрагментных дескрипторов (R 2 = 0.9815, RMSE t = 0.32, RMSE v = 0.53) и дополнительных<br />
7 квантово-химических дескрипторов (R 2 = 0.9831, RMSE t = 0.30,<br />
RMSE v = 0.41) оказались достаточно близки. В отличие от этого, улучшение<br />
статистических параметров при использовании квантово-химических дескрипторов<br />
в комбинации с фрагментными дескрипторами для моделирования pK a<br />
карбоновых кислот и азотсодержащих соединений достаточно очевидно.<br />
Так как предложенный подход оказался эффективным при моделировании<br />
трех отдельных баз данных, нами была предпринята попытка построить<br />
общую модель “структура-свойство” для общей базы данных. С целью проверки<br />
прогностической способности QSPR-моделей база данных также была раз-<br />
236