Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
ванием скользящего контроля с исключением по одному соединению. По своим статистическим показателям полученные модели сопоставимы с цитируемыми в литературе, а в ряде случаев их превосходят. Так, регрессионная модель, построенная для Базы 1 на 4 фрагментных дескрипторах (длина цепочки во фрагменте 15 атомов) имеет показатели (R 2 обуч. = 0,967 кДж·моль -1 ; F = 181,6; квадрат коэффициента корреляции при скользящем контроле, Q 2 = 0,949; стандартное отклонение, s = 0,66 кДж·моль -1 ; среднеквадратичная ошибка, RMSE ск = 0,74 кДж·моль -1 ; стандартное отклонение при скользящем контроле, s ск = 0,80 кДж·моль -1 ), превосходящие параметры лучшей регрессионной модели, полученной для этой же выборки на основе использования в качестве дескрипторов энергий высшей занятой и низшей свободной молекулярных орбиталей Е HOMO , Е LUMO и среднего арифметического между ними, (3 дескриптора, R 2 обуч. = 0,92; стандартное отклонение, s = 1,02 кДж·моль -1 ; F = 95,0; Q 2 = 0,89; стандартная ошибка при скользящем контроле 1,19) [390]. Для PLS CoMFA [390] и CoMSA моделей [394] значения Q 2 лежат в пределах 0,63-0,75 и 0,829-0,970, соответственно. В полученную модель входят дескрипторы, описывающие следующие фрагменты молекул азо-соединений: =RC–С, RC Ar ÷C Ar –NH 2 , •=•–•÷•÷•÷• (• - произвольный атом) и С–С–С÷(С÷) 2 С–N=N–С÷(С÷) 4 С–N. Фрагментные модели, построенные для выборки антрахиноновых красителей (База 2), по прогнозирующим свойствам также не уступают литературным моделям [394]. Квадрат коэффициента корреляции при скользящем контроле модели, включающей 8 дескрипторов (цепочки из 15 атомов), (R 2 обуч. = 0,942; s = 0,46; F = 81,5; Q 2 = 0,915; RMSE ск = 0,50 кДж·моль -1 ; s ск = 0,55 кДж·моль -1 ), превышает максимальное значение Q 2 (0,88) CoMSA модели [394]. Наиболее значителен вклад фрагментов: RC Ar , C Ar –N 3 sp –C, HC Ar ÷C Ar –NHR и C sp 3 ―O―(C Ar ÷) 7 C Ar ―N sp 3 . На основе слияния узких выборок азо- и антрахиноновых красителей (База 3) мы получили более универсальную модель для описания сродства краситель-целлюлоза и оценили ее прогнозирующую способность при помощи скользящего контроля. Модель включает 10 фрагментных дескрипторов (цепочки из 15 атомов) и имеет следующие характеристики: R 2 обуч. = 0, 954; Q 2 = 182
0,935; s = 0,76 кДж·моль -1 ; F = 139,5; s ск = 0,89 кДж·моль -1 ; RMSE ск = 0,83 кДж·моль -1 : -∆µ 0 = -0.49 + 2.19 Fr1 – 1.03 Fr2 – 1.01 Fr3 – 0.56 Fr4 + 3.13 Fr5 + 0.21 Fr6 + 0.11 Fr7 + 0.85 Fr8 + 0.45 Fr9 + 1.10 Fr10 (1) Где R 2 обуч. = 0, 954; Q 2 = 0,937; s = 0,70 кДж·моль -1 ; F = 139,5; s ск = 0,82 кДж·моль -1 ; RMSE ск = 0,76 кДж·моль -1 ; Fr1/С Ar ― N, Fr2/С sp3― N 3 sp ― С, Fr3/HС Ar ÷C Ar ― NH 2 , Fr4/RС Ar ÷C Ar ― N, Fr5/N sp 3 ― C Ar ÷C Ar ―N= , Fr6/•–•÷•÷•÷•–•, Fr7/C―(C÷) 6 C, Fr8/C sp 3 ―O―(C Ar ÷) 7 C Ar ―N 3 sp , Fr9/C Ar ÷(C Ar ÷) 3 C Ar ―N=N―C Ar ÷(C Ar ÷) 2 C Ar ―C=C, Fr10/N sp 3 ―C Ar ÷(C Ar ÷) 4 C Ar ―N=N―C Ar ÷(C Ar ÷) 2 C Ar ―N sp 3 Наибольший вклад в модель вносят фрагментные дескрипторы RС Ar ―N, и N 3 sp ―C Ar ÷C Ar ―N=. Таким образом на основе дескрипторов, учитывающих фрагментный состав молекулы, предложены линейно-регрессионные QSPRмодели, позволяющие прогнозировать сродство азо- и антрахиноновых красителей к целлюлозному волокну. Этим примером продемонстрировано, что предложенные фрагментные дескрипторы в сочетании со статистическим аппаратом множественной линейной регрессии являются мощным инструментом для прогнозирования сложных промышленно-важных свойств органических соединений. 5.3. Фрагментные дескрипторы с «выделенными» атомами Мы предлагаем подход, который позволяет значительно расширить круг свойств, для прогнозирования которых можно применять фрагментные дескрипторы за счет указания специальных «выделенных» атомов, играющих специфическую роль в природе моделируемого свойства. Например, при моделировании константы основности аминов логично отметить тот самый атом азота внутри химической структуры, который участвует в рассматриваемом кислотно-основном равновесии. Суть предлагаемого метода заключается в том, что: 1) такие «выделенные» атомы помечаются определенными метками в соответст- 183
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159 and 160: 5.2.1. Прогнозировани
- Page 161 and 162: зей, а также учитыв
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165 and 166: Построение QSPR-моде
- Page 167 and 168: работе [268], но с при
- Page 169 and 170: ляются удобным инс
- Page 171 and 172: чета этого свойств
- Page 173 and 174: База 2 (88 соединений
- Page 175 and 176: «редких фрагментов
- Page 177 and 178: пользовании 25 деск
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181: На первом этапе раб
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
- Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230: ного моделирования
- Page 231 and 232: ля и даже более сов
0,935; s = 0,76 кДж·моль -1 ; F = 139,5; s ск = 0,89 кДж·моль -1 ; RMSE ск = 0,83<br />
кДж·моль -1 :<br />
-∆µ 0 = -0.49 + 2.19 Fr1 – 1.03 Fr2 – 1.01 Fr3 – 0.56 Fr4 + 3.13 Fr5 + 0.21 Fr6 + 0.11<br />
Fr7 + 0.85 Fr8 + 0.45 Fr9 + 1.10 Fr10 (1)<br />
Где R 2 обуч. = 0, 954; Q 2 = 0,937; s = 0,70 кДж·моль -1 ; F = 139,5; s ск = 0,82<br />
кДж·моль -1 ; RMSE ск = 0,76 кДж·моль -1 ;<br />
Fr1/С Ar ― N, Fr2/С sp3― N 3 sp ― С, Fr3/HС Ar ÷C Ar ― NH 2 , Fr4/RС Ar ÷C Ar ― N,<br />
Fr5/N sp 3 ― C Ar ÷C Ar ―N= , Fr6/•–•÷•÷•÷•–•, Fr7/C―(C÷) 6 C,<br />
Fr8/C sp 3 ―O―(C Ar ÷) 7 C Ar ―N 3 sp ,<br />
Fr9/C Ar ÷(C Ar ÷) 3 C Ar ―N=N―C Ar ÷(C Ar ÷) 2 C Ar ―C=C,<br />
Fr10/N sp 3 ―C Ar ÷(C Ar ÷) 4 C Ar ―N=N―C Ar ÷(C Ar ÷) 2 C Ar ―N sp 3<br />
Наибольший вклад в модель вносят фрагментные дескрипторы RС Ar ―N,<br />
и N 3 sp ―C Ar ÷C Ar ―N=. Таким образом на основе дескрипторов, учитывающих<br />
фрагментный состав молекулы, предложены линейно-регрессионные QSPRмодели,<br />
позволяющие прогнозировать сродство азо- и антрахиноновых красителей<br />
к целлюлозному волокну. Этим примером продемонстрировано, что<br />
предложенные фрагментные дескрипторы в сочетании со статистическим аппаратом<br />
множественной линейной регрессии являются мощным инструментом<br />
для прогнозирования сложных промышленно-важных свойств органических<br />
соединений.<br />
5.3. Фрагментные дескрипторы с «выделенными» атомами<br />
Мы предлагаем подход, который позволяет значительно расширить круг<br />
свойств, для прогнозирования которых можно применять фрагментные дескрипторы<br />
за счет указания специальных «выделенных» атомов, играющих специфическую<br />
роль в природе моделируемого свойства. Например, при моделировании<br />
константы основности аминов логично отметить тот самый атом азота<br />
внутри химической структуры, который участвует в рассматриваемом кислотно-основном<br />
равновесии. Суть предлагаемого метода заключается в том, что: 1)<br />
такие «выделенные» атомы помечаются определенными метками в соответст-<br />
183