Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Табл. 5. Статистические характеристики QSPR-моделей для энтальпии сублимации (в ккал/моль) Модель База Обучающая выборка Контрольная выборка N дескр R 2 s R 2 прогн MAE прогн 1 1 3 0.924 2.38 0.769 2.7 2 2 3 0.852 2.92 0.752 2.41 3 3 2 0.845 2.97 0.816 2.16 Естественно, что, имея в распоряжении Базу 3, было интересным получить QSPR-модель, используя расширенную обучающую выборку. С этой целью в качестве обучающей выборки использовались соединения 1-62 (База 1), 73-88 (База 2) и 13 соединений ряда хлорированных дифенилов (см. выше). Контрольная выборка включала в соответствии с работой [381] те же 10 соединений (63-72), но была дополнена тремя соединениями ряда хлорированных дифенилов: мы взяли два соединения, использованных для прогноза в работе [384],. Таким образом, обучающая выборка состояла из 91, а контрольная выборка из 13 соединений. Построенная QSPR-модель (Модель 2, Табл. 5 на стр. 174) отличается хорошей предсказательной способностью, превосходящей показатели Модели 1, и позволяет прогнозировать исследуемое свойство для соединений ряда хлорированных дифенилов. Средняя ошибка на прогнозе 2.4 ккал/моль (модель на основе трех дескрипторов). Наконец, рассмотрение структур, выпадающих из корреляции, привело к идее изменить обучающую и контрольную выборки следующим образом: мы перенесли две структуры адамантан и диметилглиоксим, из контрольной в обучающую выборку, а муравьиную кислоту, наоборот, из обучающей в контрольную выборку. Таким образом, обучающая выборка состояла из 92, а контрольная выборка из 12 соединений. Построенная QSPR-модель (Модель 3, Табл. 5 на стр. 233) имеет лучшую прогнозирующую способность по сравнению с моделями 1 и 2. Столь резкое понижение ошибки прогноза на контрольной выборке при столь небольшой модификации разбивки данных на обучающую и контрольную выборку, однако, свидетельствует о наличии проблемы 174
«редких фрагментов», когда отдельные соединения из контрольной выборки содержат фрагменты, плохо представленные в обучающей выборке. Уравнение, соответствующее модели, полученной на основе трех фрагментных дескрипторов (Модель 3, Табл. 5 на стр. 174), которая характеризуется высокой прогнозирующей способностью, приведено ниже: Δ sub Hрасч. = +5.57 + 1.23 ƒr1 + 6.92ƒr2 + 6.95ƒr3 (1) n = 104, r 2 = 0.8450, s = 2.97 ккал/моль, F = 160, средняя ошибка (по модулю) на прогнозе 2.16 ккал/моль, где ƒr1 – число любых неводородных атомов, ●; ƒr2 - количество фрагментов вида =СR-OH; ƒr3 - количество фрагментов вида N sp3 - C=O. На рисунках Рис. 35 приведен разброс экспериментальных и расчетных значений энтальпии сублимации, соответствующий данной модели. Рис. 35.Диаграмма разброса расчетных и экспериментальных значений энтальпии сублимации для обучающей (слева) и контрольной (справа) выборок из Базы 3 согласно линейно-регрессионной модели (уравнение 1) . Таким образом, впервые исследованы энтальпии сублимации органических соединений различных классов в рамках фрагментного подхода на основе метода QSPR. Показано, что данная методология позволяет получить модели расчета энтальпии сублимации с параметрами, сравнимыми, а в ряде случаев превосходящими характеристики регрессионных уравнений, предложенных в литературе. Иными словами, предложена модель, позволяющая прогнозировать 175
- Page 123 and 124: • D x - среднее значе
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159 and 160: 5.2.1. Прогнозировани
- Page 161 and 162: зей, а также учитыв
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165 and 166: Построение QSPR-моде
- Page 167 and 168: работе [268], но с при
- Page 169 and 170: ляются удобным инс
- Page 171 and 172: чета этого свойств
- Page 173: База 2 (88 соединений
- Page 177 and 178: пользовании 25 деск
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
«редких фрагментов», когда отдельные соединения из контрольной выборки<br />
содержат фрагменты, плохо представленные в обучающей выборке.<br />
Уравнение, соответствующее модели, полученной на основе трех фрагментных<br />
дескрипторов (Модель 3, Табл. 5 на стр. 174), которая характеризуется<br />
высокой прогнозирующей способностью, приведено ниже:<br />
Δ sub Hрасч. = +5.57 + 1.23 ƒr1 + 6.92ƒr2 + 6.95ƒr3 (1)<br />
n = 104, r 2 = 0.8450, s = 2.97 ккал/моль, F = 160, средняя ошибка (по модулю)<br />
на прогнозе 2.16 ккал/моль, где ƒr1 – число любых неводородных атомов, ●; ƒr2<br />
- количество фрагментов вида =СR-OH; ƒr3 - количество фрагментов вида N sp3 -<br />
C=O.<br />
На рисунках Рис. 35 приведен разброс экспериментальных и расчетных<br />
значений энтальпии сублимации, соответствующий данной модели.<br />
Рис. 35.Диаграмма разброса расчетных и экспериментальных значений<br />
энтальпии сублимации для обучающей (слева) и контрольной (справа) выборок<br />
из Базы 3 согласно линейно-регрессионной модели (уравнение 1)<br />
.<br />
Таким образом, впервые исследованы энтальпии сублимации органических<br />
соединений различных классов в рамках фрагментного подхода на основе<br />
метода QSPR. Показано, что данная методология позволяет получить модели<br />
расчета энтальпии сублимации с параметрами, сравнимыми, а в ряде случаев<br />
превосходящими характеристики регрессионных уравнений, предложенных в<br />
литературе. Иными словами, предложена модель, позволяющая прогнозировать<br />
175