Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
энтальпию сублимации соединений исходя из дескрипторов, учитывающих фрагментный состав молекулы. 5.2.6. Прогнозирование температуры вспышки органических соединений Температура вспышки (T f ) – одна из важных характеристик горючих свойств органических веществ [385-387]. Она определяется как нижняя граница температуры, при которой смесь паров данного вещества с воздухом может быть подожжена при инициировании [385-387]. Величины T f известны для многих соединений [387]; однако они не всегда публикуются даже для промышленно важных соединений. Более того, во многих случаях экспериментальное определение этой величины для токсичных, летучих, взрывчатых и радиоактивных веществ затруднительно. Все это диктует необходимость разработки теоретических методов оценки температуры вспышки. Для T f были предложены различные схемы расчета, в том числе основанные на QSPR-исследованиях [386, 387]. В настоящей работе мы рассмотрели возможности применения структурных дескрипторов для QSPR-исследования температуры вспышки. Для проведения исследований мы использовали программные комплексы EMMA (см. раздел 8.1) и NASAWIN (см. раздел 8.2) в сочетании со входящим в оба комплекса дескрипторным блоком FRAGMENT (см. раздел 8.3). Составление баз данных. По данным работы [386] была сформирована База 1, состоящая из 400 структурно-разнородных органических соединений. Кроме того, по данным из статьи [387] была создана База 2, содержащая 271 соединение. Она также включает в себя разнообразные классы органических соединений. Результаты и обсуждение. Прежде всего, следует рассмотреть данные QSPR-исследования, приведенные в работах [386, 387], что необходимо для сравнения с результатами, полученными нами. В работе [386] были получены модели для расчета температуры вспышки с использованием PLS (метода частичных наименьших квадратов) и нейронной сети. В последнем случае при ис- 176
пользовании 25 дескрипторов, характеризующих вклады функциональных групп и атомов различных типов, для 135 соединений обучающей выборки, 133 контрольной и 132 выборки для прогноза авторы получили величины s (стандартного отклонения) 10.8 o C, 14.1 o C и 14.3 o C, соответственно. Однако для метода PLS результаты были значительно менее удовлетворительны: величина s для каждого из этих случаев составляла 21 o C, 25 o C и 23 o C, соответственно, что может свидетельствовать о ee нелинейном характере моделируемой зависимости. В работе [387] проведено моделирование температуры вспышки с использованием программы CODESSA. Авторы получили трехпараметровое уравнение со следующими статистическими характеристиками: R 2 (коэффициент детерминации) = 0.9020, R 2 cv (квадрат коэффициента корреляции при скользящем контроле) = 0.8985, s (стандартное отклонение) = 16.1 o C. Табл. 6. Статистические характеристики QSPR-моделей для температуры вспышки Модель База Обучающая выборка Контрольная выборка N дескр R 2 s, o C R 2 прогн MAE прогн , C 1 1 9 0.872 18.8 0.833 15.2 2 1А 9 0.871 18.9 0.829 15.3 3 2 9 0.932 13.7 4 2А 9 0.935 13.3 5 2 9 0.920 14.8 0.931 9.9 На первом этапе работы мы решили повторить результаты работы [386] (исследуя обучающую и контрольную выборки, идентичные приведенным в работе), но используя фрагментные дескрипторы. Данные, полученные на основе линейно-регрессионного анализа для Баз 1 и 1А, приведены в Табл. 6 на стр. 177 (Модели 1 и 2, соответственно). При построении моделей использовали процедуру пошагового включения рассчитанных дескрипторов в модель. Модель 1, построенная с использованием 9 фрагментных дескрипторов, имеет статистические параметры, превосходящие показатели PLS модели (средняя абсо- 177
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159 and 160: 5.2.1. Прогнозировани
- Page 161 and 162: зей, а также учитыв
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165 and 166: Построение QSPR-моде
- Page 167 and 168: работе [268], но с при
- Page 169 and 170: ляются удобным инс
- Page 171 and 172: чета этого свойств
- Page 173 and 174: База 2 (88 соединений
- Page 175: «редких фрагментов
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
пользовании 25 дескрипторов, характеризующих вклады функциональных<br />
групп и атомов различных типов, для 135 соединений обучающей выборки, 133<br />
контрольной и 132 выборки для прогноза авторы получили величины s (стандартного<br />
отклонения) 10.8 o C, 14.1 o C и 14.3 o C, соответственно. Однако для метода<br />
PLS результаты были значительно менее удовлетворительны: величина s<br />
для каждого из этих случаев составляла 21 o C, 25 o C и 23 o C, соответственно, что<br />
может свидетельствовать о ee нелинейном характере моделируемой зависимости.<br />
В работе [387] проведено моделирование температуры вспышки с использованием<br />
программы CODESSA. Авторы получили трехпараметровое уравнение<br />
со следующими статистическими характеристиками: R 2 (коэффициент детерминации)<br />
= 0.9020, R 2 cv (квадрат коэффициента корреляции при скользящем<br />
контроле) = 0.8985, s (стандартное отклонение) = 16.1 o C.<br />
Табл. 6. Статистические характеристики QSPR-моделей для температуры<br />
вспышки<br />
Модель База Обучающая выборка Контрольная выборка<br />
N дескр R 2 s, o C R 2 прогн MAE прогн ,<br />
C<br />
1 1 9 0.872 18.8 0.833 15.2<br />
2 1А 9 0.871 18.9 0.829 15.3<br />
3 2 9 0.932 13.7<br />
4 2А 9 0.935 13.3<br />
5 2 9 0.920 14.8 0.931 9.9<br />
На первом этапе работы мы решили повторить результаты работы [386]<br />
(исследуя обучающую и контрольную выборки, идентичные приведенным в<br />
работе), но используя фрагментные дескрипторы. Данные, полученные на основе<br />
линейно-регрессионного анализа для Баз 1 и 1А, приведены в Табл. 6 на<br />
стр. 177 (Модели 1 и 2, соответственно). При построении моделей использовали<br />
процедуру пошагового включения рассчитанных дескрипторов в модель. Модель<br />
1, построенная с использованием 9 фрагментных дескрипторов, имеет статистические<br />
параметры, превосходящие показатели PLS модели (средняя абсо-<br />
177