Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
ских загрязнителей в атмосфере и т.д. [381-384]. Экспериментальное определение энтальпий сублимации, Δ sub H, как и других термодинамических величин, требует дорогих и длительных процедур. Поэтому, в литературе уделялось значительное внимание как расчетным теоретическим, так и эмпирическим QSPR методам. Так, например, отметим, что значения энтальпий сублимации были получены на основе расчета кристаллических упаковок [381-383]. Для QSPR использовались методы регрессионного анализа [381], нейтронные сети [381], а также 3D-QSAR (CoMFA) [384]. В случае линейного регрессионного анализа с обучающей выборкой из 62 соединений (контрольная выборка состояла из 10 соединений) было получено трехпараметровое уравнение, в котором в качестве дескрипторов использовались число атомов углерода, а также число доноров и акцепторов водородной связи [381] (подробнее см. ниже). В настоящей работе фрагментные дескрипторы применены нами для QSPR-исследования энтальпии сублимации. В качестве модельной базы экспериментальных данных по энтальпиям сублимации (База 1) были выбраны данные работы [381]: обучающая выборка из 62 соединений и контрольная выборка - 10 структур (соединения 63-72). Полная выборка включала молекулы с известной кристаллической структурой, содержащие атомы С, H, O, N, в том числе алифатические и ароматические углеводороды, их оксо- и аза-производные, карбоновые кислоты, амиды и аминокислоты, цианиды, хиноны, гетероциклы. Преимуществом данной выборки соединений является наличие для нее расчета энтальпий сублимации тремя способами: (1) теоретическим расчетом кристаллических упаковок (со следующими статистическими параметрами: n = 62, r 2 = 0.971, s = 0.939 ккал/моль, максимальная ошибка = 3.5 ккал/моль), (2) регрессионным анализом (со следующими статистическими параметрами: три дескриптора, n = 62, r 2 = 0.92, s = 1.6 ккал/моль, максимальная ошибка = 8.9 ккал/моль, средняя ошибка на прогнозе = 2.8 ккал/моль), и (3) с помощью нейронной сети (со следующими параметрами для лучшей модели: семь скрытых нейронов, n = 62, r 2 = 0.865, s = 2.2 ккал/моль, максимальная ошибка = 10.1 ккал/моль, средняя ошибка на прогнозе = 3.6 ккал/моль). Это дает хорошую основу для сравнения, хотя сама выборка и не очень велика. 172
База 2 (88 соединений) была создана путем добавления в Базу 1 экспериментальных данных работы [382] и исключения дубликатов, а База 3 – путем добавления в Базу 2 экспериментальных данных работы [384] по хлорированным дифенилам (15 структур) и после исключения дубликатов База 3 в результате включала 104 соединения. Включение хлорированных дифенилов обусловлено как важностью данного типа соединений, находящих широкое применение в качестве изоляционных материалов и замедлителей горения, так и желанием расширить структурное разнообразие выборки на хлорсодержащие соединения. QSPR моделирование проводилась с использованием наших QSAR программ EMMA (см. раздел 8.1) и NASAWIN (см. раздел 8.2). Фрагментные дескрипторы вычислялись блоком FRAGMENT (см. раздел 8.3), на работу которого налагались следующие ограничения: длина цепочек составляла 1-6, отбор фрагментных дескрипторов осуществляли как в автоматическом режиме, так и вручную, при отборе из группы скоррелированных друг с другом дескрипторов выбирались наиболее коррелирующие с активностью. Рассмотрим теперь сравнительные QSPR результаты. В Табл. 5 представлены характеристики моделей, полученных на основе фрагментных дескрипторов. Прежде всего, мы построили QSPR-модель (Модель 1, Табл. 5), используя ту же выборку, что и в работе [381], то есть взяли 62 соединения в качестве обучающей выборки и 10 соединений для прогноза (База 1). Из Табл. 5 видно, что на 3 фрагментных дескрипторах, получается удовлетворительная статиcтика, сравнимая с данными работы [381] и дающая разумный прогноз (Модель 1). Интересно, что первый дескриптор (число неводородных атомов) моделирует первый дескриптор работы [381], а два последующих фрагментных дескриптора непрямым образом моделируют число центров, образующих водородные связи (как и в работе [381]). 173
- Page 121 and 122: Для решения этой пр
- Page 123 and 124: • D x - среднее значе
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159 and 160: 5.2.1. Прогнозировани
- Page 161 and 162: зей, а также учитыв
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165 and 166: Построение QSPR-моде
- Page 167 and 168: работе [268], но с при
- Page 169 and 170: ляются удобным инс
- Page 171: чета этого свойств
- Page 175 and 176: «редких фрагментов
- Page 177 and 178: пользовании 25 деск
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
База 2 (88 соединений) была создана путем добавления в Базу 1 экспериментальных<br />
данных работы [382] и исключения дубликатов, а База 3 – путем<br />
добавления в Базу 2 экспериментальных данных работы [384] по хлорированным<br />
дифенилам (15 структур) и после исключения дубликатов База 3 в результате<br />
включала 104 соединения. Включение хлорированных дифенилов обусловлено<br />
как важностью данного типа соединений, находящих широкое применение<br />
в качестве изоляционных материалов и замедлителей горения, так и желанием<br />
расширить структурное разнообразие выборки на хлорсодержащие соединения.<br />
QSPR моделирование проводилась с использованием наших QSAR программ<br />
EMMA (см. раздел 8.1) и NASAWIN (см. раздел 8.2). Фрагментные дескрипторы<br />
вычислялись блоком FRAGMENT (см. раздел 8.3), на работу которого<br />
налагались следующие ограничения: длина цепочек составляла 1-6, отбор<br />
фрагментных дескрипторов осуществляли как в автоматическом режиме, так и<br />
вручную, при отборе из группы скоррелированных друг с другом дескрипторов<br />
выбирались наиболее коррелирующие с активностью.<br />
Рассмотрим теперь сравнительные QSPR результаты. В Табл. 5 представлены<br />
характеристики моделей, полученных на основе фрагментных дескрипторов.<br />
Прежде всего, мы построили QSPR-модель (Модель 1, Табл. 5), используя<br />
ту же выборку, что и в работе [381], то есть взяли 62 соединения в качестве<br />
обучающей выборки и 10 соединений для прогноза (База 1). Из Табл. 5 видно,<br />
что на 3 фрагментных дескрипторах, получается удовлетворительная<br />
статиcтика, сравнимая с данными работы [381] и дающая разумный прогноз<br />
(Модель 1). Интересно, что первый дескриптор (число неводородных атомов)<br />
моделирует первый дескриптор работы [381], а два последующих фрагментных<br />
дескриптора непрямым образом моделируют число центров, образующих водородные<br />
связи (как и в работе [381]).<br />
173