Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
ски более достоверными, чем показатели индивидуальных моделей. При этом важно, чтобы усреднение проводилось таким образом, чтобы информация об экспериментальном значении прогнозируемого свойства для каждого из химических соединений никаким образом не участвовала ни в построении, ни в отборе моделей, по которым проводился для него прогноз. Корреляция между спрогнозированной по ансамблю моделей (в ансамбль моделей для прогнозирования свойства данного соединения включались только те модели, при построении которых оно не участвовало в составе обучающей либо контрольной выборок) температурой кипения органических соединений и экспериментальным значением этого свойства показана в виде диаграммы разброса точек на Рис. 47. Рис. 47. Корреляция расчетных и экспериментальных данных по температурам кипения (в o C) После получения вышеизложенных результатов нами было проведено их сравнение с литературными данными. При этом было выделено два типа работ: 1) работы, в которых база данных включала не более 100 соединений, и 2) работы, представляющие результаты обработки более представительных выборок соединений. О разнообразии выборок в первом случае говорить не приходится из-за малого количества соединений, и моделирование в таких случаях проводилось лишь в узких сериях соединений. Работ, в которых исследования проводились с большими базами данных, оказалось всего несколько: статьи Игольфа (Egolf) и др. [419, 420] (в данных работах нейросеть с обратным распростране- 222
нием ошибки применяли в комбинации с физико-химическими дескрипторами), работы Холла (Hall) и др. [418, 421] (в данном случае нейросеть с обратным распространением ошибки применяли в комбинации с электротопологическими индексами), а также работа Тетте (Tatteh) и др. [386] (нейросеть функции радиального базиса сочетали с топологическими индексами). В работах [418-421] база данных содержала 298 органических соединений со специально отобранными высокоточными экспериментальными данными, однако в качестве результатов были приведены характеристики лишь одной «лучшей» модели (RMSE t = 5,4 о С и RMSE v = 5,9 о С), что ставит под вопрос статистическую достоверность результатов. Как оказалось, сравнить полученные нами результаты можно лишь с данными работы [386]. Для меньшей по размере и менее разнообразной выборки Тетте и др. были получены следующие статистические показатели: RMSE t = 11,4 o C, RMSE v = 15,1 o C и RMSE p = 19,4 o C, что хуже результирующих данных по моделированию, полученных нами. 6.4. Прогнозирование температуры плавления ионных жидкостей Температура плавления является одним из наиболее сложных для прогнозирования свойств химических соединений, далеко не полный список причин чего включает: плохая воспроизводимость экспериментальных данных, зависимость от типа кристаллической упаковки, сосуществование нескольких аллотропных модификаций кристаллов, зависимость от наличия микропримесей, существование эвтектик, возможность затвердевания в аморфное либо жидкокристаллическое состояния и др. В то же время, температура плавления является важнейшей технической характеристикой, которая определяет сферу применения ионных жидкостей – материалов, широко используемых в качестве экологически-безопасных растворителей в химической промышленности. Именно поэтому это «тяжелое» свойство является удобным объектом для сравнения различных методик построения QSPR-моделей. Мы приняли участие в совместном исследовании, проведенном несколькими группами авторов, в ходе которого широкий набор современных методов 223
- Page 171 and 172: чета этого свойств
- Page 173 and 174: База 2 (88 соединений
- Page 175 and 176: «редких фрагментов
- Page 177 and 178: пользовании 25 деск
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221: Как видно из Табл. 16
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
- Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230: ного моделирования
- Page 231 and 232: ля и даже более сов
- Page 233 and 234: ного цианинового к
- Page 235 and 236: Значения констант
- Page 237 and 238: делена на обучающу
- Page 239 and 240: ность. Основной цел
- Page 241 and 242: На Рис. 50 приводятс
- Page 243 and 244: молекул с конденси
- Page 245 and 246: 7.1.4. Прогнозировани
- Page 247 and 248: сивов разрозненных
- Page 249 and 250: используются как т
- Page 251 and 252: были модифицирован
- Page 253 and 254: зависимости давлен
- Page 255 and 256: Объединенный набор
- Page 257 and 258: Оба механизма вклю
- Page 259 and 260: творителя, а также
- Page 261 and 262: Табл. 29. Характерис
- Page 263 and 264: набора дескрипторо
- Page 265 and 266: угодно сложные зав
- Page 267 and 268: симостей «структур
- Page 269 and 270: лей, хотя все модел
- Page 271 and 272: одновременно решае
ски более достоверными, чем показатели индивидуальных моделей. При этом<br />
важно, чтобы усреднение проводилось таким образом, чтобы информация об<br />
экспериментальном значении прогнозируемого свойства для каждого из химических<br />
соединений никаким образом не участвовала ни в построении, ни в отборе<br />
моделей, по которым проводился для него прогноз.<br />
Корреляция между спрогнозированной по ансамблю моделей (в ансамбль<br />
моделей для прогнозирования свойства данного соединения включались только<br />
те модели, при построении которых оно не участвовало в составе обучающей<br />
либо контрольной выборок) температурой кипения органических соединений и<br />
экспериментальным значением этого свойства показана в виде диаграммы разброса<br />
точек на Рис. 47.<br />
Рис. 47. Корреляция расчетных и экспериментальных данных по температурам<br />
кипения (в o C)<br />
После получения вышеизложенных результатов нами было проведено их<br />
сравнение с литературными данными. При этом было выделено два типа работ:<br />
1) работы, в которых база данных включала не более 100 соединений, и 2) работы,<br />
представляющие результаты обработки более представительных выборок<br />
соединений. О разнообразии выборок в первом случае говорить не приходится<br />
из-за малого количества соединений, и моделирование в таких случаях проводилось<br />
лишь в узких сериях соединений. Работ, в которых исследования проводились<br />
с большими базами данных, оказалось всего несколько: статьи Игольфа<br />
(Egolf) и др. [419, 420] (в данных работах нейросеть с обратным распростране-<br />
222