На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

ски более достоверными, чем показатели индивидуальных моделей. При этом важно, чтобы усреднение проводилось таким образом, чтобы информация об экспериментальном значении прогнозируемого свойства для каждого из химических соединений никаким образом не участвовала ни в построении, ни в отборе моделей, по которым проводился для него прогноз. Корреляция между спрогнозированной по ансамблю моделей (в ансамбль моделей для прогнозирования свойства данного соединения включались только те модели, при построении которых оно не участвовало в составе обучающей либо контрольной выборок) температурой кипения органических соединений и экспериментальным значением этого свойства показана в виде диаграммы разброса точек на Рис. 47. Рис. 47. Корреляция расчетных и экспериментальных данных по температурам кипения (в o C) После получения вышеизложенных результатов нами было проведено их сравнение с литературными данными. При этом было выделено два типа работ: 1) работы, в которых база данных включала не более 100 соединений, и 2) работы, представляющие результаты обработки более представительных выборок соединений. О разнообразии выборок в первом случае говорить не приходится из-за малого количества соединений, и моделирование в таких случаях проводилось лишь в узких сериях соединений. Работ, в которых исследования проводились с большими базами данных, оказалось всего несколько: статьи Игольфа (Egolf) и др. [419, 420] (в данных работах нейросеть с обратным распростране- 222

нием ошибки применяли в комбинации с физико-химическими дескрипторами), работы Холла (Hall) и др. [418, 421] (в данном случае нейросеть с обратным распространением ошибки применяли в комбинации с электротопологическими индексами), а также работа Тетте (Tatteh) и др. [386] (нейросеть функции радиального базиса сочетали с топологическими индексами). В работах [418-421] база данных содержала 298 органических соединений со специально отобранными высокоточными экспериментальными данными, однако в качестве результатов были приведены характеристики лишь одной «лучшей» модели (RMSE t = 5,4 о С и RMSE v = 5,9 о С), что ставит под вопрос статистическую достоверность результатов. Как оказалось, сравнить полученные нами результаты можно лишь с данными работы [386]. Для меньшей по размере и менее разнообразной выборки Тетте и др. были получены следующие статистические показатели: RMSE t = 11,4 o C, RMSE v = 15,1 o C и RMSE p = 19,4 o C, что хуже результирующих данных по моделированию, полученных нами. 6.4. Прогнозирование температуры плавления ионных жидкостей Температура плавления является одним из наиболее сложных для прогнозирования свойств химических соединений, далеко не полный список причин чего включает: плохая воспроизводимость экспериментальных данных, зависимость от типа кристаллической упаковки, сосуществование нескольких аллотропных модификаций кристаллов, зависимость от наличия микропримесей, существование эвтектик, возможность затвердевания в аморфное либо жидкокристаллическое состояния и др. В то же время, температура плавления является важнейшей технической характеристикой, которая определяет сферу применения ионных жидкостей – материалов, широко используемых в качестве экологически-безопасных растворителей в химической промышленности. Именно поэтому это «тяжелое» свойство является удобным объектом для сравнения различных методик построения QSPR-моделей. Мы приняли участие в совместном исследовании, проведенном несколькими группами авторов, в ходе которого широкий набор современных методов 223

ски более достоверными, чем показатели индивидуальных моделей. При этом<br />

важно, чтобы усреднение проводилось таким образом, чтобы информация об<br />

экспериментальном значении прогнозируемого свойства для каждого из химических<br />

соединений никаким образом не участвовала ни в построении, ни в отборе<br />

моделей, по которым проводился для него прогноз.<br />

Корреляция между спрогнозированной по ансамблю моделей (в ансамбль<br />

моделей для прогнозирования свойства данного соединения включались только<br />

те модели, при построении которых оно не участвовало в составе обучающей<br />

либо контрольной выборок) температурой кипения органических соединений и<br />

экспериментальным значением этого свойства показана в виде диаграммы разброса<br />

точек на Рис. 47.<br />

Рис. 47. Корреляция расчетных и экспериментальных данных по температурам<br />

кипения (в o C)<br />

После получения вышеизложенных результатов нами было проведено их<br />

сравнение с литературными данными. При этом было выделено два типа работ:<br />

1) работы, в которых база данных включала не более 100 соединений, и 2) работы,<br />

представляющие результаты обработки более представительных выборок<br />

соединений. О разнообразии выборок в первом случае говорить не приходится<br />

из-за малого количества соединений, и моделирование в таких случаях проводилось<br />

лишь в узких сериях соединений. Работ, в которых исследования проводились<br />

с большими базами данных, оказалось всего несколько: статьи Игольфа<br />

(Egolf) и др. [419, 420] (в данных работах нейросеть с обратным распростране-<br />

222

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!