На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

энтальпию сублимации соединений исходя из дескрипторов, учитывающих фрагментный состав молекулы. 5.2.6. Прогнозирование температуры вспышки органических соединений Температура вспышки (T f ) – одна из важных характеристик горючих свойств органических веществ [385-387]. Она определяется как нижняя граница температуры, при которой смесь паров данного вещества с воздухом может быть подожжена при инициировании [385-387]. Величины T f известны для многих соединений [387]; однако они не всегда публикуются даже для промышленно важных соединений. Более того, во многих случаях экспериментальное определение этой величины для токсичных, летучих, взрывчатых и радиоактивных веществ затруднительно. Все это диктует необходимость разработки теоретических методов оценки температуры вспышки. Для T f были предложены различные схемы расчета, в том числе основанные на QSPR-исследованиях [386, 387]. В настоящей работе мы рассмотрели возможности применения структурных дескрипторов для QSPR-исследования температуры вспышки. Для проведения исследований мы использовали программные комплексы EMMA (см. раздел 8.1) и NASAWIN (см. раздел 8.2) в сочетании со входящим в оба комплекса дескрипторным блоком FRAGMENT (см. раздел 8.3). Составление баз данных. По данным работы [386] была сформирована База 1, состоящая из 400 структурно-разнородных органических соединений. Кроме того, по данным из статьи [387] была создана База 2, содержащая 271 соединение. Она также включает в себя разнообразные классы органических соединений. Результаты и обсуждение. Прежде всего, следует рассмотреть данные QSPR-исследования, приведенные в работах [386, 387], что необходимо для сравнения с результатами, полученными нами. В работе [386] были получены модели для расчета температуры вспышки с использованием PLS (метода частичных наименьших квадратов) и нейронной сети. В последнем случае при ис- 176

пользовании 25 дескрипторов, характеризующих вклады функциональных групп и атомов различных типов, для 135 соединений обучающей выборки, 133 контрольной и 132 выборки для прогноза авторы получили величины s (стандартного отклонения) 10.8 o C, 14.1 o C и 14.3 o C, соответственно. Однако для метода PLS результаты были значительно менее удовлетворительны: величина s для каждого из этих случаев составляла 21 o C, 25 o C и 23 o C, соответственно, что может свидетельствовать о ee нелинейном характере моделируемой зависимости. В работе [387] проведено моделирование температуры вспышки с использованием программы CODESSA. Авторы получили трехпараметровое уравнение со следующими статистическими характеристиками: R 2 (коэффициент детерминации) = 0.9020, R 2 cv (квадрат коэффициента корреляции при скользящем контроле) = 0.8985, s (стандартное отклонение) = 16.1 o C. Табл. 6. Статистические характеристики QSPR-моделей для температуры вспышки Модель База Обучающая выборка Контрольная выборка N дескр R 2 s, o C R 2 прогн MAE прогн , C 1 1 9 0.872 18.8 0.833 15.2 2 1А 9 0.871 18.9 0.829 15.3 3 2 9 0.932 13.7 4 2А 9 0.935 13.3 5 2 9 0.920 14.8 0.931 9.9 На первом этапе работы мы решили повторить результаты работы [386] (исследуя обучающую и контрольную выборки, идентичные приведенным в работе), но используя фрагментные дескрипторы. Данные, полученные на основе линейно-регрессионного анализа для Баз 1 и 1А, приведены в Табл. 6 на стр. 177 (Модели 1 и 2, соответственно). При построении моделей использовали процедуру пошагового включения рассчитанных дескрипторов в модель. Модель 1, построенная с использованием 9 фрагментных дескрипторов, имеет статистические параметры, превосходящие показатели PLS модели (средняя абсо- 177

пользовании 25 дескрипторов, характеризующих вклады функциональных<br />

групп и атомов различных типов, для 135 соединений обучающей выборки, 133<br />

контрольной и 132 выборки для прогноза авторы получили величины s (стандартного<br />

отклонения) 10.8 o C, 14.1 o C и 14.3 o C, соответственно. Однако для метода<br />

PLS результаты были значительно менее удовлетворительны: величина s<br />

для каждого из этих случаев составляла 21 o C, 25 o C и 23 o C, соответственно, что<br />

может свидетельствовать о ee нелинейном характере моделируемой зависимости.<br />

В работе [387] проведено моделирование температуры вспышки с использованием<br />

программы CODESSA. Авторы получили трехпараметровое уравнение<br />

со следующими статистическими характеристиками: R 2 (коэффициент детерминации)<br />

= 0.9020, R 2 cv (квадрат коэффициента корреляции при скользящем<br />

контроле) = 0.8985, s (стандартное отклонение) = 16.1 o C.<br />

Табл. 6. Статистические характеристики QSPR-моделей для температуры<br />

вспышки<br />

Модель База Обучающая выборка Контрольная выборка<br />

N дескр R 2 s, o C R 2 прогн MAE прогн ,<br />

C<br />

1 1 9 0.872 18.8 0.833 15.2<br />

2 1А 9 0.871 18.9 0.829 15.3<br />

3 2 9 0.932 13.7<br />

4 2А 9 0.935 13.3<br />

5 2 9 0.920 14.8 0.931 9.9<br />

На первом этапе работы мы решили повторить результаты работы [386]<br />

(исследуя обучающую и контрольную выборки, идентичные приведенным в<br />

работе), но используя фрагментные дескрипторы. Данные, полученные на основе<br />

линейно-регрессионного анализа для Баз 1 и 1А, приведены в Табл. 6 на<br />

стр. 177 (Модели 1 и 2, соответственно). При построении моделей использовали<br />

процедуру пошагового включения рассчитанных дескрипторов в модель. Модель<br />

1, построенная с использованием 9 фрагментных дескрипторов, имеет статистические<br />

параметры, превосходящие показатели PLS модели (средняя абсо-<br />

177

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!