На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

Табл. 5. Статистические характеристики QSPR-моделей для энтальпии сублимации (в ккал/моль) Модель База Обучающая выборка Контрольная выборка N дескр R 2 s R 2 прогн MAE прогн 1 1 3 0.924 2.38 0.769 2.7 2 2 3 0.852 2.92 0.752 2.41 3 3 2 0.845 2.97 0.816 2.16 Естественно, что, имея в распоряжении Базу 3, было интересным получить QSPR-модель, используя расширенную обучающую выборку. С этой целью в качестве обучающей выборки использовались соединения 1-62 (База 1), 73-88 (База 2) и 13 соединений ряда хлорированных дифенилов (см. выше). Контрольная выборка включала в соответствии с работой [381] те же 10 соединений (63-72), но была дополнена тремя соединениями ряда хлорированных дифенилов: мы взяли два соединения, использованных для прогноза в работе [384],. Таким образом, обучающая выборка состояла из 91, а контрольная выборка из 13 соединений. Построенная QSPR-модель (Модель 2, Табл. 5 на стр. 174) отличается хорошей предсказательной способностью, превосходящей показатели Модели 1, и позволяет прогнозировать исследуемое свойство для соединений ряда хлорированных дифенилов. Средняя ошибка на прогнозе 2.4 ккал/моль (модель на основе трех дескрипторов). Наконец, рассмотрение структур, выпадающих из корреляции, привело к идее изменить обучающую и контрольную выборки следующим образом: мы перенесли две структуры адамантан и диметилглиоксим, из контрольной в обучающую выборку, а муравьиную кислоту, наоборот, из обучающей в контрольную выборку. Таким образом, обучающая выборка состояла из 92, а контрольная выборка из 12 соединений. Построенная QSPR-модель (Модель 3, Табл. 5 на стр. 233) имеет лучшую прогнозирующую способность по сравнению с моделями 1 и 2. Столь резкое понижение ошибки прогноза на контрольной выборке при столь небольшой модификации разбивки данных на обучающую и контрольную выборку, однако, свидетельствует о наличии проблемы 174

«редких фрагментов», когда отдельные соединения из контрольной выборки содержат фрагменты, плохо представленные в обучающей выборке. Уравнение, соответствующее модели, полученной на основе трех фрагментных дескрипторов (Модель 3, Табл. 5 на стр. 174), которая характеризуется высокой прогнозирующей способностью, приведено ниже: Δ sub Hрасч. = +5.57 + 1.23 ƒr1 + 6.92ƒr2 + 6.95ƒr3 (1) n = 104, r 2 = 0.8450, s = 2.97 ккал/моль, F = 160, средняя ошибка (по модулю) на прогнозе 2.16 ккал/моль, где ƒr1 – число любых неводородных атомов, ●; ƒr2 - количество фрагментов вида =СR-OH; ƒr3 - количество фрагментов вида N sp3 - C=O. На рисунках Рис. 35 приведен разброс экспериментальных и расчетных значений энтальпии сублимации, соответствующий данной модели. Рис. 35.Диаграмма разброса расчетных и экспериментальных значений энтальпии сублимации для обучающей (слева) и контрольной (справа) выборок из Базы 3 согласно линейно-регрессионной модели (уравнение 1) . Таким образом, впервые исследованы энтальпии сублимации органических соединений различных классов в рамках фрагментного подхода на основе метода QSPR. Показано, что данная методология позволяет получить модели расчета энтальпии сублимации с параметрами, сравнимыми, а в ряде случаев превосходящими характеристики регрессионных уравнений, предложенных в литературе. Иными словами, предложена модель, позволяющая прогнозировать 175

«редких фрагментов», когда отдельные соединения из контрольной выборки<br />

содержат фрагменты, плохо представленные в обучающей выборке.<br />

Уравнение, соответствующее модели, полученной на основе трех фрагментных<br />

дескрипторов (Модель 3, Табл. 5 на стр. 174), которая характеризуется<br />

высокой прогнозирующей способностью, приведено ниже:<br />

Δ sub Hрасч. = +5.57 + 1.23 ƒr1 + 6.92ƒr2 + 6.95ƒr3 (1)<br />

n = 104, r 2 = 0.8450, s = 2.97 ккал/моль, F = 160, средняя ошибка (по модулю)<br />

на прогнозе 2.16 ккал/моль, где ƒr1 – число любых неводородных атомов, ●; ƒr2<br />

- количество фрагментов вида =СR-OH; ƒr3 - количество фрагментов вида N sp3 -<br />

C=O.<br />

На рисунках Рис. 35 приведен разброс экспериментальных и расчетных<br />

значений энтальпии сублимации, соответствующий данной модели.<br />

Рис. 35.Диаграмма разброса расчетных и экспериментальных значений<br />

энтальпии сублимации для обучающей (слева) и контрольной (справа) выборок<br />

из Базы 3 согласно линейно-регрессионной модели (уравнение 1)<br />

.<br />

Таким образом, впервые исследованы энтальпии сублимации органических<br />

соединений различных классов в рамках фрагментного подхода на основе<br />

метода QSPR. Показано, что данная методология позволяет получить модели<br />

расчета энтальпии сублимации с параметрами, сравнимыми, а в ряде случаев<br />

превосходящими характеристики регрессионных уравнений, предложенных в<br />

литературе. Иными словами, предложена модель, позволяющая прогнозировать<br />

175

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!