Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Табл. 5. Статистические характеристики QSPR-моделей для энтальпии<br />
сублимации (в ккал/моль)<br />
Модель База Обучающая выборка<br />
Контрольная выборка<br />
N дескр R 2 s R 2 прогн MAE прогн<br />
1 1 3 0.924 2.38 0.769 2.7<br />
2 2 3 0.852 2.92 0.752 2.41<br />
3 3 2 0.845 2.97 0.816 2.16<br />
Естественно, что, имея в распоряжении Базу 3, было интересным получить<br />
QSPR-модель, используя расширенную обучающую выборку. С этой целью<br />
в качестве обучающей выборки использовались соединения 1-62 (База 1),<br />
73-88 (База 2) и 13 соединений ряда хлорированных дифенилов (см. выше).<br />
Контрольная выборка включала в соответствии с работой [381] те же 10 соединений<br />
(63-72), но была дополнена тремя соединениями ряда хлорированных<br />
дифенилов: мы взяли два соединения, использованных для прогноза в работе<br />
[384],. Таким образом, обучающая выборка состояла из 91, а контрольная выборка<br />
из 13 соединений. Построенная QSPR-модель (Модель 2, Табл. 5 на стр.<br />
174) отличается хорошей предсказательной способностью, превосходящей показатели<br />
Модели 1, и позволяет прогнозировать исследуемое свойство для соединений<br />
ряда хлорированных дифенилов. Средняя ошибка на прогнозе 2.4<br />
ккал/моль (модель на основе трех дескрипторов).<br />
Наконец, рассмотрение структур, выпадающих из корреляции, привело к<br />
идее изменить обучающую и контрольную выборки следующим образом: мы<br />
перенесли две структуры адамантан и диметилглиоксим, из контрольной в обучающую<br />
выборку, а муравьиную кислоту, наоборот, из обучающей в контрольную<br />
выборку. Таким образом, обучающая выборка состояла из 92, а контрольная<br />
выборка из 12 соединений. Построенная QSPR-модель (Модель 3,<br />
Табл. 5 на стр. 233) имеет лучшую прогнозирующую способность по сравнению<br />
с моделями 1 и 2. Столь резкое понижение ошибки прогноза на контрольной<br />
выборке при столь небольшой модификации разбивки данных на обучающую<br />
и контрольную выборку, однако, свидетельствует о наличии проблемы<br />
174