19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

делена на обучающую выборку (609 соединений) и контрольную выборку (67<br />

соединений). При моделировании общей базы данных было использовано различное<br />

количество дескрипторов. Первоначально, методом БПМЛР было отобрано<br />

226 фрагментных и 7 квантово-химических дескрипторов, а в дальнейшем<br />

осуществлялось последовательное уменьшение их числа (Табл. 24). Такой<br />

подход представляется эффективным для выявления оптимального количества<br />

дескрипторов, что, в свою очередь, дает возможность получения более устойчивой<br />

предсказательной QSPR-модели.<br />

Табл. 24. Статистические параметры QSPR-моделей построенных с использованием<br />

фрагментных и квантово-химических дескрипторов<br />

D фр /D кх R 2 RMSE обуч RMSE контр<br />

226/7 0.9938 0.34 0.40<br />

194/6 0.9931 0.36 0.55<br />

96/4 0.9862 0.36 0.46<br />

46/4 0.9832 0.56 0.64<br />

13/2 0.9658 0.78 0.92<br />

Анализ полученных результатов показал что модель “структура –<br />

свойство”, построенная с использованием 96 фрагментных и 4 квантовохимических<br />

дескрипторов (Рис. 49), представляется наиболее оптимальной. Как<br />

видно из Табл. 24, переход от модели, построенной на двухстах дескрипторах, к<br />

модели на ста приводит лишь к незначительному уменьшению коэффициента<br />

корреляции при сохранении значения RMSE для обучающей выборки и улучшению<br />

RMSE для контрольной выборки. При этом дальнейшее уменьшение<br />

числа дескрипторов до 50 хотя и позволяет сохранить близкий коэффициент<br />

корреляции, но приводит к резкому увеличению значений RMSE как для контрольной,<br />

так и для обучающей выборки.<br />

237

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!