Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
делена на обучающую выборку (609 соединений) и контрольную выборку (67<br />
соединений). При моделировании общей базы данных было использовано различное<br />
количество дескрипторов. Первоначально, методом БПМЛР было отобрано<br />
226 фрагментных и 7 квантово-химических дескрипторов, а в дальнейшем<br />
осуществлялось последовательное уменьшение их числа (Табл. 24). Такой<br />
подход представляется эффективным для выявления оптимального количества<br />
дескрипторов, что, в свою очередь, дает возможность получения более устойчивой<br />
предсказательной QSPR-модели.<br />
Табл. 24. Статистические параметры QSPR-моделей построенных с использованием<br />
фрагментных и квантово-химических дескрипторов<br />
D фр /D кх R 2 RMSE обуч RMSE контр<br />
226/7 0.9938 0.34 0.40<br />
194/6 0.9931 0.36 0.55<br />
96/4 0.9862 0.36 0.46<br />
46/4 0.9832 0.56 0.64<br />
13/2 0.9658 0.78 0.92<br />
Анализ полученных результатов показал что модель “структура –<br />
свойство”, построенная с использованием 96 фрагментных и 4 квантовохимических<br />
дескрипторов (Рис. 49), представляется наиболее оптимальной. Как<br />
видно из Табл. 24, переход от модели, построенной на двухстах дескрипторах, к<br />
модели на ста приводит лишь к незначительному уменьшению коэффициента<br />
корреляции при сохранении значения RMSE для обучающей выборки и улучшению<br />
RMSE для контрольной выборки. При этом дальнейшее уменьшение<br />
числа дескрипторов до 50 хотя и позволяет сохранить близкий коэффициент<br />
корреляции, но приводит к резкому увеличению значений RMSE как для контрольной,<br />
так и для обучающей выборки.<br />
237