На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

статистических параметров моделей по сравнению с результатами, получаемыми при использовании только фрагментных дескрипторов. Табл. 23. Статистические показатели моделей, построенных для фенолов, карбоновых кислот и азотсодержащих соединений Класс соединенистроенных Параметры моделей, по- Параметры моделей построенных с использованием только ФД с использованием ФД и квантово-химических дескрипторов Фенолы МЛР: R 2 = 0.9746, s = 0.40, МЛР: R 2 = 0.9794, s = 0.36, RMSE t = 0.38, RMSE v = 0.57 ИНС: R 2 = 0.9815, RMSE t = 0.32, RMSE v = 0.53 RMSE t = 0.33, RMSE v = 0.41 ИНС: R 2 = 0.9831, RMSE t = 0.30, RMSE v = 0.42 Карбоновые кислоты МЛР: R 2 = 0.8966, s = 0.33, RMSE t = 0.31, RMSE v = 0.51 ИНС: R 2 = 0.9115, RMSE t = 0.28, RMSE v = 0.48 МЛР: R 2 = 0.9122, s = 0.31, RMSE t = 0.28, RMSE v = 0.34 ИНС: R 2 = 0.9534, RMSE t = 0.21, RMSE v = 0.27 Азотсодержащие МЛР: R 2 = 0.9302, s = 0.99, МЛР: R 2 = 0.9611, s = 0.75, со- RMSE t = 0.93, RMSE v = 1.14 RMSE t = 0.69, RMSE v = 0.94 единения ИНС: R 2 = 0.9306, RMSE t = 0.93, RMSE v = 1.13 ИНС: R 2 = 0.9692, RMSE t = 0.62, RMSE v = 0.60 где: R 2 - коэффициент детерминации, RMSE t , RMSE v – среднеквадратичная ошибка на обучающей и контрольной выборке, , s – стандартное отклонение. Как видно из данных, приведенных в Табл. 23, лучшие статистические параметры были получены методом ИНС для фенолов. Однако в этом случае статистические параметры моделей, построенных с использованием только 20 фрагментных дескрипторов (R 2 = 0.9815, RMSE t = 0.32, RMSE v = 0.53) и дополнительных 7 квантово-химических дескрипторов (R 2 = 0.9831, RMSE t = 0.30, RMSE v = 0.41) оказались достаточно близки. В отличие от этого, улучшение статистических параметров при использовании квантово-химических дескрипторов в комбинации с фрагментными дескрипторами для моделирования pK a карбоновых кислот и азотсодержащих соединений достаточно очевидно. Так как предложенный подход оказался эффективным при моделировании трех отдельных баз данных, нами была предпринята попытка построить общую модель “структура-свойство” для общей базы данных. С целью проверки прогностической способности QSPR-моделей база данных также была раз- 236

делена на обучающую выборку (609 соединений) и контрольную выборку (67 соединений). При моделировании общей базы данных было использовано различное количество дескрипторов. Первоначально, методом БПМЛР было отобрано 226 фрагментных и 7 квантово-химических дескрипторов, а в дальнейшем осуществлялось последовательное уменьшение их числа (Табл. 24). Такой подход представляется эффективным для выявления оптимального количества дескрипторов, что, в свою очередь, дает возможность получения более устойчивой предсказательной QSPR-модели. Табл. 24. Статистические параметры QSPR-моделей построенных с использованием фрагментных и квантово-химических дескрипторов D фр /D кх R 2 RMSE обуч RMSE контр 226/7 0.9938 0.34 0.40 194/6 0.9931 0.36 0.55 96/4 0.9862 0.36 0.46 46/4 0.9832 0.56 0.64 13/2 0.9658 0.78 0.92 Анализ полученных результатов показал что модель “структура – свойство”, построенная с использованием 96 фрагментных и 4 квантовохимических дескрипторов (Рис. 49), представляется наиболее оптимальной. Как видно из Табл. 24, переход от модели, построенной на двухстах дескрипторах, к модели на ста приводит лишь к незначительному уменьшению коэффициента корреляции при сохранении значения RMSE для обучающей выборки и улучшению RMSE для контрольной выборки. При этом дальнейшее уменьшение числа дескрипторов до 50 хотя и позволяет сохранить близкий коэффициент корреляции, но приводит к резкому увеличению значений RMSE как для контрольной, так и для обучающей выборки. 237

статистических параметров моделей по сравнению с результатами, получаемыми<br />

при использовании только фрагментных дескрипторов.<br />

Табл. 23. Статистические показатели моделей, построенных для фенолов, карбоновых<br />

кислот и азотсодержащих соединений<br />

Класс соединенистроенных<br />

Параметры моделей, по-<br />

Параметры моделей построенных<br />

с использованием<br />

только ФД<br />

с использованием ФД<br />

и квантово-химических дескрипторов<br />

Фенолы МЛР: R 2 = 0.9746, s = 0.40, МЛР: R 2 = 0.9794, s = 0.36,<br />

RMSE t = 0.38, RMSE v = 0.57<br />

ИНС: R 2 = 0.9815,<br />

RMSE t = 0.32, RMSE v = 0.53<br />

RMSE t = 0.33, RMSE v = 0.41<br />

ИНС: R 2 = 0.9831,<br />

RMSE t = 0.30, RMSE v = 0.42<br />

Карбоновые<br />

кислоты<br />

МЛР: R 2 = 0.8966, s = 0.33,<br />

RMSE t = 0.31, RMSE v = 0.51<br />

ИНС: R 2 = 0.9115,<br />

RMSE t = 0.28, RMSE v = 0.48<br />

МЛР: R 2 = 0.9122, s = 0.31,<br />

RMSE t = 0.28, RMSE v = 0.34<br />

ИНС: R 2 = 0.9534,<br />

RMSE t = 0.21, RMSE v = 0.27<br />

Азотсодержащие<br />

МЛР: R 2 = 0.9302, s = 0.99, МЛР: R 2 = 0.9611, s = 0.75,<br />

со-<br />

RMSE t = 0.93, RMSE v = 1.14 RMSE t = 0.69, RMSE v = 0.94<br />

единения ИНС: R 2 = 0.9306,<br />

RMSE t = 0.93, RMSE v = 1.13<br />

ИНС: R 2 = 0.9692,<br />

RMSE t = 0.62, RMSE v = 0.60<br />

где: R 2 - коэффициент детерминации, RMSE t , RMSE v – среднеквадратичная<br />

ошибка на обучающей и контрольной выборке, , s – стандартное отклонение.<br />

Как видно из данных, приведенных в Табл. 23, лучшие статистические<br />

параметры были получены методом ИНС для фенолов. Однако в этом случае<br />

статистические параметры моделей, построенных с использованием только 20<br />

фрагментных дескрипторов (R 2 = 0.9815, RMSE t = 0.32, RMSE v = 0.53) и дополнительных<br />

7 квантово-химических дескрипторов (R 2 = 0.9831, RMSE t = 0.30,<br />

RMSE v = 0.41) оказались достаточно близки. В отличие от этого, улучшение<br />

статистических параметров при использовании квантово-химических дескрипторов<br />

в комбинации с фрагментными дескрипторами для моделирования pK a<br />

карбоновых кислот и азотсодержащих соединений достаточно очевидно.<br />

Так как предложенный подход оказался эффективным при моделировании<br />

трех отдельных баз данных, нами была предпринята попытка построить<br />

общую модель “структура-свойство” для общей базы данных. С целью проверки<br />

прогностической способности QSPR-моделей база данных также была раз-<br />

236

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!