На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

Рис. 58. Традиционный одноуровневый подход, в котором отдельные нейросетевые модели не связаны друг с другом Рис. 59. Схема многоуровневого подхода, в рамках которого за счет последовательного соединения моделей происходит перенос информации из моделей нижнего уровня в модели верхнего Естественными кандидатами на роль выходных свойств для промежуточных моделей являются физико-химические свойства, связанные с фундаментальными типами взаимодействий (гидрофобность, поляризуемость, характеристики силы водородных связей и т.д.), разнообразные константы заместителей, а также квантово-химические характеристики (ВЗСО, НСМО, заряды на атомах). Заметим, что для большинства из этих величин имеются дескрипторы, которые уже давно успешно используются при построении количественных зави- 266

симостей «структура-свойство». Принципиальным отличием и преимуществом многоуровневого подхода перед непосредственным использованием для построения моделей физико-химических и квантово-химических дескрипторов является то, что при этом не теряется интерпретируемость моделей через фрагментные дескрипторы на языке структурных формул. Кроме того, сохраняется свойственная фрагментным дескрипторам универсальность и эффективность расчета, что дает возможность использовать многоуровневые сети моделей при высокопроизводительном виртуальном скрининге. Следует отметить, что кроме улучшения качества прогноза, многоуровневый подход способен преодолеть то, что иногда называется недостатками фрагментного подхода, а именно отсутствие физико-химической интерпретации и проблема “отсутствующих фрагментов” [116]. Прежде всего, благодаря тому, что промежуточные модели дают на выходе экспериментально измеримые или легко интерпретируемые физические величины, сама конечная модель получает очевидную физико-химическую интерпретацию в терминах этих величин. Для такой интерпретации при использовании нейросетевых моделей может быть использован подход, предложенный нами ранее [478]. Что же касается «отсутствующих фрагментов», которые отсутствуют в обучающей выборке но присутствуют в тестовой, то острота этой проблемы смягчается благодаря тому, что эти фрагменты имеют шансы присутствовать в химических структурах, входящих в выборки существенно большего размера, используемые для обучения моделей предыдущих слоев. Рассмотрим два примера, показывающие преимущества использования многоуровневого подхода. В первом случае на основе опубликованных данных [479] была сформирована выборка 1, содержащая количественные данные по значению логарифма коэффициента сорбции в почве (log K oc ) для 568 органических соединений. Во втором случае для создания выборки 2 были взяты из статей [479, 480] данные по значению логарифма растворимости (log S) фуллерена С 60 в 113 органических растворителях, включая 45 алканов, 36 производных бензола, 7 производных нафталина, 14 кислород, 21 хлор и 15 бромсодержащих соединений. При построении количественных моделей «структура-свойство» в 267

Рис. 58. Традиционный одноуровневый подход, в котором отдельные нейросетевые<br />

модели не связаны друг с другом<br />

Рис. 59. Схема многоуровневого подхода, в рамках которого за счет последовательного<br />

соединения моделей происходит перенос информации из моделей<br />

нижнего уровня в модели верхнего<br />

Естественными кандидатами на роль выходных свойств для промежуточных<br />

моделей являются физико-химические свойства, связанные с фундаментальными<br />

типами взаимодействий (гидрофобность, поляризуемость, характеристики<br />

силы водородных связей и т.д.), разнообразные константы заместителей,<br />

а также квантово-химические характеристики (ВЗСО, НСМО, заряды на атомах).<br />

Заметим, что для большинства из этих величин имеются дескрипторы, которые<br />

уже давно успешно используются при построении количественных зави-<br />

266

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!