На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

гом (Yang) и Мунтцем (Muntz) [295]; CMTreeMiner этих же авторов [296]. Первоначально этот подход использовался для классификации химических структур в рамках исследований SAR [297, 298]. Специальная модификация этого подхода с применением методики «добычи взвешенных подструктур» (weighted substructure mining) в сочетании со статистической процедурой linear programming boosting [299] позволяет строить количественные QSAR/QSPR регрессионные модели с использованием «добытых» фрагментных дескрипторов [288]. 2.2.1.10. Фрагменты на основе случайных подграфов Успех применения различных схем фрагментации в значительной степени зависит от начального выбора нужных типов фрагментов. Поскольку практически невозможно рассмотреть все возможные фрагменты из-за их гигантского числа, всегда приходится ограничиваться их небольшим подмножеством. К сожалению, любая попытка ограничиться каким-либо их фиксированным типом, например, только цепочками с заранее заданной максимальной длиной, чревата риском упустить из рассмотрения очень важные для решения данной задачи фрагменты. Одно из возможных решений этой проблемы состоит в использовании рассмотренных выше «добытых» (см. пункт 2.2.1.9) либо, для чисто классификационных задач, МОП-фрагментов (см. пункт 2.2.1.5). Альтернативой этому является использование стохастических процедур генерации подструктурных фрагментов. Интересная работа в этом направлении была опубликована Грахамом (Graham) с соавт., которые получили «записи на ленту» (“tape recordings”) химических структур при помощи фрагментов атом-связь-атом, извлекаемых из молекулярных графов при помощи процедуры случайных блужданий (random walks) [300]. Для оценки структурного подобия химических соединений Батиста (Batista), Годден (Godden) и Байорат (Bajorath) разработали метод MolBlaster, основанный на генерации популяций фрагментов путем случайного удаления ребер в молекулярных графах [301]. Этот метод с успехов был использован 86

при проведении виртуального скрининга, основанного на поиске по подобию [302]. 2.2.1.11. Библиотечные фрагменты Во многих работах применяются фиксированные наборы фрагментов, взятых из библиотеки. Подобные библиотеки обычно содержат фрагменты, которые уже показали пользу своего использования при прогнозировании сходных свойств. Большинство аддитивных схем и методов группового вклада были разработаны на основе фиксированных наборов фрагментов. В некоторых исследованиях SAR/QSAR/QSPR также рассматриваются фиксированные наборы библиотечных фрагментов. В подобных случаях структуры фрагментов обычно задаются при помощи специального языка либо линейной нотации, специально созданных для описания списков фрагментов. В качестве характерных примеров можно привести: (а) экспертную систему DEREK, предназначенную для предсказания токсичности органических соединений, в которой используется для описания фрагментов специальный язык PATRAN [303]; (б) систему прогнозирования коэффициента распределения в системе октанол-вода Log P, в которой для кодирования фрагментов использован язык программирования Prolog [304]; (в) метод ALogP [180] для прогнозирования этого же свойства, основанный на использовании линейной нотации SMARTS line notation (реализованной в программном комплексе MOE (Molecular Operating Environment) [248]) для спецификации фрагментов. 2.2.2. Классификация по типам молекулярных структур Молекулярные графы могут быть использованы для описания не только обычных молекулярных структур, но и супрамолекулярных комплексов, химических реакций, полимеров с периодической структурой и других видов химических объектов. Во всех этих случаях фрагментные дескрипторы могут быть применены для представления их структур. 87

при проведении виртуального скрининга, основанного на поиске по подобию<br />

[302].<br />

2.2.1.11. Библиотечные фрагменты<br />

Во многих работах применяются фиксированные наборы фрагментов,<br />

взятых из библиотеки. Подобные библиотеки обычно содержат фрагменты, которые<br />

уже показали пользу своего использования при прогнозировании сходных<br />

свойств. Большинство аддитивных схем и методов группового вклада были<br />

разработаны на основе фиксированных наборов фрагментов. В некоторых исследованиях<br />

SAR/QSAR/QSPR также рассматриваются фиксированные наборы<br />

библиотечных фрагментов. В подобных случаях структуры фрагментов обычно<br />

задаются при помощи специального языка либо линейной нотации, специально<br />

созданных для описания списков фрагментов. В качестве характерных примеров<br />

можно привести: (а) экспертную систему DEREK, предназначенную для<br />

предсказания токсичности органических соединений, в которой используется<br />

для описания фрагментов специальный язык PATRAN [303]; (б) систему прогнозирования<br />

коэффициента распределения в системе октанол-вода Log P, в которой<br />

для кодирования фрагментов использован язык программирования Prolog<br />

[304]; (в) метод ALogP [180] для прогнозирования этого же свойства, основанный<br />

на использовании линейной нотации SMARTS line notation (реализованной<br />

в программном комплексе MOE (Molecular Operating Environment) [248]) для<br />

спецификации фрагментов.<br />

2.2.2. Классификация по типам молекулярных структур<br />

Молекулярные графы могут быть использованы для описания не только<br />

обычных молекулярных структур, но и супрамолекулярных комплексов, химических<br />

реакций, полимеров с периодической структурой и других видов химических<br />

объектов. Во всех этих случаях фрагментные дескрипторы могут быть<br />

применены для представления их структур.<br />

87

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!