Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
гом (Yang) и Мунтцем (Muntz) [295]; CMTreeMiner этих же авторов [296]. Первоначально этот подход использовался для классификации химических структур в рамках исследований SAR [297, 298]. Специальная модификация этого подхода с применением методики «добычи взвешенных подструктур» (weighted substructure mining) в сочетании со статистической процедурой linear programming boosting [299] позволяет строить количественные QSAR/QSPR регрессионные модели с использованием «добытых» фрагментных дескрипторов [288]. 2.2.1.10. Фрагменты на основе случайных подграфов Успех применения различных схем фрагментации в значительной степени зависит от начального выбора нужных типов фрагментов. Поскольку практически невозможно рассмотреть все возможные фрагменты из-за их гигантского числа, всегда приходится ограничиваться их небольшим подмножеством. К сожалению, любая попытка ограничиться каким-либо их фиксированным типом, например, только цепочками с заранее заданной максимальной длиной, чревата риском упустить из рассмотрения очень важные для решения данной задачи фрагменты. Одно из возможных решений этой проблемы состоит в использовании рассмотренных выше «добытых» (см. пункт 2.2.1.9) либо, для чисто классификационных задач, МОП-фрагментов (см. пункт 2.2.1.5). Альтернативой этому является использование стохастических процедур генерации подструктурных фрагментов. Интересная работа в этом направлении была опубликована Грахамом (Graham) с соавт., которые получили «записи на ленту» (“tape recordings”) химических структур при помощи фрагментов атом-связь-атом, извлекаемых из молекулярных графов при помощи процедуры случайных блужданий (random walks) [300]. Для оценки структурного подобия химических соединений Батиста (Batista), Годден (Godden) и Байорат (Bajorath) разработали метод MolBlaster, основанный на генерации популяций фрагментов путем случайного удаления ребер в молекулярных графах [301]. Этот метод с успехов был использован 86
при проведении виртуального скрининга, основанного на поиске по подобию [302]. 2.2.1.11. Библиотечные фрагменты Во многих работах применяются фиксированные наборы фрагментов, взятых из библиотеки. Подобные библиотеки обычно содержат фрагменты, которые уже показали пользу своего использования при прогнозировании сходных свойств. Большинство аддитивных схем и методов группового вклада были разработаны на основе фиксированных наборов фрагментов. В некоторых исследованиях SAR/QSAR/QSPR также рассматриваются фиксированные наборы библиотечных фрагментов. В подобных случаях структуры фрагментов обычно задаются при помощи специального языка либо линейной нотации, специально созданных для описания списков фрагментов. В качестве характерных примеров можно привести: (а) экспертную систему DEREK, предназначенную для предсказания токсичности органических соединений, в которой используется для описания фрагментов специальный язык PATRAN [303]; (б) систему прогнозирования коэффициента распределения в системе октанол-вода Log P, в которой для кодирования фрагментов использован язык программирования Prolog [304]; (в) метод ALogP [180] для прогнозирования этого же свойства, основанный на использовании линейной нотации SMARTS line notation (реализованной в программном комплексе MOE (Molecular Operating Environment) [248]) для спецификации фрагментов. 2.2.2. Классификация по типам молекулярных структур Молекулярные графы могут быть использованы для описания не только обычных молекулярных структур, но и супрамолекулярных комплексов, химических реакций, полимеров с периодической структурой и других видов химических объектов. Во всех этих случаях фрагментные дескрипторы могут быть применены для представления их структур. 87
- Page 35 and 36: на границах решетк
- Page 37 and 38: ными значениями со
- Page 39 and 40: рующие один и тот ж
- Page 41 and 42: дящихся на 2-ом, 3-м и
- Page 43 and 44: всех RBF-нейронов, а
- Page 45 and 46: чающей выборки, при
- Page 47 and 48: Рис. 10. Архитектура
- Page 49 and 50: 1.2.5.4. Нейросети на о
- Page 51 and 52: ми связями, занимае
- Page 53 and 54: практически важных
- Page 55 and 56: ния классического
- Page 57 and 58: ческому мозгу во вр
- Page 59 and 60: лаждения системы и
- Page 61 and 62: чем в качестве прог
- Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ
- Page 65 and 66: му типу биологичес
- Page 67 and 68: тему опубликовано
- Page 69 and 70: В настоящее время п
- Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс
- Page 73 and 74: В качестве характе
- Page 75 and 76: Некоторые типы ЦАФ
- Page 77 and 78: кроме того, они сно
- Page 79 and 80: Следует упомянуть
- Page 81 and 82: зисных графов, пред
- Page 83 and 84: рой равен 1 только в
- Page 85: множества различны
- Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92: ределенных атомных
- Page 93 and 94: элементам, что може
- Page 95 and 96: наличие или отсутс
- Page 97 and 98: использовались в н
- Page 99 and 100: ложенные в 1985 г. ато
- Page 101 and 102: 2.3. Ограничения фра
- Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106: качестве меток исп
- Page 107 and 108: ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
- Page 113 and 114: линейные комбинаци
- Page 115 and 116: таться внешней по о
- Page 117 and 118: Предсказанное знач
- Page 119 and 120: рипторе, то он пере
- Page 121 and 122: Для решения этой пр
- Page 123 and 124: • D x - среднее значе
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
при проведении виртуального скрининга, основанного на поиске по подобию<br />
[302].<br />
2.2.1.11. Библиотечные фрагменты<br />
Во многих работах применяются фиксированные наборы фрагментов,<br />
взятых из библиотеки. Подобные библиотеки обычно содержат фрагменты, которые<br />
уже показали пользу своего использования при прогнозировании сходных<br />
свойств. Большинство аддитивных схем и методов группового вклада были<br />
разработаны на основе фиксированных наборов фрагментов. В некоторых исследованиях<br />
SAR/QSAR/QSPR также рассматриваются фиксированные наборы<br />
библиотечных фрагментов. В подобных случаях структуры фрагментов обычно<br />
задаются при помощи специального языка либо линейной нотации, специально<br />
созданных для описания списков фрагментов. В качестве характерных примеров<br />
можно привести: (а) экспертную систему DEREK, предназначенную для<br />
предсказания токсичности органических соединений, в которой используется<br />
для описания фрагментов специальный язык PATRAN [303]; (б) систему прогнозирования<br />
коэффициента распределения в системе октанол-вода Log P, в которой<br />
для кодирования фрагментов использован язык программирования Prolog<br />
[304]; (в) метод ALogP [180] для прогнозирования этого же свойства, основанный<br />
на использовании линейной нотации SMARTS line notation (реализованной<br />
в программном комплексе MOE (Molecular Operating Environment) [248]) для<br />
спецификации фрагментов.<br />
2.2.2. Классификация по типам молекулярных структур<br />
Молекулярные графы могут быть использованы для описания не только<br />
обычных молекулярных структур, но и супрамолекулярных комплексов, химических<br />
реакций, полимеров с периодической структурой и других видов химических<br />
объектов. Во всех этих случаях фрагментные дескрипторы могут быть<br />
применены для представления их структур.<br />
87