Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
организации подструктурного поиска, кластеризации баз данных [150], так и для проведения исследований SAR [152]. Центрированные на связях фрагменты применялись также в системе DARC [227, 228]. 2.2.1.5. Фрагменты на основе максимальных общих подграфов Максимальный общий подграф (МОП) для множества графов определяется как подграф, который содержится во всех графах этого множества, но не содержится ни в одном другом МОП. В большинстве практически важных приложениях МОП определяется только для пар графов, т.е. для множеств, состоящих из двух графов. МОП могут быть найдены при помощи процедуры пересечения графов с использованием множества различных алгоритмов (см. обзор [235]), наиболее известный из которых состоит в поиске клик т.н. графов совместимости. Следует, однако, принять во внимание, что для пары графов может существовать несколько МОП. Основное преимущество использования МОП в качестве фрагментов в исследованиях SAR/QSAR/QSPR состоит в том, что разнообразие их строения ничем искусственно не ограничено, и поэтому с их помощью могут быть найдены ответственные за целевые свойства структурно сложные фрагменты, которые никак не могли бы попасть в поле зрения при рассмотрении только фрагментов, относящихся к какому-нибудь структурно однородному типу, такому как цепочки, циклы, ЦАФ и др.. Впервые фрагменты МОП были использованы в исследованиях SAR в начале 1980-ых годов А.Б. Розенблитом и В.Е. Голендером в рамках разработанного ими логико-комбинаторного подхода [130, 131, 236]. Поскольку в то время компьютеры были очень медленными, в практических приложениях авторам, однако, пришлось ограничиться операциями над редуцированными графами (см. обсуждение ниже), построенных на фармакофорных центрах. Следующий этап в применении фрагментов МОП в этой области относится к началу 1990-ых гг., когда их стали использовать для вычисления химического расстояния и проведения поиска по подобию [237]. В последнее время фрагменты МОП стали применять для кластеризации химических баз данных [238, 239] и, 76
кроме того, они снова стали использоваться для прогнозирования биологической активности органических соединений [194, 240, 241]. 2.2.1.6. Атомные пары и топологические мультиплеты Этот тип фрагментных дескрипторов был специально разработан для проведения исследований SAR для фармакологически важных свойств органических соединений. В его основе лежит понятие о дескрипторных центрах, под которыми подразумеваются атомы либо группы атомов, которые могли бы служить центрами межмолекулярных взаимодействий. Обычно в качестве дескрипторных центров берутся гетероатомы, ненасыщенные связи и ароматические циклы. Вторым важным элементом в спецификации этого типа дескрипторов является расстояние между дескрипторными центрами, под которым обычно подразумевают топологическое расстояние между атомами в химической структуре, либо кратчайшее расстояние между атомами, принадлежащими двум группам. В этом контексте, атомная пара определяется как пара дескрипторных центров вместе с расстоянием между ними. По аналогии с этим, топологический мультиплет определяется как мультиплет (обычно триплет) дескрипторных центров наряду с набором расстояний для каждой из их пар. Дескрипторы, относящиеся к этой категории, принимают обычно бинарные значения, указывающие на присутствие либо отсутствие соответствующих фрагментов в химической структуре. Таким образом, атомные пары являются частным случаем топологических мультиплетов. С позиций теории графов, атомные пары представляют собой цепочки со специфицированными типами терминальных вершин и обобщенными типами внутренних вершин и ребер в молекулярном графе. Топологические мультиплеты, однако, требуют более сложного описания с позиций теории графов. Атомные пары впервые были введены в практику проведения исследований SAR В.В. Авидоном и названы им фрагментарными кодами суперпозиции подструктур (ФКСП) [131, 242]. В дальнейшем сходные дескрипторы были предложены Кархартом (Carhart) с соавт. [243], которые их использовали для 77
- Page 25 and 26: жения в статье Руме
- Page 27 and 28: Рис. 5. Введение мом
- Page 29 and 30: адаптивно настраив
- Page 31 and 32: 1.2.4.7. Квазиньютонов
- Page 33 and 34: (химических соедин
- Page 35 and 36: на границах решетк
- Page 37 and 38: ными значениями со
- Page 39 and 40: рующие один и тот ж
- Page 41 and 42: дящихся на 2-ом, 3-м и
- Page 43 and 44: всех RBF-нейронов, а
- Page 45 and 46: чающей выборки, при
- Page 47 and 48: Рис. 10. Архитектура
- Page 49 and 50: 1.2.5.4. Нейросети на о
- Page 51 and 52: ми связями, занимае
- Page 53 and 54: практически важных
- Page 55 and 56: ния классического
- Page 57 and 58: ческому мозгу во вр
- Page 59 and 60: лаждения системы и
- Page 61 and 62: чем в качестве прог
- Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ
- Page 65 and 66: му типу биологичес
- Page 67 and 68: тему опубликовано
- Page 69 and 70: В настоящее время п
- Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс
- Page 73 and 74: В качестве характе
- Page 75: Некоторые типы ЦАФ
- Page 79 and 80: Следует упомянуть
- Page 81 and 82: зисных графов, пред
- Page 83 and 84: рой равен 1 только в
- Page 85 and 86: множества различны
- Page 87 and 88: при проведении вир
- Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92: ределенных атомных
- Page 93 and 94: элементам, что може
- Page 95 and 96: наличие или отсутс
- Page 97 and 98: использовались в н
- Page 99 and 100: ложенные в 1985 г. ато
- Page 101 and 102: 2.3. Ограничения фра
- Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106: качестве меток исп
- Page 107 and 108: ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
- Page 113 and 114: линейные комбинаци
- Page 115 and 116: таться внешней по о
- Page 117 and 118: Предсказанное знач
- Page 119 and 120: рипторе, то он пере
- Page 121 and 122: Для решения этой пр
- Page 123 and 124: • D x - среднее значе
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
организации подструктурного поиска, кластеризации баз данных [150], так и<br />
для проведения исследований SAR [152]. Центрированные на связях фрагменты<br />
применялись также в системе DARC [227, 228].<br />
2.2.1.5. Фрагменты на основе максимальных общих подграфов<br />
Максимальный общий подграф (МОП) для множества графов определяется<br />
как подграф, который содержится во всех графах этого множества, но не содержится<br />
ни в одном другом МОП. В большинстве практически важных приложениях<br />
МОП определяется только для пар графов, т.е. для множеств, состоящих<br />
из двух графов. МОП могут быть найдены при помощи процедуры пересечения<br />
графов с использованием множества различных алгоритмов (см. обзор<br />
[235]), наиболее известный из которых состоит в поиске клик т.н. графов<br />
совместимости. Следует, однако, принять во внимание, что для пары графов<br />
может существовать несколько МОП. Основное преимущество использования<br />
МОП в качестве фрагментов в исследованиях SAR/QSAR/QSPR состоит в том,<br />
что разнообразие их строения ничем искусственно не ограничено, и поэтому с<br />
их помощью могут быть найдены ответственные за целевые свойства структурно<br />
сложные фрагменты, которые никак не могли бы попасть в поле зрения при<br />
рассмотрении только фрагментов, относящихся к какому-нибудь структурно<br />
однородному типу, такому как цепочки, циклы, ЦАФ и др..<br />
Впервые фрагменты МОП были использованы в исследованиях SAR в<br />
начале 1980-ых годов А.Б. Розенблитом и В.Е. Голендером в рамках разработанного<br />
ими логико-комбинаторного подхода [130, 131, 236]. Поскольку в то<br />
время компьютеры были очень медленными, в практических приложениях авторам,<br />
однако, пришлось ограничиться операциями над редуцированными графами<br />
(см. обсуждение ниже), построенных на фармакофорных центрах. Следующий<br />
этап в применении фрагментов МОП в этой области относится к началу<br />
1990-ых гг., когда их стали использовать для вычисления химического расстояния<br />
и проведения поиска по подобию [237]. В последнее время фрагменты<br />
МОП стали применять для кластеризации химических баз данных [238, 239] и,<br />
76