Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
ренные атомы» [135]. Наряду с ними, Хоудс также предложил использовать «ганглии-расширеные атомы» (ganglia augmented atoms), которые дополнительно учитывают связи между атомами первой и второй оболочек [214] и поэтому могут быть представлены как ЦАФ радиуса 2 с обобщенными атомами во второй оболочке. ЦАФ радиуса 1 были в дальнейшем также интегрированы в дескрипторный блок FRAGMENT [193] под названием «разветвленные фрагменты» (branched fragments). ЦАФ произвольного радиуса были независимо предложены и реализованы несколькими группами авторов: (а) В.П.Соловьевым и Варнеком (Varnek) в программах TRAIL [196, 197] и ISIDA [114] под именем «расширенные атомы» (augmented atoms); (б) Д.А.Филимоновым, В.В.Поройковым с соавт. в программе PASS [215] под именем «многоуровневые атомные окрестности» Multilevel Neighborhoods of Atoms (MNA) [216]; (в) Ксингом (Xing) и Гленом (Glen) под именем «структурированные по дереву отпечатки пальцев» (tree structured fingerprints) [217] (которые, однако, в дальнейших публикациях Бендера (Bender), Глена (Glen) и др. называются «атомными окрестностями» (atom environments) [218, 219] и «циркулярными отпечатками пальцев» (circular fingerprints) [220-222], см. Рис. 12); (г) Фолоном (Faulon) под названием «молекулярные подписи» (molecular signatures) [223-225]. NH 2 2 1 0 O C OH Layers: 0 1 3 C.ar (sp 2 ) C.ar (sp 2 ) C.ar (sp 2 ) C.ar (sp 2 ) C.ar (sp 2 ) C (sp 2 ) N (sp 3 ) O (sp 2 ) O (sp 3 ) Рис. 12. «Циркулярные отпечатки пальцев» вместе с типами атомов, используемыми в mol2-файлах программного комплекса Sybyl. Индивидуальный фрагментный дескриптор вычисляется для каждого атома в молекуле с учетом атомов, отстоящих от него не больше, чем на две связи 74
Некоторые типы ЦАФ были первоначально разработаны для хранения в спектральных базах данных локальной (т.е. относящейся к отдельным атомам) спектральной информации, например, значений химического сдвига. Бремсер (Bremser) разработал систему подструктурных кодов, названную как «иерархически-упорядоченное сферическое окружение» (Hierarchically Ordered Spherical Environment (HOSE)), чтобы охарактеризовать сферическое окружение как отдельных атомов, так и целых циклических систем [226]. Эти кода генерировались автоматически из топологических представлений химических структур и служили для описания структурных контекстов для спектральных параметров (в частности, химических сдвигов). Очень близкая идея была воплощена Дюбуа (Dubois) и др. в системе DARC под именем FREL (Fragment Réduit à un Environment Limité – фрагмент, редуцированный до ограниченного окружения) [227, 228]. Ксяо (Xiao) с соавторами также использовали ЦАФ под названием «центрированные на атомах многоуровневые кода» (Atom-Centered Multilayer Code (ACMC)) для проведения структурного и подструктурного поиска в больших базах данных по химическим структурами и реакциям [229]. Одно из важных недавних приложений ЦАФ касается предсказания мишеней (target fishing) для данного органического соединения в хемогеномике [215, 230, 231]. 2.2.1.4. Центрированные на связях фрагменты Центрированные на связях фрагменты состоят из центральной связи, двух атомов, ею соединенных и окруженных одним или несколькими слоями атомов, находящихся на одинаковом топологическом расстоянии от ближайшего из этих двух атомов. В отличие от ЦАФ, они довольно редко используются в исследованиях SAR/QSAR/QSPR, однако они могут быть эффективно применены в качестве скринов при работе с химическими базами данных, что было продемонстрировано Адамсоном (Adamson) с соавт. [232]. Фрагменты этого типа входят в состав ключей MDL [233, 234], которые нашли применение как для 75
- Page 23 and 24: Таким образом, знач
- Page 25 and 26: жения в статье Руме
- Page 27 and 28: Рис. 5. Введение мом
- Page 29 and 30: адаптивно настраив
- Page 31 and 32: 1.2.4.7. Квазиньютонов
- Page 33 and 34: (химических соедин
- Page 35 and 36: на границах решетк
- Page 37 and 38: ными значениями со
- Page 39 and 40: рующие один и тот ж
- Page 41 and 42: дящихся на 2-ом, 3-м и
- Page 43 and 44: всех RBF-нейронов, а
- Page 45 and 46: чающей выборки, при
- Page 47 and 48: Рис. 10. Архитектура
- Page 49 and 50: 1.2.5.4. Нейросети на о
- Page 51 and 52: ми связями, занимае
- Page 53 and 54: практически важных
- Page 55 and 56: ния классического
- Page 57 and 58: ческому мозгу во вр
- Page 59 and 60: лаждения системы и
- Page 61 and 62: чем в качестве прог
- Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ
- Page 65 and 66: му типу биологичес
- Page 67 and 68: тему опубликовано
- Page 69 and 70: В настоящее время п
- Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс
- Page 73: В качестве характе
- Page 77 and 78: кроме того, они сно
- Page 79 and 80: Следует упомянуть
- Page 81 and 82: зисных графов, пред
- Page 83 and 84: рой равен 1 только в
- Page 85 and 86: множества различны
- Page 87 and 88: при проведении вир
- Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92: ределенных атомных
- Page 93 and 94: элементам, что може
- Page 95 and 96: наличие или отсутс
- Page 97 and 98: использовались в н
- Page 99 and 100: ложенные в 1985 г. ато
- Page 101 and 102: 2.3. Ограничения фра
- Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106: качестве меток исп
- Page 107 and 108: ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
- Page 113 and 114: линейные комбинаци
- Page 115 and 116: таться внешней по о
- Page 117 and 118: Предсказанное знач
- Page 119 and 120: рипторе, то он пере
- Page 121 and 122: Для решения этой пр
- Page 123 and 124: • D x - среднее значе
Некоторые типы ЦАФ были первоначально разработаны для хранения в<br />
спектральных базах данных локальной (т.е. относящейся к отдельным атомам)<br />
спектральной информации, например, значений химического сдвига. Бремсер<br />
(Bremser) разработал систему подструктурных кодов, названную как «иерархически-упорядоченное<br />
сферическое окружение» (Hierarchically Ordered Spherical<br />
Environment (HOSE)), чтобы охарактеризовать сферическое окружение как отдельных<br />
атомов, так и целых циклических систем [226]. Эти кода генерировались<br />
автоматически из топологических представлений химических структур и<br />
служили для описания структурных контекстов для спектральных параметров<br />
(в частности, химических сдвигов). Очень близкая идея была воплощена Дюбуа<br />
(Dubois) и др. в системе DARC под именем FREL (Fragment Réduit à un Environment<br />
Limité – фрагмент, редуцированный до ограниченного окружения)<br />
[227, 228]. Ксяо (Xiao) с соавторами также использовали ЦАФ под названием<br />
«центрированные на атомах многоуровневые кода» (Atom-Centered Multilayer<br />
Code (ACMC)) для проведения структурного и подструктурного поиска в<br />
больших базах данных по химическим структурами и реакциям [229].<br />
Одно из важных недавних приложений ЦАФ касается предсказания мишеней<br />
(target fishing) для данного органического соединения в хемогеномике<br />
[215, 230, 231].<br />
2.2.1.4. Центрированные на связях фрагменты<br />
Центрированные на связях фрагменты состоят из центральной связи, двух<br />
атомов, ею соединенных и окруженных одним или несколькими слоями атомов,<br />
находящихся на одинаковом топологическом расстоянии от ближайшего из<br />
этих двух атомов. В отличие от ЦАФ, они довольно редко используются в исследованиях<br />
SAR/QSAR/QSPR, однако они могут быть эффективно применены<br />
в качестве скринов при работе с химическими базами данных, что было продемонстрировано<br />
Адамсоном (Adamson) с соавт. [232]. Фрагменты этого типа<br />
входят в состав ключей MDL [233, 234], которые нашли применение как для<br />
75