Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
CRC [317]. (см. Рис. 19). После этого фрагмент помещается в определенную ячейку (bin) молекулярной голограммы, положение которой (bin ID) вычисляется как остаток от деления хеш-кода (fragment integer ID) на размер (т.е. количество ячеек) молекулярной голограммы. Каждый раз при нахождении очередного вхождения фрагмента в химическую структуру заселенность соответствующей ячейки молекулярной голограммы увеличивается на единицу. В отличие от стандартных хеш-таблиц, в молекулярных голограммах столкновения данных не устранены, и поэтому несколько разных фрагментов могут отобразиться на одну ячейку молекулярной голограммы. Следовательно, в результате анализа химической структуры общая заселенность ячейки молекулярной голограммы оказывается равной сумме целочисленных значений дескрипторов, соответствующим фрагментам, на нее отображаемым. Молекулярные голограммы легли в основу голографического QSAR (holographic QSAR - HQSAR) [153], в котором заселенности ячеек молекулярной голограммы выступают в качестве дескрипторов, корреляция которых с числовым значением биологической активности строится при помощи метода частичных наименьших квадратов PLS. Molecular Structure O Fragment Generation Fragments Fragment Integer IDs 12 5 9 ... O ... CRC Algorithm 3 6 2 0 5 13 0 7 1 8 1 2 3 4 5 6 7 8 9 10 Molecular Hologram Bin IDs Рис. 19. Генерация молекулярной голограммы По своей природе молекулярные голограммы очень близки к хешированным молекулярным отпечаткам пальцев (hashed molecular fingerprints) (или просто молекулярным отпечаткам пальцев (molecular fingerprints)), однако построены на основе бинарных фрагментных дескрипторов, показывающих лишь 94
наличие или отсутствие данного фрагмента в химической структуре. Также, в отличие от молекулярных голограмм, при построении молекулярных отпечатков пальцев каждый фрагмент может отображаться на несколько ячеек молекулярной голограммы, положения которых вычисляются при введении хеш-кода как затравки для генератора псевдослучайных чисел. Для увеличения информационной плотности (которая зависит от соотношений битов “on” и “off”), молекулярные отпечатки пальцев могут быть получены при помощи процедуры сворачивания (folding), при которой каждый молекулярный отпечаток пальцев делится пополам, и две получившиеся половины комбинируются при помощи логической операции ИЛИ. Преимущество хешированных молекулярных отпечатков пальцев заключается в возможности использовать большое число дескрипторов для описания химической структуры. Недостаток же их связан с тем, что в них столкновения данных не устраняются (см. обсуждение выше). Тем не менее, в некоторых случаях этот недостаток может быть частично устранен путем подбора оптимальной длины хеш-буфера, при котором исключены столкновения наиболее важных фрагментных дескрипторов (см. Рис. 20). O OH O O Fragment Generation ... O OH O ... O 0 1 0 1 1 0 1 0 0 1 Hashed fingerprints Рис. 20. Генерация хешированных молекулярных отпечатков пальцев. Каждый фрагмент приводит к установке нескольких битов. Бит, на котором произошла коллизия, отмечен жирным шрифтом и подчеркнут 95
- Page 43 and 44: всех RBF-нейронов, а
- Page 45 and 46: чающей выборки, при
- Page 47 and 48: Рис. 10. Архитектура
- Page 49 and 50: 1.2.5.4. Нейросети на о
- Page 51 and 52: ми связями, занимае
- Page 53 and 54: практически важных
- Page 55 and 56: ния классического
- Page 57 and 58: ческому мозгу во вр
- Page 59 and 60: лаждения системы и
- Page 61 and 62: чем в качестве прог
- Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ
- Page 65 and 66: му типу биологичес
- Page 67 and 68: тему опубликовано
- Page 69 and 70: В настоящее время п
- Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс
- Page 73 and 74: В качестве характе
- Page 75 and 76: Некоторые типы ЦАФ
- Page 77 and 78: кроме того, они сно
- Page 79 and 80: Следует упомянуть
- Page 81 and 82: зисных графов, пред
- Page 83 and 84: рой равен 1 только в
- Page 85 and 86: множества различны
- Page 87 and 88: при проведении вир
- Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92: ределенных атомных
- Page 93: элементам, что може
- Page 97 and 98: использовались в н
- Page 99 and 100: ложенные в 1985 г. ато
- Page 101 and 102: 2.3. Ограничения фра
- Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106: качестве меток исп
- Page 107 and 108: ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
- Page 113 and 114: линейные комбинаци
- Page 115 and 116: таться внешней по о
- Page 117 and 118: Предсказанное знач
- Page 119 and 120: рипторе, то он пере
- Page 121 and 122: Для решения этой пр
- Page 123 and 124: • D x - среднее значе
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
наличие или отсутствие данного фрагмента в химической структуре. Также, в<br />
отличие от молекулярных голограмм, при построении молекулярных отпечатков<br />
пальцев каждый фрагмент может отображаться на несколько ячеек молекулярной<br />
голограммы, положения которых вычисляются при введении хеш-кода<br />
как затравки для генератора псевдослучайных чисел. Для увеличения информационной<br />
плотности (которая зависит от соотношений битов “on” и “off”), молекулярные<br />
отпечатки пальцев могут быть получены при помощи процедуры сворачивания<br />
(folding), при которой каждый молекулярный отпечаток пальцев делится<br />
пополам, и две получившиеся половины комбинируются при помощи логической<br />
операции ИЛИ. Преимущество хешированных молекулярных отпечатков<br />
пальцев заключается в возможности использовать большое число дескрипторов<br />
для описания химической структуры. Недостаток же их связан с тем,<br />
что в них столкновения данных не устраняются (см. обсуждение выше). Тем не<br />
менее, в некоторых случаях этот недостаток может быть частично устранен путем<br />
подбора оптимальной длины хеш-буфера, при котором исключены столкновения<br />
наиболее важных фрагментных дескрипторов (см. Рис. 20).<br />
O<br />
OH<br />
O<br />
O<br />
Fragment Generation<br />
...<br />
O<br />
OH<br />
O<br />
...<br />
O<br />
0 1 0 1 1 0 1 0 0 1<br />
Hashed fingerprints<br />
Рис. 20. Генерация хешированных молекулярных отпечатков пальцев. Каждый<br />
фрагмент приводит к установке нескольких битов. Бит, на котором произошла<br />
коллизия, отмечен жирным шрифтом и подчеркнут<br />
95