Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
подмножеством для получения дескрипторов, способных аппроксимировать все возможные свойства с любой точностью. Тем не менее, для многих задач на практике использование базисных подграфов (и соответствующих фрагментных дескрипторов) может оказаться очень полезным. М.И. Скворцова, К.С. Федяев, И.И. Баскин и др. расширили набор базисных подграфов Рандича за счет включения как циклических фрагментов, так и составных фрагментов, состоящих из вершины, присоединенной к циклическому фрагменту [261] (этот материал не включен в данную диссертационную работу). Предложенный набор фрагментов обладает хорошей уникальностью (т.е. разные вектора дескрипторов кодируют разные структуры) и полнотой кодирования (т.е. они могут аппроксимировать большое число зависимостей структура-свойство). Базисные фрагментные дескрипторы этого типа были использованы при построении ряда QSPR-моделей [262] (см. Рис. 15). k = 2 k = 3 k = 4 k = 5 Рис. 15. Базисные подграфы Скворцовой для максимального числа вершин 5 Другим источником базисных подграфов являются результаты разложения инвариантов молекулярных графов по числам встречаемости базисных подграфов. Возможность подобного разложения следует из нескольких теоретико-графовых теорем [258, 259]. Эстрада (Estrada) развил эту методологию для спектральных моментов реберной матрицы смежности молекулярных графов, которые определяются как следы разных степеней такой матрицы [263-265]: k μ = tr( E ) (61) k где: μ k - это k-ый спектральный момент реберной матрицы смежности E (которая представляет собой квадратную и симметричную матрицу, элемент e ij кото- 82
рой равен 1 только в том случае, если ребра i и j являются смежными); tr – след матрицы, т.е. сумма ее диагональных элементов. Оказывается, спектральные моменты могут быть представлены как линейные комбинации чисел встречаемости определенных связных структурных фрагментов в молекулярных графах (вышеупомянутые теоремы не гарантируют связность подграфов и простоту разложения для произвольных инвариантов молекулярных графов, и в этом, повидимому, и заключается преимущество использования спектральных моментов в качестве таких инвариантов). Подобные линейные комбинации для простых молекулярных графов, не содержащих гетероатомов, табулированы для ациклических [263] и циклических [265] химических структур. Для иллюстрации этого подхода рассмотрим приведенную в статье [263] корреляцию между температурой кипения алканов и спектральными моментами: bp( o C) = -76.719 + 23.992μ 0 + 2.506μ 2 – 2.967μ 3 + 0.149μ 5 (62) R = 0.9949, s = 4.21, F = 1650 Первые шесть спектральных моментов реберной матрицы смежности E следующим образом выражаются в виде линейных комбинаций чисел встречаемости фрагментов, приведенных на Рис. 16: μ 0 = F 1 (63) μ (64) 2 = 2× F 2 μ (65) 3 = 6× F 3 μ = 2× F + × F + × F + × F (66) 4 2 12 3 24 4 4 5 3 120 4 10 6 5 μ = 30× F + × F + × F (67) μ = 2× F + × F + × F + × F + × F + × F + × F + × F (68) 6 2 60 3 480 4 12 5 24 6 6 7 36 8 24 где |F i | обозначает число встречаемости подграфа F i в молекулярном графе. 9 83
- Page 31 and 32: 1.2.4.7. Квазиньютонов
- Page 33 and 34: (химических соедин
- Page 35 and 36: на границах решетк
- Page 37 and 38: ными значениями со
- Page 39 and 40: рующие один и тот ж
- Page 41 and 42: дящихся на 2-ом, 3-м и
- Page 43 and 44: всех RBF-нейронов, а
- Page 45 and 46: чающей выборки, при
- Page 47 and 48: Рис. 10. Архитектура
- Page 49 and 50: 1.2.5.4. Нейросети на о
- Page 51 and 52: ми связями, занимае
- Page 53 and 54: практически важных
- Page 55 and 56: ния классического
- Page 57 and 58: ческому мозгу во вр
- Page 59 and 60: лаждения системы и
- Page 61 and 62: чем в качестве прог
- Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ
- Page 65 and 66: му типу биологичес
- Page 67 and 68: тему опубликовано
- Page 69 and 70: В настоящее время п
- Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс
- Page 73 and 74: В качестве характе
- Page 75 and 76: Некоторые типы ЦАФ
- Page 77 and 78: кроме того, они сно
- Page 79 and 80: Следует упомянуть
- Page 81: зисных графов, пред
- Page 85 and 86: множества различны
- Page 87 and 88: при проведении вир
- Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92: ределенных атомных
- Page 93 and 94: элементам, что може
- Page 95 and 96: наличие или отсутс
- Page 97 and 98: использовались в н
- Page 99 and 100: ложенные в 1985 г. ато
- Page 101 and 102: 2.3. Ограничения фра
- Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106: качестве меток исп
- Page 107 and 108: ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
- Page 113 and 114: линейные комбинаци
- Page 115 and 116: таться внешней по о
- Page 117 and 118: Предсказанное знач
- Page 119 and 120: рипторе, то он пере
- Page 121 and 122: Для решения этой пр
- Page 123 and 124: • D x - среднее значе
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
рой равен 1 только в том случае, если ребра i и j являются смежными); tr – след<br />
матрицы, т.е. сумма ее диагональных элементов. Оказывается, спектральные<br />
моменты могут быть представлены как линейные комбинации чисел встречаемости<br />
определенных связных структурных фрагментов в молекулярных графах<br />
(вышеупомянутые теоремы не гарантируют связность подграфов и простоту<br />
разложения для произвольных инвариантов молекулярных графов, и в этом, повидимому,<br />
и заключается преимущество использования спектральных моментов<br />
в качестве таких инвариантов). Подобные линейные комбинации для простых<br />
молекулярных графов, не содержащих гетероатомов, табулированы для<br />
ациклических [263] и циклических [265] химических структур.<br />
Для иллюстрации этого подхода рассмотрим приведенную в статье [263]<br />
корреляцию между температурой кипения алканов и спектральными моментами:<br />
bp( o C) = -76.719 + 23.992μ 0 + 2.506μ 2 – 2.967μ 3 + 0.149μ 5 (62)<br />
R = 0.9949, s = 4.21, F = 1650<br />
Первые шесть спектральных моментов реберной матрицы смежности E<br />
следующим образом выражаются в виде линейных комбинаций чисел встречаемости<br />
фрагментов, приведенных на Рис. 16:<br />
μ<br />
0<br />
= F 1<br />
(63)<br />
μ (64)<br />
2<br />
= 2×<br />
F 2<br />
μ (65)<br />
3<br />
= 6×<br />
F 3<br />
μ = 2×<br />
F + × F + × F + × F<br />
(66)<br />
4 2<br />
12<br />
3<br />
24<br />
4<br />
4<br />
5 3<br />
120<br />
4<br />
10<br />
6<br />
5<br />
μ = 30×<br />
F + × F + × F<br />
(67)<br />
μ = 2×<br />
F + × F + × F + × F + × F + × F + × F + × F (68)<br />
6 2<br />
60<br />
3<br />
480<br />
4<br />
12<br />
5<br />
24<br />
6<br />
6<br />
7<br />
36<br />
8<br />
24<br />
где |F i | обозначает число встречаемости подграфа F i в молекулярном графе.<br />
9<br />
83