На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

подмножеством для получения дескрипторов, способных аппроксимировать все возможные свойства с любой точностью. Тем не менее, для многих задач на практике использование базисных подграфов (и соответствующих фрагментных дескрипторов) может оказаться очень полезным. М.И. Скворцова, К.С. Федяев, И.И. Баскин и др. расширили набор базисных подграфов Рандича за счет включения как циклических фрагментов, так и составных фрагментов, состоящих из вершины, присоединенной к циклическому фрагменту [261] (этот материал не включен в данную диссертационную работу). Предложенный набор фрагментов обладает хорошей уникальностью (т.е. разные вектора дескрипторов кодируют разные структуры) и полнотой кодирования (т.е. они могут аппроксимировать большое число зависимостей структура-свойство). Базисные фрагментные дескрипторы этого типа были использованы при построении ряда QSPR-моделей [262] (см. Рис. 15). k = 2 k = 3 k = 4 k = 5 Рис. 15. Базисные подграфы Скворцовой для максимального числа вершин 5 Другим источником базисных подграфов являются результаты разложения инвариантов молекулярных графов по числам встречаемости базисных подграфов. Возможность подобного разложения следует из нескольких теоретико-графовых теорем [258, 259]. Эстрада (Estrada) развил эту методологию для спектральных моментов реберной матрицы смежности молекулярных графов, которые определяются как следы разных степеней такой матрицы [263-265]: k μ = tr( E ) (61) k где: μ k - это k-ый спектральный момент реберной матрицы смежности E (которая представляет собой квадратную и симметричную матрицу, элемент e ij кото- 82

рой равен 1 только в том случае, если ребра i и j являются смежными); tr – след матрицы, т.е. сумма ее диагональных элементов. Оказывается, спектральные моменты могут быть представлены как линейные комбинации чисел встречаемости определенных связных структурных фрагментов в молекулярных графах (вышеупомянутые теоремы не гарантируют связность подграфов и простоту разложения для произвольных инвариантов молекулярных графов, и в этом, повидимому, и заключается преимущество использования спектральных моментов в качестве таких инвариантов). Подобные линейные комбинации для простых молекулярных графов, не содержащих гетероатомов, табулированы для ациклических [263] и циклических [265] химических структур. Для иллюстрации этого подхода рассмотрим приведенную в статье [263] корреляцию между температурой кипения алканов и спектральными моментами: bp( o C) = -76.719 + 23.992μ 0 + 2.506μ 2 – 2.967μ 3 + 0.149μ 5 (62) R = 0.9949, s = 4.21, F = 1650 Первые шесть спектральных моментов реберной матрицы смежности E следующим образом выражаются в виде линейных комбинаций чисел встречаемости фрагментов, приведенных на Рис. 16: μ 0 = F 1 (63) μ (64) 2 = 2× F 2 μ (65) 3 = 6× F 3 μ = 2× F + × F + × F + × F (66) 4 2 12 3 24 4 4 5 3 120 4 10 6 5 μ = 30× F + × F + × F (67) μ = 2× F + × F + × F + × F + × F + × F + × F + × F (68) 6 2 60 3 480 4 12 5 24 6 6 7 36 8 24 где |F i | обозначает число встречаемости подграфа F i в молекулярном графе. 9 83

рой равен 1 только в том случае, если ребра i и j являются смежными); tr – след<br />

матрицы, т.е. сумма ее диагональных элементов. Оказывается, спектральные<br />

моменты могут быть представлены как линейные комбинации чисел встречаемости<br />

определенных связных структурных фрагментов в молекулярных графах<br />

(вышеупомянутые теоремы не гарантируют связность подграфов и простоту<br />

разложения для произвольных инвариантов молекулярных графов, и в этом, повидимому,<br />

и заключается преимущество использования спектральных моментов<br />

в качестве таких инвариантов). Подобные линейные комбинации для простых<br />

молекулярных графов, не содержащих гетероатомов, табулированы для<br />

ациклических [263] и циклических [265] химических структур.<br />

Для иллюстрации этого подхода рассмотрим приведенную в статье [263]<br />

корреляцию между температурой кипения алканов и спектральными моментами:<br />

bp( o C) = -76.719 + 23.992μ 0 + 2.506μ 2 – 2.967μ 3 + 0.149μ 5 (62)<br />

R = 0.9949, s = 4.21, F = 1650<br />

Первые шесть спектральных моментов реберной матрицы смежности E<br />

следующим образом выражаются в виде линейных комбинаций чисел встречаемости<br />

фрагментов, приведенных на Рис. 16:<br />

μ<br />

0<br />

= F 1<br />

(63)<br />

μ (64)<br />

2<br />

= 2×<br />

F 2<br />

μ (65)<br />

3<br />

= 6×<br />

F 3<br />

μ = 2×<br />

F + × F + × F + × F<br />

(66)<br />

4 2<br />

12<br />

3<br />

24<br />

4<br />

4<br />

5 3<br />

120<br />

4<br />

10<br />

6<br />

5<br />

μ = 30×<br />

F + × F + × F<br />

(67)<br />

μ = 2×<br />

F + × F + × F + × F + × F + × F + × F + × F (68)<br />

6 2<br />

60<br />

3<br />

480<br />

4<br />

12<br />

5<br />

24<br />

6<br />

6<br />

7<br />

36<br />

8<br />

24<br />

где |F i | обозначает число встречаемости подграфа F i в молекулярном графе.<br />

9<br />

83

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!