На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

ной. В историческом плане, анализ заместителей первым вошел в практику проведения исследований QSAR. Хотя на вышеупомянутом разложении основаны два классических подхода в QSAR, метод Ханча-Фуджиты (Hansch-Fujita) [251, 252] и метод Фри-Вильсона (Free-Wilson) [129], только второй из них основан на фрагментных дескрипторах, значения каждого из которых показывает наличие либо отсутствие определенного заместителя в определенном положении молекулярного остова. Пользуясь языком теории графов, подструктурные фрагменты метода Фри-Вильсона можно описать как молекулярные графы, включающие в свой состав граф заместителя и граф остова, соединенные между собой ребром. Эти бинарные дескрипторы традиционно используются в методе Фри-Вильсона в сочетании со множественным линейным регрессионным анализом, хотя последние модификации этого подхода включают использование более современных статистических методов (методов машинного обучения), таких как анализ главных компонент [253] и нейронные сети [254]. В отличие от дескрипторов, вычисляемых для заместителей, дескрипторы, описывающие строение молекулярных остовов, редко в явном виде используются в исследованиях SAR/QSAR/QSPR. Возможно, наиболее известный пример их неявного использования в исследованиях QSAR/QSPR включает использование индикаторных переменных, дискриминирующих между различными типами молекулярных остовов. Концепция молекулярных остовов и заместителей (боковых цепей) была подробно рассмотрена Бемисом (Bemis) и Мурко (Murcko) [255, 256], изучавших их распределение среди лекарств. 2.2.1.8. Фрагменты на основе базисных подграфов Поскольку имеется огромное множество молекулярных графов, легко можно представить, что существует по крайней мере не меньшее множество подструктурных фрагментов и соответствующих фрагментных дескрипторов. Поэтому было бы очень перспективно найти такое относительно небольшое подмножество фрагментных дескрипторов, с помощью которого можно было бы аппроксимировать любое свойство. Эта идея лежит в основе концепции ба- 80

зисных графов, предложенной Рандичем (Randič) в 1992 г. [257], который уподобил разложение молекулярных графов по базису первичных графов (и, следовательно, разложение любого фрагментного дескриптора по базисным фрагментным дескрипторам) разложению векторов по базису векторного пространства. В цитированной работе Рандич предлагает использовать несвязанные графы, состоящие из нескольких цепочек разной длины, в качестве набора таких базисных подграфов (см. Рис. 14). Рис. 14. Базисные подграфы Рандича для максимального числа вершин 7 Тем не менее, для случая базисных подграфов Рандича оказывается возможным найти такие примеры, когда различные структуры содержат одни и те же наборы базисных подграфов. Следовательно, такие базисные подграфы нельзя рассматривать как базисные в строгом смысле этого слова. Следует ответить, что строгое решение проблемы нахождения базисного набора инвариантов графов было найдено в 1983 г. для случая простых графов [258]. Этот результат был далее распространен на молекулярные графы И.И. Баскиным, М.И. Скворцовой с соавт. [259, 260] (см. раздел 3.2). Из этих работ, однако, следует, что полный набор базисных инвариантов графов строится на всех возможных подграфах, и поэтому невозможно ограничиться каким-либо небольшим их 81

зисных графов, предложенной Рандичем (Randič) в 1992 г. [257], который уподобил<br />

разложение молекулярных графов по базису первичных графов (и, следовательно,<br />

разложение любого фрагментного дескриптора по базисным фрагментным<br />

дескрипторам) разложению векторов по базису векторного пространства.<br />

В цитированной работе Рандич предлагает использовать несвязанные графы,<br />

состоящие из нескольких цепочек разной длины, в качестве набора таких<br />

базисных подграфов (см. Рис. 14).<br />

Рис. 14. Базисные подграфы Рандича для максимального числа вершин 7<br />

Тем не менее, для случая базисных подграфов Рандича оказывается возможным<br />

найти такие примеры, когда различные структуры содержат одни и те<br />

же наборы базисных подграфов. Следовательно, такие базисные подграфы<br />

нельзя рассматривать как базисные в строгом смысле этого слова. Следует ответить,<br />

что строгое решение проблемы нахождения базисного набора инвариантов<br />

графов было найдено в 1983 г. для случая простых графов [258]. Этот результат<br />

был далее распространен на молекулярные графы И.И. Баскиным, М.И.<br />

Скворцовой с соавт. [259, 260] (см. раздел 3.2). Из этих работ, однако, следует,<br />

что полный набор базисных инвариантов графов строится на всех возможных<br />

подграфах, и поэтому невозможно ограничиться каким-либо небольшим их<br />

81

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!