На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

ной. В историческом плане, анализ заместителей первым вошел в практику проведения исследований QSAR. Хотя на вышеупомянутом разложении основаны два классических подхода в QSAR, метод Ханча-Фуджиты (Hansch-Fujita) [251, 252] и метод Фри-Вильсона (Free-Wilson) [129], только второй из них основан на фрагментных дескрипторах, значения каждого из которых показывает наличие либо отсутствие определенного заместителя в определенном положении молекулярного остова. Пользуясь языком теории графов, подструктурные фрагменты метода Фри-Вильсона можно описать как молекулярные графы, включающие в свой состав граф заместителя и граф остова, соединенные между собой ребром. Эти бинарные дескрипторы традиционно используются в методе Фри-Вильсона в сочетании со множественным линейным регрессионным анализом, хотя последние модификации этого подхода включают использование более современных статистических методов (методов машинного обучения), таких как анализ главных компонент [253] и нейронные сети [254]. В отличие от дескрипторов, вычисляемых для заместителей, дескрипторы, описывающие строение молекулярных остовов, редко в явном виде используются в исследованиях SAR/QSAR/QSPR. Возможно, наиболее известный пример их неявного использования в исследованиях QSAR/QSPR включает использование индикаторных переменных, дискриминирующих между различными типами молекулярных остовов. Концепция молекулярных остовов и заместителей (боковых цепей) была подробно рассмотрена Бемисом (Bemis) и Мурко (Murcko) [255, 256], изучавших их распределение среди лекарств. 2.2.1.8. Фрагменты на основе базисных подграфов Поскольку имеется огромное множество молекулярных графов, легко можно представить, что существует по крайней мере не меньшее множество подструктурных фрагментов и соответствующих фрагментных дескрипторов. Поэтому было бы очень перспективно найти такое относительно небольшое подмножество фрагментных дескрипторов, с помощью которого можно было бы аппроксимировать любое свойство. Эта идея лежит в основе концепции ба- 80

зисных графов, предложенной Рандичем (Randič) в 1992 г. [257], который уподобил разложение молекулярных графов по базису первичных графов (и, следовательно, разложение любого фрагментного дескриптора по базисным фрагментным дескрипторам) разложению векторов по базису векторного пространства. В цитированной работе Рандич предлагает использовать несвязанные графы, состоящие из нескольких цепочек разной длины, в качестве набора таких базисных подграфов (см. Рис. 14). Рис. 14. Базисные подграфы Рандича для максимального числа вершин 7 Тем не менее, для случая базисных подграфов Рандича оказывается возможным найти такие примеры, когда различные структуры содержат одни и те же наборы базисных подграфов. Следовательно, такие базисные подграфы нельзя рассматривать как базисные в строгом смысле этого слова. Следует ответить, что строгое решение проблемы нахождения базисного набора инвариантов графов было найдено в 1983 г. для случая простых графов [258]. Этот результат был далее распространен на молекулярные графы И.И. Баскиным, М.И. Скворцовой с соавт. [259, 260] (см. раздел 3.2). Из этих работ, однако, следует, что полный набор базисных инвариантов графов строится на всех возможных подграфах, и поэтому невозможно ограничиться каким-либо небольшим их 81

ной. В историческом плане, анализ заместителей первым вошел в практику<br />

проведения исследований QSAR. Хотя на вышеупомянутом разложении основаны<br />

два классических подхода в QSAR, метод Ханча-Фуджиты (Hansch-Fujita)<br />

[251, 252] и метод Фри-Вильсона (Free-Wilson) [129], только второй из них основан<br />

на фрагментных дескрипторах, значения каждого из которых показывает<br />

наличие либо отсутствие определенного заместителя в определенном положении<br />

молекулярного остова. Пользуясь языком теории графов, подструктурные<br />

фрагменты метода Фри-Вильсона можно описать как молекулярные графы,<br />

включающие в свой состав граф заместителя и граф остова, соединенные между<br />

собой ребром. Эти бинарные дескрипторы традиционно используются в методе<br />

Фри-Вильсона в сочетании со множественным линейным регрессионным<br />

анализом, хотя последние модификации этого подхода включают использование<br />

более современных статистических методов (методов машинного обучения),<br />

таких как анализ главных компонент [253] и нейронные сети [254].<br />

В отличие от дескрипторов, вычисляемых для заместителей, дескрипторы,<br />

описывающие строение молекулярных остовов, редко в явном виде используются<br />

в исследованиях SAR/QSAR/QSPR. Возможно, наиболее известный<br />

пример их неявного использования в исследованиях QSAR/QSPR включает использование<br />

индикаторных переменных, дискриминирующих между различными<br />

типами молекулярных остовов. Концепция молекулярных остовов и заместителей<br />

(боковых цепей) была подробно рассмотрена Бемисом (Bemis) и<br />

Мурко (Murcko) [255, 256], изучавших их распределение среди лекарств.<br />

2.2.1.8. Фрагменты на основе базисных подграфов<br />

Поскольку имеется огромное множество молекулярных графов, легко<br />

можно представить, что существует по крайней мере не меньшее множество<br />

подструктурных фрагментов и соответствующих фрагментных дескрипторов.<br />

Поэтому было бы очень перспективно найти такое относительно небольшое<br />

подмножество фрагментных дескрипторов, с помощью которого можно было<br />

бы аппроксимировать любое свойство. Эта идея лежит в основе концепции ба-<br />

80

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!