На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

Модель получена с помощью метода ИНС и имеет следующие параметры прогнозирующей способности: Q 2 DCV = 0.8561, RMSE DCV = 0.520 и MAE DCV = 0.41. Диаграмма разброса для нее представлена на Рис. 40. Прогноз, log 1/EC50 9 7 5 3 3 5 7 9 Эксперимент, log 1/EC50 Рис. 40. Диаграмма разброса для ингибирования обратной транскриптазы вируса ВИЧ-1 производными HEPT Рассматриваемый пример иллюстрирует возможность применения фрагментных дескрипторов с «выделенными» атомами для количественного прогнозирования биологической активности органических соединений внутри рядов соединений с одинаковым общим фрагментом (скелетом). Следует отметить, что обычно фрагментные дескрипторы редко используются для этой цели, поскольку аппроксимируемый с их помощью вклад конкретной группировки атомов в общее свойство оказывается независимым от того, где именно внутри химической структуры она находится. Поскольку это плохо соотносится с природой биологической активности, которая связана с точным пространственноэлектронным распознаванием молекул, то это часто приводит к плохой прогнозирующей способности построенных QSAR-моделей и к невозможности их интерпретации с целью выявления факторов, влияющих на биологическую активность. Предлагаемые фрагментные дескрипторы с «выделенными» атомами полностью решают эту проблему, поскольку позволяют позиционировать все рассматриваемые фрагменты относительно заранее заданных внутри химиче- 188

ской структуры «реперных точек». На приведенной на Рис. 40 общей структуре для рассматриваемого ряда соединений такими «реперными точками» являются места подсоединений заместителей к общему скелету, которые мы «выделили» путем приписывания им меток a, b, c и d. Благодаря этому аппроксимируемый при помощи фрагментных дескрипторов с «выделенными» таким образом атомами вклад группировки атомов в общую биологическую активность оказывается зависимым от ее положения внутри химической структуры. Это приводит не только к существенному росту прогнозирующей способности получающихся QSAR-моделей, но и делает их легко интерпретируемой со структурнохимической точки зрения, поскольку значения регрессионных коэффициентов в линейных моделях и введенной нами характеристики M x (см. раздел 4.2) для нейросетевых моделей четко показывают, какая группировка атомов в каком положении вносит какой вклад в биологическую активность, и, следовательно, какие изменения нужно внести для ее оптимизации. Более того, рассмотрение характеристик M xy (см. раздел 4.2) позволяет выявить синнергию и диссинергию во влиянии различных группировок атомов на биологическую активность. В определенном смысле предлагаемый подход можно считать дальнейшим развитием классического метода Фри-Вильсона [129]. 5.3.3. Прогнозирование констант скорости гидролиза эфиров карбоновых кислот База данных, содержащая сведения по константам скорости гидролиза, измеренным в диапазоне температур от 0 до 154°С в бинарных системах вода:растворитель (концентрация неводного компонента 0-98%), для 2092 эфиров карбоновых кислот, была использована для прогнозирования константы скорости реакции, lg k [397, 398]. В зависимости от природы заместителей у атомов С и О кислотного остатка эфиров экспериментальные значения lg k изменялись от -7.53 до -0.17. QSPR-модели строили с помощью метода ИНС с использованием в качестве дескрипторов температуры, концентрации органических растворителей, параметров, характеризующих их свойства [398], а также фрагментов, со- 189

Модель получена с помощью метода ИНС и имеет следующие параметры<br />

прогнозирующей способности: Q 2 DCV = 0.8561, RMSE DCV = 0.520 и MAE DCV =<br />

0.41. Диаграмма разброса для нее представлена на Рис. 40.<br />

Прогноз, log 1/EC50<br />

9<br />

7<br />

5<br />

3<br />

3 5 7 9<br />

Эксперимент, log 1/EC50<br />

Рис. 40. Диаграмма разброса для ингибирования обратной транскриптазы вируса<br />

ВИЧ-1 производными HEPT<br />

Рассматриваемый пример иллюстрирует возможность применения фрагментных<br />

дескрипторов с «выделенными» атомами для количественного прогнозирования<br />

биологической активности органических соединений внутри рядов<br />

соединений с одинаковым общим фрагментом (скелетом). Следует отметить,<br />

что обычно фрагментные дескрипторы редко используются для этой цели,<br />

поскольку аппроксимируемый с их помощью вклад конкретной группировки<br />

атомов в общее свойство оказывается независимым от того, где именно внутри<br />

химической структуры она находится. Поскольку это плохо соотносится с природой<br />

биологической активности, которая связана с точным пространственноэлектронным<br />

распознаванием молекул, то это часто приводит к плохой прогнозирующей<br />

способности построенных QSAR-моделей и к невозможности их интерпретации<br />

с целью выявления факторов, влияющих на биологическую активность.<br />

Предлагаемые фрагментные дескрипторы с «выделенными» атомами<br />

полностью решают эту проблему, поскольку позволяют позиционировать все<br />

рассматриваемые фрагменты относительно заранее заданных внутри химиче-<br />

188

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!