На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

ванием скользящего контроля с исключением по одному соединению. По своим статистическим показателям полученные модели сопоставимы с цитируемыми в литературе, а в ряде случаев их превосходят. Так, регрессионная модель, построенная для Базы 1 на 4 фрагментных дескрипторах (длина цепочки во фрагменте 15 атомов) имеет показатели (R 2 обуч. = 0,967 кДж·моль -1 ; F = 181,6; квадрат коэффициента корреляции при скользящем контроле, Q 2 = 0,949; стандартное отклонение, s = 0,66 кДж·моль -1 ; среднеквадратичная ошибка, RMSE ск = 0,74 кДж·моль -1 ; стандартное отклонение при скользящем контроле, s ск = 0,80 кДж·моль -1 ), превосходящие параметры лучшей регрессионной модели, полученной для этой же выборки на основе использования в качестве дескрипторов энергий высшей занятой и низшей свободной молекулярных орбиталей Е HOMO , Е LUMO и среднего арифметического между ними, (3 дескриптора, R 2 обуч. = 0,92; стандартное отклонение, s = 1,02 кДж·моль -1 ; F = 95,0; Q 2 = 0,89; стандартная ошибка при скользящем контроле 1,19) [390]. Для PLS CoMFA [390] и CoMSA моделей [394] значения Q 2 лежат в пределах 0,63-0,75 и 0,829-0,970, соответственно. В полученную модель входят дескрипторы, описывающие следующие фрагменты молекул азо-соединений: =RC–С, RC Ar ÷C Ar –NH 2 , •=•–•÷•÷•÷• (• - произвольный атом) и С–С–С÷(С÷) 2 С–N=N–С÷(С÷) 4 С–N. Фрагментные модели, построенные для выборки антрахиноновых красителей (База 2), по прогнозирующим свойствам также не уступают литературным моделям [394]. Квадрат коэффициента корреляции при скользящем контроле модели, включающей 8 дескрипторов (цепочки из 15 атомов), (R 2 обуч. = 0,942; s = 0,46; F = 81,5; Q 2 = 0,915; RMSE ск = 0,50 кДж·моль -1 ; s ск = 0,55 кДж·моль -1 ), превышает максимальное значение Q 2 (0,88) CoMSA модели [394]. Наиболее значителен вклад фрагментов: RC Ar , C Ar –N 3 sp –C, HC Ar ÷C Ar –NHR и C sp 3 ―O―(C Ar ÷) 7 C Ar ―N sp 3 . На основе слияния узких выборок азо- и антрахиноновых красителей (База 3) мы получили более универсальную модель для описания сродства краситель-целлюлоза и оценили ее прогнозирующую способность при помощи скользящего контроля. Модель включает 10 фрагментных дескрипторов (цепочки из 15 атомов) и имеет следующие характеристики: R 2 обуч. = 0, 954; Q 2 = 182

0,935; s = 0,76 кДж·моль -1 ; F = 139,5; s ск = 0,89 кДж·моль -1 ; RMSE ск = 0,83 кДж·моль -1 : -∆µ 0 = -0.49 + 2.19 Fr1 – 1.03 Fr2 – 1.01 Fr3 – 0.56 Fr4 + 3.13 Fr5 + 0.21 Fr6 + 0.11 Fr7 + 0.85 Fr8 + 0.45 Fr9 + 1.10 Fr10 (1) Где R 2 обуч. = 0, 954; Q 2 = 0,937; s = 0,70 кДж·моль -1 ; F = 139,5; s ск = 0,82 кДж·моль -1 ; RMSE ск = 0,76 кДж·моль -1 ; Fr1/С Ar ― N, Fr2/С sp3― N 3 sp ― С, Fr3/HС Ar ÷C Ar ― NH 2 , Fr4/RС Ar ÷C Ar ― N, Fr5/N sp 3 ― C Ar ÷C Ar ―N= , Fr6/•–•÷•÷•÷•–•, Fr7/C―(C÷) 6 C, Fr8/C sp 3 ―O―(C Ar ÷) 7 C Ar ―N 3 sp , Fr9/C Ar ÷(C Ar ÷) 3 C Ar ―N=N―C Ar ÷(C Ar ÷) 2 C Ar ―C=C, Fr10/N sp 3 ―C Ar ÷(C Ar ÷) 4 C Ar ―N=N―C Ar ÷(C Ar ÷) 2 C Ar ―N sp 3 Наибольший вклад в модель вносят фрагментные дескрипторы RС Ar ―N, и N 3 sp ―C Ar ÷C Ar ―N=. Таким образом на основе дескрипторов, учитывающих фрагментный состав молекулы, предложены линейно-регрессионные QSPRмодели, позволяющие прогнозировать сродство азо- и антрахиноновых красителей к целлюлозному волокну. Этим примером продемонстрировано, что предложенные фрагментные дескрипторы в сочетании со статистическим аппаратом множественной линейной регрессии являются мощным инструментом для прогнозирования сложных промышленно-важных свойств органических соединений. 5.3. Фрагментные дескрипторы с «выделенными» атомами Мы предлагаем подход, который позволяет значительно расширить круг свойств, для прогнозирования которых можно применять фрагментные дескрипторы за счет указания специальных «выделенных» атомов, играющих специфическую роль в природе моделируемого свойства. Например, при моделировании константы основности аминов логично отметить тот самый атом азота внутри химической структуры, который участвует в рассматриваемом кислотно-основном равновесии. Суть предлагаемого метода заключается в том, что: 1) такие «выделенные» атомы помечаются определенными метками в соответст- 183

0,935; s = 0,76 кДж·моль -1 ; F = 139,5; s ск = 0,89 кДж·моль -1 ; RMSE ск = 0,83<br />

кДж·моль -1 :<br />

-∆µ 0 = -0.49 + 2.19 Fr1 – 1.03 Fr2 – 1.01 Fr3 – 0.56 Fr4 + 3.13 Fr5 + 0.21 Fr6 + 0.11<br />

Fr7 + 0.85 Fr8 + 0.45 Fr9 + 1.10 Fr10 (1)<br />

Где R 2 обуч. = 0, 954; Q 2 = 0,937; s = 0,70 кДж·моль -1 ; F = 139,5; s ск = 0,82<br />

кДж·моль -1 ; RMSE ск = 0,76 кДж·моль -1 ;<br />

Fr1/С Ar ― N, Fr2/С sp3― N 3 sp ― С, Fr3/HС Ar ÷C Ar ― NH 2 , Fr4/RС Ar ÷C Ar ― N,<br />

Fr5/N sp 3 ― C Ar ÷C Ar ―N= , Fr6/•–•÷•÷•÷•–•, Fr7/C―(C÷) 6 C,<br />

Fr8/C sp 3 ―O―(C Ar ÷) 7 C Ar ―N 3 sp ,<br />

Fr9/C Ar ÷(C Ar ÷) 3 C Ar ―N=N―C Ar ÷(C Ar ÷) 2 C Ar ―C=C,<br />

Fr10/N sp 3 ―C Ar ÷(C Ar ÷) 4 C Ar ―N=N―C Ar ÷(C Ar ÷) 2 C Ar ―N sp 3<br />

Наибольший вклад в модель вносят фрагментные дескрипторы RС Ar ―N,<br />

и N 3 sp ―C Ar ÷C Ar ―N=. Таким образом на основе дескрипторов, учитывающих<br />

фрагментный состав молекулы, предложены линейно-регрессионные QSPRмодели,<br />

позволяющие прогнозировать сродство азо- и антрахиноновых красителей<br />

к целлюлозному волокну. Этим примером продемонстрировано, что<br />

предложенные фрагментные дескрипторы в сочетании со статистическим аппаратом<br />

множественной линейной регрессии являются мощным инструментом<br />

для прогнозирования сложных промышленно-важных свойств органических<br />

соединений.<br />

5.3. Фрагментные дескрипторы с «выделенными» атомами<br />

Мы предлагаем подход, который позволяет значительно расширить круг<br />

свойств, для прогнозирования которых можно применять фрагментные дескрипторы<br />

за счет указания специальных «выделенных» атомов, играющих специфическую<br />

роль в природе моделируемого свойства. Например, при моделировании<br />

константы основности аминов логично отметить тот самый атом азота<br />

внутри химической структуры, который участвует в рассматриваемом кислотно-основном<br />

равновесии. Суть предлагаемого метода заключается в том, что: 1)<br />

такие «выделенные» атомы помечаются определенными метками в соответст-<br />

183

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!