Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
тур, идентичные работе [268]. Из Табл. 4 видно, что статистические характеристики модели 1 немного уступают вышеприведенным литературным данным. Тем не менее, эта модель имеет неплохую прогнозирующую способность: так, средняя ошибка на прогнозе для модели 1, построенной с использованием 4 дескрипторов, составляет даже 7.5 (10 -6 единиц). Далее мы исследовали смешанные модели с единичным включением дескрипторов другого типа, обратив особое внимание на простоту вычисления таких добавочных дескрипторов. Оказалось, что добавление в модель такого простого дескриптора, как молекулярная масса, позволяет несколько улучшить качество QSPR-модели (Табл. 4, модель 2). Этот дескриптор включается в QSPRмодель, построенную с помощью пошаговой регрессии, вторым, что приводит к улучшению качества прогноза (средняя ошибка на прогнозе достигает 7-6.3). Однако существенное улучшение качества модели было достигнуто при включении в уравнение, полученное на основе фрагментных дескрипторов, дескриптора V x [374]. Этот дескриптор был введен для описания молекулярного объема при учете сольватационных эффектов. Использование этого дескриптора приводит к резкому улучшению даже однопараметровой модели (Табл. 4 на стр. 165, модель 3). Модель, включающая 5 дескрипторов, имеет превосходные статистические характеристики уменьшает среднюю ошибку на прогнозе до 4.8. Ниже приведено уравнение этой модели: -χ M ×10 6 = - 2.91 + 0.82 V x + 3.42 ƒr 1 + 6.40 ƒr 2 -4.88 ƒr 3 - 2.99 ƒr 4 (2) n = 355, R 2 = 0.9856, s = 3.7 (10 -6 единиц), F = 3104, средняя ошибка (по модулю) на прогнозе 4.82, где fr i равно числу следующих фрагментов в молекулах: ƒr 1 – Br, ƒr 2 – Hal, ƒr 3 – • = • , (• − произвольный атом), ƒr 4 – C(Hal) 2 . Рассмотрим теперь ароматические соединения. Литературная QSPRмодель для ароматических структур [268] (85 соединений в обучающей и 20 соединений в контрольной выборках, 5 дескрипторов) имела следующие статистические характеристики: R 2 = 0.9604, s = 3.82 (10 -6 единиц), средняя ошибка при скользящем контроле 4.12 (10 -6 единиц), среднеквадратичная ошибка на прогнозе 4.00. Модель 4 (Табл. 4, стр. 233) построена на тех же данных, что и в 166
работе [268], но с применением фрагментных дескрипторов. Как и в случае алифатических соединений, для ароматической выборки (обучающая - 85 соединений, контрольная - 20 соединений) статистические параметры модели 4 (Табл. 4, стр. 165), построенной на фрагментных дескрипторах, немного уступают литературным данным. Тем не менее, ее прогнозирующая способность выше. Bключение в модель дескриптора молекулярной массы существенно не улучшает ни статистических показателей модели, ни ее прогнозирующей способности. Напротив, использование дескриптора V x приводит к резкому улучшению QSPR- модели (Табл. 4 на стр. 233, модель 5). Модель, содержащая 6 дескрипторов, имеет превосходные статистические характеристики (s = 1.99 × 10 -6 единиц) и уменьшает среднюю ошибку на прогнозе до 6.6 (10 -6 единиц). Для построения QSPR-модели ароматических соединений была использована обучающая и контрольная выборка ароматических структур, составленные по данным работы [268]. Как видно из данных Табл. 4 на стр. 165, модель 6, построенная только на фрагментных дескрипторах, имеет достаточно хорошие статистические характеристики и обладает хорошей предсказательной силой. Применение дескриптора V x также приводит к резкому улучшению QSPR-модели (Табл. 4 на стр. 233, модель 7). Модель, включающая 8 дескрипторов, имеет превосходные статистические характеристики (s = 5.44 × 10 -6 единиц) и уменьшает среднюю ошибку на прогнозе до 7.8 × 10 -6 единиц. Уравнение для этой модели приведено ниже: -χ M ×10 6 = - 4.87+ 0.823 V x – 6.64 ƒr 1 + 11.8 ƒr 2 – 8.05 ƒr 3 – 6.09 ƒr4 – 2.20 ƒr 5 + 1.08 ƒr 6 + 9.85 ƒr 7 (3) n = 378, R 2 = 0.9908, s = 5.44 (× 10 -6 единиц), средняя ошибка (по модулю)на прогнозе 7.87, где fr i равно числу следующих фрагментов в молекулах: ƒr 1 – Сl, ƒr 2 – Hal, ƒr 3 – N–O, ƒr 4 – C=O, ƒr 5 – •–•÷•–•=• , (÷- ароматическая связь), ƒr 6 – •=•–•÷•÷•÷•, ƒr 7 – RC Ar ÷C Ar (C Ar H) 2 . В задачи следующего этапа нашей работы входило исследование применимости фрагментного подхода на примере расширенной выборки органиче- 167
- Page 115 and 116: таться внешней по о
- Page 117 and 118: Предсказанное знач
- Page 119 and 120: рипторе, то он пере
- Page 121 and 122: Для решения этой пр
- Page 123 and 124: • D x - среднее значе
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159 and 160: 5.2.1. Прогнозировани
- Page 161 and 162: зей, а также учитыв
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165: Построение QSPR-моде
- Page 169 and 170: ляются удобным инс
- Page 171 and 172: чета этого свойств
- Page 173 and 174: База 2 (88 соединений
- Page 175 and 176: «редких фрагментов
- Page 177 and 178: пользовании 25 деск
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
работе [268], но с применением фрагментных дескрипторов. Как и в случае<br />
алифатических соединений, для ароматической выборки (обучающая - 85 соединений,<br />
контрольная - 20 соединений) статистические параметры модели 4<br />
(Табл. 4, стр. 165), построенной на фрагментных дескрипторах, немного уступают<br />
литературным данным. Тем не менее, ее прогнозирующая способность<br />
выше.<br />
Bключение в модель дескриптора молекулярной массы существенно не<br />
улучшает ни статистических показателей модели, ни ее прогнозирующей способности.<br />
Напротив, использование дескриптора V x приводит к резкому улучшению<br />
QSPR- модели (Табл. 4 на стр. 233, модель 5). Модель, содержащая 6<br />
дескрипторов, имеет превосходные статистические характеристики (s = 1.99 ×<br />
10 -6 единиц) и уменьшает среднюю ошибку на прогнозе до 6.6 (10 -6 единиц).<br />
Для построения QSPR-модели ароматических соединений была использована<br />
обучающая и контрольная выборка ароматических структур, составленные<br />
по данным работы [268]. Как видно из данных Табл. 4 на стр. 165, модель 6, построенная<br />
только на фрагментных дескрипторах, имеет достаточно хорошие<br />
статистические характеристики и обладает хорошей предсказательной силой.<br />
Применение дескриптора V x также приводит к резкому улучшению<br />
QSPR-модели (Табл. 4 на стр. 233, модель 7). Модель, включающая 8 дескрипторов,<br />
имеет превосходные статистические характеристики (s = 5.44 × 10 -6 единиц)<br />
и уменьшает среднюю ошибку на прогнозе до 7.8 × 10 -6 единиц. Уравнение<br />
для этой модели приведено ниже:<br />
-χ M ×10 6 = - 4.87+ 0.823 V x – 6.64 ƒr 1 + 11.8 ƒr 2 – 8.05 ƒr 3 – 6.09 ƒr4 – 2.20<br />
ƒr 5 + 1.08 ƒr 6 + 9.85 ƒr 7 (3)<br />
n = 378, R 2 = 0.9908, s = 5.44 (× 10 -6 единиц), средняя ошибка (по модулю)на<br />
прогнозе 7.87, где fr i равно числу следующих фрагментов в молекулах:<br />
ƒr 1 – Сl, ƒr 2 – Hal, ƒr 3 – N–O, ƒr 4 – C=O, ƒr 5 – •–•÷•–•=• , (÷- ароматическая<br />
связь), ƒr 6 – •=•–•÷•÷•÷•, ƒr 7 – RC Ar ÷C Ar (C Ar H) 2 .<br />
В задачи следующего этапа нашей работы входило исследование применимости<br />
фрагментного подхода на примере расширенной выборки органиче-<br />
167