Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
помощи дескрипторного блока FRAGMENT (см. раздел 8.3). Для расчета комбинаций свойств атомов во фрагментах использовали дескрипторный блок FRAGPROP (см. раздел 8.4). Этот дескрипторный блок позволяет вычислять 50 комбинаций свойств атомов (или дескрипторы FRAGPROP, fragmental properties) для фрагментов размерами от 1 до 5 неводородных атомов. Полный набор дескрипторов, вычисляемый блоком FRAGPROP, приведен в разделе 8.4 данной диссертационной работы. Для оценки прогнозирующей способности QSPRмоделей была применена процедура 5x4-кратного двойного скользящего контроля (см. подраздел 4.1.4). Вычисляемые статистические характеристики включают: (1) Q 2 DCV - параметр Q 2 (Q 2 =(SS-PSS)/SS, где PSS - сумма квадратов ошибок прогноза свойства, SS - сумма квадратов отклонения свойства от среднего значения) для усредненных спрогнозированных значений, (2) RMSE DCV - среднеквадратическая ошибка прогнозирования, (3) MAE DCV - средняя абсолютная ошибка прогнозирования. Как показали расчеты, качество QSPR моделей, как линейнорегрессионных, так и нейросетевых, полученных для всех трех исследованных характеристик полимеров – показателя преломления, плотности в аморфном состоянии и температуры стеклования, значительно улучшается при включении в модели наряду с фрагментными дескрипторами, дескрипторов, описывающих комбинации свойств атомов во фрагментах. Это наблюдается для всего исследованного диапазона размеров фрагментов - от 1 до 5 неводородных атомов. Так, лучшая QSPR модель для показателя преломления, была получена методом БПМЛР на основе фрагментных дескрипторов, содержащих от 1 до 4 неводородных атомов, и имела следующие статистические характеристики: Q 2 DCV 0.7822, RMSE DCV 0.033, MAE DCV 0.021. При включении в эту модель дескрипторов, описывающих свойства атомов во фрагментах (см. Табл. 8 на стр. 195), эти показатели улучшаются, соответственно, до 0.872, 0.026 и 0.015. В случае температуры стеклования добавление дескрипторов FRAGPROP в лучшую БПМЛР модель, построенную с использованием фрагментных дескрипторов, включающих от 1 до 5 неводородных атомов, также позволяет улучшить ее статистические показатели: от 0.849 до 0.864 (Q 2 DCV), от 45.0 до 42.7 (RMSE DCV ) и от 32.0 194
до 28.0 (MAE DCV ). Повышение прогнозирующей способности в наибольшей степени наблюдается в случае QSPR моделей, построенных для расчета плотности полимеров в аморфном состоянии. Например, статистические показатели лучшей из БПМЛР моделей, построенной с использованием фрагментов с размерами от 1 до 2 неводородных атомов (Q 2 DCV 0.474, RMSE DCV 0.159 и MAE DCV 0.959), при комбинировании фрагментных дескрипторов с дескрипторами FRAGPROP, становятся, соответственно 0.910, 0.066 и 0.043. Комбинации свойств атомов во фрагментах, имеющие наибольшую значимость для описания исследованных свойств, приведены в Табл. 8. Табл. 8. Формулы для расчета комбинаций свойств атомов во фрагментах и названия дескрипторов, наиболее часто встречающихся в QSPR-моделях, полученных для прогнозирования свойств полимеров (дескрипторы приведены по степени убывания частоты встречаемости в частных моделях для соответствующего свойства). N Название дескриптора Формула Плотность в аморфном состоянии 1 Отношение числа электронов к числу атомов в молекуле или среднее количество p 1 _ ANe = N e / N a электронов в атоме 2 Среднее значение произведения электроотрицательностей атомов для всех свя- Nb p2 зей в молекуле. 1 p2 _ APE = ∑ χ ( a1 ) ⋅ χ( a2 ) 3 Максимальное значение произведения модуля разности электроотрицательностей для всех связей в мо- p2 _ HDE = max p2 (| χ ( a1) − χ( a2 ) | ⋅nb ) лекуле на порядок соответствующей связи 4 Сумма произведений разностей электроотрицательности атомов в положениях 1-2 p5_ SPDE = ∑ ( χ( a1) − χ( a2 )) ⋅( χ( a5) − χ( a4 )) p5 и 5-4 для всех 5-атомных цепочек N 5 Отношение суммы кубов 1 a 3 p1 _ AR3 = атомных радиусов к числу ∑ Ri N a i= 1 атомов в молекуле 6 Среднее значение произве- 195
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159 and 160: 5.2.1. Прогнозировани
- Page 161 and 162: зей, а также учитыв
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165 and 166: Построение QSPR-моде
- Page 167 and 168: работе [268], но с при
- Page 169 and 170: ляются удобным инс
- Page 171 and 172: чета этого свойств
- Page 173 and 174: База 2 (88 соединений
- Page 175 and 176: «редких фрагментов
- Page 177 and 178: пользовании 25 деск
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193: веществ, например,
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
- Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230: ного моделирования
- Page 231 and 232: ля и даже более сов
- Page 233 and 234: ного цианинового к
- Page 235 and 236: Значения констант
- Page 237 and 238: делена на обучающу
- Page 239 and 240: ность. Основной цел
- Page 241 and 242: На Рис. 50 приводятс
- Page 243 and 244: молекул с конденси
до 28.0 (MAE DCV ). Повышение прогнозирующей способности в наибольшей<br />
степени наблюдается в случае QSPR моделей, построенных для расчета плотности<br />
полимеров в аморфном состоянии. Например, статистические показатели<br />
лучшей из БПМЛР моделей, построенной с использованием фрагментов с размерами<br />
от 1 до 2 неводородных атомов (Q 2 DCV 0.474, RMSE DCV 0.159 и MAE DCV<br />
0.959), при комбинировании фрагментных дескрипторов с дескрипторами<br />
FRAGPROP, становятся, соответственно 0.910, 0.066 и 0.043. Комбинации<br />
свойств атомов во фрагментах, имеющие наибольшую значимость для описания<br />
исследованных свойств, приведены в Табл. 8.<br />
Табл. 8. Формулы для расчета комбинаций свойств атомов во фрагментах и названия<br />
дескрипторов, наиболее часто встречающихся в QSPR-моделях, полученных<br />
для прогнозирования свойств полимеров (дескрипторы приведены по<br />
степени убывания частоты встречаемости в частных моделях для соответствующего<br />
свойства).<br />
N Название дескриптора Формула<br />
Плотность в аморфном состоянии<br />
1 Отношение числа электронов<br />
к числу атомов в молекуле<br />
или среднее количество<br />
p 1 _ ANe = N e<br />
/ N a<br />
электронов в атоме<br />
2 Среднее значение произведения<br />
электроотрицательностей<br />
атомов для всех свя-<br />
Nb<br />
p2<br />
зей в молекуле.<br />
1<br />
p2 _ APE = ∑ χ ( a1 ) ⋅ χ(<br />
a2<br />
)<br />
3 Максимальное значение<br />
произведения модуля разности<br />
электроотрицательностей<br />
для всех связей в мо-<br />
p2 _ HDE = max<br />
p2 (| χ ( a1)<br />
− χ(<br />
a2<br />
) | ⋅nb<br />
)<br />
лекуле на порядок соответствующей<br />
связи<br />
4 Сумма произведений разностей<br />
электроотрицательности<br />
атомов в положениях 1-2 p5_<br />
SPDE = ∑ ( χ(<br />
a1)<br />
− χ(<br />
a2<br />
)) ⋅(<br />
χ(<br />
a5)<br />
− χ(<br />
a4<br />
))<br />
p5<br />
и 5-4 для всех 5-атомных цепочек<br />
N<br />
5 Отношение суммы кубов<br />
1 a<br />
3<br />
p1<br />
_ AR3<br />
=<br />
атомных радиусов к числу<br />
∑ Ri<br />
N<br />
a i=<br />
1<br />
атомов в молекуле<br />
6 Среднее значение произве-<br />
195