программ EMMA (см. раздел 8.1) и NASAWIN (см. раздел 8.2). Для данного исследования было создано несколько баз данных. Во-первых, по данным работ [361, 362] была сформирована База 1, состоящая из 293 структур, в которой представлены разнообразные классы органических соединений и некоторых неорганических веществ (как, например, H 2 , O 2 , N 2 , N 2 O, CO, SO 2 , H 2 S, H 2 O, NH 3 , Cl 2 и др.). Во-вторых, по данным работы [363] была создана База 2, содержащая 426 соединений, включающих C, H, O, N, S, P, F, Cl, Br, I (циклические и ациклические неароматические углеводороды; ароматические углеводороды, галогенированные и перфторированные производные, спирты, фенолы, простые и сложные эфиры, альдегиды, кетоны, карбоновые кислоты; амины, нитрилы, нитропроизводные, амиды, серу- и фосфорсодержащие соединения). Кроме того, была сформирована комбинированная база данных, База 3, которая объединяла две предыдущих базы и, после исключения дубликатов, состояла из 613 соединений. На основе комбинированной Базы 3 нами был построен ряд моделей, наилучшая из которых следующее: α calc = 0.04 + 1.08 ƒ 1 +0.38 ƒ 2 + 0.92 ƒ 3 + 0.61 ƒ 4 + 3.04 ƒ 5 + 2.18 ƒ 6 + 0.44 ƒ 7 + 2.34 ƒ 8 + 3.35 ƒ 9 + 5.49 ƒ 10 + 0.38 ƒ 11 + 0.15 ƒ 12 + 0.34 ƒ 13 + 0.36 ƒ 14 (2) n = 552, r 2 = 0.9967, s = 0.38 A 3 , F = 10931 где ƒ 1, ƒ 2, ƒ 3, ƒ 4, ƒ 5, ƒ 6 , ƒ 7, ƒ 8, ƒ 9, ƒ 10 - число атомов С,. Н, N, O, S, P, F, Cl, Br, I, соответственно; ƒ 11 - количество тройных связей в молекуле, ●≡●; ƒ 12 - количество двойных связей в молекуле, ●=●; ƒ 13 - количество ароматических связей, ●÷●; ƒ 14 – количество атомов в сочленениях циклов в ароматической системе, С Ar (C Ar ) 3 . Следует отметить, что ранее опубликованные аддитивные схемы показали на Базе 3 существенно более высокое значение стандартного отклонения (s = 0.61 A 3 ). Таким образом, в рамках рассмотренной методологии нами построены уравнения, позволяющие прогнозировать поляризуемость органических соединений различных классов с высокой точностью исходя из их элементного состава и числа фрагментов, отражающих наличие кратных и ароматических свя- 160
зей, а также учитывающих конденсированные ароматические системы. Этим примером продемонстрировано, что предложенные фрагментные дескрипторы в сочетании со статистическим аппаратом множественной линейной регрессии являются мощным инструментом для разработки аддитивных схем прогнозирования физико-химических свойств органических соединений. 5.2.2. Прогнозирование энтальпий образования алифатических полинитросоединений Алифатические полинитросоединения находят практическое применение главным образом благодаря своей высокой энергетической емкости [364]. Именно поэтому из физико-химических свойств этой группы соединений наиболее хорошо экспериментально изучены термохимические свойства, в частности теплоты образования [364]. Цель настоящей работы – анализ пригодности автоматического метода создания аддитивных схем на основе использования фрагментных дескрипторов и сравнение точности прогноза с результатами популярных методов молекулярно-механического и полуэмпирических квантовохимических расчетов для прогнозирования энтальпий образования алифатических полинитросоединений. В данной работе мы использовали экспериментальные данные по теплотам образования 31 алифатического полинитросоединения [364]. Построенную нами в результате выполнения работы при помощи программного комплекса EMMA (см. раздел 8.1) с использованием блока Fragment (см. раздел 8.3) эмпирическую схему расчета энтальпий образования алифатических полинитросоединений можно представить при помощи уравнения (в ккал/моль): Δ 13 6.47 f , 0 H f = − .2 − 6.29 f1 − 3.81f 2 − 4.59 f3 + 3.13 f 4 + 3.65 f5 + R = 0.9922; s = 2.65; F = 253.5, где f 1 – число атомов углерода; f 2 – число связей между вторичным и четвертичным атомами углерода; f 3 – число связей между первичным и четвертичным атомами углерода; f 4 – число пар первичных атомов углерода, присоединенных 161 6
- Page 1 and 2:
На правах рукописи
- Page 3 and 4:
2.2.6. Классификация
- Page 5 and 6:
5.4. Псевдофрагментн
- Page 7 and 8:
7.4.3. Примеры разных
- Page 9 and 10:
ВВЕДЕНИЕ На соврем
- Page 11 and 12:
более точного прог
- Page 13 and 14:
ГЛАВА 1. ИСКУССТВЕН
- Page 15 and 16:
входными; нейроны,
- Page 17 and 18:
Таким образом, урав
- Page 19 and 20:
1.2.4. Нейросети обра
- Page 21 and 22:
Значения весов объ
- Page 23 and 24:
Таким образом, знач
- Page 25 and 26:
жения в статье Руме
- Page 27 and 28:
Рис. 5. Введение мом
- Page 29 and 30:
адаптивно настраив
- Page 31 and 32:
1.2.4.7. Квазиньютонов
- Page 33 and 34:
(химических соедин
- Page 35 and 36:
на границах решетк
- Page 37 and 38:
ными значениями со
- Page 39 and 40:
рующие один и тот ж
- Page 41 and 42:
дящихся на 2-ом, 3-м и
- Page 43 and 44:
всех RBF-нейронов, а
- Page 45 and 46:
чающей выборки, при
- Page 47 and 48:
Рис. 10. Архитектура
- Page 49 and 50:
1.2.5.4. Нейросети на о
- Page 51 and 52:
ми связями, занимае
- Page 53 and 54:
практически важных
- Page 55 and 56:
ния классического
- Page 57 and 58:
ческому мозгу во вр
- Page 59 and 60:
лаждения системы и
- Page 61 and 62:
чем в качестве прог
- Page 63 and 64:
ГЛАВА 2. ФРАГМЕНТНЫ
- Page 65 and 66:
му типу биологичес
- Page 67 and 68:
тему опубликовано
- Page 69 and 70:
В настоящее время п
- Page 71 and 72:
ниях QSPR/QSAR/SAR. И дейс
- Page 73 and 74:
В качестве характе
- Page 75 and 76:
Некоторые типы ЦАФ
- Page 77 and 78:
кроме того, они сно
- Page 79 and 80:
Следует упомянуть
- Page 81 and 82:
зисных графов, пред
- Page 83 and 84:
рой равен 1 только в
- Page 85 and 86:
множества различны
- Page 87 and 88:
при проведении вир
- Page 89 and 90:
21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92:
ределенных атомных
- Page 93 and 94:
элементам, что може
- Page 95 and 96:
наличие или отсутс
- Page 97 and 98:
использовались в н
- Page 99 and 100:
ложенные в 1985 г. ато
- Page 101 and 102:
2.3. Ограничения фра
- Page 103 and 104:
ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106:
качестве меток исп
- Page 107 and 108:
ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
- Page 113 and 114: линейные комбинаци
- Page 115 and 116: таться внешней по о
- Page 117 and 118: Предсказанное знач
- Page 119 and 120: рипторе, то он пере
- Page 121 and 122: Для решения этой пр
- Page 123 and 124: • D x - среднее значе
- Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159: 5.2.1. Прогнозировани
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165 and 166: Построение QSPR-моде
- Page 167 and 168: работе [268], но с при
- Page 169 and 170: ляются удобным инс
- Page 171 and 172: чета этого свойств
- Page 173 and 174: База 2 (88 соединений
- Page 175 and 176: «редких фрагментов
- Page 177 and 178: пользовании 25 деск
- Page 179 and 180: Tf расч. о С, Tf calc. o C 30
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212:
При анализе дескри
- Page 213 and 214:
414]). Следует также о
- Page 215 and 216:
d расч., г/куб.см 4,0 3,0
- Page 217 and 218:
Табл. 15. Корреляция
- Page 219 and 220:
Табл. 16. Усредненны
- Page 221 and 222:
Как видно из Табл. 16
- Page 223 and 224:
нием ошибки примен
- Page 225 and 226:
NASAWIN (см. раздел 8.2) н
- Page 227 and 228:
ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230:
ного моделирования
- Page 231 and 232:
ля и даже более сов
- Page 233 and 234:
ного цианинового к
- Page 235 and 236:
Значения констант
- Page 237 and 238:
делена на обучающу
- Page 239 and 240:
ность. Основной цел
- Page 241 and 242:
На Рис. 50 приводятс
- Page 243 and 244:
молекул с конденси
- Page 245 and 246:
7.1.4. Прогнозировани
- Page 247 and 248:
сивов разрозненных
- Page 249 and 250:
используются как т
- Page 251 and 252:
были модифицирован
- Page 253 and 254:
зависимости давлен
- Page 255 and 256:
Объединенный набор
- Page 257 and 258:
Оба механизма вклю
- Page 259 and 260:
творителя, а также
- Page 261 and 262:
Табл. 29. Характерис
- Page 263 and 264:
набора дескрипторо
- Page 265 and 266:
угодно сложные зав
- Page 267 and 268:
симостей «структур
- Page 269 and 270:
лей, хотя все модел
- Page 271 and 272:
одновременно решае
- Page 273 and 274:
Как видно приведен
- Page 275 and 276:
принципе гарантиро
- Page 277 and 278:
мерации атомов дос
- Page 279 and 280:
бор сигналов, соотв
- Page 281 and 282:
только с атомных се
- Page 283 and 284:
7.4.3. Примеры разных
- Page 285 and 286:
Рис. 66. Минимальная
- Page 287 and 288:
ров» ведет к ухудше
- Page 289 and 290:
бензол, было отброш
- Page 291 and 292:
на атому. После 4000 э
- Page 293 and 294:
фов), то и все нейро
- Page 295 and 296:
проведения линейно
- Page 297 and 298:
тате чего NASAWIN прев
- Page 299 and 300:
8.2.3. Химически-орие
- Page 301 and 302:
8.2.7. Нейросетевые п
- Page 303 and 304:
8.2.11. Кластеризация
- Page 305 and 306:
нейросетевом прогр
- Page 307 and 308:
18 p1_Nlp Количество не
- Page 309 and 310:
43 p 4 _ SPR = ∑ R( a ) ⋅ R( a
- Page 311 and 312:
делей. Программа та
- Page 313 and 314:
позволяющая прогно
- Page 315 and 316:
ЛИТЕРАТУРА 1. Гилле
- Page 317 and 318:
31. Aoyama T.; Ichikawa H. Neural N
- Page 319 and 320:
54. Karelson M.; Dobchev D.A.; Kuls
- Page 321 and 322:
79. Carpenter G.A.; Grossberg S. A
- Page 323 and 324:
103. Ежов А.А.; Токаев
- Page 325 and 326:
126. Benson S.W.; Buss J.H. Additiv
- Page 327 and 328:
148. Fisanick W.; Lipkus A.H.; Rusi
- Page 329 and 330:
169. Klopman G.; Macina O.T.; Levin
- Page 331 and 332:
189. Nilakantan R.; Bauman N.; Dixo
- Page 333 and 334:
209. Татевский В.М. Кл
- Page 335 and 336:
ces and Related Descriptors in QSAR
- Page 337 and 338:
248. MOE, Molecular Operating Envir
- Page 339 and 340:
269. Estrada E.; Gonzalez H. What A
- Page 341 and 342:
288. Saigo H.; Kadowaki T.; Tsuda K
- Page 343 and 344:
309. Vladutz G. Modern Approaches t
- Page 345 and 346:
331. Rouvray D.H. Predicting Chemis
- Page 347 and 348:
352. Корн Г.; Корн Т. С
- Page 349 and 350:
374. Abraham M.H.; McGowan J.C. The
- Page 351 and 352:
394. Polanski J.; Gieleciak R.; Wys
- Page 353 and 354:
417. Goll E.S.; Jurs P.C. Predictio
- Page 355 and 356:
ренции “Молекуляр
- Page 357 and 358:
454. Kobakhidze N.; Gverdtsiteli M.
- Page 359 and 360:
Approaches to Model Tissue-Air Part
- Page 361 and 362:
499. Lohninger H. Evaluation of Neu
- Page 363 and 364:
517. Halberstam N.M.; Baskin I.I.;
- Page 365:
СПИСОК ОБОЗНАЧЕНИЙ