ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

19.11.2014 Views
3) число встречаемости некоторого подграфа в графе является значением соответствующего фрагментного дескриптора для этого графа, мы сразу приходим к формулировке центрального положения данной диссертационной работы: любая сколь угодно сложная зависимость между структурой органического соединения и его свойством может быть аппроксимирована при помощи многослойной нейронной сети персептронного типа с двумя скрытыми слоями нейронов и набора фрагментных дескрипторов. Следует, однако, отметить, что в большинстве случаев для аппроксимации зависимости «структурасвойство», как показывает опыт, достаточно и одного слоя скрытых нейронов. 110

ГЛАВА 4. РАЗРАБОТКА НЕЙРОСЕТЕВЫХ ПОДХОДОВ Данная глава содержит описание предложенных нами подходов к решению перечисленных в разделе 1.4 проблем, связанных с применением искусственных нейронных сетей для решения прикладных задач, в частности, для поиска количественных корреляций «структура-свойство». 4.1. Подход к решению проблемы «переучивания» нейронных сетей Одной из основных проблем, с которой мы столкнулись в начале 1990-ых годов уже в ходе самых первых работ по применению аппарата искусственных нейронных сетей для прогнозирования свойств органических соединений была связана с эффектом «переучивания» и необходимостью поиска эффективных методов его предотвращения. 4.1.1. Суть эффекта «переучивания» нейросетей Эффект «переучивания» (overtraining) нейросетей был, по-видимому, впервые описан в математической литературе в 1990 г (см. [338]). Он наблюдается при обучении многослойных нейронных сетей с обратным распространением ошибки (т.е. многослойных персептронов) в том случае, когда число примеров в обучающей выборке невелико по сравнению с числом настраиваемых параметров нейросети (т.е. синаптических весов и порогов активации нейронов). В настоящее время его принято считать особым проявлением эффекта «переподгонки данных» (overfitting), наблюдаемого во многих методах машинного обучения (о сходстве и различии понятий «переучивания» и «переподгонки» см. в статье [339]). Суть эффекта «переучивания» заключается в следующем: процесс обучения нейросети может быть условно разделен на две последовательные фазы – «обобщения» (generalization) и «запоминания» (memorization). Для химических соединений, содержащихся в обучающей выборке, среднеквадратичная ошибка прогнозирования их свойств постоянно уменьшается 111

Page 1 and 2: На правах рукописи

Page 3 and 4: 2.2.6. Классификация

Page 5 and 6: 5.4. Псевдофрагментн

Page 7 and 8: 7.4.3. Примеры разных

Page 9 and 10: ВВЕДЕНИЕ На соврем

Page 11 and 12: более точного прог

Page 13 and 14: ГЛАВА 1. ИСКУССТВЕН

Page 15 and 16: входными; нейроны,

Page 17 and 18: Таким образом, урав

Page 19 and 20: 1.2.4. Нейросети обра

Page 21 and 22: Значения весов объ

Page 23 and 24: Таким образом, знач

Page 25 and 26: жения в статье Руме

Page 27 and 28: Рис. 5. Введение мом

Page 29 and 30: адаптивно настраив

Page 31 and 32: 1.2.4.7. Квазиньютонов

Page 33 and 34: (химических соедин

Page 35 and 36: на границах решетк

Page 37 and 38: ными значениями со

Page 39 and 40: рующие один и тот ж

Page 41 and 42: дящихся на 2-ом, 3-м и

Page 43 and 44: всех RBF-нейронов, а

Page 45 and 46: чающей выборки, при

Page 47 and 48: Рис. 10. Архитектура

Page 49 and 50: 1.2.5.4. Нейросети на о

Page 51 and 52: ми связями, занимае

Page 53 and 54: практически важных

Page 55 and 56: ния классического

Page 57 and 58: ческому мозгу во вр

Page 59 and 60: лаждения системы и

Page 61 and 62: чем в качестве прог

Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ

Page 65 and 66: му типу биологичес

Page 67 and 68: тему опубликовано

Page 69 and 70: В настоящее время п

Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс

Page 73 and 74: В качестве характе

Page 75 and 76: Некоторые типы ЦАФ

Page 77 and 78: кроме того, они сно

Page 79 and 80: Следует упомянуть

Page 81 and 82: зисных графов, пред

Page 83 and 84: рой равен 1 только в

Page 85 and 86: множества различны

Page 87 and 88: при проведении вир

Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре

Page 91 and 92: ределенных атомных

Page 93 and 94: элементам, что може

Page 95 and 96: наличие или отсутс

Page 97 and 98: использовались в н

Page 99 and 100: ложенные в 1985 г. ато

Page 101 and 102: 2.3. Ограничения фра

Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ

Page 105 and 106: качестве меток исп

Page 107 and 108: ной нумерации граф

Page 109: нейронной сети с пр

Page 113 and 114: линейные комбинаци

Page 115 and 116: таться внешней по о

Page 117 and 118: Предсказанное знач

Page 119 and 120: рипторе, то он пере

Page 121 and 122: Для решения этой пр

Page 123 and 124: • D x - среднее значе

Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH

Page 127 and 128: В соответствии с вы

Page 129 and 130: зовании рассмотрен

Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2

Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,

Page 135 and 136: R3 R2 R5 R6 Общая формул

Page 137 and 138: ко, эта разница все

Page 139 and 140: переставленными эк

Page 141 and 142: лей приведен в рабо

Page 143 and 144: деленными» атомами

Page 145 and 146: 5.1.2. Иерархическая

Page 147 and 148: водородного соседа

Page 149 and 150: Атом кислорода в со

Page 151 and 152: PA1 -PH 2 Атом фосфора,

Page 153 and 154: Br2 -Br= Формально нез

Page 155 and 156: то в дальнейшем буд

Page 157 and 158: После нахождения п

Page 159 and 160: 5.2.1. Прогнозировани

Page 161 and 162: зей, а также учитыв

Page 163 and 164: Эксперимент 50 40 30 20

Page 165 and 166: Построение QSPR-моде

Page 167 and 168: работе [268], но с при

Page 169 and 170: ляются удобным инс

Page 171 and 172: чета этого свойств

Page 173 and 174: База 2 (88 соединений

Page 175 and 176: «редких фрагментов

Page 177 and 178: пользовании 25 деск

Page 179 and 180: Tf расч. о С, Tf calc. o C 30

Page 181 and 182: На первом этапе раб

Page 183 and 184: 0,935; s = 0,76 кДж·моль -1

Page 185 and 186: пример использован

Page 187 and 188: почечных фрагменто

Page 189 and 190: ской структуры «ре

Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a

Page 193 and 194: веществ, например,

Page 195 and 196: до 28.0 (MAE DCV ). Повыше

Page 197 and 198: Таким образом, псев

Page 199 and 200: цепочки длиной до д

Page 201 and 202: алканов, см 3 /моль 7

Page 203 and 204: свое преимущество

Page 205 and 206: 6.3.1. Общая методоло

Page 207 and 208: бирался оптимальны

Page 209 and 210: 0,25 Результаты полу

Page 211 and 212: При анализе дескри

Page 213 and 214: 414]). Следует также о

Page 215 and 216: d расч., г/куб.см 4,0 3,0

Page 217 and 218: Табл. 15. Корреляция

Page 219 and 220: Табл. 16. Усредненны

Page 221 and 222: Как видно из Табл. 16

Page 223 and 224: нием ошибки примен

Page 225 and 226: NASAWIN (см. раздел 8.2) н

Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА

Page 229 and 230: ного моделирования

Page 231 and 232: ля и даже более сов

Page 233 and 234: ного цианинового к

Page 235 and 236: Значения констант

Page 237 and 238: делена на обучающу

Page 239 and 240: ность. Основной цел

Page 241 and 242: На Рис. 50 приводятс

Page 243 and 244: молекул с конденси

Page 245 and 246: 7.1.4. Прогнозировани

Page 247 and 248: сивов разрозненных

Page 249 and 250: используются как т

Page 251 and 252: были модифицирован

Page 253 and 254: зависимости давлен

Page 255 and 256: Объединенный набор

Page 257 and 258: Оба механизма вклю

Page 259 and 260: творителя, а также

Page 261 and 262: Табл. 29. Характерис

Page 263 and 264: набора дескрипторо

Page 265 and 266: угодно сложные зав

Page 267 and 268: симостей «структур

Page 269 and 270: лей, хотя все модел

Page 271 and 272: одновременно решае

Page 273 and 274: Как видно приведен

Page 275 and 276: принципе гарантиро

Page 277 and 278: мерации атомов дос

Page 279 and 280: бор сигналов, соотв

Page 281 and 282: только с атомных се

Page 283 and 284: 7.4.3. Примеры разных

Page 285 and 286: Рис. 66. Минимальная

Page 287 and 288: ров» ведет к ухудше

Page 289 and 290: бензол, было отброш

Page 291 and 292: на атому. После 4000 э

Page 293 and 294: фов), то и все нейро

Page 295 and 296: проведения линейно

Page 297 and 298: тате чего NASAWIN прев

Page 299 and 300: 8.2.3. Химически-орие

Page 301 and 302: 8.2.7. Нейросетевые п

Page 303 and 304: 8.2.11. Кластеризация

Page 305 and 306: нейросетевом прогр

Page 307 and 308: 18 p1_Nlp Количество не

Page 309 and 310: 43 p 4 _ SPR = ∑ R( a ) ⋅ R( a

Page 311 and 312: делей. Программа та

Page 313 and 314: позволяющая прогно

Page 315 and 316: ЛИТЕРАТУРА 1. Гилле

Page 317 and 318: 31. Aoyama T.; Ichikawa H. Neural N

Page 319 and 320: 54. Karelson M.; Dobchev D.A.; Kuls

Page 321 and 322: 79. Carpenter G.A.; Grossberg S. A

Page 323 and 324: 103. Ежов А.А.; Токаев

Page 325 and 326: 126. Benson S.W.; Buss J.H. Additiv

Page 327 and 328: 148. Fisanick W.; Lipkus A.H.; Rusi

Page 329 and 330: 169. Klopman G.; Macina O.T.; Levin

Page 331 and 332: 189. Nilakantan R.; Bauman N.; Dixo

Page 333 and 334: 209. Татевский В.М. Кл

Page 335 and 336: ces and Related Descriptors in QSAR

Page 337 and 338: 248. MOE, Molecular Operating Envir

Page 339 and 340: 269. Estrada E.; Gonzalez H. What A

Page 341 and 342: 288. Saigo H.; Kadowaki T.; Tsuda K

Page 343 and 344: 309. Vladutz G. Modern Approaches t

Page 345 and 346: 331. Rouvray D.H. Predicting Chemis

Page 347 and 348: 352. Корн Г.; Корн Т. С

Page 349 and 350: 374. Abraham M.H.; McGowan J.C. The

Page 351 and 352: 394. Polanski J.; Gieleciak R.; Wys

Page 353 and 354: 417. Goll E.S.; Jurs P.C. Predictio

Page 355 and 356: ренции “Молекуляр

Page 357 and 358: 454. Kobakhidze N.; Gverdtsiteli M.

Page 359 and 360: Approaches to Model Tissue-Air Part

Page 361 and 362: 499. Lohninger H. Evaluation of Neu

Page 363 and 364: 517. Halberstam N.M.; Baskin I.I.;

Page 365: СПИСОК ОБОЗНАЧЕНИЙ

rmse

neural

molecular

qsar

fragment

nasawin

prediction

networks

analysis

quantitative

cdn.scipeople.com

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸ ... View more ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

Delete template?

Save as template ?

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸ ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸