ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

19.11.2014 Views
выражение (74) можно рассматривать как начало разложения Тэйлора- Маклорена функции f(x,y) в окрестности точки (0,0): 2 ∂f ( x, y) ∂f ( x, y) 1 ∂ f ( x, y) f ( x, y) = f (0,0) + ⋅ x + ⋅ y + ⋅ x 2 ∂x ∂y 2 ∂x x= 0, y= 0 x= 0, y= 0 x= 0, y= 0 2 + + 1 2 ∂ 2 f ( x, y) 2 ∂y ⋅ y 2 + 1 2 2 ∂ f ( x, y) ∂x∂y x= 0, y= 0 x= 0, y= 0 ⋅ xy + K (77) Основная идея разработанного нами подхода состоит в использовании статистических характеристик, основанных на коэффициентах в разложении функции по Тэйлору-Маклорену, для интерпретации нейросетевых моделей. Рассмотрим теперь, как извлечь из набора данных ту же информацию о влиянии x и y на f при помощи нейросетей. В этом случае, если при построении нейросетевой модели отождествить x и y со входами нейросети, а f с ее выходом, то влияние x на f может быть выражено при помощи среднего значения частной производной функции f по отношению к переменной x, усредненного по всей выборке: N 1 ∂f ( x, y) a ~ M x = ∑ (78) N ∂ x i= 1 x= xi , y= y i Здесь основное отличие от рассмотренного выше случая множественной линейной регрессии состоит в том, что значения частной производной может несколько отличаться на разных точках вследствие нелинейности функции f, что и обуславливает необходимость усреднения. Аналогично, влияние другой переменной y на функцию f может быть выражено при помощи усредненного значения частной производной по отношению к ней: N 1 ∂f ( x, y) b ~ M x = ∑ (79) N ∂ y i= 1 x= xi , y= y i Итак, предлагаются следующие статистические характеристики для интерпретации нейросетевых моделей: • M x – среднее значение первой частной производной по выборке: M x N 1 ∂f ( x, K) = ∑ (80) N ∂ x i= 1 x= x i , K 122

• D x – среднее значение дисперсии первой частной производной по выборке: D x = 1 N ⎛ ( , ) ∑ ⎜ ∂f x K N ⎝ ∂x i= 1 x= xi , K − M x ⎞ ⎟ ⎠ 2 (81) • M xx – среднее значение второй частной производной по выборке: M xx N 2 1 ∂ f ( x, K) = ∑ (82) 2 N ∂ x i= 1 x= x i , K • M xy – среднее значение второй смешанной частной производной по отношению к двум переменным: M xy N 2 1 ∂ f ( x, K) = ∑ (83) N ∂x∂y i= 1 x= xi , y= y i , K Еще одна статистическая характеристика I x (сумма квадратов значений первой частной производной) может быть использована (и реально используется в программном комплексе NASAWIN) для определения относительной важности переменных: I x = N ∑ ⎛ ⎜ ∂f ( x, K) ⎝ ∂x i= 1 x= x , K i ⎞ ⎟ ⎠ 2 (84) Для многослойной нейросети с обратным распространением ошибки значения первых частных производных ∂f ∂x x= x i ,K могут быть легко получены из значений величин δ на входных нейронах, тогда как значения вторых частных производных 2 ∂ f 2 ∂x x= x i ,K и 2 ∂ f ∂x∂y x= xi , y= y i ,K можно вычислить по методу конечных разностей. Значение M x можно рассматривать как аналог коэффициента в уравнении линейной регрессии для переменной x, D x выражает степень нелинейности функции по отношению к переменной x, а M xx описывает взаимодействие между переменными x и y. Остановимся подробнее на использовании этих статистических характеристик для выявления типов нелинейного характера зависимости. Пусть функция f линейна по своим аргументам – переменным x и y: 123

Page 1 and 2: На правах рукописи

Page 3 and 4: 2.2.6. Классификация

Page 5 and 6: 5.4. Псевдофрагментн

Page 7 and 8: 7.4.3. Примеры разных

Page 9 and 10: ВВЕДЕНИЕ На соврем

Page 11 and 12: более точного прог

Page 13 and 14: ГЛАВА 1. ИСКУССТВЕН

Page 15 and 16: входными; нейроны,

Page 17 and 18: Таким образом, урав

Page 19 and 20: 1.2.4. Нейросети обра

Page 21 and 22: Значения весов объ

Page 23 and 24: Таким образом, знач

Page 25 and 26: жения в статье Руме

Page 27 and 28: Рис. 5. Введение мом

Page 29 and 30: адаптивно настраив

Page 31 and 32: 1.2.4.7. Квазиньютонов

Page 33 and 34: (химических соедин

Page 35 and 36: на границах решетк

Page 37 and 38: ными значениями со

Page 39 and 40: рующие один и тот ж

Page 41 and 42: дящихся на 2-ом, 3-м и

Page 43 and 44: всех RBF-нейронов, а

Page 45 and 46: чающей выборки, при

Page 47 and 48: Рис. 10. Архитектура

Page 49 and 50: 1.2.5.4. Нейросети на о

Page 51 and 52: ми связями, занимае

Page 53 and 54: практически важных

Page 55 and 56: ния классического

Page 57 and 58: ческому мозгу во вр

Page 59 and 60: лаждения системы и

Page 61 and 62: чем в качестве прог

Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ

Page 65 and 66: му типу биологичес

Page 67 and 68: тему опубликовано

Page 69 and 70: В настоящее время п

Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс

Page 73 and 74: В качестве характе

Page 75 and 76: Некоторые типы ЦАФ

Page 77 and 78: кроме того, они сно

Page 79 and 80: Следует упомянуть

Page 81 and 82: зисных графов, пред

Page 83 and 84: рой равен 1 только в

Page 85 and 86: множества различны

Page 87 and 88: при проведении вир

Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре

Page 91 and 92: ределенных атомных

Page 93 and 94: элементам, что може

Page 95 and 96: наличие или отсутс

Page 97 and 98: использовались в н

Page 99 and 100: ложенные в 1985 г. ато

Page 101 and 102: 2.3. Ограничения фра

Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ

Page 105 and 106: качестве меток исп

Page 107 and 108: ной нумерации граф

Page 109 and 110: нейронной сети с пр

Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА

Page 113 and 114: линейные комбинаци

Page 115 and 116: таться внешней по о

Page 117 and 118: Предсказанное знач

Page 119 and 120: рипторе, то он пере

Page 121: Для решения этой пр

Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH

Page 127 and 128: В соответствии с вы

Page 129 and 130: зовании рассмотрен

Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2

Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,

Page 135 and 136: R3 R2 R5 R6 Общая формул

Page 137 and 138: ко, эта разница все

Page 139 and 140: переставленными эк

Page 141 and 142: лей приведен в рабо

Page 143 and 144: деленными» атомами

Page 145 and 146: 5.1.2. Иерархическая

Page 147 and 148: водородного соседа

Page 149 and 150: Атом кислорода в со

Page 151 and 152: PA1 -PH 2 Атом фосфора,

Page 153 and 154: Br2 -Br= Формально нез

Page 155 and 156: то в дальнейшем буд

Page 157 and 158: После нахождения п

Page 159 and 160: 5.2.1. Прогнозировани

Page 161 and 162: зей, а также учитыв

Page 163 and 164: Эксперимент 50 40 30 20

Page 165 and 166: Построение QSPR-моде

Page 167 and 168: работе [268], но с при

Page 169 and 170: ляются удобным инс

Page 171 and 172: чета этого свойств

Page 173 and 174: База 2 (88 соединений

Page 175 and 176: «редких фрагментов

Page 177 and 178: пользовании 25 деск

Page 179 and 180: Tf расч. о С, Tf calc. o C 30

Page 181 and 182: На первом этапе раб

Page 183 and 184: 0,935; s = 0,76 кДж·моль -1

Page 185 and 186: пример использован

Page 187 and 188: почечных фрагменто

Page 189 and 190: ской структуры «ре

Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a

Page 193 and 194: веществ, например,

Page 195 and 196: до 28.0 (MAE DCV ). Повыше

Page 197 and 198: Таким образом, псев

Page 199 and 200: цепочки длиной до д

Page 201 and 202: алканов, см 3 /моль 7

Page 203 and 204: свое преимущество

Page 205 and 206: 6.3.1. Общая методоло

Page 207 and 208: бирался оптимальны

Page 209 and 210: 0,25 Результаты полу

Page 211 and 212: При анализе дескри

Page 213 and 214: 414]). Следует также о

Page 215 and 216: d расч., г/куб.см 4,0 3,0

Page 217 and 218: Табл. 15. Корреляция

Page 219 and 220: Табл. 16. Усредненны

Page 221 and 222: Как видно из Табл. 16

Page 223 and 224: нием ошибки примен

Page 225 and 226: NASAWIN (см. раздел 8.2) н

Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА

Page 229 and 230: ного моделирования

Page 231 and 232: ля и даже более сов

Page 233 and 234: ного цианинового к

Page 235 and 236: Значения констант

Page 237 and 238: делена на обучающу

Page 239 and 240: ность. Основной цел

Page 241 and 242: На Рис. 50 приводятс

Page 243 and 244: молекул с конденси

Page 245 and 246: 7.1.4. Прогнозировани

Page 247 and 248: сивов разрозненных

Page 249 and 250: используются как т

Page 251 and 252: были модифицирован

Page 253 and 254: зависимости давлен

Page 255 and 256: Объединенный набор

Page 257 and 258: Оба механизма вклю

Page 259 and 260: творителя, а также

Page 261 and 262: Табл. 29. Характерис

Page 263 and 264: набора дескрипторо

Page 265 and 266: угодно сложные зав

Page 267 and 268: симостей «структур

Page 269 and 270: лей, хотя все модел

Page 271 and 272: одновременно решае

Page 273 and 274: Как видно приведен

Page 275 and 276: принципе гарантиро

Page 277 and 278: мерации атомов дос

Page 279 and 280: бор сигналов, соотв

Page 281 and 282: только с атомных се

Page 283 and 284: 7.4.3. Примеры разных

Page 285 and 286: Рис. 66. Минимальная

Page 287 and 288: ров» ведет к ухудше

Page 289 and 290: бензол, было отброш

Page 291 and 292: на атому. После 4000 э

Page 293 and 294: фов), то и все нейро

Page 295 and 296: проведения линейно

Page 297 and 298: тате чего NASAWIN прев

Page 299 and 300: 8.2.3. Химически-орие

Page 301 and 302: 8.2.7. Нейросетевые п

Page 303 and 304: 8.2.11. Кластеризация

Page 305 and 306: нейросетевом прогр

Page 307 and 308: 18 p1_Nlp Количество не

Page 309 and 310: 43 p 4 _ SPR = ∑ R( a ) ⋅ R( a

Page 311 and 312: делей. Программа та

Page 313 and 314: позволяющая прогно

Page 315 and 316: ЛИТЕРАТУРА 1. Гилле

Page 317 and 318: 31. Aoyama T.; Ichikawa H. Neural N

Page 319 and 320: 54. Karelson M.; Dobchev D.A.; Kuls

Page 321 and 322: 79. Carpenter G.A.; Grossberg S. A

Page 323 and 324: 103. Ежов А.А.; Токаев

Page 325 and 326: 126. Benson S.W.; Buss J.H. Additiv

Page 327 and 328: 148. Fisanick W.; Lipkus A.H.; Rusi

Page 329 and 330: 169. Klopman G.; Macina O.T.; Levin

Page 331 and 332: 189. Nilakantan R.; Bauman N.; Dixo

Page 333 and 334: 209. Татевский В.М. Кл

Page 335 and 336: ces and Related Descriptors in QSAR

Page 337 and 338: 248. MOE, Molecular Operating Envir

Page 339 and 340: 269. Estrada E.; Gonzalez H. What A

Page 341 and 342: 288. Saigo H.; Kadowaki T.; Tsuda K

Page 343 and 344: 309. Vladutz G. Modern Approaches t

Page 345 and 346: 331. Rouvray D.H. Predicting Chemis

Page 347 and 348: 352. Корн Г.; Корн Т. С

Page 349 and 350: 374. Abraham M.H.; McGowan J.C. The

Page 351 and 352: 394. Polanski J.; Gieleciak R.; Wys

Page 353 and 354: 417. Goll E.S.; Jurs P.C. Predictio

Page 355 and 356: ренции “Молекуляр

Page 357 and 358: 454. Kobakhidze N.; Gverdtsiteli M.

Page 359 and 360: Approaches to Model Tissue-Air Part

Page 361 and 362: 499. Lohninger H. Evaluation of Neu

Page 363 and 364: 517. Halberstam N.M.; Baskin I.I.;

Page 365: СПИСОК ОБОЗНАЧЕНИЙ

rmse

neural

molecular

qsar

fragment

nasawin

prediction

networks

analysis

quantitative

cdn.scipeople.com

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸ ... View more ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

Delete template?

Save as template ?

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸ ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸