ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

More documents

Recommendations

Info

где: N – количество примеров в обучающей выборке; M – размерность входных векторов (т.е. количество дескрипторов при QSAR/QSPR-анализе); x i – входной вектор для i-ого примера из обучающей выборки (т.е. вектор дескрипторов для i-ого соединения); y i – известное значение выходной величины y для i-ого примера (т.е. экспериментальное значение прогнозируемого свойства y для i-ого соединения); σ – единый параметр, соответствующий ширине Гауссовых функций, и называемый в контексте регрессионного анализа параметром сглаживания. При известной функции f(x,y) наиболее вероятное значение (т.е. математическое ожидание) y для произвольного вектора x может быть найдено по формуле: +∞ ∫ yf ( x, y) dy yˆ ( x) = E( y | x) = . (42) −∞ +∞ ∫ −∞ f ( x, y) dy Подставляя (41) в (42) после некоторых преобразований можно получить окончательное выражение оценки y для произвольного x: yˆ( x) = N ∑ i= 1 N ∑ i= 1 T ⎡ ( x − xi ) ( x − yi exp⎢− 2 ⎣ 2σ T ⎡ ( x − xi ) ( x − x exp⎢− 2 ⎣ 2σ x ⎤ i ) ⎥ ⎦ ⎤ i ) ⎥ ⎦ . (43) Легко заметить, что числители стоящих в экспоненте дробей представляют собой квадраты Эвклидовых расстояний между произвольным вектором x и вектором x i из i-ого примера обучающей выборки: 2 T x − x ≡ ( x − x ) ( x − x ) . (44) i i i Заметим, однако, что при наличии существенных корреляций между компонентами входных векторов x более корректно в статистическом плане (хотя и более трудоемко в вычислительном плане) использовать в формуле (43) вместо квадратов расстояний Эвклида квадраты расстояний Махаланобиса (x-x i ) T Σ -1 (xx i ), где Σ – матрица ковариации компонентов векторов x. Таким образом, согласно формуле (43), наиболее вероятное значение y для произвольного вектора x прогнозируется как взвешенная сумма значений y i для всех примеров из обу- 44
чающей выборки, причем каждому примеру придается вес, экспоненциально убывающий при возрастании квадрата расстояния от него до вектора x, а скорость этого убывания контролируется параметром сглаживания σ. Как архитектура, так и функционирование GR-нейросетей описывается формулой (43). GR-нейросеть состоит из 4 слоев: 1) входного; 2) скрытого; 3) слоя суммирования; 4) выходного слоя (см. Рис. 9). Число нейронов во входном слое равно количеству компонент входного вектора x. Скрытый слой GRнейросети состоит из RBF-нейронов, функционирующих в соответствии с формулой (40). Число нейронов в скрытом слое равно количеству примеров в обучающей выборке, а вес связи w ji между входным нейроном j и скрытым нейроном i устанавливается равным значению j-ой компоненты вектора x i (т.е. значению j-ого дескриптора для i-ого соединения из обучающей выборки в случае QSAR/QSPR-анализа). Слой суммирования GR-нейросети состоит из двух линейных нейронов, причем первый из них вычисляет значение числителя в формуле (43), а второй – знаменателя. Вес связи, идущей от скрытого нейрона i к первому из нейронов суммирования, устанавливается равным y i (т.е. экспериментальному значению прогнозируемого свойства y для i-ого соединения из обучающей выборки), а все веса связей, идущих от нейронов скрытого слоя ко второму нейрону слоя суммирования устанавливаются равными единице. Выходной слой GR-нейросети состоит из одного нейрона, который выполняет деление числителя на знаменатель в соответствие с формулой (43) (подобные нейроны, формирующие в процессе вычислений два сетевых входа и осуществляющие деление одного на другой, называют Паде-нейронами). Таким образом, единственным настраиваемым параметром GR-нейросети является фактор сглаживания σ. Его оптимальное значение обычно подбирается исходя из критерия максимизации прогнозирующей способности нейросети, оцениваемой при помощи процедуры перекрестного скользящего контроля. 45
Page 1 and 2: На правах рукописи
Page 3 and 4: 2.2.6. Классификация
Page 5 and 6: 5.4. Псевдофрагментн
Page 7 and 8: 7.4.3. Примеры разных
Page 9 and 10: ВВЕДЕНИЕ На соврем
Page 11 and 12: более точного прог
Page 13 and 14: ГЛАВА 1. ИСКУССТВЕН
Page 15 and 16: входными; нейроны,
Page 17 and 18: Таким образом, урав
Page 19 and 20: 1.2.4. Нейросети обра
Page 21 and 22: Значения весов объ
Page 23 and 24: Таким образом, знач
Page 25 and 26: жения в статье Руме
Page 27 and 28: Рис. 5. Введение мом
Page 29 and 30: адаптивно настраив
Page 31 and 32: 1.2.4.7. Квазиньютонов
Page 33 and 34: (химических соедин
Page 35 and 36: на границах решетк
Page 37 and 38: ными значениями со
Page 39 and 40: рующие один и тот ж
Page 41 and 42: дящихся на 2-ом, 3-м и
Page 43: всех RBF-нейронов, а
Page 47 and 48: Рис. 10. Архитектура
Page 49 and 50: 1.2.5.4. Нейросети на о
Page 51 and 52: ми связями, занимае
Page 53 and 54: практически важных
Page 55 and 56: ния классического
Page 57 and 58: ческому мозгу во вр
Page 59 and 60: лаждения системы и
Page 61 and 62: чем в качестве прог
Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ
Page 65 and 66: му типу биологичес
Page 67 and 68: тему опубликовано
Page 69 and 70: В настоящее время п
Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс
Page 73 and 74: В качестве характе
Page 75 and 76: Некоторые типы ЦАФ
Page 77 and 78: кроме того, они сно
Page 79 and 80: Следует упомянуть
Page 81 and 82: зисных графов, пред
Page 83 and 84: рой равен 1 только в
Page 85 and 86: множества различны
Page 87 and 88: при проведении вир
Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
Page 91 and 92: ределенных атомных
Page 93 and 94: элементам, что може
Page 95 and 96:
наличие или отсутс
Page 97 and 98:
использовались в н
Page 99 and 100:
ложенные в 1985 г. ато
Page 101 and 102:
2.3. Ограничения фра
Page 103 and 104:
ГЛАВА 3. МАТЕМАТИЧЕ
Page 105 and 106:
качестве меток исп
Page 107 and 108:
ной нумерации граф
Page 109 and 110:
нейронной сети с пр
Page 111 and 112:
ГЛАВА 4. РАЗРАБОТКА
Page 113 and 114:
линейные комбинаци
Page 115 and 116:
таться внешней по о
Page 117 and 118:
Предсказанное знач
Page 119 and 120:
рипторе, то он пере
Page 121 and 122:
Для решения этой пр
Page 123 and 124:
• D x - среднее значе
Page 125 and 126:
R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
Page 127 and 128:
В соответствии с вы
Page 129 and 130:
зовании рассмотрен
Page 131 and 132:
R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
Page 133 and 134:
f ( x, y) ≡ f ( y, x) ⇔ f ( x,
Page 135 and 136:
R3 R2 R5 R6 Общая формул
Page 137 and 138:
ко, эта разница все
Page 139 and 140:
переставленными эк
Page 141 and 142:
лей приведен в рабо
Page 143 and 144:
деленными» атомами
Page 145 and 146:
5.1.2. Иерархическая
Page 147 and 148:
водородного соседа
Page 149 and 150:
Атом кислорода в со
Page 151 and 152:
PA1 -PH 2 Атом фосфора,
Page 153 and 154:
Br2 -Br= Формально нез
Page 155 and 156:
то в дальнейшем буд
Page 157 and 158:
После нахождения п
Page 159 and 160:
5.2.1. Прогнозировани
Page 161 and 162:
зей, а также учитыв
Page 163 and 164:
Эксперимент 50 40 30 20
Page 165 and 166:
Построение QSPR-моде
Page 167 and 168:
работе [268], но с при
Page 169 and 170:
ляются удобным инс
Page 171 and 172:
чета этого свойств
Page 173 and 174:
База 2 (88 соединений
Page 175 and 176:
«редких фрагментов
Page 177 and 178:
пользовании 25 деск
Page 179 and 180:
Tf расч. о С, Tf calc. o C 30
Page 181 and 182:
На первом этапе раб
Page 183 and 184:
0,935; s = 0,76 кДж·моль -1
Page 185 and 186:
пример использован
Page 187 and 188:
почечных фрагменто
Page 189 and 190:
ской структуры «ре
Page 191 and 192:
1 O O OH C C a O C H 2 O H + C C a
Page 193 and 194:
веществ, например,
Page 195 and 196:
до 28.0 (MAE DCV ). Повыше
Page 197 and 198:
Таким образом, псев
Page 199 and 200:
цепочки длиной до д
Page 201 and 202:
алканов, см 3 /моль 7
Page 203 and 204:
свое преимущество
Page 205 and 206:
6.3.1. Общая методоло
Page 207 and 208:
бирался оптимальны
Page 209 and 210:
0,25 Результаты полу
Page 211 and 212:
При анализе дескри
Page 213 and 214:
414]). Следует также о
Page 215 and 216:
d расч., г/куб.см 4,0 3,0
Page 217 and 218:
Табл. 15. Корреляция
Page 219 and 220:
Табл. 16. Усредненны
Page 221 and 222:
Как видно из Табл. 16
Page 223 and 224:
нием ошибки примен
Page 225 and 226:
NASAWIN (см. раздел 8.2) н
Page 227 and 228:
ГЛАВА 7. РАЗРАБОТКА
Page 229 and 230:
ного моделирования
Page 231 and 232:
ля и даже более сов
Page 233 and 234:
ного цианинового к
Page 235 and 236:
Значения констант
Page 237 and 238:
делена на обучающу
Page 239 and 240:
ность. Основной цел
Page 241 and 242:
На Рис. 50 приводятс
Page 243 and 244:
молекул с конденси
Page 245 and 246:
7.1.4. Прогнозировани
Page 247 and 248:
сивов разрозненных
Page 249 and 250:
используются как т
Page 251 and 252:
были модифицирован
Page 253 and 254:
зависимости давлен
Page 255 and 256:
Объединенный набор
Page 257 and 258:
Оба механизма вклю
Page 259 and 260:
творителя, а также
Page 261 and 262:
Табл. 29. Характерис
Page 263 and 264:
набора дескрипторо
Page 265 and 266:
угодно сложные зав
Page 267 and 268:
симостей «структур
Page 269 and 270:
лей, хотя все модел
Page 271 and 272:
одновременно решае
Page 273 and 274:
Как видно приведен
Page 275 and 276:
принципе гарантиро
Page 277 and 278:
мерации атомов дос
Page 279 and 280:
бор сигналов, соотв
Page 281 and 282:
только с атомных се
Page 283 and 284:
7.4.3. Примеры разных
Page 285 and 286:
Рис. 66. Минимальная
Page 287 and 288:
ров» ведет к ухудше
Page 289 and 290:
бензол, было отброш
Page 291 and 292:
на атому. После 4000 э
Page 293 and 294:
фов), то и все нейро
Page 295 and 296:
проведения линейно
Page 297 and 298:
тате чего NASAWIN прев
Page 299 and 300:
8.2.3. Химически-орие
Page 301 and 302:
8.2.7. Нейросетевые п
Page 303 and 304:
8.2.11. Кластеризация
Page 305 and 306:
нейросетевом прогр
Page 307 and 308:
18 p1_Nlp Количество не
Page 309 and 310:
43 p 4 _ SPR = ∑ R( a ) ⋅ R( a
Page 311 and 312:
делей. Программа та
Page 313 and 314:
позволяющая прогно
Page 315 and 316:
ЛИТЕРАТУРА 1. Гилле
Page 317 and 318:
31. Aoyama T.; Ichikawa H. Neural N
Page 319 and 320:
54. Karelson M.; Dobchev D.A.; Kuls
Page 321 and 322:
79. Carpenter G.A.; Grossberg S. A
Page 323 and 324:
103. Ежов А.А.; Токаев
Page 325 and 326:
126. Benson S.W.; Buss J.H. Additiv
Page 327 and 328:
148. Fisanick W.; Lipkus A.H.; Rusi
Page 329 and 330:
169. Klopman G.; Macina O.T.; Levin
Page 331 and 332:
189. Nilakantan R.; Bauman N.; Dixo
Page 333 and 334:
209. Татевский В.М. Кл
Page 335 and 336:
ces and Related Descriptors in QSAR
Page 337 and 338:
248. MOE, Molecular Operating Envir
Page 339 and 340:
269. Estrada E.; Gonzalez H. What A
Page 341 and 342:
288. Saigo H.; Kadowaki T.; Tsuda K
Page 343 and 344:
309. Vladutz G. Modern Approaches t
Page 345 and 346:
331. Rouvray D.H. Predicting Chemis
Page 347 and 348:
352. Корн Г.; Корн Т. С
Page 349 and 350:
374. Abraham M.H.; McGowan J.C. The
Page 351 and 352:
394. Polanski J.; Gieleciak R.; Wys
Page 353 and 354:
417. Goll E.S.; Jurs P.C. Predictio
Page 355 and 356:
ренции “Молекуляр
Page 357 and 358:
454. Kobakhidze N.; Gverdtsiteli M.
Page 359 and 360:
Approaches to Model Tissue-Air Part
Page 361 and 362:
499. Lohninger H. Evaluation of Neu
Page 363 and 364:
517. Halberstam N.M.; Baskin I.I.;
Page 365:
СПИСОК ОБОЗНАЧЕНИЙ
show all

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸