ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

More documents

Recommendations

Info

ными позициями присоединения заместителей, а полученная выборка из 92 соединений была случайным образом разбита на обучающую выборку из 84 соединений и контрольную выборку из 8 соединений. Было использовано 5 дескрипторов, описывающих заместители: π-константы для пара- (R 4 ) и двух метаположений (R 3 и R 5 ) и E s -константы двух орто-положений (R 2 и R 6 ). Эффективная концентрация, вызывающая 50% блокирование кальциевых каналов (log(1/EC 50 )), была взята в качестве биологической активности, которая была нами скоррелирована со значениями этих пяти дескрипторов при помощи многослойной нейросети с обратным распространением ошибок, включающей два скрытых нейрона (при большем числе скрытых нейронов наблюдалась худшая предсказательная способность нейросетевых моделей). Нейросеть была обучена по стандартному алгоритму «обобщенного дельта-правила». В процессе обучения не было «переучивания» (среднеквадратичная ошибка на контрольной выборке все время уменьшалась), и оно было остановлено после 200.000 итераций, когда изменение среднеквадратичной ошибки на обучающей выборке на 100 последовательных итерациях стало меньше 0.001 логарифмических единиц. В результате обучения нейросети среднеквадратичная ошибка на обучающей выборке составила 0.79 логарифмических единиц (коэффициент корреляции 0.832), а на контрольной выборке – 0.71 логарифмическая единица. Для сравнения мы провели аналогичное исследование с тем же самым набором дескрипторов при той же самой разбивке базы на обучающую и контрольную выборки, но без дублирования соединений. В этом случае среднеквадратичная ошибка на обучающей выборке оказалась 0.70 логарифмических единиц (коэффициент корреляции 0.87), а на контрольной выборке – 1.59 логарифмических единиц. Таким образом, расширение базы за счет добавления копий соединений с переставленными эквивалентными позициями присоединения заместителей обеспечило значительное повышение прогнозирующей способности нейросетевой модели (среднеквадратичная ошибка на контрольной выборке упала с 1.59 до 0.71 логарифмической единицы). Далее, мы применили построенную на исходной (нерасширенной) выборке нейросетевую модель для прогнозирования активности всех клонов (т.е. тех же самых соединений, но с 138
переставленными эквивалентными позициями присоединения заместителей). Среднеквадратичная ошибка прогноза в этом случае оказалась 1.57 логарифмических единиц. Поскольку клоны являются теми же самыми соединениями с той же самой биологической активностью, то можно сделать вывод, что нейросеть, обученная на исходном нерасширенном наборе данных, неспособна корректно воспроизвести свойства симметрии в количественных зависимостях «структура-активность». Таким образом, можно сделать вывод, что нейросеть, обученная на расширенном наборе данных делает более корректные предсказания по сравнению с нейросетью, обученной на исходном наборе данных. Эти эксперименты были повторены нами для различных разбивок набора соединений на обучающую и контрольную выборки, и во всех случаях общая картина оставалась неизменной. Пример 2. Галлюциногенная активность фенилалкиламинов. Целью данного исследования явилось изучение применимости концепции обучаемой симметрии на примере галлюциногенной активностей фенилалкиламинов (III). R 2 NH 2 R 1 III Данные по галлюциногенной активности этой группы соединений взяты из работы [355]. Поскольку в исходном наборе химических структур имелось несколько двухпозиционных «мостиковых» заместителей для R 1 , для которых не определены константы заместителей, мы их преобразовали путем «разрезания» в однопозиционные (например, «мостиковые» заместители 4,5-(OCH 2 O) и 4,5-(OCH 2 CH 2 O) были преобразованы в однопозиционные заместители 4-OCH 3 и 5-OCH 3 ). Для поиска количественных зависимостей «структура-активность» мы использовали набор из 7 дескрипторов: σ-константы для двух ортоположений и π-константы для двух мета- и одного пара-положения в R 1 , а также индикаторную переменную, указывающую на присутствие алкильного 139
Page 1 and 2:
На правах рукописи
Page 3 and 4:
2.2.6. Классификация
Page 5 and 6:
5.4. Псевдофрагментн
Page 7 and 8:
7.4.3. Примеры разных
Page 9 and 10:
ВВЕДЕНИЕ На соврем
Page 11 and 12:
более точного прог
Page 13 and 14:
ГЛАВА 1. ИСКУССТВЕН
Page 15 and 16:
входными; нейроны,
Page 17 and 18:
Таким образом, урав
Page 19 and 20:
1.2.4. Нейросети обра
Page 21 and 22:
Значения весов объ
Page 23 and 24:
Таким образом, знач
Page 25 and 26:
жения в статье Руме
Page 27 and 28:
Рис. 5. Введение мом
Page 29 and 30:
адаптивно настраив
Page 31 and 32:
1.2.4.7. Квазиньютонов
Page 33 and 34:
(химических соедин
Page 35 and 36:
на границах решетк
Page 37 and 38:
ными значениями со
Page 39 and 40:
рующие один и тот ж
Page 41 and 42:
дящихся на 2-ом, 3-м и
Page 43 and 44:
всех RBF-нейронов, а
Page 45 and 46:
чающей выборки, при
Page 47 and 48:
Рис. 10. Архитектура
Page 49 and 50:
1.2.5.4. Нейросети на о
Page 51 and 52:
ми связями, занимае
Page 53 and 54:
практически важных
Page 55 and 56:
ния классического
Page 57 and 58:
ческому мозгу во вр
Page 59 and 60:
лаждения системы и
Page 61 and 62:
чем в качестве прог
Page 63 and 64:
ГЛАВА 2. ФРАГМЕНТНЫ
Page 65 and 66:
му типу биологичес
Page 67 and 68:
тему опубликовано
Page 69 and 70:
В настоящее время п
Page 71 and 72:
ниях QSPR/QSAR/SAR. И дейс
Page 73 and 74:
В качестве характе
Page 75 and 76:
Некоторые типы ЦАФ
Page 77 and 78:
кроме того, они сно
Page 79 and 80:
Следует упомянуть
Page 81 and 82:
зисных графов, пред
Page 83 and 84:
рой равен 1 только в
Page 85 and 86:
множества различны
Page 87 and 88: при проведении вир
Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
Page 91 and 92: ределенных атомных
Page 93 and 94: элементам, что може
Page 95 and 96: наличие или отсутс
Page 97 and 98: использовались в н
Page 99 and 100: ложенные в 1985 г. ато
Page 101 and 102: 2.3. Ограничения фра
Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
Page 105 and 106: качестве меток исп
Page 107 and 108: ной нумерации граф
Page 109 and 110: нейронной сети с пр
Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
Page 113 and 114: линейные комбинаци
Page 115 and 116: таться внешней по о
Page 117 and 118: Предсказанное знач
Page 119 and 120: рипторе, то он пере
Page 121 and 122: Для решения этой пр
Page 123 and 124: • D x - среднее значе
Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH
Page 127 and 128: В соответствии с вы
Page 129 and 130: зовании рассмотрен
Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
Page 135 and 136: R3 R2 R5 R6 Общая формул
Page 137: ко, эта разница все
Page 141 and 142: лей приведен в рабо
Page 143 and 144: деленными» атомами
Page 145 and 146: 5.1.2. Иерархическая
Page 147 and 148: водородного соседа
Page 149 and 150: Атом кислорода в со
Page 151 and 152: PA1 -PH 2 Атом фосфора,
Page 153 and 154: Br2 -Br= Формально нез
Page 155 and 156: то в дальнейшем буд
Page 157 and 158: После нахождения п
Page 159 and 160: 5.2.1. Прогнозировани
Page 161 and 162: зей, а также учитыв
Page 163 and 164: Эксперимент 50 40 30 20
Page 165 and 166: Построение QSPR-моде
Page 167 and 168: работе [268], но с при
Page 169 and 170: ляются удобным инс
Page 171 and 172: чета этого свойств
Page 173 and 174: База 2 (88 соединений
Page 175 and 176: «редких фрагментов
Page 177 and 178: пользовании 25 деск
Page 179 and 180: Tf расч. о С, Tf calc. o C 30
Page 181 and 182: На первом этапе раб
Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
Page 185 and 186: пример использован
Page 187 and 188: почечных фрагменто
Page 189 and 190:
ской структуры «ре
Page 191 and 192:
1 O O OH C C a O C H 2 O H + C C a
Page 193 and 194:
веществ, например,
Page 195 and 196:
до 28.0 (MAE DCV ). Повыше
Page 197 and 198:
Таким образом, псев
Page 199 and 200:
цепочки длиной до д
Page 201 and 202:
алканов, см 3 /моль 7
Page 203 and 204:
свое преимущество
Page 205 and 206:
6.3.1. Общая методоло
Page 207 and 208:
бирался оптимальны
Page 209 and 210:
0,25 Результаты полу
Page 211 and 212:
При анализе дескри
Page 213 and 214:
414]). Следует также о
Page 215 and 216:
d расч., г/куб.см 4,0 3,0
Page 217 and 218:
Табл. 15. Корреляция
Page 219 and 220:
Табл. 16. Усредненны
Page 221 and 222:
Как видно из Табл. 16
Page 223 and 224:
нием ошибки примен
Page 225 and 226:
NASAWIN (см. раздел 8.2) н
Page 227 and 228:
ГЛАВА 7. РАЗРАБОТКА
Page 229 and 230:
ного моделирования
Page 231 and 232:
ля и даже более сов
Page 233 and 234:
ного цианинового к
Page 235 and 236:
Значения констант
Page 237 and 238:
делена на обучающу
Page 239 and 240:
ность. Основной цел
Page 241 and 242:
На Рис. 50 приводятс
Page 243 and 244:
молекул с конденси
Page 245 and 246:
7.1.4. Прогнозировани
Page 247 and 248:
сивов разрозненных
Page 249 and 250:
используются как т
Page 251 and 252:
были модифицирован
Page 253 and 254:
зависимости давлен
Page 255 and 256:
Объединенный набор
Page 257 and 258:
Оба механизма вклю
Page 259 and 260:
творителя, а также
Page 261 and 262:
Табл. 29. Характерис
Page 263 and 264:
набора дескрипторо
Page 265 and 266:
угодно сложные зав
Page 267 and 268:
симостей «структур
Page 269 and 270:
лей, хотя все модел
Page 271 and 272:
одновременно решае
Page 273 and 274:
Как видно приведен
Page 275 and 276:
принципе гарантиро
Page 277 and 278:
мерации атомов дос
Page 279 and 280:
бор сигналов, соотв
Page 281 and 282:
только с атомных се
Page 283 and 284:
7.4.3. Примеры разных
Page 285 and 286:
Рис. 66. Минимальная
Page 287 and 288:
ров» ведет к ухудше
Page 289 and 290:
бензол, было отброш
Page 291 and 292:
на атому. После 4000 э
Page 293 and 294:
фов), то и все нейро
Page 295 and 296:
проведения линейно
Page 297 and 298:
тате чего NASAWIN прев
Page 299 and 300:
8.2.3. Химически-орие
Page 301 and 302:
8.2.7. Нейросетевые п
Page 303 and 304:
8.2.11. Кластеризация
Page 305 and 306:
нейросетевом прогр
Page 307 and 308:
18 p1_Nlp Количество не
Page 309 and 310:
43 p 4 _ SPR = ∑ R( a ) ⋅ R( a
Page 311 and 312:
делей. Программа та
Page 313 and 314:
позволяющая прогно
Page 315 and 316:
ЛИТЕРАТУРА 1. Гилле
Page 317 and 318:
31. Aoyama T.; Ichikawa H. Neural N
Page 319 and 320:
54. Karelson M.; Dobchev D.A.; Kuls
Page 321 and 322:
79. Carpenter G.A.; Grossberg S. A
Page 323 and 324:
103. Ежов А.А.; Токаев
Page 325 and 326:
126. Benson S.W.; Buss J.H. Additiv
Page 327 and 328:
148. Fisanick W.; Lipkus A.H.; Rusi
Page 329 and 330:
169. Klopman G.; Macina O.T.; Levin
Page 331 and 332:
189. Nilakantan R.; Bauman N.; Dixo
Page 333 and 334:
209. Татевский В.М. Кл
Page 335 and 336:
ces and Related Descriptors in QSAR
Page 337 and 338:
248. MOE, Molecular Operating Envir
Page 339 and 340:
269. Estrada E.; Gonzalez H. What A
Page 341 and 342:
288. Saigo H.; Kadowaki T.; Tsuda K
Page 343 and 344:
309. Vladutz G. Modern Approaches t
Page 345 and 346:
331. Rouvray D.H. Predicting Chemis
Page 347 and 348:
352. Корн Г.; Корн Т. С
Page 349 and 350:
374. Abraham M.H.; McGowan J.C. The
Page 351 and 352:
394. Polanski J.; Gieleciak R.; Wys
Page 353 and 354:
417. Goll E.S.; Jurs P.C. Predictio
Page 355 and 356:
ренции “Молекуляр
Page 357 and 358:
454. Kobakhidze N.; Gverdtsiteli M.
Page 359 and 360:
Approaches to Model Tissue-Air Part
Page 361 and 362:
499. Lohninger H. Evaluation of Neu
Page 363 and 364:
517. Halberstam N.M.; Baskin I.I.;
Page 365:
СПИСОК ОБОЗНАЧЕНИЙ
show all

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸