ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

19.11.2014 Views
заместителя в R 2 . Исходная выборка, включающая 35 соединений, была, как и в предыдущем примере, удвоена, и получившиеся 70 соединений были случайным образом разбиты на обучающую и контрольную выборки в соотношении 10:1. Как и в предыдущем примере, была использована многослойная ИНС с обратным распространением ошибок с двумя скрытыми нейронами. При обучении не наблюдался эффект «переучивания», что, как и в предыдущем примере, сделало ненужным использование третьей выборки для объективной оценки прогнозирующей способности нейросетевой модели. В результате обучения среднеквадратичная ошибка составила 0.55 логарифмических единиц на обучающей выборке (коэффициент корреляции 0.932) и 0.47 логарифмических единиц на контрольной выборке. Как и в предыдущем примере, мы повторили построение модели с использованием исходного (нерасширенного) набора данных. В этом случае уже наблюдался сильный эффект «переучивания» вследствие неблагоприятного соотношения между числом соединений и числом подстроечных параметров в нейросети. Среднеквадратичная ошибка нейросетевой модели, взятой при прохождении среднеквадратичной ошибки на контрольной выборке через минимум (т.е. до начала «переучивания»), составила 0.89 логарифмических единиц на обучающей выборке (коэффициент корреляции 0.82) и 0.54 логарифмические единицы на контрольной выборке, тогда как «переученная» нейросеть показала ошибку в 0.49 логарифмических единиц на обучающей выборке (коэффициент корреляции 0.95) и 0.98 логарифмических единиц на контрольной выборке. Обе эти модели дали близкие среднеквадратичные ошибки при прогнозировании галлюциногенной активности «клонов» исходных соединений (1.19 и 1.15 логарифмических единиц). Таким образом, расширение исходной выборки соединений за счет их «клонов» (получаемых путем перестановок эквивалентных позиций присоединения заместителей) позволило улучшить соотношение между числом соединений в выборке и числом подстроечных параметров нейросети (70:17 против 35:17), что, в свою очередь, привело к улучшению качества нейросетевой модели. Следует отметить, что построенные нами количественные модели «структура-активность» существенно лучше опубликованных (обзор известных моде- 140

лей приведен в работе [355]): все опубликованные модели построены только на небольших подмножествах использованного в нашей работе набора соединений (коэффициенты корреляции варьируются от 0.79 для выборки из 26 соединений до 0.97 для выборки из 10 соединений), и ни в одной из работ не оценивалась прогнозирующая способность моделей на контрольной выборке. Как и в предыдущем случае, все вычислительные эксперименты были повторены для разных разбивок исходных соединений на обучающую и контрольные выборки, и во всех случаях качественные результаты совпали. Выводы. Нами предложен подход (концепция обучаемой симметрии), позволяющий осуществлять построение количественных моделей «структураактивность» в рамках основанного на параметрах заместителей «классического» подхода для однородных наборов химических соединений с симметричных общим скелетом, позволяющий обходиться без произвольных симметрических функций от констант заместителей. Нейронная сеть в этом случае обучается на только воспроизводить зависимость биологической активности от значений дескрипторов, но и воспроизводить необходимые свойства симметрии в количественных соотношениях «структура-активность». Следует также отметить, что разработанная методология применима не только к «классическому» подходу, основанному на использовании констант заместителей в качестве дескрипторов: она применима к любому исследованию, в котором требуется аппроксимировать количественную зависимость «структура-свойство» или «структураактивность» для симметрично построенных химических систем (при небольшом порядке группы симметрии). Таким образом, концепция обучаемой симметрии позволяет улучшать прогнозирующую способность количественных нейросетевых моделей «структура-активность» и «структура-свойство» за счет использования дополнительной информации о свойствах симметрии этих соотношений. 141

Page 1 and 2: На правах рукописи

Page 3 and 4: 2.2.6. Классификация

Page 5 and 6: 5.4. Псевдофрагментн

Page 7 and 8: 7.4.3. Примеры разных

Page 9 and 10: ВВЕДЕНИЕ На соврем

Page 11 and 12: более точного прог

Page 13 and 14: ГЛАВА 1. ИСКУССТВЕН

Page 15 and 16: входными; нейроны,

Page 17 and 18: Таким образом, урав

Page 19 and 20: 1.2.4. Нейросети обра

Page 21 and 22: Значения весов объ

Page 23 and 24: Таким образом, знач

Page 25 and 26: жения в статье Руме

Page 27 and 28: Рис. 5. Введение мом

Page 29 and 30: адаптивно настраив

Page 31 and 32: 1.2.4.7. Квазиньютонов

Page 33 and 34: (химических соедин

Page 35 and 36: на границах решетк

Page 37 and 38: ными значениями со

Page 39 and 40: рующие один и тот ж

Page 41 and 42: дящихся на 2-ом, 3-м и

Page 43 and 44: всех RBF-нейронов, а

Page 45 and 46: чающей выборки, при

Page 47 and 48: Рис. 10. Архитектура

Page 49 and 50: 1.2.5.4. Нейросети на о

Page 51 and 52: ми связями, занимае

Page 53 and 54: практически важных

Page 55 and 56: ния классического

Page 57 and 58: ческому мозгу во вр

Page 59 and 60: лаждения системы и

Page 61 and 62: чем в качестве прог

Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ

Page 65 and 66: му типу биологичес

Page 67 and 68: тему опубликовано

Page 69 and 70: В настоящее время п

Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс

Page 73 and 74: В качестве характе

Page 75 and 76: Некоторые типы ЦАФ

Page 77 and 78: кроме того, они сно

Page 79 and 80: Следует упомянуть

Page 81 and 82: зисных графов, пред

Page 83 and 84: рой равен 1 только в

Page 85 and 86: множества различны

Page 87 and 88: при проведении вир

Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре

Page 91 and 92: ределенных атомных

Page 93 and 94: элементам, что може

Page 95 and 96: наличие или отсутс

Page 97 and 98: использовались в н

Page 99 and 100: ложенные в 1985 г. ато

Page 101 and 102: 2.3. Ограничения фра

Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ

Page 105 and 106: качестве меток исп

Page 107 and 108: ной нумерации граф

Page 109 and 110: нейронной сети с пр

Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА

Page 113 and 114: линейные комбинаци

Page 115 and 116: таться внешней по о

Page 117 and 118: Предсказанное знач

Page 119 and 120: рипторе, то он пере

Page 121 and 122: Для решения этой пр

Page 123 and 124: • D x - среднее значе

Page 125 and 126: R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH

Page 127 and 128: В соответствии с вы

Page 129 and 130: зовании рассмотрен

Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2

Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,

Page 135 and 136: R3 R2 R5 R6 Общая формул

Page 137 and 138: ко, эта разница все

Page 139: переставленными эк

Page 143 and 144: деленными» атомами

Page 145 and 146: 5.1.2. Иерархическая

Page 147 and 148: водородного соседа

Page 149 and 150: Атом кислорода в со

Page 151 and 152: PA1 -PH 2 Атом фосфора,

Page 153 and 154: Br2 -Br= Формально нез

Page 155 and 156: то в дальнейшем буд

Page 157 and 158: После нахождения п

Page 159 and 160: 5.2.1. Прогнозировани

Page 161 and 162: зей, а также учитыв

Page 163 and 164: Эксперимент 50 40 30 20

Page 165 and 166: Построение QSPR-моде

Page 167 and 168: работе [268], но с при

Page 169 and 170: ляются удобным инс

Page 171 and 172: чета этого свойств

Page 173 and 174: База 2 (88 соединений

Page 175 and 176: «редких фрагментов

Page 177 and 178: пользовании 25 деск

Page 179 and 180: Tf расч. о С, Tf calc. o C 30

Page 181 and 182: На первом этапе раб

Page 183 and 184: 0,935; s = 0,76 кДж·моль -1

Page 185 and 186: пример использован

Page 187 and 188: почечных фрагменто

Page 189 and 190: ской структуры «ре

Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a

Page 193 and 194: веществ, например,

Page 195 and 196: до 28.0 (MAE DCV ). Повыше

Page 197 and 198: Таким образом, псев

Page 199 and 200: цепочки длиной до д

Page 201 and 202: алканов, см 3 /моль 7

Page 203 and 204: свое преимущество

Page 205 and 206: 6.3.1. Общая методоло

Page 207 and 208: бирался оптимальны

Page 209 and 210: 0,25 Результаты полу

Page 211 and 212: При анализе дескри

Page 213 and 214: 414]). Следует также о

Page 215 and 216: d расч., г/куб.см 4,0 3,0

Page 217 and 218: Табл. 15. Корреляция

Page 219 and 220: Табл. 16. Усредненны

Page 221 and 222: Как видно из Табл. 16

Page 223 and 224: нием ошибки примен

Page 225 and 226: NASAWIN (см. раздел 8.2) н

Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА

Page 229 and 230: ного моделирования

Page 231 and 232: ля и даже более сов

Page 233 and 234: ного цианинового к

Page 235 and 236: Значения констант

Page 237 and 238: делена на обучающу

Page 239 and 240: ность. Основной цел

Page 241 and 242: На Рис. 50 приводятс

Page 243 and 244: молекул с конденси

Page 245 and 246: 7.1.4. Прогнозировани

Page 247 and 248: сивов разрозненных

Page 249 and 250: используются как т

Page 251 and 252: были модифицирован

Page 253 and 254: зависимости давлен

Page 255 and 256: Объединенный набор

Page 257 and 258: Оба механизма вклю

Page 259 and 260: творителя, а также

Page 261 and 262: Табл. 29. Характерис

Page 263 and 264: набора дескрипторо

Page 265 and 266: угодно сложные зав

Page 267 and 268: симостей «структур

Page 269 and 270: лей, хотя все модел

Page 271 and 272: одновременно решае

Page 273 and 274: Как видно приведен

Page 275 and 276: принципе гарантиро

Page 277 and 278: мерации атомов дос

Page 279 and 280: бор сигналов, соотв

Page 281 and 282: только с атомных се

Page 283 and 284: 7.4.3. Примеры разных

Page 285 and 286: Рис. 66. Минимальная

Page 287 and 288: ров» ведет к ухудше

Page 289 and 290: бензол, было отброш

Page 291 and 292: на атому. После 4000 э

Page 293 and 294: фов), то и все нейро

Page 295 and 296: проведения линейно

Page 297 and 298: тате чего NASAWIN прев

Page 299 and 300: 8.2.3. Химически-орие

Page 301 and 302: 8.2.7. Нейросетевые п

Page 303 and 304: 8.2.11. Кластеризация

Page 305 and 306: нейросетевом прогр

Page 307 and 308: 18 p1_Nlp Количество не

Page 309 and 310: 43 p 4 _ SPR = ∑ R( a ) ⋅ R( a

Page 311 and 312: делей. Программа та

Page 313 and 314: позволяющая прогно

Page 315 and 316: ЛИТЕРАТУРА 1. Гилле

Page 317 and 318: 31. Aoyama T.; Ichikawa H. Neural N

Page 319 and 320: 54. Karelson M.; Dobchev D.A.; Kuls

Page 321 and 322: 79. Carpenter G.A.; Grossberg S. A

Page 323 and 324: 103. Ежов А.А.; Токаев

Page 325 and 326: 126. Benson S.W.; Buss J.H. Additiv

Page 327 and 328: 148. Fisanick W.; Lipkus A.H.; Rusi

Page 329 and 330: 169. Klopman G.; Macina O.T.; Levin

Page 331 and 332: 189. Nilakantan R.; Bauman N.; Dixo

Page 333 and 334: 209. Татевский В.М. Кл

Page 335 and 336: ces and Related Descriptors in QSAR

Page 337 and 338: 248. MOE, Molecular Operating Envir

Page 339 and 340: 269. Estrada E.; Gonzalez H. What A

Page 341 and 342: 288. Saigo H.; Kadowaki T.; Tsuda K

Page 343 and 344: 309. Vladutz G. Modern Approaches t

Page 345 and 346: 331. Rouvray D.H. Predicting Chemis

Page 347 and 348: 352. Корн Г.; Корн Т. С

Page 349 and 350: 374. Abraham M.H.; McGowan J.C. The

Page 351 and 352: 394. Polanski J.; Gieleciak R.; Wys

Page 353 and 354: 417. Goll E.S.; Jurs P.C. Predictio

Page 355 and 356: ренции “Молекуляр

Page 357 and 358: 454. Kobakhidze N.; Gverdtsiteli M.

Page 359 and 360: Approaches to Model Tissue-Air Part

Page 361 and 362: 499. Lohninger H. Evaluation of Neu

Page 363 and 364: 517. Halberstam N.M.; Baskin I.I.;

Page 365: СПИСОК ОБОЗНАЧЕНИЙ

rmse

neural

molecular

qsar

fragment

nasawin

prediction

networks

analysis

quantitative

cdn.scipeople.com

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸ ... View more ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

Delete template?

Save as template ?

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸

ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸ ÐÐ° Ð¿ÑÐ°Ð²Ð°Ñ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ¸