Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Нейросетевое моделирование проводилось с использованием программного комплекса NASAWIN (см. раздел 8.2) и EMMA (см. раздел 8.1). Каждая исследуемая выборка разбивалась случайным образом на обучающую и контрольную подвыборки. Были изучены построенные на одинаковых наборах дескрипторов линейно-регрессионные и нейросетевые модели. Обучение ИНС проводилось по методу обобщенного дельта-правила со скоростью обучения, равной 0,25 и моментом 0,9. Обучение прерывалось в момент наступления переучивания. Предварительно нами был проведен отбор наиболее значимых дескрипторов с помощью множественной линейной регрессии. Для общей выборки такими дескрипторами оказались 3 дескриптора – Е LUMO (d 1 ), logP (d 4 ) и дескриптор, характеризующий наличие нитрогруппы в пара-положении (d 5 ). Результаты нейросетевого моделирования для общей выборки, содержащей 49 обучающих и 5 контрольных соединений, приведены в Табл. 25. С целью улучшения параметров модели в рамках заданных дескрипторов общая выборка из 54 соединений была разбита на 2 подвыборки структурнородственных соединений. Для первой подвыборки, состоящей из 33 гетероциклических аналогов пирена и фенантрена и замещенных флуоренонов, значимыми оказались все дескрипторы, за исключением липофильности (d 4 ). Для второй подвыборки, содержащей замещенные бифенилы, значимыми оказались дескрипторы E LUMO (d 1 ) и logP (d 4 ). Сравнивая между собой результаты отбора дескрипторов для различных выборок, легко заметить, что дескриптор Е LUMO выступает в роли основного, способного характеризовать мутагенную активность как молекул с конденсированными бензольными кольцами, так и производных бифенила. Чем энергия низшей свободной орбитали ниже, тем стабильнее соответствующие активные метаболиты, в частности первый в цепи восстановления нитрогруппы – анионрадикал, тем больше мутагенная активность. Вторым по значению дескриптором, характеризующим положение нитрогрупп, является d 5 , прямо пропорциональный мутагенной активности. Влияние мета- и орто- заместителей, уменьшающее планарность молекулы и ее активность, оказалось более важным для 242
молекул с конденсированными бензольными кольцами, чем для бифенилов. Следует отметить, что планарность молекулы для мутагенной активности нитроароматических соединений имеет особое значение [448]. Во-первых, планарные молекулы обладают большей способностью интеркалировать в ДНК, чем непланарные, и, во-вторых, полагают, что они имеют повышенное сродство к нитроредуктазам, чем другие соединения [449]. Липофильность оказалась несущественным параметром при описании активности производных с конденсированными бензольными кольцами. Модели, описанные в литературе для этих производных, также как и для бифенилов, как включают этот параметр [444], так и не включают его [443]. Этот факт можно объяснить тем, что липофильность играет второстепенную роль в определении мутагенной активности рассматриваемых соединений. Табл. 25. Статистические характеристики нейросетевых моделей Выборка Дескрипторы Метод Характеристики модели соединений входного слоя R RMSE t RMSE v Производные пирена, d 1 , d 2 , d 3 , d 5 , d 6 , ИНС 0.90 0.76 0.96 фенантрена, флуоренона d 7 МЛР 0.75 1.45 1.94 Замещенные бифенилы d 1 , d 4 ИНС 0.97 0.59 0.13 МЛР 0.80 1.21 1.34 Все соединения d 1 , d 4 , d 5 ИНС 0.87 1.30 1.57 МЛР 0.75 1.45 1.94 где R - коэффициент корреляции между предсказанной и экспериментальной величинами числа ревертантов для соединений обучающей выборки; RMSE t – среднеквадратичная ошибка воспроизведения числа ревертантов для соединений обучающей выборки (ln единицы); RMSE v - среднеквадратичная ошибка предсказания числа ревертантов для соединений контрольной выборки (ln единицы). Результаты нейросетевого моделирования для двух подвыборок родственных соединений также приведены в Табл. 25. Первая подвыборка содержала 30 соединений в обучающей выборке и 3 соединения в контрольной; вторая – 19 в обучающей и 2 в контрольной. Как видно из Табл. 25, наилучшая модель была получена для замещенных бифенилов, представляющих собой единый 243
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
- Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230: ного моделирования
- Page 231 and 232: ля и даже более сов
- Page 233 and 234: ного цианинового к
- Page 235 and 236: Значения констант
- Page 237 and 238: делена на обучающу
- Page 239 and 240: ность. Основной цел
- Page 241: На Рис. 50 приводятс
- Page 245 and 246: 7.1.4. Прогнозировани
- Page 247 and 248: сивов разрозненных
- Page 249 and 250: используются как т
- Page 251 and 252: были модифицирован
- Page 253 and 254: зависимости давлен
- Page 255 and 256: Объединенный набор
- Page 257 and 258: Оба механизма вклю
- Page 259 and 260: творителя, а также
- Page 261 and 262: Табл. 29. Характерис
- Page 263 and 264: набора дескрипторо
- Page 265 and 266: угодно сложные зав
- Page 267 and 268: симостей «структур
- Page 269 and 270: лей, хотя все модел
- Page 271 and 272: одновременно решае
- Page 273 and 274: Как видно приведен
- Page 275 and 276: принципе гарантиро
- Page 277 and 278: мерации атомов дос
- Page 279 and 280: бор сигналов, соотв
- Page 281 and 282: только с атомных се
- Page 283 and 284: 7.4.3. Примеры разных
- Page 285 and 286: Рис. 66. Минимальная
- Page 287 and 288: ров» ведет к ухудше
- Page 289 and 290: бензол, было отброш
- Page 291 and 292: на атому. После 4000 э
Нейросетевое моделирование проводилось с использованием программного<br />
комплекса NASAWIN (см. раздел 8.2) и EMMA (см. раздел 8.1). Каждая<br />
исследуемая выборка разбивалась случайным образом на обучающую и контрольную<br />
подвыборки. Были изучены построенные на одинаковых наборах дескрипторов<br />
линейно-регрессионные и нейросетевые модели. Обучение ИНС<br />
проводилось по методу обобщенного дельта-правила со скоростью обучения,<br />
равной 0,25 и моментом 0,9. Обучение прерывалось в момент наступления переучивания.<br />
Предварительно нами был проведен отбор наиболее значимых дескрипторов<br />
с помощью множественной линейной регрессии. Для общей выборки такими<br />
дескрипторами оказались 3 дескриптора – Е LUMO (d 1 ), logP (d 4 ) и дескриптор,<br />
характеризующий наличие нитрогруппы в пара-положении (d 5 ). Результаты<br />
нейросетевого моделирования для общей выборки, содержащей 49 обучающих<br />
и 5 контрольных соединений, приведены в Табл. 25.<br />
С целью улучшения параметров модели в рамках заданных дескрипторов<br />
общая выборка из 54 соединений была разбита на 2 подвыборки структурнородственных<br />
соединений. Для первой подвыборки, состоящей из 33 гетероциклических<br />
аналогов пирена и фенантрена и замещенных флуоренонов, значимыми<br />
оказались все дескрипторы, за исключением липофильности (d 4 ). Для второй<br />
подвыборки, содержащей замещенные бифенилы, значимыми оказались дескрипторы<br />
E LUMO (d 1 ) и logP (d 4 ).<br />
Сравнивая между собой результаты отбора дескрипторов для различных<br />
выборок, легко заметить, что дескриптор Е LUMO выступает в роли основного,<br />
способного характеризовать мутагенную активность как молекул с конденсированными<br />
бензольными кольцами, так и производных бифенила. Чем энергия<br />
низшей свободной орбитали ниже, тем стабильнее соответствующие активные<br />
метаболиты, в частности первый в цепи восстановления нитрогруппы – анионрадикал,<br />
тем больше мутагенная активность. Вторым по значению дескриптором,<br />
характеризующим положение нитрогрупп, является d 5 , прямо пропорциональный<br />
мутагенной активности. Влияние мета- и орто- заместителей, уменьшающее<br />
планарность молекулы и ее активность, оказалось более важным для<br />
242