Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Рис. 58. Традиционный одноуровневый подход, в котором отдельные нейросетевые модели не связаны друг с другом Рис. 59. Схема многоуровневого подхода, в рамках которого за счет последовательного соединения моделей происходит перенос информации из моделей нижнего уровня в модели верхнего Естественными кандидатами на роль выходных свойств для промежуточных моделей являются физико-химические свойства, связанные с фундаментальными типами взаимодействий (гидрофобность, поляризуемость, характеристики силы водородных связей и т.д.), разнообразные константы заместителей, а также квантово-химические характеристики (ВЗСО, НСМО, заряды на атомах). Заметим, что для большинства из этих величин имеются дескрипторы, которые уже давно успешно используются при построении количественных зави- 266
симостей «структура-свойство». Принципиальным отличием и преимуществом многоуровневого подхода перед непосредственным использованием для построения моделей физико-химических и квантово-химических дескрипторов является то, что при этом не теряется интерпретируемость моделей через фрагментные дескрипторы на языке структурных формул. Кроме того, сохраняется свойственная фрагментным дескрипторам универсальность и эффективность расчета, что дает возможность использовать многоуровневые сети моделей при высокопроизводительном виртуальном скрининге. Следует отметить, что кроме улучшения качества прогноза, многоуровневый подход способен преодолеть то, что иногда называется недостатками фрагментного подхода, а именно отсутствие физико-химической интерпретации и проблема “отсутствующих фрагментов” [116]. Прежде всего, благодаря тому, что промежуточные модели дают на выходе экспериментально измеримые или легко интерпретируемые физические величины, сама конечная модель получает очевидную физико-химическую интерпретацию в терминах этих величин. Для такой интерпретации при использовании нейросетевых моделей может быть использован подход, предложенный нами ранее [478]. Что же касается «отсутствующих фрагментов», которые отсутствуют в обучающей выборке но присутствуют в тестовой, то острота этой проблемы смягчается благодаря тому, что эти фрагменты имеют шансы присутствовать в химических структурах, входящих в выборки существенно большего размера, используемые для обучения моделей предыдущих слоев. Рассмотрим два примера, показывающие преимущества использования многоуровневого подхода. В первом случае на основе опубликованных данных [479] была сформирована выборка 1, содержащая количественные данные по значению логарифма коэффициента сорбции в почве (log K oc ) для 568 органических соединений. Во втором случае для создания выборки 2 были взяты из статей [479, 480] данные по значению логарифма растворимости (log S) фуллерена С 60 в 113 органических растворителях, включая 45 алканов, 36 производных бензола, 7 производных нафталина, 14 кислород, 21 хлор и 15 бромсодержащих соединений. При построении количественных моделей «структура-свойство» в 267
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
- Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230: ного моделирования
- Page 231 and 232: ля и даже более сов
- Page 233 and 234: ного цианинового к
- Page 235 and 236: Значения констант
- Page 237 and 238: делена на обучающу
- Page 239 and 240: ность. Основной цел
- Page 241 and 242: На Рис. 50 приводятс
- Page 243 and 244: молекул с конденси
- Page 245 and 246: 7.1.4. Прогнозировани
- Page 247 and 248: сивов разрозненных
- Page 249 and 250: используются как т
- Page 251 and 252: были модифицирован
- Page 253 and 254: зависимости давлен
- Page 255 and 256: Объединенный набор
- Page 257 and 258: Оба механизма вклю
- Page 259 and 260: творителя, а также
- Page 261 and 262: Табл. 29. Характерис
- Page 263 and 264: набора дескрипторо
- Page 265: угодно сложные зав
- Page 269 and 270: лей, хотя все модел
- Page 271 and 272: одновременно решае
- Page 273 and 274: Как видно приведен
- Page 275 and 276: принципе гарантиро
- Page 277 and 278: мерации атомов дос
- Page 279 and 280: бор сигналов, соотв
- Page 281 and 282: только с атомных се
- Page 283 and 284: 7.4.3. Примеры разных
- Page 285 and 286: Рис. 66. Минимальная
- Page 287 and 288: ров» ведет к ухудше
- Page 289 and 290: бензол, было отброш
- Page 291 and 292: на атому. После 4000 э
- Page 293 and 294: фов), то и все нейро
- Page 295 and 296: проведения линейно
- Page 297 and 298: тате чего NASAWIN прев
- Page 299 and 300: 8.2.3. Химически-орие
- Page 301 and 302: 8.2.7. Нейросетевые п
- Page 303 and 304: 8.2.11. Кластеризация
- Page 305 and 306: нейросетевом прогр
- Page 307 and 308: 18 p1_Nlp Количество не
- Page 309 and 310: 43 p 4 _ SPR = ∑ R( a ) ⋅ R( a
- Page 311 and 312: делей. Программа та
- Page 313 and 314: позволяющая прогно
- Page 315 and 316: ЛИТЕРАТУРА 1. Гилле
Рис. 58. Традиционный одноуровневый подход, в котором отдельные нейросетевые<br />
модели не связаны друг с другом<br />
Рис. 59. Схема многоуровневого подхода, в рамках которого за счет последовательного<br />
соединения моделей происходит перенос информации из моделей<br />
нижнего уровня в модели верхнего<br />
Естественными кандидатами на роль выходных свойств для промежуточных<br />
моделей являются физико-химические свойства, связанные с фундаментальными<br />
типами взаимодействий (гидрофобность, поляризуемость, характеристики<br />
силы водородных связей и т.д.), разнообразные константы заместителей,<br />
а также квантово-химические характеристики (ВЗСО, НСМО, заряды на атомах).<br />
Заметим, что для большинства из этих величин имеются дескрипторы, которые<br />
уже давно успешно используются при построении количественных зави-<br />
266