Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Следующий важный вклад в эту область был сделан Крамером (Cramer), который в 1980 г. определил параметры BC(DEF) путем проведения факторного анализа набора физических свойств для выборки разнородных органических жидкостей [154]. Эти параметры, с одной стороны, сильно коррелируют с разнообразными физическими свойствами разнородных органических соединений и, с другой стороны, их значения могут быть предсказаны с использованием фрагментных дескрипторов в рамках аддитивно-конституционных моделей [155]. Таким образом, Крамером был впервые разработан основанный на фрагментных дескрипторах набор моделей QSPR, позволяющий предсказывать целый набор физических свойств для разнородных органических соединений. По-видимому, наиболее важным достижением 80-ых годов прошлого века в области применения фрагментных дескрипторов для прогнозирования биологической активности стала разработка Клопманым (Klopman) и др. компьютерной программы CASE (Computer-Automated Structure Evaluation) [156-159]. Эта программа, представленная авторами как «самообучающаяся система искусственного интеллекта» [159], способна распознавать активирующие и деактивирующие фрагменты (биофоры и биофобы) относительно определенного вида биологический активности, а также оценивать вероятность того, что произвольное тестовое соединение будет обладать этой активностью. Эта методология была успешно применена для предсказания множества видом биологической активности, в частности: мутагенности [157, 160, 161], канцерогенности [156, 159, 161-163], галлюциногенной активности [164], антиконвульсантной активности [165], ингибиторной активности по отношению к спартеиновой монооксигеназе [166], β-адренергической активности [167], способности связываться с μ-опиатным рецептором [168], антибактериальной активности [169], антилейкемической активности [170] и др. Она также позволяет строить количественные модели с использованием фрагментных дескрипторов при помощи статистического аппарата множественной линейной регрессии [162, 167]. Начиная с начала 90-ых годов, появляется большое число разнообразных подходов (наряду с соответствующими программами), основанных на использовании фрагментных дескрипторов в исследованиях SAR/QSAR/QSPR. На эту 66
тему опубликовано несколько концептуальных статей и мини-обзоров [110, 111, 113-116, 171]. Рассмотрим основные принципы классификации фрагментных дескрипторов. 2.2. Типы фрагментных дескрипторов Структурные фрагменты и соответствующие фрагментные дескрипторы могут быть классифицированы: по типам молекулярных графов, по типам молекулярных структур, по типам значений дескрипторов, по типам дескрипторных наборов, по связанности фрагментов, по уровням детализации молекулярных графов и т.д. 2.2.1. Классификация по типам молекулярных графов Структурные фрагменты, применяемые в исследованиях «структурасвойство», могут быть отнесены ко множеству типов молекулярных графов. В частности, можно выделить: простые фиксированные типы молекулярных графов; фрагменты WLN и SMILES; центрированные на атомах фрагменты; центрированные на связях фрагменты; фрагменты на основе максимальных общих подграфов; атомные пары и топологические мультиплеты; заместители и молекулярные остовы; фрагменты на основе базисных подграфов; фрагменты на основе «добытых» (mined) подграфов; библиотечные фрагменты и др. Рассмотрим каждый из вышеперечисленных типов. 2.2.1.1. Простые фиксированные типы молекулярных графов Древнегреческий атомизм, согласно которому все вещества состоят из атомов, приводит к простейшему типу структурных фрагментам – атомам, т.е. вершинам молекулярных графов. Существует по крайней мере одно свойство, молекулярный вес, значение которого для всех химических соединений могут быть точно, если не принимать во внимание пренебрежительно малые реляти- 67
- Page 15 and 16: входными; нейроны,
- Page 17 and 18: Таким образом, урав
- Page 19 and 20: 1.2.4. Нейросети обра
- Page 21 and 22: Значения весов объ
- Page 23 and 24: Таким образом, знач
- Page 25 and 26: жения в статье Руме
- Page 27 and 28: Рис. 5. Введение мом
- Page 29 and 30: адаптивно настраив
- Page 31 and 32: 1.2.4.7. Квазиньютонов
- Page 33 and 34: (химических соедин
- Page 35 and 36: на границах решетк
- Page 37 and 38: ными значениями со
- Page 39 and 40: рующие один и тот ж
- Page 41 and 42: дящихся на 2-ом, 3-м и
- Page 43 and 44: всех RBF-нейронов, а
- Page 45 and 46: чающей выборки, при
- Page 47 and 48: Рис. 10. Архитектура
- Page 49 and 50: 1.2.5.4. Нейросети на о
- Page 51 and 52: ми связями, занимае
- Page 53 and 54: практически важных
- Page 55 and 56: ния классического
- Page 57 and 58: ческому мозгу во вр
- Page 59 and 60: лаждения системы и
- Page 61 and 62: чем в качестве прог
- Page 63 and 64: ГЛАВА 2. ФРАГМЕНТНЫ
- Page 65: му типу биологичес
- Page 69 and 70: В настоящее время п
- Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс
- Page 73 and 74: В качестве характе
- Page 75 and 76: Некоторые типы ЦАФ
- Page 77 and 78: кроме того, они сно
- Page 79 and 80: Следует упомянуть
- Page 81 and 82: зисных графов, пред
- Page 83 and 84: рой равен 1 только в
- Page 85 and 86: множества различны
- Page 87 and 88: при проведении вир
- Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92: ределенных атомных
- Page 93 and 94: элементам, что може
- Page 95 and 96: наличие или отсутс
- Page 97 and 98: использовались в н
- Page 99 and 100: ложенные в 1985 г. ато
- Page 101 and 102: 2.3. Ограничения фра
- Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106: качестве меток исп
- Page 107 and 108: ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
- Page 113 and 114: линейные комбинаци
- Page 115 and 116: таться внешней по о
Следующий важный вклад в эту область был сделан Крамером (Cramer),<br />
который в 1980 г. определил параметры BC(DEF) путем проведения факторного<br />
анализа набора физических свойств для выборки разнородных органических<br />
жидкостей [154]. Эти параметры, с одной стороны, сильно коррелируют с разнообразными<br />
физическими свойствами разнородных органических соединений<br />
и, с другой стороны, их значения могут быть предсказаны с использованием<br />
фрагментных дескрипторов в рамках аддитивно-конституционных моделей<br />
[155]. Таким образом, Крамером был впервые разработан основанный на фрагментных<br />
дескрипторах набор моделей QSPR, позволяющий предсказывать целый<br />
набор физических свойств для разнородных органических соединений.<br />
По-видимому, наиболее важным достижением 80-ых годов прошлого века<br />
в области применения фрагментных дескрипторов для прогнозирования биологической<br />
активности стала разработка Клопманым (Klopman) и др. компьютерной<br />
программы CASE (Computer-Automated Structure Evaluation) [156-159].<br />
Эта программа, представленная авторами как «самообучающаяся система искусственного<br />
интеллекта» [159], способна распознавать активирующие и деактивирующие<br />
фрагменты (биофоры и биофобы) относительно определенного<br />
вида биологический активности, а также оценивать вероятность того, что произвольное<br />
тестовое соединение будет обладать этой активностью. Эта методология<br />
была успешно применена для предсказания множества видом биологической<br />
активности, в частности: мутагенности [157, 160, 161], канцерогенности<br />
[156, 159, 161-163], галлюциногенной активности [164], антиконвульсантной<br />
активности [165], ингибиторной активности по отношению к спартеиновой монооксигеназе<br />
[166], β-адренергической активности [167], способности связываться<br />
с μ-опиатным рецептором [168], антибактериальной активности [169],<br />
антилейкемической активности [170] и др. Она также позволяет строить количественные<br />
модели с использованием фрагментных дескрипторов при помощи<br />
статистического аппарата множественной линейной регрессии [162, 167].<br />
Начиная с начала 90-ых годов, появляется большое число разнообразных<br />
подходов (наряду с соответствующими программами), основанных на использовании<br />
фрагментных дескрипторов в исследованиях SAR/QSAR/QSPR. На эту<br />
66