Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
менное состояние дел в этой быстро развивающейся области науки подробно рассмотрено нами в нескольких обзорах [37, 39, 109]. 1.4. Ограничения искусственных нейронных сетей Как и любой метод машинного обучения, искусственные нейронные сети имеют свои ограничения, которых, однако, по мере развития теории нейросетевого моделирования и общей теории обучающихся систем, становится все меньше и меньше. В начале 90-ых годов прошлого века, т.е. на момент появления первых работ по их применению для прогнозирования свойств химических соединений, такими ограничениями или даже недостатками считались следующие: • нейросеть – это «черный ящик», т.е. нейросетевые модели не поддаются интерпретации; • нейросетевые модели не могут быть точно воспроизведены ввиду инициализации весов связей перед обучением случайными числами; • нейронные сети не работают с большим числом дескрипторов; • нейросети легко «переучиваются», и тогда они хорошо воспроизводят свойства соединений, содержащихся в обучающей выборке, но при этом плохо прогнозируют свойства любых других соединений; • с помощью нейросетей ничего нельзя сделать такого, на что бы не были способны стандартные методы статистического анализа данных. Хотя перечисленные выше утверждения не всегда справедливы, они, тем не менее, указывают на реальные проблемы, с которыми столкнулись исследователи в ходе первых работ по применению нейронных сетей для прогнозирования свойств химических соединений. Без их решения нейросети не могли бы быть использованы как составная часть универсальной методологии прогнозирования свойств химических соединений. Поэтому разработка эффективных методов решения этих проблем составила важную часть диссертационной работы (см. Главу 4). 62
ГЛАВА 2. ФРАГМЕНТНЫЕ ДЕСКРИПТОРЫ В ПОИСКЕ ЗАВИСИМОСТЕЙ СТРУКТУРА-СВОЙСТВО Фрагментный дескриптор – это числовая характеристика химической структуры, показывающая, присутствует ли внутри нее определенный структурный фрагмент, либо специфицирующая сколько раз он в ней содержится. К преимуществам фрагментных дескрипторов обычно относят следующие (см. [110-116]): 1) простота и эффективность вычислений; 2) простота интерпретации со структурно-химической точки зрения; 3) базисный характер, выражающийся в возможности аппроксимировать с их помощью любую зависимость «структура-свойство». 2.1. История фрагментных дескрипторов Среди множества дескрипторов, используемых в настоящее время в исследованиях SAR/QSAR/QSPR, (см. [105]), фрагментные дескрипторы занимают особое место. Ранние работы по их применению для предсказания разнообразные свойств химических соединений датируются 50-ми, 40-ми и даже 30-ми годами прошлого столетия, когда они использовались в рамках методологии аддитивных схем. Фогель (Vogel) [117], Цан (Zahn) [118], Саудерс (Souders) [119, 120], Франклин (Franklin) [121, 122], Татевский [123], Бернштейн (Bernstein) [124], Лаидлер (Laidler) [125], Бенсон (Benson) и Басс (Buss) [126] и Аллен (Allen) [127] были первопроходцами в этом направлении. В цитированных работах все вычислительные подходы были основаны на классической структурной теории в рамках представлений об атомах и химических связях. Е.А.Смоленский был, по-видимому, первым, кто применил еще в 1964 г. язык теории графов для прогнозирования физико-химических свойств органических соединений [128]. Первые аддитивные схемы постепенно эволюционировали и превратились в современный набор методов групповых вкладов (group contribution methods). Основная отличительная черта аддитивных схем и методов групповых вкладов состоит в их тесной связи с физико-химической теорией, и по- 63
- Page 11 and 12: более точного прог
- Page 13 and 14: ГЛАВА 1. ИСКУССТВЕН
- Page 15 and 16: входными; нейроны,
- Page 17 and 18: Таким образом, урав
- Page 19 and 20: 1.2.4. Нейросети обра
- Page 21 and 22: Значения весов объ
- Page 23 and 24: Таким образом, знач
- Page 25 and 26: жения в статье Руме
- Page 27 and 28: Рис. 5. Введение мом
- Page 29 and 30: адаптивно настраив
- Page 31 and 32: 1.2.4.7. Квазиньютонов
- Page 33 and 34: (химических соедин
- Page 35 and 36: на границах решетк
- Page 37 and 38: ными значениями со
- Page 39 and 40: рующие один и тот ж
- Page 41 and 42: дящихся на 2-ом, 3-м и
- Page 43 and 44: всех RBF-нейронов, а
- Page 45 and 46: чающей выборки, при
- Page 47 and 48: Рис. 10. Архитектура
- Page 49 and 50: 1.2.5.4. Нейросети на о
- Page 51 and 52: ми связями, занимае
- Page 53 and 54: практически важных
- Page 55 and 56: ния классического
- Page 57 and 58: ческому мозгу во вр
- Page 59 and 60: лаждения системы и
- Page 61: чем в качестве прог
- Page 65 and 66: му типу биологичес
- Page 67 and 68: тему опубликовано
- Page 69 and 70: В настоящее время п
- Page 71 and 72: ниях QSPR/QSAR/SAR. И дейс
- Page 73 and 74: В качестве характе
- Page 75 and 76: Некоторые типы ЦАФ
- Page 77 and 78: кроме того, они сно
- Page 79 and 80: Следует упомянуть
- Page 81 and 82: зисных графов, пред
- Page 83 and 84: рой равен 1 только в
- Page 85 and 86: множества различны
- Page 87 and 88: при проведении вир
- Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92: ределенных атомных
- Page 93 and 94: элементам, что може
- Page 95 and 96: наличие или отсутс
- Page 97 and 98: использовались в н
- Page 99 and 100: ложенные в 1985 г. ато
- Page 101 and 102: 2.3. Ограничения фра
- Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106: качестве меток исп
- Page 107 and 108: ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
менное состояние дел в этой быстро развивающейся области науки подробно<br />
рассмотрено нами в нескольких обзорах [37, 39, 109].<br />
1.4. Ограничения искусственных нейронных сетей<br />
Как и любой метод машинного обучения, искусственные нейронные сети<br />
имеют свои ограничения, которых, однако, по мере развития теории нейросетевого<br />
моделирования и общей теории обучающихся систем, становится все<br />
меньше и меньше. В начале 90-ых годов прошлого века, т.е. на момент появления<br />
первых работ по их применению для прогнозирования свойств химических<br />
соединений, такими ограничениями или даже недостатками считались следующие:<br />
• нейросеть – это «черный ящик», т.е. нейросетевые модели не поддаются<br />
интерпретации;<br />
• нейросетевые модели не могут быть точно воспроизведены ввиду инициализации<br />
весов связей перед обучением случайными числами;<br />
• нейронные сети не работают с большим числом дескрипторов;<br />
• нейросети легко «переучиваются», и тогда они хорошо воспроизводят<br />
свойства соединений, содержащихся в обучающей выборке, но при этом<br />
плохо прогнозируют свойства любых других соединений;<br />
• с помощью нейросетей ничего нельзя сделать такого, на что бы не были<br />
способны стандартные методы статистического анализа данных.<br />
Хотя перечисленные выше утверждения не всегда справедливы, они, тем<br />
не менее, указывают на реальные проблемы, с которыми столкнулись исследователи<br />
в ходе первых работ по применению нейронных сетей для прогнозирования<br />
свойств химических соединений. Без их решения нейросети не могли бы<br />
быть использованы как составная часть универсальной методологии прогнозирования<br />
свойств химических соединений. Поэтому разработка эффективных<br />
методов решения этих проблем составила важную часть диссертационной работы<br />
(см. Главу 4).<br />
62