Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
На первом этапе работы для всех 398 красителей было определено геометрическое строение молекул при помощи процедуры автоматического молекулярного моделирования, включающей проведение в автоматическом режиме построения 3D-моделей молекул с последующим уточнением моделей путем поочередного применения методов молекулярной механики, молекулярной динамики (для вывода молекул из ложных локальных минимумов) и, наконец, полуэмпирического квантово-химического метода PM3. Технические детали разработанного нами и использованного в этом исследовании клиент/серверного программного комплекса описаны в работе [429]. На втором этапе работы проводилась нейросетевая обработка баз данных при помощи многослойных персептронов с использованием компьютерной программы NASAWIN. В качестве дескрипторов использовались рассчитанные на первом этапе по методу PM3 энергии высшей занятой молекулярной орбитали (ВЗМО) E ВЗМО и низшей свободной молекулярной орбитали (НСМО) E НСМО , длина полиметиновой цепочки n, индикатор наличия заместителя в мезоположении полиметиновой цепочки, а также индикаторы типа X в формуле (I): X O , X N , X S , X CH=CH , X C(CH3)2 . Обучение нейросети проводилось по обучающей выборке с использованием алгоритма обобщенного дельта-правила (см. [42]) при начальном значении параметра скорости обучения 0.25 с последующим снижением до 0.01. Прогнозирующая способность нейросети оценивалась при помощи независимого прогноза на контрольной выборке. Для нахождения оптимальной архитектуры сети обучение проводилось при разном числе нейронов во внутреннем слое. В Табл. 21 приведены значения коэффициентов корреляции R и среднеквадратичных ошибок на обучающей выборке s t и среднеквадратичных ошибок прогноза на контрольной выборке s v для разного числа внутренних нейронов n h для соединений из полной выборки, а в Табл. 22 дана та же информация для красителей с R 6 =H. Из информации, содержащейся в Табл. 21 и Табл. 22 можно сделать вывод, что для обеспечения наилучшей прогнозирующей способности следует брать нейросеть с 8-10 внутренними нейронами для произвольного симметрич- 232
ного цианинового красителя и с 7-8 внутренними нейронами для незамещенных в цепочке симметричных цианиновых красителей, при этом качество прогноза (среднеквадратичная ошибка 7-11 нм для общего случая и 3-5 нм для красителей с R 6 =H) значительно превосходит все то, что было достигнуто ранее (см. обсуждение выше) и обеспечивает достаточную точность для решения практических задач дизайна красителей с заданным положением длинноволновой полосы поглощения. Табл. 21. Результаты обучения ИНС для полной выборки (обозначения см. в тексте) n h R RMSE t (в нм) RMSE v (в нм) 2 0.9884 13.5 10.0 3 0.9910 11.9 9.3 4 0.9912 11.8 8.3 5 0.9924 10.9 7.5 6 0.9924 10.9 8.0 7 0.9931 10.4 9.0 8 0.9923 11.0 7.4 9 0.9923 11.0 7.4 10 0.9928 10.6 7.0 11 0.9921 11.1 8.5 12 0.9930 10.6 9.4 Табл. 22. Результаты обучения ИНС для выборки c R 6 =H (обозначения см. в тексте) n h R RMSE t (в нм) RMSE v (в нм) 2 0.9959 7.5 4.9 3 0.9958 7.6 4.7 4 0.9966 6.8 4.5 5 0.9954 8.0 5.5 6 0.9961 7.4 5.2 7 0.9986 4.4 3.4 8 0.9976 5.7 4.5 9 0.9955 7.8 6.9 10 0.9980 5.3 4.8 7.1.2. Оценка значений констант ионизации для различных классов органических соединений Как известно, константа ионизации, К а (или обратный логарифм - logK a =pK a ) является одной из важнейших характеристик органических соеди- 233
- Page 181 and 182: На первом этапе раб
- Page 183 and 184: 0,935; s = 0,76 кДж·моль -1
- Page 185 and 186: пример использован
- Page 187 and 188: почечных фрагменто
- Page 189 and 190: ской структуры «ре
- Page 191 and 192: 1 O O OH C C a O C H 2 O H + C C a
- Page 193 and 194: веществ, например,
- Page 195 and 196: до 28.0 (MAE DCV ). Повыше
- Page 197 and 198: Таким образом, псев
- Page 199 and 200: цепочки длиной до д
- Page 201 and 202: алканов, см 3 /моль 7
- Page 203 and 204: свое преимущество
- Page 205 and 206: 6.3.1. Общая методоло
- Page 207 and 208: бирался оптимальны
- Page 209 and 210: 0,25 Результаты полу
- Page 211 and 212: При анализе дескри
- Page 213 and 214: 414]). Следует также о
- Page 215 and 216: d расч., г/куб.см 4,0 3,0
- Page 217 and 218: Табл. 15. Корреляция
- Page 219 and 220: Табл. 16. Усредненны
- Page 221 and 222: Как видно из Табл. 16
- Page 223 and 224: нием ошибки примен
- Page 225 and 226: NASAWIN (см. раздел 8.2) н
- Page 227 and 228: ГЛАВА 7. РАЗРАБОТКА
- Page 229 and 230: ного моделирования
- Page 231: ля и даже более сов
- Page 235 and 236: Значения констант
- Page 237 and 238: делена на обучающу
- Page 239 and 240: ность. Основной цел
- Page 241 and 242: На Рис. 50 приводятс
- Page 243 and 244: молекул с конденси
- Page 245 and 246: 7.1.4. Прогнозировани
- Page 247 and 248: сивов разрозненных
- Page 249 and 250: используются как т
- Page 251 and 252: были модифицирован
- Page 253 and 254: зависимости давлен
- Page 255 and 256: Объединенный набор
- Page 257 and 258: Оба механизма вклю
- Page 259 and 260: творителя, а также
- Page 261 and 262: Табл. 29. Характерис
- Page 263 and 264: набора дескрипторо
- Page 265 and 266: угодно сложные зав
- Page 267 and 268: симостей «структур
- Page 269 and 270: лей, хотя все модел
- Page 271 and 272: одновременно решае
- Page 273 and 274: Как видно приведен
- Page 275 and 276: принципе гарантиро
- Page 277 and 278: мерации атомов дос
- Page 279 and 280: бор сигналов, соотв
- Page 281 and 282: только с атомных се
ного цианинового красителя и с 7-8 внутренними нейронами для незамещенных<br />
в цепочке симметричных цианиновых красителей, при этом качество прогноза<br />
(среднеквадратичная ошибка 7-11 нм для общего случая и 3-5 нм для красителей<br />
с R 6 =H) значительно превосходит все то, что было достигнуто ранее (см.<br />
обсуждение выше) и обеспечивает достаточную точность для решения практических<br />
задач дизайна красителей с заданным положением длинноволновой полосы<br />
поглощения.<br />
Табл. 21. Результаты обучения ИНС для полной выборки (обозначения см. в тексте)<br />
n h R RMSE t (в нм) RMSE v (в нм)<br />
2 0.9884 13.5 10.0<br />
3 0.9910 11.9 9.3<br />
4 0.9912 11.8 8.3<br />
5 0.9924 10.9 7.5<br />
6 0.9924 10.9 8.0<br />
7 0.9931 10.4 9.0<br />
8 0.9923 11.0 7.4<br />
9 0.9923 11.0 7.4<br />
10 0.9928 10.6 7.0<br />
11 0.9921 11.1 8.5<br />
12 0.9930 10.6 9.4<br />
Табл. 22. Результаты обучения ИНС для выборки c R 6 =H (обозначения см. в тексте)<br />
n h R RMSE t (в нм) RMSE v (в нм)<br />
2 0.9959 7.5 4.9<br />
3 0.9958 7.6 4.7<br />
4 0.9966 6.8 4.5<br />
5 0.9954 8.0 5.5<br />
6 0.9961 7.4 5.2<br />
7 0.9986 4.4 3.4<br />
8 0.9976 5.7 4.5<br />
9 0.9955 7.8 6.9<br />
10 0.9980 5.3 4.8<br />
7.1.2. Оценка значений констант ионизации для различных классов органических<br />
соединений<br />
Как известно, константа ионизации, К а (или обратный логарифм -<br />
logK a =pK a ) является одной из важнейших характеристик органических соеди-<br />
233