На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

На первом этапе работы для всех 398 красителей было определено геометрическое строение молекул при помощи процедуры автоматического молекулярного моделирования, включающей проведение в автоматическом режиме построения 3D-моделей молекул с последующим уточнением моделей путем поочередного применения методов молекулярной механики, молекулярной динамики (для вывода молекул из ложных локальных минимумов) и, наконец, полуэмпирического квантово-химического метода PM3. Технические детали разработанного нами и использованного в этом исследовании клиент/серверного программного комплекса описаны в работе [429]. На втором этапе работы проводилась нейросетевая обработка баз данных при помощи многослойных персептронов с использованием компьютерной программы NASAWIN. В качестве дескрипторов использовались рассчитанные на первом этапе по методу PM3 энергии высшей занятой молекулярной орбитали (ВЗМО) E ВЗМО и низшей свободной молекулярной орбитали (НСМО) E НСМО , длина полиметиновой цепочки n, индикатор наличия заместителя в мезоположении полиметиновой цепочки, а также индикаторы типа X в формуле (I): X O , X N , X S , X CH=CH , X C(CH3)2 . Обучение нейросети проводилось по обучающей выборке с использованием алгоритма обобщенного дельта-правила (см. [42]) при начальном значении параметра скорости обучения 0.25 с последующим снижением до 0.01. Прогнозирующая способность нейросети оценивалась при помощи независимого прогноза на контрольной выборке. Для нахождения оптимальной архитектуры сети обучение проводилось при разном числе нейронов во внутреннем слое. В Табл. 21 приведены значения коэффициентов корреляции R и среднеквадратичных ошибок на обучающей выборке s t и среднеквадратичных ошибок прогноза на контрольной выборке s v для разного числа внутренних нейронов n h для соединений из полной выборки, а в Табл. 22 дана та же информация для красителей с R 6 =H. Из информации, содержащейся в Табл. 21 и Табл. 22 можно сделать вывод, что для обеспечения наилучшей прогнозирующей способности следует брать нейросеть с 8-10 внутренними нейронами для произвольного симметрич- 232

ного цианинового красителя и с 7-8 внутренними нейронами для незамещенных в цепочке симметричных цианиновых красителей, при этом качество прогноза (среднеквадратичная ошибка 7-11 нм для общего случая и 3-5 нм для красителей с R 6 =H) значительно превосходит все то, что было достигнуто ранее (см. обсуждение выше) и обеспечивает достаточную точность для решения практических задач дизайна красителей с заданным положением длинноволновой полосы поглощения. Табл. 21. Результаты обучения ИНС для полной выборки (обозначения см. в тексте) n h R RMSE t (в нм) RMSE v (в нм) 2 0.9884 13.5 10.0 3 0.9910 11.9 9.3 4 0.9912 11.8 8.3 5 0.9924 10.9 7.5 6 0.9924 10.9 8.0 7 0.9931 10.4 9.0 8 0.9923 11.0 7.4 9 0.9923 11.0 7.4 10 0.9928 10.6 7.0 11 0.9921 11.1 8.5 12 0.9930 10.6 9.4 Табл. 22. Результаты обучения ИНС для выборки c R 6 =H (обозначения см. в тексте) n h R RMSE t (в нм) RMSE v (в нм) 2 0.9959 7.5 4.9 3 0.9958 7.6 4.7 4 0.9966 6.8 4.5 5 0.9954 8.0 5.5 6 0.9961 7.4 5.2 7 0.9986 4.4 3.4 8 0.9976 5.7 4.5 9 0.9955 7.8 6.9 10 0.9980 5.3 4.8 7.1.2. Оценка значений констант ионизации для различных классов органических соединений Как известно, константа ионизации, К а (или обратный логарифм - logK a =pK a ) является одной из важнейших характеристик органических соеди- 233

ного цианинового красителя и с 7-8 внутренними нейронами для незамещенных<br />

в цепочке симметричных цианиновых красителей, при этом качество прогноза<br />

(среднеквадратичная ошибка 7-11 нм для общего случая и 3-5 нм для красителей<br />

с R 6 =H) значительно превосходит все то, что было достигнуто ранее (см.<br />

обсуждение выше) и обеспечивает достаточную точность для решения практических<br />

задач дизайна красителей с заданным положением длинноволновой полосы<br />

поглощения.<br />

Табл. 21. Результаты обучения ИНС для полной выборки (обозначения см. в тексте)<br />

n h R RMSE t (в нм) RMSE v (в нм)<br />

2 0.9884 13.5 10.0<br />

3 0.9910 11.9 9.3<br />

4 0.9912 11.8 8.3<br />

5 0.9924 10.9 7.5<br />

6 0.9924 10.9 8.0<br />

7 0.9931 10.4 9.0<br />

8 0.9923 11.0 7.4<br />

9 0.9923 11.0 7.4<br />

10 0.9928 10.6 7.0<br />

11 0.9921 11.1 8.5<br />

12 0.9930 10.6 9.4<br />

Табл. 22. Результаты обучения ИНС для выборки c R 6 =H (обозначения см. в тексте)<br />

n h R RMSE t (в нм) RMSE v (в нм)<br />

2 0.9959 7.5 4.9<br />

3 0.9958 7.6 4.7<br />

4 0.9966 6.8 4.5<br />

5 0.9954 8.0 5.5<br />

6 0.9961 7.4 5.2<br />

7 0.9986 4.4 3.4<br />

8 0.9976 5.7 4.5<br />

9 0.9955 7.8 6.9<br />

10 0.9980 5.3 4.8<br />

7.1.2. Оценка значений констант ионизации для различных классов органических<br />

соединений<br />

Как известно, константа ионизации, К а (или обратный логарифм -<br />

logK a =pK a ) является одной из важнейших характеристик органических соеди-<br />

233

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!