На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

f ( x, y) = ax + by (85) В этом случае только значения M x и M y будут ненулевыми (M x = a, M y = b), тогда как значения других статистических характеристик будут равно нулю (D x = 0, D y = 0, M xx = 0, M xy = 0, M yy = 0). Параболическая зависимость f ( x, y) + by 2 2 = ax (86) может быть выявлена по ненулевым значениям статистических характеристик M xx и M yy (M xx = a, M yy = b) и по нулевому значению M xy . Гиперболический характер зависимости f ( x, y) = axy (87) может быть определен по ненулевому значению M xy (M xy = a) и нулевым значениям M xx и M yy . Следует также отметить, что рассматриваемые статистические характеристики вполне могут быть использованы при дискретных и даже при булевых (индикаторных) значениях переменных, хотя характер интерпретации в последнем случае несколько иной: значения M x тогда обозначают вклад наличия определенного признака у объекта в значение функции (например, вклад фрагмента X химический структуры в значение какого-либо свойства химического соединения), а значения M xy – либо (если Y – непрерывная переменная, а X - булева) влияние признака X на M y , т.е. на характер зависимости функции от ее аргумента y (например, влияние наличие фрагмента X внутри химической структуры на зависимость какого-либо свойства химического соединения от значения дескриптора Y) либо (если X и Y – булевы переменные) вклад конъюнкции признаков X и Y в значение функции (например, вклад факта одновременного присутствия фрагментов X и Y в химическом соединении в значение его свойства). Рассмотрим теперь, каким образом введенные выше статистические характеристики могут быть использованы для интерпретации нейросетевой модели «структура-свойство», на примере предсказания положения длинноволновой полосы поглощения цианиновых красителей (I) в этаноле. 124

R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH) n (CH) n N R 3 R 4 R 5 R 5 (I) Подробно построение нейросетевой модели для этого случая рассмотрено в разделе 7.1.1 данной диссертационной работы, поэтому здесь мы остановимся лишь на возможности дать ей содержательную интерпретацию при помощи рассматриваемых статистических характеристик. Для целей интерпретации была отобрана модель, построенная при помощи трехслойной нейросети с 10 скрытыми нейронами, показавшая наилучшую прогнозирующую способность на контрольной выборке. В качестве дескрипторов использованы энергии HOMO и LUMO, рассчитанные при помощи полуэмпирического квантовохимического метода PM3, длина (число ацетиленовых фрагментов) полиметиновой цепочки N, а также индикаторные переменные X: X S (для X = S, см. структурную формулу), X N (для X = N), X O (для X = O), X CC (X = -CH=CH-), X CCC (X = C(CH 3 ) 2 ). R 4 Табл. 1. Значения статистических характеристик Дескриптор M x D x M xx M xy X E HOMO 97.8 37.6 0.293 -1.043 (Y = X N ) N 94.4 37.4 0.408 -0.692 (Y = X N ) E LUMO -39.3 17.2 0.767 0.521 (Y = E HOMO ) X N -26.8 9.1 0.522 -1.043 (Y = E HOMO ) X O -23.1 9.0 0.082 -0.278 (Y = E HOMO ) X S -20.3 7.7 0.031 0.277 (Y = X N ) X CCC -10.6 4.1 0.019 -0.153 (Y = E HOMO ) X CC 3.7 2.1 -0.041 -0.425 (Y = E HOMO ) 125

R 1<br />

R 2<br />

R 1<br />

R 2<br />

X R 6 X<br />

R N +<br />

3 (CH) n (CH) n N<br />

R 3<br />

R 4 R 5 R 5<br />

(I)<br />

Подробно построение нейросетевой модели для этого случая рассмотрено<br />

в разделе 7.1.1 данной диссертационной работы, поэтому здесь мы остановимся<br />

лишь на возможности дать ей содержательную интерпретацию при помощи<br />

рассматриваемых статистических характеристик. Для целей интерпретации была<br />

отобрана модель, построенная при помощи трехслойной нейросети с 10<br />

скрытыми нейронами, показавшая наилучшую прогнозирующую способность<br />

на контрольной выборке. В качестве дескрипторов использованы энергии<br />

HOMO и LUMO, рассчитанные при помощи полуэмпирического квантовохимического<br />

метода PM3, длина (число ацетиленовых фрагментов) полиметиновой<br />

цепочки N, а также индикаторные переменные X: X S (для X = S, см.<br />

структурную формулу), X N (для X = N), X O (для X = O), X CC (X = -CH=CH-),<br />

X CCC (X = C(CH 3 ) 2 ).<br />

R 4<br />

Табл. 1. Значения статистических характеристик<br />

Дескриптор M x D x M xx M xy<br />

X<br />

E HOMO 97.8 37.6 0.293 -1.043 (Y = X N )<br />

N 94.4 37.4 0.408 -0.692 (Y = X N )<br />

E LUMO -39.3 17.2 0.767 0.521 (Y = E HOMO )<br />

X N -26.8 9.1 0.522 -1.043 (Y =<br />

E HOMO )<br />

X O -23.1 9.0 0.082 -0.278 (Y =<br />

E HOMO )<br />

X S -20.3 7.7 0.031 0.277 (Y = X N )<br />

X CCC -10.6 4.1 0.019 -0.153 (Y =<br />

E HOMO )<br />

X CC 3.7 2.1 -0.041 -0.425 (Y =<br />

E HOMO )<br />

125

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!