Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
f ( x, y) = ax + by (85) В этом случае только значения M x и M y будут ненулевыми (M x = a, M y = b), тогда как значения других статистических характеристик будут равно нулю (D x = 0, D y = 0, M xx = 0, M xy = 0, M yy = 0). Параболическая зависимость f ( x, y) + by 2 2 = ax (86) может быть выявлена по ненулевым значениям статистических характеристик M xx и M yy (M xx = a, M yy = b) и по нулевому значению M xy . Гиперболический характер зависимости f ( x, y) = axy (87) может быть определен по ненулевому значению M xy (M xy = a) и нулевым значениям M xx и M yy . Следует также отметить, что рассматриваемые статистические характеристики вполне могут быть использованы при дискретных и даже при булевых (индикаторных) значениях переменных, хотя характер интерпретации в последнем случае несколько иной: значения M x тогда обозначают вклад наличия определенного признака у объекта в значение функции (например, вклад фрагмента X химический структуры в значение какого-либо свойства химического соединения), а значения M xy – либо (если Y – непрерывная переменная, а X - булева) влияние признака X на M y , т.е. на характер зависимости функции от ее аргумента y (например, влияние наличие фрагмента X внутри химической структуры на зависимость какого-либо свойства химического соединения от значения дескриптора Y) либо (если X и Y – булевы переменные) вклад конъюнкции признаков X и Y в значение функции (например, вклад факта одновременного присутствия фрагментов X и Y в химическом соединении в значение его свойства). Рассмотрим теперь, каким образом введенные выше статистические характеристики могут быть использованы для интерпретации нейросетевой модели «структура-свойство», на примере предсказания положения длинноволновой полосы поглощения цианиновых красителей (I) в этаноле. 124
R 1 R 2 R 1 R 2 X R 6 X R N + 3 (CH) n (CH) n N R 3 R 4 R 5 R 5 (I) Подробно построение нейросетевой модели для этого случая рассмотрено в разделе 7.1.1 данной диссертационной работы, поэтому здесь мы остановимся лишь на возможности дать ей содержательную интерпретацию при помощи рассматриваемых статистических характеристик. Для целей интерпретации была отобрана модель, построенная при помощи трехслойной нейросети с 10 скрытыми нейронами, показавшая наилучшую прогнозирующую способность на контрольной выборке. В качестве дескрипторов использованы энергии HOMO и LUMO, рассчитанные при помощи полуэмпирического квантовохимического метода PM3, длина (число ацетиленовых фрагментов) полиметиновой цепочки N, а также индикаторные переменные X: X S (для X = S, см. структурную формулу), X N (для X = N), X O (для X = O), X CC (X = -CH=CH-), X CCC (X = C(CH 3 ) 2 ). R 4 Табл. 1. Значения статистических характеристик Дескриптор M x D x M xx M xy X E HOMO 97.8 37.6 0.293 -1.043 (Y = X N ) N 94.4 37.4 0.408 -0.692 (Y = X N ) E LUMO -39.3 17.2 0.767 0.521 (Y = E HOMO ) X N -26.8 9.1 0.522 -1.043 (Y = E HOMO ) X O -23.1 9.0 0.082 -0.278 (Y = E HOMO ) X S -20.3 7.7 0.031 0.277 (Y = X N ) X CCC -10.6 4.1 0.019 -0.153 (Y = E HOMO ) X CC 3.7 2.1 -0.041 -0.425 (Y = E HOMO ) 125
- Page 73 and 74: В качестве характе
- Page 75 and 76: Некоторые типы ЦАФ
- Page 77 and 78: кроме того, они сно
- Page 79 and 80: Следует упомянуть
- Page 81 and 82: зисных графов, пред
- Page 83 and 84: рой равен 1 только в
- Page 85 and 86: множества различны
- Page 87 and 88: при проведении вир
- Page 89 and 90: 21 01 12 12 21 01 Рис. 17. Ре
- Page 91 and 92: ределенных атомных
- Page 93 and 94: элементам, что може
- Page 95 and 96: наличие или отсутс
- Page 97 and 98: использовались в н
- Page 99 and 100: ложенные в 1985 г. ато
- Page 101 and 102: 2.3. Ограничения фра
- Page 103 and 104: ГЛАВА 3. МАТЕМАТИЧЕ
- Page 105 and 106: качестве меток исп
- Page 107 and 108: ной нумерации граф
- Page 109 and 110: нейронной сети с пр
- Page 111 and 112: ГЛАВА 4. РАЗРАБОТКА
- Page 113 and 114: линейные комбинаци
- Page 115 and 116: таться внешней по о
- Page 117 and 118: Предсказанное знач
- Page 119 and 120: рипторе, то он пере
- Page 121 and 122: Для решения этой пр
- Page 123: • D x - среднее значе
- Page 127 and 128: В соответствии с вы
- Page 129 and 130: зовании рассмотрен
- Page 131 and 132: R4 R5 R3 R6 N (a) R2 6 N 2 6 2 6 2
- Page 133 and 134: f ( x, y) ≡ f ( y, x) ⇔ f ( x,
- Page 135 and 136: R3 R2 R5 R6 Общая формул
- Page 137 and 138: ко, эта разница все
- Page 139 and 140: переставленными эк
- Page 141 and 142: лей приведен в рабо
- Page 143 and 144: деленными» атомами
- Page 145 and 146: 5.1.2. Иерархическая
- Page 147 and 148: водородного соседа
- Page 149 and 150: Атом кислорода в со
- Page 151 and 152: PA1 -PH 2 Атом фосфора,
- Page 153 and 154: Br2 -Br= Формально нез
- Page 155 and 156: то в дальнейшем буд
- Page 157 and 158: После нахождения п
- Page 159 and 160: 5.2.1. Прогнозировани
- Page 161 and 162: зей, а также учитыв
- Page 163 and 164: Эксперимент 50 40 30 20
- Page 165 and 166: Построение QSPR-моде
- Page 167 and 168: работе [268], но с при
- Page 169 and 170: ляются удобным инс
- Page 171 and 172: чета этого свойств
- Page 173 and 174: База 2 (88 соединений
R 1<br />
R 2<br />
R 1<br />
R 2<br />
X R 6 X<br />
R N +<br />
3 (CH) n (CH) n N<br />
R 3<br />
R 4 R 5 R 5<br />
(I)<br />
Подробно построение нейросетевой модели для этого случая рассмотрено<br />
в разделе 7.1.1 данной диссертационной работы, поэтому здесь мы остановимся<br />
лишь на возможности дать ей содержательную интерпретацию при помощи<br />
рассматриваемых статистических характеристик. Для целей интерпретации была<br />
отобрана модель, построенная при помощи трехслойной нейросети с 10<br />
скрытыми нейронами, показавшая наилучшую прогнозирующую способность<br />
на контрольной выборке. В качестве дескрипторов использованы энергии<br />
HOMO и LUMO, рассчитанные при помощи полуэмпирического квантовохимического<br />
метода PM3, длина (число ацетиленовых фрагментов) полиметиновой<br />
цепочки N, а также индикаторные переменные X: X S (для X = S, см.<br />
структурную формулу), X N (для X = N), X O (для X = O), X CC (X = -CH=CH-),<br />
X CCC (X = C(CH 3 ) 2 ).<br />
R 4<br />
Табл. 1. Значения статистических характеристик<br />
Дескриптор M x D x M xx M xy<br />
X<br />
E HOMO 97.8 37.6 0.293 -1.043 (Y = X N )<br />
N 94.4 37.4 0.408 -0.692 (Y = X N )<br />
E LUMO -39.3 17.2 0.767 0.521 (Y = E HOMO )<br />
X N -26.8 9.1 0.522 -1.043 (Y =<br />
E HOMO )<br />
X O -23.1 9.0 0.082 -0.278 (Y =<br />
E HOMO )<br />
X S -20.3 7.7 0.031 0.277 (Y = X N )<br />
X CCC -10.6 4.1 0.019 -0.153 (Y =<br />
E HOMO )<br />
X CC 3.7 2.1 -0.041 -0.425 (Y =<br />
E HOMO )<br />
125