Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
8.2.1. Представление химической информации NASAWIN может работать с химическими базами данных, записанными как в стандартном SDF-формате, поддерживаемом основными существующими коммерческими программами, так и в SET-STR-формате, который поддерживается рядом программ и программных комплексов, разработанных на химическом факультете МГУ (в частности молекулярный редактор «MOLED», программный комплекс «EMMA», генератор химических структур «GOLD», многочисленные дескрипторные блоки и т.д.). При необходимости комплекс «NASAWIN» без явного вмешательства пользователей сам производит конвертацию между необходимыми форматами, благодаря чему обеспечивается его интегрированная работа с многочисленным ориентированным на химию программным обеспечением. Кроме того, «NASAWIN» содержит и самостоятельные средства просмотра используемых баз данных. Также важно отметить, что «NASAWIN» позволяет работать и с «разреженными» базами данных. Такие базы очень часто встречаются в химии, т.к. часто не для всех соединений, представленных в базе данных, измерены все значения свойств или получены все значения дескрипторов. 8.2.2. Интеграция с программными компонентами, осуществляющими расчет дескрипторов химических структур Управляющая программа «NASAWIN» обеспечивает согласованную работу с гибким набором многочисленных автономных программных компонент, проводящих расчет разнообразных дескрипторов химических структур: подструктурных, топологических, позиционных, физико-химических и квантовохимических. Кроме того, «NASAWIN» предоставляет встроенную библиотеку, облегчающую разработку новых дескрипторных блоков. 298
8.2.3. Химически-ориентированная визуализация При обработке химических баз данных очень важно знать, какая химическая структура скрывается за каждой записью в базе данных и за каждой точкой на графиках зависимостей, из-за чего использование для этой цели статистических либо нейросетевых пакетов общего назначения часто оказывается крайне неудобным и неэффективным. «NASAWIN» позволяет абсолютно на всех этапах взаимодействия пользователя с программой видеть структурные формулы химических соединений прямо в диалоговых окнах или в окнах визуализации хода и результатов обучения, что резко повышает удобство и эффективность работы с программой. 8.2.4. Модификация дескрипторов и свойств В настоящее время «NASAWIN» поддерживает 8 типов модификаций дескрипторов. Кроме общеупотребительных типов модификаций дескрипторов (взятие квадрата, квадратного корня, логарифма, обратного числа и порогового индикатора) предусмотрены и специфические для химии типы, вычисляемые с учетом количества неводородных атомов в молекуле («деление на число атомов», «умножение на число атомов» и «обратная величина, умноженная на число атомов»). Также возможны следующие 3 вида модификаций для исследуемых свойств: взятие обратного числа, взятие логарифма, а также использование специфического типа модификации «логарифм от обратной величины», что часто бывает необходимо при обработке данных по биологической активности химических соединений. 8.2.5. Предварительный отбор дескрипторов При использовании подструктурных дескрипторов при поиске соотношений «структура-свойство» практически всегда оказывается, что их значения линейно взаимосвязаны. Для этого случая в «NASAWIN» специально предусмот- 299
- Page 247 and 248: сивов разрозненных
- Page 249 and 250: используются как т
- Page 251 and 252: были модифицирован
- Page 253 and 254: зависимости давлен
- Page 255 and 256: Объединенный набор
- Page 257 and 258: Оба механизма вклю
- Page 259 and 260: творителя, а также
- Page 261 and 262: Табл. 29. Характерис
- Page 263 and 264: набора дескрипторо
- Page 265 and 266: угодно сложные зав
- Page 267 and 268: симостей «структур
- Page 269 and 270: лей, хотя все модел
- Page 271 and 272: одновременно решае
- Page 273 and 274: Как видно приведен
- Page 275 and 276: принципе гарантиро
- Page 277 and 278: мерации атомов дос
- Page 279 and 280: бор сигналов, соотв
- Page 281 and 282: только с атомных се
- Page 283 and 284: 7.4.3. Примеры разных
- Page 285 and 286: Рис. 66. Минимальная
- Page 287 and 288: ров» ведет к ухудше
- Page 289 and 290: бензол, было отброш
- Page 291 and 292: на атому. После 4000 э
- Page 293 and 294: фов), то и все нейро
- Page 295 and 296: проведения линейно
- Page 297: тате чего NASAWIN прев
- Page 301 and 302: 8.2.7. Нейросетевые п
- Page 303 and 304: 8.2.11. Кластеризация
- Page 305 and 306: нейросетевом прогр
- Page 307 and 308: 18 p1_Nlp Количество не
- Page 309 and 310: 43 p 4 _ SPR = ∑ R( a ) ⋅ R( a
- Page 311 and 312: делей. Программа та
- Page 313 and 314: позволяющая прогно
- Page 315 and 316: ЛИТЕРАТУРА 1. Гилле
- Page 317 and 318: 31. Aoyama T.; Ichikawa H. Neural N
- Page 319 and 320: 54. Karelson M.; Dobchev D.A.; Kuls
- Page 321 and 322: 79. Carpenter G.A.; Grossberg S. A
- Page 323 and 324: 103. Ежов А.А.; Токаев
- Page 325 and 326: 126. Benson S.W.; Buss J.H. Additiv
- Page 327 and 328: 148. Fisanick W.; Lipkus A.H.; Rusi
- Page 329 and 330: 169. Klopman G.; Macina O.T.; Levin
- Page 331 and 332: 189. Nilakantan R.; Bauman N.; Dixo
- Page 333 and 334: 209. Татевский В.М. Кл
- Page 335 and 336: ces and Related Descriptors in QSAR
- Page 337 and 338: 248. MOE, Molecular Operating Envir
- Page 339 and 340: 269. Estrada E.; Gonzalez H. What A
- Page 341 and 342: 288. Saigo H.; Kadowaki T.; Tsuda K
- Page 343 and 344: 309. Vladutz G. Modern Approaches t
- Page 345 and 346: 331. Rouvray D.H. Predicting Chemis
- Page 347 and 348: 352. Корн Г.; Корн Т. С
8.2.1. Представление химической информации<br />
NASAWIN может работать с химическими базами данных, записанными<br />
как в стандартном SDF-формате, поддерживаемом основными существующими<br />
коммерческими программами, так и в SET-STR-формате, который поддерживается<br />
рядом программ и программных комплексов, разработанных на химическом<br />
факультете МГУ (в частности молекулярный редактор «MOLED», программный<br />
комплекс «EMMA», генератор химических структур «GOLD», многочисленные<br />
дескрипторные блоки и т.д.). При необходимости комплекс<br />
«NASAWIN» без явного вмешательства пользователей сам производит конвертацию<br />
между необходимыми форматами, благодаря чему обеспечивается его<br />
интегрированная работа с многочисленным ориентированным на химию программным<br />
обеспечением. Кроме того, «NASAWIN» содержит и самостоятельные<br />
средства просмотра используемых баз данных.<br />
Также важно отметить, что «NASAWIN» позволяет работать и с «разреженными»<br />
базами данных. Такие базы очень часто встречаются в химии, т.к.<br />
часто не для всех соединений, представленных в базе данных, измерены все<br />
значения свойств или получены все значения дескрипторов.<br />
8.2.2. Интеграция с программными компонентами, осуществляющими расчет<br />
дескрипторов химических структур<br />
Управляющая программа «NASAWIN» обеспечивает согласованную работу<br />
с гибким набором многочисленных автономных программных компонент,<br />
проводящих расчет разнообразных дескрипторов химических структур: подструктурных,<br />
топологических, позиционных, физико-химических и квантовохимических.<br />
Кроме того, «NASAWIN» предоставляет встроенную библиотеку,<br />
облегчающую разработку новых дескрипторных блоков.<br />
298