На правах рукописи

На правах рукописи На правах рукописи

cdn.scipeople.com
from cdn.scipeople.com More from this publisher
19.11.2014 Views

8.2.1. Представление химической информации NASAWIN может работать с химическими базами данных, записанными как в стандартном SDF-формате, поддерживаемом основными существующими коммерческими программами, так и в SET-STR-формате, который поддерживается рядом программ и программных комплексов, разработанных на химическом факультете МГУ (в частности молекулярный редактор «MOLED», программный комплекс «EMMA», генератор химических структур «GOLD», многочисленные дескрипторные блоки и т.д.). При необходимости комплекс «NASAWIN» без явного вмешательства пользователей сам производит конвертацию между необходимыми форматами, благодаря чему обеспечивается его интегрированная работа с многочисленным ориентированным на химию программным обеспечением. Кроме того, «NASAWIN» содержит и самостоятельные средства просмотра используемых баз данных. Также важно отметить, что «NASAWIN» позволяет работать и с «разреженными» базами данных. Такие базы очень часто встречаются в химии, т.к. часто не для всех соединений, представленных в базе данных, измерены все значения свойств или получены все значения дескрипторов. 8.2.2. Интеграция с программными компонентами, осуществляющими расчет дескрипторов химических структур Управляющая программа «NASAWIN» обеспечивает согласованную работу с гибким набором многочисленных автономных программных компонент, проводящих расчет разнообразных дескрипторов химических структур: подструктурных, топологических, позиционных, физико-химических и квантовохимических. Кроме того, «NASAWIN» предоставляет встроенную библиотеку, облегчающую разработку новых дескрипторных блоков. 298

8.2.3. Химически-ориентированная визуализация При обработке химических баз данных очень важно знать, какая химическая структура скрывается за каждой записью в базе данных и за каждой точкой на графиках зависимостей, из-за чего использование для этой цели статистических либо нейросетевых пакетов общего назначения часто оказывается крайне неудобным и неэффективным. «NASAWIN» позволяет абсолютно на всех этапах взаимодействия пользователя с программой видеть структурные формулы химических соединений прямо в диалоговых окнах или в окнах визуализации хода и результатов обучения, что резко повышает удобство и эффективность работы с программой. 8.2.4. Модификация дескрипторов и свойств В настоящее время «NASAWIN» поддерживает 8 типов модификаций дескрипторов. Кроме общеупотребительных типов модификаций дескрипторов (взятие квадрата, квадратного корня, логарифма, обратного числа и порогового индикатора) предусмотрены и специфические для химии типы, вычисляемые с учетом количества неводородных атомов в молекуле («деление на число атомов», «умножение на число атомов» и «обратная величина, умноженная на число атомов»). Также возможны следующие 3 вида модификаций для исследуемых свойств: взятие обратного числа, взятие логарифма, а также использование специфического типа модификации «логарифм от обратной величины», что часто бывает необходимо при обработке данных по биологической активности химических соединений. 8.2.5. Предварительный отбор дескрипторов При использовании подструктурных дескрипторов при поиске соотношений «структура-свойство» практически всегда оказывается, что их значения линейно взаимосвязаны. Для этого случая в «NASAWIN» специально предусмот- 299

8.2.1. Представление химической информации<br />

NASAWIN может работать с химическими базами данных, записанными<br />

как в стандартном SDF-формате, поддерживаемом основными существующими<br />

коммерческими программами, так и в SET-STR-формате, который поддерживается<br />

рядом программ и программных комплексов, разработанных на химическом<br />

факультете МГУ (в частности молекулярный редактор «MOLED», программный<br />

комплекс «EMMA», генератор химических структур «GOLD», многочисленные<br />

дескрипторные блоки и т.д.). При необходимости комплекс<br />

«NASAWIN» без явного вмешательства пользователей сам производит конвертацию<br />

между необходимыми форматами, благодаря чему обеспечивается его<br />

интегрированная работа с многочисленным ориентированным на химию программным<br />

обеспечением. Кроме того, «NASAWIN» содержит и самостоятельные<br />

средства просмотра используемых баз данных.<br />

Также важно отметить, что «NASAWIN» позволяет работать и с «разреженными»<br />

базами данных. Такие базы очень часто встречаются в химии, т.к.<br />

часто не для всех соединений, представленных в базе данных, измерены все<br />

значения свойств или получены все значения дескрипторов.<br />

8.2.2. Интеграция с программными компонентами, осуществляющими расчет<br />

дескрипторов химических структур<br />

Управляющая программа «NASAWIN» обеспечивает согласованную работу<br />

с гибким набором многочисленных автономных программных компонент,<br />

проводящих расчет разнообразных дескрипторов химических структур: подструктурных,<br />

топологических, позиционных, физико-химических и квантовохимических.<br />

Кроме того, «NASAWIN» предоставляет встроенную библиотеку,<br />

облегчающую разработку новых дескрипторных блоков.<br />

298

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!