19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

рена возможность формирования такого поднабора дескрипторов, внутри которого<br />

отсутствует линейная попарная зависимость между ними, что часто позволяет<br />

резко сократить число используемых дескрипторов. Кроме того, во многих<br />

задачах прогнозирования физико-химических свойств химических соединений<br />

степень нелинейности их зависимости от значений дескрипторов оказывается<br />

не очень высокой, хотя и существенной для максимально точного прогнозирования,<br />

что дает возможность использовать быстрые линейно-регрессионные<br />

методы отбора дескрипторов. Хотя в общем случае сформированный таким образом<br />

набор отобранных дескрипторов может оказаться неоптимальным, в реальных<br />

задачах по изучению зависимости «структура-свойство» (когда число<br />

подструктурных дескрипторов может составить тысячи и даже десятки тысяч,<br />

что делает проблематичным использование чистых нейросетевых методов отбора<br />

дескрипторов) такой подход часто оказывается единственно возможным.<br />

Для обеспечения этого в «NASAWIN» предусмотрена специальная интерактивная<br />

процедура пошаговой линейной регрессии (БПМЛР, см. подраздел 4.1.5),<br />

которая позволяет пользователю быстро сформировать небольшой набор ценных<br />

дескрипторов, который в дальнейшем может быть использован для обучения<br />

нейронной сети.<br />

8.2.6. Построение классификационных моделей структура-активность<br />

Очень часто, особенно при работе с биологическими данными, значения<br />

свойств представлены на качественном уровне (1 - есть активность, 0 - нет активности).<br />

Программа «NASAWIN» способна самостоятельно различать типы<br />

представления исходных данных и в зависимости от этого строить классификационные<br />

либо регрессионные. Кроме того, предусмотрена возможность ручного<br />

разбиения массива исследуемых соединений по каждому конкретному свойству<br />

на активные и неактивные, с последующим построением классификационных<br />

моделей. Пользователь может изменять пороговую величину для такого<br />

разбиения. Подчеркнем, что в данную диссертационную работу включено использование<br />

только регрессионных методов.<br />

300

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!