19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

После нахождения первоначального набора фрагментных дескрипторов,<br />

содержащих коды атомов в наиболее подробной классификации, программа генерирует<br />

фрагментные дескрипторы с различными уровнями обобщения классификации<br />

атомов (в соответствии с выбранной схемой, см. выше) и формирует<br />

канонические кодирующие строки для каждого из них. При этом просматриваются<br />

все возможные перестановки из группы автоморфизмов соответствующего<br />

фрагмента, и осуществляется выбор лексикографически наименьшей строки.<br />

Каждая каноническая строка сравнивается сначала с указанным пользователем<br />

либо сформированным вызывающей программой (NASAWIN,<br />

NETPROGNOSIS, и т.д.) списком масок (кодов) фрагментов, а затем она ищется<br />

в иерархически сформированном списке уже найденных фрагментов. Если такая<br />

строка соответствует какой-либо из масок и содержится в этом списке, то<br />

число вложений соответствующего фрагмента увеличивается на единицу, в<br />

противном случае, если строка соответствует какой-либо маске, но отсутствует<br />

в списке, то соответствующий фрагмент добавляется к списку найденных<br />

фрагментов с числом вложений, равным единице. Для нестандартных фрагментов<br />

число вложений определяется путем деления числа изоморфных вложений<br />

соответствующего подграфа в молекулярный граф на предварительно найденный<br />

порядок группы автоморфизмов этого подграфа. Кроме того, программа<br />

хранит в памяти список фрагментов, содержащих указатели на группы статистически<br />

идентичных дескрипторов (значения которых пропорциональны друг<br />

другу для всех уже пройденных химических структур), тогда как сам список и<br />

все группы реорганизуются после завершения анализа каждой из химических<br />

структур.<br />

После завершения первого прохода подсчитывается число появлений во<br />

всей базе данных для каждого из фрагментов, накопленных в иерархическом<br />

списке, и те фрагменты, которые содержатся в слишком малом числе соединений,<br />

и, соответственно, не удовлетворяют пороговому условию, заданному<br />

пользователем, удаляются из списка. Кроме того, из каждой группы статистически<br />

идентичных дескрипторов в списке оставляется только один. На втором<br />

проходе формируется файл с именами оставшихся дескрипторов и файл, со-<br />

157

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!