Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
После нахождения первоначального набора фрагментных дескрипторов,<br />
содержащих коды атомов в наиболее подробной классификации, программа генерирует<br />
фрагментные дескрипторы с различными уровнями обобщения классификации<br />
атомов (в соответствии с выбранной схемой, см. выше) и формирует<br />
канонические кодирующие строки для каждого из них. При этом просматриваются<br />
все возможные перестановки из группы автоморфизмов соответствующего<br />
фрагмента, и осуществляется выбор лексикографически наименьшей строки.<br />
Каждая каноническая строка сравнивается сначала с указанным пользователем<br />
либо сформированным вызывающей программой (NASAWIN,<br />
NETPROGNOSIS, и т.д.) списком масок (кодов) фрагментов, а затем она ищется<br />
в иерархически сформированном списке уже найденных фрагментов. Если такая<br />
строка соответствует какой-либо из масок и содержится в этом списке, то<br />
число вложений соответствующего фрагмента увеличивается на единицу, в<br />
противном случае, если строка соответствует какой-либо маске, но отсутствует<br />
в списке, то соответствующий фрагмент добавляется к списку найденных<br />
фрагментов с числом вложений, равным единице. Для нестандартных фрагментов<br />
число вложений определяется путем деления числа изоморфных вложений<br />
соответствующего подграфа в молекулярный граф на предварительно найденный<br />
порядок группы автоморфизмов этого подграфа. Кроме того, программа<br />
хранит в памяти список фрагментов, содержащих указатели на группы статистически<br />
идентичных дескрипторов (значения которых пропорциональны друг<br />
другу для всех уже пройденных химических структур), тогда как сам список и<br />
все группы реорганизуются после завершения анализа каждой из химических<br />
структур.<br />
После завершения первого прохода подсчитывается число появлений во<br />
всей базе данных для каждого из фрагментов, накопленных в иерархическом<br />
списке, и те фрагменты, которые содержатся в слишком малом числе соединений,<br />
и, соответственно, не удовлетворяют пороговому условию, заданному<br />
пользователем, удаляются из списка. Кроме того, из каждой группы статистически<br />
идентичных дескрипторов в списке оставляется только один. На втором<br />
проходе формируется файл с именами оставшихся дескрипторов и файл, со-<br />
157