19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

6.3.5. Моделирование температуры кипения разнородных органических соединений<br />

Температура кипения моделировалась по выборке, содержащей разнородные<br />

органические соединения. В качестве источника данных был взят электронный<br />

каталог органических соединений фирмы Fluka [415], содержащий<br />

16 793 записей. База данных «структура-свойство» создавалась путем автоматизированного<br />

отбора записей из электронного каталога со следующими условиями:<br />

1) наличие в каталоге значения температуры кипения для данного соединения<br />

при атмосферном давлении; 2) чистота образца 99% и выше.<br />

В процессе построения моделей вся база данных разбивалась 10-ю разными<br />

способами на три выборки: 1) обучающую (409 соединений); 2) контрольную<br />

(50 соединений); и 3) выборку для оценки прогнозирующей способности<br />

(50 соединений). Согласно описанной выше схеме (см. подраздел 6.3.1),<br />

для базы данных был проведен расчет фрагментных дескрипторов с варьированием<br />

максимального размера фрагментов от 1 до 10 атомов. Далее для каждого<br />

из полученных дескрипторов были рассчитаны 4 нелинейные модификации.<br />

После этого, для 10 различных вариантов разбивки базы данных из первоначального<br />

набора с помощью процедуры быстрой пошаговой множественной<br />

линейной регрессии (БПМЛР) был проведен отбор дескрипторов. Усредненные<br />

результаты полученных линейно-регрессионных моделей (с нелинейными модификациями<br />

дескрипторов) для 10 наборов дескрипторов с переменным максимальным<br />

размером фрагментов (всего 100 моделей) представлены в Табл. 16.<br />

218

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!