19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

бирался оптимальный в соответствии со средней ошибкой прогноза на внутренних<br />

контрольных выборках и отобранные из него наборы дескрипторов были<br />

далее использованы в исследовании при помощи многослойных нейронных<br />

сетей с обратным распространением ошибок.<br />

На следующем этапе для каждой разбивки базы данных строилось по 5<br />

нейросетевых моделей для каждого числа скрытых нейронов, которое варьировалось<br />

от 2 до 8. Обучение проводилось при помощи «обобщенного дельтаправила»<br />

(параметр скорости 0,25, момент 0,9) до достижения минимальной<br />

среднеквадратичной ошибки на внутренней контрольной выборке. После этого<br />

определялось оптимальное число скрытых нейронов, обеспечивающее наименьшие<br />

ошибки на внутренних контрольных выборках, и результаты прогнозирования<br />

полученных моделей для всех соединений усреднялись. В результате<br />

для каждого соединения были получены результаты прогноза ансамблевой модели,<br />

для оценки качества которой вычислялись следующие статистические показатели:<br />

множественный коэффициент корреляции R, а также среднеквадратичные<br />

значения ошибок для обучающей (RMSE t ), внутренней контрольной<br />

(RMSE v ) и внешней контрольной (RMSE p ) выборок. Для оценки эффекта перехода<br />

к ансамблевому моделированию проводился также расчет средних значений<br />

этих показателей, вычисленных для каждой из моделей до усреднения.<br />

6.3.2. Моделирование вязкости органических соединений<br />

При моделировании вязкости органических соединений была использована<br />

база данных, взятая из работы [410]. Из выборки, приведенной в работе<br />

[410], были исключены два соединения (266 и 267), для которых авторами ошибочно<br />

приведены одинаковые названия, но разные значения вязкости. Моделируемое<br />

свойство для данной базы представлено в виде десятичного логарифма<br />

от значения вязкости органического соединения, измеренного в единицах Па·с.<br />

При построении моделей вся база данных, состоящая из 367 органических соединений<br />

различных классов ((367 структур – линейные, разветвленные и циклические<br />

(моно- и бициклические) алканы, алкены и алкины, арены, спирты,<br />

207

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!