Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
бирался оптимальный в соответствии со средней ошибкой прогноза на внутренних<br />
контрольных выборках и отобранные из него наборы дескрипторов были<br />
далее использованы в исследовании при помощи многослойных нейронных<br />
сетей с обратным распространением ошибок.<br />
На следующем этапе для каждой разбивки базы данных строилось по 5<br />
нейросетевых моделей для каждого числа скрытых нейронов, которое варьировалось<br />
от 2 до 8. Обучение проводилось при помощи «обобщенного дельтаправила»<br />
(параметр скорости 0,25, момент 0,9) до достижения минимальной<br />
среднеквадратичной ошибки на внутренней контрольной выборке. После этого<br />
определялось оптимальное число скрытых нейронов, обеспечивающее наименьшие<br />
ошибки на внутренних контрольных выборках, и результаты прогнозирования<br />
полученных моделей для всех соединений усреднялись. В результате<br />
для каждого соединения были получены результаты прогноза ансамблевой модели,<br />
для оценки качества которой вычислялись следующие статистические показатели:<br />
множественный коэффициент корреляции R, а также среднеквадратичные<br />
значения ошибок для обучающей (RMSE t ), внутренней контрольной<br />
(RMSE v ) и внешней контрольной (RMSE p ) выборок. Для оценки эффекта перехода<br />
к ансамблевому моделированию проводился также расчет средних значений<br />
этих показателей, вычисленных для каждой из моделей до усреднения.<br />
6.3.2. Моделирование вязкости органических соединений<br />
При моделировании вязкости органических соединений была использована<br />
база данных, взятая из работы [410]. Из выборки, приведенной в работе<br />
[410], были исключены два соединения (266 и 267), для которых авторами ошибочно<br />
приведены одинаковые названия, но разные значения вязкости. Моделируемое<br />
свойство для данной базы представлено в виде десятичного логарифма<br />
от значения вязкости органического соединения, измеренного в единицах Па·с.<br />
При построении моделей вся база данных, состоящая из 367 органических соединений<br />
различных классов ((367 структур – линейные, разветвленные и циклические<br />
(моно- и бициклические) алканы, алкены и алкины, арены, спирты,<br />
207