19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Как видно из Табл. 16 и Табл. 17, прогнозирующая способность построенных<br />

нейросетевых моделей заметно выше линейно-регрессионных. Кроме того,<br />

следует обратить внимание на тот факт, что (как и во всех других случаях,<br />

см. подразделы 6.3.2, 6.3.3 и 6.3.4) статистические показатели ансамблевой модели,<br />

усредняющей прогнозы по нейросетевому ансамблю, всегда заметно<br />

средних статистических показателей индивидуальных нейросетевых моделей в<br />

ансамбле. Это еще раз подтверждает известное из теории и практики машинного<br />

обучения утверждение о существенных преимуществах использования ансамблей<br />

нейросетевых моделей по сравнению с индивидуальными моделями.<br />

По-видимому, два основных фактора вносят вклад в это явление. Во-первых,<br />

усреднение по моделям, получаемым при разных разбивках базы данных позволяет<br />

эффективно использовать для обучения информацию из внутренних<br />

контрольных выборок, что эквивалентно увеличению эффективного размера<br />

обучающих выборок. Во-вторых, уменьшается вклад дисперсии в среднеквадратичную<br />

ошибку прогнозирования, поскольку дисперсия среднего нескольких<br />

случайных независимых переменных всегда ниже средней дисперсии каждой из<br />

этих переменных (т.е. происходит подавление «шума» при усреднении).<br />

Как известно, статистические показатели отдельно взятой модели при небольшом<br />

размере базы данных не может служить основой для вывода о качестве<br />

методики моделирования и иметь какую-либо статистическую значимость<br />

при отсутствии корректного скользящего контроля. Так, например, одна из полученных<br />

для данной базы данных статистических моделей характеризовалась<br />

следующими статистическими показателями: среднеквадратичная ошибка для<br />

обучающей выборки RMSE t равна 5.6 о С, для внутренней контрольной выборки<br />

RMSE v = 4.4 о С, а для внешней контрольной выборки RMSE p = 5.0 о С, что в несколько<br />

раз ниже усредненных показателям. Статистические показатели подобных<br />

индивидуальных моделей могут не характеризовать их истинную прогнозирующую<br />

способность, особенно когда в процессе их построения производится<br />

отбор дескрипторов. Хотя в отдельных публикациях, как, например [418],<br />

встречаются подобные результаты, ориентироваться на них нецелесообразно.<br />

Поэтому усредненные по множеству моделей результаты являются статистиче-<br />

221

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!