Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Как видно из Табл. 16 и Табл. 17, прогнозирующая способность построенных<br />
нейросетевых моделей заметно выше линейно-регрессионных. Кроме того,<br />
следует обратить внимание на тот факт, что (как и во всех других случаях,<br />
см. подразделы 6.3.2, 6.3.3 и 6.3.4) статистические показатели ансамблевой модели,<br />
усредняющей прогнозы по нейросетевому ансамблю, всегда заметно<br />
средних статистических показателей индивидуальных нейросетевых моделей в<br />
ансамбле. Это еще раз подтверждает известное из теории и практики машинного<br />
обучения утверждение о существенных преимуществах использования ансамблей<br />
нейросетевых моделей по сравнению с индивидуальными моделями.<br />
По-видимому, два основных фактора вносят вклад в это явление. Во-первых,<br />
усреднение по моделям, получаемым при разных разбивках базы данных позволяет<br />
эффективно использовать для обучения информацию из внутренних<br />
контрольных выборок, что эквивалентно увеличению эффективного размера<br />
обучающих выборок. Во-вторых, уменьшается вклад дисперсии в среднеквадратичную<br />
ошибку прогнозирования, поскольку дисперсия среднего нескольких<br />
случайных независимых переменных всегда ниже средней дисперсии каждой из<br />
этих переменных (т.е. происходит подавление «шума» при усреднении).<br />
Как известно, статистические показатели отдельно взятой модели при небольшом<br />
размере базы данных не может служить основой для вывода о качестве<br />
методики моделирования и иметь какую-либо статистическую значимость<br />
при отсутствии корректного скользящего контроля. Так, например, одна из полученных<br />
для данной базы данных статистических моделей характеризовалась<br />
следующими статистическими показателями: среднеквадратичная ошибка для<br />
обучающей выборки RMSE t равна 5.6 о С, для внутренней контрольной выборки<br />
RMSE v = 4.4 о С, а для внешней контрольной выборки RMSE p = 5.0 о С, что в несколько<br />
раз ниже усредненных показателям. Статистические показатели подобных<br />
индивидуальных моделей могут не характеризовать их истинную прогнозирующую<br />
способность, особенно когда в процессе их построения производится<br />
отбор дескрипторов. Хотя в отдельных публикациях, как, например [418],<br />
встречаются подобные результаты, ориентироваться на них нецелесообразно.<br />
Поэтому усредненные по множеству моделей результаты являются статистиче-<br />
221