Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
являются слишком упрощенные модели, получаемые на небольших выборках<br />
(т.н. «недоподгонка данных», т.е. underfitting).<br />
Второй способ предотвращения «переучивания», в соответствии с общими<br />
положениями теории статистического обучения и основанного на ней принципа<br />
минимизации структурного риска, состоит во введении регуляризационного<br />
члена в минимизируемую в процессе обучения нейросети функцию риска.<br />
Частным случаем такого введения регуляризаторов в нейросеть является обучение<br />
«с забыванием», имеющее очевидные нейрофизиологические аналогии. В<br />
рамках нейросетевого программного комплекса NASAWIN нами был реализован<br />
и этот метод предотвращения переучивания за счет введения четырех разных<br />
регуляризаторов. Тем не менее, этот способ обладает существенным недостатком<br />
– для нахождения оптимального значения относительного веса регуляризатора<br />
в функции риска требуется многократно проводить полное обучение<br />
нейросети для разных его значений, что делает метод малопривлекательным<br />
с вычислительной точки зрения.<br />
Наконец, самым эффективным методом предотвращения «переучивания»<br />
является остановка обучения при достижении наименьшей среднеквадратичной<br />
ошибки прогнозирования на контрольной выборке. Показано, что подобная остановка<br />
обучения является одной из форм регуляризации [340]. Получаемые<br />
при этом модели сравнимы по прогнозирующей способности с моделями, при<br />
построении которых явным образом используются регуляризаторы, но при этом<br />
тратится вычислительных ресурсов значительно меньше, так как для построения<br />
модели требуется всего лишь однократное (и к тому же неполное) обучение<br />
нейросети. Именно эта схема предотвращения «переучивания» и является основной<br />
в программном комплексе NASAWIN, разработанном в рамках данной<br />
диссертационной работы.<br />
Тем не менее, в ходе практического применения вышеупомянутого метода<br />
остановки обучения обнаружилась проблема, суть которой состоит в том,<br />
что поскольку контрольная выборка используется для остановки обучения, т.е.<br />
для отбора модели, содержащаяся в ней информация в неявном виде частично<br />
попадает в отобранную модель, и поэтому такая выборка уже не может счи-<br />
114