19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

являются слишком упрощенные модели, получаемые на небольших выборках<br />

(т.н. «недоподгонка данных», т.е. underfitting).<br />

Второй способ предотвращения «переучивания», в соответствии с общими<br />

положениями теории статистического обучения и основанного на ней принципа<br />

минимизации структурного риска, состоит во введении регуляризационного<br />

члена в минимизируемую в процессе обучения нейросети функцию риска.<br />

Частным случаем такого введения регуляризаторов в нейросеть является обучение<br />

«с забыванием», имеющее очевидные нейрофизиологические аналогии. В<br />

рамках нейросетевого программного комплекса NASAWIN нами был реализован<br />

и этот метод предотвращения переучивания за счет введения четырех разных<br />

регуляризаторов. Тем не менее, этот способ обладает существенным недостатком<br />

– для нахождения оптимального значения относительного веса регуляризатора<br />

в функции риска требуется многократно проводить полное обучение<br />

нейросети для разных его значений, что делает метод малопривлекательным<br />

с вычислительной точки зрения.<br />

Наконец, самым эффективным методом предотвращения «переучивания»<br />

является остановка обучения при достижении наименьшей среднеквадратичной<br />

ошибки прогнозирования на контрольной выборке. Показано, что подобная остановка<br />

обучения является одной из форм регуляризации [340]. Получаемые<br />

при этом модели сравнимы по прогнозирующей способности с моделями, при<br />

построении которых явным образом используются регуляризаторы, но при этом<br />

тратится вычислительных ресурсов значительно меньше, так как для построения<br />

модели требуется всего лишь однократное (и к тому же неполное) обучение<br />

нейросети. Именно эта схема предотвращения «переучивания» и является основной<br />

в программном комплексе NASAWIN, разработанном в рамках данной<br />

диссертационной работы.<br />

Тем не менее, в ходе практического применения вышеупомянутого метода<br />

остановки обучения обнаружилась проблема, суть которой состоит в том,<br />

что поскольку контрольная выборка используется для остановки обучения, т.е.<br />

для отбора модели, содержащаяся в ней информация в неявном виде частично<br />

попадает в отобранную модель, и поэтому такая выборка уже не может счи-<br />

114

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!