21.07.2015 Views

1. Научни трудове, включени - Технически Университет - София

1. Научни трудове, включени - Технически Университет - София

1. Научни трудове, включени - Технически Университет - София

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Conference on Systems, Man and Cybernetics, SMC’03, vol. 2, pp. 1636-1641, Oct. 2003,Washington DC, USA (публикуван в IEEE Xplore).Резюме. Представени са свойствата на нов алгоритъм за адаптивно обучение при аналоговитемногослойни невронни мрежи. Той прилага стратегията за управление в режим на хлъзгане.Множеството на нулевите нива на грешката се разглежда като повърхнина на хлъзгане впространството на обучаваните параметри на невронната мрежа. Траектория в режим на хлъзгане сепредизвиква и достига за крайно време върху такава повърхнина на хлъзгане. В доклада допълнително еанализирана работата на алгоритъма за обучение при добавен към входовете на мрежата ограниченшум. Проведени са симулационни експерименти, където обучаващият алгоритъм е приложен за онлайнапроксимация на немонотонна функция и за идентификация на динамиката на манипулатор.Обучаващите се мрежови структури наследяват някои от преимуществата на системите спроменлива структура като робастност и висока скорост на обучение.<strong>1.</strong>21 A. V. Topalov, O. Kaynak, and N. G. Shakev, “Neural Network Identification, PredictiveModeling and Control with a Sliding Mode Learning Mechanism: an Application to theRobotic Manipulators”, Proc. of First International IEEE Symposium “Intelligent Systems”,vol. 1, pp. 102-107, Sept. 2002, Varna, Bulgaria (публикуван в IEEE Xplore).Резюме. Представени са свойствата на нова адаптивна схема за невронно управление на нелинейниобекти, реализираща подобен на ПИД закон. Настройката на регулатора се базира върху оценка нагрешката в управляващия сигнал, определена с една стъпка напред чрез невронен предсказващ модел наобекта. Алгоритъм за адаптация, основан на метода за управление в режим на хлъзгане е приложенедновременно по отношение на модела и на регулатора. Разработената схема за управление есимулирана и е оценен ефекта от прилагането и при траекторно управление на прост манипулационенробот с две степени на свобода. Резултатите показват, че и двете обучаващи се структури,невронният предсказващ модел и регулаторът, наследяват някои от предимствата на метода зауправление в режим на хлъзгане - робастност и висока скорост на обучение.<strong>1.</strong>22 N. G. Shakev, A. V. Topalov, O. Kaynak, and H. L. Akin, “Reactive-behavior Learningof Quadruped Robots Playing Soccer”, Proc. of First International Conference onMechatronics, ITM'01, pp. 149-154, October 1-3, 2001, Istanbul, Turkey (публикуван вCiteSeer x Digital Library)Резюме. Футболът за роботи може да бъде отнесен към класа на многоагентните системи и включварешаването на редица сложни задачи. Играещите в един отбор роботи трябва да си сътрудничат завкарването на топката в противниковата врата и в същото време да защитават своята собственаврата. Предмет на изследването са проблеми, свързани с научаване и прилагане на реактивни поведенияпри агентите-роботи играещи футбол. Кратко е представена проектираната за отбора от роботикучета„Церберус’01“ цялостна система за управление. Отборът участва, в рамките на Лигата накрачещите роботи нa Sony, в състезанията RoboCup 2001 проведени в гр. Сиатъл, САЩ. Анализира серазработеното реактивно поведение за прехващане на движеща се топка при едновременно избягванена стълкновения с други играещи роботи и със стените на игралното поле. За реализиране на товаповедение е разработен и обучен размит невроннен генератор на траектория (FNTG). За обучение натраекторния генератор е предложен метод, използващ генетични алгоритми (GAs).<strong>1.</strong>23 A. V. Topalov, K. -Ch. Kim, J. -H. Kim, and B. -K. Lee, “Fast Genetic On-LineLearning Algorithm for Neural Network and Its Application to Temperature Control”, Proc.of IEEE Int. Conf. on Evolutionary Computation, pp.649-654, May 1996, Nagoya, Japan(публикуван в IEEE Xplore).Резюме. В този доклад е предложен метод за бързо онлайн обучение на структури на невронни мрежичрез съвместно използване на генетичен алгоритъм (GA) и алгоритъм динамичен бакпропагейшън(динамичен алгоритъм за обучение чрез обратно разпространение на грешката). Генетичнияталгоритъм е използван за груба настройка на теглата на връзките в невронната мрежа. Динамичниятбакпропагейшън алгоритъм се прилага впоследствие за постигане на фина настройка на теглата намрежата. Фитнес функцията, използваща квадрата на грешката между обучаващия сигнал и изходниясигнал на мрежата, се дефинира на всяка времева стъпка като предложеният GA – базираналгоритъм решава оптимизационна задача по отношение на нестационарна функция. Във всяка времевастъпка решението с най-добра фитнес функция се използва за текущо представяне на теглата иотместванията на невронната мрежа. Проведените симулационни и експериментални изследвания вреално време за управление на температурата на сушилен шкаф показват, че този алгоритъм заобучение има бърза сходимост и по-добро поведение относно намаляване на грешката на съответствиепри онлайн обучаваните невронни структури. Това води до подобрение на преходните характеристикипри невронно-адаптивните системи. Предложеният метод има потенциал за приложение в редица7

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!