21.07.2015 Views

1. Научни трудове, включени - Технически Университет - София

1. Научни трудове, включени - Технически Университет - София

1. Научни трудове, включени - Технически Университет - София

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

постигнато добро качество на управление. В тази статия е представена нова невронно-генетичнаадаптивна схема за управление, която е приложена за управление на преместванията на роботманипулатор. Проектираната стратегия е децентрализирана и позволява прилагането на независимиставни управления. Две свързани невронни мрежи с прави връзки се използват за предсказване с еднастъпка напред на позицията на ставата на робота. Генетичен алгоритъм е приложен запредварителна онлайн настройка на параметрите на регулатора. Динамичен алгоритъм за обучение собратно разпространение на грешката (dynamic back propagation) се използва за адаптация намрежовите тегла и за фина настройка на параметрите на регулатора. Разработената схема зауправление е симулирана и е оценено нейното функциониране при задача за траекторно следене отпланарен робот манипулатор с две степени на свобода.Доклади на международни научни конференции2.11 A. V. Topalov and O. Kaynak, “Sliding Mode Feedback-Error-Learning NeurocontrolStrategy for a Robot Manipulator”, Proc. of Joint 2nd International Conference on SoftComputing and Intelligent Systems and 5th International Symposium on Advanced IntelligentSystems, SCIS&ISIS’04, pp. 124-130, 2004, Yokohama, Japan.Резюме. Представени са особеностите на нов динамичен алгоритъм за робастно адаптивно обучениепри невронните мрежи и приложението му за невронно-адаптивно управление на нелинейни системи.Предложеният метод директно прилага теорията за системите с променлива структура.Алгоритъмът за обучение установява вътрешно хлъзгащо движение по отношение на параметрите нарегулатора, водещо към нулата грешката при обучение. Външното хлъзгащо движение касаеуправлявания обект, векторът на следящата грешка по състояние на който едновременно се принуденосе насочва към началото на фазовото пространство. Демонстрирана е еквивалентността междудвете хлъзгащи движения. Доказана е сходимостта на алгоритъма и са дадени условията за нея.Представени са резултати от симулационни изследвания на невронно-адаптивно управление надвузвенен планарен манипулатор, прилагащо предложената схема за нелинеен регулатор обучаван врежим на хлъзгане по грешката в затворената система (sliding mode feedback-error-learning). Тепоказват, че регулаторът наследява някои от предимствата на системите с променлива структура –робастност и бързо обучение.2.12 A. V. Topalov and O. Kaynak, “Robust On-line Training of Multilayer Perceptrons viaDirect Implementation of Variable Structure Systems Theory”, Proc. of the 4th InternationalSymposium on Advanced Intelligent systems, ISIS 2003, pp. 300-303, 2003, Jeju, South Korea.Резюме. Предложен е алгоритъм за онлайн трениране на многослойни перцептрони, който е базиранвърху директното прилагане на теорията за системите с променлива структура. Разглеждат семрежови структури притежаващи много входове, един скрит слой и един изход, чиито тегла навръзките между невроните могат да се актуализират в непрекъснато време (аналогови невроннимрежи). Множеството от нулеви нива на грешката при обучение се приема за повърхнина на хлъзгане впространството на обучаваните параметри. Върху тази повърхнина се предизвиква траектория врежим на хлъзгане, която се достига за крайно време. Представени са също така и резултати отсимулирана задача за онлайн идентификация на динамиката на двузвенен равнинен манипулатор.2.13 H. L. Akin, A. Topalov and O. Kaynak, Cerberus 2003 Team Description Paper,RoboCup2003, Proc. of the International Symposium with Team Description Papers, pp. 1-6,2003, Padova, Italy, (публикуван също и в интернет: http://www.science.uva.nl/~arnoud/research/aibo/tdps-Four-Legged-2003/Cerberus2003.pdf)Резюме. Футболът за роботи е една поставяща много предизвикателства област на изследвания,особено подходяща за изучаване широк спектър от задачи, касаещи цялостната разработката наавтономни агенти. Тимът „Церберус“ направи своя дебют на състезанията RoboCup през 2001 г. катопървия международен отбор, участващ в Лигата на крачещите роботи Sony, създаден в резултат насъвместните изследователски усилия на група студенти и техните преподаватели от BogaziciUniversity, Истанбул, Турция и <strong>Технически</strong>я университет – <strong>София</strong>, филиал Пловдив, България.Въвеждането на RoboCup като обединяваща тема за различни области на изследване при автономнитероботи привлече много студенти и ускори изследователските усилия. В програмното осигуряване наотбора е възприета модулната архитектура. Основните системни компоненти (модули) са: зрение,локализация, планировчик, модул за поведения и модул за управление на движението. Със създаденитепрез тази година възможности за изграждане на локална безжична мрежа между роботите ототбора, усилията са концентрирани върху реализацията на многоагентни поведения и в частностгенериране на многоагентни стратегии чрез прилагане на обучение с поощрение (reinforcement learning).Работи се върху многоагентната локализация, като целта е да бъде разширен разработения през11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!