22.11.2013 Aufrufe

Arbeitsgruppe Neuroinformatik

Arbeitsgruppe Neuroinformatik

Arbeitsgruppe Neuroinformatik

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong><br />

Prof. Dr. Martin Riedmiller<br />

Martin.Riedmiller@uos.de<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 1


Leitmotiv<br />

’Zukünftige Computerprogramme werden einen wachsenden Anteil<br />

’intelligenter’ Softwaremodule enthalten. Diese Module werden nicht auf<br />

übliche Art programmiert, sondern lernen ihr Verhalten aus Daten, die vom<br />

Benutzer zur Verfügung gestellt werden, oder die vom Programm während<br />

seiner Anwendung gesammelt werden.’<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 2


Vom Gehirn zum Künstlichen Neuronalen Netz<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 3


Vom Gehirn zum Künstlichen Neuronalen Netz<br />

• Wissen lässt sich in Gewichten (Synapsen) speichern/ lernen<br />

• praktisch beliebige (nichtlineare) Zusammenhänge repräsentierbar<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 3


Struktur und Ausrichtung der AG <strong>Neuroinformatik</strong><br />

Personal: 5 wissenschaftliche Mitarbeiter (4 Doktoranden, 1 Postdoc)<br />

Arbeitsgebiete: Maschinelles Lernen/ <strong>Neuroinformatik</strong>, Robotik,<br />

Regelungstechnik<br />

Strategische Ausrichtung:<br />

• Grundlagen lernfähiger Systeme: Lernalgorithmen, Methoden und<br />

Modellierung (Effizienz, Robustheit)<br />

• Einbettung lernfähiger Module in komplexe Softwaresysteme<br />

• Praktische Umsetzung in (Industrie-)Projekten: ’Proof of Concept’,<br />

Anregungen für neue Forschungsrichtungen<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 4


Arbeitsgebiete I<br />

Überwachtes Lernen: Lernen aus Beispielen. Generalisierungsfähigkeit,<br />

schnelle Lernverfahren, Risikoabschätzung, probablisitische Modellierung<br />

• Rprop (Riedmiller 1992, Riedmiller und Braun 1993)<br />

• Unit-OBS (Stahlberger und Riedmiller 1996)<br />

• Bayes’sche Lernverfahren und Komiteebildung (Gujahr und Riedmiller, 1996,<br />

Gutjahr 1998)<br />

• GMMs (Lauer 2004)<br />

• Zeitreihenprognose (Gujahr und Riedmiller, 1996, Ragg, Schröder, Riedmiller 2006)<br />

• CBR (Gabel und Riedmiller, 2005, 2006)<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 5


Arbeitsgebiete II<br />

Reinforcement Lernen: Lernen aus Erfolg/ Mißerfolg. Effizienz,<br />

Robustheit, unsichere und partielle Information, Einsatz im<br />

regelungstechnischen Kontext, Lernen in Multi-Agenten Systemen.<br />

• RL-Regler für technische Prozesse (Riedmiller, 1996)<br />

• Lernen von Kommunikation (Riedmiller, Moore und Schneider, 2000)<br />

• MAS-Algorithmen für stochastische und deterministische MDPs (Lauer und<br />

Riedmiller 2000, Lauer und Riedmiller, 2004)<br />

• Multiple Zeitskalen (Schoknecht und Riedmiller, 2002)<br />

• Abstakte Zustandsräume (Lauer und Riedmiller, 2000, Timmer und Riedmiller 2004)<br />

• NFQ (Riedmiller, 2005)<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 6


Arbeitsgebiete III<br />

Integration Lernverfahren und weitere CI-Methoden. Evoultionäre<br />

Algorithmen, Fuzzy Regler, Unüberwachtes Lernen<br />

• Fynesse (Spott, Weisbrod und Riedmiller, 2001)<br />

• Evolution eines Bildverarbeitungssystems (Lange und Riedmiller, 2005)<br />

• Extraktion von Zustandsinformation aus Kamerabildern (Schulz, König und<br />

Riedmiller, 2006)<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 7


Industrieprojekt Absatzprognose Bildzeitung<br />

Aufgabenstellung: Prognose der täglichen<br />

Verkaufszahlen der Bildzeitung mit neuronalen<br />

Verfahren.<br />

Laufzeit: seit 1996<br />

wissenschaftlicher Kontext:<br />

• überwachtes Lernen mit Neuronalen Netzen<br />

• Codierung zeitlicher Information<br />

• Generalisierungsfähigkeit:<br />

Bayes’sche Lernverfahren, Pruning<br />

Verwandte Fragestellungen/ Projekte: Prognose von Finanzzeitreihen<br />

(Projekt mit HELABA), Ausreißererkennung (Projekt mit BfU),<br />

Mustererkennung, Modellbildung<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 8


Industrieprojekt Neuronale Regelung eines Ottomotors<br />

Aufgabenstellung: Optimale Regelung<br />

des Luft-Kraftstoffgemisches sowie des<br />

Zündzeitpunkts beim Ottomotor.<br />

Laufzeit: 1996 - 1998<br />

wissenschaftlicher Kontext:<br />

10<br />

5<br />

F 0<br />

-5<br />

-10<br />

2.25<br />

dtheta/dt<br />

0<br />

0.2<br />

• modellfreies, selbständiges Lernen aus Erfolg/<br />

Mißerfolg (Reinforcement Lernen)<br />

-2.25<br />

-0.2<br />

0<br />

theta<br />

• Regelung nichtlinearer Systeme<br />

• Regelung von Mehrgrößensystemen<br />

• Effizienz und Robustheit von RL-Verfahren<br />

Verwandte Fragestellungen/ Projekte: Neuronaler Thermostat (Projekt<br />

mit Haake), Kollisionsvermeidung mobiler Roboter, Ausregelung instabiler<br />

Systeme (inverses Pendel).<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 9


DFG Projekt: Neuronale Agenten für Scheduling<br />

Aufgabenstellung: Reaktive Steuerung der<br />

Bearbeitungsreihenfolge von Jobs.<br />

Laufzeit: seit 2005<br />

wissenschaftlicher Kontext:<br />

• Reinforcement Lernen mit Neuronalen Netzen<br />

• Kooperation in Multi-Agenten Systemen<br />

• Generalisierungsfähigkeit:<br />

Übertragung auf ähnliche Lastverteilungen<br />

• Konvergenz verteilter RL-Algorithmen<br />

Verwandte Fragestellungen/ Projekte: Mehrgrößenregelung in<br />

technischen Prozessen, Teamverhalten im Roboterfußball<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 10


Internes Projekt: Lernen mit Zustandsabstraktion<br />

Aufgabenstellung: Erforschung neuartiger<br />

RL-Algorithmen für abstrakte Zustandsräume<br />

(Effizienz von RL-Verfahren)<br />

Laufzeit: seit 2000<br />

wissenschaftlicher Kontext:<br />

• Effizientes Reinforcement Lernen<br />

• Beschleunigung durch Abstraktion<br />

• Generalisierungsfähigkeit:<br />

Abstraktion erlaubt Übertragung<br />

a1,r1<br />

X1<br />

a2,r2<br />

X2<br />

a3,r3<br />

X3<br />

X4<br />

X5<br />

a6,r6<br />

X6<br />

a4,r4 a5,r5<br />

X7<br />

history state<br />

X1 a1 X2 a2 X3 a3<br />

X4<br />

a4,r4<br />

history state<br />

X2 a2 X3 a3 X4 a4<br />

X5<br />

Verwandte Fragestellungen/ Projekte: Effiziente Regelung realer<br />

Systeme (z.B. Robotik)<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 11


Evolution eines Bildverarbeitungssystems<br />

Aufgabenstellung:<br />

Aufgabenspezifische Evolution<br />

geeigneter Softwaremodule für eine<br />

lernfähige Bildverarbeitung<br />

Laufzeit: seit 2003<br />

wissenschaftlicher Kontext:<br />

• überwachtes Lernen mit<br />

Neuronalen Netzen<br />

• Automatische Codierung<br />

relevanter Information durch<br />

evolutionäre Algorithmen<br />

• intelligente<br />

Sensorverarbeitung<br />

adaptive<br />

Verwandte Fragestellungen/ Projekte: Merkmalsfindung,<br />

Systemintegration adaptiver und programmierter Module<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 12


Internes Projekt: Reinforcement Lernverfahren für reale<br />

Systeme<br />

Aufgabenstellung: Selbständig lernende<br />

neuronale Steuerungen durch Spezifikation von<br />

Erfolg/ Misserfolg durch direkte Interaktion am<br />

realen System.<br />

Laufzeit: seit 1996<br />

wissenschaftlicher Kontext:<br />

• Effiziente neuronale RL-Algorithmen<br />

• Integration mit Fuzzy Ansätzen<br />

• Codierung von Zustandsinformation<br />

Verwandte Fragestellungen/ Projekte: Lernfähige und adaptive mobile<br />

Roboter, regelungstechnische Aufgabenstellungen.<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 13


Projekt Brainstomers - Roboterfußball (DFG)<br />

Aufgabenstellung: ’2050 wird ein Team aus<br />

Robotern den menschlichen Fußballweltmeister<br />

schlagen’ (RoboCup Federation).<br />

Laufzeit: seit 1998<br />

wissenschaftlicher Kontext:<br />

• Einbettung maschineller Lernverfahren in<br />

komplexen Softwaresystemen<br />

• Steuerung mobiler Roboter in dynamischen<br />

’natürlichen’ Umgebungen (Pfadplanung<br />

unter Unsicherheit, Bildverarbeitung)<br />

• Lernverfahren für kooperative Multi-Agenten<br />

Systeme<br />

Verwandte Fragestellungen/ Projekte: Lernverfahren in<br />

regelungstechnischen Aufgabenstellungen, Lernen in kooperativen<br />

Multi-Agenten Systemen, z.B. Scheduling, Energieverteilung<br />

Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 14

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!