Arbeitsgruppe Neuroinformatik
Arbeitsgruppe Neuroinformatik
Arbeitsgruppe Neuroinformatik
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong><br />
Prof. Dr. Martin Riedmiller<br />
Martin.Riedmiller@uos.de<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 1
Leitmotiv<br />
’Zukünftige Computerprogramme werden einen wachsenden Anteil<br />
’intelligenter’ Softwaremodule enthalten. Diese Module werden nicht auf<br />
übliche Art programmiert, sondern lernen ihr Verhalten aus Daten, die vom<br />
Benutzer zur Verfügung gestellt werden, oder die vom Programm während<br />
seiner Anwendung gesammelt werden.’<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 2
Vom Gehirn zum Künstlichen Neuronalen Netz<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 3
Vom Gehirn zum Künstlichen Neuronalen Netz<br />
• Wissen lässt sich in Gewichten (Synapsen) speichern/ lernen<br />
• praktisch beliebige (nichtlineare) Zusammenhänge repräsentierbar<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 3
Struktur und Ausrichtung der AG <strong>Neuroinformatik</strong><br />
Personal: 5 wissenschaftliche Mitarbeiter (4 Doktoranden, 1 Postdoc)<br />
Arbeitsgebiete: Maschinelles Lernen/ <strong>Neuroinformatik</strong>, Robotik,<br />
Regelungstechnik<br />
Strategische Ausrichtung:<br />
• Grundlagen lernfähiger Systeme: Lernalgorithmen, Methoden und<br />
Modellierung (Effizienz, Robustheit)<br />
• Einbettung lernfähiger Module in komplexe Softwaresysteme<br />
• Praktische Umsetzung in (Industrie-)Projekten: ’Proof of Concept’,<br />
Anregungen für neue Forschungsrichtungen<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 4
Arbeitsgebiete I<br />
Überwachtes Lernen: Lernen aus Beispielen. Generalisierungsfähigkeit,<br />
schnelle Lernverfahren, Risikoabschätzung, probablisitische Modellierung<br />
• Rprop (Riedmiller 1992, Riedmiller und Braun 1993)<br />
• Unit-OBS (Stahlberger und Riedmiller 1996)<br />
• Bayes’sche Lernverfahren und Komiteebildung (Gujahr und Riedmiller, 1996,<br />
Gutjahr 1998)<br />
• GMMs (Lauer 2004)<br />
• Zeitreihenprognose (Gujahr und Riedmiller, 1996, Ragg, Schröder, Riedmiller 2006)<br />
• CBR (Gabel und Riedmiller, 2005, 2006)<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 5
Arbeitsgebiete II<br />
Reinforcement Lernen: Lernen aus Erfolg/ Mißerfolg. Effizienz,<br />
Robustheit, unsichere und partielle Information, Einsatz im<br />
regelungstechnischen Kontext, Lernen in Multi-Agenten Systemen.<br />
• RL-Regler für technische Prozesse (Riedmiller, 1996)<br />
• Lernen von Kommunikation (Riedmiller, Moore und Schneider, 2000)<br />
• MAS-Algorithmen für stochastische und deterministische MDPs (Lauer und<br />
Riedmiller 2000, Lauer und Riedmiller, 2004)<br />
• Multiple Zeitskalen (Schoknecht und Riedmiller, 2002)<br />
• Abstakte Zustandsräume (Lauer und Riedmiller, 2000, Timmer und Riedmiller 2004)<br />
• NFQ (Riedmiller, 2005)<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 6
Arbeitsgebiete III<br />
Integration Lernverfahren und weitere CI-Methoden. Evoultionäre<br />
Algorithmen, Fuzzy Regler, Unüberwachtes Lernen<br />
• Fynesse (Spott, Weisbrod und Riedmiller, 2001)<br />
• Evolution eines Bildverarbeitungssystems (Lange und Riedmiller, 2005)<br />
• Extraktion von Zustandsinformation aus Kamerabildern (Schulz, König und<br />
Riedmiller, 2006)<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 7
Industrieprojekt Absatzprognose Bildzeitung<br />
Aufgabenstellung: Prognose der täglichen<br />
Verkaufszahlen der Bildzeitung mit neuronalen<br />
Verfahren.<br />
Laufzeit: seit 1996<br />
wissenschaftlicher Kontext:<br />
• überwachtes Lernen mit Neuronalen Netzen<br />
• Codierung zeitlicher Information<br />
• Generalisierungsfähigkeit:<br />
Bayes’sche Lernverfahren, Pruning<br />
Verwandte Fragestellungen/ Projekte: Prognose von Finanzzeitreihen<br />
(Projekt mit HELABA), Ausreißererkennung (Projekt mit BfU),<br />
Mustererkennung, Modellbildung<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 8
Industrieprojekt Neuronale Regelung eines Ottomotors<br />
Aufgabenstellung: Optimale Regelung<br />
des Luft-Kraftstoffgemisches sowie des<br />
Zündzeitpunkts beim Ottomotor.<br />
Laufzeit: 1996 - 1998<br />
wissenschaftlicher Kontext:<br />
10<br />
5<br />
F 0<br />
-5<br />
-10<br />
2.25<br />
dtheta/dt<br />
0<br />
0.2<br />
• modellfreies, selbständiges Lernen aus Erfolg/<br />
Mißerfolg (Reinforcement Lernen)<br />
-2.25<br />
-0.2<br />
0<br />
theta<br />
• Regelung nichtlinearer Systeme<br />
• Regelung von Mehrgrößensystemen<br />
• Effizienz und Robustheit von RL-Verfahren<br />
Verwandte Fragestellungen/ Projekte: Neuronaler Thermostat (Projekt<br />
mit Haake), Kollisionsvermeidung mobiler Roboter, Ausregelung instabiler<br />
Systeme (inverses Pendel).<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 9
DFG Projekt: Neuronale Agenten für Scheduling<br />
Aufgabenstellung: Reaktive Steuerung der<br />
Bearbeitungsreihenfolge von Jobs.<br />
Laufzeit: seit 2005<br />
wissenschaftlicher Kontext:<br />
• Reinforcement Lernen mit Neuronalen Netzen<br />
• Kooperation in Multi-Agenten Systemen<br />
• Generalisierungsfähigkeit:<br />
Übertragung auf ähnliche Lastverteilungen<br />
• Konvergenz verteilter RL-Algorithmen<br />
Verwandte Fragestellungen/ Projekte: Mehrgrößenregelung in<br />
technischen Prozessen, Teamverhalten im Roboterfußball<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 10
Internes Projekt: Lernen mit Zustandsabstraktion<br />
Aufgabenstellung: Erforschung neuartiger<br />
RL-Algorithmen für abstrakte Zustandsräume<br />
(Effizienz von RL-Verfahren)<br />
Laufzeit: seit 2000<br />
wissenschaftlicher Kontext:<br />
• Effizientes Reinforcement Lernen<br />
• Beschleunigung durch Abstraktion<br />
• Generalisierungsfähigkeit:<br />
Abstraktion erlaubt Übertragung<br />
a1,r1<br />
X1<br />
a2,r2<br />
X2<br />
a3,r3<br />
X3<br />
X4<br />
X5<br />
a6,r6<br />
X6<br />
a4,r4 a5,r5<br />
X7<br />
history state<br />
X1 a1 X2 a2 X3 a3<br />
X4<br />
a4,r4<br />
history state<br />
X2 a2 X3 a3 X4 a4<br />
X5<br />
Verwandte Fragestellungen/ Projekte: Effiziente Regelung realer<br />
Systeme (z.B. Robotik)<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 11
Evolution eines Bildverarbeitungssystems<br />
Aufgabenstellung:<br />
Aufgabenspezifische Evolution<br />
geeigneter Softwaremodule für eine<br />
lernfähige Bildverarbeitung<br />
Laufzeit: seit 2003<br />
wissenschaftlicher Kontext:<br />
• überwachtes Lernen mit<br />
Neuronalen Netzen<br />
• Automatische Codierung<br />
relevanter Information durch<br />
evolutionäre Algorithmen<br />
• intelligente<br />
Sensorverarbeitung<br />
adaptive<br />
Verwandte Fragestellungen/ Projekte: Merkmalsfindung,<br />
Systemintegration adaptiver und programmierter Module<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 12
Internes Projekt: Reinforcement Lernverfahren für reale<br />
Systeme<br />
Aufgabenstellung: Selbständig lernende<br />
neuronale Steuerungen durch Spezifikation von<br />
Erfolg/ Misserfolg durch direkte Interaktion am<br />
realen System.<br />
Laufzeit: seit 1996<br />
wissenschaftlicher Kontext:<br />
• Effiziente neuronale RL-Algorithmen<br />
• Integration mit Fuzzy Ansätzen<br />
• Codierung von Zustandsinformation<br />
Verwandte Fragestellungen/ Projekte: Lernfähige und adaptive mobile<br />
Roboter, regelungstechnische Aufgabenstellungen.<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 13
Projekt Brainstomers - Roboterfußball (DFG)<br />
Aufgabenstellung: ’2050 wird ein Team aus<br />
Robotern den menschlichen Fußballweltmeister<br />
schlagen’ (RoboCup Federation).<br />
Laufzeit: seit 1998<br />
wissenschaftlicher Kontext:<br />
• Einbettung maschineller Lernverfahren in<br />
komplexen Softwaresystemen<br />
• Steuerung mobiler Roboter in dynamischen<br />
’natürlichen’ Umgebungen (Pfadplanung<br />
unter Unsicherheit, Bildverarbeitung)<br />
• Lernverfahren für kooperative Multi-Agenten<br />
Systeme<br />
Verwandte Fragestellungen/ Projekte: Lernverfahren in<br />
regelungstechnischen Aufgabenstellungen, Lernen in kooperativen<br />
Multi-Agenten Systemen, z.B. Scheduling, Energieverteilung<br />
Martin Riedmiller, Univ. Osnabrück, Martin.Riedmiller@uos.de <strong>Arbeitsgruppe</strong> <strong>Neuroinformatik</strong> 14