Max, unser Agent in der virtuellen Welt - Universität Bielefeld
Max, unser Agent in der virtuellen Welt - Universität Bielefeld
Max, unser Agent in der virtuellen Welt - Universität Bielefeld
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Universität</strong> <strong>Bielefeld</strong><br />
Fragen <strong>der</strong> Vorlesung auch:<br />
5 Kommunizierende <strong>Agent</strong>en<br />
15. Vorlesung: <strong>Max</strong>, <strong>unser</strong> <strong>Agent</strong> <strong>in</strong> <strong>der</strong> <strong>virtuellen</strong> <strong>Welt</strong><br />
Werden / können /<br />
sollen KI-Systeme<br />
menschenähnlich<br />
se<strong>in</strong>?<br />
Methoden <strong>der</strong> Künstlichen Intelligenz<br />
Ipke Wachsmuth WS 2003/2004<br />
Androiden Humanoide Roboter Virtuelle Menschen<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 2<br />
Son<strong>der</strong>forschungsbereich 360<br />
Situierte Künstliche Kommunikatoren<br />
Vorgestellt werden zum Abschluß Arbeiten aus <strong>unser</strong>em Labor<br />
zum Thema „Situierte Künstliche Kommunikatoren“.<br />
Wie kommuniziert<br />
<strong>der</strong> Mensch <strong>in</strong> kooperativen<br />
Aufgabensituationen<br />
robust<br />
und erfolgreich?<br />
Was läßt sich daraus<br />
über spezielle<br />
Intelligenzleistungen<br />
des Menschen lernen?<br />
Lassen sich<br />
Kommunikationsfähigkeiten<br />
auf<br />
künstliche <strong>Agent</strong>en<br />
übertragen?<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz sound check 3<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 4
Instrukteur-Konstrukteur-Dialog<br />
<strong>Agent</strong> MAX<br />
I: Schraube es rechts an.<br />
K: Me<strong>in</strong>st du hier?<br />
Szenario:<br />
Zwei Partner<br />
konstruieren<br />
kooperativ e<strong>in</strong><br />
Modellflugzeug<br />
Instrukteur (I)<br />
ist e<strong>in</strong> Mensch,<br />
Konstrukteur (K)<br />
e<strong>in</strong> künstlicher<br />
<strong>Agent</strong><br />
I und K kooperieren<br />
<strong>in</strong> e<strong>in</strong>em<br />
„Instrukteur-<br />
Konstrukteur-<br />
Dialog“<br />
E<strong>in</strong> künstlicher Kommunikator, situiert <strong>in</strong> virtueller Realität<br />
Erforschung von Grundlagen<br />
kommunikativer Intelligenz im<br />
„face-to-face“-Dialog:<br />
• PHYSIS – das Körpersystem<br />
(speziell Gestik)<br />
• KOGNITION – das<br />
Wissenssystem<br />
• EMOTION – das<br />
Bewertungssystem<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 5<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 6<br />
Sprache verstehen<br />
Gesten verstehen: Erfassung<br />
I: Steck die gelbe Schraube<br />
<strong>in</strong> die lange Leiste.<br />
steck BEFEHL CONNECT<br />
die DET<br />
gelbe FARBE GELB<br />
Schraube OBJEKTTYP SCHRAUBE<br />
<strong>in</strong> PRAEP IN<br />
die DET<br />
lange GROESSE GROSS<br />
Leiste OBJEKTTYP LEISTE<br />
• Spracherkennung<br />
• Syntaktisch-semantisches Pars<strong>in</strong>g<br />
• Referenz auf wahrgenommene Szene<br />
(select x (OBJEKTTYP(x)= SCHRAUBE und FARBE(x)= GELB))<br />
(select y (OBJEKTTYP(y)= LEISTE und GROESSE(y)=GROSS))<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 7<br />
Segmentierungsh<strong>in</strong>weise<br />
• starke Beschleunigung<br />
<strong>der</strong> Hand, Stopps,<br />
rapide Wechsel <strong>der</strong><br />
Bewegungsrichtung<br />
• starke Handspannung<br />
• Symmetrien bei<br />
beidhändigen Gesten<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 8
Gesten verstehen: Analyse<br />
E<strong>in</strong>ige HamNoSys-Symbole<br />
Datenhandschuh<br />
Gelenkw<strong>in</strong>kel<br />
Gelenkw<strong>in</strong>kel<br />
und -positionen<br />
Symbol ASCII-Darstellung Beschreibung<br />
BSif<strong>in</strong>ger Zeigef<strong>in</strong>ger gestreckt<br />
EF<strong>in</strong>A<br />
nach vorn gestreckt<br />
6DOF Tracker<br />
Handposition<br />
Handmodell<br />
Symbol-<br />
Klassifikator<br />
symbolische<br />
Posturbeschreibung<br />
PalmL<br />
LocShoul<strong>der</strong><br />
Handfläche nach l<strong>in</strong>ks<br />
<strong>in</strong> Schulterhöhe<br />
LocStretched<br />
ganz ausgestreckt<br />
Symbolische Klassifikation <strong>der</strong><br />
Gestenform (HamNoSys)<br />
MoveA<br />
Handvorwärtsbewegung<br />
MoveR<br />
Handrechtsbewegung<br />
... ...<br />
( )<br />
( )<br />
parallel ausgeführt<br />
(„Hamburger Notations-System“ des Instituts<br />
für Deutsche Gebärdensprache, Hamburg)<br />
[ ]<br />
[ ]<br />
<strong>in</strong> Sequenz ausgeführt<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 9<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 10<br />
Multimodale Analyse: tATN<br />
Physis: E<strong>in</strong> beweglicher Körper<br />
Verb<strong>in</strong>de das gelbe Teil mit<br />
dem violetten Teil...<br />
• Handanimation mit „key-fram<strong>in</strong>g“<br />
• Körperbewegung durch modellbasierte<br />
Animation<br />
• Bewegungsgenerierung nebenläufig<br />
und synchronisiert<br />
zeigen/select (deiktisch)<br />
drehen (mimetisch)<br />
• Koord<strong>in</strong>ation von Sprache und Gestik<br />
• Interpretation im Kontext <strong>der</strong> Anwendung<br />
K<strong>in</strong>ematisches Skelett mit 53 Freiheitsgraden (DOF) <strong>in</strong><br />
25 Gelenken für den Körper und 25 DOF für jede Hand<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 11<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 12
Simulierte Gesichtsmuskeleffekte<br />
Ausdruck von Emotionen<br />
A Stirnmuskel<br />
B Augenbrauenrunzler<br />
C Augenr<strong>in</strong>gmuskel<br />
D Augenlidmuskel<br />
E Heber <strong>der</strong> Oberlippe<br />
und des Nasenflügels<br />
F Jochbe<strong>in</strong>muskel und<br />
Mundw<strong>in</strong>kelheber<br />
G Mundw<strong>in</strong>kelherabzieher<br />
H R<strong>in</strong>gmuskel des Mundes<br />
I Unterlippenherabzieher<br />
J Unterkiefer<br />
Studentisches Projekt<br />
(Körber-Studienpreis!)<br />
Koord<strong>in</strong>ierte Ansteuerung <strong>der</strong><br />
Gesichtsmuskeln basiert auf<br />
sogenannten Action Units<br />
(Ekman/Friesen)<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 13<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 14<br />
Sprechen und Sprechmimik<br />
Gestik und Sprache äußern<br />
• e<strong>in</strong>e Gesichtsstellung (Visem) für M, P, B<br />
• e<strong>in</strong>e Gesichtsstellung (Visem) für N, L, T, D<br />
• e<strong>in</strong>e Gesichtsstellung (Visem) für F, V<br />
• e<strong>in</strong>e Gesichtsstellung (Visem) für K, G<br />
• und Viseme für die verschiedenen Vokale<br />
Text-to-Speech:<br />
TXT2PHO (IKP Uni Bonn), MBROLA<br />
Phonemtranskription ist Grundlage für<br />
die automatische Generierung von sog.<br />
Visemen für die Sprechmimik<br />
(Concept-to-Speech: TO DO)<br />
MURML: XML-basierte<br />
Markup Language für<br />
„Multimodal Utterance<br />
Representations“<br />
<br />
<br />
Und jetzt nimm diese Leiste<br />
so gross. <br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Gestik: „Imitationsspiele“<br />
Perceive – Reason – Act<br />
• Mensch macht<br />
vor, MAX<br />
macht nach<br />
• Erfassung <strong>der</strong><br />
E<strong>in</strong>gabegestik:<br />
HamNoSys<br />
Perceive<br />
Act<br />
REAKTIVES VERHALTEN<br />
• Reaktives und deliberatives<br />
Verhalten kann nebenläufig<br />
se<strong>in</strong> und wettbewerben!<br />
• HamNoSys als<br />
Spezifikation<br />
<strong>der</strong> gestischen<br />
Äußerungen<br />
Reason<br />
• E<strong>in</strong>e impulsive Reaktion<br />
kann kontrolliertes Handeln<br />
überschreiben, und umgekehrt.<br />
Echtzeit!<br />
DELIBERATIVES VERHALTEN<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 17<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 18<br />
Kognitive Architektur<br />
Situierte<br />
Künstliche<br />
Kommunikatoren<br />
SFB 360<br />
Kommunizieren mit <strong>Agent</strong> <strong>Max</strong><br />
• nebenläufiges Wahrnehmen,<br />
Schlußfolgern und Handeln<br />
Emotionssystem<br />
• parallele Verarbeitung <strong>in</strong><br />
reaktivem und deliberativem<br />
System<br />
• Informations-Rückfluß <strong>in</strong><br />
e<strong>in</strong>er kognitiven Schleife<br />
• BDI-Kern mit dynamischen<br />
eigenständigen Planern<br />
• Berücksichtigung <strong>der</strong> Physis<br />
des <strong>Agent</strong>en, Multimodalität<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 19<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 20
Interne Emotionsdynamik<br />
<strong>Max</strong> im Nixdorf Museum<br />
PREVAILING MOOD<br />
+<br />
BOREDOM<br />
SPONTANEOUS EMOTION<br />
PLEASURE<br />
AROUSAL<br />
DOMINANCE<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 21<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 22<br />
E<strong>in</strong>ige Abschlußbemerkungen<br />
Ausblick aufs nächste Semester<br />
Der Intelligenzbegriff <strong>der</strong> KI ist "computational"<br />
(Verarbeitung von Information durch Symbole).<br />
KI-Theorien s<strong>in</strong>d "generativ" <strong>in</strong> dem S<strong>in</strong>ne, daß<br />
sie Synthese vor Analyse stellen.<br />
Paradigmen än<strong>der</strong>n sich:<br />
• e<strong>in</strong>gebettete Systeme (die mit Sensoren und<br />
Effektoren <strong>in</strong> ihre Umgebung gekoppelt s<strong>in</strong>d):<br />
Situierte KI<br />
• anstelle "globaler" Rekonstruktion <strong>in</strong>telligenten<br />
Verhaltens Betrachtung simpler <strong>in</strong>teragieren<strong>der</strong><br />
Systeme: <strong>Agent</strong>en-Systeme, Verteilte KI<br />
Kann KI e<strong>in</strong>e <strong>Welt</strong>formel für<br />
Intelligenz liefern?<br />
Ke<strong>in</strong> e<strong>in</strong>zelner Ansatz kann<br />
alle Merkmale von Intelligenz<br />
reproduzieren / erklären.<br />
M<strong>in</strong>sky (<strong>in</strong> e<strong>in</strong>er 93er Ausgabe von<br />
Scientific American):<br />
"The m<strong>in</strong>d is a tractor-trailor,<br />
roll<strong>in</strong>g on many wheels, but AI<br />
workers keep design<strong>in</strong>g unicycles."<br />
Im Im Sommersemester 2004 2004 bietet bietet die die AG AG WBS WBS für für das das Hauptstudium an: an:<br />
39 3921 2113 13 Spezielle Themen Themen <strong>der</strong> <strong>der</strong> KI KI V Latoschik<br />
2 SWS, SWS, Do. Do. 14-16 14-16<br />
39 3921 2125 25 XHTML, CSS CSS und und JavaScript V Schmidt<br />
2 SWS, SWS, Block Block<br />
39 3921 2180 80 Arbeitsgeme<strong>in</strong>schaft Wissensbasierte Systeme AG AG Latoschik/Sowa<br />
2 SWS, SWS, Mi. Mi. 16-18 16-18 Wachsmuth<br />
Schöne Ferien!<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 23<br />
15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 24