20.11.2013 Aufrufe

Max, unser Agent in der virtuellen Welt - Universität Bielefeld

Max, unser Agent in der virtuellen Welt - Universität Bielefeld

Max, unser Agent in der virtuellen Welt - Universität Bielefeld

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Universität</strong> <strong>Bielefeld</strong><br />

Fragen <strong>der</strong> Vorlesung auch:<br />

5 Kommunizierende <strong>Agent</strong>en<br />

15. Vorlesung: <strong>Max</strong>, <strong>unser</strong> <strong>Agent</strong> <strong>in</strong> <strong>der</strong> <strong>virtuellen</strong> <strong>Welt</strong><br />

Werden / können /<br />

sollen KI-Systeme<br />

menschenähnlich<br />

se<strong>in</strong>?<br />

Methoden <strong>der</strong> Künstlichen Intelligenz<br />

Ipke Wachsmuth WS 2003/2004<br />

Androiden Humanoide Roboter Virtuelle Menschen<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 2<br />

Son<strong>der</strong>forschungsbereich 360<br />

Situierte Künstliche Kommunikatoren<br />

Vorgestellt werden zum Abschluß Arbeiten aus <strong>unser</strong>em Labor<br />

zum Thema „Situierte Künstliche Kommunikatoren“.<br />

Wie kommuniziert<br />

<strong>der</strong> Mensch <strong>in</strong> kooperativen<br />

Aufgabensituationen<br />

robust<br />

und erfolgreich?<br />

Was läßt sich daraus<br />

über spezielle<br />

Intelligenzleistungen<br />

des Menschen lernen?<br />

Lassen sich<br />

Kommunikationsfähigkeiten<br />

auf<br />

künstliche <strong>Agent</strong>en<br />

übertragen?<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz sound check 3<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 4


Instrukteur-Konstrukteur-Dialog<br />

<strong>Agent</strong> MAX<br />

I: Schraube es rechts an.<br />

K: Me<strong>in</strong>st du hier?<br />

Szenario:<br />

Zwei Partner<br />

konstruieren<br />

kooperativ e<strong>in</strong><br />

Modellflugzeug<br />

Instrukteur (I)<br />

ist e<strong>in</strong> Mensch,<br />

Konstrukteur (K)<br />

e<strong>in</strong> künstlicher<br />

<strong>Agent</strong><br />

I und K kooperieren<br />

<strong>in</strong> e<strong>in</strong>em<br />

„Instrukteur-<br />

Konstrukteur-<br />

Dialog“<br />

E<strong>in</strong> künstlicher Kommunikator, situiert <strong>in</strong> virtueller Realität<br />

Erforschung von Grundlagen<br />

kommunikativer Intelligenz im<br />

„face-to-face“-Dialog:<br />

• PHYSIS – das Körpersystem<br />

(speziell Gestik)<br />

• KOGNITION – das<br />

Wissenssystem<br />

• EMOTION – das<br />

Bewertungssystem<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 5<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 6<br />

Sprache verstehen<br />

Gesten verstehen: Erfassung<br />

I: Steck die gelbe Schraube<br />

<strong>in</strong> die lange Leiste.<br />

steck BEFEHL CONNECT<br />

die DET<br />

gelbe FARBE GELB<br />

Schraube OBJEKTTYP SCHRAUBE<br />

<strong>in</strong> PRAEP IN<br />

die DET<br />

lange GROESSE GROSS<br />

Leiste OBJEKTTYP LEISTE<br />

• Spracherkennung<br />

• Syntaktisch-semantisches Pars<strong>in</strong>g<br />

• Referenz auf wahrgenommene Szene<br />

(select x (OBJEKTTYP(x)= SCHRAUBE und FARBE(x)= GELB))<br />

(select y (OBJEKTTYP(y)= LEISTE und GROESSE(y)=GROSS))<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 7<br />

Segmentierungsh<strong>in</strong>weise<br />

• starke Beschleunigung<br />

<strong>der</strong> Hand, Stopps,<br />

rapide Wechsel <strong>der</strong><br />

Bewegungsrichtung<br />

• starke Handspannung<br />

• Symmetrien bei<br />

beidhändigen Gesten<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 8


Gesten verstehen: Analyse<br />

E<strong>in</strong>ige HamNoSys-Symbole<br />

Datenhandschuh<br />

Gelenkw<strong>in</strong>kel<br />

Gelenkw<strong>in</strong>kel<br />

und -positionen<br />

Symbol ASCII-Darstellung Beschreibung<br />

BSif<strong>in</strong>ger Zeigef<strong>in</strong>ger gestreckt<br />

EF<strong>in</strong>A<br />

nach vorn gestreckt<br />

6DOF Tracker<br />

Handposition<br />

Handmodell<br />

Symbol-<br />

Klassifikator<br />

symbolische<br />

Posturbeschreibung<br />

PalmL<br />

LocShoul<strong>der</strong><br />

Handfläche nach l<strong>in</strong>ks<br />

<strong>in</strong> Schulterhöhe<br />

LocStretched<br />

ganz ausgestreckt<br />

Symbolische Klassifikation <strong>der</strong><br />

Gestenform (HamNoSys)<br />

MoveA<br />

Handvorwärtsbewegung<br />

MoveR<br />

Handrechtsbewegung<br />

... ...<br />

( )<br />

( )<br />

parallel ausgeführt<br />

(„Hamburger Notations-System“ des Instituts<br />

für Deutsche Gebärdensprache, Hamburg)<br />

[ ]<br />

[ ]<br />

<strong>in</strong> Sequenz ausgeführt<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 9<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 10<br />

Multimodale Analyse: tATN<br />

Physis: E<strong>in</strong> beweglicher Körper<br />

Verb<strong>in</strong>de das gelbe Teil mit<br />

dem violetten Teil...<br />

• Handanimation mit „key-fram<strong>in</strong>g“<br />

• Körperbewegung durch modellbasierte<br />

Animation<br />

• Bewegungsgenerierung nebenläufig<br />

und synchronisiert<br />

zeigen/select (deiktisch)<br />

drehen (mimetisch)<br />

• Koord<strong>in</strong>ation von Sprache und Gestik<br />

• Interpretation im Kontext <strong>der</strong> Anwendung<br />

K<strong>in</strong>ematisches Skelett mit 53 Freiheitsgraden (DOF) <strong>in</strong><br />

25 Gelenken für den Körper und 25 DOF für jede Hand<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 11<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 12


Simulierte Gesichtsmuskeleffekte<br />

Ausdruck von Emotionen<br />

A Stirnmuskel<br />

B Augenbrauenrunzler<br />

C Augenr<strong>in</strong>gmuskel<br />

D Augenlidmuskel<br />

E Heber <strong>der</strong> Oberlippe<br />

und des Nasenflügels<br />

F Jochbe<strong>in</strong>muskel und<br />

Mundw<strong>in</strong>kelheber<br />

G Mundw<strong>in</strong>kelherabzieher<br />

H R<strong>in</strong>gmuskel des Mundes<br />

I Unterlippenherabzieher<br />

J Unterkiefer<br />

Studentisches Projekt<br />

(Körber-Studienpreis!)<br />

Koord<strong>in</strong>ierte Ansteuerung <strong>der</strong><br />

Gesichtsmuskeln basiert auf<br />

sogenannten Action Units<br />

(Ekman/Friesen)<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 13<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 14<br />

Sprechen und Sprechmimik<br />

Gestik und Sprache äußern<br />

• e<strong>in</strong>e Gesichtsstellung (Visem) für M, P, B<br />

• e<strong>in</strong>e Gesichtsstellung (Visem) für N, L, T, D<br />

• e<strong>in</strong>e Gesichtsstellung (Visem) für F, V<br />

• e<strong>in</strong>e Gesichtsstellung (Visem) für K, G<br />

• und Viseme für die verschiedenen Vokale<br />

Text-to-Speech:<br />

TXT2PHO (IKP Uni Bonn), MBROLA<br />

Phonemtranskription ist Grundlage für<br />

die automatische Generierung von sog.<br />

Visemen für die Sprechmimik<br />

(Concept-to-Speech: TO DO)<br />

MURML: XML-basierte<br />

Markup Language für<br />

„Multimodal Utterance<br />

Representations“<br />

<br />

<br />

Und jetzt nimm diese Leiste<br />

so gross. <br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />


Gestik: „Imitationsspiele“<br />

Perceive – Reason – Act<br />

• Mensch macht<br />

vor, MAX<br />

macht nach<br />

• Erfassung <strong>der</strong><br />

E<strong>in</strong>gabegestik:<br />

HamNoSys<br />

Perceive<br />

Act<br />

REAKTIVES VERHALTEN<br />

• Reaktives und deliberatives<br />

Verhalten kann nebenläufig<br />

se<strong>in</strong> und wettbewerben!<br />

• HamNoSys als<br />

Spezifikation<br />

<strong>der</strong> gestischen<br />

Äußerungen<br />

Reason<br />

• E<strong>in</strong>e impulsive Reaktion<br />

kann kontrolliertes Handeln<br />

überschreiben, und umgekehrt.<br />

Echtzeit!<br />

DELIBERATIVES VERHALTEN<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 17<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 18<br />

Kognitive Architektur<br />

Situierte<br />

Künstliche<br />

Kommunikatoren<br />

SFB 360<br />

Kommunizieren mit <strong>Agent</strong> <strong>Max</strong><br />

• nebenläufiges Wahrnehmen,<br />

Schlußfolgern und Handeln<br />

Emotionssystem<br />

• parallele Verarbeitung <strong>in</strong><br />

reaktivem und deliberativem<br />

System<br />

• Informations-Rückfluß <strong>in</strong><br />

e<strong>in</strong>er kognitiven Schleife<br />

• BDI-Kern mit dynamischen<br />

eigenständigen Planern<br />

• Berücksichtigung <strong>der</strong> Physis<br />

des <strong>Agent</strong>en, Multimodalität<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 19<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 20


Interne Emotionsdynamik<br />

<strong>Max</strong> im Nixdorf Museum<br />

PREVAILING MOOD<br />

+<br />

BOREDOM<br />

SPONTANEOUS EMOTION<br />

PLEASURE<br />

AROUSAL<br />

DOMINANCE<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 21<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 22<br />

E<strong>in</strong>ige Abschlußbemerkungen<br />

Ausblick aufs nächste Semester<br />

Der Intelligenzbegriff <strong>der</strong> KI ist "computational"<br />

(Verarbeitung von Information durch Symbole).<br />

KI-Theorien s<strong>in</strong>d "generativ" <strong>in</strong> dem S<strong>in</strong>ne, daß<br />

sie Synthese vor Analyse stellen.<br />

Paradigmen än<strong>der</strong>n sich:<br />

• e<strong>in</strong>gebettete Systeme (die mit Sensoren und<br />

Effektoren <strong>in</strong> ihre Umgebung gekoppelt s<strong>in</strong>d):<br />

Situierte KI<br />

• anstelle "globaler" Rekonstruktion <strong>in</strong>telligenten<br />

Verhaltens Betrachtung simpler <strong>in</strong>teragieren<strong>der</strong><br />

Systeme: <strong>Agent</strong>en-Systeme, Verteilte KI<br />

Kann KI e<strong>in</strong>e <strong>Welt</strong>formel für<br />

Intelligenz liefern?<br />

Ke<strong>in</strong> e<strong>in</strong>zelner Ansatz kann<br />

alle Merkmale von Intelligenz<br />

reproduzieren / erklären.<br />

M<strong>in</strong>sky (<strong>in</strong> e<strong>in</strong>er 93er Ausgabe von<br />

Scientific American):<br />

"The m<strong>in</strong>d is a tractor-trailor,<br />

roll<strong>in</strong>g on many wheels, but AI<br />

workers keep design<strong>in</strong>g unicycles."<br />

Im Im Sommersemester 2004 2004 bietet bietet die die AG AG WBS WBS für für das das Hauptstudium an: an:<br />

39 3921 2113 13 Spezielle Themen Themen <strong>der</strong> <strong>der</strong> KI KI V Latoschik<br />

2 SWS, SWS, Do. Do. 14-16 14-16<br />

39 3921 2125 25 XHTML, CSS CSS und und JavaScript V Schmidt<br />

2 SWS, SWS, Block Block<br />

39 3921 2180 80 Arbeitsgeme<strong>in</strong>schaft Wissensbasierte Systeme AG AG Latoschik/Sowa<br />

2 SWS, SWS, Mi. Mi. 16-18 16-18 Wachsmuth<br />

Schöne Ferien!<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 23<br />

15. Vorlesung Methoden <strong>der</strong> Künstlichen Intelligenz 24

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!