31.01.2014 Aufrufe

¨Ubungsblatt 2 — Lösungen - Institut für Informatik

¨Ubungsblatt 2 — Lösungen - Institut für Informatik

¨Ubungsblatt 2 — Lösungen - Institut für Informatik

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Grundlagen der Künstlichen Intelligenz<br />

Prof. Dr. M. Bennewitz, Prof. Dr. W. Burgard,<br />

Dr. M. Ragni<br />

N. Abdo, Dr. J. Boedecker, M. Göbelbecker, J. Hess<br />

Sommersemester 2013<br />

Universität Freiburg<br />

<strong>Institut</strong> <strong>für</strong> <strong>Informatik</strong><br />

Aufgabe 2.1 (Problemformalisierung)<br />

Übungsblatt 2 <strong>—</strong> <strong>Lösungen</strong><br />

Geben Sie <strong>für</strong> die folgenden Problemstellungen jeweils eine möglichst präzise<br />

Formulierung an, die aus Anfangszustand, Zustandsraum, Aktionen, Zieltest<br />

und einer Pfadkostenfunktion besteht:<br />

• Sie wollen mit dem Auto von Freiburg nach Berlin fahren. Sie haben eine<br />

aktuelle Autobahnkarte von Deutschland und eine Liste von Staumeldungen<br />

<strong>für</strong> bestimmte Streckenabschnitte, aber kein Navigationssystem.<br />

Lösung:<br />

Zustände: Städte auf der Deutschlandkarte, die durch Autobahnen verbunden<br />

sind.<br />

Anfangszustand: Freiburg<br />

Zieltest: In Berlin?<br />

Aktionen: Von einer Stadt zur nächsten fahren.<br />

Pfadkosten: z.B. gewichtete Summe aus Straßenlänge + Verkehrsdichte<br />

• Sie müssen eine Karte von Europa mit nur vier Farben einfärben. Damit<br />

man die Grenzen einzelner Länder erkennen kann, ist es erforderlich, dass<br />

es keine Nachbarländer mit gleicher Einfärbung gibt.<br />

Lösung:<br />

Zustände: Die Zustände sind 49-Tupel der Farben rot, grün, blau, gelb<br />

oder ungefärbt (z.B.). Jeder Eintrag repräsentiert ein Land auf der Karte.<br />

Der Kompaktheit halber kann man die Farben mit den Zahlen 0 (rot) bis<br />

4 (ungefärbt) kodieren.<br />

Anfangszustand: Alle Länder sind ungefärbt / alle Länder sind rot /<br />

jedes Land kann eine der 4+1=5 Farben [ungefärbt, r,g,b,y] haben.<br />

Zieltest: Alle Länder sind gefärbt, benachbarte Länder haben unterschiedliche<br />

Farben?<br />

Aktionen:EinemLandeineder4Farbenzuweisenundvorherüberprüfen<br />

obeinNachbarlandschondiegleicheFarbehat/einLandumfärben,wenn<br />

ein Konflikt festgestellt wird.<br />

Pfadkosten: Jede Aktion verursacht Einheitskosten.<br />

• Ein Affe befindet sich in einem Raum mit einer Kiste, und an der Decke<br />

hängenaußerhalbseinerReichweiteBananen.ErwürdegernedieBananen<br />

essen.<br />

1


a 0,1<br />

b small b medium ,b big b medium ,b big<br />

a 1,2<br />

b small b medium b big<br />

Lösung:<br />

Zustände: Die Zustände sind die Positionen und Höhen des Äffchens, der<br />

Kiste und der Bananen.<br />

Anfangszustand: Affe befindet sich an Position A mit Höhe niedrig, die<br />

Kiste steht an Position B mit Höhe niedrig, die Bananen sind an Position<br />

C mit Höhe hoch.<br />

Zieltest: Bananen sind in der Hand des Affen (Position Affe = Position<br />

Bananen?).<br />

Aktionen: Affe kann sich irgendwohin bewegen, kann die Kiste bewegen,<br />

kann auf die Kiste klettern, von der Kiste herunterklettern, die Bananen<br />

greifen, Bananen essen, ...<br />

Pfadkosten: Jede Aktion verursacht Einheitskosten.<br />

Aufgabe 2.2 (Uninformierte Belief-Space-Suche)<br />

Sie sollen drei unterschiedlich große Klötzchen, die an den Positionen 0, 1 und<br />

2 aufgereiht sind, der Größe nach sortieren, können aber die Klötzchen weder<br />

sehen noch selbst bewegen. Sie können jedoch einer anderen Person Anweisungen<br />

der folgenden Form geben: ”<br />

Vergleiche die Klötzchen an Positionen i und<br />

j und bringe sie gegebenenfalls durch Vertauschung relativ zueinander in die<br />

richtige Reihenfolge“ (Anweisung a ij ). Die initiale Anordnung der Klötzchen ist<br />

Ihnen unbekannt. Geben Sie eine Folge von Anweisungen an, nach der Sie mit<br />

Sicherheit wissen, dass die Klötzchen richtig angeordnet sind. Geben Sie an, wie<br />

sich Ihr belief state mit der Zeit entwickelt.<br />

Lösung:<br />

Position<br />

Beliefspace→ 0 1 2<br />

Aktion ↓<br />

b small ,b medium ,b big b small ,b medium ,b big b small ,b medium ,b big<br />

a 0,2<br />

b small ,b medium b small ,b medium ,b big b medium ,b big<br />

Aufgabe 2.3 (Pfadkosten)<br />

In der Vorlesung sind wir bisher davon ausgegangen, dass die Pfadkosten nie<br />

negativ sein können. In dieser Aufgabe werden wir negative Pfadkosten sowie<br />

Zyklen in Pfaden besprechen.<br />

(a) Nehmen Sie an, dass eine negative untere Schranke c < 0 <strong>für</strong> die Pfadkosten<br />

pro Schritt eingeführt wird. Das heißt, Kosten können negativ, aber<br />

nie kleiner als c sein. Verhindert diese Änderung, bei der uniformen Kostensuche<br />

den ganzen Baum zu durchsuchen? Wenn ja, warum?<br />

Lösung:<br />

2


TrotzBeschränkungdernegativenPfadkostenmussgrundsätzlichderganze<br />

Baum durchsucht werden, wenn man sicher sein will, die optimale<br />

Lösung zu finden. Denn egal, wie teuer ein Pfad bisher bewertet ist, es<br />

könnte immer noch sein, dass eine Sequenz von negativen Kosten die gesamten<br />

Kosten verbessert.<br />

(b) Nehmen Sie an, es gibt eine Sequenz von Operatoren, die einen Ring bilden,<br />

so dass die Ausführung dieser Sequenz keine Änderung des Zustandes<br />

zur Folge hat. Wenn nun alle diese Operatoren negative Kosten haben,<br />

welche Auswirkungen hat dies bezüglich des optimalen Verhaltens eines<br />

Agenten in einer solchen Umgebung?<br />

Lösung:<br />

Der Agent wird dann wahrscheinlich <strong>für</strong> immer in dieser Schleife bleiben,<br />

da der Nutzen immer grösser wird, beziehungsweise die Kosten immer<br />

geringer, je mehr dieser Aktionen er ausführt.<br />

Aufgabe 2.4 (A*-Suche)<br />

(a) Spielen Sie das 8-Puzzle mit dem A*-Algorithmus durch, ausgehend von<br />

folgendem Anfangszustand:<br />

Der Zielzustand soll sein:<br />

2 8 3<br />

1 6 4<br />

7 5<br />

1 2 3<br />

8 4<br />

7 6 5<br />

Zeigen Sie die Folge der Suchknoten, die der Algorithmus betrachtet und<br />

die entsprechenden f-, g- und h-Werte <strong>für</strong> jeden Knoten. Verwenden Sie<br />

dabeidiebeideninderVorlesungvorgestellte ”<br />

ManhattanDistanz“-Heuristik.<br />

Lösung:<br />

Siehe Abbildung 1.<br />

3


Abbildung 1: 8-Puzzle Suchbaum mit Manhattan Distanz<br />

4


(b) Berechnen sie <strong>für</strong> jeden Zustand aus Aufgabenteil (a) die h- und f-Werte,<br />

jedoch unter Verwendung der ”<br />

Misplaced Tiles“-Heuristik. Wie könnte die<br />

Verwendung dieser Heuristik die Suche beinflussen?<br />

Lösung:<br />

h-Werte (In gleicher Reihenfolge wie in Abb.1):<br />

4<br />

5 3 5<br />

3 3 4 4<br />

2 3 3<br />

1 3<br />

2 0 2<br />

f-Werte:<br />

4<br />

6 4 6<br />

5 5 6 6<br />

5 6 6<br />

5 6<br />

7 5 7<br />

Die Misplaced-Tiles-Heuristik ist ungenauer und weist mehreren Knoten<br />

denselben h-Wert zu (h = 3 in Suchebene 3), deshalb müssen im schlechtesten<br />

Fall mehr Knoten expandiert werden, es kann sein, dass zunächst<br />

ein Teil des Suchbaums exploriert wird, der nicht den optimalen Pfad<br />

beinhaltet.<br />

5

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!