18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

19.3 Architekturentwurf 335<br />

Als Kriterien zur Bewertung einer Architekturmodifikation dienen<br />

in der Regel Maße, die basierend auf der Gesamtwahrscheinlichkeit der<br />

Trainingsdaten diejenige Architektur bevorzugen, für die die Gesamtwahrscheinlichkeit<br />

aller Trainingsdaten größer ist. Im folgenden werden solche<br />

Verfahren als ” likelihood-basierte“ Architekturoptimierungen bezeichnet.<br />

Andere Bewertungskriterien sind zum Beispiel solche, die andere prinzipiell<br />

wünschenswerte Eigenschaften berücksichtigen, wie den Informationsgewinn<br />

(das heißt den Entropieverlust), der durch eine Architekturmodifikation<br />

entsteht.<br />

Bei allen likelihood-basierten Optimierungsverfahren besteht die Gefahr<br />

der Überanpassung, wenn versucht wird, die Gesamtwahrscheinlichkeit aller<br />

Trainingsdaten zu optimieren, weil dabei nicht berücksichtigt wird, wie sich<br />

die Architekturmodifikation auf andere, nicht zur Trainingsmenge gehörende<br />

Daten auswirkt.<br />

Das Problem der Überanpassung ist auch bekannt aus der Theorie der<br />

künstlichen neuronalen Netze. Dort beobachtet man den Effekt, wenn ein<br />

neuronales Netz zu viele Epochen auf den Trainingsdaten trainiert wird.<br />

Wenn die Zahl der Parameter des Netzes ausreicht, so fängt es irgendwann<br />

an, die Trainingsdaten ” auswendig“ zu lernen, statt zu lernen, was deren<br />

Struktur ist. Für ungesehene Testdaten wird das im Netz gespeicherte<br />

Weltmodell ab diesem Zeitpunkt immer schlechter. Das Netz verliert an<br />

Generalisierungsfähigkeit. Das Problem wird dadurch gelöst, daß mit Hilfe<br />

einer Kreuzvalidierungsmenge der Zeitpunkt bestimmt wird, ab dem ein<br />

Leistungsabfall auf den Kreuzvalidierungsdaten eintritt. Diese Menge ist<br />

in der Regel eine Teilmenge der zur Verfügung stehenden Trainingsdaten,<br />

die, nachdem sie bestimmt ist, nicht mehr zum Trainieren verwendet wird.<br />

Sobald der Effekt der Überanpassung einsetzt, wird der Trainingsprozeß<br />

abgebrochen.<br />

Die Idee der Verwendung von Kreuzvalidierungsmengen läßt sich auch<br />

auf likelihood-basierte Optimierungsverfahren anwenden, sowohl um zu<br />

entscheiden, ob ein iterativer Optimierungsprozeß fortgeführt werden soll,<br />

als auch um zu bewerten, wie gut eine Architektur- bzw. Parametermodifikation<br />

ist. Die Bewertung einer Modifikation wird so vorgenommen,<br />

daß die Gesamtwahrscheinlichkeit der Kreuzvalidierungsmenge unter der<br />

Bedingung des modifizierten Systems berechnet wird. Wenn nun mehrere<br />

mögliche Systemmodifikationen antizipiert werden, dann sollte diejenige<br />

ausgeführt werden, die den größten Wahrscheinlichkeitsgewinn verspricht.<br />

Bei einem iterativen Optimierungsverfahren sollte das Verfahren so lange<br />

fortgesetzt werden, bis auf der Kreuzvalidierungsmenge kein Gewinn mehr<br />

festzustellen ist. Man sieht leicht ein, daß ohne eine Kreuzvalidierungsmenge<br />

ein Optimierungsverfahren, das die Zahl der Parameter mit jedem Schritt

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!